標簽:步驟
等不來OpenAI的Q*,華為諾亞探索LLM推理的秘密武器MindStar先來了
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
AI首次實時生成視頻!尤洋團隊新作,網友:這是新紀元
一水 發自 凹非寺量子位 | 公眾號 QbitAI尤洋團隊新作,首個基于DiT的實時視頻生成方法來了! 先來直觀感受一下效果(右側為新方法): 這是團隊在Open-Sora...
史上首個實時AI視頻生成技術:DiT通用,速度提升10.6倍
機器之心報道 機器之心編輯部DiT 都能用,生成視頻無質量損失,也不需要訓練。實時 AI 視頻生成來了! 本周三,新加坡國立大學尤洋團隊提出了業內第一種可以...
AI Agent 落地現狀:成功率太低,即使用 GPT-4 也不到 15%
文章轉載自「機器之心」,Founder Park 略有增刪。 隨著大語言模型的不斷進化與自我革新,性能、準確度、穩定性都有了大幅的提升,這已經被各個基準問題集驗...
Transformer本可以深謀遠慮,但就是不做
機器之心報道 機器之心編輯部語言模型是否會規劃未來 token?這篇論文給你答案。 「別讓 Yann LeCun 看見了。」Yann LeCun 表示太遲了,他已經看到了。今天要...
清華叉院教授扔出量子密碼學重磅!論文引業界轟動,但算法被發現bug
新智元報道編輯:好困 Aeneas 【新智元導讀】前段時間,由清華叉院助理教授陳一鐳提出的全新「破解格密碼的量子算法」,一經發表便引發了業內轟動。然而就在...
若通過驗證可顛覆美國后量子密碼設計,清華陳一鐳預印論文格密碼
機器之心報道 機器之心編輯部30 年來最重要的量子算法突破?在計算機領域,解決格上的近似最短向量問題(Approximate Shortest Vector Problems in Lattices...
Scaling Laws又失靈了?谷歌新研究:擴散模型不是越大越好
大數據文摘授權轉載自夕小瑤科技說作者:Zicy 近年來,模型規模呈現出愈來愈大的趨勢,越來越多的人相信“力大磚飛”。 OpenAI 雖然沒有公布Sora的訓練細節,但...
Scaling Laws 又失靈了?谷歌新研究:擴散模型不是越大越好
夕小瑤科技說 原創作者 | Zicy近年來,模型規模呈現出愈來愈大的趨勢,越來越多的人相信“力大磚飛”。 OpenAI 雖然沒有公布Sora的訓練細節,但在Sora的技術報...
顏水成/程明明新作!Sora核心組件DiT訓練提速10倍,Masked Diffusion Transformer V2開源
新智元報道編輯:LRS 好困 【新智元導讀】Masked Diffusion Transformer V2在ImageNet benchmark 上實現了1.58的FID score的新SoTA,并通過mask modeling表征...
香港大學發布思維擴散DoT,讓思維在時間上擴散,提效保質!
夕小瑤科技說 原創編輯 | Tscom 引言:探索結合擴散模型與思維鏈來提升大模型推理能力在人工智能領域,大語言模型(LLMs)已經引起了廣泛的關注,它們在自然...
加速知識檢索:伯克利&DeepMind聯合研究,RaLMSpec讓語言模型服務飛速提升2-7倍!
夕小瑤科技說 原創作者 | 智商掉了一地、賣萌醬近年來,隨著大型語言模型(LLM)的出現,在多樣化的 NLP 任務上取得了令人矚目的成果。然而,知識密集型任務...
今日arXiv最熱NLP大模型論文:伯克利&DeepMind聯合研究,RaLMSpec讓檢索增強LLM速度提升2-7倍!
夕小瑤科技說 原創編輯 | Tscom引言:知識密集型NLP任務中的挑戰與RaLM的潛力在知識密集型自然語言處理(NLP)任務中,傳統的大語言模型面臨著將海量知識編碼...
「think step by step」還不夠,讓模型「think more steps」更有用
機器之心報道 機器之心編輯部本文對思維鏈的推理步長進行了控制變量實驗,發現推理步長和答案的準確性是線性相關的,這種影響機制甚至超越了問題本身所產生的...
奮戰一年,LangChain首個穩定版本終于發布,LangGraph把智能體構建為圖
機器之心報道 編輯:張倩著名的大模型智能體工具,現在有大版本更新了。 不知不覺,LangChain 已經問世一年了。作為一個開源框架,LangChain 提供了構建基于...