標簽:方法
ACL2024:浙江大學提出大小模型協同的跨文檔理解,低成本高表現
夕小瑤科技說 原創作者 | Richard 自大模型出現以來,其在自然語言處理領域取得了令人矚目的進展。然而如何有效地將大模型應用于具體的任務中,仍面臨諸多挑...
ICLR 2024 Oral | 應對隨時間變化的分布偏移,西安大略大學等提出學習時序軌跡方法
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
高質量3D生成最有希望的一集?GaussianCube在三維生成中全面超越NeRF
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
「AI+物理先驗知識」,浙大、中國科學院通用蛋白質-配體相互作用評分方法登Nature子刊
將 ScienceAI設為星標 第一時間掌握 新鮮的 AI for Science 資訊編輯 | X 蛋白質就像是身體中的精密鎖具,而藥物分子則是鑰匙,只有完美契合的鑰匙才能解鎖治...
一步文生圖大模型還能“更小更快”,MixDQ量化方法無損“瘦身”擴散模型3倍,提速1.5倍
大數據文摘授權轉載自將門創投 作者:趙天辰 我們提出了MixDQ,一種面向少步擴散模型的混合比特量化方案。 MixDQ分析定位了“少步擴散模型量化”的獨特問題,并...
GPT-4o更容易越獄?北航&南洋理工上萬次測試給出詳細分析
北航&南洋理工聯合團隊投稿量子位 | 公眾號 QbitAIGPT-4o,比上一代更容易被越獄攻擊了? 來自北航和南洋理工的研究人員,通過上萬次的API查詢,對GPT-4o...
To Believe or Not to Believe?DeepMind新研究一眼看穿LLM幻覺
新智元報道編輯:庸庸 喬楊 【新智元導讀】DeepMind發表了一篇名為「To Believe or Not to Believe Your LLM」的新論文,探討了LLM的不確定性量化問題,通過...
支持合成一分鐘高清視頻,華科等提出人類跳舞視頻生成新框架UniAnimate
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
ICML 2024 Oral|外部引導的深度聚類新范式
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
next-token被淘汰!Meta實測「多token」訓練方法,推理提速3倍,性能大漲10%+
新智元報道編輯:LRS 【新智元導讀】研究人員提出了一種新的大型語言模型訓練方法,通過一次性預測多個未來tokens來提高樣本效率和模型性能,在代碼和自然語...
無需3D數據也能訓練,港科&港中文聯手華為推出3D自動駕駛場景生成模型
允中 發自 凹非寺量子位 | 公眾號 QbitAI無需采集3D數據,也能訓練出高質量的3D自動駕駛場景生成模型。 這是來自香港中文大學、香港科技大學和華為諾亞方舟實...
解決Transformer根本缺陷,CoPE論文爆火:所有大模型都能獲得巨大改進
機器之心報道 機器之心編輯部即使最強大的 LLM 也難以通過 token 索引來關注句子等概念,現在有辦法了。最近兩天,馬斯克和 LeCun 的口水戰妥妥成為大家的看...
OCR小模型仍有機會!華科等提出VIMTS:零樣本視頻端到端識別新SOTA
新智元報道編輯:LRT 【新智元導讀】通過提示查詢生成模塊和任務感知適配器,大一統框架VimTS在不同任務間實現更好的協同作用,顯著提升了模型的泛化能力。該...
不影響輸出質量還能追蹤溯源,「大模型無偏水印」入選ICLR 2024 Spotlight
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
粵公網安備 44011502001135號