標簽:方法
參數少80%,效果仍超LoRA!上交大&上海AI Lab推出高效微調框架FLoRA
Huiser 投稿量子位 | 公眾號 QbitAI為了讓大模型在特定任務、場景下發揮更大作用,LoRA這樣能夠平衡性能和算力資源的方法正在受到研究者們的青睞。 然而,以L...
大模型性能摻水嚴重?北大交出答卷:交互評估+動態出題,死記硬背也沒用 | ACL 2024
新智元報道編輯:LRS 【新智元導讀】當前大語言模型(LLM)的評估方法受到數據污染問題的影響,導致評估結果被高估,無法準確反映模型的真實能力。北京大學等...
ACL2024主會:無需訓練的大模型推薦系統!
夕小瑤科技說 原創作者 | Axe_越如今,各種推薦系統無時無刻不在包圍著我們的生活,自大模型(Large Language Model, LLM)時代以來,得益于LLM的高自由度,...
比LERF提速199倍!清華哈佛發布LangSplat:三維語義高斯潑濺 | CVPR 2024 Highlight
新智元報道編輯:LRST 【新智元導讀】本文將為大家介紹CVPR 2024 Highlight的論文LangSplat: 3D Language Gaussian Splatting(三維語義高斯潑濺)。LangSpla...
史上首個實時AI視頻生成技術:DiT通用,速度提升10.6倍
機器之心報道 機器之心編輯部DiT 都能用,生成視頻無質量損失,也不需要訓練。實時 AI 視頻生成來了! 本周三,新加坡國立大學尤洋團隊提出了業內第一種可以...
GPAvatar:僅需單圖,快速且精準的3D頭像重建及其表情控制
大數據文摘授權轉載自將門創投 作者:楚選耕 頭部虛擬形象的重建對于虛擬現實、在線會議、游戲和電影等行業的應用至關重要。 該領域的主要目標是忠實地重建頭...
小紅書怎么用大模型?頂會作者在線等你來聊
允中 發自 凹非寺量子位 | 公眾號 QbitAI大模型正引領新一輪的研究熱潮,業界和學術界都涌現出了眾多的創新成果。 小紅書技術團隊也在這一浪潮中不斷探索,多...
又一篇AI頂會!這個idea“ 殺瘋了 ” ….
很多人總是誤以為,靠著自己的認真努力就能把SCI/CCF論文發出來,可真相是:只知道一味地努力,是一種完完全全錯誤的學生思維,是發不出論文的。 科研是有“門...
今日arXiv最熱大模型論文:大模型對齊告別微調,直接編輯表征空間即可解決
夕小瑤科技說 原創作者 | Richard人工智能技術正在飛速發展,尤其是大語言模型在自然語言處理領域取得了令人矚目的成就。但同時,我們也面臨著如何讓語言模型...
提速199倍!清華&哈佛發布三維語義高斯潑濺LangSplat|CVPR‘24 Highlight
LangSplat團隊 投稿量子位 | 公眾號 QbitAI入選CVPR 2024 Highlight的三維語義高斯潑濺最新成果,查詢速度比之前的SOTA方法LERF快了199倍! 清華&哈佛團...
OpenAI 是如何估計與分析模型計算量的?
直播預告 | 6月25日10點,「智猩猩AI新青年講座」第241講正式開講,伊利諾伊大學厄巴納-香檳分校在讀博士趙曉明將直播講解《從單目視頻中合成動態新視圖》,...
導師爆料:這篇CVPR最佳學生論文,從想法到成稿只用一個月,源自業余靈感
機器之心報道 機器之心編輯部按部就班 vs. 好奇心驅動,哪個更容易出研究成果?CVPR 2024 的最佳學生論文,竟然是用一個月的時間寫出來的。 北京時間 6 月 20...
Nature重磅:大模型的謊言如何“破”?牛津團隊提出新方法,無需人工監督或特定領域知識
大數據文摘授權轉載自學術頭條 世界衛生組織(WHO)的人工智能健康資源助手 SARAH 列出了舊金山本不存在的診所的虛假名稱和地址。 Meta公司“短命”的科學聊天...
小紅書這場大模型論文分享會,集齊了四大國際頂會的作者
大模型正引領新一輪的研究熱潮,業界和學術界都涌現出了眾多的創新成果。 小紅書技術團隊也在這一浪潮中不斷探索,多篇論文研究成果在 ICLR、ACL、CVPR、AAAI...
1塊3090就能訓7B大模型,山東大學低帶寬低顯存訓練法,解決顯卡限購卡脖子
夕小瑤科技說 原創作者 | 謝年年 大模型的全參數微調對資源要求非常高,當前業界更傾向于采用LoRA,Parallel Adapter等參數高效微調(PEFT)方法,通過添加只...
粵公網安備 44011502001135號