標簽：方法

參數少80%，效果仍超LoRA！上交大&上海AI Lab推出高效微調框架FLoRA

Huiser 投稿量子位 | 公眾號 QbitAI為了讓大模型在特定任務、場景下發揮更大作用，LoRA這樣能夠平衡性能和算力資源的方法正在受到研究者們的青睞。然而，以L...

閱讀原文

AIGC動態

1年前 (2024)

大模型性能摻水嚴重？北大交出答卷：交互評估+動態出題，死記硬背也沒用 | ACL 2024

新智元報道編輯：LRS 【新智元導讀】當前大語言模型（LLM）的評估方法受到數據污染問題的影響，導致評估結果被高估，無法準確反映模型的真實能力。北京大學等...

閱讀原文

AIGC動態

1年前 (2024)

ACL2024主會：無需訓練的大模型推薦系統！

夕小瑤科技說原創作者 | Axe_越如今，各種推薦系統無時無刻不在包圍著我們的生活，自大模型（Large Language Model, LLM）時代以來，得益于LLM的高自由度，...

閱讀原文

AIGC動態

1年前 (2024)

比LERF提速199倍！清華哈佛發布LangSplat：三維語義高斯潑濺 | CVPR 2024 Highlight

新智元報道編輯：LRST 【新智元導讀】本文將為大家介紹CVPR 2024 Highlight的論文LangSplat: 3D Language Gaussian Splatting（三維語義高斯潑濺）。LangSpla...

閱讀原文

AIGC動態

1年前 (2024)

史上首個實時AI視頻生成技術：DiT通用，速度提升10.6倍

機器之心報道機器之心編輯部DiT 都能用，生成視頻無質量損失，也不需要訓練。實時 AI 視頻生成來了！本周三，新加坡國立大學尤洋團隊提出了業內第一種可以...

閱讀原文

AIGC動態

1年前 (2024)

GPAvatar：僅需單圖，快速且精準的3D頭像重建及其表情控制

大數據文摘授權轉載自將門創投作者：楚選耕頭部虛擬形象的重建對于虛擬現實、在線會議、游戲和電影等行業的應用至關重要。該領域的主要目標是忠實地重建頭...

閱讀原文

AIGC動態

1年前 (2024)

小紅書怎么用大模型？頂會作者在線等你來聊

允中發自凹非寺量子位 | 公眾號 QbitAI大模型正引領新一輪的研究熱潮，業界和學術界都涌現出了眾多的創新成果。小紅書技術團隊也在這一浪潮中不斷探索，多...

閱讀原文

AIGC動態

1年前 (2024)

又一篇AI頂會！這個idea“ 殺瘋了 ” ….

很多人總是誤以為，靠著自己的認真努力就能把SCI/CCF論文發出來，可真相是：只知道一味地努力，是一種完完全全錯誤的學生思維，是發不出論文的。科研是有“門...

閱讀原文

AIGC動態

1年前 (2024)

今日arXiv最熱大模型論文：大模型對齊告別微調，直接編輯表征空間即可解決

夕小瑤科技說原創作者 | Richard人工智能技術正在飛速發展，尤其是大語言模型在自然語言處理領域取得了令人矚目的成就。但同時，我們也面臨著如何讓語言模型...

閱讀原文

AIGC動態

1年前 (2024)

提速199倍！清華&哈佛發布三維語義高斯潑濺LangSplat｜CVPR‘24 Highlight

LangSplat團隊投稿量子位 | 公眾號 QbitAI入選CVPR 2024 Highlight的三維語義高斯潑濺最新成果，查詢速度比之前的SOTA方法LERF快了199倍！清華&哈佛團...

閱讀原文

AIGC動態

1年前 (2024)

OpenAI 是如何估計與分析模型計算量的？

直播預告 | 6月25日10點，「智猩猩AI新青年講座」第241講正式開講，伊利諾伊大學厄巴納-香檳分校在讀博士趙曉明將直播講解《從單目視頻中合成動態新視圖》，...

閱讀原文

AIGC動態

1年前 (2024)

導師爆料：這篇CVPR最佳學生論文，從想法到成稿只用一個月，源自業余靈感

機器之心報道機器之心編輯部按部就班 vs. 好奇心驅動，哪個更容易出研究成果？CVPR 2024 的最佳學生論文，竟然是用一個月的時間寫出來的。北京時間 6 月 20...

閱讀原文

AIGC動態

1年前 (2024)

Nature重磅：大模型的謊言如何“破”？牛津團隊提出新方法，無需人工監督或特定領域知識

大數據文摘授權轉載自學術頭條世界衛生組織（WHO）的人工智能健康資源助手 SARAH 列出了舊金山本不存在的診所的虛假名稱和地址。 Meta公司“短命”的科學聊天...

閱讀原文

AIGC動態

1年前 (2024)

小紅書這場大模型論文分享會，集齊了四大國際頂會的作者

大模型正引領新一輪的研究熱潮，業界和學術界都涌現出了眾多的創新成果。小紅書技術團隊也在這一浪潮中不斷探索，多篇論文研究成果在 ICLR、ACL、CVPR、AAAI...

閱讀原文

AIGC動態

1年前 (2024)

1塊3090就能訓7B大模型，山東大學低帶寬低顯存訓練法，解決顯卡限購卡脖子

夕小瑤科技說原創作者 | 謝年年大模型的全參數微調對資源要求非常高，當前業界更傾向于采用LoRA，Parallel Adapter等參數高效微調（PEFT）方法，通過添加只...

閱讀原文

AIGC動態

1年前 (2024)

1…5 678 9…21