標簽：方法

今日arXiv最熱NLP大模型論文：微軟發(fā)布：大模型時代的可解釋機器學習，現(xiàn)狀與挑戰(zhàn)

夕小瑤科技說原創(chuàng)作者 | 謝年年、Python自深度學習開啟了人工智能的黑盒模式，模型的可解釋性一直都是專家學者討論研究的重點。為什么可解釋性問題這么重要...

閱讀原文

AIGC動態(tài)

2年前 (2024)

大語言模型的深度裁剪法

?夕小瑤科技說原創(chuàng)作者 | 芒果、Python?引言：大語言模型的計算挑戰(zhàn)與優(yōu)化需求在人工智能領(lǐng)域，大語言模型（LLMs）已經(jīng)成為推動語言理解和生成任務進步的重...

閱讀原文

AIGC動態(tài)

2年前 (2024)

小樣本學習只是一場學術(shù)界自嗨嗎？

700個開發(fā)硬件免費申請?現(xiàn)金大獎！生成式 AI、機器人 AI、PC AI 三大賽道！AMD Pervasive AI 開發(fā)者挑戰(zhàn)賽報名火熱進行中，掃碼了解詳情并報名～導讀本文是知...

閱讀原文

AIGC動態(tài)

2年前 (2024)

港中文聯(lián)合MIT提出超長上下文LongLoRA大模型微調(diào)算法

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自將門創(chuàng)投現(xiàn)階段，上下文窗口長度基本上成為了評估LLM能力的硬性指標，上下文的長度越長，代表大模型能夠接受的用戶要求越復雜，近期Ope...

閱讀原文

AIGC動態(tài)

2年前 (2024)

AI模擬器拿下物理仿真新SOTA！｜SIGGRAPH Asia 2023最佳論文

NFM團隊投稿量子位 | 公眾號 QbitAI機器學習讓計算機圖形學（CG）仿真更真實了！方法名為神經(jīng)流向圖（Neural Flow Maps，NFM），四個渦旋的煙霧也能精確模...

閱讀原文

AIGC動態(tài)

2年前 (2024)

大型語言模型的模型壓縮與高效推理：綜述

來源：專知基于Transformer的大型語言模型取得了巨大成功。然而，在推理過程中產(chǎn)生的顯著內(nèi)存和計算成本，使得在資源受限的設備上部署大型模型變得具有挑戰(zhàn)...

閱讀原文

AIGC動態(tài)

2年前 (2024)

Meta發(fā)布抽象鏈，大模型工具利用精度+6%，速度+40%！

夕小瑤科技說原創(chuàng)編輯 | 芒果引言：大語言模型與真實世界知識的對齊挑戰(zhàn)在人工智能領(lǐng)域，大型語言模型（LLMs）的發(fā)展已經(jīng)取得了顯著進步，特別是在理解和執(zhí)...

閱讀原文

AIGC動態(tài)

2年前 (2024)

如何解決大模型增量預訓練中的災難性遺忘？

目前不少開源模型在通用領(lǐng)域具有不錯的效果，但由于缺乏領(lǐng)域數(shù)據(jù)，往往在一些垂直領(lǐng)域中表現(xiàn)不理想，這時就需要增量預訓練和微調(diào)等方法來提高模型的領(lǐng)域能力...

閱讀原文

AIGC動態(tài)

2年前 (2024)

OpenAI、斯坦福大學提出Meta-Prompting，有效提升語言模型的性能

夕小瑤科技說原創(chuàng)作者 | 智商掉了一地、Python 為了研究如何提高語言模型的性能，使其更充分有效地輸出對于提問的回答，來自斯坦福和 OpenAI 的學者強強聯(lián)手...

閱讀原文

AIGC動態(tài)

2年前 (2024)

重塑3D生成核心理論：VAST、港大、清華用「零」訓練數(shù)據(jù)生成了3D模型

機器之心專欄機器之心編輯部AI 生成 3D 模型最難的一關(guān)，終于被搞定了。無需任何訓練數(shù)據(jù)，只需對著模型描述一句話，如「一個做作業(yè)的香蕉人」：或是「一只...

閱讀原文

AIGC動態(tài)

2年前 (2024)

湯曉鷗帶隊：免調(diào)優(yōu)長視頻生成，可支持512幀！任何擴散模型都能用｜ICLR'24

豐色發(fā)自凹非寺量子位 | 公眾號 QbitAI想要AI生成更長的視頻？現(xiàn)在，有人提出了一個效果很不錯的免調(diào)優(yōu)方法，直接就能作用于預訓練好的視頻擴散模型。它...

閱讀原文

AIGC動態(tài)

2年前 (2024)

首個通用雙向Adapter多模態(tài)目標追蹤方法BAT，入選AAAI 2024

機器之心專欄機器之心編輯部能夠有效實現(xiàn)多模態(tài)交叉提示跟蹤。目標跟蹤是計算機視覺的一項基礎視覺任務，由于計算機視覺的快速發(fā)展，單模態(tài) (RGB) 目標跟蹤...

閱讀原文

AIGC動態(tài)

2年前 (2024)

小模型增強可超GPT-4？北航 && 人大 | 提出大模型ICL增強范式，模型越小收益越高！

引言：上下文學習（In-context Learning，ICL）技術(shù)是提高模型在自然語言處理任務上表現(xiàn)的高效提示技術(shù)，因而眾多研究在這個方向上提出各種方法，但大多數(shù)都...

閱讀原文

AIGC動態(tài)

2年前 (2024)

ICLR 2024 Oral | 三行代碼，即插即用！NUS尤洋團隊新作—InfoBatch，無損數(shù)據(jù)集動態(tài)剪枝加速

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自將門創(chuàng)投本文介紹來自NUS尤洋團隊的最新科研成果 - InfoBatch。這是首篇關(guān)于無損數(shù)據(jù)剪枝加速的工作，覆蓋分類、分割、檢測、圖片生成...

閱讀原文

AIGC動態(tài)

2年前 (2024)

一張照片，為深度學習巨頭們定制人像圖片

機器之心專欄作者：InstantX 團隊主題驅(qū)動的文本到圖像生成，通常需要在多張包含該主題（如人物、風格）的數(shù)據(jù)集上進行訓練，這類方法中的代表工作包括 Drea...

閱讀原文

AIGC動態(tài)

2年前 (2024)

1…12 131415 16…21