標簽:準確率

字節提出視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024

文章轉載自公眾號:量子位,本文只做學術/技術分享,如有侵權,聯系刪文。 視覺語言模型屢屢出現新突破,但ViT仍是圖像編碼器的首選網絡結構。 字節提出新基...
閱讀原文

字節發布視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024

允中 發自 凹非寺量子位 | 公眾號 QbitAI視覺語言模型屢屢出現新突破,但ViT仍是圖像編碼器的首選網絡結構。 字節提出新基礎模型——ViTamin,專為視覺語言時代...
閱讀原文

蘋果加入開源大戰,官宣端側小模型OpenELM!參數2.7億到30億一臺M2 Mac可跑

新智元報道編輯:桃子 【新智元導讀】開源戰在這半個月愈演愈烈。先是Llama 3,又到微軟Phi-3,再到今天蘋果發布的OpenELM。四種不同小參數版本全部上線,我...
閱讀原文

蘋果卷開源大模型,公開代碼、權重、數據集、訓練全過程,OpenELM亮相

機器之心報道 編輯:陳萍、大盤雞蘋果發布基于開源訓練和推理框架的高效語言模型族 OpenELM。要說 ChatGPT 拉開了大模型競賽的序幕,那么 Meta 開源 Llama 系...
閱讀原文

超越GPT-4,斯坦福團隊手機可跑的大模型火了,一夜下載量超2k

機器之心報道 機器之心編輯部在大模型落地應用的過程中,端側 AI 是非常重要的一個方向。 近日,斯坦福大學研究人員推出的 Octopus v2 火了,受到了開發者社...
閱讀原文

如何從頭開始編寫LoRA代碼,這有一份教程

選自 lightning.ai 作者:Sebastian Raschka 機器之心編譯 編輯:陳萍作者表示:在各種有效的 LLM 微調方法中,LoRA 仍然是他的首選。LoRA(Low-Rank Adaptat...
閱讀原文

何愷明劉壯新作:消除數據集偏差的十年之戰

編輯部 發自 凹非寺量子位 | 公眾號 QbitAIMIT新晉副教授何愷明,新作新鮮出爐: 瞄準一個橫亙在AI發展之路上十年之久的問題:數據集偏差。 該研究為何愷明在...
閱讀原文

年輕人的第一個多模態大模型:1080Ti輕松運行,已開源在線可玩

Vary-toy團隊 投稿量子位 | 公眾號 QbitAI一款名為Vary-toy的“年輕人的第一個多模態大模型”來了! 模型大小不到2B,消費級顯卡可訓練,GTX1080ti 8G的老顯卡...
閱讀原文

歷時8年終發Science,他證明老鼠有類人的想象力

來源:量子位關于大模型注意力機制,Meta又有了一項新研究。通過調整模型注意力,屏蔽無關信息的干擾,新的機制讓大模型準確率進一步提升。而且這種機制不需...
閱讀原文

更像人腦的新型注意力機制,Meta讓大模型自動屏蔽任務無關信息,準確率提高27%

克雷西 發自 凹非寺量子位 | 公眾號 QbitAI關于大模型注意力機制,Meta又有了一項新研究。通過調整模型注意力,屏蔽無關信息的干擾,新的機制讓大模型準確率...
閱讀原文

DeepMind:誰說卷積網絡不如ViT?

機器之心報道編輯:陳萍、小舟本文通過評估按比例擴大的 NFNets,挑戰了 ConvNets 在大規模上表現不如 ViTs 的觀點。深度學習的早期成功可歸功于卷積神經網絡...
閱讀原文

大模型搞“搜索”,準確率高達95.8%!研究作者:已提醒OpenAI谷歌Meta

豐色 發自 凹非寺量子位 | 公眾號 QbitAI一項最新研究(來自蘇黎世聯邦理工大學)發現:大模型的“人肉搜索”能力簡直不可小覷。例如一位Reddit用戶只是發表了...
閱讀原文

DeepMind讓大模型學會歸納和演繹,GPT-4準確率提升13.7%

機器之心報道機器之心編輯部當前,大型語言模型(LLM)在推理任務上表現出令人驚艷的能力,特別是在給出一些樣例和中間步驟時。然而,prompt 方法往往依賴于 ...
閱讀原文

突破『逆轉詛咒』!新數學推理數據集揭秘,讓大語言模型逆向推理能力翻倍

夕小瑤科技說 分享來源 | 機器之心復雜數學推理是評價大語言模型推理能力的重要指標,目前常用的數學推理數據集樣本量有限且問題多樣性不足,導致大語言模型...
閱讀原文

MetaMath:新數學推理語言模型,訓練大模型的逆向思維

機器之心專欄機器之心編輯部復雜數學推理是評價大語言模型推理能力的重要指標,目前常用的數學推理數據集樣本量有限且問題多樣性不足,導致大語言模型存在 [...
閱讀原文