標簽:問題

大模型沒有自我改進能力?蘇黎世理工聯合Meta AI提出小模型架構,顯著提升大模型表現

夕小瑤科技說 原創作者 | 謝年年、python前段時間,多位大佬發文指出大模型沒有自我改進的能力,甚至自我改進之后,回答質量還會明顯下降。自我改進之所以不...
閱讀原文

從 CoT 到 Agent,最全綜述來了!上交出品

夕小瑤科技說 原創作者 | 小戲、Python就在前兩天,我們剛剛和大家聊了聊最近相當火爆的 AI Agents 這一概念:。水平所限,我們也只是淺淺為大家梳理了一下 A...
閱讀原文

Hinton和LeCun再交鋒,激辯LLM能否引發智能奇點!LeCun:人類理解能力碾壓GPT-4

新智元報道編輯:桃子 潤【新智元導讀】大模型能否理解自己所說,Hinton和LeCun再次吵起來了。LeCun新論文證明,GPT-4回答問題準確率僅為15%,自回歸模型不及...
閱讀原文

全網大討論:引爆OpenAI全員亂斗的Q*到底是什么?

機器之心報道編輯:澤南、小舟強大到能威脅人類,所以不得不把自家 CEO 開了?本周三,OpenAI 的「宮斗」隨著山姆?奧特曼回歸 CEO 大位而告于段落,不過此次...
閱讀原文

人類考92分的題,GPT-4只能考15分:測試一升級,大模型全都現原形了

機器之心報道編輯:張倩、澤南AutoGPT 的得分也涼涼。GPT-4 自誕生以來一直是位「優等生」,在各種考試(基準)中都能得高分。但現在,它在一份新的測試中只...
閱讀原文

新王加冕,GPT-4V 屠榜視覺問答

夕小瑤科技說 原創作者 | 智商掉了一地、Python當前,多模態大型模型(Multi-modal Large Language Model, MLLM)在視覺問答(VQA)領域展現了卓越的能力。然...
閱讀原文

是全部重做還是融合改造?揭秘京東云言犀升級全過程

作者 | Tina 采訪嘉賓 | 京東云言犀團隊 ChatGPT 到來后,NLP(自然語言處理)這一行就有了一個梗兒:“一夜醒來,專業沒了。”NLP 是人工智能的一個子領域,指...
閱讀原文

大模型多跳推理有解啦,北大化繁為簡,用30B模型擊敗百億模型

夕小瑤科技說 原創作者 | 謝年年、python我們日常生活中的許多問題都是復雜的多跳問題。比如“《堅如磐石》中飾演黎志田的演員在《三體》中飾演什么角色?”要...
閱讀原文

谷歌為什么輸給了OpenAI?科技公司創始人兼谷歌前員工帶你一探究竟

新智元報道編輯:alan【新智元導讀】在AI革命的浪潮中,谷歌為什么失去了領先地位?最近,NVIDIA科學家Jim Fan轉發了Socratic公司創始人的一篇博客,為我們提...
閱讀原文

企業要做大模型落地?建議進來看看這個榜單

夕小瑤科技說 原創作者 | 賣萌醬機器幻覺問題,可能是未來相當長一段時間內懸浮在大模型領域上方的兩片烏云之一。遙記半年前,LeCun 就曾斷言:“單純根據概率...
閱讀原文

恕我直言,大模型對齊可能無法解決安全問題,我們都被表象誤導了

夕小瑤科技說 原創作者 | 智商掉了一地、Python是否聽說過“偽對齊”這一概念?在大型語言模型(LLM)的評估中,研究者發現了一個引人注目的現象:當面對多項選...
閱讀原文

普林斯頓開源34B數學大模型:性能媲美谷歌Minerva,參數少一半!550億token專業數據訓練

新智元報道編輯:青荻 潤【新智元導讀】在數學領域,一個全新的時代即將到來。LLEMMA,一個強大的數學專用語言模型,正在帶來革命性的性能、數據集和解決方案...
閱讀原文

Bard 首發失利、Gemini AI 推遲發布,谷歌的大模型之路為何如此坎坷?

11 月 16 日,來自 The Information 的獨家消息,谷歌決定推遲發布 Gemini AI——這是旨在與 OpenAI 競爭的大模型產品。自 3 月份 Bard 發布以來,谷歌的 LLM ...
閱讀原文

比ChatGPT早發兩周,被噴下線的Galactica成了LeCun最大的意難平

機器之心報道編輯:小舟、大盤雞今天我們提到大型語言模型(LLM),第一個想到的就是 OpenAI 的 ChatGPT。一年來,ChatGPT 因其強大的性能,廣泛的應用前景而...
閱讀原文

被谷歌收購后,我終于知道為什么大模型競爭落后于OpenAI了

轉載自機器之能編輯:sia儼然一部豪門生存指南。2018 年 3 月,一家科技教育初創 Socratic 被谷歌收購。當時這家僅 10 人的小公司打造了一款家庭作業助手(也...
閱讀原文
1272829303136