標簽:問題

全新生物學基準數據集LAB-Bench震撼開源!覆蓋8大任務,超2.4K選擇題

lü作者:十九 編輯:十九,李寶珠 FutureHouse Inc. 的研究人員推出了 LAB-Bench 生物學基準測試數據集,用于評估 AI 系統在文獻檢索和推理、圖形解釋、表格...
閱讀原文

真假 Agent 大討論:我的?Agent?可能是個?Chatbot?

編輯 | 趙明華、褚杏娟 策劃 | 李忠良 目前,Agent(智能體)已經成為當前人工智能領域的熱門話題。在很多產品和業務上,Agent 都具有廣泛的應用前景,不少...
閱讀原文

Karpathy:用表情包解釋一下,為什么AI數不清Strawberry幾個 r?

還記得這些天大模型被揪出來的低級錯誤嗎? 不知道 13.11 和 13.8哪個大,數不清 Strawberry 單詞里面有多少個 r…… 每每被發現一個弱點,大模型都只能接受人...
閱讀原文

Llama3.1訓練平均3小時故障一次,H100萬卡集群好脆弱,氣溫波動都會影響吞吐量

西風 發自 凹非寺量子位 | 公眾號 QbitAI每3個小時1次、平均1天8次,Llama 3.1 405B預訓練老出故障,H100是罪魁禍首? 最近有人從Meta發布的92頁超長Llama 3....
閱讀原文

訓練一次經歷 419 次意外故障!英偉達 GPU 也差點玩不轉 405B 模型,全靠 Meta 工程師后天救場!

整理 | 華衛 最近,Meta 在一份研究報告中揭示了訓練 Llama 3 405B 參數模型的重大挑戰:該系統在包含 16384 個 Nvidia H100 GPU 的集群上運行,在訓練期間...
閱讀原文

秘密打造「AI陶哲軒」 震驚數學圈!谷歌IMO夢之隊首曝光,菲爾茲獎得主深度點評

新智元報道編輯:編輯部 【新智元導讀】19秒破解幾何難題,谷歌AI奪得IMO銀牌在業界掀起了巨震。就連菲爾茲獎得主陶哲軒,前IMO美國隊負責人羅博深都對此大加...
閱讀原文

1.6萬塊H100訓Llama 3.1,每3小時故障1次!罪魁禍首竟是GPU和HBM3顯存

新智元報道編輯:庸庸 好困 【新智元導讀】在Meta的Llama 3.1訓練過程中,其運行的1.6萬個GPU訓練集群每3小時就會出現一次故障,意外故障中的半數都是由英偉...
閱讀原文

英偉達最新技術分享:手把手教你用Llama 3.1合成數據改進模型!附代碼

新智元報道編輯:喬楊 好困 【新智元導讀】適逢Llama 3.1模型剛剛發布,英偉達就發表了一篇技術博客,手把手教你如何好好利用這個強大的開源模型,為領域模型...
閱讀原文

標簽貼錯,AMD召回所有新一代CPU

機器之心報道 編輯:澤南、佳琪因為有 typo,召回所有已鋪貨芯片。上個月,AMD 首席執行官蘇姿豐博士在 ComputeX 開幕主題演講上揭開了 Zen 5 架構的神秘面紗...
閱讀原文

OpenAI慘遭打臉!SearchGPT官方演示大翻車,源代碼竟暴露搜索機制

新智元報道編輯:桃子 喬楊 【新智元導讀】OpenAI再次上演了谷歌Bard出糗的一幕,SearchGPT官方震撼演示卻被外媒曝出低級錯誤。另有神通廣大的開發者甚至扒出...
閱讀原文

陶哲軒點評谷歌AlphaProof:AI在數學競賽中展現「超凡智慧」

機器之心報道 編輯:大盤雞人工智能在數學推理中不斷前進。在奧數問題面前,AI 的「智商」往往不太夠用。不過,這已經是過去式了。谷歌 DeepMind 用 AI 做出...
閱讀原文

損壞不可逆?英特爾13/14代酷睿桌面CPU崩潰后續,不會召回

機器之心報道 編輯:杜偉真就要「AMD Yes」了。 最近一段時間,部分使用英特爾第 13/14 代酷睿臺式機處理器的游戲玩家遇到了一些麻煩。他們反饋稱,這些處理...
閱讀原文

為什么AI數不清Strawberry里有幾個 r?Karpathy:我用表情包給你解釋一下

機器之心報道 機器之心編輯部讓模型知道自己擅長什么、不擅長什么是一個很重要的問題。還記得這些天大模型被揪出來的低級錯誤嗎? 不知道 9.11 和 9.9 哪個大...
閱讀原文

谷歌再被OpenAI截胡?訓練數學AI拿下IMO銀牌,不及SearchGPT放了空響…

夕小瑤科技說 原創作者 | 海野昨夜谷歌振臂高呼:我們新的數學AI,能在IMO數學競賽達到銀牌水平! 但就在谷歌發文的幾個小時后,OpenAI就偷了谷歌的家: 發布...
閱讀原文

谷歌AI一分之差痛失IMO金牌!19秒做一題碾壓人類選手,幾何AI超進化震撼評委

新智元報道編輯:編輯部 【新智元導讀】就在剛剛,谷歌DeepMind最新的數學模型捧得了IMO奧數銀牌!它不僅以滿分成績做出了6道題中的4道,距離金牌只有1分之差...
閱讀原文
191011121336