標簽:問題
LLM群體智能崛起,數學性能暴增11.6%!谷歌DeepMind四大機構聯手新作
新智元報道編輯:桃子 【新智元導讀】多個LLM聯合,可以邁向更強大系統!最新研究發現,GPT-4能夠提升同伴的性能,能夠讓數學能力暴漲11.6%。AI如何成為「更...
o1 研發團隊完整采訪:Ilya早期曾參與,靈感源于AlphaGo
機器之心報道 機器之心編輯部自從 OpenAI 的 o1 問世以來,它強大的推理能力就承包了 AI 圈近期的熱搜。不需要專門訓練,它就能直接拿下數學奧賽金牌,甚至可...
萬字探討:國內AI應用創業陷入惡性循環,問題在哪里,出路是什么?
自從ChatGPT引起的大模型進化至今,沒有人懷疑LLM和其應用范式將會對人類產生極其重大的影響。 無論是大模型本身的chatbot,multi-agent,多模態對話,還是大...
Sam Altman 最新演講:o1 堪比 GPT-2時刻,AI Agent 時代即將到來
來源:AI寒武紀 OpenAI CEO Sam Altman 剛剛在 T-Mobile 資本市場日上發表演講,不僅談到了 OpenAI 與 T-Mobile 的合作,還重點介紹了 OpenAI 的全新推理模型...
o1方法的推理能力無上限?LeCun怒懟:兩層網絡還可以萬能近似呢
來源:AI科技前沿 OpenAI的o1大模型一經亮相,AI界便熱議如何復制其成果。OpenAI對技術細節嚴格保密,試圖從AI中獲取完整推理過程,稍有過問即遭警告。技術報...
Transformer推理天花板被谷歌打破?DeepMind首席科學家亮出84頁PPT,卻遭LeCun反對
新智元報道編輯:編輯部 HXZ 【新智元導讀】隨OpenAI爆火的CoT,已經引發了大佬間的激戰!谷歌DeepMind首席科學家Denny Zhou拿出一篇ICLR 2024論文稱:CoT可...
萬字長文解讀百度大模型原生安全構建之路
演講嘉賓 |馮景輝 編輯 |蔡芳芳 策劃 |AICon 全球人工智能開發與應用大會 大模型以其更智能、不確定和不可解釋的特點,給安全領域,尤其是內容安全帶來了...
ICML 2024丨多軌圖卷積網絡:解決過平滑與過碾壓的新思路
圖神經網絡(Graph Neural Networks)是強大的圖(關系與交互系統)分析工具,已成功應用在推薦系統、金融風控、知識工程、分子動力學模擬、芯片設計等諸多領...
o1方法性能無上限!姚班馬騰宇等數學證明:推理token夠多,就能解決任意問題
來源:量子位 | 公眾號 QbitAI克雷西 發自 凹非寺OpenAI用o1開啟推理算力Scaling Law,能走多遠? 數學證明來了:沒有上限。 斯隆獎得主馬騰宇以及Google Bra...
超強o1模型智商已超120!1小時寫出NASA博士1年代碼,最新編程賽超越99.8%選手
新智元報道編輯:桃子 喬楊 【新智元導讀】OpenAI博士級別的智能,真的實現了!一位UCI物理學博士實測o1,發現自己用時1年完成的博士論文代碼,竟被AI在1個小...
MMMU華人團隊更新Pro版!多模態基準升至史詩級難度:過濾純文本問題、引入純視覺問答
新智元報道編輯:LRS 【新智元導讀】MMMU-Pro通過三步構建過程(篩選問題、增加候選選項、引入純視覺輸入設置)更嚴格地評估模型的多模態理解能力;模型在新...
實測 OpenAI 最強模型 o1 :做題王者,實戰青銅
做題王者 實戰青銅本周OpenAI 突然發布了 o1 系列模型,最大的特點是擅長推理。 模型的能力,一代比一代強,我們的測評,一次比一次難做。測評變成一件「畢恭...
「LLM」這個名字不好,Karpathy認為不準確、馬斯克怒批太愚蠢
機器之心報道 編輯:陳陳LLM 應該改名嗎?你怎么看。在 AI 領域,幾乎每個人都在談論大型語言模型,其英文全稱為 Large Language Models,簡寫為 LLM。 因為 ...
陶哲軒提前實測滿血版o1:能當研究生使喚
白小交 衡宇 發自 凹非寺量子位 | 公眾號 QbitAI好羨慕!原來早在8月份,陶哲軒就已經用上了OpenAI o1。 還是現在大家都用不上的滿血版本(眼淚不爭氣地從嘴...
實測 | GPT-o1:學會了思考,也學會了偷懶
警惕 AI 用思考時長等效答案質量。作者丨林杰鑫 編輯丨陳彩嫻 我可能是全網第一個花錢向 GPT-o1 提問,人在深圳靠一條網線橫跨太平洋到美國硅谷讓 OpenAI 最...