標簽:問題

GPT-4推理能力為0?開發者懸賞1萬美金被打臉,神秘提示正確率直沖100%

新智元報道編輯:Aeneas 好困 【新智元導讀】小孩子都會的腦筋急轉彎推理題,GPT-4和Claude 3做不出?國外一位開發者小哥堅稱這一觀點,認為GPT模型在訓練集...
閱讀原文

N-S方程問題有解了?與黎曼猜想并列,千禧年數學難題勝利在望

機器之心報道 編輯:澤南、小舟這是數學中最著名的未解問題之一。新的工作已通過同行評審,全文可看。 起猛了,流體力學迎來自己的超導時刻了?最近幾天,數...
閱讀原文

陶哲軒轉發、菲爾茲獎得主領銜:AI正在顛覆數學家的工作方式 | 美國數學學會特刊

夢晨 發自 凹非寺量子位 | 公眾號 QbitAI陶哲軒點贊轉發,《美國數學學會通報》用一整期特刊介紹了AI給數學帶來的改變。 這些文章讀起來很有趣,盡管使我自己...
閱讀原文

中科大等意外發現:大模型不看圖也能正確回答視覺問題!

陳林 投稿 凹非寺量子位 | 公眾號 QbitAI大模型不看圖,竟也能正確回答視覺問題?! 中科大、香港中文大學、上海AI Lab的研究團隊團隊意外發現了這一離奇現象...
閱讀原文

今日arXiv最熱大模型論文:從Twitter動態預測論文學術不端,人大發布

夕小瑤科技說 原創作者 | 松果 引言:社交媒體在科研誠信中的潛在作用在科研領域,確保研究成果的真實性和可靠性是至關重要的。然而,不論是由于研究不端行為...
閱讀原文

GPT-4加Agent輕松追平Devin!普林斯頓造,開源首日斬獲1.6k星

白交 發自 凹非寺量子位 | 公眾號 QbitAI用GPT-4打造的AI程序員,結果輕松追平Devin! 普林斯頓打造的開源SWE-agent,直接開箱即用——修復GitHub存儲庫中真實b...
閱讀原文

普林斯頓首個「開源」AI程序員登場!爆改GPT-4,93秒修bug

新智元報道編輯:編輯部 【新智元導讀】世界首個AI程序員Devin誕生不足一個月,普林斯頓就推出了全新的「開源版本」——SWE-agent!在GPT-4的加持下,debug只需...
閱讀原文

ChatGPT官宣免注冊,全球互聯網變天!OpenAI將取代谷歌搜索?

新智元報道編輯:編輯部 【新智元導讀】OpenAI這份愚人節禮物,實在是太大了:今天起,ChatGPT不用注冊,可以直接使用。用戶狂歡,競品顫抖,我們仿佛已經聽...
閱讀原文

馬斯克發布Grok 1.5,追了一年,仍落后于GPT-4和Claude3

點擊上方藍字關注我們“xAI公司近日推出了Grok-1.5 AI模型,具備強大的推理能力和處理高達10萬字文本的能力。在多項基準測試中表現優異,盡管與市場領先產品GP...
閱讀原文

CVPR 2024|生成不了光線極強的圖片?微信視覺團隊有效解決擴散模型奇點問題

機器之心專欄 機器之心編輯部擴散模型憑借其在圖像生成方面的出色表現,開啟了生成式模型的新紀元。諸如 Stable Diffusion,DALLE,Imagen,SORA 等大模型如...
閱讀原文

LLM性能最高60%提升!谷歌ICLR 2024力作:讓大語言模型學會「圖的語言」

新智元報道編輯:Mindy 【新智元導讀】圖是組織信息的一種有用方式,但LLMs主要是在常規文本上訓練的。谷歌團隊找到一種將圖轉換為LLMs可以理解的格式的方法...
閱讀原文

AI 能否代替軟件工程師?

出品:CSDN(ID:CSDNnews) 作者:Harry Tormey 譯者:彎月 責編:夏萌 軟件工程師的工作不僅僅是寫代碼。AI 面臨著一系列的挑戰,比如深入洞察人類以及開...
閱讀原文

和安克創始人陽萌聊聊:我不看好英偉達,但相信大模型會改變硬件

今晚 8 點,Anker安克創始人陽萌將作客 Founder Park 視頻號直播間,與極客公園創始人張鵬聊聊,大模型會如何改變硬件行業。 主要話題: 大模型會是英偉達 GP...
閱讀原文

今日arXiv最熱NLP大模型論文:天津大學發布大模型數學能力細粒度評價基準FineMath

夕小瑤科技說 原創作者 | Tscom 引言:大語言模型數學能力評估的重要性數學能力的評估對于理解和發展大語言模型(LLMs)至關重要。數學問題不僅涉及對數字的...
閱讀原文

討論下一個token預測時,我們可能正在走進陷阱

機器之心報道 編輯:趙陽自香農在《通信的數學原理》一書中提出「下一個 token 預測任務」之后,這一概念逐漸成為現代語言模型的核心部分。最近,圍繞下一個 ...
閱讀原文
1181920212236