標簽:測試

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

NEO發布第一位自主機器學習工程師,MLE-bench秒殺了OpenAI o1

夕小瑤科技說 原創作者 | 海野今天剛刷到一家初創AI公司——NEO AI,一出手就是王炸! 他們是這樣介紹第一個項目的:首個自主機器學習AI工程師。 官方還曬出一...
閱讀原文

擴展測試時計算是萬能的嗎?Scaling What成為關鍵

機器之心PRO · 會員通訊 Week 46---- 本周為您解讀 ③個值得細品的AI & Robotics業內要事 ---- 1. 擴展測試時計算是萬能的嗎?Scaling What成為關鍵 傳統...
閱讀原文

蘋果罕見原型機曝光,全壓感按鍵 iPhone 或會出現

iPhone 原型機 又曝光在智能手機的發展初期,無按鍵手機曾經是所有廠商的終極愿景。 在 iPhone 誕生的前十年,這張圖可是騙到我不止一次。 曾經盛傳的 iPhone...
閱讀原文

AI在《我的世界》PK蓋樓,新舊Claude差距過于明顯,網友:審美也是智力的一種

夢晨 發自 凹非寺量子位 | 公眾號 QbitAI測評大模型Agent能力,從未如此直觀。 新舊兩版Claude 3.5 Sonnet在《我的世界》里PK蓋樓,差距不要太明顯,引來大量...
閱讀原文

實測完 Mac mini 的 3D 渲染能力后,我們發現了一點驚喜

實踐 出真知Mac mini,終究還是火出圈了。 自從發布和發售以來,大家對這臺全新蘋果主機的興趣點,主要集中在以下幾個方面: 體積很小,重量很輕,甚至開始重...
閱讀原文

Ilya承認Scaling Law到頭了,Meta和谷歌尋找替代o1的方法

夕小瑤科技說 原創作者 | 小鹿近期,全球科技界的目光都集中在OpenAI即將推出的下一代模型上,究竟會是o2還是GPT-5? o2代表了全新的訓練范式,而GPT-5則代表...
閱讀原文

Scaling Law撞南墻,MIT發現另一條路:測試時訓練,推理能力最高升至5.8倍

夕小瑤科技說 分享作者 | 量子位o1不是通向大模型推理的唯一路徑! MIT的新研究發現,在測試時對大模型進行訓練,可以讓推理水平大幅提升。 在挑戰超難的ARC...
閱讀原文

連OpenAI都推不動Scaling Law了?MIT把「測試時訓練」系統研究了一遍,發現還有路

機器之心報道 機器之心編輯部昨天,The Information 的一篇文章讓 AI 社區炸了鍋。 這篇文章透露,OpenAI 下一代旗艦模型的質量提升幅度不及前兩款旗艦模型之...
閱讀原文

o1不是唯一路徑!MIT新研究:在測試時訓練,模型推理能力最高升至5.8倍

克雷西 發自 凹非寺量子位 | 公眾號 QbitAIo1不是通向大模型推理的唯一路徑! MIT的新研究發現,在測試時對大模型進行訓練,可以讓推理水平大幅提升。 在挑戰...
閱讀原文

陶哲軒聯手60多位數學家出題,世界頂尖模型通過率僅2%!專家級數學基準,讓AI再苦戰數年

新智元報道編輯:Hjh 【新智元導讀】Epoch AI推出數學基準FrontierMath,目前前沿模型測試成功率均低于2%!OpenAI研究科學家Noam Brown說道:「我喜歡看到新...
閱讀原文

AI落地千行百業,存儲痛點凸顯,浪潮信息如何助力AI向實?

存儲成為AI向實關鍵。 作者|陳駿達 編輯|漠影 AI時代,存儲不僅是數據的棲息之地,更是AI模型訓練、落地過程中的堅實底座。 在AI開啟的存儲行業新周期中,眾...
閱讀原文

產品轉型,創始人用48小時做了個demo,2 個月后公司賣了6.5億美元

Casetext 是一家已經做了 12 年的公司,最初用技術提高法律領域的文件處理效率,從 UGC 網站轉型到 AI 技術方案,順利找到 PMF,ARR 2000 萬美元,估值 1 億...
閱讀原文

o1圖像理解神秘現身,網友瘋狂測試!Altman自曝:o2研究生級水平破105%

新智元報道編輯:桃子 【新智元導讀】完整版o1圖像理解能力,被提前「放出」了?網友曝出o1能夠識圖,進行推理總結。現在,o1多模態一大波試用已經鋪屏全網。...
閱讀原文

大模型玩你畫我猜:Claude6局3勝,GPT-4o表現迷惑

奇月 發自 凹非寺量子位 | 公眾號 QbitAI一群大模型玩你畫我猜,人類一旁圍觀超起勁兒。 就像下面這張圖展示的,由Grok畫長頸鹿,一堆大模型根據生成內容猜答...
閱讀原文

谷歌Agent首次發現真實世界代碼漏洞!搶救全球數億設備,或挽回數十億美元損失?

新智元報道編輯:Aeneas 好困 【新智元導讀】AI首次發現真實世界中的重大安全漏洞?SQLite中的一個漏洞,幸運地被谷歌研究者的AI Agent發現了,修復后并未造...
閱讀原文
12313