Anthropic估值漲到615億美元
原標題:實測Claude 3.7:3200行代碼一口氣輸出,物理規律手拿把掐,弱智吧已失守
文章來源:量子位
內容字數:6560字
Claude 3.7 Sonnet:編程能力爆表的新一代AI模型
近日,Anthropic發布了其最新一代大型語言模型Claude 3.7 Sonnet,引發了廣泛關注。其在編程、物理模擬以及現實世界任務處理上的強大能力,使其成為AI領域的新焦點。本文將對Claude 3.7 Sonnet的各項能力進行總結。
1. 編程能力:代碼生成速度快,游戲開發能力強
Claude 3.7 Sonnet展現出驚人的編程能力。它能夠根據簡單的描述生成大量的、功能完善的代碼。例如,僅需一個樣本,就能生成3200多行代碼,創建一個包含跳躍、打怪、回血、吃金幣等復雜機制的可玩性很高的游戲,甚至可以復刻熱門游戲《Flappy Bird》和《我的世界》。 它還能夠快速生成模擬太陽系運行的1374行代碼,并實現實時交互,展現了其對物理規律的準確把握和代碼生成速度。
2. 物理模擬能力:精準把握物理規律,速度快
許多測試者利用Claude 3.7 Sonnet進行物理模擬,例如模擬四維空間內小球的彈跳,以及模擬流體。其速度遠超之前的模型,例如o3-mini,展現了“天下武功,唯快不破”的優勢。 它甚至能夠根據簡單的描述生成模擬太陽系運行的程序,準確地展現了各個行星的運行軌跡。
3. 現實世界任務處理能力:超越預期,應用場景廣泛
Claude 3.7 Sonnet在處理現實世界任務方面也表現出色。它可以生成動畫天氣卡,模擬云彩移動和雨滴飄落;可以高精度還原網頁HTML結構;甚至可以根據心率生成Apple Watch貪吃蛇游戲,游戲難度與玩家心率正相關。這些都體現了其強大的理解和應用能力。
4. 邏輯推理能力:識破邏輯陷阱,應對復雜情境
Claude 3.7 Sonnet能夠識破許多邏輯陷阱。在“Misguided Attention”基準測試中,它成功避免了被誤導信息影響,正確解答了改進后的“電車難題”和“薛定諤的貓”問題,甚至能識別出一些“弱智吧”式的因果倒置問題,表現出強大的邏輯推理能力。即使在未開啟推理模式下,其表現也與開啟推理模式的o3-mini不相上下。
5. Anthropic公司及融資
Claude 3.7 Sonnet的發布也伴隨著Anthropic新一輪35億美元的融資消息,估值達到615億美元,遠超預期,這體現了市場對其技術的認可。
6. 總結
Claude 3.7 Sonnet 在編程、物理模擬和現實世界任務處理等方面展現出強大的能力,其速度快、準確性高,并具有強大的邏輯推理能力。 這款新模型的出現,無疑將推動AI領域進一步發展,并為各種應用場景帶來更多可能性。 其在代碼生成和游戲開發方面的突出表現,也使其成為開發者和游戲愛好者關注的焦點。
聯系作者
文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破