<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        剛剛,全球首個(gè)混合推理模型Claude 3.7降世!最強(qiáng)編程大腦暴擊DeepSeek R1

        AIGC動(dòng)態(tài)6個(gè)月前發(fā)布 新智元
        441 0 0

        剛剛,全球首個(gè)混合推理模型Claude 3.7降世!最強(qiáng)編程大腦暴擊DeepSeek R1

        原標(biāo)題:剛剛,全球首個(gè)混合推理模型Claude 3.7降世!最強(qiáng)編程大腦暴擊DeepSeek R1
        文章來(lái)源:新智元
        內(nèi)容字?jǐn)?shù):9092字

        Anthropic發(fā)布Claude 3.7 Sonnet:混合推理模型引領(lǐng)AI新紀(jì)元

        Anthropic公司近日重磅發(fā)布了其最新的大型語(yǔ)言模型Claude 3.7 Sonnet,這款模型被譽(yù)為迄今為止最智能的Claude系列模型,也是全球首個(gè)混合推理模型。其核心突破在于結(jié)合了兩種思考方式:即時(shí)響應(yīng)和逐步擴(kuò)展思考,顯著提升了模型在各個(gè)領(lǐng)域的性能。

        1. 混合推理:即時(shí)與擴(kuò)展思考的完美結(jié)合

        Claude 3.7 Sonnet 的獨(dú)特之處在于它能夠根據(jù)用戶需求,在即時(shí)響應(yīng)和逐步展示詳細(xì)思考過(guò)程(擴(kuò)展思考模式)之間切換。擴(kuò)展思考模式下,模型會(huì)詳細(xì)展現(xiàn)其推理步驟,如同人類思考過(guò)程一樣,極大提升了模型在復(fù)雜問(wèn)題上的解決能力。用戶可以通過(guò)API精確控制模型的思考時(shí)間和token數(shù)量,在速度和質(zhì)量之間取得平衡。

        2. 性能顯著提升,編碼能力尤其突出

        在多項(xiàng)基準(zhǔn)測(cè)試中,Claude 3.7 Sonnet的表現(xiàn)令人矚目。尤其在數(shù)學(xué)、物理、指令執(zhí)行和編程等方面,其性能大幅超越了上一代模型Claude 3.5 Sonnet,數(shù)學(xué)和編碼能力提升超過(guò)10%。在編碼測(cè)試中,它甚至擊敗了o3-mini和DeepSeek R1等競(jìng)爭(zhēng)對(duì)手,與Grok 3不相上下,在SWE-bench上取得了70.3%的高分,成為名副其實(shí)的“軟件工程AI”。

        3. Claude Code:智能體編程工具的驚艷亮相

        除了模型本身的升級(jí),Anthropic還同步發(fā)布了智能體編程工具Claude Code(預(yù)覽版)。該工具能夠協(xié)助開(kāi)發(fā)者完成大量的工程任務(wù),例如搜索和閱讀代碼、編輯文件、編寫(xiě)和運(yùn)行測(cè)試、提交代碼到GitHub等。在早期測(cè)試中,Claude Code甚至能夠一次性完類需要45分鐘才能完成的任務(wù),大大提升了開(kāi)發(fā)效率。

        4. 行為擴(kuò)展與持續(xù)交互能力

        Claude 3.7 Sonnet 具備“行為擴(kuò)展”能力,能夠迭代調(diào)用函數(shù)、響應(yīng)環(huán)境變化,并持續(xù)操作直到完成開(kāi)放式任務(wù)。這使得它在與虛擬計(jì)算機(jī)交互的任務(wù)中表現(xiàn)出色,并在OSWorld評(píng)估中取得了優(yōu)異成績(jī)。更令人印象深刻的是,在《口袋妖怪:紅》游戲中,它成功挑戰(zhàn)并擊敗了三位道館館主,展現(xiàn)了其強(qiáng)大的持續(xù)學(xué)習(xí)和策略調(diào)整能力。

        5. 串行與并行測(cè)試時(shí)計(jì)算:提升模型性能的關(guān)鍵

        Claude 3.7 Sonnet 在擴(kuò)展思考模式下采用串行測(cè)試時(shí)計(jì)算,通過(guò)逐步增加計(jì)算資源投入來(lái)提升性能。同時(shí),Anthropic也在探索并行測(cè)試時(shí)計(jì)算,通過(guò)多個(gè)思維過(guò)程的采樣和選擇最佳結(jié)果來(lái)進(jìn)一步優(yōu)化模型性能,在GPQA評(píng)估中取得了顯著進(jìn)展。

        6. 免費(fèi)開(kāi)放,引領(lǐng)AI發(fā)展新方向

        值得一提的是,Claude 3.7 Sonnet 目前已免費(fèi)開(kāi)放,用戶可以通過(guò)Claude.ai平臺(tái)、Anthropic API、Amazon Bedrock以及Google Cloud的Vertex AI進(jìn)行訪問(wèn)。Anthropic此舉無(wú)疑將進(jìn)一步推動(dòng)AI領(lǐng)域的發(fā)展,并促進(jìn)更多創(chuàng)新應(yīng)用的誕生。


        聯(lián)系作者

        文章來(lái)源:新智元
        作者微信:
        作者簡(jiǎn)介:智能+中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國(guó)新智能時(shí)代。

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無(wú)評(píng)論

        暫無(wú)評(píng)論...
        主站蜘蛛池模板: 亚洲AV无码AV吞精久久| 中文字幕无线码免费人妻| 日韩一级免费视频| 大学生a级毛片免费观看| 亚洲人成网站影音先锋播放| 一区视频免费观看| 亚洲国产精品一区二区九九| 色www永久免费网站| 亚洲色欲色欲www在线丝 | 一区二区三区免费电影| 亚洲AV无码AV男人的天堂| 在线观看免费视频网站色| 亚洲区精品久久一区二区三区| 久久免费看黄a级毛片| 亚洲国产成人精品无码区在线秒播 | 一区二区三区在线免费看| 亚洲精品国产摄像头| 久久精品国产亚洲一区二区| 精品乱子伦一区二区三区高清免费播放| 亚洲第一成年男人的天堂| 国产免费AV片无码永久免费 | 亚洲精品无码久久毛片| 四虎国产精品成人免费久久| 亚洲黄色三级网站| 国产精品69白浆在线观看免费| 中国china体内裑精亚洲日本| 日韩在线a视频免费播放| 99re免费在线视频| 亚洲小说图片视频| 麻豆国产入口在线观看免费| 午夜理伦剧场免费| 国产精品午夜免费观看网站| 亚洲久热无码av中文字幕| 四虎影视永久免费观看| 2021免费日韩视频网| 免费精品一区二区三区第35| 一个人看的www免费在线视频| 亚洲人成无码网站在线观看| 亚洲精品一卡2卡3卡三卡四卡| 亚洲热线99精品视频| 亚洲国产精品无码久久久久久曰 |