<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        微軟推出的14B參數(shù)小語言模型,擅長數(shù)學(xué)等領(lǐng)域的復(fù)雜推理

        AI工具7個月前發(fā)布 AI工具集
        652 0 0

        產(chǎn)品名稱:Phi-4
        產(chǎn)品簡介:Phi-4是微軟推出的14億參數(shù)小型語言模型,在數(shù)學(xué)等領(lǐng)域的復(fù)雜推理以及傳統(tǒng)語言處理方面表現(xiàn)出色。Phi-4用數(shù)據(jù)質(zhì)量為核心訓(xùn)練重點,大量融入合成數(shù)據(jù),提升模型在STEM問答和數(shù)學(xué)競賽問題上的表現(xiàn)。Phi-4引入新的訓(xùn)練范式midtraining,增強長文本處理能力,窗口長度可達16K。
        詳細(xì)介紹:

        Phi-4是什么

        Phi-4是微軟推出的14B參數(shù)小型語言模型,在數(shù)學(xué)等領(lǐng)域的復(fù)雜推理以及傳統(tǒng)語言處理方面表現(xiàn)出色。Phi-4用數(shù)據(jù)質(zhì)量為核心訓(xùn)練重點,大量融入合成數(shù)據(jù),提升模型在STEM問答和數(shù)學(xué)競賽問題上的表現(xiàn)。Phi-4引入新的訓(xùn)練范式midtraining,增強長文本處理能力,窗口長度可達16K。Phi-4在編程任務(wù)上表現(xiàn)出色,在HumanEval基準(zhǔn)測試中以82.6%的準(zhǔn)確率領(lǐng)先其他開源模型(如70B的Llama 3.3和72B的Qwen 2.5)。Phi-4目前在Azure AI Foundry上可用,下周將在Hugging Face上可用。

        微軟推出的14B參數(shù)小語言模型,擅長數(shù)學(xué)等領(lǐng)域的復(fù)雜推理

        Phi-4的主要功能

        • 問答能力:能理解和回答各種問題,尤其在STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué))領(lǐng)域表現(xiàn)出色。
        • 數(shù)學(xué)問題解決:模型在美國數(shù)學(xué)競賽AMC 10/12中得分超過90,顯示強大的數(shù)學(xué)推理能力。
        • 編程任務(wù):Phi-4在編程任務(wù)上表現(xiàn)出色,能理解和生成代碼,解決編程問題。
        • 長文本處理:基于midtraining階段,Phi-4能處理長達16K的上下文,保持高召回率。
        • 復(fù)雜推理:模型在多個基準(zhǔn)測試中展現(xiàn)處理復(fù)雜推理任務(wù)的能力,如MMLU和GPQA。
        • 安全交互:Phi-4在后訓(xùn)練中進行安全對齊,確保與用戶的交互符合負(fù)責(zé)任AI原則。

        Phi-4的技術(shù)原理

        • 合成數(shù)據(jù)訓(xùn)練:Phi-4的訓(xùn)練過程中大量使用合成數(shù)據(jù),基于多代理提示、自我修訂和指令反轉(zhuǎn)等技術(shù)生成,提高模型的推理和問題解決能力。
        • midtraining階段:在預(yù)訓(xùn)練和后訓(xùn)練之間加入的midtraining階段,提升模型處理長文本的能力。
        • 長上下文數(shù)據(jù)選擇:從高質(zhì)量非合成文本中篩選出長于8K tokens的樣本,加權(quán)超過16K tokens的樣本,匹配目標(biāo)長度。
        • 對比學(xué)習(xí):用樞軸tokens搜索(PTS)方法,識別對模型輸出影響最大的關(guān)鍵tokens,生成高信噪比的對比學(xué)習(xí)數(shù)據(jù)。
        • 人類反饋:結(jié)合人類反饋對比學(xué)習(xí)(Human Feedback DPO),構(gòu)造優(yōu)質(zhì)的正負(fù)樣本對,讓模型輸出更符合人類偏好。

        Phi-4的項目地址

        Phi-4的應(yīng)用場景

        • 教育輔助:作為教育輔助工具,幫助學(xué)生解答STEM領(lǐng)域的復(fù)雜問題,提供數(shù)學(xué)和編程作業(yè)的輔導(dǎo)。
        • 技術(shù)研究:在科學(xué)研究中,理解和生成研究論文中的概念和數(shù)據(jù),輔助研究人員進行文獻綜述和數(shù)據(jù)分析。
        • 軟件開發(fā):輔助軟件開發(fā),包括代碼生成、調(diào)試和功能實現(xiàn)。
        • 智能助手:作為智能助手,理解和響應(yīng)用戶的查詢,提供信息檢索、日程管理和其他個人助理服務(wù)。
        • 企業(yè)決策支持:分析大量數(shù)據(jù),為企業(yè)提供市場趨勢分析、風(fēng)險評估和決策支持。
        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: a级毛片毛片免费观看久潮喷| 亚洲国产精品精华液| 国产伦精品一区二区免费| 免费成人午夜视频| 美女裸体无遮挡免费视频网站| 日产乱码一卡二卡三免费| 亚洲AV网站在线观看| 日本免费一区二区久久人人澡| 亚洲真人日本在线| 国产日韩久久免费影院| 亚洲国产精品无码久久SM| 亚洲日韩AV一区二区三区四区| 卡1卡2卡3卡4卡5免费视频| 亚洲国产成人久久一区WWW| 国产精品美女久久久免费| 亚洲av最新在线网址| 亚洲人成免费网站| 亚洲卡一卡二卡乱码新区| 最近中文字幕无吗高清免费视频| 亚洲欧美不卡高清在线| 国产L精品国产亚洲区久久| 久久青草免费91线频观看不卡| 337p日本欧洲亚洲大胆精品555588 | 免费毛片在线看不用播放器| 日韩免费观看一级毛片看看| 国产天堂亚洲精品| 女人被弄到高潮的免费视频 | 免费人成黄页在线观看日本| 亚洲高清中文字幕| 日本特黄特黄刺激大片免费| 一级毛片免费全部播放| 精品日韩亚洲AV无码一区二区三区 | 有色视频在线观看免费高清在线直播 | 亚洲爱情岛论坛永久| 成年在线网站免费观看无广告| 美女尿口扒开图片免费 | 日本高清免费aaaaa大片视频| 国产99精品一区二区三区免费| 亚洲精品欧洲精品| 美丽姑娘免费观看在线观看中文版 | 国内自产少妇自拍区免费|