<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        開源小模型的大智慧!微軟Phi-4技術(shù)報告解讀與簡單測評

        AIGC動態(tài)4個月前發(fā)布 智猩猩GenAI
        401 0 0

        Phi-4:小模型的大智慧——技術(shù)詳解及簡單測評

        開源小模型的大智慧!微軟Phi-4技術(shù)報告解讀與簡單測評

        原標(biāo)題:開源小模型的大智慧!微軟Phi-4技術(shù)報告解讀與簡單測評
        文章來源:智猩猩GenAI
        內(nèi)容字?jǐn)?shù):10088字

        微軟Phi-4:14B參數(shù)小型語言模型的突破

        本文概述了微軟研究院最新發(fā)布的14B參數(shù)大型語言模型Phi-4,它在眾多大型模型中脫穎而出,并在STEM領(lǐng)域問答能力上超越了GPT-4。其成功秘訣在于對數(shù)據(jù)質(zhì)量的極致追求和創(chuàng)新的合成數(shù)據(jù)生成技術(shù)。

        1. 數(shù)據(jù)質(zhì)量的極致追求:合成數(shù)據(jù)的重要性

        Phi-4的成功離不開對高質(zhì)量數(shù)據(jù)的依賴。文章強(qiáng)調(diào)數(shù)據(jù)質(zhì)量與模型規(guī)模同樣重要,甚至可能更為關(guān)鍵。Phi系列模型一直重視合成數(shù)據(jù),因?yàn)樗邆浣Y(jié)構(gòu)化和漸進(jìn)式學(xué)習(xí)的特點(diǎn),能夠幫助模型更有效地學(xué)習(xí),并與推理上下文更好地對齊。與傳統(tǒng)的無監(jiān)督數(shù)據(jù)集相比,合成數(shù)據(jù)更易于消化和理解。

        2. 合成數(shù)據(jù)生成方法:多智能體提示與自我修訂

        Phi-4的預(yù)訓(xùn)練主要依賴于約4000B標(biāo)記的合成數(shù)據(jù)集。這些數(shù)據(jù)通過多步驟提示工作流生成,包括多智能體提示、自我修訂和指令反轉(zhuǎn)等技術(shù)。這些方法彌補(bǔ)了傳統(tǒng)數(shù)據(jù)集的不足,提升了模型的推理和問題解決能力。此外,Phi-4還使用了數(shù)千萬個經(jīng)過篩選和增強(qiáng)的有機(jī)問題和解決方案,以及來自學(xué)術(shù)論文、教育論壇和編程教程等高質(zhì)量的有機(jī)數(shù)據(jù)源。

        3. 模型架構(gòu)與訓(xùn)練過程:4K到16K上下文長度擴(kuò)展

        Phi-4采用僅解碼器的Transformer架構(gòu),擁有14B參數(shù)。其默認(rèn)上下文長度為4096個標(biāo)記,并在中訓(xùn)練階段擴(kuò)展到16K,這使得模型能夠處理更長的文本序列。訓(xùn)練過程持續(xù)約10萬億標(biāo)記,并采用了線性預(yù)熱和衰減計(jì)劃等優(yōu)化策略。中訓(xùn)練階段主要目標(biāo)是擴(kuò)展上下文長度,并使用了更長上下文的數(shù)據(jù)進(jìn)行訓(xùn)練,顯著提升了長上下文性能。

        4. 訓(xùn)練后處理:提升模型可靠性和安全性

        訓(xùn)練后處理是Phi-4的關(guān)鍵環(huán)節(jié),通過監(jiān)督微調(diào)(SFT)、直接偏好優(yōu)化(DPO)和關(guān)鍵標(biāo)記搜索(PTS)等技術(shù),進(jìn)一步優(yōu)化模型輸出,確保其在推理、編碼、對話等任務(wù)中的精準(zhǔn)性和可靠性。SFT使用約80億標(biāo)記的數(shù)據(jù)進(jìn)行微調(diào);DPO通過人類偏好數(shù)據(jù)優(yōu)化模型輸出;PTS通過識別和優(yōu)化關(guān)鍵標(biāo)記提升模型推理能力。此外,還進(jìn)行了幻覺緩解的處理,使模型在不確定時更傾向于拒絕回答。

        5. 基準(zhǔn)測試與性能:超越GPT-4

        Phi-4在多個基準(zhǔn)測試中表現(xiàn)出色,尤其在STEM問答任務(wù)中,甚至在GPQA和MATH上超越了GPT-4。在編碼任務(wù)中也優(yōu)于其他開放權(quán)重的模型。然而,文章也指出了其在事實(shí)知識幻覺和嚴(yán)格遵循詳細(xì)指令方面的局限性。

        6. 安全性與未來展望

        Phi-4的開發(fā)遵循微軟的負(fù)責(zé)任AI原則,并通過多種安全措施確保其安全性。盡管存在一些弱點(diǎn),Phi-4的卓越表現(xiàn)證明了小型語言模型的巨大潛力。未來,隨著技術(shù)的進(jìn)一步優(yōu)化,Phi-4有望在更多應(yīng)用場景中發(fā)揮重要作用。

        7. 第四屆全球自動駕駛峰會

        文章最后提及了將于1月14日在北京舉辦的第四屆全球自動駕駛峰會,內(nèi)容包括開幕式、多個主題論壇和技術(shù)研討會。


        聯(lián)系作者

        文章來源:智猩猩GenAI
        作者微信:
        作者簡介:智猩猩旗下公眾號之一,深入關(guān)注大模型與AI智能體,及時搜羅生成式AI技術(shù)產(chǎn)品。

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 好猛好深好爽好硬免费视频| 亚洲一线产区二线产区区| 国产精品亚洲综合网站| 日韩在线看片免费人成视频播放| 亚洲小说区图片区| 免费国产黄线在线观看| 亚洲 日韩 色 图网站| 德国女人一级毛片免费| 亚洲精品第一国产综合亚AV| 国产精品免费_区二区三区观看| 亚洲高清一区二区三区电影| 国产免费无遮挡精品视频| 直接进入免费看黄的网站| 国产精品亚洲综合一区| 两个人看的www高清免费视频| 无码欧精品亚洲日韩一区| 最近最新高清免费中文字幕| 亚洲人成影院午夜网站| 日韩电影免费在线| 春意影院午夜爽爽爽免费| 亚洲精品无码AV人在线播放| 91免费国产精品| 亚洲乱妇熟女爽到高潮的片| 亚洲高清无码专区视频| 无码国产精品一区二区免费3p| 亚洲无线一二三四区| 日本高清免费网站| 中文字幕无码免费久久| 亚洲男人天堂2018av| 亚洲国产精品成人久久蜜臀| 午夜老司机永久免费看片| 亚洲日韩精品无码AV海量| 一本久久a久久精品亚洲| 91av视频免费在线观看| 国产亚洲精品AAAA片APP| 亚洲精品国产精品乱码在线观看| 免费三级毛片电影片| 精品国产福利尤物免费| 亚洲永久在线观看| 精品亚洲成α人无码成α在线观看| 国产人成免费视频网站|