原標題:微軟Phi-4封神,14B小模型數學擊敗GPT-4o!合成數據占比40%,36頁技術報告出爐
文章來源:新智元
內容字數:9233字
微軟推出新一代小模型Phi-4
微軟最近正式發布了其下一代小模型Phi-4,具有140億個參數,創新性地使用40%的合成數據進行訓練。該模型在數學推理和STEM領域的性能上顯著超越了GPT-4o和Gemini Pro 1.5,為人工智能模型的發展帶來了新的突破。
1. Phi-4的核心技術
Phi-4的成功主要得益于三大核心技術:使用合成數據進行預訓練和中訓練、高質量有機數據的篩選與過濾,以及先進的后訓練方法。合成數據的高比例和高質量使得Phi-4在推理任務上表現出色,甚至與更大模型的表現相當。
2. 優越的數學性能
在2024 ACM數學競賽中,Phi-4取得了91.8%的準確率,顯示出其在數學推理方面的卓越能力。研究表明,Phi-4在許多基準測試中,其表現超越了其教師模型GPT-4o,并在STEM問答任務中展現出強大的實力。
3. 合成數據的優勢
合成數據為Phi-4訓練的主要組成部分,通過多種技術生成,避免了傳統數據集中的一些弱點。相比于有機數據,合成數據在結構化和支持漸進式學習方面具有優勢,使得模型學習效率更高。
4. 后訓練技術的創新
后訓練階段的關鍵技術——關鍵token搜索(PTS),能夠識別出影響模型正確性的關鍵token,從而優化模型的輸出。結合拒絕采樣和直接偏好優化(DPO),Phi-4在減少幻覺現象上也取得了顯著進展。
5. 展望未來
盡管Phi-4在多個基準測試中表現優秀,但研究團隊仍發現該模型在遵循指令方面存在不足。未來,團隊計劃通過有針對性的合成數據進一步提升Phi系列模型的指令跟隨性能,期待后續發布的模型帶來更多驚喜。
聯系作者
文章來源:新智元
作者微信:
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。