AIGC動態歡迎閱讀
原標題:微軟發布Phi-3,性能超Llama-3,可手機端運行
關鍵字:模型,報告,微軟,數據,基準
文章來源:機器之心
內容字數:3522字
內容摘要:
機器之心報道
編輯:小舟、澤南數據已成為提升大模型能力的重點。Llama-3 剛發布沒多久,競爭對手就來了,而且是可以在手機上運行的小體量模型。
本周二,微軟發布了自研小尺寸模型 Phi-3。
新模型有三個版本,其中 Phi-3 mini 是一個擁有 38 億參數的語言模型,經過 3.3 萬億 token 的訓練,其整體性能在學術基準和內部測試上成績優異。
盡管 Phi-3 mini 被優化至可部署在手機上,但它的性能可以與 Mixtral 8x7B 和 GPT-3.5 等模型相媲美。微軟表示,創新主要在于用于訓練的數據集。與此同時,Phi-3 與 Llama-2 使用相同的架構,方便開源社區在其基礎上開發。此前,微軟的 Phi 系列模型曾經引發了人們的熱議,去年 6 月,微軟發布了《Textbooks Are All You Need》論文,用規模僅為 7B token 的「教科書質量」數據訓練 1.3B 參數的模型 phi-1,實現了良好的性能。
去年 9 月,微軟進一步探索這條道路,讓 1.3B 參數的 Transformer 架構語言模型 Phi-1.5 顯示出強大的編碼能力。
原文鏈接:微軟發布Phi-3,性能超Llama-3,可手機端運行
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...