微軟推出iPhone能跑的ChatGPT級模型,網(wǎng)友:OpenAI得把GPT-3.5淘汰了
AIGC動態(tài)歡迎閱讀
原標(biāo)題:微軟推出iPhone能跑的ChatGPT級模型,網(wǎng)友:OpenAI得把GPT-3.5淘汰了
關(guān)鍵字:報告,模型,數(shù)據(jù),微軟,參數(shù)
文章來源:量子位
內(nèi)容字?jǐn)?shù):2643字
內(nèi)容摘要:
夢晨發(fā)自 凹非寺量子位 | 公眾號 QbitAILlama 3發(fā)布剛幾天,微軟就出手截胡了?
剛剛發(fā)布的Phi-3系列小模型技術(shù)報告,引起AI圈熱議。
其中僅3.8B參數(shù)的Phi-3-mini在多項基準(zhǔn)測試中超過了Llama 3 8B。
為了方便開源社區(qū)使用,還特意設(shè)計成了與Llama系列兼容的結(jié)構(gòu)。
微軟這次打出“手機就能直接跑的小模型”的旗號,4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的蘋果A16芯片上跑到每秒12 token。
這意味著,現(xiàn)在手機上能本地運行的最佳開源模型,已經(jīng)做到ChatGPT水平。
在技術(shù)報告中還玩了一把花活,讓phi-3-mini自己解釋為什么構(gòu)建小到手機能跑的模型很令人驚嘆。
除了mini杯之外,小杯中杯也一并發(fā)布:
Phi-3-small,7B參數(shù),為支持多語言換用了tiktoken分詞器,并額外增加10%多語種數(shù)據(jù)。
Phi-3-medium,14B參數(shù),在更多數(shù)據(jù)上訓(xùn)練,多數(shù)測試中已超越GPT-3.5和Mixtral 8x7b MoE。
(大杯他們目前不打算做)
作者陣容一看也不簡單,一眼掃過去MSRA和
原文鏈接:微軟推出iPhone能跑的ChatGPT級模型,網(wǎng)友:OpenAI得把GPT-3.5淘汰了
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破