LLM將成歷史?開源bGPT或顛覆深度學(xué)習(xí)范式:直接模擬二進制,開啟模擬數(shù)字世界新紀(jì)元!
AIGC動態(tài)歡迎閱讀
原標(biāo)題:LLM將成歷史?開源bGPT或顛覆深度學(xué)習(xí)范式:直接模擬二進制,開啟模擬數(shù)字世界新紀(jì)元!
關(guān)鍵字:模型,字節(jié),數(shù)據(jù),圖像,序列
文章來源:新智元
內(nèi)容字?jǐn)?shù):8352字
內(nèi)容摘要:
新智元報道編輯:LRS
【新智元導(dǎo)讀】新模型bGPT是一個基于字節(jié)的Transformer模型,能夠?qū)⒉煌愋偷臄?shù)據(jù)納入同一框架之下,可以生成文本、圖像和音頻,還能模擬計算機行為,數(shù)字世界將迎來真正的大一統(tǒng)?微軟亞洲研究院推出的最新成果bGPT,這種基于字節(jié)的Transformer模型,為我們探索數(shù)字世界開辟了新的大門。
與傳統(tǒng)的基于詞表的語言模型不同,bGPT的獨特之處在于其對原始二進制數(shù)據(jù)的直接處理能力,不受特定格式或任務(wù)的限制,其目標(biāo)是全面模擬數(shù)字世界。論文:https://arxiv.org/abs/2402.19155
代碼:https://github.com/sanderwood/bgpt
模型:https://huggingface.co/sander-wood/bgpt
項目主頁:https://byte-gpt.github.io
研究團隊在其論文中展示了bGPT在建模上的巨大潛力,通過字節(jié)級處理,bGPT不僅能生成文本、圖像和音頻,還能模擬計算機行為——從格式轉(zhuǎn)換算法到CPU狀態(tài)的建模。將所有數(shù)據(jù)視為字節(jié)序列的做法,使bGPT能夠?qū)⒉煌愋偷臄?shù)據(jù)納入同一框架之下
原文鏈接:LLM將成歷史?開源bGPT或顛覆深度學(xué)習(xí)范式:直接模擬二進制,開啟模擬數(shù)字世界新紀(jì)元!
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點關(guān)注人工智能、機器人等前沿領(lǐng)域發(fā)展,關(guān)注人機融合、人工智能和機器人對人類社會與文明進化的影響,領(lǐng)航中國新智能時代。