鵝廠造10億虛擬人格專搞數(shù)據(jù)合成:讓7B模型數(shù)學(xué)成績(jī)打平GPT4,還能給弱智吧出題
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:鵝廠造10億虛擬人格專搞數(shù)據(jù)合成:讓7B模型數(shù)學(xué)成績(jī)打平GPT4,還能給弱智吧出題
關(guān)鍵字:人格,騰訊,模型,知乎,作者
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
克雷西 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI10億名“員工”生產(chǎn)數(shù)據(jù)合成,數(shù)量占到了世界人口的13%。
不過這些“員工”并不是真人,而是騰訊利用網(wǎng)絡(luò)數(shù)據(jù)制造出的虛擬人格。
用這些虛擬人格產(chǎn)生的合成數(shù)據(jù),能讓7B模型的數(shù)學(xué)成績(jī)暴增15分,打平了GPT-4 Turbo。
作者觀察到,只要在數(shù)據(jù)合成prompt中簡(jiǎn)單地加入角色信息,就可以讓生成該角色視角下獨(dú)特的合成數(shù)據(jù)。
于是經(jīng)過研究之后,這個(gè)包含10億個(gè)(準(zhǔn)確說是1,015,863,523個(gè))不同人格信息的Persona Hub應(yīng)運(yùn)而生。
除了前面提到的訓(xùn)練數(shù)據(jù),這些人格還能設(shè)計(jì)出弱智吧風(fēng)格的邏輯推理問題,也可以拿來做工具開發(fā),甚至打造出游戲NPC、進(jìn)行社會(huì)模擬。
有網(wǎng)友看了表示這實(shí)在是泰褲辣,自己以前也做過這樣的實(shí)驗(yàn),不過只制作了一萬種人格,現(xiàn)在這個(gè)項(xiàng)目真的很有趣。
還有人說,人物角色或?qū)⒊蔀楹铣蓴?shù)據(jù)的未來。
效果如何,接下來就一起來感受下。
數(shù)學(xué)成績(jī)暴增,還能給弱智吧提問Persona Hub中的這10億種不同的人格,可以用來生成多種類型的文本信息。
其中也包括生成訓(xùn)練數(shù)據(jù),比如用它們生成的數(shù)學(xué)文本訓(xùn)練大模型,可以讓7B模型擁
原文鏈接:鵝廠造10億虛擬人格專搞數(shù)據(jù)合成:讓7B模型數(shù)學(xué)成績(jī)打平GPT4,還能給弱智吧出題
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破