AIGC動態歡迎閱讀
原標題:UCLA華人提出全新自我對弈機制!LLM自己訓自己,效果碾壓GPT-4專家指導
關鍵字:模型,數據,研究人員,對手,自我
文章來源:新智元
內容字數:5347字
內容摘要:
新智元報道編輯:潤
【新智元導讀】來自UCLA的華人團隊提出一種全新的LLM自我對弈系統,能夠讓LLM自我合成數據,自我微調提升性能,甚至超過了用GPT-4作為專家模型指導的效果。合成數據已經成為了大語言模型進化之路上最重要的一塊基石了。
在去年底,有網友扒出前OpenAI首席科學家Ilya曾經在很多場合表示過,LLM的發展不存在數據瓶頸,合成數據可以解決大部分的問題。
英偉達高級科學家Jim Fan在看了最近的一批論文后也認為,使用合成數據,再加上傳統用于游戲和圖像生成的技術思路,可以讓LLM完成大幅度的自我進化。
而正式提出這個方法的論文,是由來自UCLA的華人團隊。
論文地址:https://arxiv.org/abs/2401.01335v1
他們通過自我對弈機制(SPIN)生成合成數據,再通過自我微調的方法,不使用新的數據集,讓性能較弱的LLM在Open LLM Leaderboard Benchmark上將平均分從58.14提升至63.16。
研究人員提出了一種名為SPIN的自我微調的方法,通過自我對弈的方式——LLM與其前一輪迭代版本進行對抗,從而逐步提升語言模型的性能
原文鏈接:UCLA華人提出全新自我對弈機制!LLM自己訓自己,效果碾壓GPT-4專家指導
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...