昆侖萬(wàn)維攜手南洋理工大學(xué)搶發(fā)Q*算法:百倍提升7B模型推理能力
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:昆侖萬(wàn)維攜手南洋理工大學(xué)搶發(fā)Q*算法:百倍提升7B模型推理能力
關(guān)鍵字:模型,準(zhǔn)確率,算法,能力,數(shù)據(jù)
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過(guò)去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報(bào)道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com自 OpenAI 的 Q* 項(xiàng)目曝光后,引發(fā)業(yè)內(nèi)眾多討論。據(jù)現(xiàn)有信息匯總,Q* 項(xiàng)目被視作 OpenAI 在探索人工通用智能(Artificial General Intelligence, AGI)道路上的一次重大嘗試,有望在包括數(shù)學(xué)問(wèn)題解決能力、自主學(xué)習(xí)和自我改進(jìn)等多個(gè)層面對(duì)人工智能技術(shù)帶來(lái)革新性突破。英偉達(dá)科學(xué)家 Jim Fan、圖靈獎(jiǎng)得主 Yann LeCun 等參與討論 OpenAI 的 Q* 實(shí)現(xiàn)方式Meta 科學(xué)家田淵棟則認(rèn)為 Q* 是 Q-learning 和 A* 的結(jié)合,且天然地適合推理任務(wù),尤其在數(shù)學(xué)推理方面
不過(guò)迄今為止 OpenAI 沒(méi)有公開(kāi)關(guān)于 Q* 算法的具體細(xì)節(jié),其效果究竟如何我們并不得而知。
昆侖萬(wàn)維自 Q* 項(xiàng)目曝光以來(lái),一
原文鏈接:昆侖萬(wàn)維攜手南洋理工大學(xué)搶發(fā)Q*算法:百倍提升7B模型推理能力
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:almosthuman2014
作者簡(jiǎn)介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)