全模態(tài)對(duì)齊框架align-anything來(lái)了:實(shí)現(xiàn)跨模態(tài)指令跟隨
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:全模態(tài)對(duì)齊框架align-anything來(lái)了:實(shí)現(xiàn)跨模態(tài)指令跟隨
關(guān)鍵字:模型,數(shù)據(jù),框架,反饋,算法
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過(guò)去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報(bào)道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本開(kāi)源項(xiàng)目由北京大學(xué)對(duì)齊小組開(kāi)發(fā)并進(jìn)行長(zhǎng)期維護(hù),團(tuán)隊(duì)專注于人工智能系統(tǒng)的安全交互與價(jià)值對(duì)齊,指導(dǎo)老師為北京大學(xué)人工智能研究院楊耀東助理教授。核心成員包括吉嘉銘、周嘉懿、邱天異、陳博遠(yuǎn)、王愷樂(lè)、洪東海、樓翰濤、王旭堯、陳文琦、張釗為、汪明志、鐘伊凡等。
團(tuán)隊(duì)就強(qiáng)化學(xué)習(xí)方法及大模型的后訓(xùn)練對(duì)齊技術(shù)開(kāi)展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列成果。近期,團(tuán)隊(duì)針對(duì) OpenAI o1 技術(shù)的深入分析累計(jì)點(diǎn)擊量已超過(guò) 15 萬(wàn)。
如何全模態(tài)大模型與人類的意圖相對(duì)齊,已成為一個(gè)極具前瞻性且至關(guān)重
原文鏈接:全模態(tài)對(duì)齊框架align-anything來(lái)了:實(shí)現(xiàn)跨模態(tài)指令跟隨
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:
作者簡(jiǎn)介: