學術(shù)前沿 | 進步對齊:讓AI跟上人類道德的腳步
AIGC動態(tài)歡迎閱讀
原標題:學術(shù)前沿 | 進步對齊:讓AI跟上人類道德的腳步
關(guān)鍵字:價值觀,人類,道德,模型,方法
文章來源:人工智能學家
內(nèi)容字數(shù):0字
內(nèi)容摘要:
來源:北京大學人工智能研究院
供稿:邱天異
排版:梁文凱玥AI引發(fā)的價值鎖定與進步對齊的定義隨著AI技術(shù)的發(fā)展,AI系統(tǒng)已經(jīng)開始在多個領(lǐng)域?qū)θ祟惖挠^念和價值觀產(chǎn)生影響。例如,大型語言模型(LLM)被用于個人助理、教育、內(nèi)容創(chuàng)作等,它們所體現(xiàn)的價值觀可能會在社會層面上傳遞給用戶。
價值鎖定(Value Lock-in)是指由于AI系統(tǒng)的影響,社會的道德價值觀長期停滯不前,停留在某個特定的歷史階段。例如,如果AI系統(tǒng)固化了21世紀初的價值觀,未來的社會可能無法超越這些價值觀,導致不道德實踐的延續(xù)和新道德概念的缺失。
為防止這種現(xiàn)象,本文提出進步對齊的概念。進步對齊旨在確保AI系統(tǒng)所體現(xiàn)的道德價值觀能夠持續(xù)改進,跟隨甚至引領(lǐng)人類道德的演變,就像人類價值觀在過去千年中經(jīng)歷的進步一樣。AI引發(fā)的價值鎖定是關(guān)鍵生存性風險價值鎖定可能導致社會喪失大量的道德潛力,延續(xù)當前的苦難和不公正。如果AI系統(tǒng)固化了當代的偏見和道德盲點,未來的人類社會可能會長期停滯在不道德的狀態(tài)中。這種風險與AI引發(fā)的滅絕風險一樣,都是關(guān)鍵的生存性風險,需要引起足夠的重視和研究。
目前,對價值鎖定的研究和關(guān)注相對較少,大多數(shù)對齊
原文鏈接:學術(shù)前沿 | 進步對齊:讓AI跟上人類道德的腳步
聯(lián)系作者
文章來源:人工智能學家
作者微信:
作者簡介: