北大王立威:理論視角看大模型,為什么AI既聰明又愚蠢 | 智者訪談
AIGC動態(tài)歡迎閱讀
原標題:北大王立威:理論視角看大模型,為什么AI既聰明又愚蠢 | 智者訪談
關鍵字:模型,機器,問題,數(shù)據(jù),數(shù)學
文章來源:機器之心
內(nèi)容字數(shù):0字
內(nèi)容摘要:
人工智能的卓越發(fā)展
源于對技術與產(chǎn)業(yè)本質(zhì)的洞察
機器之心全新視頻欄目「智者訪談」
邀請領域?qū)<遥聪?AI 核心技術與行業(yè)趨勢
為從業(yè)者量身打造
深化行業(yè)認知,激發(fā)創(chuàng)新思考
與智者同行,共創(chuàng)AI 未來以英偉達為代表,近期美股科技巨頭市值蒸發(fā)超過萬億,引發(fā)了市場對 AI 泡沫破裂的擔憂,特別引發(fā)焦慮的是大模型領域,甚至有人將其與互聯(lián)網(wǎng)泡沫相提并論。
我們驚嘆于當前 AI 的成果,但若深究其過程則往往感到失落。在生成式 AI 盛行的當下,這種矛盾心理尤為突出。
大語言模型(LLM)的通用能力是一個意外的收獲,為了改進機器翻譯序列處理而提出的 Transformer,性能是如此強大,已經(jīng)成為語音、文本、圖像領域事實上的基礎架構,并且展現(xiàn)出一統(tǒng)模態(tài)的巨大潛力。從 GPT-3 到 GPT-3.5(即 ChatGPT),模型能力似乎有了質(zhì)的飛躍,但二者在訓練方式上并沒有本質(zhì)區(qū)別,這是否意味著更多的數(shù)據(jù)、更大的模型是通往智能的正確路徑,更好地「預測下一個詞」最終能讓我們創(chuàng)造出會思考的機器?
今天,大模型已經(jīng)開始走向產(chǎn)品階段,人工智能正滲透到千行百業(yè),我們在享受智能化所帶來的便利的同時,也面臨一系列現(xiàn)
原文鏈接:北大王立威:理論視角看大模型,為什么AI既聰明又愚蠢 | 智者訪談
聯(lián)系作者
文章來源:機器之心
作者微信:
作者簡介: