AIGC動態歡迎閱讀
原標題:State of GPT:大神Andrej揭秘OpenAI大模型原理和訓練過程
關鍵字:模型,標記,提示,數據,基礎
文章來源:人工智能學家
內容字數:0字
內容摘要:
前言
OpenAI的創始人之一,大神Andrej Karpthy剛在微軟Build 2023開發者大會上做了專題演講:State of GPT(GPT的現狀)。
在這個樸實無華的題目之下,Andrej帶來的是一場超級精彩的分享。
他詳細介紹了如何從GPT基礎模型一直訓練出ChatGPT這樣的助手模型(assistant model)。作者不曾在其他公開視頻里看過類似的內容,這或許是OpenAI官方第一次詳細闡述其大模型內部原理和RLHF訓練細節。
難能可貴的是,Andrej不僅深入了細節, 還高屋建瓴的抽象了大模型實現中的諸多概念,牛人的洞察就是不一樣。
比如,Andrej非常形象的把當前LLM大語言模型比喻為人類思考模式的系統一(快系統),這是相對于反應慢但具有更長線推理的系統二(慢系統)而言。這只是演講里諸多閃光點的其中一個。
并且,Andrej真的有當導師的潛力,把非常技術的內容講得深入淺出,而又異常透徹。這個演講完全可以讓非專業人士也能理解,并且,認真看完演講后會有一種醍醐灌頂的感覺。
這場主題演講是如此精彩,以至于作者認為,所有關心LLM大語言模型的人都不容錯過。所以,在制作
原文鏈接:State of GPT:大神Andrej揭秘OpenAI大模型原理和訓練過程
聯系作者
文章來源:人工智能學家
作者微信:AItists
作者簡介:致力成為權威的人工智能科技媒體和前沿科技研究機構
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...