干貨滿滿!大神Karpathy兩小時(shí)AI大課文字版第一彈,全新工作流自動(dòng)把視頻轉(zhuǎn)成文章

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:干貨滿滿!大神Karpathy兩小時(shí)AI大課文字版第一彈,全新工作流自動(dòng)把視頻轉(zhuǎn)成文章
關(guān)鍵字:分詞,字符串,字符,視頻,詞匯表
文章來源:新智元
內(nèi)容字?jǐn)?shù):8506字
內(nèi)容摘要:
新智元報(bào)道編輯:桃子
【新智元導(dǎo)讀】「從頭開始構(gòu)建GPT分詞器」文字版來了。前段時(shí)間,AI大神Karpathy上線的AI大課,已經(jīng)收獲了全網(wǎng)15萬次播放量。
當(dāng)時(shí)還有網(wǎng)友表示,這2小時(shí)課程的含金量,相當(dāng)于大學(xué)4年。
就在這幾天,Karpathy又萌生了一個(gè)新的想法:
那便是,將2小時(shí)13分鐘的「從頭開始構(gòu)建GPT分詞器」的視頻,轉(zhuǎn)換為一本書的章節(jié)(或者博客文章)形式,專門討論「分詞」。具體步驟如下:
– 為視頻添加字幕或解說文字。
– 將視頻切割成若干帶有配套圖片和文字的段落。
– 利用大語言模型的提示工程技術(shù),逐段進(jìn)行翻譯。
– 將結(jié)果輸出為網(wǎng)頁形式,其中包含指向原始視頻各部分的鏈接。
更廣泛地說,這樣的工作流程可以應(yīng)用于任何視頻輸入,自動(dòng)生成各種教程的「配套指南」,使其格式更加便于閱讀、瀏覽和搜索。
這聽起來是可行的,但也頗具挑戰(zhàn)。
他在GitHub項(xiàng)目minbpe下,寫了一個(gè)例子來闡述自己的想象。
地址:https://github.com/karpathy/minbpe/blob/master/lecture.md
Karpathy表示,這是自己手動(dòng)完成的任務(wù),即觀看視頻并將
原文鏈接:干貨滿滿!大神Karpathy兩小時(shí)AI大課文字版第一彈,全新工作流自動(dòng)把視頻轉(zhuǎn)成文章
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺(tái),致力于推動(dòng)中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國新智能時(shí)代。

粵公網(wǎng)安備 44011502001135號(hào)