Karpathy離職OpenAI,首發(fā)2小時(shí)AI大課!從頭開(kāi)始構(gòu)建GPT分詞器
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:Karpathy離職OpenAI,首發(fā)2小時(shí)AI大課!從頭開(kāi)始構(gòu)建GPT分詞器
關(guān)鍵字:分詞,模型,英語(yǔ),字符串,算法
文章來(lái)源:新智元
內(nèi)容字?jǐn)?shù):4859字
內(nèi)容摘要:
新智元報(bào)道編輯:桃子
【新智元導(dǎo)讀】果不其然,繼放出BPE的GitHub代碼后,Karpathy終于上線(xiàn)了「從頭構(gòu)建GPT分詞器」的課程,引來(lái)網(wǎng)友關(guān)注。離職OpenAI的技術(shù)大神karpathy,終于上線(xiàn)了2小時(shí)的AI大課。
——「讓我們構(gòu)建GPT Tokenizer(分詞器)」。
其實(shí),早在新課推出兩天前,karpathy在更新的GitHub項(xiàng)目中,就預(yù)告了這件事。
這個(gè)項(xiàng)目是minbpe——專(zhuān)為L(zhǎng)LM分詞中常用的BPE(字節(jié)對(duì)編碼)算法創(chuàng)建最少、干凈以及教育性的代碼。
目前,GitHub已經(jīng)狂攬6.1k星,442個(gè)fork。
項(xiàng)目地址:https://github.com/karpathy/minbpe
網(wǎng)友:2小時(shí)課程含金量,相當(dāng)于大學(xué)4年不得不說(shuō),karpathy新課發(fā)布依然吸引了業(yè)內(nèi)一學(xué)者的關(guān)注。
他總是可以把相當(dāng)復(fù)雜的LLM概念,用非常好理解的方式講出來(lái)。
有網(wǎng)友直接取消了晚上的約會(huì),去上課了。
與karpathy的約會(huì)之夜。
AI機(jī)器學(xué)習(xí)研究員Sebastian Raschka表示,「我喜歡從頭開(kāi)始的實(shí)現(xiàn),我真的很期待看到這個(gè)視頻」!
英偉達(dá)高級(jí)科學(xué)家Jim F
原文鏈接:Karpathy離職OpenAI,首發(fā)2小時(shí)AI大課!從頭開(kāi)始構(gòu)建GPT分詞器
聯(lián)系作者
文章來(lái)源:新智元
作者微信:AI_era
作者簡(jiǎn)介:智能+中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類(lèi)社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國(guó)新智能時(shí)代。