每周編輯精選|FewJoint 基準(zhǔn)數(shù)據(jù)集上線、科技部監(jiān)督司發(fā)布 AI 新規(guī)
AIGC動態(tài)歡迎閱讀
原標(biāo)題:每周編輯精選|FewJoint 基準(zhǔn)數(shù)據(jù)集上線、科技部監(jiān)督司發(fā)布 AI 新規(guī)
關(guān)鍵字:數(shù)據(jù),解讀,中文,分詞,模型
文章來源:HyperAI超神經(jīng)
內(nèi)容字?jǐn)?shù):6142字
內(nèi)容摘要:
小樣本學(xué)習(xí) (Few-shot Learning) 是指像人類一樣能夠通過很少的樣本來學(xué)習(xí)掌握新任務(wù)。這一領(lǐng)域已經(jīng)成為機(jī)器學(xué)習(xí)社區(qū)的熱點(diǎn),并被認(rèn)為是推動機(jī)器智能接近人類智能的關(guān)鍵方向之一。哈工大推出了FewJoint 基準(zhǔn)數(shù)據(jù)集,為 NLP 小樣本評測提供了公共的評價(jià)基準(zhǔn)。該數(shù)據(jù)集已在 hyper.ai 上線,hyper.ai 還有更多供中文大模型訓(xùn)練的 NLP 數(shù)據(jù)集可以下載哦~一起來看看吧!
1 月 29 日-2 月 2 日,hyper.ai 官網(wǎng)更新速覽:
* 優(yōu)質(zhì)公共數(shù)據(jù)集:10 條
* AI4S 論文案例:3 篇
* 熱門百科詞條:10 條
訪問官網(wǎng):hyper.ai公開數(shù)據(jù)集精選1.FewJoint 小樣本基準(zhǔn)數(shù)據(jù)集
FewJoint 基準(zhǔn)數(shù)據(jù)集是來自于訊飛 AIUI 開放平臺上真實(shí)用戶語料和專家構(gòu)造的語料(比例約為 3:7),包含 59 個(gè)真實(shí)領(lǐng)域,是目前包含領(lǐng)域最多的對話數(shù)據(jù)集之一。
直接使用:
https://hyper.ai/datasets/29239
2.100 PoisonMpts 中文大模型治理數(shù)據(jù)集
100 PoisonMpts 是業(yè)內(nèi)首個(gè)大語言模型治理開
原文鏈接:每周編輯精選|FewJoint 基準(zhǔn)數(shù)據(jù)集上線、科技部監(jiān)督司發(fā)布 AI 新規(guī)
聯(lián)系作者
文章來源:HyperAI超神經(jīng)
作者微信:HyperAI
作者簡介:解構(gòu)技術(shù)先進(jìn)性與普適性,解讀更前沿的 AIForScience 案例