30 個(gè)優(yōu)質(zhì) NLP 數(shù)據(jù)集和模型,一鍵使用 8 個(gè) demo,建議收藏!| 超全大模型資源匯總
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:30 個(gè)優(yōu)質(zhì) NLP 數(shù)據(jù)集和模型,一鍵使用 8 個(gè) demo,建議收藏!| 超全大模型資源匯總
關(guān)鍵字:模型,數(shù)據(jù),解讀,系列,中文
文章來源:大數(shù)據(jù)文摘
內(nèi)容字?jǐn)?shù):8335字
內(nèi)容摘要:
大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自HyperAI超神經(jīng)
近兩年來,大模型的熱度持續(xù)高漲,并且開始在更廣泛的領(lǐng)域進(jìn)行落地探索。隨著行業(yè)整體的快速發(fā)展,越來越多的開源大模型涌入市場(chǎng),進(jìn)一步推動(dòng)了上層應(yīng)用的拓展。
對(duì)于開發(fā)者而言,挑選優(yōu)質(zhì)大模型和數(shù)據(jù)集對(duì)其后續(xù)的研發(fā)、模型微調(diào)至關(guān)重要。為了方便大家選擇并下載適配開發(fā)需求的模型與數(shù)據(jù)集,HyperAI超神經(jīng)為大家匯總了大模型相關(guān)資源:
* 優(yōu)質(zhì)公共數(shù)據(jù)集:15 個(gè)
* 優(yōu)質(zhì)開源模型:15 個(gè)
*優(yōu)質(zhì)教程精選:8 個(gè)
更多大模型資源,見官網(wǎng):hyper.ai數(shù)據(jù)集精選1.seq-monkey 序列猴子開源數(shù)據(jù)集 1.0
序列猴子數(shù)據(jù)集是用于訓(xùn)練序列猴子模型的數(shù)據(jù)集,涉及領(lǐng)域包括:中文通用文本語料、古詩今譯語料、文本生成語料。
直接使用:https://my5353.com/seqmon
2.IEPile 大規(guī)模信息抽取語料庫
IEPile 是由浙江大學(xué)研發(fā)的大規(guī)模、高質(zhì)量的雙語(中英)信息抽取 (IE) 指令微調(diào)數(shù)據(jù)集,涵蓋了醫(yī)學(xué)、金融等多個(gè)領(lǐng)域。
直接使用:https://my5353.com/30064
3.LongAlign-10K 大模型長上下文對(duì)齊數(shù)
原文鏈接:30 個(gè)優(yōu)質(zhì) NLP 數(shù)據(jù)集和模型,一鍵使用 8 個(gè) demo,建議收藏!| 超全大模型資源匯總
聯(lián)系作者
文章來源:大數(shù)據(jù)文摘
作者微信:BigDataDigest
作者簡介:普及數(shù)據(jù)思維,傳播數(shù)據(jù)文化