探索NeurIPS 2024:突破性數(shù)據(jù)集助力云層去除、化學(xué)光譜分析與自動駕駛革新
內(nèi)含 9 個數(shù)據(jù)集下載鏈接
原標(biāo)題:NeurIPS 2024 數(shù)據(jù)集匯總|覆蓋云層去除/化學(xué)光譜/歌聲音頻/自動駕駛/昆蟲標(biāo)本······
文章來源:HyperAI超神經(jīng)
內(nèi)容字?jǐn)?shù):5113字
NeurIPS 2024 數(shù)據(jù)集匯總
根據(jù)李姝的報道,HyperAI超神經(jīng)從NeurIPS 2024會議中整理并分享了9個高質(zhì)量的開源數(shù)據(jù)集,涵蓋云層去除、化學(xué)光譜、歌聲音頻、自動駕駛、昆蟲標(biāo)本等多個領(lǐng)域。這些數(shù)據(jù)集為研究者提供了豐富的資源,幫助推動相關(guān)領(lǐng)域的研究進展。
1. AllClear 公共云層去除數(shù)據(jù)集
發(fā)布機構(gòu):康奈爾大學(xué)、哥倫比亞大學(xué)
預(yù)估大小:22.42 GB
下載地址:點擊這里
AllClear是目前最大的公共云層去除數(shù)據(jù)集,包含23,742個全球分布的興趣區(qū)域(ROIs),共計400萬張圖像,旨在解決云層對下游應(yīng)用的影響。
2. Muharaf 手寫文數(shù)據(jù)集
發(fā)布機構(gòu):北卡羅來納州立大學(xué)等
預(yù)估大小:9.83 GB
下載地址:點擊這里
該數(shù)據(jù)集專注于手寫文識別,包含超過1.6k張歷史手寫頁面圖像,促進手寫文本識別技術(shù)的發(fā)展。
3. 化學(xué)多模光譜數(shù)據(jù)集
發(fā)布機構(gòu):IBM Research等
預(yù)估大小:9.7 GB
下載地址:點擊這里
該數(shù)據(jù)集匯集79萬種分子的多種光譜數(shù)據(jù),旨在通過自動化結(jié)構(gòu)解析簡化分子發(fā)現(xiàn)流程。
4. GTSinger 歌聲音頻數(shù)據(jù)集
發(fā)布機構(gòu):浙江大學(xué)
預(yù)估大小:28.94 GB
下載地址:點擊這里
包含80.59小時的歌聲錄音,涵蓋多種語言,為音色和風(fēng)格研究提供了豐富的資源。
5. DrivingDojo 自動駕駛數(shù)據(jù)集
發(fā)布機構(gòu):中國科學(xué)院等
下載地址:點擊這里
該數(shù)據(jù)集包含約18k個視頻片段,旨在提升復(fù)雜駕駛環(huán)境中的預(yù)測和控制能力。
6. 多模態(tài)昆蟲生物多樣性數(shù)據(jù)集
發(fā)布機構(gòu):生物多樣性基因組學(xué)中心等
預(yù)估大小:37.71 GB
下載地址:點擊這里
包含超過500萬昆蟲標(biāo)本的詳細(xì)信息,旨在監(jiān)測全球昆蟲生物多樣性。
7. OpenSatMap 高分辨率衛(wèi)星數(shù)據(jù)集
發(fā)布機構(gòu):中國科學(xué)院等
預(yù)估大小:57.7 GB
下載地址:點擊這里
該數(shù)據(jù)集專為大規(guī)模地圖構(gòu)建而設(shè)計,包含3,787張高分辨率衛(wèi)星圖像。
8. 自然物種聲音數(shù)據(jù)集
發(fā)布機構(gòu):馬薩諸塞大學(xué)等
預(yù)估大小:131.26 GB
下載地址:點擊這里
收錄230,000個音頻文件,涵蓋鳥類、哺乳動物等多個物種的聲音。
9. MINT-1T 文本圖像對多模態(tài)數(shù)據(jù)集
發(fā)布機構(gòu):華盛頓大學(xué)等
下載地址:點擊這里
該數(shù)據(jù)集規(guī)模龐大,包含1萬億個文本標(biāo)記和34億張圖像,為科學(xué)文檔研究提供了豐富的數(shù)據(jù)資源。
以上是HyperAI超神經(jīng)為大家匯總的NeurIPS 2024數(shù)據(jù)集,若有意向收錄其他資源,歡迎留言或投稿。欲了解更多信息,請訪問HyperAI超神經(jīng)官網(wǎng)。
聯(lián)系作者
文章來源:HyperAI超神經(jīng)
作者微信:
作者簡介:解構(gòu)技術(shù)先進性與普適性,報道更前沿的 AIforScience 案例