數據科學開源社區,幫助數據人才在交流中享受學習,在實踐中快速成長。眾多數據科學從業者及愛好者在這里分享開源代碼、復現實戰案例、參與數據競賽、記錄成長歷程。
Level-Navi Agent是一個無需訓練即可使用的框架,利用大語言模型進行深度查詢理解和精準搜索。
Dolphin R1是一個用于訓練推理模型的數據集,包含80萬條樣本。
自監督觸覺表示,用于基于視覺的觸覺傳感。
數據驅動的框架,增強大型語言模型的工作流編排能力
開源的先進語言模型后訓練框架
大規模多語言偏好混合數據集
多語言預訓練數據集
大規模多模態推理與指令調優平臺
用于強化學習驗證的數學問題數據集
高質量的數據集、工具和概念,用于大型語言模型的微調。
高質量數據集,用于OLMo2訓練的第二階段。
百度旗下AI算力、學習和實訓平臺,飛槳AI Studio星河社區官網入口網址
Appen提供數據改進人工智能的解決方案,幫助客戶推動創新,加速AI發展,并保持競爭優勢。通過數據提供、數據清洗、數據標注和數據收集等功能,Appen為AI提供訓練和學習所需的信息,提高AI的準確性、可信度和用戶體驗。,Figure Eight官網入口網址
BOSS AI是一款企業私有化AI工作平臺,幫助企業定制專屬AI團隊,降低人工成本,提高經營效益。它提供私有化AI系統、AI客服/顧問、行業AI專家平臺和AI虛擬數字人等功能,適用于教育、電商、廣告、自媒體等行業。,BOSSAI – 企業員工AI官網入口網址
Pile是一個825 GiB的多樣化、開源的語言建模數據集,由22個較小的高質量數據集組合而成,可用于訓練大規模的語言模型,提升模型的泛化能力和跨領域知識。,The Pile官網入口網址
Appen提供高質量數據,助力AI模型的開發和應用。我們的服務涵蓋數據注釋、數據收集、大型語言模型等多個方面,適用于語言模型訓練、圖像識別、搜索引擎優化、機器翻譯等應用場景。,CrowdFlower官網入口網址
IBM的Project CodeNet是一個大型數據集,旨在教授AI編碼。它包含了超過55種不同編程語言的約14百萬個代碼樣本和約5億行代碼,可以用于AI編碼教育、代碼翻譯和轉換、代碼分析和優化等應用場景。,Project CodeNet by IBM官網入口網址
鏑數據官網入口網址,鏑數聚,是行業數據報告聚合網站,首選平臺dydata
Datalearner網站是一個集AI科研、技術分享、數據推薦和學術交流于一體的綜合性平臺。,datalearner官網入口網址
飛槳AI Studio官網入口網址,百度飛槳人工智能學習實訓社區,飛槳AI Studio是一個基于云端的深度學習平臺,可在無需安裝配置硬件環境的前提下,便于開發人員進行人工智能相關的應用開發與管理。
BOSSAI – 企業員工AI官網入口網址,AI專家等角色訓練、實現AI員工
Objaverse-3D物體數據集官網入口網址,海量注釋3D物體數據集
百度飛槳AI Studio官網入口網址,集開放數據、開源算法、免費算力三位一體,為開發者提供高效學習和開發環境、高價值高獎金競賽項目,支撐高校老師輕松實現AI教學,并助力開發者學習交流,加速落地AI業務場景
這是一個數據集市場網站,提供各種準確、完整的數據集,數據集包括商業數據集、房地產數據集、電商數據集等。
這個網站是關于Algo的,是一款對話式人工智能聊天機器人,提供有用和有意義的見解,而不是冗長的聊天。與ChatGPT相比,它更少地冗余,更加注重用戶的需求。Algo不使用用戶數據進行...
百度飛漿二次元小姐姐版AI繪畫——AI Studio是基于百度深度學習平臺飛槳的人工智能學習與實訓社區,提供在線編程環境、免費GPU算力、海量開源算法和開放數據,幫助開發者快速創建和...
鏑數聚是中國領先的數據綜合服務平臺,聚合3000+數據機構,提供7大服務類型,匯集海量權威數據,
AI Studio是基于百度深度學習...
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙