AI工具

LSP(Language Self-Play)

LSP(Language Self-Play)是Meta提出的一種強化學習方法,解決大型語言模型對大量高質量訓練數據的依賴問題。LSP的核心思想是利用自我博弈的方式,讓同一模...
閱讀原文

TrafficVLM

TrafficVLM是高德導航推出的基于大模型技術的交通視覺語言模型,通過交通孿生還原能力,將海量實時交通數據轉化為動態孿生視頻流,構建出與現實世界同步的“數...
閱讀原文

DeepSeek-R1-Safe

DeepSeek-R1-Safe 是浙江大學網絡空間安全學院和華為合作推出的基于DeepSeek衍生的安全大模型。模型基于華為昇騰芯片和 MindSpeedLLM 框架,通過構建安全語料...
閱讀原文

Kronos

Kronos 是首個面向金融市場的 K 線圖基礎模型,由清華大學與微軟亞洲研究院聯合開源。通過分析股票、加密貨幣等資產的 K 線數據,包括開盤價、最高價、最低價...
閱讀原文

OneSearch

OneSearch 是快手推出的電商搜索端到端生成式框架,優化傳統電商搜索的級聯式架構,提升搜索精準度和用戶體驗。三大創新點包括:關鍵詞增強層次量化編碼(KHQ...
閱讀原文

Codexia

Codexia是強大的跨平臺AI編碼桌面應用程序,支持為OpenAI Codex CLI提供圖形界面和工具集,增強開發體驗。
閱讀原文

Lego-Edit

Lego-Edit 是小米開源的基于指令的圖像編輯框架,通過多模態大語言模型(MLLM)的泛化能力,實現對圖像的靈活編輯。采用模型級工具包,包含多種高效訓練的模...
閱讀原文

混元3D Studio

混元3D Studio(Hunyuan3D Studio)是騰訊推出的一站式3D創作平臺,基于AI技術加速3D內容創作全流程。平臺支持從概念設計到動畫制作的各個環節,包括高效的概...
閱讀原文

CapCut AI Suite

CapCut AI Suite 是字節推出的 AI 驅動的創意編輯工具,能將任何主題快速轉化為完整視頻,提供 AI 圖像、視頻、音樂生成等功能,支持自動剪輯、轉錄、翻譯等...
閱讀原文

FastMTP

FastMTP 是騰訊自研的大語言模型(LLM)推理加速技術,通過優化多標記預測(MTP)技術,用共享權重的單 MTP 頭替代傳統多獨立模塊,結合語言感知詞匯壓縮和自...
閱讀原文

Xiaomi-MiMo-Audio

Xiaomi-MiMo-Audio是小米開源的首個原生端到端語音大模型。模型基于創新預訓練架構和上億小時訓練數據,首次在語音領域實現了基于 In-Context Learning(ICL...
閱讀原文

Lucy Edit Dev

Lucy Edit Dev 是 Decart AI 團隊開源的基于文本指令的視頻編輯模型。能根據簡單的文本提示對視頻進行多種編輯操作,如更改服裝、替換角色、插入對象和轉換場...
閱讀原文

Wan2.2-Animate

Wan2.2-Animate是阿里通義團隊推出的動作生成模型,模型同時支持動作模仿和角色扮演兩種模式,能基于表演者的視頻,精確復制面部表情和動作,生成高度逼真的...
閱讀原文

Ling-V2

Ling-V2 是螞蟻百靈團隊推出的基于 MoE 架構的大型語言模型家族,首個版本 Ling-mini-2.0 擁有 160 億總參數,每個輸入標記僅激活 14 億參數。
閱讀原文

Viking 長期記憶

Viking長期記憶是火山引擎推出的端到端長期記憶標準產品,基于自研VikingDB向量數據庫,具備百億級數據毫秒級檢索能力,能精準抽取事件與用戶畫像,支持語義...
閱讀原文
1910111213278