AI工具

NEO

NEO是商湯科技與南洋理工大學合作研發的全新多模態模型架構,作為首個原生多模態架構(Native VLM),NEO通過底層架構的深度創新,打破了傳統多模態模型的局...
閱讀原文

Mistral 3

Mistral 3 是 Mistral AI 推出的新一代開源 AI 模型系列,包括小型的 Ministral 3(3B、8B、14B 參數)和大型的 Mistral Large 3(675B 總參數,41B 激活參數...
閱讀原文

AnuNeko

AnuNeko是米哈游創始人蔡浩宇的新公司Anuttacon推出的AI聊天工具。工具用獨特的“貓娘”形象為特色,通過高度個性化和情緒化的對話體驗,為用戶帶來與眾不同的...
閱讀原文

PixVerse V5.5

PixVerse V5.5 是愛詩科技推出的視頻生成大模型。模型通過自研的多模態理解和生成技術,支持音畫同步生成,簡化從構思到成片的復雜工作流程,提高創作效率。
閱讀原文

Alpamayo-R1

Alpamayo-R1(AR1)是英偉達推出的視覺-語言-動作(VLA)模型,通過因果推理提升自動駕駛的決策能力和泛化性。模型的核心創新包括:構建因果鏈(CoC)數據集...
閱讀原文

可靈O1

可靈O1(可靈視頻 O1 模型)是可靈AI推出的全球首個統一多模態視頻生成模型。模型通過創新的多模態視覺語言(MVL)架構,實現視頻生成、編輯與理解的無縫融合。
閱讀原文

Gen-4.5

Gen-4.5 是RunWay推出的視頻生成模型,模型在視頻生成的運動質量、視覺逼真度和提示詞遵循度等方面樹立新的行業標準。Gen-4.5 能生成電影級、極為逼真的畫面...
閱讀原文

Temvideo.ai

Temvideo.ai 是面向商業用戶的 AI 視頻制作工具,通過智能算法幫助用戶快速生成高質量的營銷視頻。用戶只需提供想法和素材,AI 代理即可自動完成視頻制作,包...
閱讀原文

Vidi2

Vidi2是字節跳動推出的專注于視頻理解和創作的多模態大語言模型。在多模態時間檢索(TR)方面達到了行業領先水平,在時空定位(STG)和視頻問答(Video QA)...
閱讀原文

傳聲港

傳聲港是杭州龍投文化傳媒有限公司旗下的AI驅動綜合媒體服務平臺,為企業提供一站式品牌傳播與推廣服務。平臺整合了網絡媒體、自媒體博主、網紅達人等資源,...
閱讀原文

Ito

Ito是開源的智能語音聽寫工具,通過其獨特的“VibeTyping”技術,將用戶的口語意圖轉換為精美文本。支持在郵件客戶端、文檔、聊天平臺、瀏覽器和代碼編輯器等各...
閱讀原文

Talo

Talo 是先進的AI實時語音翻譯工具,專為打破語言障礙設計,廣泛應用于視頻會議場景。支持超過60種語言的即時翻譯,能無縫集成到Google Meet、Microsoft Teams...
閱讀原文

GELab-Zero

GELab-Zero 是 StepFun 開發的開源 GUI Agent 模型,專注于移動設備的自動化交互和任務執行。具備本地可部署能力,支持在消費級硬件上運行 4B 模型,確保低延...
閱讀原文

Spokenly

Spokenly 是為 Mac 和 iPhone 設計的智能語音聽寫應用,支持超過100種語言,具備自動語言檢測功能,適合多語言用戶和國際團隊。提供“本地優先”模式,所有語音...
閱讀原文

DeepSeek-Math-V2

DeepSeek-Math-V2 是 DeepSeek 團隊推出的開源數學推理模型,能實現自我驗證的數學推理。模型關注答案正確性,注重推理過程的嚴謹性。
閱讀原文
1234290