標簽:多模態交互

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

DreamVVT

DreamVVT 是字節跳動和清華大學(深圳)聯合推出的視頻虛擬試穿(Video Virtual Try-On, VVT)技術,基于擴散 Transformer(DiTs)框架,通過兩階段方法實現...
閱讀原文

dots.vlm1

dots.vlm1 是小紅書 hi lab 開源的首個多模態大模型。基于一個從零訓練的 12 億參數視覺編碼器 NaViT 和 DeepSeek V3 大語言模型(LLM),具備強大的視覺感知...
閱讀原文

Claude Opus 4.1

Claude Opus 4.1 是 Anthropic 公司最新推出的大型語言模型,是 Claude Opus 4 的升級版本。模型在多個方面進行優化和提升,包括推理質量、指令遵循能力及整...
閱讀原文

Intern-S1

Intern-S1是上海人工智能實驗室在世界人工智能大會上正式開源發布的科學多模態大模型,融合了語言和多模態性能,具備高水平的均衡發展能力,并富集多學科專業...
閱讀原文

Pic Answer

Pic Answer 是 Tech Consolidated Inc. 推出的智能教育應用,通過拍照快速解答學術問題。用戶只需拍攝題目或問題的照片,應用會借助先進的人工智能技術,迅速...
閱讀原文

TRAE Agent

TRAE Agent 是字節跳動開源的基于大語言模型(LLM)的智能助手,專為軟件工程任務設計。能像資深工程師一樣自主完成復雜任務,例如復現問題、制定修復方案、...
閱讀原文

DeepAgent

DeepAgent是Abacus.AI推出的全能通用Agent,專為企業和專業人士設計,支持基于自然語言輸入快速生成風險投資(VC)融資演示文稿,DeepAgent能進行跨學科研究...
閱讀原文

星流Agent

星流Agent是專為中文用戶設計的一站式創意設計Agent。星流Agent延續Lovart的全棧式智能設計能力,全面適配中文語義、東方美學和本地場景。用戶只需輸入一句話...
閱讀原文

OAgents

OAgents 是OPPO PersonalAI Lab推出的開源基礎Agent框架。框架基于標準化的評估協議和模塊化設計,推動Agent框架的研究。OAgents基于系統實證研究,分析關鍵A...
閱讀原文

鴻蒙智能體框架(HMAF)是什么?一文看懂

鴻蒙智能體框架(Harmony Agent Framework,簡稱 HMAF)是華為公司為其自主研發的鴻蒙操作系統(HarmonyOS)打造的一款核心人工智能框架 。在于構建一個具備...
閱讀原文

AI智能體(AI Agent)是什么?一文看懂

AI智能體(AI Agent),也被稱為人工智能體,是人工智能領域中的一個核心概念,指的是能感知其環境、進行自主決策并采取行動以實現特定目標的智能實體或計算...
閱讀原文

Kimi-Dev

Kimi-Dev是Moonshot AI推出的開源代碼模型,專為軟件工程任務設計。模型擁有 72B 參數量,編程水平比最新的DeepSeek-R1還強,和閉源模型比較也表現優異。在 S...
閱讀原文

Gemini 2.5 Pro (I/O 版)

Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升級版多模態AI模型,具體版本號為 Gemini 2.5 Pro Preview 05-06。模型在編程能力上取得重大突破...
閱讀原文

Embodied Reasoner

Embodied Reasoner是浙江大學、中國科學院軟件研究所、阿里巴巴集團等機構推出的新型的具身交互推理模型,基于視覺搜索、推理和行動協同完成復雜任務。模型基...
閱讀原文

訊飛星辰MaaS

訊飛星辰MaaS是科大訊飛推出的AI大模型定制微調平臺,創建你的專屬定制大模型。訊飛星辰MaaS匯集20多個行業內知名的優質模型,如星火大模型、Llama3、DeepSee...
閱讀原文