標簽:圖像識別

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

Gemini 2.5 Pro (I/O 版)

Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升級版多模態AI模型,具體版本號為 Gemini 2.5 Pro Preview 05-06。模型在編程能力上取得重大突破...
閱讀原文

天翼AI開放平臺

天翼AI開放平臺是中國電信正式上線的AI技術服務平臺。平臺以中國電信自研的星辰大模型為技術底座,提供從AI技術能力展示到產品體驗、接入使用的全流程服務。
閱讀原文

ImagePulse

ImagePulse (圖律脈動)是魔搭社區推出的開源項目,為下一代圖像理解和生成模型提供數據集支持,通過原子化模型的能力并構建原子能力數據集。項目包含多個原...
閱讀原文

Translate Image

Translate Image 是免費的在線 AI 圖片翻譯工具,專為需要快速翻譯圖片中文字的用戶設計。支持多種圖片格式(如 JPG、PNG、JPEG 等),可處理產品圖片、電商...
閱讀原文

Piece it Together

Piece it Together (PiT)是Bria AI等機構推出的創新圖像生成框架,專門用在從部分視覺組件生成完整的概念圖像?;谔囟I域的先驗知識,將用戶提供的碎片...
閱讀原文

Qwen2.5-VL-32B

Qwen2.5-VL-32B是阿里巴巴開源的多模態模型,參數規模為32B。模型在Qwen2.5-VL系列的基礎上,基于強化學習優化,具備更符合人類偏好的回答風格、顯著提升的數...
閱讀原文

Reve Image

Reve Image 是 Reve 推出的全新 AI 圖像生成模型。專注于提升美學表現、精確的提示遵循能力以及出色的排版設計,能生成高質量的視覺作品。模型在生成圖像時展...
閱讀原文

ReCamMaster

ReCamMaster 是浙江大學、快手科技等聯合推出的視頻重渲染框架,能根據新的相機軌跡重新生成視頻內容。通過預訓練模型和幀維度條件機制,結合多相機同步數據...
閱讀原文

I2V3D

I2V3D是香港城市大學和微軟 GenAI創新的圖像到視頻生成框架,支持將靜態圖像轉換為動態視頻,基于3D幾何引導實現精確的動畫控制。I2V3D結合傳統計算機圖形學...
閱讀原文

Aya Vision

Aya Vision 是 Cohere 推出的多模態、多語言的視覺模型,提升全球范圍內的多語言和多模態通信能力。支持 23 種語言,能執行圖像描述生成、視覺問答、文本翻譯...
閱讀原文

PixVerse V4

PixVerse V4 是愛詩科技推出的最新 AI 視頻生成工具,基于文本或圖片輸入快速生成高質量的 AI 視頻,生成速度最快可達 5 秒。新版本在語義理解、物理規律表現...
閱讀原文

Microsoft Research Forum

Microsoft Research Forum 是微軟研究院推出的系列虛擬論壇活動,匯聚全球科技與研究領域的專家學者,共同探討人工智能及相關前沿技術的最新進展、創新理念與...
閱讀原文

HumanDiT

HumanDiT 是浙江大學和字節跳動聯合提出的姿態引導的高保真人體視頻生成框架?;跀U散變換器(Diffusion Transformer,DiT),能在大規模數據集上訓練,生成...
閱讀原文

LLaVA-Rad

LLaVA-Rad是微軟研究院推出的小型多模態模型,專注于臨床放射學報告生成。是LLaVA-Med項目的分支,特別是胸部X光(CXR)成像?;贚LaVA-Med的基礎架構和訓練...
閱讀原文

Lumina-Image 2.0

Lumina-Image 2.0 是開源的高效統一圖像生成模型,參數量為26億,基于擴散模型和Transformer架構。在圖像生成質量、復雜提示理解和資源效率方面表現出色,在...
閱讀原文
1235