標簽：圖像識別

顛覆行業定價：豆包視覺引領高清圖片處理新紀元，300張僅需一元！

豆包視覺理解模型已經接入豆包App和PC端產品～

閱讀原文

AIGC動態

5個月前

什么是狹義人工智能（Artificial Narrow Intelligence, ANI）：智能家居助理提升生活便利性與舒適度

狹義人工智能（Artificial Narrow Intelligence, ANI）也被稱為“弱人工智能”，是指被設計和訓練來執行特定任務或狹窄范圍內任務的人工智能系統。與擁有類似人...

閱讀原文

AI百科

5個月前

圖趣AI：多風格AI繪畫應用助你輕松創作獨特視覺藝術

圖趣AI是基于AI技術的繪畫軟件，能根據用戶的文字描述，創作出各種風格和主題的藝術畫作。用戶只需輸入創意靈感，AI能模擬出相應的視覺內容，包括風景、奇幻...

閱讀原文

AI工具

5個月前

解鎖多模態大模型的潛力：OCR VLM的性應用與未來展望

通過VLM范式解決OCR任務的工作~

閱讀原文

AIGC動態

5個月前

Qwen2vl-Flux：多模態圖像生成模型賦能創意無限，支持多樣化生成模式

Qwen2VL-Flux是多模態圖像生成模型，結合Qwen2VL的視覺語言理解和FLUX框架，基于文本提示和圖像參考生成高質量的圖像。模型支持多種生成模式，包括變體生成、...

閱讀原文

AI工具

5個月前

DINO-X：通用視覺大模型助力智能識別與分析的新時代

DINO-X是IDEA研究院推出的通用視覺大模型，具備開放世界對象檢測與理解能力。支持文本、視覺和定制提示，能識別圖像中的任何對象而無需用戶提示。基于超過1億...

閱讀原文

AI工具

6個月前

T-Rex Label：智能AI標注工具簡化復雜場景一鍵標注過程

T-Rex Label是AI自動標注工具，IDEA計算機視覺團隊基于T-Rex2模型創建。T-Rex Label支持一鍵標注和零樣本檢測，適用于農業、工業、生物醫藥等多個行業。T-Rex...

閱讀原文

AI工具

6個月前

LLaVA-o1：開源視覺語言模型助力智能理解與生成內容

LLaVA-o1是北京大學、清華大學、鵬城實驗室、阿里巴巴達摩院以及理海大學（Lehigh University）組成的研究團隊推出的開源視覺語言模型，基于Llama-3.2-Vision...

閱讀原文

AI工具

6個月前

一加 13：全面體驗，顛覆你的手機認知！

三年之期已到，一加重新定義一加。

閱讀原文

AIGC動態

6個月前

眾影AI：智能動畫創作：從劇本與音頻到視覺作品的自動生成

眾影AI是AI視頻生成工具，專注于輕動畫創作。基于自研的大模型自動分析劇本或音頻，能一鍵生成角色表演，平均1分鐘內完成視頻制作。適于多種創作場景，如夫妻...

閱讀原文

AI工具

6個月前

Vision Search Assistant：結合視覺語言模型與網絡代理搜索技術的開源框架研究

Vision Search Assistant（VSA）是結合視覺語言模型（VLMs）和網絡代理的框架，提升模型對未知視覺內容的理解能力。基于互聯網檢索，使VLMs處理和回答有關未...

閱讀原文

AI工具

6個月前

什么是深度學習（Deep Learning）

深度學習（Deep Learning）是機器學習的一個子集，本文介紹了什么是深度學習、深度學習的工作原理、深度學習與機器學習的區別、深度學習的開發框架以及深度學...

閱讀原文

AI百科

6個月前

什么是神經網絡（Neural Network）

神經網絡（Neural Network）作為人工智能中的一種計算模型，是受人腦啟發的一種機器學習類型。本文介紹了其定義、工作原理、類型、優勢、局限和其應用場景。

閱讀原文

AI百科

6個月前

AI初創公司融資數據庫

AI工具集推出的AI初創公司融資數據庫，通過該頁面你可以獲取人工智能行業最新的融資數據和資訊，為投資者、創業者、研究人員和AI愛好者提供關于AI創業公司融...

閱讀原文

AI快訊

6個月前

Screenshot to Code

Sscreenshot to Code是一個開源的項目，利用人工智能技術（GPT-4V 和 DALL·E 3）將用戶的屏幕截圖轉換為前端網頁代碼。項目的核心功能是自動化網頁設計的編碼...

閱讀原文

AI工具

6個月前

1 234 5