標簽:分辨率
WPS接入DeepSeek,秒變辦公神器!
WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!
這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...
擴散模型失寵?端側非自回歸圖像生成基礎模型Meissonic登場,超越SDXL!
新智元報道編輯:LRST 【新智元導讀】剛剛,一款專為消費級顯卡設計的全新非自回歸掩碼圖像建模的文本到圖像生成模型——Meissonic發布,標志著圖像生成即將進...
ECCV 2024收錄!曠視提出無需訓練的更高分辨率圖像生成框架HiDiffusion | 一作、高級研究員張慎主講預告
在圖像生成領域,高分辨率圖像的生成一直是一個具有挑戰性的工作。Stable Diffusion等強大的預訓練擴散模型目前可以生成1024x1024像素的高質量圖像。但生成更...
長短大小樣樣精通!原始分辨率、超長視頻輸入:更靈活的全開源多模態架構Oryx
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
字節豆包全新圖像Tokenizer:生成圖像最低只需32個token,最高提速410倍
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
超越CVPR 2024方法,DynRefer在區域級多模態識別任務上,多項SOTA
機器之心發布 機器之心編輯部為了實現高精度的區域級多模態理解,本文提出了一種動態分辨率方案來模擬人類視覺認知系統。本文作者來自于中國科學院大學LAMP實...
把整個地球裝進神經網絡,北航團隊推出全球遙感圖像生成模型
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI北航的研究團隊,用擴散模型“復刻”了一個地球? 在全球的任意位置,模型都能生成多種分辨率的遙感圖像,創造出豐富...
4倍內存效率,生成和超分雙SOTA!清華&智譜AI發布最新Inf-DiT模型
直播預告 | 5月28日10點,「智猩猩AI新青年講座」第236講正式開講,密歇根大學安娜堡分校在讀博士生張揮杰將直播講解《利用多級框架和多解碼器架構提高擴散模...
今日arXiv最熱CV大模型論文:國產開源視覺大模型InternVL 1.5發布,趕超GPT-4V水準
夕小瑤科技說 原創作者 | 墨墨2023年9月,OpenAI發布了多模態大模型GPT-4V,開啟了多模態研究熱潮。短短8個月時間內,閉源模型如Gemini系列, Qwen-VL-Max,開...
DiT架構大一統:一個框架集成圖像、視頻、音頻和3D生成,可編輯、能試玩
機器之心報道 編輯:杜偉、大盤雞基于 Diffusion Transformer(DiT)又迎來一大力作「Flag-DiT」,這次要將圖像、視頻、音頻和 3D「一網打盡」。今年 2 月初...
超分辨率專題 | 3 種方法、4 個教程、10 個數據集,一文 Get 核心知識點
作者:十九 編輯:李寶珠,三羊 超分辨率能夠克服或補償由于圖像采集系統、采集環境本身限制而導致的成像模糊、圖像質量低下等問題,提升圖像分辨率,為特征...
在線教程|二次元的福音!一鍵部署APISR,動漫畫質飛躍升級
作者:十九 編輯:李寶珠,三羊 APISR 不僅可以恢復并增強低質量、低分辨率的動漫圖像和視頻源,還能處理各種圖像退化問題(如模糊、噪聲、壓縮偽影等),提...
上海AI Lab開源首個可替代GPT-4V的多模態大模型
夕小瑤科技說 原創作者 | 任同學與開源和閉源模型相比,InternVL 1.5 在 OCR、多模態、數學和多輪對話等 18 個基準測試中的 8 個中取得了最先進的結果。 上海...
Open-Sora 全面開源升級:支持單鏡頭16s視頻生成和720p分辨率
Open-Sora 在開源社區悄悄更新了,現在支持單鏡頭長達16秒的視頻生成,分辨率最高可達720p,并且可以處理任何寬高比的文本到圖像、文本到視頻、圖像到視頻、...
Open-Sora全面開源升級:支持16s視頻生成和720p分辨率
機器之心發布 機器之心編輯部Open-Sora 在開源社區悄悄更新了,現在單鏡頭支持長達16秒的視頻生成,分辨率最高可達720p,并且可以處理任何寬高比的文本到圖像...
Open-Sora 全面開源升級:支持 16s 視頻生成和 720p 分辨率
最近,AI 科技評論發現,國產視頻生成模型 Open-Sora 在開源社區悄悄更新了! 現在支持長達16秒的視頻生成,分辨率最高可達720p,并且可以處理任何寬高比的文...