AI工具
谷歌推出的最強(qiáng)量子芯片,成功解決30年糾錯(cuò)難題
Willow 量子芯片是谷歌最新推出的具有105個(gè)物理量子比特,在量子糾錯(cuò)和計(jì)算效率上取得了顯著突破。Willow成功解決了量子計(jì)算領(lǐng)域近30年的糾錯(cuò)難題,實(shí)現(xiàn)了在...
微軟和馬里蘭大學(xué)共同開源的多模態(tài)大語言模型
Florence-VL是創(chuàng)新的多模態(tài)大型語言模型(MLLMs),是馬里蘭大學(xué)和微軟研究院共同推出的。Florence-VL用生成式視覺基礎(chǔ)模型Florence-2豐富視覺表示,能捕捉圖...
開源AI虛擬試衣工具,智能適配性別和體型自動(dòng)調(diào)整衣物
OOTDiffusion是開源的AI虛擬試衣工具,能智能適配不同性別和體型,自動(dòng)調(diào)整衣物尺寸和形狀,生成自然貼合的試穿效果。OOTDiffusion支持半身和全身試穿模式,...
AI顏色調(diào)色板,輸入關(guān)鍵詞或主題自動(dòng)生成顏色組合
Colorify Rocks是AI顏色調(diào)色板,能根據(jù)用戶輸入的關(guān)鍵詞或主題,迅速創(chuàng)建出和諧且吸引人的顏色組合。工具基于先進(jìn)的AI技術(shù),理解色彩理論、趨勢和美學(xué),為設(shè)...
AI食譜應(yīng)用,提供定制化的餐食建議
ChefBot是基于AI技術(shù)快速生成個(gè)性化食譜的應(yīng)用。用戶輸入簡單的食材和飲食偏好,ChefBot能在60秒內(nèi)提供定制化的烹飪方案。ChefBot滿足個(gè)性化需求、注重健康飲...
英偉達(dá)推出的視覺語言大模型
NVILA是NVIDIA推出的系列視覺語言模型,能平衡效率和準(zhǔn)確性。模型用“先擴(kuò)展后壓縮”策略,有效處理高分辨率圖像和長視頻。NVILA在訓(xùn)練和微調(diào)階段進(jìn)行系統(tǒng)優(yōu)化...
O1-CODER:智能編碼助手O1版提升開發(fā)效率與代碼質(zhì)量
O1-CODER是北京交通大學(xué)研究團(tuán)隊(duì)推出的開源項(xiàng)目,旨在復(fù)制OpenAI的O1模型,專注于編碼任務(wù)。O1-CODER結(jié)合強(qiáng)化學(xué)習(xí)(RL)和蒙特卡洛樹搜索(MCTS)技術(shù),提升...
南洋理工推出的VR端3D角色扮演AI系統(tǒng)
SOLAMI是創(chuàng)新的VR端3D角色扮演AI系統(tǒng),是南洋理工大學(xué)研究團(tuán)隊(duì)推出的。支持用戶用語音和肢體語言與虛擬角色進(jìn)行沉浸式互動(dòng),基于社交視覺-語言-行為模型,提...
clone-voice:多語言聲音克隆工具支持16種語言,實(shí)現(xiàn)個(gè)性化語音合成
Clone-voice是開源的聲音克隆工具,基于深度學(xué)習(xí)技術(shù)分析和模擬人類聲音,實(shí)現(xiàn)聲音的高質(zhì)量克隆。工具支持包括中文、英文、日語、韓語等在內(nèi)的16種語言,能將...
AI文本到圖像生成框架,提升單步擴(kuò)散模型的效率和性能
SNOOPI是創(chuàng)新的文本到圖像生成框架,基于增強(qiáng)單步擴(kuò)散模型的指導(dǎo)提升模型性能和控制力。SNOOPI包括PG-SB(適當(dāng)指導(dǎo) - SwiftBrush)和NASA(負(fù)向遠(yuǎn)離轉(zhuǎn)向注意...
音頻驅(qū)動(dòng)的生成肖像說話視頻框架,保持身份一致性和表現(xiàn)力
MEMO(Memory-Guided EMOtionaware diffusion)是Skywork AI、南洋理工大學(xué)和新加坡國立大學(xué)推出的音頻驅(qū)動(dòng)肖像動(dòng)畫框架,用在生成具有身份一致性和表現(xiàn)力的...
xAI為Grok AI助手推出的新圖像生成模型
Aurora是xAI為AI助手Grok新增的圖像生成模型。Aurora擅長創(chuàng)建逼真的圖像,擅長人物肖像。Aurora能生成包括公共和版權(quán)人物在內(nèi)的圖像(如米老鼠)。Aurora 的...
One Shot, One Talk:中科大與香港理工攜手打造創(chuàng)新動(dòng)態(tài)圖像生成技術(shù),實(shí)現(xiàn)實(shí)時(shí)創(chuàng)作與智能化設(shè)計(jì)
One Shot, One Talk是先進(jìn)的圖像生成技術(shù),能從單張圖片中生成具有個(gè)性化細(xì)節(jié)的全身動(dòng)態(tài)說話頭像,支持逼真的動(dòng)畫效果,包括自然的表情變化和生動(dòng)的身體動(dòng)作...
辦公小浣熊2.0:智能協(xié)作新體驗(yàn),商湯AI辦公助手賦能創(chuàng)作空間
辦公小浣熊2.0是商湯科技推出的AI辦公助手,集成數(shù)據(jù)分析、文檔解析、智能規(guī)劃和內(nèi)容創(chuàng)作等AI功能。工具基于一站式創(chuàng)作空間,讓用戶在平臺(tái)內(nèi)完成所有工作任務(wù)...
智譜 AI 免費(fèi)開放圖像理解大模型
GLM-4V-Flash是智譜AI推出的專注于圖像理解的AI模型,提供免費(fèi)的API接口,支持用戶上傳圖片URL或Base64編碼圖片獲取詳細(xì)的圖像描述。模型簡化圖像分析流程,...
粵公網(wǎng)安備 44011502001135號(hào)