原標(biāo)題:谷歌發(fā)布全新AI圖像生成工具Whisk:以圖生圖,無需提示詞
文章來源:小夏聊AIGC
內(nèi)容字?jǐn)?shù):2501字
谷歌推出創(chuàng)新生成式人工智能工具Whisk
近日,谷歌實(shí)驗(yàn)室在美國正式發(fā)布了其最新的生成式人工智能工具——Whisk。這一工具的推出標(biāo)志著圖像生成領(lǐng)域的一次重要突破,它不再依賴傳統(tǒng)的文本提示,而是以圖像作為核心輸入,提供了一種更為直觀和富有創(chuàng)意的創(chuàng)作體驗(yàn)。
獨(dú)特的圖像輸入方式
Whisk允許用戶直接上傳圖片,或者在工具內(nèi)部生成圖像,并靈活指定主題、場(chǎng)景和風(fēng)格等關(guān)鍵元素。這些元素可以在Whisk系統(tǒng)中進(jìn)行混合和匹配,從而創(chuàng)造出獨(dú)一無二的圖像作品。用戶甚至可以根據(jù)自己的需求添加文本提示,對(duì)生成的圖像進(jìn)行微調(diào),進(jìn)一步增強(qiáng)創(chuàng)作的個(gè)性化。
強(qiáng)大的后臺(tái)支持
在Whisk的背后,谷歌的語言模型(據(jù)推測(cè)可能是最新的Gemini2.0Flash)發(fā)揮著至關(guān)重要的作用。該模型能夠自動(dòng)生成輸入圖像的詳細(xì)描述,這些描述隨后被輸入到谷歌最新的圖像生成模型Imagen3中。Imagen3具備捕捉和保留圖像主體特征的能力,確保每一幅作品都獨(dú)具特色,而非簡(jiǎn)單的復(fù)制。
用戶體驗(yàn)與反饋
許多早期測(cè)試者,包括藝術(shù)家和創(chuàng)意專業(yè)人士,對(duì)Whisk的使用體驗(yàn)給予了高度評(píng)價(jià)。他們認(rèn)為Whisk更像是一種全新的創(chuàng)意工具,鼓勵(lì)用戶進(jìn)行快速的視覺頭腦風(fēng)暴,迅速生成和篩選多個(gè)選項(xiàng),以找到最符合需求的圖像作品。
實(shí)際測(cè)試與結(jié)果
我們?cè)贏ITOP100平臺(tái)上進(jìn)行了幾次測(cè)試,上傳了幾張圖片,并查看融合的效果,結(jié)果令人滿意。比如,當(dāng)我們將一只綠色的恐龍毛絨玩具作為樣式圖,并選擇一位胖乎乎的穿著唐朝服飾的小女孩作為主題圖進(jìn)行融合時(shí),生成的圖像保持了主題圖的核心元素,同時(shí)融入了毛絨玩具的材質(zhì)特征,整體效果賞心悅目。如果用戶對(duì)生成的圖像不滿意,還可以通過編輯提示詞進(jìn)行微調(diào)。
使用體驗(yàn)與未來展望
盡管Whisk的用戶體驗(yàn)令人愉悅,但在高流量時(shí)段,生成新圖像的過程中可能會(huì)出現(xiàn)幾秒鐘的等待。這一情況可能是由于大量用戶同時(shí)涌入體驗(yàn)這一新工具所造成的延遲。不過,這并沒有影響用戶對(duì)Whisk的熱情和期待。
目前,Whisk僅對(duì)美國用戶開放,用戶可以通過labs.google/whisk免費(fèi)嘗試并反饋。雖然其他國家的用戶暫時(shí)無法直接訪問這一工具,但他們對(duì)Whisk未來的發(fā)展充滿期待。
總結(jié)
作為谷歌實(shí)驗(yàn)室的一部分,Whisk是公司在AI領(lǐng)域進(jìn)行創(chuàng)新的重要試驗(yàn)項(xiàng)目之一。與Gemini、Imagen以及最新的視頻模型Veo2等項(xiàng)目相似,Whisk雖然仍處于實(shí)驗(yàn)階段,但其展現(xiàn)出的潛力和創(chuàng)新性令人期待。可以預(yù)見,在不久的將來,Whisk將會(huì)在圖像生成領(lǐng)域占據(jù)重要地位,成為一顆璀璨的新星。
功能亮點(diǎn)
Whisk的核心功能包括:
- 以圖生圖:用戶只需上傳圖片,無需費(fèi)心構(gòu)思文字提示,工具即可自動(dòng)理解并生成符合預(yù)期的圖像。
- 風(fēng)格混合:智能算法能夠精準(zhǔn)捕捉并混合不同圖片的風(fēng)格特征,無論是抽象藝術(shù)風(fēng)格還是具體場(chǎng)景元素,都能巧妙融入新的圖像中。
- 快速迭代:用戶可以通過編輯文本提示或上傳新圖片,輕松實(shí)現(xiàn)圖像的迭代修改,優(yōu)化生成結(jié)果。
聯(lián)系作者
文章來源:小夏聊AIGC
作者微信:
作者簡(jiǎn)介:專注于人工智能生成內(nèi)容的前沿信息與技術(shù)分享。我們提供AI生成藝術(shù)、文本、音樂、視頻等領(lǐng)域的最新動(dòng)態(tài)與應(yīng)用案例。每日新聞速遞、技術(shù)解讀、行業(yè)分析、專家觀點(diǎn)和創(chuàng)意展示。期待與您一起探索AI的無限潛力。歡迎關(guān)注并分享您的AI作品或?qū)氋F意見。