圖像AI那么耗算力,問(wèn)題出在 RGB 格式上?

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:圖像AI那么耗算力,問(wèn)題出在 RGB 格式上?
關(guān)鍵字:圖像,模型,神經(jīng)網(wǎng)絡(luò),語(yǔ)言,格式
文章來(lái)源:JioNLP
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
Hello,大家好,我是 JioNLP。
最近一直在想一個(gè)問(wèn)題。為什么我們的圖像 AI 模型那么耗算力?比如,現(xiàn)在多模態(tài)圖文理解 AI 模型本地化部署一個(gè)節(jié)點(diǎn),動(dòng)不動(dòng)就需要十幾個(gè) G 的顯存資源。
這個(gè)原因當(dāng)然很多,這篇文章我只說(shuō)一個(gè)點(diǎn)。
那就是 AI 模型的圖像輸入是 RGB 。
RGB 圖像的壓縮一般像一張 1920 x 1080 的圖像,如果要輸入 AI 模型做處理的話,必須首先轉(zhuǎn)換成 RGB 三顏色格式,形成一個(gè) 1920 x 1080 x 3 字節(jié)大小的輸入,這個(gè)大小大概是 6M 內(nèi)存空間的大小。
但是除了 RGB 這種格式之外,還有 YUV 這種圖像存儲(chǔ)格式,它利用了人眼睛對(duì)亮度敏感,對(duì)顏色不敏感這個(gè)特性,實(shí)現(xiàn)了對(duì)圖像的壓縮。存儲(chǔ)一張1920 x 1080 的 YUV 格式的圖像只需要大概 3M 內(nèi)存空間。空間減半了。
當(dāng)然,3M 還是太大了,有很多的壓縮算法,它可以把圖像做極致的壓縮,一張 1920 x 1080 的圖像,按照jpeg 的壓縮方法,可以壓縮到幾百 KB 的大小。比原始 RGB 高效多了,但是從眼視覺角度看,兩者幾乎看不出差別。(下圖中,png 存儲(chǔ)的就
原文鏈接:圖像AI那么耗算力,問(wèn)題出在 RGB 格式上?
聯(lián)系作者
文章來(lái)源:JioNLP
作者微信:
作者簡(jiǎn)介:

粵公網(wǎng)安備 44011502001135號(hào)