AIGC動態歡迎閱讀
原標題:圖像AI那么耗算力,問題出在 RGB 格式上?
關鍵字:圖像,模型,神經網絡,語言,格式
文章來源:JioNLP
內容字數:0字
內容摘要:
Hello,大家好,我是 JioNLP。
最近一直在想一個問題。為什么我們的圖像 AI 模型那么耗算力?比如,現在多模態圖文理解 AI 模型本地化部署一個節點,動不動就需要十幾個 G 的顯存資源。
這個原因當然很多,這篇文章我只說一個點。
那就是 AI 模型的圖像輸入是 RGB 。
RGB 圖像的壓縮一般像一張 1920 x 1080 的圖像,如果要輸入 AI 模型做處理的話,必須首先轉換成 RGB 三顏色格式,形成一個 1920 x 1080 x 3 字節大小的輸入,這個大小大概是 6M 內存空間的大小。
但是除了 RGB 這種格式之外,還有 YUV 這種圖像存儲格式,它利用了人眼睛對亮度敏感,對顏色不敏感這個特性,實現了對圖像的壓縮。存儲一張1920 x 1080 的 YUV 格式的圖像只需要大概 3M 內存空間。空間減半了。
當然,3M 還是太大了,有很多的壓縮算法,它可以把圖像做極致的壓縮,一張 1920 x 1080 的圖像,按照jpeg 的壓縮方法,可以壓縮到幾百 KB 的大小。比原始 RGB 高效多了,但是從眼視覺角度看,兩者幾乎看不出差別。(下圖中,png 存儲的就
聯系作者
文章來源:JioNLP
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...