GitHub 8k Star,一作實(shí)習(xí)生,字節(jié)這個(gè)大模型成果被蘋果選中了
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:GitHub 8k Star,一作實(shí)習(xí)生,字節(jié)這個(gè)大模型成果被蘋果選中了
關(guān)鍵字:字節(jié)跳動(dòng),模型,團(tuán)隊(duì),圖像,數(shù)據(jù)
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
機(jī)器之心發(fā)布
機(jī)器之心編輯部字節(jié)跳動(dòng)大模型團(tuán)隊(duì)成果 Depth Anything V2 現(xiàn)已被蘋果官方收入 Core ML 模型庫(kù)。本文介紹了 Depth Anything 系列成果的研發(fā)歷程、技術(shù)挑戰(zhàn)與解決方法,分享了團(tuán)隊(duì)對(duì)于 Scaling Laws 在單一視覺任務(wù)方面的思考。值得一提的是,Depth Anything V1 與 V2 兩個(gè)版本論文一作是團(tuán)隊(duì)實(shí)習(xí)生。近日,字節(jié)跳動(dòng)大模型團(tuán)隊(duì)開發(fā)的成果 Depth Anything V2 ,入選蘋果公司 CoreML模型庫(kù),目前已呈現(xiàn)在開發(fā)者相關(guān)頁面中。Depth Anything 是一種單目深度估計(jì)模型,V1 版本發(fā)布于 2024 年初,V2 版本發(fā)布于 2024 年 6 月,包含 25M 到 1.3B 參數(shù)的不同大小模型,可應(yīng)用于視頻特效、自動(dòng)駕駛、3D 建模、增強(qiáng)現(xiàn)實(shí)、安全監(jiān)控以及空間計(jì)算等領(lǐng)域。相比上一代版本,V2 版在細(xì)節(jié)處理上更精細(xì),魯棒性更強(qiáng),并且對(duì)比基于 Diffusion 的 SOTA 模型,速度上有顯著提升。
目前Github上該系列成果總計(jì)收獲 8.7k Star。其中,Depth Anything V2 發(fā)布不
原文鏈接:GitHub 8k Star,一作實(shí)習(xí)生,字節(jié)這個(gè)大模型成果被蘋果選中了
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡(jiǎn)介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)