標簽:方法

一套參數,狂攬160個SOTA!廈大等重磅開源「視覺感知基礎模型」APE

新智元報道編輯:LRS 好困【新智元導讀】由廈門大學等機構提出的全新視覺感知基礎模型APE,只需一個模型外加一套參數,就能在160個測試集上取得當前SOTA或極...
閱讀原文

0微調搞定160個測試集!最強多模態分割一切大模型來了,架構參數全開源

Brady 投稿量子位 | 公眾號 QbitAI用多模態大模型來做語義分割,效果有多好?一張圖+文字輸入想分割的物體,大模型幾秒鐘就能識別并搞定!只需輸入想分割的對...
閱讀原文

彌合化學反應預訓練和條件分子生成之間的差距,北大&望石智慧提出「統一」模型

將 ScienceAI設為星標第一時間掌握新鮮的 AI for Science 資訊編輯 |紫羅化學反應是藥物設計和有機化學研究的基礎。研究界越來越需要一種能夠有效捕獲化學反...
閱讀原文

一張照片,TikTok姐就都能跳舞了

機器之心報道編輯:杜偉、小舟動畫視頻生成這幾天火了,這次 NUS、字節的新框架不僅效果自然流暢,還在視頻保真度方面比其他方法強了一大截。前幾日,阿里研...
閱讀原文

NeurIPS?2023|北京大學提出類別級6D物姿估計新范式,取得新SOTA

機器之心專欄作者:張繼耀類別級 6D 物體位姿估計是一個基礎且重要的問題,在機器人、虛擬現實和增強現實等領域應用廣泛。本文中,來自北京大學的研究者提出...
閱讀原文

全網都在模仿的「科目三」,梅西、鋼鐵俠、二次元姐馬上拿下

機器之心報道機器之心編輯部來自阿里的研究團隊提出了一種名為 Animate Anyone 的方法,只需一張人物照片,再配合骨骼動畫引導,就能生成動畫視頻。最近一段...
閱讀原文

SDXL Turbo、LCM相繼發布,AI畫圖進入實時生成時代:字打多快,出圖就有多快

機器之心報道機器之心編輯部使用一塊 A100,出圖的延遲只有 200 毫秒。本周二,Stability AI 推出了新一代圖像合成模型 Stable Diffusion XL Turbo,引發了一...
閱讀原文

UW+MIT最新研究:讓機器人在不斷變化的環境中學習新技能

大數據文摘授權轉載自機器人大講堂作者:李鑫為了在現實世界中最好地幫助人類,機器人應具備在動態且快速變化的環境中持續獲取實用新技能的能力。然而,當前...
閱讀原文

DeepMind最新研究:這個AI Agent,幾分鐘學會人類專家行為,登上Nature子刊

只需要幾分鐘,就可以成功模仿專家行為,并記住所有學過的知識,Google DeepMind 研發的 AI Agent,登上了 Nature 子刊。據介紹,在 3D 模擬中,該智能體能夠...
閱讀原文

北大最新多模態大模型開源:在混合數據集上訓練,無需修改直接用到圖像視頻任務

一個北大投稿 發送至 凹非寺量子位 | 公眾號 QbitAI訓完130億參數通用視覺語言大模型,只需3天!北大和中山大學團隊又出招了——在最新研究中,研究團隊提出了...
閱讀原文

研究沒思路的看過來,這是可信機器學習的1000個創新idea

機器之心專欄作者:UIUC 汪浩瀚I. 前言1. 先講一個故事大概在 4-5 年前的時候,我還是卡內基梅隆大學(CMU)的 phd。身處在名校光環的照耀下,再加上頂級導師...
閱讀原文

又一千億級大模型問世,全面開源!

夕小瑤科技說 分享11月27日,浪潮信息發布“源2.0”基礎大模型,并宣布全面開源。源2.0基礎大模型包括1026億、518億、21億等三種參數規模的模型,在編程、推理...
閱讀原文

僅靠合成數據無法實現 AGI

點擊上方藍字關注我們“ OpenAI最新的模型Q*引發了關注,它能解決數學問題并展現出卓越的推理能力。然而,是否應該依賴合成數據引發了科技社區的討論,有人認...
閱讀原文

單個A100生成3D圖像只需30秒,這是Adobe讓文本、圖像都動起來的新方法

機器之心報道編輯:杜偉、佳琪3D 生成是 AI 視覺領域的研究熱點之一。本文中,來自 Adobe 研究院和斯坦福大學等機構的研究者利用基于 transformer 的 3D 大型...
閱讀原文

谷歌:LLM找不到推理錯誤,但能糾正它

機器之心報道編輯:PandaLLM 找不到推理錯誤,但卻能糾正錯誤!今年,大型語言模型(LLM)成為 AI 領域關注的焦點。LLM 在各種自然語言處理(NLP)任務上取得...
閱讀原文
1151617181921