標簽:策略
TPAMI | 安全強化學習方法、理論與應用綜述,慕工大、同濟、伯克利等深度解析
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
Google DeepMind推出DemoStart自主強化學習方法 利用少量示范樣本實現復雜操作任務
來源:機器人大講堂 一直以來,研究人員都在試圖開發出能夠在現實環境中安全、高效地執行復雜任務(如多指手操作)的機器人技能。傳統的機器人學習方法往往需...
一手訓練,多手應用:國防科大提出靈巧手抓取策略遷移新方案
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
最高3倍無損提速!數學規劃求解器效率升級,論文已中頂刊TPAMI | 中科大&華為諾亞
HEM++團隊 投稿量子位 | 公眾號 QbitAI最高3倍無損提速,用數學規劃求解器尋找最優解更快了! 近日,中科大王杰教授團隊(MIRA Lab)和華為諾亞方舟實驗室(H...
數據治理如何轉化為業務價值?平安產險的探索與實踐解析
△大會PPT獲取通道已開啟,關注數字化經緯公眾號,后臺回復 “PPT”,即可獲取 PPT 下載地址 嘉賓 | 洪廣智 平安產險客戶大數據團隊平臺組負責人 編輯 | 高玉嫻 ...
ECCV 2024 | 探索離散Token視覺生成中的自適應推理策略
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
o1突發曝光?谷歌8月論文已揭示原理,大模型光有軟件不存在護城河
明敏 發自 凹非寺量子位 | 公眾號 QbitAI發布不到1周,OpenAI最強模型o1的護城河已經沒有了。 有人發現,谷歌DeepMind一篇發表在8月的論文,揭示原理和o1的工...
o1 改變了 Scaling 范式?Self-Play 還值得 All In 嗎?
機器之心PRO · 會員通訊 Week 37---- 本周為您解讀 ③個值得細品的AI & Robotics業內要事 ---- 1. o1 改變了 Scaling 范式?Self-Play 還值得 All In 嗎?...
小模型越級挑戰14倍參數大模型,谷歌開啟Test-Time端新的Scaling Law
西風 發自 凹非寺量子位 | 公眾號 QbitAI不必增加模型參數,計算資源相同,小模型性能超過比它大14倍的模型! 谷歌DeepMind最新研究引發熱議,甚至有人表示這...
大模型走向物理世界,TeleAI 發布大模型驅動的具身智能綜述,覆蓋300篇文獻
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
機器人有了"迪士尼魔法"!AI教機器人像卡通人物一樣流暢逼真地跳舞
大數據文摘授權轉載自機器人大講堂在計算機動畫和機器人控制領域,如何讓虛擬角色或實體機器人按照預設軌跡精確執行動作,一直是一個充滿挑戰的難題。近日,...
Cross-Embodiment/數據集/VLA,具身智能今年的研究重點在哪?
機器之心PRO · 會員通訊 Week 35---- 本周為您解讀 ③個值得細品的AI & Robotics業內要事 ---- 1.Cross-Embodiment/數據集/VLA,具身智能今年的研究重點在...
DeepSeek開源數學大模型,高中、大學定理證明新SOTA
機器之心報道 機器之心編輯部DeepSeek-Prover-V1.5 通過結合強化學習和蒙特卡洛樹搜索,顯著提升了證明生成的效率和準確性。AI 技術與數學發現的進展,正前所...
香港理工:你精心設計的prompt,很容易被用戶套出來!
夕小瑤科技說 原創作者 | 謝年年自OpenAI的GPT系列及微軟Copilot Studio驚艷登場以來,第三方開發者群體迅速壯大,他們巧妙地設計個性化prompts,并與專業領...
首個支持普通話和方言混說的TTS大模型:河南話、上海話、粵語說得溜
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
粵公網安備 44011502001135號