標簽:問題
解決多模態大模型幻覺問題的秘密武器:“啄木鳥”免重訓方法!哪里出問題啄哪里!
夕小瑤科技說 原創作者 | 付奶茶、王二狗最近多模態大模型的研究取得了巨大的進展。然而,這些模型在生成時存在著文本與圖像不一致的問題,這個問題就是一直...
吳恩達加入圖靈三巨頭混戰,炮轟Sam Altman:AI監管「不會管不如不管」,LeCun轉贊
新智元報道編輯:潤 alan【新智元導讀】針對「AI末日論」引發的大佬們關于AI監管的口水戰,吳恩達下場力挺LeCun:「不合格的監管不如不要監管」!Hinton,Ben...
GPT-4V連小學生都不如?最新基準測試錯誤率竟高達90%:紅綠燈認錯、勾股定理也不會
新智元報道編輯:LRS 好困【新智元導讀】馬里蘭大學發布首個專為VLM設計的基準測試HallusionBench,全面測試GPT-4V視覺錯誤和語言幻覺。GPT-4被吹的神乎其神...
MetaAI提出全新驗證鏈框架,大模型通過“三省吾身”緩解幻覺現象
大數據文摘授權轉載自將門創投作者:seven_曾子曰:“吾日三省吾身”–出自《論語·學而》時至今日,生成幻覺(hallucination)仍然是大模型研究界中一個令人非常...
多模態大模型幻覺降低30%!中科大等提出首個幻覺修正架構「Woodpecker」啄木鳥
新智元報道編輯:好困【新智元導讀】最近,來自中科大等機構的研究人員提出了首個多模態修正架構「啄木鳥」,可有效解決MLLM輸出幻覺的問題。視覺幻覺是常見...
國外Java工程師力證:GPT-4不能解決邏輯謎題,但確實具備推理能力
新智元報道編輯:Lumina【新智元導讀】IMG Arena的高級軟件工程師 Johan LAJILI認為在LLM能夠理解概念、通過圖靈測試時,我們就該承認它具有推理能力了。GPT-...
北京大學王選所推出 ALCUNA ,大模型新知識理解能力評測再添一榜!
夕小瑤科技說 原創作者 | 付奶茶、ZenMoore你是否好奇大型語言模型(LLMs)在面對未知新知識時會有怎樣的表現呢?或者你想知道我們如何讓這些大模型了解新知...
用50多年時間,探索最令人困惑的復雜性理論知識極限
選自quantamagazine機器之心編譯編輯:Panda證明問題難以解決究竟有多難?元復雜性(meta-complexity)理論研究者數十年來一直探究這個問題。近期的一系列研...
多模態LLM幻覺問題降低30%!業內首個“啄木鳥”免重訓方法誕生|中科大
豐色 發自 凹非寺量子位 | 公眾號 QbitAI還在用指令微調解決多模態大模型的“幻覺”問題嗎?比如下圖中模型將橙色柯基錯認為“紅狗”,還指出周圍還有幾條?,F在...
ICCV 2023丨邁向真實世界的多幀超分
本文介紹的是我們在ICCV2023的工作 Towards Real-world Burst Image Super-Resolution: Benchmark and Method 。arxiv鏈接:https://arxiv.org/abs/2309.0480...
別再吹 GPT-4V 了!連北京烤鴨都不認識,你敢信??
夕小瑤科技說 原創作者 | 智商掉了一地、ZenMooreGPT-4 被吹的神乎其神,作為具備視覺能力的 GPT-4 版本——GPT-4V,也被大眾寄于了厚望。但如果告訴你,GPT-4V...
北大數學課,啟用AI助教
衡宇 發自 凹非寺量子位 | 公眾號 QbitAI這門北大數學課,學生和老師竟然都在用AI“摸魚”?!不僅如此,老師還是主動推薦你用,“方便跟上授課進度”。原來,這...
代碼生成:基于 AI 大模型的挑戰與前景
作者 | Ben Linders 譯者 | 馬可薇 策劃 | 丁曉昀 使用 AI 通用模型來完成代碼生成這類非常具體的任務可能會帶來問題。人工智能生成的代碼就像是陌生人的代碼...
陳怡然力薦《關于我博士畢業的這件小事》,Waymo研究員2年半心路分享火了
編者按:搞科研、讀博士,這從來都不是一條輕松的路。今年9月,UCLA博士生葉小飛終于通過答辯,正式成為自動駕駛領域的一位“刀客特”。兩年半讀博期間,葉小飛...
中國科協發布2023重大科學問題、工程技術難題和產業技術問題
來源:科技導報今日科協10月22日,在第二十五屆中國科協年會主論壇上,中國科協隆重發布2023重大科學問題、工程技術難題和產業技術問題。人工智能、新能源、...
粵公網安備 44011502001135號