標簽:問題

都說 RAG “爛大街”了,但為何深度應用寥寥無幾?| 直播預告

大語言模型技術迅猛發展的腳步,正引領著信息檢索技術進入一個新的紀元。在這一領域中,RAG 技術將傳統信息檢索技術與大語言模型技術相結合,為知識理解、知...
閱讀原文

思路打開!騰訊造了10億個角色,驅動數據合成!7B模型效果打爆了

夕小瑤科技說 原創作者 | 謝年年世界由形形色色的角色構成,每個角色都擁有獨特的知識、經驗、興趣、個性和職業,他們共同制造了豐富多元的知識與文化。 所謂...
閱讀原文

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%

新智元報道編輯:編輯部 【新智元導讀】6月,IEEE刊登了一篇對ChatGPT代碼生成任務進行系統評估的論文,數據集就是程序員們最愛的LeetCode題庫。研究揭示了LL...
閱讀原文

聊聊大模型推理中的分離式推理

原文:https://zhuanlan.zhihu.com/p/706469785 一開始本文叫做“聊聊大模型推理中的存儲優化”的,但是發布之后感覺還是要叫分離式推理更好,雖然我本來是想寫...
閱讀原文

谷歌DeepMind全新ToT基準:全面評估LLM時間推理能力

新智元報道編輯:alan 【新智元導讀】近日,來自谷歌DeepMind的研究人員,推出了專門用于評估大語言模型時間推理能力的基準測試——Test of Time(ToT),從兩...
閱讀原文

騰訊 AI 助手元寶大升級!除了能搜公眾號,跟其他國產 AI 搜索有什么不同?

少數問題 需要 額外思考5 月 30 日,騰訊的 AI 助手應用「騰訊元寶」上線。因為可以引用公眾號文章,內容生態質量較高,AI 搜索賽道雖然卷生卷死,姍姍來遲的...
閱讀原文

AI助攻「菜鳥數學家」解決忙碌海貍問題,陶哲軒轉發分享

機器之心報道 編輯:大盤雞、佳琪????在 AI 的幫助下,越來越多的數學問題得到了解決。AI在數學領域的應用對大家來說并不陌生了。數學家陶哲軒作為倡導者,一...
閱讀原文

復旦大學:一個小技巧探測大模型的知識邊界,有效消除幻覺

夕小瑤科技說 原創作者 | Zicy 孔子說“知之為知之,不知為不知,是知也”,目前的大模型非常缺乏這個能力。雖然大模型擁有豐富的知識,但它仍然缺乏對自己知識...
閱讀原文

上交舉辦“大模型奧林匹克競賽”,GPT-4o僅得39分

夕小瑤科技說 原創作者 | 謝年年大模型的奧林匹克競賽來了! 最近,上交構建了一個全面、極具挑戰性的奧賽級別的基準——OlympicArena,從來自62個不同奧林匹克...
閱讀原文

迄今最快的網絡流算法,網友:幾乎與數學理論一樣快

金磊 發自 凹非寺量子位 | 公眾號 QbitAI迄今為止最快、近乎完美的網絡流(Network Flow)算法,來了! 有多快? 對于任何類型的網絡,計算速度幾乎與數學理...
閱讀原文

菲爾茲獎得主親測GPT-4o,經典過河難題失敗!最強Claude 3.5回答離譜,LeCun嘲諷LLM

新智元報道編輯:桃子 喬楊 【新智元導讀】LLM能否解決「狼-山羊-卷心菜」經典過河難題?最近,菲爾茲獎得主Timothy Gowers分享了實測GPT-4o的過程,模型在最...
閱讀原文

ACL2024主會:無需訓練的大模型推薦系統!

夕小瑤科技說 原創作者 | Axe_越如今,各種推薦系統無時無刻不在包圍著我們的生活,自大模型(Large Language Model, LLM)時代以來,得益于LLM的高自由度,...
閱讀原文

陳丹琦團隊圖表解讀新基準:新王Claude3.5剛及格,但已是模型最強推理表現

克雷西 發自 凹非寺量子位 | 公眾號 QbitAIClaude 3.5 Sonnet的圖表推理能力,比GPT-4o高出了27.8%。 針對多模態大模型在圖表任務上的表現,陳丹琦團隊提出了...
閱讀原文

首個多模態視頻競技場Video-MME來了!Gemini全面超越GPT-4o,Jeff Dean連轉三次

新智元報道編輯:alan 好困 【新智元導讀】近日,首個多模態LLM視頻分析綜合評估基準Video-MME誕生!在這場全新的考試中,Gemini 1.5 Pro一路遙遙領先,谷歌...
閱讀原文

OpenAI CTO深度訪談:劇透GPT-5發布時間

OpenAI CTO 穆拉提分享OpenAI近況與AI行業動向。 編譯|陳駿達 編輯|Panken 智東西6月25日消息,近日,OpenAI首席技術官米拉·穆拉提(Mira Murati)在達特茅斯...
閱讀原文
1121314151636