標(biāo)簽:長上
WPS接入DeepSeek,秒變辦公神器!
WPS 大家經(jīng)常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓W(xué)PS秒變辦公神器。 DeepSeek API申請地址:http:/...
AI賺錢副業(yè)~AI生成影視解說,半個月漲粉變現(xiàn)3.5W+!
這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認(rèn)準(zhǔn)機會,然后抓住它。 接觸過很多咨詢項目的人,發(fā)現(xiàn)...
米開朗基羅怎么說?谷歌DeepMind推出長上下文評估新框架
新智元報道編輯:alan 【新智元導(dǎo)讀】近日,來自谷歌DeepMind的研究人員提出了Michelangelo,「用米開朗基羅的觀點」來測量任意上下文長度的基礎(chǔ)模型性能。米...
Jamba 1.5發(fā)布,最長上下文,非Transformer架構(gòu)首次成功領(lǐng)先
昨天,號稱當(dāng)前最強、最高效的長上下文模型——Jamba 1.5 系列發(fā)布。 Jamba 是第一個基于 Mamba 架構(gòu)的生產(chǎn)級模型。Mamba 是由卡內(nèi)基梅隆大學(xué)和普林斯頓大學(xué)的...
支持1024幀、準(zhǔn)確率近100%,英偉達「LongVILA」開始發(fā)力長視頻
機器之心報道 編輯:杜偉、陳陳現(xiàn)在,長上下文視覺語言模型(VLM)有了新的全棧解決方案 ——LongVILA,它集系統(tǒng)、模型訓(xùn)練與數(shù)據(jù)集開發(fā)于一體。現(xiàn)階段,將模型...
無一大模型及格! 北大/通研院提出超難基準(zhǔn),專門評估長文本理解生成
LooGLE團隊 投稿自 凹非寺量子位 | 公眾號 QbitAI在長文本理解能力這塊,竟然沒有一個大模型及格! 北大聯(lián)合北京通用人工智能研究院提出了一個新基準(zhǔn)數(shù)據(jù)集:...
NVIDIA把Llama-3的上下文長度擴展16倍,長上下文理解能力超越GPT-4
夕小瑤科技說 原創(chuàng)作者 | Richard在 Llama-3.1 模型發(fā)布之前,開源模型與閉源模型的性能之間一直存在較大的差距,尤其是在長上下文理解能力上。 大模型的上下...
7B最強長視頻模型! LongVA視頻理解超千幀,霸榜多個榜單
AIxiv專欄是機器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學(xué)術(shù)...
Gemini 1.5 Pro裝進機器人,參觀一遍公司就能禮賓、帶路
機器之心報道 編輯:張倩長上下文大模型幫助機器人理解世界。最近,谷歌 DeepMind 突然開始炫起了機器人。這個機器人可以輕松聽從人類指令、進行視覺導(dǎo)覽,用...
超越 Transformer 與 Mamba,Meta 聯(lián)合斯坦福等高校推出最強架構(gòu) TTT
作者 | 趙明華 近日,斯坦福、UCSD、UC 伯克利和 Meta 的研究人員提出了一種全新架構(gòu),用機器學(xué)習(xí)模型取代 RNN 的隱藏狀態(tài)。 圖 1 所有序列建模層都可以表示...
單卡A100實現(xiàn)百萬token推理,速度快10倍,這是微軟官方的大模型推理加速
機器之心報道 編輯:張倩、陳萍微軟的這項研究讓開發(fā)者可以在單卡機器上以 10 倍的速度處理超過 1M 的輸入文本。大型語言模型 (LLM) 已進入長上下文處理時代...
強強聯(lián)合!當(dāng)RAG遇到長上下文,滑鐵盧大學(xué)發(fā)布LongRAG,效果領(lǐng)先GPT-4 Turbo 50%
夕小瑤科技說 原創(chuàng)作者 | Axe_越過猶不及——《論語·先進》 大學(xué)考試時,有些老師允許帶備cheet sheet(忘紙條),上面記著關(guān)鍵公式和定義,幫助我們快速作答提高...
谷歌重磅:告別RAG,長上下文的大語言模型無需檢索增強
夕小瑤科技說 原創(chuàng)作者 | Richard當(dāng)今人工智能領(lǐng)域正在經(jīng)歷一場靜默的革命。隨著大語言模型(LLM)的快速發(fā)展,它們不僅能夠處理更長的上下文,還展現(xiàn)出驚人的...
一次可輸入多張圖像,還能多輪對話!最新開源數(shù)據(jù)集,讓AI更接近現(xiàn)實
劉子煜 投稿量子位 | 公眾號 QbitAI大模型對話能更接近現(xiàn)實了! 不僅可以最多輸入20張圖像,還能支持多達27輪對話。可處理文本+圖像tokens最多18k。 這就是最...
英偉達新研究:上下文長度虛標(biāo)嚴(yán)重,32K性能合格的都不多
西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號 QbitAI無情戳穿“長上下文”大模型的虛標(biāo)現(xiàn)象—— 英偉達新研究發(fā)現(xiàn),包括GPT-4在內(nèi)的10個大模型,生成達到128k甚至1M上下文長...
速度秒殺GPT-4o!Mistral開源首個22B代碼模型破記錄,支持80+編程語言
新智元報道編輯:喬楊 好困 【新智元導(dǎo)讀】就在剛剛,法國AI初創(chuàng)公司Mistral發(fā)布了自家首款代碼生成模型Codestral。不僅支持32K長上下文窗口以及80多種編程語...
拯救被「掰彎」的GPT-4!西交微軟北大聯(lián)合提出IN2訓(xùn)練治療LLM「中間迷失」
新智元報道編輯:alan 【新智元導(dǎo)讀】近日,西交微軟北大聯(lián)合提出信息密集型訓(xùn)練大法,使用純數(shù)據(jù)驅(qū)動的方式,矯正LLM訓(xùn)練過程產(chǎn)生的偏見,在一定程度上治療...