標簽:基準
WPS接入DeepSeek,秒變辦公神器!
WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!
這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...
含284個數據集,覆蓋18項臨床任務,上海AI Lab等發布多模態醫療基準GMAI-MMBench
作者:李姝 編輯:李寶珠 上海人工智能實驗室聯合華盛頓大學/莫納什大學/華東師范大學等多所科研單位提出了 GMAI-MMBench 基準,包含來自全球的 284 個下游任...
?首個自主機器學習AI工程師,剛問世就秒了OpenAI o1,Kaggle大師拿到飽
機器之心報道 編輯:澤南,亞鸝???多智能體系統,可自動化整個 ML 工作流程,節省數千小時工時。 Open AI 的推理模型 o1,這么快就被比下去了? 本周五,AI ...
LLM 推理量化評估:FP8、INT8 與 INT4 的全面對比
大會預告12月5日-6日,2024中國生成式AI大會(上海站)將舉辦。上海科大助理教授、博導顧家遠,騰訊優圖實驗室天衍研究中心負責人吳賢,銀河通用機器人合伙人...
最強開源CodeLLM模型深夜來襲!320億參數,Qwen2.5-Coder新模型超越GPT-4o
小明 發自 凹非寺量子位 | 公眾號 QbitAI一夜之間,AI編程模型的開源王座易主了! Qwen2.5-Coder-32B正式發布,霸氣拿下多個主流基準測試SOTA,徹底登上全球...
o1/Claude集體翻車!陶哲軒等60+頂尖數學家合力提出新數學基準,大模型正確率通通不足2%
一水 發自 凹非寺量子位 | 公眾號 QbitAI讓大模型集體吃癟,數學題正確率通通不到2%! 獲大神卡帕西力薦,大模型新數學基準來勢洶洶—— 一出手,曾在國際數學...
陶哲軒和Karpathy推薦的數學測試,讓全體LLM的數學幾乎得0分:解決率2%
夕小瑤科技說 原創作者 | 小鹿最近,出現了一個數學基準集,讓大模型們的數學集體翻車,正確率還不到2%。 就是這家非營利研究機構Epoch AI,它集合了世界最頂...
陶哲軒聯手60多位數學家出題,世界頂尖模型通過率僅2%!專家級數學基準,讓AI再苦戰數年
新智元報道編輯:Hjh 【新智元導讀】Epoch AI推出數學基準FrontierMath,目前前沿模型測試成功率均低于2%!OpenAI研究科學家Noam Brown說道:「我喜歡看到新...
不讓視覺語言模型「盲猜」,性能竟直接提升一倍?
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
下載次數破39萬!CMU、Meta聯合發布VQAScore文生圖優化方案:Imagen3已采用
新智元報道編輯:LRST 【新智元導讀】VQAScore是一個利用視覺問答模型來評估由文本提示生成的圖像質量的新方法;GenAI-Bench是一個包含復雜文本提示的基準測...
高效評估多模態預訓練對齊質量,中科大提出模態融合率MIR
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
突破短視頻局限!MMBench 團隊構建中長視頻開放問答評測基準,全面評估多模態大模型視頻理解能力
新宇投稿 凹非寺量子位 | 公眾號 QbitAIGPT-4o 四月發布會掀起了視頻理解的熱潮,而開源領軍者Qwen2也對視頻毫不手軟,在各個視頻評測基準上狠狠秀了一把肌肉...
控制電腦手機的智能體人人都能造,微軟開源OmniParser
機器之心報道 編輯:Panda大?模型控制計算機果真就是未來方向?最近這幾天,讓大模型具備控制計算機(包括電腦和手機)的相關研究和應用如雨后春筍般不斷涌現...
加強版Claude3.5正式上線,一句話操控電腦的時代真的要來了。
大數據文摘受權 轉載自數字生命卡茲克 作者:卡茲克、東毅 夜里十一點,大洋彼岸早上8點整。 Claude帶著大貨閃亮登場了。 升級版的Claude 3.5 Sonnet,新模型...
開源版OpenAI再出「神作」,小模型吊打Llama 3!Ministral系列問世,邊緣AI開啟
新智元報道編輯:桃子 【新智元導讀】Mistral 7B誕生一周年之際,法國AI初創公司Mistral再次連發兩個輕量級模型Ministral 3B和Ministral 8B,性能趕超Llama 3...