標簽：基準

跨平臺多模態智能體基準測試來了！但全班第一只考了35.26分

新智元報道編輯：alan 好困【新智元導讀】近日，來自CAMEL AI、KAUST、CMU、斯坦福、清華等高校和機構的研究人員推出了一個跨平臺的多模態智能體基準測試，...

閱讀原文

AIGC動態

9個月前

Meta 科學家揭秘 Llama 3.1：合成數據很重要，MoE 不是必須的

剛剛發布的開源「巨無霸」Llama 3.1 雖然自帶論文，但依舊激起了廣大網友強烈的好奇心和求知欲。 Llama 3.1 都使用了哪些數據？其中有多少合成數據？為什么不...

閱讀原文

AIGC動態

10個月前

Llama 4訓練已開啟！Meta科學家最新采訪，揭秘Llama 3.1是如何煉成的

新智元報道編輯：喬楊【新智元導讀】最近，Latent Space發布的播客節目中請來了Meta的AI科學家Thomas Scialom。他在節目中揭秘了Llama 3.1的一些研發思路，...

閱讀原文

AIGC動態

10個月前

賈揚清點贊：3K star量的SGLang上新，加速Llama 405B推理秒殺vLLM、TensorRT-LLM

機器之心報道編輯：張倩用來運行 Llama 3 405B 優勢明顯。最近，Meta 開源了最新的 405B 模型（Llama 3.1 405B），把開源模型的性能拉到了新高度。由于模型...

閱讀原文

AIGC動態

10個月前

萬億token！史上最大多模態數據集誕生

機器之心報道編輯：Panda W開源多模態大模型或將開始騰飛。值此 Llama 3.1 占領各大頭條之際，又突然冒出了另一個也非常重要的發布 —— 一個規模空前的開源多...

閱讀原文

AIGC動態

10個月前

Mistral AI新旗艦模型挑戰Llama 3.1！1230億參數性能直逼GPT-4o

Mistral AI新旗艦模型重磅發布：“幻覺”控制出色。編譯|孟強編輯|云鵬智東西7月25日消息，繼Meta昨日推出開源Llama3.1模型之后，法國初創AI公司Mistral AI...

閱讀原文

AIGC動態

10個月前

兩天內，Meta 和 Mistral 兩款主流大模型打擂臺！已經不僅卷性能了，誰更便宜就用誰？

來源：AI前線整理：冬梅、核子可樂Mistral 發布開源旗艦模型，參數更小但性能不打折對于前沿人工智能模型領域來說，這兩天可謂熱鬧非凡，AI 科技競賽正在...

閱讀原文

AIGC動態

10個月前

Mistral新旗艦決戰Llama 3.1！最強開源Large 2 123B，扛鼎多語言編程全能王

新智元報道編輯：【新智元導讀】緊跟著Meta的重磅發布，Mistral Large 2也帶著權重一起上新了，而且參數量僅為Llama 3.1 405B的三分之一。不僅在編碼、數學...

閱讀原文

AIGC動態

10個月前

蘋果開源7B大模型，訓練過程數據集一口氣全給了，網友：開放得不像蘋果

一水發自凹非寺量子位 | 公眾號 QbitAI蘋果最新殺入開源大模型戰場，而且比其他公司更開放。推出7B模型，不僅效果與Llama 3 8B相當，而且一次性開源了全部...

閱讀原文

AIGC動態

10個月前

權重、代碼、數據集全開源，性能超越Mistral-7B，蘋果小模型來了

機器之心報道機器之心編輯部小模型成趨勢？本周，OpenAI 上線小模型 GPT-4o-mini，小模型賽道正式開卷。近期加入這一賽道的還有蘋果。最近，蘋果公司作為 D...

閱讀原文

AIGC動態

10個月前

Mamba寫代碼真的超越Transformer！原始論文入選頂流新會議

西風發自凹非寺量子位 | 公眾號 QbitAI“歐洲OpenAI”和“Transformer挑戰者”強強聯合了！ Mistral AI剛剛推出了其第一個基于Mamba2架構的開源模型——Codestral...

閱讀原文

AIGC動態

10個月前

原作親自下場！Mistral首款開源7B Mamba模型「埃及艷后」效果驚艷

新智元報道編輯：編輯部【新智元導讀】最近，7B小模型又成為了AI巨頭們競相追趕的潮流。繼谷歌的Gemma2 7B后，Mistral今天又發布了兩個7B模型，分別是針對ST...

閱讀原文

AIGC動態

10個月前

Llama3比GPT-4o更愛說謊，首個大模型“誠實性”評估基準來了 | 上海交大

Pengfei Liu 投稿量子位 | 公眾號 QbitAI評估大模型是否誠實的基準來了！上海交通大學生成式人工智能實驗室（GAIR Lab）推出了一項開創性的評估基準——BeHone...

閱讀原文

AIGC動態

10個月前

大模型時代的藍海任務，GPT4V準確率不足10%，港科大發布指代理解基準RefCOCO

夕小瑤科技說原創作者 | 謝年年談到多模態大模型的應用場景，除了生成任務以外，應用最廣泛的可能就是在圖像和視頻中進行目標檢測。目標檢測要求從圖像中識...

閱讀原文

AIGC動態

10個月前

上交舉辦“大模型奧林匹克競賽”，GPT-4o僅得39分

夕小瑤科技說原創作者 | 謝年年大模型的奧林匹克競賽來了！最近，上交構建了一個全面、極具挑戰性的奧賽級別的基準——OlympicArena，從來自62個不同奧林匹克...

閱讀原文

AIGC動態

11個月前

1 2 345 6…12