AIGC動態歡迎閱讀
原標題:Mistral AI兩:7B數學推理專用、Mamba2架構代碼大模型
關鍵字:模型,問題,權重,架構,術業
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心報道
機器之心編輯部網友很好奇,Mathstral能不能搞定「9.11和9.9誰大」這一問題。昨天,AI圈竟然被「9.11和9.9誰大」這樣簡單的問題攻陷了,包括OpenAI GPT-4o、Google Gemini等在內的大語言模型都翻了車。這讓我們看到,大語言模型在處理一些數字問題時并不能像人類那樣理解并給出正確的答案。
對于數字以及復雜的數學問題,專用模型更術業有專攻。
今天,法國大模型獨角獸 Mistral AI 發布了一個專注于數學推理和科學發現的7B大模型「Mathstral」,來解決需要復雜、多步驟邏輯推理的高級數學問題。
該模型基于 Mistral 7B 構建,支持的上下文窗口長度為32k,遵循的開源協議為Apache 2.0 license。
Mathstral在構建時追求出色的性能與速度權衡,這是 Mistral AI積極推廣的一種開發理念,尤其是微調功能。同時,Mathstral是一個指令型模型,可以使用它或者對它進行微調。模型權重已經放在了HuggingFace上。
模型權重:https://huggingface.co/mistralai/mathst
原文鏈接:Mistral AI兩:7B數學推理專用、Mamba2架構代碼大模型
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...