AIGC動態歡迎閱讀
原標題:首批中文版Llama3模型來了,解釋成語、答弱智吧問題
關鍵字:模型,知乎,清華大學,中文,基準
文章來源:機器之心
內容字數:8638字
內容摘要:
機器之心報道
編輯:小舟、張倩中文問題,中文回答。最近,Meta 推出了 Llama 3,為開源大模型樹立了新的標桿。
和以往的原始 Llama 模型一樣,Llama 3 對中文的支持效果欠佳,經常會出現你用中文提問,它用英文或中文+英文回復的現象。因此,要想讓國內用戶用上該模型,開發者還需對其進行微調。
最近,在 Github 以及 HuggingFace 平臺上,我們已經陸陸續續地看到了一些這樣的項目,比如 llama3-Chinese-chat 和 Llama3-8B-Chinese-Chat。這篇文章將逐一介紹。
llama3-Chinese-chat
llama3-Chinese-chat 是一個 Github 項目,由名為「Ke Bai」的開發者開發。項目鏈接:https://github.com/CrazyBoyM/llama3-Chinese-chat
該模型效果如下:作者表示,該模型使用 170k + 高質量多輪中文對話數據連夜訓練得到。他還整理了一份可用的訓練數據列表,里面包含弱智吧、小紅書、知乎等網絡數據和開發者自己制作的數據。模型推理成本如下:
fp16 模式大
原文鏈接:首批中文版Llama3模型來了,解釋成語、答弱智吧問題
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...