AIGC動態歡迎閱讀
內容摘要:
生成式AI時代最火AI芯片峰會下月來襲!9月6-7日,智猩猩發起主辦的2024全球AI芯片峰會將在北京盛大舉行。峰會設有開幕式、數據中心AI芯片專場、邊緣/端側AI芯片專場、智算集群技術論壇等7大板塊。目前,來自AMD、高通、Habana、壁仞科技、摩爾線程、蘋芯科技、億鑄科技、凌川科技、云天勵飛、中國移動研究院、北極雄芯等40+企業的嘉賓已確認演講或討論。掃碼申請免費票或購票參會~今天給大家帶來知乎好友@ybq一篇關于大模型和小模型討論的文章。首先,我們思考一個問題,為什么 qwen2 基本上是當下最受歡迎的開源模型?說實話,相比于 deepseek、llama、minicpm 這些誠意滿滿的技術報告,qwen2 的技術報告稍顯一些“小家子氣”,并沒有提及到關鍵的技術細節。然而,qwen2 提供給開源社區的“全家桶”套餐,又是多長的技術報告也比不上的。對 llm 的研究者來說,用相同 tokenizer,相同的 7T pretrain_data 得到的“一簇小 llm”,其研究價值遠遠超過 Qwen2-72B 本身!
知乎:https://zhuanlan.zhihu.com/p/7
原文鏈接:大模型 VS 小模型
聯系作者
文章來源:智猩猩AGI
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...