標簽:詞表
WPS接入DeepSeek,秒變辦公神器!
WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!
這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...
LLM實踐系列-詳談Tokenizer訓練細節
今天給大家帶來知乎@真中合歡的一篇文章,《LLM實踐--Tokenizer訓練》。 知乎:https://zhuanlan.zhihu.com/p/739078635 經過了數據收集、篩選、去重,馬上就...
NeurIPS 2024 | 大模型的詞表大小,同樣適用于Scaling Law
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
GPT-4o不會數r,被外國小哥原地逼瘋! 谷歌論文揭秘Transformer「數不到n」
新智元報道編輯:Aeneas 好困 【新智元導讀】提示工程師Riley Goodside小哥,依然在用「Strawberry里有幾個r」折磨大模型們,GPT-4o在無限次PUA后,已經被原...
LLama+Mistral+…+Yi=? 免訓練異構大模型集成學習框架DeePEn來了
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
AI讀論文新神器:多欄密集文字、中英圖文混排文檔都能讀的多模態大模型Fox|曠視
Fox團隊 投稿量子位 | 公眾號 QbitAI雖然多模態大模型都能挑西瓜了,但理解復雜文檔方面還是差點意思。 面對文字密集、多欄混排等文檔時往往力不從心,區域級...
單模型斬獲「蛋白質突變預測」榜一!西湖大學提出基于結構詞表方法 | ICLR 2024 Spotlight
新智元報道編輯:LRS 【新智元導讀】Saprot在proteingym蛋白質突變預測任務公開基準榜(由牛津大學計算機與哈佛醫學院設立)排名第一。相比,其他排名靠前的...
4000萬蛋白結構訓練,西湖大學開發基于結構詞表的蛋白質通用大模型,已開源
將ScienceAI設為星標 第一時間掌握 新鮮的AI for Science資訊編輯 |ScienceAI 蛋白質結構相比于序列往往被認為更加具有信息量,因為其直接決定了蛋白質的功能...
年輕人的第一個多模態大模型:1080Ti輕松運行,已開源在線可玩
Vary-toy團隊 投稿量子位 | 公眾號 QbitAI一款名為Vary-toy的“年輕人的第一個多模態大模型”來了! 模型大小不到2B,消費級顯卡可訓練,GTX1080ti 8G的老顯卡...
OCR終結了?曠視提出支持文檔級OCR的多模態大模型,支持中英文,已開源!
國科大&曠視團隊 投稿量子位 | 公眾號 QbitAI想將一份文檔圖片轉換成Markdown格式? 以往這一任務需要文本識別、布局檢測和排序、公式表格處理、文本清洗...
詞表的選擇如何影響語言模型訓練?這可能是目前見過最好的詞表選擇研究
機器之心報道編輯:趙陽本文初步探討了不同類型的詞表對語言模型訓練所產生的影響,研究者使用了 12 個小型的語言模型及 4 個中型的語言模型作為實驗對象,并...
中文LLaMA-2刷榜,開源可商用!千元預算,訓練半天,效果媲美主流大模型
新智元報道編輯:好困 桃子【新智元導讀】最強中文版LLaMA-2來了!15小時訓練,僅需數千元算力,性能碾壓同級中文漢化模型,開源可商用。LLaMA-2相較于LLaMA-...
15小時、幾千元訓完中文版LLaMA2!低成本方案全面開源,包含代碼權重,支持商用
明敏 發自 凹非寺量子位 公眾號 | QbitAI訓練大模型,幾千塊就能實現了!現在,15小時、幾千塊錢、85億 token數據,即可訓出中文LLaMA2。綜合性能達到開源社...
千元預算半天訓練,效果媲美主流大模型,開源可商用中文LLaMA-2
機器之心發布機器之心編輯部LLaMA-2 相較于 LLaMA-1,引入了更多且高質量的語料,實現了顯著的性能提升,全面允許商用,進一步激發了開源社區的繁榮,拓展了...