標簽:大模型訓練

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

代碼論文全開源!月之暗面發布重磅技術報告:模型訓練效率翻倍

原標題:代碼論文全開源!月之暗面發布重磅技術報告:模型訓練效率翻倍 文章來源:人工智能學家 內容字數:9145字AI寒武紀月之暗面團隊:Muon 優化器與 Moonl...
閱讀原文

DeepSeek發布NSA:超快速長上下文訓練與推理的新突破

原標題:DeepSeek發布NSA:超快速長上下文訓練與推理的新突破 文章來源:小夏聊AIGC 內容字數:3860字DeepSeek's NSA: A Breakthrough in Accelerating AI Mo...
閱讀原文

廈門大學《大模型概念、技術與應用實踐》(PPT文件)

《大模型概念、技術與應用實踐》由廈門大學大數據教學團隊制作,科普大模型技術及其在各領域的應用。強調其在大數據教學領域的影響力。回顧人工智能發展簡史...
閱讀原文

張俊林從Deepseek R1看Scaling Law的未來

原標題:張俊林從Deepseek R1看Scaling Law的未來 文章來源:人工智能學家 內容字數:16988字大模型Scaling Law與S型智能增長曲線:一個思想實驗 本文探討了...
閱讀原文

萬卡時代,一家IT企業的智算 |甲子光年

通過硬件和軟件的雙重布局,藍耘呈現了一個經過時間檢驗的答案。
閱讀原文