標簽:張量

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

專家模型不要專家并行!微軟開源MoE新路徑

新智元報道編輯:alan 【新智元導讀】近日,來自微軟的研究人員開源了使用全新方法訓練的MoE大模型,不走尋常路,且編碼和數學表現出色。繼Phi家族之后,微軟...
閱讀原文

從圖像到視頻:淺談Video Diffusion Models背后的底層原理

01前言最近一段時間恰好在推進手上的一個做視頻生成相關的課??題,也是對視頻擴散模型(Video Diffusion Models)這一領域有了頗多認識。其中,視頻擴散模型...
閱讀原文

「乘法變加法」!MIT清華校友全新方法優化Transformer:Addition is All You Need

新智元報道編輯:喬楊 好困 【新智元導讀】Transformer計算,竟然直接優化到乘法運算了。MIT兩位華人學者近期發表的一篇論文提出:Addition is All You Need...
閱讀原文

一行代碼訓練成本再降30%,AI大模型混合精度訓練再升級|開源

允中 發自 凹非寺量子位 | 公眾號 QbitAIFP8通過其獨特的數值表示方式,能夠在保持一定精度的同時,在大模型訓練中提高訓練速度、節省內存占用,最終降低訓練...
閱讀原文

TensorRT-LLM保姆級教程(一)-快速入門

隨著大模型的爆火,投入到生產環境的模型參數量規模也變得越來越大(從數十億參數到千億參數規模),從而導致大模型的推理成本急劇增加。因此,市面上也出現...
閱讀原文

如果大不是有史以來的第一次,那是什么導致了它發生?

來源:科技世代千高原 許多持反對態度的人對宇宙膨脹的發生提出質疑。但證據表明事實并非如此。 不斷膨脹的宇宙充滿了星系和我們今天觀察到的復雜結構,它起...
閱讀原文

Llama3訓練每3小時崩一次?豆包大模型、港大團隊為脆皮萬卡訓練提效

機器之心發布 機器之心編輯部伴隨大模型迭代速度越來越快,訓練集群規模越來越大,高頻率的軟硬件故障已經成為阻礙訓練效率進一步提高的痛點,檢查點(Checkp...
閱讀原文

GPU訓Llama 3.1瘋狂崩潰,竟有大廠用CPU服務器跑千億參數大模型?

新智元報道編輯:編輯部 【新智元導讀】是時候用CPU通用服務器跑千億參數大模型了!馬斯克19天建成由10萬塊H100串聯的世界最大超算,已全力投入Grok 3的訓練...
閱讀原文

斯坦福博士圖解AlphaFold 3:超多細節+可視化還原ML工程師眼中的AF3

新智元報道編輯:喬楊 庸庸 【新智元導讀】AlphaFold 3的論文太晦澀?沒關系,斯坦福大學的兩位博士生「圖解」AlphaFold 3 ,將模型架構可視化,同時不遺漏任...
閱讀原文

只激活3.8B參數,性能比肩同款7B模型!訓練微調都能用,來自微軟

克雷西 發自 凹非寺量子位 | 公眾號 QbitAI只需激活60%的參數,就能實現與全激活稠密模型相當的性能。 微軟亞洲研究院的一項新研究,實現了模型的完全稀疏激...
閱讀原文

參數少80%,效果仍超LoRA!上交大&上海AI Lab推出高效微調框架FLoRA

Huiser 投稿量子位 | 公眾號 QbitAI為了讓大模型在特定任務、場景下發揮更大作用,LoRA這樣能夠平衡性能和算力資源的方法正在受到研究者們的青睞。 然而,以L...
閱讀原文

AI真·煉丹:整整14天,無需人類參與

金磊 夢晨 發自 凹非寺量子位 | 公眾號 QbitAI現在制藥這事,人類要靠邊站了。 坐標蘇州,這是一個1600平的制藥實驗室,它的“打開方式”是這樣的: 門口,沒有...
閱讀原文

史上最快AI芯片「Sohu」,速度10倍于B200,哈佛輟學生打造

機器之心報道 編輯:澤南、杜偉生成式 AI 推理性價比是 GPU 的 140 倍。大模型時代,全球都缺算力,買鏟子的英偉達市值被炒上了天。 現在,終于有一家公司帶...
閱讀原文

大模型壓縮量化方案怎么選?無問芯穹Qllm-Eval量化方案全面評估:多模型、多參數、多維度

機器之心發布 作者:李師堯(無問芯穹TechView)基于 Transformer架構的大型語言模型在各種基準測試中展現出優異性能,但數百億、千億乃至萬億量級的參數規模...
閱讀原文

這個團隊做了OpenAI沒Open的技術,開源OpenRLHF讓對齊大模型超簡單

機器之心報道 編輯:Panda隨著大型語言模型(LLM)規模不斷增大,其性能也在不斷提升。盡管如此,LLM 依然面臨著一個關鍵難題:與人類的價值和意圖對齊。在解...
閱讀原文