標簽:內存
WPS接入DeepSeek,秒變辦公神器!
WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!
這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...
vLLM這一年的新特性以及后續規劃(總結版!)
大會預告12月5日-6日,2024中國生成式AI大會(上海站)舉辦。將邀請50+位嘉賓圍繞大模型、AI Infra、端側生成式AI、AI視頻生成和具身智能等議題進行同臺分享...
無需訓練即可大幅提升SAM 2!開源的SAM2Long來了,港中文、上海AI Lab出品
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
萬字長文細說端側大模型進展
開講預告11月7日晚7點,上海 AI Lab OpenGVLab 博士后研究員羅根,將以《Mono-InternVL: 突破原生多模態大模型性能瓶頸》為主題進行直播講解,歡迎掃碼報名~0...
蘋果地表最強AI PC誕生,M4 Max猛獸加持性能暴漲!頂配6萬,續航飆至24小時
新智元報道編輯:編輯部 【新智元導讀】一周Mac三連發,壓軸場MacBook Pro終于來了,也宣告著M4全系芯片誕生。最強性能野獸M4 Pro、M4 Max采用第二代3nm工藝...
蘋果發布 M4 MacBook Pro!全系 16G 內存起步,史上續航最長的 Mac
終于 正式登場10 月初,全新的 MacBook Pro 在尚未公開前,直接被幾位博主提前開箱上手,堪稱蘋果自 iPhone 4 以來最嚴重的產品泄露事件。 原本以為蘋果會把...
低內存占用也能實現滿血訓練?!北理北大港中文MMLab推出Fira訓練框架
Fira團隊 投稿量子位 | 公眾號 QbitAI內存占用小,訓練表現也要好……大模型訓練成功實現二者兼得。 來自北理、北大和港中文MMLab的研究團隊提出了一種滿足低秩...
英偉達5090被曝32G大顯存、核心是5080的兩倍!網友:怕不是B200雙芯封裝技術下放
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI32GB GDDR7內存,CUDA核心數21760個—— 關于英偉達下一代旗艦消費級顯卡5090,知名消息人士kopite7kimi給出了最新爆...
最高配 128 核!英特爾至強 6 性能核處理器發布:運行 Llama2-7B 快了 3.08 倍
作者 | 褚杏娟 “英特爾至強 6 性能核,將是英特爾有史以來性能最強大的至強處理器。”英特爾數據中心與人工智能集團副總裁、中國區總經理陳葆立在 9 月 6 日...
英特爾最強服務器CPU來了!AI性能直接翻倍
夢晨 金磊 發自 凹非寺量子位 | 公眾號 QbitAI服務器CPU領域持續多年的核心數量大戰,被一舉終結了! 英特爾最新發布的至強?6 性能核處理器(P-core系列),...
從架構、工藝到能效表現,全面了解LLM硬件加速,這篇綜述就夠了
機器之心報道 編輯:陳陳、杜偉大語言模型(LLM)的發展同時往往伴隨著硬件加速技術的進化,本文對使用 FPGA、ASIC 等芯片的模型性能、能效表現來了一次全面...
Sigmoid注意力一樣強,蘋果開始重新審視注意力機制
機器之心報道 機器之心編輯部注意力是 Transformer 架構的關鍵部分,負責將每個序列元素轉換為值的加權和。將查詢與所有鍵進行點積,然后通過 softmax 函數歸...
AMD的GPU跑AI模型終于Yes了?PK英偉達H100不帶怕的
機器之心報道 編輯:Panda都很貴。AMD vs 英偉達絕對算是一個長盛不衰的話題 —— 從玩游戲用哪家強到如今訓練 AI 哪個更高效?原因也很簡單:它們的 GPU 產品...
模型推理速度狂飆 20 倍,又有一家公司想趕超英偉達
曾造出世界最大芯片公司 Cerebras,發布了全球最快的 AI 推理架構——Cerebras Inference。 運行 Llama3.1 8B 時,它能以 1800 token/s 的速率吐出文字。 自推...
GPU推理時代終結?世界最大芯片加持推理狂飆20倍,英偉達H100也趴!
新智元報道編輯:桃子 好困 【新智元導讀】LLM若以每秒1000+token高速推理,當前最先進的GPU根本無法實現!Cerebras Inference一出世,推理速度趕超英偉達GPU...