ICLR 2024 Poster:精確且高效的大語言模型低比特量化方法 QLLM|AI新青年講座
AIGC動態(tài)歡迎閱讀
原標(biāo)題:ICLR 2024 Poster:精確且高效的大語言模型低比特量化方法 QLLM|AI新青年講座
關(guān)鍵字:高效,新青年,講座,方法,人工智能
文章來源:算法邦
內(nèi)容字?jǐn)?shù):2556字
內(nèi)容摘要:
「AI新青年講座」由智猩猩出品,致力于邀請青年學(xué)者,主講他們在生成式AI、LLM、計算機(jī)視覺、機(jī)器學(xué)習(xí)等人工智能領(lǐng)域的最新重要研究成果。
AI新青年是加速人工智能前沿研究的新生力量。AI新青年的視頻講解和直播答疑,將可以幫助大家增進(jìn)對人工智能前沿研究的理解,相應(yīng)領(lǐng)域的專業(yè)知識也能夠得以積累加深。同時,通過與AI新青年的直接交流,大家在AI學(xué)習(xí)和應(yīng)用AI的過程中遇到的問題,也能夠盡快解決。
「AI新青年講座」現(xiàn)已完結(jié)233講,錯過往期講座直播的朋友,可以點擊文章底部“閱讀原文”進(jìn)行回看!
有興趣分享學(xué)術(shù)成果的朋友,可以與智猩猩教研產(chǎn)品團(tuán)隊進(jìn)行郵件(class@zhidx.com)聯(lián)系。大語言模型在自然語言處理領(lǐng)域的卓越表現(xiàn)已引起廣泛矚目,然而其對計算資源和硬件設(shè)施的高要求成為了廣泛應(yīng)用的一大挑戰(zhàn)。針對這一難題,來自莫納什大學(xué)、北航、商湯的研究者創(chuàng)新性地提出了一種名為 QLLM 的高效、精準(zhǔn)的低比特量化方法。QLLM 通過引入自適應(yīng)通道重組機(jī)制,巧妙地將離群值所攜帶的能量重新分布至其他通道,有效緩解了這些極端值對量化動態(tài)范圍的影響。
此外,為補償量化過程中的性能損失,研究者設(shè)計了一種僅涉及
原文鏈接:ICLR 2024 Poster:精確且高效的大語言模型低比特量化方法 QLLM|AI新青年講座
聯(lián)系作者
文章來源:算法邦
作者微信:allplusai
作者簡介:智猩猩矩陣賬號之一,連接青年AI學(xué)者,講解研究成果,分享系統(tǒng)思考。