China Daily Homepage
中文網首頁
時政
資訊
C財經
生活
視頻
專欄
原創
觀天下
地方

登錄

注冊

移動新媒體

China Daily Homepage
中文網首頁
時政
資訊
C財經
生活
視頻
專欄
漫畫
原創
觀天下
地方

壓縮算法為大語言模型“瘦身”

來源：科技日報

2024-11-23 08:47　

分享到

分享到微信

原標題：壓縮算法為大語言模型“瘦身”

據美國科學促進會旗下網站19日報道，美國普林斯頓大學和斯坦福大學團隊開發出一種新壓縮算法CALDERA，能精簡大型語言模型（LLM）的海量數據，為LLM“瘦身”。這項算法不僅有助保護數據隱私、節約能源、降低成本，還能推動LLM在手機和筆記本電腦上高效使用。

團隊舉例稱，當人們使用ChatGPT時，請求會被發送到OpenAI公司的后端服務器進行處理。這一過程不僅成本高昂、能耗巨大，通常還很慢。如果用戶想要使用消費級圖形處理單元運行LLM，就需要對這些LLM進行壓縮。

CALDERA算法通過減少LLM冗余并降低信息層的精度來發揮作用。“瘦身”后的LLM更加精簡，可在手機或筆記本電腦等設備上存儲和訪問，同時提供了與未壓縮版本幾乎一樣準確而微妙的性能。

雖然CALDERA并非首個壓縮LLM的算法，但其獨特之處在于兼具“低精度”和“低排序”兩種特性。其中，“低精度”減少了比特數，加快了數據存儲和處理速度。而“低排序”則降低了LLM數據中的冗余。

團隊表示，使用CALDERA壓縮的LLM可能適用于那些對精度要求不是最高的場景。此外，用戶可在智能手機或筆記本電腦等設備上對壓縮后的LLM進行微調，這使其能根據特定需求調整模型來增強隱私，而無需與第三方共享敏感數據。

不過團隊也提醒道，在智能手機或筆記本電腦上運行LLM，可能會占用設備內存。（記者劉霞）

【責任編輯：張瑨瑄】

科技日報

最熱新聞

為你推薦

換一批

關于我們 | 聯系我們

首頁
時政
資訊
財經
生活
視頻
專欄
漫畫
獨家
招聘

中國日報網版權說明：凡注明來源為“中國日報網：XXX（署名）”，除與中國日報網簽署內容授權協議的網站外，其他任何網站或單位未經允許禁止轉載、使用，違者必究。如需使用，請與010-84883777聯系；凡本網注明“來源：XXX（非中國日報網）”的作品，均轉載自其它媒體，目的在于傳播更多信息，其他媒體如需轉載，請與稿件來源方聯系，如產生任何問題與本網無關。

版權保護：本網登載的內容（包括文字、圖片、多媒體資訊等）版權屬中國日報網（中報國際文化傳媒（北京）有限公司）獨家所有使用。未經中國日報網事先協議授權，禁止轉載使用。給中國日報網提意見：rx@chinadaily.com.cn

首頁
時政
資訊
財經
文化
漫畫
視頻
地方

中文 | English

^{<sub id="rpmts"></sub>}

亚洲制服丝袜精品久久100部,久久只有精品免费,成年无码按摩av片在线,亚洲国产中文成人久久综合

壓縮算法為大語言模型“瘦身”