金融之窗

压缩算法为大语言模型“瘦身”

  据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。

  团队举例称,当人们使用ChatGPT时,请求会被发送到OpenAI公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大,通常还很慢。如果用户想要使用消费级图形处理单元运行LLM,就需要对这些LLM进行压缩。

  CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供了与未压缩版本几乎一样准确而微妙的性能。

压缩算法为大语言模型“瘦身”
图片来源于网络,如有侵权,请联系删除

  虽然CALDERA并非首个压缩LLM的算法,但其独特之处在于兼具“低精度”和“低排序”两种特性。其中,“低精度”减少了比特数,加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。

  团队表示,使用CALDERA压缩的LLM可能适用于那些对精度要求不是最高的场景。此外,用户可在智能手机或笔记本电脑等设备上对压缩后的LLM进行微调,这使其能根据特定需求调整模型来增强隐私,而无需与第三方共享敏感数据。

压缩算法为大语言模型“瘦身”
图片来源于网络,如有侵权,请联系删除

  不过团队也提醒道,在智能手机或笔记本电脑上运行LLM,可能会占用设备内存。(记者 刘霞)

【纠错】 【责任编辑:朱家齐】

推荐阅读:

冰淇淋加盟市场利润怎么样?开一家冰淇淋店赚钱吗?

人保车险|开车跑高速的10条老司机秘籍,你值得拥有!

人保车险|车险共有多少种,应该买哪种?

“认房不认贷”的效果显现在统计局9月数据里

神舟十七号近日择机发射 船箭组合体转运至发射区

高质量发展调研行|“刷脸办电” 大数据这样替老百姓“多跑路”

未来将发射巡天空间望远镜 空间站基本构型将由“T”字型升级为“十”字型

人保车险|车险报案有什么影响,可以报几次呢?

蜜雪冰城与邮政联名,科技创新品牌实现线上线下融合

“老司机”必看,被忽略的车损险原来还有这么多作用!

专题推荐:

相关推荐