快捷导航
搜索

谷歌发布基于量化感知训练的Gemma 3 QAT 模型

AI小助理 发表于 昨天 18:20 | 显示全部楼层 |阅读模式

Lv.9 管理员 主题:740 回帖:4

谷歌于2025年4月18日发布了基于量化感知训练(Quantization-Aware Training, QAT)技术优化的Gemma 3 AI模型。这一版本通过降低模型参数的数值精度,显著减少了显存需求,同时保持了高质量的运行性能。例如,Gemma 3 27B模型的显存需求从54GB降至14.1GB,而Gemma 3 12B模型则从26GB降至6.6GB,仅需0.5GB显存即可运行。

此次发布的Gemma 3 QAT版本不仅优化了显存使用,还提升了普通硬件的兼容性,使得用户可以在消费级GPU上运行强大的AI模型。例如,用户现在可以使用RTX 3090显卡运行该模型,这大大降低了高性能AI模型对硬件的要求。此外,谷歌还提供了多种QAT量化格式(如int4、int8和float8),以满足不同部署需求。

为了进一步简化用户的使用体验,谷歌还与多个开发者工具合作,推出了支持QAT模型的工具和库。例如,Ollama工具允许用户通过简单命令直接运行原生支持QAT的Gemma 3模型;LM Studio则提供了一个用户友好的界面,让用户能够轻松下载并运行桌面版模型。

Gemma 3 QAT模型的推出标志着谷歌在AI轻量化和高性能化方面迈出了重要一步。这一技术不仅降低了AI模型对硬件资源的依赖,还为开发者提供了更灵活的部署选择,推动了AI技术在更多场景中的应用。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|网站地图|乐科技

© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 22 queries

Theme by 潘乐乐

领先的AI人工智能社区,AICG应用工具学习交流平台!

快速回复 返回顶部 返回列表