Google 发布 Gemma 3 QAT 模型：让顶尖 AI 模型走进消费级 GPU

作者:Jam 发布时间: April 22, 2025 分类: No Comments

继上月推出新一代开放模型 Gemma 3 后，Google 近日再次拓展其模型生态，发布了基于量化感知训练 (Quantization-Aware Training, QAT) 优化的新版本。 Gemma 3 此前已凭借其在 BF16 精度下于单个高端 GPU（如 NVIDIA H100）上运行的能力，证明了其领先性能。而 QAT 版本的推出，旨在显著降低模型的内存需求，同时尽可能保持高质量输出，从而让强大的 AI 模型能够在更多消费级硬件上运行。 Google 发布 Gemma 3 QAT 模型：让顶尖 AI 模型走进消费级 GPU-1

>>展开阅读

Jam's Blog II

JamLee.Life 心情演绎

Google 发布 Gemma 3 QAT 模型：让顶尖 AI 模型走进消费级 GPU