Google 发布 Gemma 3 QAT 模型:让顶尖 AI 模型走进消费级 GPU

继上月推出新一代开放模型 Gemma 3 后,Google 近日再次拓展其模型生态,发布了基于量化感知训练 (Quantization-Aware Training, QAT) 优化的新版本。 Gemma 3 此前已凭借其在 BF16 精度下于单个高端 GPU(如 NVIDIA H100)上运行的能力,证明了其领先性能。而 QAT 版本的推出,旨在显著降低模型的内存需求,同时尽可能保持高质量输出,从而让强大的 AI 模型能够在更多消费级硬件上运行。Google 发布 Gemma 3 QAT 模型:让顶尖 AI 模型走进消费级 GPU-1

>>展开阅读