DiffusionGemma: 4x faster text generation

谷歌推出实验性开源模型DiffusionGemma（26B MoE），采用文本扩散技术，突破传统自回归LLM逐词生成范式，支持整块文本并行生成，GPU上速度提升达4倍。该模型基于Gemma 4系列的高参数效率与Gemini扩散研究成果，配备专用扩散头以优化生成速度。虽在生成质量上暂未超越自回归版Gemma 4（仍为生产首选），但专为研究者和开发者设计，适用于对延迟敏感的本地交互场景，如实时内联编辑、快速迭代及非线性文本结构生成。模型采用Apache 2.0许可证。

本专栏通过快照技术转载，仅保留核心内容