谷歌推出实验性开源模型DiffusionGemma(26B MoE),采用文本扩散技术,突破传统自回归LLM逐词生成范式,支持整块文本并行生成,GPU上速度提升达4倍。该模型基于Gemma 4系列的高参数效率与Gemini扩散研究成果,配备专用扩散头以优化生成速度。虽在生成质量上暂未超越自回归版Gemma 4(仍为生产首选),但专为研究者和开发者设计,适用于对延迟敏感的本地交互场景,如实时内联编辑、快速迭代及非线性文本结构生成。模型采用Apache 2.0许可证。

本专栏通过快照技术转载,仅保留核心内容

内容中包含的图片若涉及版权问题,请及时与我们联系删除