桃子桃子 AI 快讯
返回首页
模型发布8 小时快讯 · 2026.06.25 16:34

NVIDIA 发布扩散语言模型 Nemotron-TwoTower

NVIDIA 推出扩散式语言模型,并行生成令牌,吞吐量提升 2.42 倍。

2026.06.25 · 周四1 分钟阅读评分 85

NVIDIA 发布了 Nemotron-TwoTower-30B-A3B-Base-BF16,这是一种基于扩散的新型语言模型,由 Nemotron 3 Nano 30B-A3B 骨干网络构建。

技术特点:

  • 采用冻结自回归上下文塔和扩散去噪塔,并行填充令牌块,而非逐令牌生成。
  • 默认掩码扩散设置下,保留了自回归基线 98.7% 的聚合基准质量,同时实现了 2.42 倍的实际生成吞吐量提升。

该模型发布标志着扩散式语言模型在保持质量的同时大幅加速推理,为高效文本生成提供了新路径。

信源