国产AI模型再创佳绩！智谱联合华为开源GLM-Image，问鼎Hugging Face全球第一

开源即登顶，引发国际关注
智谱与华为联合开源的新一代图像生成模型GLM-Image，在发布不到24小时内即登顶Hugging Face全球榜单第一，引发海外科技社区广泛讨论。模型在性能、结构与训练路径上的多项创新，被视为国产图像生成模型的一次集中展示，也让国际视野重新审视中国AI技术的进展速度。

成绩背后，是体系化技术能力的集中体现
GLM-Image的快速走红并非偶然。其在多项核心指标上达到SOTA水平，尤其在文字渲染与复杂场景生成方面表现突出，成为开源模型中的标杆之一。这一成果不仅体现了模型本身的性能突破，也反映出国产大模型在工程化与系统设计能力上的整体提升。

混合架构设计带来的生成优势
从技术路径看，GLM-Image采用了“自回归+扩散解码器”的混合架构。其中，9B规模的自回归模块负责语义理解与整体构图，7B的扩散解码器则承担高质量图像生成任务，并通过DiT结构与Glyph Encoder协同完成文字渲染。这一分工清晰的架构，使模型在复杂文本与图像结合场景中具备更高稳定性与可控性。

国产算力完成从验证到实战的跨越
尤为重要的是，GLM-Image成为首个完全依托国产芯片完成训练的国产图像生成模型。模型基于昇腾Atlas 800T A2设备，并运行在昇思MindSpore AI框架之上，完成了从数据处理到模型训练的全流程实践。这一成果验证了国产算力体系已具备支撑前沿模型训练的能力，为中国AI产业提供了坚实底座。

文字渲染能力跻身全球第一梯队
在文字渲染这一长期被视为图像生成难点的领域，GLM-Image交出了亮眼成绩单。在CVTG-2K榜单中，其多区域文字生成准确率达到0.9116，字符级NED指标达到0.9557，均位列开源模型第一；在LongText-Bench中，无论是英文还是中文长文本渲染，均取得榜首成绩，显示出对复杂文字场景的成熟处理能力。

高性价比推动应用快速落地
除性能优势外，GLM-Image在成本控制上同样具备竞争力。其API调用价格低至0.1元即可生成一张图片，在打破行业价格底线的同时，显著降低了商业与开发者使用门槛。这使其能够广泛应用于科普插画、商业设计、内容创作等多种场景，加速模型能力向实际生产力转化。

国产AI迈入“好用且敢用”的新阶段
GLM-Image的成功开源，标志着国产大模型已从“能跑起来”迈向“跑得稳、跑得好”。在国产算力与自主框架的支撑下，中国AI产业正逐步摆脱对单一外部技术路径的依赖，进入以自主创新定义能力边界的新阶段。