重磅开源!美团LongCat团队发布Image模型,并升级同名APP

读懂AI5天前发布 wuaiai
55 00

图像生成模型迈向新阶段
近日,美团LongCat团队宣布开源全新图像生成模型 LongCat-Image,为行业带来一款“参数更小、性能更强”的创新方案。该模型仅以 6B 参数规模,便在文生图、图像编辑等核心任务上逼近头部大模型,展现出高效能、高性价比的技术路线。团队透露,LongCat-Image得益于独特的架构设计、系统化训练策略与精细化数据工程,为开源图像生成生态提供了新的可能。

模型创新:6B参数的高性能突破
LongCat-Image采用统一架构处理文生图与图像编辑任务,并以渐进式学习方式逐步提升模型的指令遵循能力、视觉保真度与文字渲染精度。在图像编辑任务中,模型的可控性表现尤为突出。团队通过对训练范式的重构,实现了模型在语义理解、局部修改与整体风格保持上的有效平衡,让“小体量模型也能做到高质量编辑”成为现实。

面向大众的LongCat APP再度升级
在面向 C 端用户的产品线上,美团同步推出 LongCat APP 的重大版本更新。此次升级新增“图生图”功能,并一次性上线 24 款零门槛玩法模板。无论是海报制作还是人像精修,用户仅需一键即可生成专业级作品。这意味着 AI 创作正在从“专业门槛”走向“全民体验”。

基准测试中的全面领先表现
在图像编辑领域,LongCat-Image在 GEdit-Bench、ImgEdit-Bench 等多项重要指标中达到开源领域的 SOTA。其中文渲染能力尤为突出,ChineseWord 评测中取得 90.7 分,覆盖常用字与大部分生僻字,让“中文渲染不准”这一行业常见技术短板得以突破。
文生图方面,模型在 GenEval 0.87、DPG-Bench 86.8 的成绩显示其具备强竞争力。在大规模人工主观评分中,LongCat-Image在真实度、文本对齐与合成逻辑合理性方面均表现突出,充分证明了其在综合能力上的厚实底蕴。

推动开源生态向高质发展
美团推出 LongCat-Image,不仅为开源社区提供了稳定可控的高性能模型,也在行业中树立了“小参数高性能”的技术样本。随着 APP 升级同步展开,从产业技术到大众应用,美团正形成一条贯穿创作工具链的完整生态。未来,随着更多功能的开放,LongCat 体系有望持续推动 AI 图像创作能力普及化与专业化双向发展。

© 版权声明

相关文章