终于有一款能把图里文字画对的 AI

大多数图像模型在密集文字、紧凑版面和多对象提示下都会翻车。ERNIE Image 正是针对这些硬骨头训练的——海报上的长段正文、漫画里的对话气泡、结构化多格构图、中英双语混排场景,它都能稳稳接住。

app screen

为什么创作者选择 ERNIE Image

别的模型力不从心的地方,正是它的主场

ERNIE Image 采用单流扩散 Transformer 架构,专门处理生成模型常见的薄弱环节:清晰可读的文字、严格的版面排布、多对象提示词遵从,以及中英双语指令。内置的轻量 Prompt Enhancer 会把简短输入扩写成结构化描述,你无需钻研 prompt 工程也能拿到可用结果。

Turbo 模式快速迭代

50 步的 SFT 主模型之外,另提供经蒸馏的 8 步 Turbo 版本。先用 Turbo 跑草稿,锁定方向后再切主模型出成片——不用换工具。

靠榜单说话,不只秀 demo

GENEval 0.8856、LongTextBench 0.9733,OneIG 中英文双榜均位列第一梯队。质量是公开可验证的,不是挑好的展示。

想到哪儿写到哪儿

内置 Prompt Enhancer 会把一句话想法扩展成详尽的结构化提示。你专注创意,模型接管 prompt 工程那一层。

整条流水线只在一个页面

生成、编辑、合成、放大、导出——整套视觉工作流都在同一个标签页里。不用来回切工具,也不用堆订阅。

替掉摄影和素材预算

几分钟内出品牌一致的海报、产品图、营销物料。创作产能上去,人力和版权开销不涨。

Apache 2.0,产出归你

模型权重以 Apache 2.0 开源,生成物商用权全部归你。广告、周边、印刷、转售、微调、本地部署——都没问题。

核心能力

专为那些能把其他图像模型卡死的场景而生

ERNIE Image 是一款 8B 单流 DiT 模型,搭配 Prompt Enhancer 和 Turbo 蒸馏版本。下面是这套架构真正擅长的事。

图内文字准确渲染

海报上的长段正文、信息图的标题、漫画里的对话气泡、UI 稿里的按钮标签——字形清晰可辨,不会像其他扩散模型那样糊成一团或者拼出乱码。LongTextBench 成绩 0.9733。

指令遵从到位

多对象、明确的空间关系、知识密集的长提示词,模型都会按你写的来,而不是退化成一张通用的"好看图"。GENEval 0.8856,领先 Qwen-Image,接近 FLUX.2。

结构化版面与多格排布

海报、漫画、故事板、UI 稿、信息图——模型会推理整个页面的版式和分格,而不只是主体和风格。支持分辨率包括 1024×1024、848×1264、1264×848、768×1376、1376×768 等。

中英双语同等可用

中文或英文提示词输出质量相当——OneIG-EN 0.5750,OneIG-ZH 0.5543。图内文字两种语言都能画对,一套流水线同时服务两个市场。

双版本:SFT 与 Turbo

50 步 SFT 主模型追求最高指令忠实度,用于最终出稿。ERNIE-Image-Turbo 通过 DMD + 强化学习蒸馏,8 步即可出可用预览,适合快速迭代。

开源权重,消费级显卡可跑

完整 8B 模型以 Apache 2.0 协议发布,单张 24GB 显卡即可本地运行。自托管、用自家品牌数据微调、直接接入生产管线——没有厂商锁定。

创意专业人士的信赖之选

听听真实用户如何改造工作流

Sarah Chen
数字艺术家

我主要画带对话气泡的漫画分镜,别的 AI 工具画出来的文字全是乱码。ERNIE Image 是第一款图内文字真能看的模型——每周省下 20 多小时。

Marcus Rodriguez
营销总监

以前带真实标题的活动海报得等代理公司两周,现在在公司内部一下午就能出中英双语两版。

Emily Watson
内容创作者

Turbo 模式彻底改了我的迭代方式——以前渲染一张的时间,现在能看完 30 个构图。方向定了再切主模型出成片。

David Kim
平面设计师

我试过十五款以上的文生图工具。版面重的活儿——海报、信息图、任何讲究排版和文字位置的场景——我只敢交给 ERNIE Image。

Lisa Thompson
社交媒体经理

12 个账号、两种语言、一个月一下午搞定。双语提示让我不再维护两套平行的创作管线——互动量大概翻了三倍。

James Wilson
创意总监

我们彻底砍掉了图库预算。每张图都是原创、品牌一致,而且图内真实文字是直接出在图里的——设计师不用再在 Photoshop 里补标题了。

Anna Martinez
自由插画师

客户改稿以前要拖好几天,现在在通话时就改完。我带着几十个已探索的方向进会——产能大概涨了 5 倍,跟客户的沟通也顺多了。

Robert Chang
品牌经理

50 多个 SKU 的版面一致性以前是全职工作。模型学会了我们的视觉规范,现在能按需吐出对齐一致的产品素材。

Sophie Laurent
艺术指导

以前提案 PPT 只能放占位图,因为真图得做好几周。现在每一页都是定制插图——客户以为我们背后有整个工作室。

Michael Brown
产品设计师

带真实界面文字的 UI 稿——按钮、标签、微文案——第一次出就对。我一天能迭代 50 多版,开发环节至少快了 4 倍。

Rachel Green
数字营销人

我们几乎完全靠 AI 生成的海报和轮播图,从 1 万粉涨到 10 万。关键是图里的文字真的看得清——这对社交传播就是全部了。

Kevin Park
UX 设计师

每个新项目都会挖出我没计划用上的新能力。精修细节、结构化多格版面、双语文案——它处理的复杂度足以让一个资深设计师认真对待。

常见问题

关于 ERNIE Image 你想知道的一切