Metni Gerçekten Doğru Çıkaran Görseller Oluşturun
Çoğu görsel modeli yoğun metin, sıkı düzenler ve çok nesneli komutlarda başarısız olur. ERNIE Image tam da bu durumlar için eğitilmiştir — posterlerdeki uzun metinler, çizgi romanlardaki konuşma balonları, yapılandırılmış çok panelli kompozisyonlar ve iki dilli Çince/İngilizce sahneler.

Yaratıcılar Neden ERNIE Image'ı Tercih Ediyor
Diğer görsel modellerinin zayıf olduğu yerlerde güçlü
ERNIE Image, genellikle üretken modelleri bozan durumları işlemek için eğitilmiş tek akışlı bir Difüzyon Transformatörüdür: okunabilir metin, katı düzenler, çok nesneli komutlar ve iki dilli talimatlar. Hafif bir Komut İyileştirici, kısa girdileri yapılandırılmış açıklamalara genişletir, böylece kullanılabilir çıktı almak için komut mühendisliği yapmanıza gerek kalmaz.
Turbo Modu ile Hızlı İterasyon
Damıtılmış 8 adımlık bir Turbo varyantı, 50 adımlık SFT modeliyle birlikte gelir. Taslak hızında çizim yapın, ardından ana kareyi tam kalitede render edin — araç değiştirmeye gerek yok.
Sadece Demolar Değil, Kıyaslamalar
GENEval 0.8856, LongTextBench 0.9733, hem İngilizce hem de Çince'de üst düzey OneIG puanları. Kalite bağımsız olarak doğrulanmıştır, seçici değildir.
Düşündüğünüz Gibi Yazın
Yerleşik Komut İyileştirici, tek satırlık bir fikri ayrıntılı, yapılandırılmış bir komuta dönüştürür. Siz yaratıcı modda kalın; model komut mühendisliği katmanını halleder.
Tüm İş Akışı için Tek Yüzey
Oluşturun, düzenleyin, birleştirin, ölçeklendirin, dışa aktarın — görsel iş akışınız tek bir sekme içinde kalır. Araç değiştirme yok, yığılmış abonelikler yok.
Çekim ve Stok Bütçelerini Değiştirin
Dakikalar içinde marka ile uyumlu posterler, ürün kareleri ve kampanya varlıkları. Kadro veya lisans harcamasını ölçeklendirmeden yaratıcı hacmi ölçeklendirin.
Apache 2.0 — Çıktı Size Ait
Ağırlıklar Apache 2.0 altında açıktır ve oluşturduğunuz her şey ticari olarak sizindir. Reklamlar, ürünler, baskı, yeniden satış, ince ayar, kendi sunucunuzda barındırma — hepsi masada.
Temel Yetenekler
Diğer görsel modellerini bozan durumlar için oluşturulmuştur
ERNIE Image, bir Komut İyileştirici ve bir Turbo varyantıyla eşleştirilmiş 8B tek akışlı bir DiT'tir. İşte mimarinin gerçekten iyi olduğu şeyler.
Doğru Görsel İçi Metin Render Etme
Posterlerdeki uzun metinler, infografiklerdeki başlıklar, çizgi romanlardaki konuşma balonları, UI maketlerindeki etiketler. Diğer difüzyon modellerinin glifleri bulandırdığı veya harfleri halüsinasyon gördüğü yerlerde karakterler temiz render edilir — LongTextBench 0.9733.
Komuta Sadık Kompozisyon
Birden fazla nesne, belirli mekansal ilişkiler, bilgi yoğun komutlar. Model, genel bir 'güzel resim'e çökmek yerine gerçekten tanımladığınız şeyi takip eder — GENEval 0.8856, Qwen-Image'ın önünde ve FLUX.2 ile karşılaştırılabilir.
Yapılandırılmış Düzenler ve Çok Panel
Posterler, çizgi romanlar, storyboard'lar, UI kareleri, infografikler. ERNIE Image, sayfa düzeni ve panel kompozisyonu hakkında akıl yürütür — sadece konu ve stil değil. Desteklenen çözünürlükler arasında 1024×1024, 848×1264, 1264×848, 768×1376 ve 1376×768 bulunur.
İki Dilli Çince ve İngilizce
Her iki dildeki komutlar karşılaştırılabilir kalitede sonuçlar döndürür — OneIG-EN 0.5750 ve OneIG-ZH 0.5543. Görsel içi metin her iki yazı sistemini de işler, böylece aynı kampanyayı iki pazarda tek bir iş akışından gönderebilirsiniz.
İki Varyant: SFT ve Turbo
50 adımlık SFT modeli, son kareler için komut sadakatini maksimize eder. ERNIE-Image-Turbo — DMD ve güçlendirmeli öğrenme ile damıtılmış — hızlı iterasyon için saniyeler içinde 8 adımlık önizlemeler döndürür.
Açık Ağırlıklar, Tüketici GPU'su Dostu
Tam 8B kontrol noktası Apache 2.0 altında yayınlanır ve tek bir 24GB GPU üzerinde çalışır. Kendi sunucunuzda barındırın, marka verilerinizde ince ayar yapın veya doğrudan bir üretim iş akışına entegre edin — satıcı kilidi yok.
Yaratıcı Profesyoneller Tarafından Güveniliyor
İş akışlarını dönüştüren yaratıcılardan gerçek hikayeler
Çoğunlukla konuşma balonlu çizgi roman panelleri üzerinde çalışıyorum, diğer tüm yapay zeka araçları bunu mahvetti. ERNIE Image, görsel içindeki metnin gerçekten render edildiği ilk araç — haftada 20+ saat geri kazandım.
Gerçek başlıklı kampanya posterleri ajansımızdan haftalarca sonra geliyordu. Şimdi onları hem İngilizce hem de Çince olarak bir öğleden sonra şirket içinde oluşturuyorum.
Turbo modu iterasyon şeklimi değiştirdi — eskiden bir tane render etmek için gereken sürede 30 kompozisyonu önizleyebiliyorum. Sonra son kareyi tam SFT modelinde kilitlerim.
On beşten fazla metinden görsele araç test ettim. ERNIE Image, düzen ağırlıklı işler için güvendiğim tek araç — posterler, infografikler, aralık ve metnin gerçekten önemli olduğu her şey.
On iki hesap, iki dil, ayda bir öğleden sonra. İki dilli komut, artık paralel yaratıcı iş akışlarını sürdürmediğim anlamına geliyor — etkileşim kabaca üç katına çıktı.
Stok fotoğraf kalemini tamamen emekliye ayırdık. Her varlık orijinal, marka ile uyumlu ve içinde gerçek metin pişirilmiş olarak gelir — böylece tasarım ekibi Photoshop'ta başlıkları yeniden retüşlamayı bırakır.
Eskiden günleri yiyen müşteri revizyonları artık görüşme sırasında gerçekleşiyor. Düzinelerce keşfedilmiş yönle giriyorum — çıktı kabaca 5 kat arttı ve müşteri görüşmeleri çok daha iyi.
50+ SKU'da düzen tutarlılığını korumak eskiden tam zamanlı bir işti. Model stil kılavuzumuzu öğrendi ve şimdi talep üzerine mükemmel şekilde hizalanmış ürün varlıkları gönderiyor.
Sunum destelerinin gerçekleri haftalar aldığı için yer tutucu görsellere dayanırdı. Şimdi her slayt özel görsellerle geliyor — ve müşteri arkamızda tam bir stüdyo olduğunu düşünüyor.
Gerçek arayüz metniyle UI maketleri — düğmeler, etiketler, mikro metinler — ilk denemede doğru çıktı. Günde 50+ konsepti döngüye sokuyorum; geliştirme döngüsü kolayca dört katına çıktı.
Neredeyse tamamen yapay zeka tarafından oluşturulan posterler ve atlıkarıncalar üzerinde 10 bin'den 100 bin takipçiye büyüdük. Fark, görseldeki metnin gerçekten okunması — sosyal medya için tüm oyun bu.
Her proje, kullanmayı planlamadığım başka bir yeteneği ortaya çıkarıyor. İnce retüşleme, yapılandırılmış çok panelli düzenler, iki dilli metin — kıdemli bir tasarımcının ciddiye alacağı türden karmaşıklığı ele alır.
Sıkça Sorulan Sorular
ERNIE Image hakkında bilmeniz gereken her şey