
Satu Prompt — 5 Generator Baru: Putaran 2 Perbandingan AI
Satu Prompt — 5 Generator Baru: Putaran 2 Perbandingan AI
Kami menguji 5 model AI lagi dengan prompt yang sama. Bisakah pendatang baru bersaing dengan para pemimpin? Hasil mengejutkan di dalam.
Putaran 2: Kontestan Baru
Setelah perbandingan pertama kami di mana kami menguji FLUX, Ideogram, Stable Diffusion, Seedream, dan Nano Banana, kami menerima banyak sekali pertanyaan: "Bagaimana dengan Imagen 4?", "Sudah coba Recraft?", "Bagaimana dengan model-model baru dari China?"
Pertanyaan yang wajar. Dunia generasi AI bergerak cepat. Model terbaik hari ini mungkin jadi berita kemarin besok. Jadi kami mengambil 5 generator lagi — beberapa baru, beberapa underrated — dan melemparkan tiga prompt yang sama pada mereka.
Aturan yang sama: tanpa tweaking, tanpa optimasi, murni jujur. Satu teks — lima hasil. Mari kita lihat apa yang terjadi.
Kenalan dengan Line-up Baru
Sebelum menyelam ke hasil, mari kita perkenalkan peserta hari ini secara singkat.
Z-Image Turbo (Pruna AI)
Model yang dioptimalkan dari Pruna AI yang fokus pada kecepatan tanpa kehilangan kualitas. "Turbo" bukan hanya marketing — model ini benar-benar generate cepat sambil mempertahankan kualitas yang kompetitif. Dibangun dengan arsitektur yang mengutamakan efisiensi, dirancang untuk workflow volume tinggi di mana kecepatan penting. Tersedia via Replicate dengan harga yang ramah kantong.
Qwen-Image (Alibaba)
Dari keluarga Qwen (Tongyi Qianwen) milik Alibaba datang model vision-language ini. Bagian dari dorongan China ke generasi AI, Qwen-Image membawa kemampuan teknis yang kuat terutama dengan estetika Asia dan referensi budaya. Pendekatan menarik untuk pemahaman prompt dengan dukungan multibahasa yang built-in.
Recraft V3 (Recraft AI)
Iterasi ketiga Recraft fokus pada pekerjaan desain dan ilustrasi. Tidak seperti model yang berat ke fotorealistik, Recraft V3 unggul dalam grafis bergaya vektor, desain logo, dan ilustrasi bergaya. Versi 3 menambahkan dukungan fotorealisme yang lebih baik sambil mempertahankan kekuatan ilustratifnya. Seorang spesialis yang mencoba menjadi generalis.
Imagen 4 (Google)
Entri terbaru Google dalam perlombaan generasi gambar. Imagen 4 membawa riset DeepMind ke produksi, dengan penekanan pada keamanan, akurasi, dan kepatuhan prompt. Dukungan kuat dari infrastruktur dan riset Google berarti kualitas konsisten dan pembaruan reguler. Jawaban raksasa korporat untuk model open-source.
FLUX Schnell (Black Forest Labs)
Dari pencipta FLUX original datang Schnell (bahasa Jerman untuk "cepat"). Versi streamlined dari FLUX yang dioptimalkan untuk kecepatan — lebih sedikit diffusion steps, inference lebih cepat, biaya komputasi lebih rendah. Mengorbankan sedikit kualitas untuk kecepatan, tapi tetap mempertahankan DNA FLUX. Sempurna untuk iterasi dan preview.
Test #1: Prompt Sederhana
Prompt: A golden retriever puppy sitting in a field of sunflowers, golden hour lighting, photorealistic
Dimulai dengan prompt sederhana yang sama dari Putaran 1. Anak anjing di ladang bunga matahari. Harusnya mudah, kan?
Yang Kami Harapkan
Foto realistis dari anak anjing golden retriever di antara bunga matahari, cahaya golden hour yang hangat. Sederhana, jelas, tanpa trik.
Yang Perlu Diperhatikan
- Fotorealisme: kualitas foto sebenarnya atau jelas-jelas rendered
- Pencahayaan: golden hour sejati atau hanya "terang"
- Tekstur bulu: setan ada di detailnya
- Akurasi bunga matahari: skala dan struktur yang benar
Hasil

Z-Image Turbo menghasilkan hasil yang mengejutkan bersih. Fotorealisme bagus, pencahayaan lumayan. Tekstur bulu sedikit lebih lembut daripada model tingkat atas, tapi untuk model yang fokus pada kecepatan, kualitas yang mengesankan. Bunga matahari terlihat natural. Performa baseline yang solid.
Qwen-Image menciptakan gambar yang sangat polished dengan komposisi yang sangat baik. Keseimbangan warna yang menarik — sedikit lebih dingin dari golden hour tradisional tapi secara estetis menyenangkan. Detail work kuat. Model ini jelas "memahami" scene dengan baik.
Recraft V3 sedikit kesulitan di sini. Hasilnya condong sedikit ilustratif daripada fotorealistik — Anda bisa melihat DNA desainnya muncul. Tetap menyenangkan untuk dilihat, tapi tidak mencapai target "fotorealistik" sekuat kompetitor. Bunga mataharinya well-rendered.
Imagen 4 menghasilkan hasil yang sangat bergaya Google: bersih, aman, secara teknis benar. Pencahayaan excellent, tekstur bulu bagus, semuanya di tempatnya. Mungkin kurang "karakter" dibanding yang lain, tapi Anda tidak bisa menyalahkan eksekusi teknisnya. Inilah yang terlihat seperti "AI korporat" — reliable dan polished.
FLUX Schnell menunjukkan mengapa keluarga FLUX dihormati. Bahkan versi "cepat" mempertahankan kualitas yang kuat. Pencahayaan atmosfer yang bagus, depth of field yang baik, anak anjing terlihat natural. Optimasi kecepatan tampaknya tidak mengorbankan banyak. Keseimbangan yang mengesankan.
Test #2: Kompleksitas Menengah
Prompt: A weathered fisherman in his 60s mending a net on a wooden dock, early morning fog, fishing boats in the background, cinematic lighting, shallow depth of field
Sekarang kita tambahkan kompleksitas. Orang spesifik, atmosfer, storytelling lingkungan. Di sinilah model mulai menunjukkan kepribadiannya.
Yang Perlu Diperhatikan
- Wajah dan tangan: akurasi usia, kerutan, jari
- Atmosfer kabut: natural atau artificial
- Tekstur jala: pola berulang sulit untuk AI
- Depth of field: blur latar belakang yang tepat
- Nuansa sinematik: apakah terlihat seperti still film
Hasil
Z-Image Turbo menangani ini dengan cukup baik. Wajah terlihat tua dengan tepat, tangan acceptable (titik lemah untuk banyak model). Kabut ada tapi sedikit seragam. Jala disederhanakan tapi dapat dibaca. Secara keseluruhan hasil yang kompeten yang tidak akan menang penghargaan tapi menyelesaikan pekerjaan.
Qwen-Image mengesankan di sini. Detail wajah sangat baik dengan kerutan yang terlihat natural dan kulit yang weathered. Kabut atmosferik yang bagus, color grading yang nice. Jala ditangani lebih baik daripada kebanyakan kompetitor. Depth of field bekerja dengan baik. Vibe sinematik yang kuat. Model ini tampaknya unggul dalam subjek manusia.
Recraft V3 lagi-lagi menunjukkan akar ilustrasinya. Hasilnya lebih concept-art daripada fotografi. Indah dengan caranya sendiri, tapi menyimpang dari "fotografi sinematik" ke arah "ilustrasi lukisan." Jika Anda ingin storyboard atau concept piece, sempurna. Untuk fotorealisme, belum sampai.
Imagen 4 memberikan eksekusi teknis yang solid. Penuaan wajah yang bagus, kabut yang tepat, depth of field yang acceptable. Scene terasa agak "dipentaskan" — sangat bersih, sangat terkontrol. Realisme yang kurang kasar, lebih estetika "iklan TV." Kualitas tinggi, karakter moderat.
FLUX Schnell menciptakan scene yang atmosferik dan moody. Lighting work yang bagus, detail wajah yang baik, kabut terasa natural. Jala disederhanakan tapi komposisi keseluruhan kuat. Model ini secara konsisten memukul di atas kategorisasi "cepat"-nya.
Test #3: Prompt Kompleks
Prompt: A tiny astronaut sitting on the edge of a coffee cup, looking up at a galaxy swirling inside the cup like cream in coffee, miniature tilt-shift photography style, dramatic lighting from above, hyperdetailed, 4K
Test tersulit. Permainan skala, fisika yang mustahil, gaya fotografi spesifik. Ini memisahkan pemahaman konsep dari pencocokan kata kunci.
Yang Perlu Diperhatikan
- Skala: apakah astronotnya benar-benar miniatur atau hanya kecil
- Efek tilt-shift: blur tepi yang karakteristik
- Galaksi dalam kopi: apakah menggabungkan konsep atau menciptakan kekacauan
- Pencahayaan: overhead dramatis atau hanya "terang dari atas"
- Koherensi keseluruhan: foto tunggal atau komposit yang jelas
Hasil
Z-Image Turbo memberikan upaya yang jujur. Astronot ada di sana, cangkir ada di sana, beberapa pusaran di kopi. Tapi konsepnya tidak sepenuhnya menyatu — terasa lebih seperti elemen terpisah yang ditempatkan bersama. Tilt-shift minimal. Untuk model kecepatan yang mengatasi prompt kompleks, upaya yang respectable tapi tidak menghasilkan wow.
Qwen-Image menciptakan sesuatu yang menarik. Scale work yang bagus dengan astronot kecil, efek galaksi yang nice di kopi. Pencahayaan dramatis. Namun, tilt-shift subtle hingga tidak ada. Model jelas memahami konsep dan mengeksekusi dengan baik pada sebagian besar elemen. Interpretasi yang kuat jika bukan eksekusi yang sempurna.
Recraft V3 pergi penuh interpretasi artistik. Menciptakan scene yang indah dan bergaya yang lebih "concept art" daripada "fotografi tilt-shift." Galaksi terlihat menakjubkan, astronot well-rendered, tapi jelas ilustrasi bukan fotografi. Jika Anda ingin seni, Anda mendapatkannya. Jika Anda ingin fotorealisme, ini bukan itu.
Imagen 4 menangani ini secara metodis. Semua elemen ada: astronot kecil, kopi galaksi, pencahayaan overhead. Eksekusi bersih dan aman. Hasilnya secara teknis benar tapi kurang "sihir" — terasa dikonstruksi daripada ditangkap. Pendekatan safety-first Google terlihat di sini.
FLUX Schnell mengejutkan kami. Berhasil menangkap konsep dengan baik dengan scale work yang bagus, integrasi galaksi yang nice, dan upaya efek tilt-shift. Pencahayaan dramatis, komposisi thoughtful. Untuk model "cepat", ia memukul jauh di atas kelas beratnya pada prompt kompleks.
Observasi Umum: Putaran 2
Setelah menguji lima model ini, beberapa pola muncul dengan jelas.
Kecepatan vs Kualitas Tidak Selalu Trade-off
Baik Z-Image Turbo dan FLUX Schnell dioptimalkan untuk kecepatan, namun keduanya memberikan kualitas yang bersaing dengan model yang lebih lambat. Kategori "cepat" telah matang secara signifikan. Anda tidak harus selalu memilih antara kecepatan dan kualitas lagi.
Perbedaan Regional dalam Estetika
Qwen-Image (China) dan Imagen 4 (Amerika) menunjukkan perbedaan halus tapi nyata dalam color grading, preferensi komposisi, dan penekanan detail. Latar belakang budaya data training dan pilihan developer membentuk output. Tidak ada yang "lebih baik" — hanya berbeda.
Spesialis Membutuhkan Use Case Spesifik
Recraft V3 terus mencoba menjadi fotorealistik ketika hatinya jelas ada di ilustrasi dan desain. Ini bukan model "buruk" — ini spesialis yang diminta menjadi generalis. Gunakan untuk apa yang dia kuasai (grafis vektor, ilustrasi bergaya) dan dia akan bersinar.
Vibe Korporat vs Open-Source
Imagen 4 (Google) memiliki nuansa polished, aman, korporat. Secara teknis sangat baik tapi secara kreatif konservatif. Model yang adjacent dengan open-source seperti FLUX Schnell mengambil risiko kreatif lebih banyak. Kedua pendekatan valid untuk use case yang berbeda.
Pemahaman Prompt Semakin Baik
Kelima model memahami prompt kompleks lebih baik daripada model dari bahkan enam bulan lalu. Konsep "astronot kecil di cangkir kopi" yang akan membingungkan model lama sekarang ditangani dengan kompeten oleh kebanyakan. Industri ini matang dengan cepat.
Perbandingan: Putaran 1 vs Putaran 2
Bagaimana kontestan baru kita dibandingkan dengan line-up Putaran 1?
Fotorealisme Terbaik:
- Putaran 1: Ideogram v3 Turbo
- Putaran 2: Qwen-Image
- Keunggulan: Seri — keduanya unggul di aspek yang berbeda
Atmosfer/Sinematografi Terbaik:
- Putaran 1: FLUX 2 Max
- Putaran 2: FLUX Schnell
- Keunggulan: Putaran 1 (Max masih lebih baik dari Schnell)
Keseimbangan Kecepatan/Kualitas Terbaik:
- Putaran 1: Seedream 4.5
- Putaran 2: FLUX Schnell
- Keunggulan: Putaran 2 (Schnell mengesankan cepat)
Terbaik untuk Prompt Kompleks:
- Putaran 1: FLUX 2 Max
- Putaran 2: Qwen-Image
- Keunggulan: Putaran 1 (Max menangani kompleksitas lebih baik)
Paling Reliable/Konsisten:
- Putaran 1: Stable Diffusion 3.5
- Putaran 2: Imagen 4
- Keunggulan: Putaran 1 (SD 3.5 adalah pilihan reliable yang membosankan)
Cheat Sheet: Siapa untuk Apa
| Tugas | Pilihan Terbaik dari Putaran 2 | Mengapa |
|---|---|---|
| Workflow volume tinggi | Z-Image Turbo | Generasi cepat, kualitas lumayan, ramah budget |
| Potret manusia, wajah | Qwen-Image | Detail wajah dan tekstur kulit yang sangat baik |
| Desain, pekerjaan ilustrasi | Recraft V3 | Dibangun untuk grafis bergaya, bukan fotorealisme |
| Konten aman, korporat | Imagen 4 | Kualitas dengan dukungan Google, fokus keamanan |
| Iterasi cepat, preview | FLUX Schnell | Cepat seperti Turbo, kualitas seperti FLUX |
| Komposisi kompleks | Qwen-Image | Pemahaman prompt yang kuat |
Tips Praktis: Putaran 1 & 2 Digabung
Jika Anda sudah membaca kedua artikel perbandingan, inilah yang perlu Anda ketahui:
Untuk Kualitas Maksimal: Gunakan FLUX 2 Max (Putaran 1) atau Ideogram v3 (Putaran 1) ketika kualitas adalah yang utama dan kecepatan tidak masalah.
Untuk Kecepatan: FLUX Schnell (Putaran 2) atau Z-Image Turbo (Putaran 2) ketika Anda perlu iterasi cepat atau memiliki keterbatasan budget.
Untuk Potret: Qwen-Image (Putaran 2) atau Ideogram v3 (Putaran 1) keduanya unggul dalam wajah manusia dan tekstur kulit.
Untuk Reliabilitas: Stable Diffusion 3.5 (Putaran 1) atau Imagen 4 (Putaran 2) ketika Anda perlu hasil yang dapat diprediksi dan konsisten.
Untuk Eksperimen: Coba semuanya via Replicate. Dengan $0.02-0.05 per gambar, menguji model yang berbeda lebih murah daripada kopi.
Kuasai Fundamental: Memahami pose, emosi, pencahayaan, dan komposisi lebih penting daripada model mana yang Anda gunakan. Prompt yang bagus pada model "lebih buruk" mengalahkan prompt buruk pada model "terbaik". Cek panduan kami untuk 500 Poses dan 132 Emotions untuk level up skill prompting Anda.
Kesimpulannya
Putaran 2 menunjukkan lanskap generasi AI sehat dan kompetitif. Tidak ada model tunggal yang mendominasi segalanya. Model yang dioptimalkan kecepatan semakin cukup baik untuk menantang yang fokus kualitas. Pemain regional (Qwen dari China) membawa perspektif yang berbeda.
Model terbaik adalah yang sesuai dengan use case spesifik Anda, budget, dan workflow. Jangan ikuti hype — uji sendiri. Dengan harga Replicate, tidak ada alasan untuk tidak bereksperimen.
Dan ingat: semua model ini akan ketinggalan zaman dalam enam bulan. Teknologi bergerak secepat itu. Tetap penasaran, terus menguji, dan jangan terlalu terikat pada satu platform.
Ingin membuat gambar AI yang lebih baik terlepas dari model mana yang Anda gunakan? Kuasai fundamental dengan Panduan 500 Poses dan Panduan 132 Emotions kami — skill universal yang bekerja pada generator apa pun.
Siap membuat konten AI yang lebih baik?
Dapatkan panduan profesional dengan foto referensi — berhenti menebak, mulai berkreasi.
Lihat panduan →
