Firefly, keluarga model AI Adobe, tidak memiliki reputasi yang baik di kalangan pengembang.
Model grafis Firefly khususnya telah dianggap lambat dan cacat dibandingkan dengan Midjourney, DALL-E 3 OpenAI, dan pesaing lainnya, yang memiliki kecenderungan memutarbalikkan kaki dan bentuk serta melewatkan nuansa yang muncul. Namun Adobe sedang mencoba memperbaikinya dengan versi ketiganya, Firefly Image 3, yang dirilis minggu ini di konferensi industri Max London.
Model ini, sekarang tersedia di Photoshop (beta) dan aplikasi web Adobe Firefly, menghasilkan gambar yang lebih “nyata” daripada aslinya (Gambar 2) dan sebelumnya (Gambar 1) karena kemampuan pemahaman jangka panjang, kompleks dan peristiwa yang berhubungan dengan peristiwa. serta kemampuan pencahayaan dan produksi suara yang baik. Itu harus secara akurat menampilkan hal-hal seperti tipografi, ikonografi, gambar raster, dan seni garis, kata Adobe, dan “mampu” menampilkan banyak orang dan orang-orang dengan “detail” dan “berbagai jenis pemikiran dan kata-kata.”
Untuk apa nilainya, dalam eksperimen singkat saya yang tidak ilmiah, Gambar 3 dia melakukannya terlihat seperti langkah dari Gambar 2.
Saya sendiri belum bisa menguji Gambar 3. Namun Adobe PR memposting beberapa keluaran dari model tersebut, dan saya dapat menjalankannya melalui Gambar 2 online untuk mendapatkan beberapa contoh yang membandingkan keluaran dengan Gambar 3. (Perhatikan bahwa keluaran Gambar 3 akan dipilih.)
Perhatikan pencahayaan pada subjek dari Gambar 3 dibandingkan dengan yang di bawah ini, dari Gambar 2:
Output Gambar 3 terlihat lebih detail dan hidup di mata saya, dengan bayangan dan kontras yang tidak ada pada Model 2.
Berikut beberapa gambar yang menunjukkan pengertian gambar 3 pada permainan :
Perhatikan bahwa Gambar 2 lebih penting daripada keluaran pada Gambar 3 dalam hal jumlah detail – dan kejelasan. Terdapat permasalahan pada kepala pada baju model pada Gambar 3 (sekitar pinggang), namun bentuknya lebih rumit dibandingkan kepala pada Gambar 2.
Beberapa perubahan pada Gambar 3 tidak diragukan lagi dapat dikaitkan dengan rangkaian pelatihan yang besar dan bervariasi.
Seperti Gambar 2 dan Gambar 1, Gambar 3 diajarkan untuk mengangkat Adobe Stock, perpustakaan Adobe bebas royalti gratis, dengan lisensi publik yang hak ciptanya telah habis masa berlakunya. Adobe Stock terus berkembang, begitu pula data yang tersedia untuk pelatihan.
Dalam upaya untuk mencegah tuntutan hukum dan memposisikan dirinya sebagai alternatif yang lebih “tradisional” terhadap vendor AI yang melatih gambar secara sewenang-wenang (misalnya OpenAI, Midjourney), Adobe memiliki program untuk membayar kontributor Adobe Stock untuk kumpulan data pelatihan. (Namun, kami perhatikan bahwa suara program ini bersifat anonim.) Sebaliknya, Adobe juga melatih model Firefly pada gambar yang dihasilkan AI, yang oleh sebagian orang dianggap sebagai cara untuk menghapus data.
Laporan terbaru dari Bloomberg menunjukkan bahwa gambar yang dihasilkan AI di Adobe Stock tidak termasuk dalam kursus pembuatan gambar Firefly. Adobe membela praktik tersebut, dengan mengatakan bahwa gambar yang dihasilkan AI hanya merupakan sebagian kecil dari apa yang dilatih untuk memastikan gambar tersebut tidak menampilkan simbol atau karakter yang dapat dikenali atau nama artis.
Tentu saja, tidak ada jenis yang berbeda, berdasarkan pembelajaran yang “tepat” atau filter dengan perlindungan lain yang menjamin tidak ada kesalahan – lihat pengguna orang mengipasi burung dan Gambar 2. Ujian sebenarnya dari Gambar 3 akan muncul ketika masyarakat sudah bisa menguasainya.
Inovasi didukung oleh AI
Gambar 3 memberikan beberapa kemampuan baru di Photoshop selain menambahkan teks ke gambar.
“Mesin” baru pada Gambar 3, bersama dengan transformator otomatis baru, memungkinkan seniman menciptakan banyak warna, latar belakang, dan tema. Mereka dimasukkan ke dalam Gambar Referensi, sebuah proses yang memungkinkan pengguna untuk menempatkan contoh pada gambar yang warna atau nadanya ingin dicocokkan dengan kreasi mereka di masa depan.
Tiga alat desain baru – Buat Dasar, Buat Kesamaan, dan Tambahan Lainnya – tambahkan Gambar 3 untuk membuat perubahan mendetail pada gambar. Generate Background (cukup jelas) menggantikan latar belakang dengan desain yang sesuai dengan gambar yang ada, sedangkan Generate Same memberikan kontras untuk bagian gambar yang dipilih (misalnya orang atau objek). Sedangkan untuk Detail, ini “menyempurnakan” gambar agar lebih jelas dan jelas.
Jika ini terdengar familiar, itu karena mereka sudah berada dalam versi beta di aplikasi Firefly selama sebulan (dan Midjourney lebih lama dari itu). Ini menunjukkan paparan mereka terhadap Photoshop – dalam versi beta.
Sedangkan untuk aplikasi web, Adobe tidak mengabaikan pendekatan alternatif terhadap alat AI-nya.
Bertepatan dengan rilis Gambar 3, aplikasi web Firefly mendapatkan Referensi Struktur dan Referensi Gaya, yang diposisikan Adobe sebagai cara baru untuk meningkatkan teknologi. (Semua ini diumumkan pada bulan Maret, namun sekarang tersedia secara luas.) Dengan Referensi Struktur, pengguna dapat membuat gambar baru yang sesuai dengan “struktur” gambar – misalnya, melihat bagian depan mobil balap. Referensi Gaya pada dasarnya adalah mentransfer gaya dengan nama lain, mempertahankan konten gambar (seperti gajah di Safari Afrika) sambil meniru gaya (seperti gambar pensil) dari gambar yang diinginkan.
Berikut adalah Referensi Struktur yang sedang beraksi:
Dan Referensi Gaya:
Saya bertanya kepada Adobe apakah, dengan semua perubahan tersebut, harga versi Firefly akan berubah. Saat ini, paket termurah Firefly adalah $4,99 per bulan – mengalahkan pesaing seperti Midjourney ($10 per bulan) dan OpenAI (yang membuka DALL-E 3 di belakang langganan ChatGPT Plus $20 per bulan).
Adobe mengatakan sahamnya saat ini akan tetap berlaku untuk saat ini, begitu pula dengan strategi pembiayaan utangnya. Ia juga mengatakan bahwa kebijakan kompensasinya, yang menetapkan bahwa Adobe akan membayar royalti terkait layanan yang dibuat di Firefly, tidak akan berubah, begitu pula pendekatannya terhadap konten yang dihasilkan AI. Informasi Konten – metadata yang mengidentifikasi konten yang dihasilkan AI – akan terus dilampirkan secara otomatis ke semua generasi gambar Firefly online dan di Photoshop, baik dibuat dari awal atau sedikit dimodifikasi menggunakan alat kreatif.