Alat produksi video OpenAI, Sora, mengejutkan komunitas AI pada bulan Februari dengan video yang mengalir dan realistis yang tampak lebih unggul dari para pesaingnya. Namun penampilan pertama yang diawasi dengan ketat banyak ditinggalkan – sebagian besar diisi oleh pembuat film yang diberi akses untuk membuat film pendek menggunakan Sora.
Shy Kids adalah tim kreatif digital yang berbasis di Toronto yang dipilih oleh OpenAI sebagai salah satu dari sedikit tim yang membuat film pendek untuk mempromosikan OpenAI, meskipun mereka diberi lebih banyak hak untuk membuat “tema luar angkasa”. Dalam sebuah wawancara dengan publikasi media visual fxguide, seniman pasca produksi Patrick Cederberg menggambarkan “menggunakan Sora” sebagai bagian dari karyanya.
Mungkin hal yang paling penting bagi banyak orang adalah ini: Meskipun catatan ulasan singkat OpenAI membuat pembaca berpikir bahwa ini berasal dari Sora, kenyataannya ini adalah produksi yang sangat profesional, penuh dengan penceritaan, pengeditan, koreksi warna, dan tugas pengiriman yang solid. seperti rotoskopi dan VFX. Sama seperti Apple yang mengatakan “bidik di iPhone” tetapi tidak menampilkan pengaturan studio, pencahayaan teknis, dan pengerjaan warna setelahnya, postingan Sora hanya membahas tentang apa yang dapat dilakukan orang, bukan bagaimana mereka melakukannya.
Wawancara Cederberg menarik dan non-teknis, jadi jika Anda tertarik, kunjungi fxguide dan bacalah. Namun berikut beberapa fakta menarik tentang penggunaan Sora yang memberi tahu kita bahwa, meskipun mengejutkan, model tersebut mungkin tidak sejauh yang kita kira.
Pengendalian masih menjadi hal yang paling penting dan sulit saat ini. … Hal terdekat yang kami dapatkan hanyalah menjadi pengeras suara dalam motivasi kami. Menentukan pakaian karakter, serta warna balon, adalah cara kami karena pengambilan gambar / generasi ke generasi, tidak ada format tetap untuk mengontrol konsistensi.
Dengan kata lain, hal-hal yang mudah dalam membuat film tradisional, seperti pemilihan warna pakaian seseorang, penggunaan teknik dan pencahayaan modern, karena setiap pengambilan gambar dibuat secara independen satu sama lain. Hal ini jelas bisa berubah, namun saat ini sangat sulit.
Keluaran Sora juga harus diperiksa untuk elemen yang tidak penting: Cederberg menjelaskan bagaimana model menciptakan wajah pada balon yang ada di kepala karakter utama, atau tali yang digantung di depan. Ini harus dihapus dari postingan, buang-buang waktu lagi, jika mereka tidak dapat menemukan informasi untuk mengecualikan mereka.
Pengaturan waktu dan pergerakan karakter atau kamera yang tepat sebenarnya tidak memungkinkan: “Ada kontrol temporal di mana ini terjadi pada generasi nyata, tetapi tidak akurat … ini semacam pengambilan gambar dalam kegelapan,” dia dikatakan. Cederberg.
Misalnya, ketepatan waktu sebagai gelombang adalah proses konseptual yang digerakkan oleh pikiran, tidak seperti animasi. Dan bidikan seperti panci di atas tubuh fotografer mungkin menunjukkan atau tidak menunjukkan apa yang diinginkan pembuat film – jadi tim dalam hal ini memotret dari potret dan menggeser tiang. Animasi yang dihasilkan seringkali melambat tanpa alasan.
Sebaliknya, penggunaan bahasa sehari-hari dalam pembuatan film, seperti “kontrol tangan kanan” atau “pembakaran” tidak konsisten, kata Cederberg, yang menurut tim sangat mengejutkan.
“Para peneliti, sebelum bertemu dengan seniman untuk memainkan instrumen tersebut, tidak berpikir seperti pembuat film,” ujarnya.
Hasilnya, tim melakukan banyak generasi, masing-masing berlangsung selama 10 hingga 20 detik, dan pada akhirnya hanya menggunakan sedikit. Cederberg memperkirakan rasionya adalah 300:1 – tetapi tentu saja kita semua akan terkejut dengan rasio tunas biasa.
Tim membuat sedikit video di balik layar yang menjelaskan beberapa pengalaman mereka, jika Anda penasaran. Seperti kebanyakan hal seputar AI, ulasan yang ada semuanya merupakan kritik terhadap apa yang telah dilakukan – meskipun tidak seheboh AI berbantuan AI yang kita lihat baru-baru ini.
Masalah menarik terakhir berkaitan dengan hak cipta: Jika Anda meminta Sora memberi Anda film “Star Wars”, dia akan mengatakan tidak. Dan jika Anda mencoba bergaul dengan “pria dengan pedang laser di pesawat ruang angkasa retro-futuristik”, ia akan menolaknya lagi, karena ia mengenali apa yang Anda coba lakukan. Dia juga menolak melakukan “pemotretan tipe Aronofsky” atau “zoom Hitchcock”.
Di sisi lain, ini sangat masuk akal. Namun hal ini menimbulkan pertanyaan: Jika Sora mengetahui apa ini, apakah itu berarti model tersebut dilatih tentang kontennya, apakah lebih baik untuk menyadari bahwa konten tersebut rusak? OpenAI, yang menyimpan kartu pelatihannya di dekat rompi – sampai tidak berguna Wawancara dengan CTO Mira Murati dan Joanna Stern – hampir tidak pernah memberitahu kami.
Adapun Sora dan penggunaannya dalam pembuatan film, jelas merupakan alat yang ampuh dan berguna, namun posisinya adalah “tidak membuat film dari kain utuh”. Namun. Seperti yang pernah dikatakan salah satu penjahat, “itu akan terjadi nanti.”