Buat Video dari Teks dengan Sora dari OpenAI!

Apa Itu Sora?

OpenAI, pengembang teknologi chatbot ChatGPT, kini melebarkan sayap ke ranah video. Mereka memperkenalkan Sora, sebuah model AI yang dapat mengubah kalimat deskriptif menjadi video definisi tinggi. Serupa dengan DALL-E (pembuat gambar dari teks), Sora memungkinkan pengguna mengetikkan adegan yang diinginkan dan secara otomatis menghasilkan video klip. Kemampuannya semakin mencengangkan karena Sora juga bisa:

  • Menciptakan video dari gambar statis.
  • Memperpanjang video yang ada.
  • Mengisi bagian yang hilang dalam video.

Teknologi ini tentu menggembirakan para penggemar AI, namun menimbulkan kekhawatiran serius soal penyebaran misinformasi. Dengan semakin maraknya kejahatan digital di seluruh dunia, video rekayasa (deepfake) buatan AI dikhawatirkan dapat dimanipulasi untuk kepentingan tertentu. Data dari Clarity, perusahaan pembelajaran mesin, menunjukkan peningkatan 900% dalam pembuatan deepfake selama setahun terakhir.

Sora menambah deretan kompetitor OpenAI di bidang pembuat video AI, seperti Lumiere dari Meta dan Stable Video Diffusion dari Stability AI. Amazon pun tidak ketinggalan dengan “Create with Alexa”, yang khusus menghasilkan konten animasi anak-anak berdasarkan perintah verbal.

Bagaimana Cara Kerjanya?

Untuk saat ini, Sora hanya bisa menghasilkan video dengan durasi maksimal satu menit. OpenAI, yang didukung oleh Microsoft, memiliki tujuan jangka panjang untuk menghubungkan berbagai modalitas: teks, gambar, dan video. Dengan demikian, mereka menawarkan rangkaian model AI yang lebih luas dan kompleks.

Meski belum tersedia untuk umum, OpenAI telah memberikan akses terbatas kepada tim “red teamers” untuk menguji kerentanan Sora terhadap misinformasi dan bias. Saat ini, OpenAI hanya menampilkan 10 sampel video di situs web mereka, sementara dokumen teknisnya akan dirilis menyusul.

OpenAI juga sedang mengembangkan “detection classifier” untuk mengidentifikasi video buatan Sora. Mereka juga berencana menyertakan metadata khusus dalam output video untuk memudahkan identifikasi konten yang dihasilkan AI. Hal ini serupa dengan upaya Meta untuk menggunakan metadata guna mengenali gambar yang dibuat AI selama pemilihan umum nanti.

Sora yang mengandalkan model difusi dan arsitektur Transformer (diperkenalkan Google tahun 2017), dipandang sebagai pondasi bagi model AI yang dapat memahami dan “meniru” dunia nyata. Namun, kemunculannya juga memicu diskusi penting tentang etika pengembangan AI dan tanggung jawab dalam mencegah penyalahgunaan teknologi.

Baca juga: Wow! AI Amazon Bisa Berbicara Seperti Manusia!