Tuntutan hak cipta Steady Diffusion bisa menjadi gempa hukum bagi AI

Gambar dihasilkan oleh Steady Diffusion dengan perintah “Mickey Mouse in entrance of a McDonalds signal.”

Timothy B. Lee / Difusi Stabil

Perangkat lunak AI Steady Diffusion memiliki kemampuan luar biasa untuk mengubah teks menjadi gambar. Ketika saya meminta perangkat lunak untuk menggambar “Mickey Mouse di depan tanda McDonald’s”, misalnya, itu menghasilkan gambar yang Anda lihat di atas.

Difusi Stabil dapat melakukan ini karena dilatih pada ratusan juta contoh gambar yang diambil dari seluruh internet. Beberapa dari gambar ini ada di area publik atau telah diterbitkan di bawah lisensi permisif seperti Inventive Commons. Banyak lainnya tidak—dan seniman serta fotografer dunia tidak senang akan hal itu.

Pada bulan Januari, tiga seniman visible mengajukan gugatan hak cipta class motion terhadap Stability AI, startup yang menciptakan Steady Diffusion. Pada bulan Februari, raksasa lisensi gambar Getty mengajukan gugatannya sendiri.

“Stability AI telah menyalin lebih dari 12 juta foto dari koleksi Getty Photographs, beserta keterangan dan metadata terkait, tanpa izin atau kompensasi dari Getty Photographs,” tulis Getty dalam gugatannya.

Pakar hukum memberi tahu saya bahwa ini adalah perairan hukum yang belum dipetakan.

“Saya lebih gelisah daripada sebelumnya tentang apakah pelatihan adalah penggunaan yang adil dalam kasus di mana AI menghasilkan output yang dapat bersaing dengan enter yang mereka latih,” kata sarjana hukum Cornell James Grimmelmann kepada saya.

AI generatif adalah teknologi baru yang pengadilan tidak pernah memutuskan implikasi hak ciptanya. Ada beberapa argumen kuat bahwa doktrin penggunaan wajar hak cipta memungkinkan Stability AI menggunakan gambar. Tapi ada juga argumen kuat di sisi lain. Ada kemungkinan nyata bahwa pengadilan dapat memutuskan bahwa Stabilitas AI melanggar undang-undang hak cipta dalam skala besar.

Itu akan menjadi gempa hukum untuk industri yang masih baru ini. Membangun AI generatif mutakhir akan membutuhkan lisensi dari ribuan—bahkan mungkin jutaan—pemegang hak cipta. Prosesnya kemungkinan akan sangat lambat dan mahal sehingga hanya segelintir perusahaan besar yang mampu melakukannya. Meski begitu, mannequin yang dihasilkan kemungkinan besar tidak akan sebaik itu. Dan perusahaan yang lebih kecil mungkin dikunci dari industri sama sekali.

Penggugat dalam gugatan class motion menggambarkan Difusi Stabil sebagai “alat kolase kompleks” yang berisi “salinan terkompresi” dari gambar pelatihannya. Jika ini benar, kasusnya akan menjadi slam dunk bagi penggugat.

Tetapi para ahli mengatakan itu tidak benar. Erik Wallace, seorang ilmuwan komputer di College of California, Berkeley, mengatakan kepada saya dalam sebuah wawancara telepon bahwa gugatan tersebut memiliki “ketidakakuratan teknis” dan “banyak melebarkan kebenaran”. Wallace menunjukkan bahwa Difusi Stabil hanya berukuran beberapa gigabita—terlalu kecil untuk memuat salinan terkompresi dari semua atau bahkan sangat banyak gambar pelatihannya.

Pada kenyataannya, Difusi Stabil bekerja dengan terlebih dahulu mengonversi immediate pengguna menjadi representasi laten: daftar angka yang meringkas konten gambar. Sama seperti Anda dapat mengidentifikasi titik di permukaan Bumi berdasarkan garis lintang dan garis bujurnya, Difusi Stabil mencirikan gambar berdasarkan “koordinat” di “ruang gambar”. Itu kemudian mengubah representasi laten ini menjadi gambar.