Membuat wajah: Cara melatih AI di wajah Anda untuk membuat potret konyol

Shaun Hutchinson | Aurich Lawson | Difusi Stabil
Saat ini, Anda telah banyak membaca tentang teknologi AI generatif seperti Midjourney dan Secure Diffusion, yang menerjemahkan enter teks menjadi gambar dalam hitungan detik. Jika Anda seperti saya, Anda langsung bertanya-tanya bagaimana Anda bisa menggunakan teknologi itu untuk menampar wajah Anda ke Mona Lisa atau Captain America. Lagi pula, siapa yang tidak ingin menjadi pantat Amerika?

Saya memiliki sejarah panjang menempatkan wajah saya pada hal-hal. Sebelumnya, melakukannya adalah proses yang melelahkan untuk menemukan atau mengambil gambar dengan sudut dan ekspresi yang tepat, lalu menggunakan Photoshop untuk mencangkokkan wajah saya ke aslinya. Meskipun saya menganggap hasilnya gila namun bermanfaat, prosesnya membutuhkan banyak waktu. Tetapi dengan Difusi Stabil dan Dreambooth, saya sekarang dapat melatih mannequin di wajah saya dan menempelkannya ke apa pun yang diinginkan hati saya yang aneh.
Dalam panduan ini, saya akan menunjukkan cara menginstal Secure Diffusion secara lokal di komputer Anda, melatih Dreambooth di wajah Anda, dan membuat begitu banyak foto diri Anda sehingga teman dan keluarga Anda pada akhirnya akan memblokir Anda untuk menghentikan banjir foto konyol. Seluruh proses akan memakan waktu sekitar dua jam dari awal hingga selesai, dengan sebagian besar waktu dihabiskan untuk mengasuh pocket book Google Colab sambil melatih gambar Anda.
Sebelum kita mulai, beberapa catatan:
Spesifikasi sistem
Untuk penelusuran ini, saya sedang mengerjakan komputer Home windows dengan Nvidia 3080Ti yang memiliki VRAM 12GB. Untuk menjalankan Secure Diffusion, Anda harus memiliki kartu grafis Nvidia dengan RAM video minimal 4 GB. Difusi Stabil Bisa berjalan di sistem Linux, Mac yang memiliki chip M1 atau M2, dan GPU AMD, dan Anda dapat menghasilkan gambar hanya dengan menggunakan CPU. Namun, metode tersebut memerlukan beberapa penyesuaian, jadi untuk keperluan penelusuran ini, mesin Home windows dengan GPU Nvidia lebih disukai.
Masalah etika
Dalam hal program gambar generatif seperti Secure Diffusion, ada masalah etika yang menurut saya harus saya akui. Ada pertanyaan legitimate seputar bagaimana knowledge yang digunakan untuk melatih Secure Diffusion dikumpulkan dan apakah etis untuk melatih program pada karya seniman tanpa persetujuan mereka. Ini adalah topik besar yang berada di luar cakupan panduan ini. Secara pribadi, saya menggunakan Difusi Stabil sebagai penulis untuk membantu saya membuat sketsa karakter cepat, dan itu menjadi bagian yang tak ternilai dari proses saya. Namun, menurut saya karya yang dibuat oleh Secure Diffusion tidak boleh dikomersialkan, setidaknya sampai kita menyelesaikan dilema etika dan menentukan cara memberi kompensasi kepada seniman yang mungkin telah dieksploitasi. Dan untuk saat ini, saya merasa bahwa Difusi Stabil harus tetap untuk penggunaan pribadi saja.
Terakhir, teknologi seperti Secure Diffusion secara bersamaan mengasyikkan dan menakutkan. Ini mengasyikkan karena memberi orang seperti saya, yang memuncak secara artistik dengan cat jari di taman kanak-kanak, kemampuan untuk membuat gambar yang saya bayangkan. Tapi itu menakutkan karena dapat digunakan untuk membuat propaganda dan deepfake yang sangat realistis dengan potensi untuk menghancurkan kehidupan orang. Jadi, Anda sebaiknya hanya melatih Difusi Stabil pada foto diri Anda atau seseorang yang telah memberikan persetujuan kepada Anda. Periode.
Sekarang, siapa yang siap melakukan ini?