BAGIKAN
Geralt/Pixabay

Google China, Baidu, baru saja merilis sebuah laporan resmi yang menunjukkan perkembangan terakhirnya dalam kecerdasan buatan (artificial intelligence / AI): sebuah program yang dapat mengkloning suara setelah menganalisis klip dalam beberapa detik, menggunakan jaringan syaraf tiruan. Perangkat lunak ini tidak hanya bisa meniru suara masukan, tapi juga bisa mengubahnya untuk mencerminkan jenis kelamin lain atau bahkan aksen yang berbeda.

(Anda dapat mendengarkan beberapa contoh yang dihasilkan di sini , yang dihosting di GitHub.)

Iterasi sebelumnya dari teknologi ini telah memungkinkan kloning suara setelah sistem menganalisis sampel suara dengan waktu yang lebih lama. Pada tahun 2017, tim peneliti Baidu Deep Voice mengenalkan teknologi yang bisa mengkloning suara dengan 30 menit dari materi pelatihan. Adobe memiliki program yang disebut VoCo yang bisa meniru suara hanya dengan 20 menit audio. Sebuah startup Kanada, yang disebut Lyrebird , bisa mengkloning suara hanya dengan satu menit audio. Inovasi Baidu telah mempersingkat waktu tersebut menjadi beberapa detik saja.

Terdapat beberapa aplikasi menakjubkan untuk teknologi ini. Sebagai contoh: bayangkan ketika anak Anda sedang mendengarkan suara Anda saat Anda berada jauh, atau memiliki suara duplikat yang dibuat untuk orang yang telah kehilangan kemampuan untuk berbicara. Teknologi ini juga bisa digunakan untuk membuat asisten digital yang dipersonalisasi dan layanan terjemahan ucapan yang terdengar lebih alami.

Namun, seperti banyak teknologi, kloning suara juga disertai dengan risiko untuk disalahgunakan. New Scientist melaporkan bahwa program tersebut mampu menghasilkan sebuah suara yang menipu sebuah perangkat lunak pengenalan suara dengan akurasi lebih dari 95 persen dalam sebuah percobaan. Manusia bahkan telah menilai suara kloning tersebut dengan skor 3,16 dari 4. Hal ini bisa membuka peluang kemungkinan penyalahgunaan untuk melakukan penipuan dengan AI atau kecerdasan buatan.

Program yang telah ada bisa menggunakan AI untuk menggantikan atau mengubah suara – dan bahkan menghasilkan dari coretan- wajah individu dalam video. Saat ini, ini sebagian besar digunakan di internet untuk sekadar kelakar dengan memasukkan Nicolas Cage ke dalam seri “Lord of the Rings”, misalnya. Tapi ditambah dengan teknologi yang bisa mengkloning suara, kita segera bisa dibombardir dengan lebih banyak “berita palsu” dari politisi yang melakukan tindakan yang tidak wajar atau mengatakan hal-hal yang sebenarnya tidak mereka inginkan.

Ini sudah sangat mudah untuk membodohi orang-orang dengan hanya menggunakan kata-kata tertulis atau Photoshop; Mungkin ada lebih banyak masalah jika teknologi ini digunakan oleh pihak yang salah.