Adobe’den Konuşma Değiştirici
San Diego’da yapılan Max toplantısında Adobe bu sene bizlere henüz geliştirme aşamasında olduğu bir projesini sundu: VoCo(voice converter). VoCo teknolojisi duyduğu cümleleri değiştirebiliyor, hem de bunu o kadar başarılı yapıyor ki cümlenin orijinal kısmıyla değiştirilmiş kısmını birbirinden ayırt etmek neredeyse imkansız.
Peki bunu nasıl yapıyor? VoCo’nun belirlenen kişinin 20 dakikalık konuşmasına ihtiyacı var. Bu konuşmayı kaydediyor. Ama cümledeki değiştirmek istediği kelimenin illa bu 20 dakikalık konuşma içerisinde kaydedilmiş olmasına gerek yok. Kelimeleri fenomlarına ayırarak hiç söylenmemiş bir kelimeyi de cümleye ekleyebiliyor. Kopyalanmış kelimeye oranla bu yeni üretilen kelime daha yapay duyuluyor, fakat daha yapım aşamasında olduğunu düşünürsek bu noktanın geliştirilme ihtimali çok yüksek.
VoCo genelde kullanılan ‘speech syntesis’ teknolojisiyle çalışmıyor. Bu teknolojidekinin aksine manüel düzeltmelere ve ‘timestamp’ler belirlemeye gerek yok. Algoritma kendi kendine yeni ses sentezini iyileştiriyor.
Fakat, prototip aşamasını geçebilirse VoCo piyasaya sunulduğunda birçok endişe yaratacağı kesin. Artık yapay söylenmiş sözlerle orijinal sözleri birbirinden ayırt etmek çok daha zor olacak. Bilgi kirliliğinin artacağına ve sosyal toplumu negatif etkileyeceğine kesin gözüyle bakılıyor. Fakat kim bilir belki de orijinal ve yapay sesleri ayırt etmeye yarayan yeni bir teknoloji de VoCo’nun yanında gelir ve VoCo bizim için komik cümleler yapabileceğimiz yeni bir teknolojik eğlence haline gelir.