
Sosyal medyada gezinirken karşımıza çıkan o ultra gerçekçi ancak bir o kadar da tuhaf görselleri düşünün… Geçmişte daha berbat olsalar da günümüzde daha güzel düzeylere geldiler evet ancak hâlâ o yapaylık hissi duruyor ve gözlerimiz o filtreyi artık geliştirmiş durumda.
Konu müziğe geldiğinde ise işler bir anda değişiyor ve dinlediğimiz o yeni, akılda kalıcı müziğin bir insan tarafından mı yoksa gelişmiş bir algoritma tarafından mı bestelendiğini anlamak neredeyse imkansız durumda. Pekala gözlerimiz bunu saniyeler içinde yakalarken kulaklarımız neden bu kadar kolay kandırılıyor?
Görsel anormallik zihnimizde alarmlar çalıyor

Bu durumun en temel sebebi, beynimizin görsel ve işitsel dataları sürece biçimindeki devasa farktan kaynaklanıyor. İnsan beyni, milyonlarca yıllık evrim süreci boyunca yüzleri, beden oranlarını ve fizikî dünyadaki ışık gölge oyunlarını tanıma konusunda inanılmaz bir uzmanlık geliştirdi. Karşımızdaki bir insanın yüzünde milimetrik bir orantısızlık olduğunda yahut bir elin duruşu doğal fizik kurallarına ters göründüğünde, beynimizdeki alarm zilleri anında çalıyor.
“Uncanny Valley” yani Türkçesi tam karşılığı olmasa da “Tefkinsiz Vadi” denilen bu fenomen yüzünden, gerçeğe çok yaklaşan fakat tam olamayan imgeler bize ürkütücü ve düzmece geliyor. Görsel dünyada referans noktamız somut gerçeklik olduğu için en ufak yanılgıyı affetmiyoruz.
Yapay zekâ işitsel konuları daha kolay kopyalıyor

Müzikte ise durum çok daha soyut ve matematiksel bir tabana oturuyor. Müzik, tabiatı gereği belli kalıpların, ritimlerin ve frekansların tekrarına dayalı bir sanat formu olduğu için yapay zekânın bu kuralları öğrenip taklit etmesi görsel dünyaya kıyasla daha “pürüzsüz” sonuçlar veriyor.
Bir görselde altı parmaklı bir el görmek bariz bir hatayken, müzikte alışılmadık bir ritim yahut farklı bir tını duymak bir yanılgı değil, “sanatsal bir tercih” yahut yeni bir stil olarak yorumlanıyor. Müziğin yanılgıyı tolere etme kapasitesi görselliğe nazaran çok daha yüksek olduğu için yapay zekânın ürettiği besteleri yadırgamıyoruz.
Cevap müziğin evriminde de gizli

İşin bir öteki boyutu da kulaklarımızın aslında uzun yıllardır “yapay” seslere aşina olmasıyla ilgili. Son otuz kırk yıldır dinlediğimiz tanınan müziklerin neredeyse tamamı synthesizer’lar, davul makineleri ve ağır stüdyo efektleriyle üretiliyor. Auto-tune üzere ses düzeltme teknolojileri sayesinde insan sesinin bile ne kadarının doğal, ne kadarının dijital olduğunu ayırt edemediğimiz bir çağdayız.
Zaten elektronik ve dijital olarak üretilmiş seslere alışkın olduğumuz için yapay zekânın ürettiği bir melodiyi duyduğumuzda bunu “yapay” olarak etiketlemek yerine çağdaş bir yapım olarak kabul ediyoruz. Yani gözlerimiz doğallığı ararken, kulaklarımız sentetik mükemmelliğe çoktan alışmış durumda.
Teknik olarak da bir tutmamak gerek

Son olarak, görsel dünyadaki karmaşıklık ile ses dünyasındaki bilgi akışı ortasındaki teknik farkı da unutmamak gerekiyor. Bir fotoğraf karesinde milyonlarca pikselin, ışığın, dokunun ve perspektifin birbiriyle dengeli olması gerekirken, müzik vakte yayılan doğrusal bir frekans dizisi olarak işleniyor.
Yapay zekâ, müzik teorisindeki matematiksel kuralları (hangi notanın hangisinden sonra geleceği gibi) görselliğin kaotik fizik kurallarına nazaran çok daha kolay ve kusursuz uygulayabiliyor. Bu yüzden bugün dinlediğiniz o olağanüstü müziğin gerisinde bir bestekar değil, yalnızca çok yeterli eğitilmiş bir algoritma olabilir ve tahminen de siz bunu muhtemelen hiçbir vakit fark etmeyeceksiniz…
Webtekno
https://www.webtekno.com/yapay-zeka-muzikleri-neden-ayirt-edemiyoruz-h207939.html