Shazam gibi Müzik Tanımlama Uygulamaları Nasıl Çalışır?

Shazam Uygulaması iPhone Kimliği
Shazam

Müzik tanımlama uygulamaları ilk başta sihir gibi görünüyor, ancak kaputun altında şarkıları anında bulabilen sofistike bir algoritma var. İşte böyle çalışırlar.

Müzik Tanımlamanın Büyüsü

Muhtemelen hepimize oldu. Güzel bir restoranda akşam yemeği yiyor, bir kafede takılıyor veya bir mağazada dolaşıyorsunuz, aniden konuşmacılar üzerinden çalan harika bir şarkı duyuyorsunuz. Belki daha önce dinlemediğiniz bir şarkı veya daha önce hiç duymadığınız bir parçadır. Böylece, telefonunuzu çıkarın, Shazam'ı açın ve cihazınızı tavana kadar tutun. Sadece bir flaşta, uygulama size şarkının ne olduğunu, sanatçının kim olduğunu ve nerede aktaracağını söyler.

Hızlıdırlar, son derece hassastırlar ve en belirsiz şarkıları bile tanımlayabilirler. Özetle, şarkıyı bir kayıttan izole ederek ve geniş bir parça veritabanında arayarak çalışırlar. Ancak bunu yapmanın arkasındaki teknoloji oldukça karmaşık ve etkileyici.

Bugün tanıdığımız Shazam uygulamasının 2002 yılında piyasaya sürüldüğünü ve sistemin şimdi olduğu kadar doğru ve hızlı olduğunu bilmek şok olabilir. Tüm bunlar müzik dünyasında devrim yaratacak benzersiz bir algoritma sayesinde.

Sadece Şarkı Sözleri Değil

İlk bakışta, Shazam gibi müzik tanımlama uygulamaları basit görünebilir. Herhangi bir ses yardımcısıyla aynı şarkı sözlerini dinlediklerini ve şarkının ne olduğunu söylemek için şarkı sözleri veritabanında arama yaptıklarını düşünebilirsiniz.

Bununla birlikte, çoğu müzik tanımlama uygulaması, bir enstrümanın başlığının ne olduğunu, hatta bir kapak şarkısının şarkıcısını söyleyebilir. Çünkü parçanın şarkı sözlerini analiz etmek yerine, geniş veritabanlarındaki her şarkıya özgü “parmak izleri” arıyorlar.

İLİŞKİLİ: İPhone, iPad, Mac veya Apple TV'de Şarkı Sözlerini Görüntüleme

Parmak İzi Teknolojisi

İPhone X'da Shazam
Denys Prykhodov / Shutterstock.com

Muhtemelen parmak izinizi kullanarak kilidi açılabilen cihazlarınız var, bu da parmağınızdaki size özgü küçük çizgilerin düzeni. Benzer şekilde, bir şarkının kısa bir klibini kaydetmek için mikrofonunuzu tuttuğunuzda, bu klip Shazam'ın veya başka bir uygulamanın veritabanlarında arayabileceği veri modellerine dönüşür.

İlk bakışta, bu yöntem birkaç probleme eğilimli görünüyor. Çoğunlukla halka açık müzik duyduğunuzda, hoparlörlerin neden olduğu, şarkıları tanımlanamaz hale getirebilecek veya yanlış eşleşmelere neden olabilecek arka plan gürültüsü ve bozulması vardır. Ayrıca, kısa bir ses klibinde bile yakalanan çok sayıda veri var, bu da milyonlarca şarkıdan oluşan bir veritabanında bu desenleri aramayı yavaşlatabilir.

2003 yılında Scientific American ile yapılan bir röportajda, Shazam'ın baş veri bilimcisi ve kurucu ortağı Avery Li-Chun Wang, algoritmalarının bu sorunları nasıl düzelttiğini açıklıyor. Bir ses klibinin bilgisi, bir zaman dilimi boyunca frekanslardaki bir değişikliği temsil eden, spektrogram olarak bilinen bir 3D grafik ile görselleştirilebilir. Ayrıca, bir sesin ne kadar yüksek olduğu genliği de dikkate alır. Bu, renk yoğunluğu kullanılarak bir spektrogramda temsil edilir.

Shazam Müzik Spektrogramı
Avery Li-Chun Wang / Shazam

İnsanların belirli bir frekansta olmadıkları sürece sesi algılayamamaları gibi, arama yaparken bir şarkının tamamını dikkate almak yerine, Shazam yalnızca bir ses klibindeki en yüksek enerji içeriği olan “zirveleri” alır . Yakaladığı parmak izleri, yalnızca belirli bir zaman dilimi içinde en yüksek frekans noktalarını alır ve daha sonra bu frekanslar içindeki tepe genliği noktalarını alır.

Columbia Üniversitesi için bir araştırma makalesinde, Wang, yöntemin arka plan gürültüsü gibi bir ses klibinin gereksiz kısımlarının çoğunu çıkarmasına ve bozulmayı gidermesine izin verdiğini belirtti. Ayrıca, baskıların boyutunu, geniş veritabanları arasında bir şarkıyı tanımlamak için yalnızca milisaniye sürecek kadar küçük yapar.

Shazam’ın Etkisi

Sevdikleri bir şarkıyı duyan ortalama dinleyicilere yardımcı olmanın yanı sıra, müzik tanımlama uygulamaları da müzik dünyasının şekillenmesine yardımcı olur.

Radyo istasyonları ve gerçek zamanlı aktarım hizmetleri, insanların hangi parçaların halk tarafından dinlendiğini anlamak için çoğu zaman Shazaminging ile ilgili verileri kullanır. Bu yararlıdır çünkü sanatçının ne olursa olsun bir şarkının akılda kalıcılığını ve potansiyel popülaritesini gösterir. Bir şarkıyı uygulamayla belirlediğinizde, kaç kişinin de onu tanımlamaya çalıştığını hemen görürsünüz.

Soundhound Müzik Tanımlaması
Soundhound

Shazam'ın yükselişinden bu yana, bir avuç rakip de ortaya çıktı. Soundhound, bir şarkıyı sadece şarkı söyleyerek veya mırıldanarak, karışık sonuçlarla tanımlayabildiğini iddia ediyor. Ayrıca Google Asistan gibi ses uygulamalarıyla entegre edilmiş ve Shazam’ın sistemine çok benzer bir şarkı tanımlayıcısı da vardır.

İLİŞKİLİ: Ücretsiz Müzik Akışı için En İyi Siteler

LEAVE A REPLY

Please enter your comment!
Please enter your name here