Hvordan fungerer musikidentifikationsapps som Shazam?

Musikidentifikationsapps virker i starten som magi, men under motorhjelmen er der en sofistikeret algoritme, der kan finde sange på et øjeblik. Sådan fungerer de.

Musikkens magi identifikation

Det er sikkert sket for os alle sammen. Du spiser middag på en hyggelig restaurant, hænger ud på en kaffebar eller går rundt i en butik, når du pludselig hører en fantastisk sang spille over højtalerne. Måske er det en sang, du har lyttet til før, eller et nummer, du aldrig har hørt. Så du trækker din telefon ud, åbner Shazam og holder din enhed op til loftet. På et øjeblik fortæller appen dig, hvad sangen er, hvem kunstneren er, og hvor den skal streames.

De er hurtige, bemærkelsesværdigt nøjagtige og kan identificere selv de mest obskure sange. I en nøddeskal arbejder de ved at isolere sangen fra en optagelse og søge den mod en omfattende database af numre. Men teknologien bag, hvordan de gør dette, er ret kompleks og imponerende.

Du kan blive chokeret over at vide, at Shazam-appen, som vi kender i dag, blev udgivet helt tilbage i 2002, og systemet var lige så præcist og hurtigt dengang, som det er nu. Det er alt sammen takket være en unik algoritme, der ville revolutionere musikverdenen.

  Sådan opsætter du et harddisk-RAID i Open Media Vault

Det er ikke kun teksten

Ved første øjekast kan musikidentifikationsapps som Shazam virke enkle. Du tror måske, de bare lytter til teksten, det samme som enhver stemmeassistent, og søger efter den i en database med sangtekster for at fortælle dig, hvad sangen er.

De fleste musikidentifikationsapps er dog i stand til at fortælle, hvad titlen på en instrumental er, eller endda sangeren på en coversang. Det er fordi, i stedet for at analysere sangteksterne, leder de efter “fingeraftryk”, der er unikke for hver sang i deres omfattende databaser.

Fingeraftryksteknologi

Du har sandsynligvis enheder, der kan låses op ved hjælp af dit fingeraftryk, som er arrangementet af de små linjer på din finger, der er unikke for dig. På samme måde, når du holder din mikrofon op for at optage et kort klip af en sang, bliver dette klip forvandlet til datamønstre, som Shazam eller en anden app kan slå op i deres database.

Ved første øjekast ser den metode ud til at være udsat for flere problemer. Det meste af tiden, hvor du hører musik offentligt, er der baggrundsstøj og forvrængning forårsaget af højttalerne, hvilket kan gøre sange uidentificerbare eller resultere i unøjagtige matchninger. Der er også en masse data indfanget i selv et kort lydklip, hvilket kan gøre søgningen efter disse mønstre på tværs af en database med millioner af sange langsom.

  Sådan deaktiveres Outlook-tilføjelsesprogrammer til fejlfinding

I et interview med Scientific American i 2003 forklarer Avery Li-Chun Wang, chefdataforsker og medstifter af Shazam, hvordan deres algoritme løser disse problemer. Informationen om et lydklip kan visualiseres med et 3D-diagram kendt som et spektrogram, som repræsenterer en ændring i frekvenser over en periode. Den tager også højde for amplitude, som er hvor høj en lyd er. Dette er repræsenteret i et spektrogram ved hjælp af farveintensiteten.

På samme måde som mennesker ikke kan opfatte lyd, medmindre de er på en bestemt frekvens, i stedet for at tage hele en sang i betragtning, når de udfører en søgning, optager Shazam kun “peaks”, som er det højeste energiindhold i et lydklip . Fingeraftrykkene, den fanger, tager kun de højeste frekvenspunkter inden for en given tidsramme og derefter topamplitudepletterne inden for disse frekvenser.

  Sådan kopierer du Nintendo Switch-skærmbilleder til en pc via USB

I et forskningspapir for Columbia University, udtalte Wang, at metoden giver dem mulighed for at fjerne de fleste af de unødvendige dele af et lydklip som baggrundsstøj og rydde op for forvrængning. Det gør også størrelsen af ​​udskrifterne små nok til, at det tager blot millisekunder at identificere en sang i deres enorme database.

Shazams indvirkning

Ud over at være nyttige for almindelige lyttere, der hører en sang, de kan lide, hjælper musikidentifikationsapps også med at forme musikverdenen.

Radiostationer og streamingtjenester bruger ofte dataene om, hvilke mennesker der Shazam-er mest for at finde ud af, hvilke numre der bliver lyttet til af offentligheden. Dette er nyttigt, fordi det angiver en sangs iørefaldende og potentielle popularitet, uanset kunstneren. Når du identificerer en sang med appen, vil du med det samme se, hvor mange der også har forsøgt at identificere den.

Siden opkomsten af ​​Shazam er en håndfuld konkurrenter også dukket op. Soundhound hævder at være i stand til at identificere en sang blot ved at du synger eller nynner til den, med blandede resultater. Der er også en sangidentifikator integreret med stemmeapps såsom Google Assistant, der fungerer meget på samme måde som Shazams system.