Skip to content

Hur Googles Hum to Search fungerar

30 de juni de 2021
GettyImages 1152311608 338947b37f904e72aef96d1d408e0b4d

Viktiga takeaways

  • Google har lanserat ett nytt verktyg som låter användare söka efter låtar genom att surra, sjunga eller vissla.
  • Det nya verktyget använder maskininlärning för att matcha ett surrat spår med en databas med mer än en halv miljon låtar som kontinuerligt uppdateras.
  • Google-användare frågar vilken låt som spelas nästan 100 gånger varje månad.

Google har lanserat en ny funktion som heter ”Hum to Search” för att lösa ett frustrerande problem: att ha en låt fast i huvudet och inte kunna räkna ut vad den heter. Tanken att surra för att hitta en låt verkar otroligt enkel, så varför lanserar Google bara den här funktionen 2020? Tja, det visar sig att identifiera låtar på det här sättet faktiskt är ganska komplicerat, delvis för att våra surrade versioner tenderar att skilja sig ganska från originalspåret. I ett nyligen inlägg på sin AI-blogg förklarar Google hur det använde maskininlärning för att åtgärda detta problem och i slutändan hjälpa människor att hitta en låt genom att surra, vissla eller sjunga melodin även när deras återgivning är mindre än korrekt. ”Vårt fokus för Hum to Search är att hjälpa människor att identifiera och hitta musik som sitter fast i deras huvud”, berättade en Google-talesman Lifewire i ett e-postmeddelande.

Bara börja humma

Google-användare frågar vilken låt som spelas nästan 100 miljoner gånger varje månad, sa Aparna Chennapragada, Googles vice vd och chef för konsumentshopping, en video som introducerar flera nya sökfunktioner. Nu finns det ett sätt att ta reda på det. Funktionen ”Hum to Search” är inbyggd i Googles mobilapp, Google Search-widget och Google Assistant. För att komma åt den via appen, tryck på mikrofonikonen och säg ”Vad är den här låten?” Att välja knappen ”Sök efter en låt” fungerar också. För att fungera korrekt kräver funktionen att du surrar i minst 10-15 sekunder. Android-användare kan surra för att hitta låtar på mer än 20 språk, medan endast engelska låtar fungerar på iPhones. Verktyget kan inte alltid identifiera en låt direkt, men när det väl gör det är resultaten ganska bra.

”Mer än hälften av låtarna i en mängd olika variabler (ton, tonhöjd, volym etc.) känns igen av våra algoritmer, men naturligtvis beror noggrannheten på kvaliteten på surrningen, låtens typ och mer , sa Google-talesmannen Lifewire i ett e-postmeddelande. ”Men när det väl har erkänts är ungefär fyra av fem svar korrekta.” Det här är dock inte första gången som surrats i en musikidentifierande app. SoundHound erbjuder en liknande funktion, som noterats av CNN Business, och finns också på Android och iOS. Enligt Googles talesman väcker inte den nya funktionen några integritetsproblem och inte heller ”förändrar det sättet Google hanterar ljudbaserade interaktioner”, sa de Lifewire i ett e-postmeddelande.

Maskininlärning

Trots konceptets enkelhet är det tekniskt ganska svårt att surra en låt för att hitta studioinspelningen. Det finns flera orsaker till detta, förklarar Google Researchs Christian Frank i ett blogginlägg den 12 november. Först och främst kan en nynnad version av låten skilja sig mycket från den faktiska inspelningen, vilket gör det svårt att matcha de två. Så medan Shazam och en mängd andra appar redan finns för att identifiera den låten du hör i en restaurang eller annan allmän plats, kan det vara svårare att använda en humrad melodi som grund för den sökningen. ”Med texter, bakgrundssång och instrument kan ljudet från en musikal eller studioinspelning vara helt annorlunda än en surr melodi”, skriver Frank. ”Av misstag eller design, när någon surrar sin tolkning av en sång, kan tonhöjd, tangent, tempo eller rytm ofta variera något eller till och med betydligt.”

Googles visualisering av ett surrat klipp bredvid en matchande studioinspelning.

Eftersom de surrade versionerna av sånger kan vara så olika från originalen, konstaterar Frank att många tidigare metoder har krävt att en persons humming matchas med en version av låten som bara har en melodi eller ett spår som inkluderar humming. Detta har gjort användningsfall i verkliga utmaningar, eftersom databaserna med dessa låtar kan begränsas och behöver uppdateras manuellt. Google förklarar att för Hum to Search-funktionen använder den maskininlärningsmodeller för att göra ljud till en ”nummerbaserad sekvens” som representerar melodin i låten – vad den säger kan betraktas som ett ”fingeravtryck.”

Mer användarvänligt

Användningen av maskininlärning i Googles Hum to Search-funktion gör i slutändan verktyget mycket lättare att använda i den verkliga världen. Eftersom Hum to Search matchar sökarens brummade melodi med den aktuella låten kan verktyget arbeta med de nya låtarna när de släpps istället för en databas som ständigt behöver uppdateras med surrade versioner av varje spår. Dessutom behöver du inte perfekt tonhöjd för att använda den. ”Det nuvarande systemet når hög noggrannhet i en sångdatabas som innehåller över en halv miljon låtar som vi kontinuerligt uppdaterar”, säger Google i sitt meddelande Hum to Search. ”Den här sångkorpusen har fortfarande utrymme att växa till att inkludera fler av världens många melodier.”