Zazpívejte a najděte skladbu: Google rozpozná melodii

Zazpívejte a najděte skladbu: Google rozpozná melodii

Komentáře

4 Minuty

Některé písně zůstanou v hlavě celé dny — bez slov nebo jména interpreta. Google nyní slibuje řešení: stačí si zanotovat chytlavou melodii a aplikace ji rozpozná. Funkce „hum to search“ dokáže identifikovat skladbu podle vašeho humnutí, pískání nebo zpěvu, i když nemáte dokonalý hlas nebo přesnou výšku tónu.

Jak začít hledat píseň jedním zazpíváním

Funkce je dostupná v nejnovější verzi aplikace Google na mobilu a přes Google Assistant. Na iOS ji Google spustil v angličtině; na Androidu funguje ve více než 20 jazycích a společnost plánuje další rozšíření. Postup je jednoduchý: otevřete aplikaci Google nebo widget vyhledávání, klepněte na ikonu mikrofonu a řekněte „what's this song?“ nebo zvolte tlačítko „Search a song“. Poté po dobu 10–15 sekund hummujte, pískněte nebo zpívejte melodii. Na Google Assistant stačí říct „Hey Google, what's this song?“ a začít melodii předvádět.

Technologie za rozpoznáváním melodie

Princip fungování lze popsat obrazně: melodie má svůj vlastí otisk prstů. Google nasadil strojové učení, které zvuk přemění na číselnou sekvenci reprezentující tvar melodie — tedy na jakousi „digitální otisk“. Modely jsou trénované na širokém souboru dat: od studiových nahrávek přes lidi, kteří zpívají, až po pískání a humnutí. Algoritmus odstraní doprovodné informace, jako je konkrétní barva hlasu nebo nástrojové aranžmá, a ponechá jen základní melodickou strukturu.

Co se děje „pod kapotou“

  • Audio je analyzováno a transformováno na sekvenci čísel odrážející výškové a rytmické vzorce.
  • Modely vyhledávají podobné sekvence v rozsáhlé databázi skladeb z celého světa v reálném čase.
  • Systém navrhuje nejpravděpodobnější shody; uživatel si pak může prohlédnout informace o skladbě, poslechnout ukázku nebo otevřít písničku v oblíbené hudební aplikaci.

Vědecký kontext a vývoj technologie

Tento krok navazuje na dřívější výzkum a aplikace Google v oblasti rozpoznávání hudby. Už v roce 2017 přinesl projekt Now Playing na telefonech Pixel 2 nízkoenergetické rozpoznávání hudby přímo na zařízení pomocí hlubokých neuronových sítí. V roce 2018 se podobná technologie objevila ve funkci SoundSearch v aplikaci Google a katalog se rozrostl na miliony skladeb. Nová zkušenost teď posouvá hranici dál: rozpoznání je možné i bez přesných textů nebo studiového záznamu — postačí pouhé hummnutí.

Praktické využití a omezení

V praxi vám funkce ušetří čas, když slyšíte chytlavý motiv v rádiu nebo si jen nemůžete vybavit název rodinné písně. Po nalezení shody nabízí Google odkazy na videoklipy, texty písní, analýzy a alternativní nahrávky. Přesto existují omezení: krátké, velmi jednoduché nebo často se opakující melodie mohou vést k více výsledkům; silný šum v pozadí, přerušované nahrávání nebo výrazné odchylky v rytmu mohou kvalitu rozpoznání snížit. Také u skladeb s podobnou melodií může systém nabídnout několik relevantních shod — uživatel musí vybrat tu správnou.

Souvislé technologie a potenciál do budoucna

Metody používané pro rozpoznávání melodií se překrývají s dalšími oblastmi strojového učení: automatickým rozpoznáváním zvuku, transfer learningem a křížovými multimodálními vyhledávači, které porovnávají zvuk s notovou osnovou nebo s textovými popisy. Budoucí vylepšení mohou zahrnovat lepší vícejazyčnou podporu, offline rozpoznávání na zařízení kvůli soukromí, přesnější rozlišení variant jedné skladby nebo využití pro hudební výzkum a etnomuzikologii.

Expert Insight

„Rozpoznání melodie z humu představuje zajímavý mix akustiky a datového učení,“ říká prof. Jana Novotná, akustická inženýrka a docentka hudební informatiky. „Nejde jen o identifikaci tónů, ale o extrakci podstaty melodie nezávisle na hlasu nebo aranžmá. To otevírá nové možnosti pro přístup k hudbě i pro studie kulturních variací v melodické struktuře.“

Závěr

Funkce „hum to search“ dělá rozpoznávání hudby dostupnějším a intuitivnějším — stačí melodie z vašich úst. Jde o praktický příklad toho, jak strojové učení převádí složité akustické vzorce do uživatelsky přívětivých nástrojů. Ať už jste hudební nadšenec, novinář nebo vědec, tento nástroj ukazuje, jak technologie zpřístupňují informace ve chvílích, kdy si paměť zrovna neví rady.

Zanechte komentář

Komentáře