Robot Rock: Wie tiefes Lernen für die Strategie von Spotify von zentraler Bedeutung ist

Robot Rock: Wie tiefes Lernen für die Strategie von Spotify von zentraler Bedeutung ist

Kredit: Engadget

Spotifys Discover Weekly ist bei Nutzern sehr beliebt, um neue Musik zu finden. Viele erkennen jedoch nicht, dass Deep Learning der Kern des Features ist.

Viele befürchteten, dass das Internet Alben töten würde. Das Rosinenpicken von Highlights aus einer LP ist jetzt üblich, und KI ist von zentraler Bedeutung für das nächste Kapitel in der Entwicklung der Musik.

Fast 60 Jahre nachdem die Beatles unser Denken über Popmusik revolutioniert haben, sind wir bei der Playlist angekommen. Die Wiedergabeliste ist jetzt dominanter als das Album: Vielleicht eine natürliche Weiterentwicklung der Tage, als man die Songs, die man im Radio hörte, auf eine Kassette aufnahm.

Playlists bieten Anpassungsmöglichkeiten. Sie können es den Zuhörern ermöglichen, ihre Lieblingssongs von ihren Lieblingskünstlern auszuwählen und sie in einen potenziell endlosen Stream zu stellen, basierend auf Stimmung, Genre oder sogar einem Ereignis. Playlists sind jedoch mehr als nur Zusammenstellungsgeräte. Für viele haben sie Radio-DJs ersetzt.



Die Musikkuration hat – wie Genres, Stile und Trends selbst – eine Menge Veränderungen erfahren. Wir begannen mit Einzelpersonen, die Wiedergabelisten zusammengestellt haben, von denen sie dachten, dass sie anderen gefallen würden, bevor sie durch das Tagging-System von Pandora ersetzt wurden. Das Tagging ermöglichte es den Benutzern, nach einem Label zu suchen, das ihnen gefiel, und gab ihnen Empfehlungen. Das Markieren ist jedoch zeitaufwändig. Musik ist subjektiv. Wenn es um etwas so Persönliches und Entzweiendes wie Musik geht, wird es immer Unterschiede geben.

Die Discover-Wiedergabelisten von Spotify sind einige der genauesten Möglichkeiten, präzise Musikempfehlungen zu erhalten. Wie schafft es der schwedische Dienst also, bei der Suche nach neuen Künstlern den Nagel so genau auf den Kopf zu treffen, ohne Tagging und ohne DJs?

Wie nutzt Spotify Deep Learning?

Spotify arbeitet seit über einem Jahrzehnt mit maschinellem Lernen. Was begann als ein Mann, der im Unternehmen als eine Art Nebenprojekt an KI arbeitet hat sich zu einem viel größeren Aspekt des Unternehmens entwickelt. Ähnlich wie das maschinelle Lernen selbst normalerweise aus mehreren Algorithmen besteht, die sich gegenseitig herausfordern, hat Spotify eine Reihe von Möglichkeiten, Musikempfehlungen zu generieren.

Eine der wichtigsten Möglichkeiten, dies zu tun, ist die Verarbeitung natürlicher Sprache (NLP). NLP analysiert riesige Schwaden natürlicher Sprachdaten, und dazu kann auch die Spracherkennung gehören. Im Falle von Musikempfehlungen durchsucht Spotify das Internet nach geschriebenem Text über Musik, um herauszufinden, welche Wörter verwendet werden, wenn über bestimmte Songs gesprochen wird, und um herauszufinden, welche anderen Songs in Bezug darauf erwähnt werden. Wenn also beispielsweise im Internet viel über Beyoncé in Bezug auf Rihanna geschrieben wird, werden die NLP-Algorithmen dies berücksichtigen und Beyoncé-Fans Rihanna-Songs empfehlen.


Deep Learning treibt sich selbst dazu an, mehr zu lernen. Es ist perfekt für einen Streaming-Dienst, der möchte, dass wir angeschlossen bleiben und zuhören.


Spotify verwendet auch Convolutional Neural Networks (CNN), um die Wellenformdaten eines Songs auszuwerten. Dies ist eine Form von Deep Learning, die mindestens drei Ebenen von Knoten betrachtet: eine Eingabeschicht, eine verborgene Schicht und eine Ausgabeschicht. CNN wird am häufigsten in der Bilderkennung verwendet, häufig für Gesichter.

Spotify verwendet CNNs jedoch etwas anders, da sie sie eher auf Ton als auf Bild anwenden. Audioframes werden auf Attribute wie Tempo, Lautstärke und Tonart analysiert, damit Spotify Songs mit ähnlichen Eigenschaften zusammenfassen kann.

Spotify verwendet auch eine Python-Bibliothek, um eine Matrixformel auszuführen. Es vergleicht jeden Benutzer für die Songs, die er hört, mit anderen Benutzern und den Songs, die er hört, so dass Sie von hier aus die Daten eines Songs mit anderen Songs vergleichen und herausfinden können, welche ähnlich sind.

Warum ist Deep Learning für die Unterhaltung so wichtig?

Sehr zum Ärger unserer Eltern verändert sich Musik ständig. Der Geschmack, den wir mit 20 hatten, ändert sich mit 30. Die Songs, von denen wir nicht genug bekommen können, altern sehr schnell und das ist eine Herausforderung für Spotify.

Deep Learning drängt sich immer wieder auf, mehr zu lernen, mehr Daten auszuwerten und bessere Ergebnisse zu erzielen. Es ist perfekt für einen Streaming-Dienst, der möchte, dass wir angeschlossen bleiben und zuhören. Deep Learning in der gesamten Unterhaltungsbranche bietet jedoch eine tiefere Personalisierung, als es das Marketing jemals zuvor geschafft hat.

Die Discover-Wiedergabelisten von Spotify sind einfach zu verwenden und wurden allgemein für ihre Fähigkeit gelobt, den Musikgeschmack der Benutzer zu erfassen. / Kredit: The Verge

Deep Learning identifiziert Muster, wie Menschen Inhalte konsumieren. Es bewertet, was Sie als „Mikropräferenzen“ bezeichnen können, vom Zeitpunkt des Interesses eines Verbrauchers an einem Produkt bis hin zu seiner möglichen nächsten Reaktion. Eine Feedbackschleife ist ein entscheidender Teil des KI-Lernens, da die Maschine bestimmt, ob die von ihr getroffenen Entscheidungen richtig waren oder nicht. Letztlich gilt: Je mehr Daten ein Unternehmen über Sie hat, desto besser kann ein Deep-Learning-Algorithmus Sie „kennenlernen“ und Empfehlungen aussprechen.

Laut Netflix 75 % dessen, was Verbraucher auf ihrem Dienst ansehen kommt von ihren Empfehlungsalgorithmen. Bedenken Sie auch, dass Netflix im Zug der Hyperpersonalisierung angekommen ist. Der Dienst generiert basierend auf den Inhalten, die Sie ansehen, ein zufälliges Miniaturbild für eine TV-Sendung. Wenn Sie also besonders auf Horrorfilme stehen, erwarten Sie ein dunkleres Filmplakat als jemand, der auf romantische Komödien steht: Sie sehen möglicherweise ein führendes Paar als Miniaturansicht, unabhängig davon, ob sich die Serie um dieses Paar dreht.

Wir sind nicht weit davon entfernt, Filmtrailer zu schneiden und zusammenzufügen, je nachdem, worauf Sie mit größerer Wahrscheinlichkeit reagieren. Wenn YouTube beispielsweise die Kraft des Deep Learning nutzen könnte, um zu erfahren, welche Filme Ihnen am besten gefallen, könnte es auf der Grundlage der Eigenschaften, auf die Sie wahrscheinlich reagieren, einfach zufällig einen Trailer für einen neuen Film generieren.

Oder vielleicht sogar einen Film erstellen basierend darauf, was Sie möchten.

Deep Learning ist ein wesentlicher Bestandteil der Zukunft der Musik

Unglaublicherweise mochte Spotify-CEO Daniel Ek Discover Weekly ursprünglich nicht.

„Ich hätte das zu 100 % getötet, wenn es nur um mich gegangen wäre“, sagte Ek über das Feature. „Ich dachte: ‚Oh, das wird eine Katastrophe.‘ Und dann ist es offensichtlich etwas wirklich Erfolgreiches geworden. Es ist eine der beliebtesten Produktfunktionen, die wir haben.“

Es ist vielleicht poetisch, dass Ek Deep Learning nicht bewertet hat, so wie viele Kritiker die Beatles in den 1960er Jahren nicht mochten. Sowohl die KI als auch die Fab Four sind revolutionär für die Populärkultur: nicht nur die Musik.

Musik verändert sich ständig, aber das Rad dreht sich. Trends kommen in Mode, bevor sie aus dem Blickfeld verschwinden. Die Art und Weise, wie wir Musik konsumieren, wird sich weiterentwickeln, aber mit Deep Learning, das in die größten Musikkonsumplattformen der Welt integriert ist, werden sich zweifellos Empfehlungen mit den Klängen entwickeln, die wir hören.

Lukas Konrad

Technologie- und Marketing-Enthusiast