Un collectif d’hacktivistes annonce avoir copié une partie du catalogue de la plateforme de streaming musical, représentant quelque 86 millions de pistes audio et 256 millions de données associées.
Le 22 décembre dernier, Anna’s Archive a affirmé avoir créé « la plus vaste base de données musicales jamais rendue publique ». L’opération, dirigée contre Spotify, aurait permis d’extraire près de 300 téraoctets de données depuis les serveurs du géant du streaming.
Cela inclut les métadonnées de 256 millions de morceaux, soit 99,9 % du catalogue référencé par la plateforme suédoise, ainsi que 86 millions de fichiers audio effectivement copiés. Pour saisir la portée de cette initiative, il faut revenir aux origines d’Anna’s Archive.
Fondé en 2022, le projet se présente comme une bibliothèque numérique ouverte et un moteur de recherche de métadonnées, conçu pour prévenir la disparition de contenus causée par des retraits judiciaires, des défaillances techniques ou des crises politiques. Sa mission : préserver et démocratiser l’accès au savoir, notamment pour les étudiants et chercheurs dépourvus de ressources financières.
Le site évolue toutefois dans une zone juridique incertaine. Il n’héberge pas directement les œuvres protégées, mais en facilite souvent l’accès à travers des liens externes, flirtant ainsi avec les limites du droit d’auteur.
« Préserver le savoir et la culture de l’humanité »
Dans le cas de Spotify, le collectif explique avoir eu recours à une méthode de scraping – c’est-à-dire une extraction automatisée et massive – pour contourner les protections DRM (gestion des droits numériques).
Les fichiers les plus populaires ont été conservés dans leur format d’origine (OGG Vorbis, 160 kbps), tandis que les morceaux moins écoutés ont été réencodés en OGG Opus à 75 kbps afin de réduire l’espace de stockage.
Pour justifier cette opération, Anna’s Archive invoque une volonté de « préserver le patrimoine culturel de l’humanité ». Dans un billet de blog, le collectif affirme que les archives musicales disponibles, notamment via les réseaux torrent, souffrent de nombreuses lacunes.
« Ce scraping de Spotify est notre modeste tentative de constituer une archive musicale de préservation », écrit le groupe, qui ajoute avoir saisi l’occasion de s’aventurer en dehors de son domaine de prédilection : les livres.
Spotify confirme et relativise
Contactée par plusieurs médias, la plateforme a reconnu un « incident de sécurité », tout en cherchant à en minimiser la gravité.
« Nous menons une enquête active sur un accès non autorisé ayant permis à un tiers de récupérer certaines métadonnées publiques et de contourner nos systèmes de gestion des droits numériques pour atteindre des fichiers audio », a indiqué un porte-parole de Spotify à Billboard.
Malgré l’argument de la préservation, ce téléchargement massif et la diffusion publique de fichiers protégés s’apparentent à du piratage. À cet effet, Anna’s Archive est déjà visé par de multiples procédures judiciaires dans plusieurs pays.
La Belgique a ordonné des sanctions en juillet 2024, assorties d’amendes pouvant atteindre 500 000 euros. Le Royaume-Uni a obtenu des blocages de domaine via la High Court en décembre de la même année, tandis que l’Allemagne a restreint l’accès aux principaux sites du groupe dès octobre 2024.
