Um grupo hacktivista afirmou ter extraído praticamente todo o catálogo do Spotify por meio de scraping em larga escala. A ação foi divulgada no sábado (20) no blog Anna’s Archive, projeto que se define como a maior biblioteca aberta da história da humanidade e que agora mira a música como alvo de preservação. O Spotify confirmou a extração de dados.
Segundo o grupo, foram coletadas 256 milhões de peças de metadados — o equivalente a 99,9% das faixas disponíveis na plataforma. Além disso, cerca de 86 milhões de arquivos de áudio teriam sido baixados, representando aproximadamente 99,6% das reproduções do serviço, em um volume estimado de 300 TB de dados.
“Há algum tempo, descobrimos uma maneira de extrair dados do Spotify em grande escala. Vimos, então, uma oportunidade para nós: construir um arquivo musical voltado principalmente para a preservação”, afirmou o coletivo. Para eles, a iniciativa busca evitar que músicas desapareçam caso deixem de estar disponíveis no streaming.
O grupo argumenta que, apesar de a música ser um tipo de mídia relativamente bem preservado, ainda existem lacunas importantes. Entre elas, o foco excessivo em artistas populares, a priorização de formatos de alta qualidade e grande volume — como FLAC — e a ausência de um repositório definitivo que concentre toda a música já publicada.
Se uma música está disponível exclusivamente em plataformas como o Spotify, ela corre o risco de se tornar “lost media” caso sejam removidas do catálogo ou se o serviço deixe de operar. Nesses casos, sem cópias alternativas, o conteúdo pode se perder de forma permanente.
Distribuição pirata
O Anna’s Archive afirmou que vai distribuir tanto os metadados quanto as músicas extraídas do Spotify. Os dados textuais já foram liberados, enquanto os arquivos de áudio devem ser disponibilizados gradualmente, seguindo a ordem de popularidade das faixas. No futuro, o grupo também planeja liberar mais metadados e artes de álbuns.
O TecMundo não encoraja o download de músicas por meios alternativos e faz um alerta: com a repercussão do suposto vazamento, criminosos podem se aproveitar do tema para disseminar arquivos maliciosos disfarçados de músicas.
Spotify investiga a extração de dados
Ao site Billboard, o Spotify confirmou o acesso não autorizado que resultou na extração de metadados públicos e o uso de táticas ilícitas para contornar o DRM (Digital Rights Management) para acessar os arquivos de músicas da plataforma.
“Uma investigação sobre acesso não autorizado identificou que terceiros coletaram metadados públicos e usaram táticas ilícitas para burlar o DRM e acessar alguns arquivos de áudio da plataforma”, comunicou a empresa.
O Spotify não divulgou quantos ou quais dados foram vazados.
Quer continuar por dentro de temas como segurança digital, streaming e tecnologia? Siga o TecMundo nas redes sociais e acompanhe nossas notícias, análises e alertas sobre o mundo digital.
