
Datasets of MusicBrainz/Tidal/Spotify 是一个开源音乐数据集,主要提供 MusicBrainz、Tidal、Spotify 的音乐数据集。
目前此数据集包含了:
MusicBrainz:艺术家:250 万,专辑:480 万,曲目:4900 万
Spotify:艺术家:6.4 万,专辑:19.6 万,曲目:110 万
Tidal:艺术家:11.8 万,专辑:40.3 万,曲目:250 万
数据集是开发者通过调用MusicBrainz/Tidal/Spotify 官方API接口收集整理而成。
MusicBrainz/Tidal/Spotify对API接口调用的并发数限制并不相同:
- MusicBrainz 官方直接提供了数据集和API,API只需要增量爬取新增数据,因此限制较少
- Spotify 只允许10 秒调用一次
- Tidal 每 15分钟允许~200 次调用
由于API接口调用的限制,开发者花了几个月时间才爬取完成。对于音乐类、AI应用的开发者,此数据集是很好的资源库,节省了自己爬取的大量时间。
项目地址:https://github.com/MusicMoveArr/Datasets
数据集磁力链接:magnet:?xt=urn:btih:eee113333c15cbb69dc91473f70860186508f647
另外强烈推荐MusicBrainz,开放的音乐百科全书和社区驱动的音乐元数据数据库,MusicBrainz 网站有很多不错的资源值得挖掘:
MusicBrainz官方数据库:https://musicbrainz.org/doc/MusicBrainz_Database/Download
MusicBrainz总结的其他知名的行业数据集:https://musicbrainz.org/doc/Other_Databases
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...