当前位置:   article > 正文

(附源码以及相关文件)基于Python的音乐推荐系统_音乐推荐系统python

音乐推荐系统python

本文是基于JupyterNotebook做的一个基于Python的音乐推荐系统

目录

1、导入库,定义了一个变量data_home,赋值为'./'

2、数据读取

3、对每一个用户分别统计他的播放总量

4、对于每一首歌分别统计他的播放总量

5、看看目前的排行情况

6、数据截取

7、数据拼接

8、数据清洗

9、基于排行榜首的推荐

10、基于歌曲相似度的推荐

11、基于矩阵分解SVD的推荐

1、导入库,定义了一个变量data_home,赋值为'./'

导入系统需要依赖的包pandas,numpy,time,sqlites

  1. #导入库,定义了一个变量data_home,赋值为'./'
  2. import pandas as pd
  3. import numpy as np
  4. import time
  5. import sqlite3
  6. data_home='./'

2、数据读取

      读取原始数据文件train_triplets.txt,1,2步骤的代码如下,通过numpy的read_csv方法读取data_home路径下的train_triplets.txt文件,数据文件中只需要用户,歌曲,播放量三个指标;查看数据大小规模以及各指标格式,发现数据大小为(48373586,3),数据量为千万级别,查看info信息,占用1.1+GB内存,数据量非常庞大,查看大小以及指标代码如下

  1. triplet_dataset=pd.read_csv(filepath_or_buffer=data_home+'train_triplets.txt',
  2. sep='\t',header=None,
  3. names=['user','song','play_count'])
  1. triplet_dataset.shape
  2. triplet_dataset.info()

输出:

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/441657
推荐阅读
相关标签
  

闽ICP备14008679号