詹惠儿

2019-01-04   阅读量: 609

数据分析师

用pandas做推荐系统

扫码加入数据分析学习群

推荐系统是一种根据用户的选择来预测或过滤偏好的系统。推荐系统用于各种领域,包括电影,音乐,新闻,书籍,研究文章,搜索查询,社交标签和一般产品。
推荐系统以两种方式中的任何一种产生推荐列表 -

  • 协同过滤:协同过滤方法根据用户过去的行为(即用户购买或搜索的项目)以及其他用户做出的类似决策来构建模型。然后,该模型用于预测用户可能感兴趣的项目(或项目的评级)。
  • 基于内容的过滤:基于内容的过滤方法使用项目的一系列离散特征,以推荐具有类似属性的其他项目。基于内容的过滤方法完全基于项目的描述和用户偏好的简档。它根据用户过去的偏好推荐项目。

让我们使用Python和Pandas开发一个基本的推荐系统。
让我们专注于通过建议与特定项目最相似的项目(在本例中为电影)来提供基本推荐系统。它只是告诉哪些电影/项目与用户的电影选择最相似。

使用分隔符“\ t”导入数据集,因为该文件是tsv文件(制表符分隔文件)。

# import pandas library

import pandas as pd

# Get the data

column_names = ['user_id', 'item_id', 'rating', 'timestamp']

path = 'https://cdncontribute.geeksforgeeks.org/wp-content/uploads/file.tsv'

df = pd.read_csv(path, sep='\t', names=column_names)

# Check the head of the data

df.head()

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 5 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子