新闻个性化推荐系统项目,本项目以python作为主要语言,涉及到爬虫技术、jieba分词、算法在项目里用了协同过滤和TF-IDF。
代码流程:
首先我们从main()看起。
1.首先Get_day_data.TransforData(i)函数,找到最后一次浏览的是第i天的新闻的用户行为,存放在test/train_lastday_set目录下。
2.Get_day_data.TransforDataset(i)函数,区分每一天的新闻,存放在test/train_date_set1目录下
3.Get_keywords.Get_keywords(i)函数,调用jieba库,挑出每一天最火的分层,存放在test/key_words下
4.Get_keynews.Get_keynews(i)函数,通过每一个用户最后一次浏览的新闻,
1