数据集
要使用的数据集如下: :
职位发布数据集
特征提取和预处理
要运行文件,请从给定的链接下载堆栈溢出数据集,并将其放置在/ data / user_preprocessing文件夹中。 用户配置文件的特征提取和预处理由feature_extraction_user_a.ipynb和feature_extraction_user_b.ipynb完成。 提取的功能已经在/ data / user_preprocessing文件夹中。
协同过滤模型
要运行文件,请从给定链接下载堆栈溢出数据集和作业发布数据集,并将其放置在/ data / collaborative过滤文件夹中。 运行协同过滤.ipynb,以基于基于内容的建议检查CF建议的输出。
基于内容的过滤模型
为了运行基于内容的过滤模型:
需要安装以下模块spacy nltk sklearn scipy
请下载上面提到的两个
2021-03-17 20:03:36
118.37MB
系统开源
1