恢复上升
简历解析器和摘要器工具可对简历进行分类,并根据用户要求对简历进行排名。
数据集
包含1000个以csv格式标记的简历(根据特定简历所属的主要类别/类别进行标记)。 我们将使用此csv格式的简历数据集来训练我们的模型以进行分类。 然后,我们的模型应该能够处理任何看不见的简历。
参考文件:
Utils / Analysis.ipynb :数据清理+预处理+可视化+见解
Utils / Summarize.ipynb :恢复汇总算法
Utils / pdftotext.ipynb :使用pdfminer将odf转换为文本
Utils / Modelling.ipynb :主文件+代表性更改+培训+模型比较+测试
Utils / naive_bayes.ipynb :多项朴素贝叶斯实现
Utils / svm.ipynb :svm实现
Utils / clean_data1.csv :
1