sw-kaggle
关于 kaggle 问题的解答与优化
主要工作:可视化分析不同特征与存活率的关系, 类别特征one-hot编码,数值特征分段处理,pipeline预处理数据, 使用LR, RF等进行投票分类,最终排名top10%
主要工作:多分类问题,给定手写数字,进行0-9识别。分别使用numpy,tensorflow搭建ANN, CNN进行训练,识别率98%
主要工作:使用nltk, sklearn,构建关于问题特征的向量进行相似性判断,采用lightgbm进行训练,完成相似问题判断。
个人工作:
主要工作:针对全书每一章节进行分词,tf-idf文档向量化,分别使用监督和无监督进行训练预测, 并与其它名著对比结果。
[拉勾和Boss直聘关于机器学习岗位的简单分析]
主要工作:在两个不同的求职平台,分别以 机器学习 为关键字, 进行搜索,获取全部结果,对其进行简单分析,代码和分析见
1