上传者: 42169971
|
上传时间: 2022-03-29 22:58:06
|
文件大小: 29.01MB
|
文件类型: -
fake_news_TFIDF_analysis
使用TFIDF分析进行假新闻预测
资料来源:Kaggle资料集
网址: :
目的:
阿拉伯联合酋长国TF-IDF数据处理和相关单词的特征提取
使用新闻数据集来训练MLlib中的不同分类回归模型。
使用训练有素的模型来确定哪些绩效更好。
要求:
安装了Spark
客观的 :
使用TF-IDF数据处理和特征提取来识别文本中更相关的单词
执行步骤以提取特征并标记并提交给分类回归模型。
演示使用MLlib库的不同方法。