灾难响应消息分析项目-集成和RNN方法
在本笔记本中,我探索了三种分析文本数据以预测文本主题的方法。 这是通过数据完成的,中有来自灾难幸存者的已编译文本消息,目的是对它们进行分类,以了解处理灾难时的优先级。
文献资料
以下项目是Udacity的数据科学纳米学位计划的一部分,该计划提供了原始数据库。 该信息如图8所示。
表格中分析的文本消息具有三种类型,分布如下所示:
需要注意的另一重要事项是所分析的文本与灾难相对应。 在下面您可以找到不同文本中最常见的10个单词:
在该项目中,您将发现两个部分:
应用程序:在项目的“应用程序”部分中,有一个Web应用程序,它使用分析后的信息来制作图形和预测。 该预测是通过模型完成的,该模型是根据Udacity提供的信息进行训练的。 Udacity提供的Web应用程序模板。
笔记本:在笔记本中,您还可以找到随机森林模型,预处理和图形。 它还包含一个
1