提交Kaggle竞赛“真实与否?NLP与灾难鸣叫”(排名前25%) 挑战链接: : 链接到公共Kaggle笔记本(SVM): : 在此存储库中,您将找到3个笔记本: 一种使用spaCy字向量和SVM的 一种使用BiLSTM的 一种将预训练的BERT用于序列分类 在测试集上,SVM的f1得分达到0.81152,BiLSTM达到0.80,而BERT达到〜0.83 f1得分。
2023-03-20 16:46:11 990KB nlp svm binaryclassification JupyterNotebook
1
Kaggle_Disaster_Tweets 带有灾难性推文的自然语言处理:预测哪些推文与真实灾难有关,哪些不与真实灾难有关任务开始日期:2021.04.04 任务说明:使用火车数据中的信息,构建模型以预测某条推文是否与真实灾害有关 火车数据集说明: 列 描述 有效/缺失 遗失率 'ID ' 每条推文的唯一标识符(推文编号) 7613/0 0% '关键词' 推文中的特定关键字 7552/61 1% '地点' 发推文的位置 5080/2533 33% '文本' 推文的文字 7613/0 0% '目标' 这条推文是否是一场真正的灾难(标签) 7613/0 0% 测试数据集说明: 列 描述 有效/缺失 遗失率 'ID ' 每条推文的唯一标识符(推文编号) 7613/0 0% '关键词' 推文中的特定关键字 3237/26 1% '地点' 发
2023-02-04 19:10:35 2KB Python
1
灾害响应管道项目 目录 安装 运行主应用程序的所有依赖项都在requirements.txt文件中进行整理。我建议使用该文件创建虚拟环境。使用Python版本3. *时,代码应该没有问题地运行。 预处理文件夹中的jupyter笔记本是使用Python的标准Anaconda发行版创建的。 依赖项是: 点击== 7.1.2 joblib == 1.0.1 langdetect == 1.0.8 nltk == 3.5 numpy == 1.20.1 熊猫== 1.2.3 python-dateutil == 2.8.1 pytz == 2021.1 regex == 2020.11.13 scikit学习== 0.24.1 scipy == 1.6.1 六个== 1.15.0 SQLAlchemy == 1.3.23 threadpoolctl == 2.1.0 tqd
2022-05-31 09:59:19 4.42MB python nlp api flask
1
灾难鸣叫检测器 项目概况 该项目是Kaggle挑战。 在紧急时刻,Twitter已成为重要的沟通渠道。 由于Twitter提供近乎实时的信息,因此第一响应者越来越多地对其进行监视。 但是他们可能会面临困难,很难清楚地确定一个人是否正在宣布灾难。 使用包含隐喻的许多推文,这项任务可能很棘手。 我基于监督学习构建了一个解决方案,可以识别一条推文是否与真正的灾难有关。 这可以帮助紧急服务自动监视Twitter,以更好地检测灾难。 Github资料库 该存储库包含3个脚本: eda.y :对“关键字”和“位置”特征的探索性分析,以分析与灾难发生的可能关联。 preprocessing.py :一系列推文清洁和预处理 modelling.py :推文矢量化(TF-IDF)和二进制分类模型(多项朴素贝叶斯) 探索性数据分析 我想弄清楚我们是否可以利用模型中的“位置”和“关键字”列。 关键字分
2021-12-13 10:11:32 2.95MB JupyterNotebook
1
自然语言处理与灾难鸣叫Kaggle
2021-12-12 20:00:47 32KB JupyterNotebook
1
Pro SQL Server Disaster Recovery sqlServer pdf格式电子书,数据库高级教程, 英文版
2021-12-02 19:14:17 3.5MB Pro SQL Server Disaster
1
2020版新教材高中英语 Unit 6 Disaster and hope Using language练习 外研版3.doc
2021-10-20 09:02:51 33KB
2020版新教材高中英语 单元素养评价(六)Unit 6 Disaster and hope 外研版3.doc
2021-10-20 09:02:49 130KB
Start here! Predict survival on the Titanic and get familiar with ML basics
2021-10-03 12:52:08 33KB 数据集
1