提交Kaggle竞赛“真实与否?NLP与灾难鸣叫”(排名前25%) 挑战链接: : 链接到公共Kaggle笔记本(SVM): : 在此存储库中,您将找到3个笔记本: 一种使用spaCy字向量和SVM的 一种使用BiLSTM的 一种将预训练的BERT用于序列分类 在测试集上,SVM的f1得分达到0.81152,BiLSTM达到0.80,而BERT达到〜0.83 f1得分。
2023-03-20 16:46:11 990KB nlp svm binaryclassification JupyterNotebook
1
-数据集-_V-COCO_analysis
2023-03-20 12:56:16 23.58MB JupyterNotebook
1
基于不平衡数据的Python_Health-Insurance-交叉销售预测 在该项目中,我们将现代机器学习技术应用于保险单持有人的数据,以分析和预测其行为。 使用Python语言,我们对数据的处理方法产生了令人兴奋的见解,可以帮助保险公司进行业务建模。
2023-03-17 18:20:03 6.05MB JupyterNotebook
1
数据分析项目 1.健康保险交叉销售预测 (Kaggle数据集URL: ://www.kaggle.com/anmolkumar/health-insurance-cross-sell-prediction) 训练数据包含381109笔客户资料,每笔客户资料包含12个细分,1个客户ID细分,10个输入细分及1个目标细分-Response是否响应(1代表关注,0代表不关注)。 初步 角色 测量类型 不同值个数 ID 记录标识 无类型 381109 性别 输入 分类型 2个 年龄 输入 数值型 66 驾驶执照 输入 分类型 2个 区域代码 输入 分类型 53 以前_已保险 输入 分类型 2个 车辆年龄 输入 分类型 3 车辆损坏 输入 分类型 2个 年度_高级 输入 数值型 48838 Policy_Sales_Channel 输入 分类 155 优质的 输入 数值型 290 回
2023-03-17 16:49:16 4.75MB JupyterNotebook
1
健康保险交叉销售 该存储库包含支持保险公司交叉销售其产品的代码 项目背景 假设的All All是一家为客户提供健康保险的公司,产品团队正在分析为被保险人提供新产品的可能性:汽车保险。 该保险将由销售团队提供给客户,而销售团队反过来会限制活动期间可以联系的客户数量。 通过这种方式,Insurance All公司要求对具有更大可能性粘附到新产品上的客户进行预测,因此,销售团队可以策略性地向客户提供该产品,以实现最大的销售额。 请求背后的原因:一个模型,该模型可以预测客户是否会对汽车保险感兴趣 大股东:销售团队 问题类型:交叉销售 粒度:客户关系 主要方法:分类 运输方式 具有主要见解的仪表板,可对有意购买汽车保险的客户的最相关属性进行分析。 带有模型的API,该模型将同时使电报中的bot和电子表格消耗数据 业务问题 对购买汽车保险感兴趣的客户中,有多少百分比的销售团队能够通过拨打20,00
2023-03-17 15:26:06 15.28MB JupyterNotebook
1
灾难响应消息分析项目-集成和RNN方法 在本笔记本中,我探索了三种分析文本数据以预测文本主题的方法。 这是通过数据完成的,中有来自灾难幸存者的已编译文本消息,目的是对它们进行分类,以了解处理灾难时的优先级。 文献资料 以下项目是Udacity的数据科学纳米学位计划的一部分,该计划提供了原始数据库。 该信息如图8所示。 表格中分析的文本消息具有三种类型,分布如下所示: 需要注意的另一重要事项是所分析的文本与灾难相对应。 在下面您可以找到不同文本中最常见的10个单词: 在该项目中,您将发现两个部分: 应用程序:在项目的“应用程序”部分中,有一个Web应用程序,它使用分析后的信息来制作图形和预测。 该预测是通过模型完成的,该模型是根据Udacity提供的信息进行训练的。 Udacity提供的Web应用程序模板。 笔记本:在笔记本中,您还可以找到随机森林模型,预处理和图形。 它还包含一个
2023-03-15 20:52:26 700KB JupyterNotebook
1
滑出时间 飞机滑行时间的建模要开发模型,以预测飞机在预定起飞时间之前2小时的滑行时间
2023-03-15 15:52:12 202KB JupyterNotebook
1
SalaryPrediction:这是使用线性回归的薪资预测模型
2023-03-11 22:20:34 15KB JupyterNotebook
1
随机森林分类器
2023-03-10 15:52:12 51KB JupyterNotebook
1
流行的无模型强化学习算法 PyTorch和Tensorflow 2.0在Openai体育馆环境和自行实现的Reacher环境中均实现了最新的无模型强化学习算法。 算法包括软参与者关键(SAC),深度确定性策略梯度(DDPG),双延迟DDPG(TD3),参与者关键(AC / A2C),近端策略优化(PPO),QT-Opt(包括交叉熵( CE)方法) , PointNet ,运输商,循环策略梯度,软决策树等。 请注意,此存储库更多是我在研究和实施期间实施和测试的个人算法集合,而不是正式的开放源代码库/软件包以供使用。 但是,我认为与他人分享它可能会有所帮助,并且我希望对实现进行有益的讨论。 但是我没有花太多时间在清理或构建代码上。 您可能会注意到,每种算法可能都有几种实现方式,在此我特意展示所有这些方式,供您参考和比较。 此外,此存储库仅包含PyTorch实施。 对于RL算法的官方库,
1