Kaggle_Disaster_Tweets 带有灾难性推文的自然语言处理:预测哪些推文与真实灾难有关,哪些不与真实灾难有关任务开始日期:2021.04.04 任务说明:使用火车数据中的信息,构建模型以预测某条推文是否与真实灾害有关 火车数据集说明: 列 描述 有效/缺失 遗失率 'ID ' 每条推文的唯一标识符(推文编号) 7613/0 0% '关键词' 推文中的特定关键字 7552/61 1% '地点' 发推文的位置 5080/2533 33% '文本' 推文的文字 7613/0 0% '目标' 这条推文是否是一场真正的灾难(标签) 7613/0 0% 测试数据集说明: 列 描述 有效/缺失 遗失率 'ID ' 每条推文的唯一标识符(推文编号) 7613/0 0% '关键词' 推文中的特定关键字 3237/26 1% '地点' 发
2023-02-04 19:10:35 2KB Python
1
Kaggle-SMS-Spam-Collection-Dataset-:使用NLTK和Scikit-learn分类为垃圾邮件或火腿邮件
1
资源为.ipynb格式。可以用jupter nootboke打开 对kaggle泰坦尼克号辛存者预测竞赛的一点小总结 1.首先提出了对数据分析思维的一些tips(不感兴趣的可以跳过) 2.对数据分析的流程做了一个文本的总结。 由数据探索-->特征工程-->建模三部分组成 2.1 数据探索:探索特征的类型,缺失情况等等 2.2 特征工程:简要介绍数据的填充,删除,增补等等方法 2.3 建模:对可以使用的分类算法做一些比较,优先选择比较好的算法来进行集成学习(有借鉴一些大神的思路 , 但是因为找不到原来的网址了,没有附加超链接,如果以后有遇见相似的文本,希望各位发个消息,我再加上链接,谢谢!)
2023-01-27 20:30:13 463KB kaggle titanic
1
提交 小路 验证 排行榜 评论 1 /storage/hpc_anna/Kaggle_DRD/submissions/size256/minimal/2015-05-27-16-52 0.068 0.07967 2 /storage/hpc_anna/Kaggle_DRD/submissions/size256/minimal/2015-05-27-17-45 0.078 0.06259 批量大小 128 3 /storage/hpc_anna/Kaggle_DRD/submissions/size256/minimal/2015-05-27-17-45-random 0.00966 4 /storage/hpc_anna/Kaggle_DRD/submissions/size256/onehidden/2015-05-28-19-04 0.1342 0.13
2023-01-05 21:51:24 43.03MB Shell
1
Python心脏衰竭分类器 这是kaggle提供的一项任务,其中包括创建一个分类器算法,该算法可以使用血液信息和其他一些功能来预测心脏病发作。 在这个项目中,我尝试了3种不同的机器学习模型,即随机森林分类器,SVC和Logistic回归器,其中两个在数据框中运行良好,但是SVC无法正常工作,因此我决定将其从笔记本中删除,在这个项目中,我专注于数据分析,但是缺少功能工程。 同样在这个项目中,我还没有开始使用github,所以我再次希望你理解这一点并下载数据以运行代码。
2023-01-04 19:45:22 170KB JupyterNotebook
1
Kaggle COVID-19临床试验EDA 我第一次尝试使用Kaggle上与COVID-19相关的临床试验数据集进行EDA。 有关数据集的更多信息,访问: :
2023-01-04 15:49:57 2.48MB eda clinical-trials covid-19 JupyterNotebook
1
广告实时竞价数据,是广告牌、商场广告位和互联网广告栏中的广告位的实时竞价情况信息,用以训练有偏模型和预测客户点击。
1
Kaggle_Jane_Street_Market_Prediction:https
2023-01-02 15:48:48 20KB JupyterNotebook
1
简街市场预测 作者:刘增丰,崔贤ji,郑家杰 在此项目中,目标是根据市场价格从130点的时间序列中预测市场份额的未来回报值。 该数据集是从竞赛中获得的。 以下是实现这些目标的一些可能步骤: 去噪 滚动平均值 使用小波变换的阈值 使用的机器学习模型: 决策树(CART) 线性回归 k最近邻居 人工神经网络 卷积神经网络
2023-01-02 15:45:06 141KB JupyterNotebook
1
从Reddit WorldNews Channel网站上抓取的新闻数据(2008-06-08 到 2016-07-01)和对应时间的 Dow Jones Industrial Average (DJIA)股票指数数据。
2022-12-30 17:59:28 6.09MB 股市预测 Kaggle 市场情绪识别
1