The Rotten Tomatoes movie review dataset包含train.tsv >8M和test.tsv >3M两个文件 kaggle下载地址: https:// www.kaggle.com/c/sentiment analysis on movie reviews/data 分类标签如下: 0 negative 1 somewhat negative 2 neutral 3 somewhat positive 4 positive
1
wine_reviewer:使用机器学习基于二值化的品尝笔记来预测葡萄酒评论分数
2022-03-13 08:30:00 159.77MB kaggle-dataset machinelearning-r R
1
信用卡模糊检测kaggle--数据集 背景信息信用卡公司必须能够识别欺诈性的信用卡交易,以免向客户收取未购买商品的费用,这一点很重要。 内容数据集包含欧洲持卡人在2013年9月使用信用卡进行的交易。 该数据集显示了两天内发生的交易,在284,807笔交易中,我们有492起欺诈。 数据集高度不平衡,阳性类别(欺诈)占所有交易的0.172%。 它仅包含数字输入变量,它们是PCA转换的结果。 遗憾的是,由于机密性问题,我们无法提供有关数据的原始功能和更多背景信息。 功能部件V1,V2,...,V28是PCA获得的主要组件,尚未通过PCA转换的唯一功能部件是“时间”和“量”。 功能“时间”包含数据集中每个事务和第一个事务之间经过的秒数。 功能“金额”是交易金额,此功能可用于与示例相关的成本敏感型学习。 特征“类别”是响应变量,在发生欺诈时其值为1,否则为0。 启示识别欺诈性的信用卡交易。
2021-12-15 11:58:49 216KB JupyterNotebook
1
Kaggle数据集工作 我的项目正在处理各种Kaggle数据集 专案 从胸部X光照片进行肺炎分类(2021年2月12日-至今) 使用 看到当前和了解更多详情。 Spotify歌曲人气回归(2021年2月8日-2021年2月12日) 使用 经过训练的RandomForest,DNN,LinearRegression和LinearSVR可以预测歌曲的流行程度。 获得了12.300的RMSE错误,其准确度比猜测的平均受欢迎程度高近2倍。 见和了解更多详情。
2021-11-22 23:07:48 19.44MB data-science machine-learning JupyterNotebook
1