KaggleLeaf分类 Kaggle竞赛“植物幼苗分类”
2024-01-11 10:43:45 31KB Python
1
自然语言处理 我在这里分享了我在IE Univesity的自然语言处理课程中使用的一些代码。 我也分享我所做的项目。 1.计算歌曲的词汇多样性 我遇到一篇文章,讨论一些音乐家在其职业生涯中的整体词汇。 因此,我想将清单上前3位歌手和最后2位歌手的歌曲与我们在课堂上看到的3首歌曲进行比较。 排在首位的是Eminem(毫不奇怪),他的100首最慢的歌曲中使用了大约8,800个单词。 然后是Jay Z(6,900字)和Tupac Shakur(6,600字)。 排在最末的是Spice Girls和Bruno Mars(大约1500个单词)。 我尝试选择看起来在词汇上更加多样化的歌曲,并且与预期的一样,结果表明两组之间的差异很大,而且与我们看到的三首歌曲相比,差异也很大。 (可以在文件1_Lexical_Diversity中找到该代码) 2.分类模型:真实与否? NLP与灾难鸣叫 我们获得了将近1
2023-04-11 16:46:54 7.42MB JupyterNotebook
1
kaggle竞赛Predict Student Performance from Game Play 自己写的项目代码,带注释+讲解 数据集:https://www.kaggle.com/competitions/predict-student-performance-from-game-play/data score为0.678,300/600的rank 竞赛目标: You'll develop a model trained on one of the largest open datasets of game logs. 文件包括: train.csv - the training set test.csv - the test set sample_submission.csv - a sample submission file in the correct format train_labels.csv - correct value for all 18 questions for each session in the training set
2023-04-06 09:56:16 148KB kaggle
1
提交Kaggle竞赛“真实与否?NLP与灾难鸣叫”(排名前25%) 挑战链接: : 链接到公共Kaggle笔记本(SVM): : 在此存储库中,您将找到3个笔记本: 一种使用spaCy字向量和SVM的 一种使用BiLSTM的 一种将预训练的BERT用于序列分类 在测试集上,SVM的f1得分达到0.81152,BiLSTM达到0.80,而BERT达到〜0.83 f1得分。
2023-03-20 16:46:11 990KB nlp svm binaryclassification JupyterNotebook
1
广告实时竞价数据,是广告牌、商场广告位和互联网广告栏中的广告位的实时竞价情况信息,用以训练有偏模型和预测客户点击。
1
简街市场预测 作者:刘增丰,崔贤ji,郑家杰 在此项目中,目标是根据市场价格从130点的时间序列中预测市场份额的未来回报值。 该数据集是从竞赛中获得的。 以下是实现这些目标的一些可能步骤: 去噪 滚动平均值 使用小波变换的阈值 使用的机器学习模型: 决策树(CART) 线性回归 k最近邻居 人工神经网络 卷积神经网络
2023-01-02 15:45:06 141KB JupyterNotebook
1
Kaggle竞赛解决方案-使用LightGBM算法预测二手商品的成交概率 avito是一家俄罗斯公司,从网站上来看是一个线上购物平台,这一次题目的目标,就是预测某一个商品在某一天被售出的概率,给定的数据有一段时间内的商品的销售情况(数量,价格,地区,品类,商品的俄文描述,商品的图片)等信息。 Avito提供了多个数据集, 除了主要的训练集(train.csv, 150万+样本)和测试集(test.csv, 50万+样本)外, 还有train_active.csv/test_active.csv(和train/test同时期的数据, 但没有成交概率和图片信息); periods_train.csv/periods_test.csv(只包含了active数据中每件商品的id, activation_date - 广告投放日期, date_from/date_to - 广告展示的第一天和最后一天); train_jpg.zip/test_jpg.zip(train和test样本的图片)。
2022-12-14 20:27:02 298KB python lightGBM 机器学习
1
Kaggle-Playground-Series-March-2021 存储库已保存,以显示Kaggle竞赛游乐场系列-2021年3月的工作”。
2022-11-15 14:23:16 4.4MB HTML
1
从一系列 CT 影像中对肺部影像进行分割,并识别估计肺部容积量。
2022-11-05 09:59:43 529.02MB Kaggle CT影像 图像分割 智慧医疗
1
kaggle竞赛训练集cifar-10
2022-10-15 09:03:06 715.4MB 深度学习 数据集
1