自然语言处理 我在这里分享了我在IE Univesity的自然语言处理课程中使用的一些代码。 我也分享我所做的项目。 1.计算歌曲的词汇多样性 我遇到一篇文章,讨论一些音乐家在其职业生涯中的整体词汇。 因此,我想将清单上前3位歌手和最后2位歌手的歌曲与我们在课堂上看到的3首歌曲进行比较。 排在首位的是Eminem(毫不奇怪),他的100首最慢的歌曲中使用了大约8,800个单词。 然后是Jay Z(6,900字)和Tupac Shakur(6,600字)。 排在最末的是Spice Girls和Bruno Mars(大约1500个单词)。 我尝试选择看起来在词汇上更加多样化的歌曲,并且与预期的一样,结果表明两组之间的差异很大,而且与我们看到的三首歌曲相比,差异也很大。 (可以在文件1_Lexical_Diversity中找到该代码) 2.分类模型:真实与否? NLP与灾难鸣叫 我们获得了将近1
2023-04-11 16:46:54 7.42MB JupyterNotebook
1
ODIR 我们提交给Kaggle的眼部疾病智能识别(ODIR)问题,作为ENEL 610的最终项目。 作者- 阿迪亚·波瓦尔(Aditya Porwal) 斯帕什·梅塔(Sparsh Mehta) 电气与计算机工程系卡尔加里大学加拿大艾伯塔省。 代码运行说明 代码重现性的逐步 : 可以在这里找到代码:
2023-04-10 16:25:42 2.69MB JupyterNotebook
1
kaggle竞赛Predict Student Performance from Game Play 自己写的项目代码,带注释+讲解 数据集:https://www.kaggle.com/competitions/predict-student-performance-from-game-play/data score为0.678,300/600的rank 竞赛目标: You'll develop a model trained on one of the largest open datasets of game logs. 文件包括: train.csv - the training set test.csv - the test set sample_submission.csv - a sample submission file in the correct format train_labels.csv - correct value for all 18 questions for each session in the training set
2023-04-06 09:56:16 148KB kaggle
1
提交Kaggle竞赛“真实与否?NLP与灾难鸣叫”(排名前25%) 挑战链接: : 链接到公共Kaggle笔记本(SVM): : 在此存储库中,您将找到3个笔记本: 一种使用spaCy字向量和SVM的 一种使用BiLSTM的 一种将预训练的BERT用于序列分类 在测试集上,SVM的f1得分达到0.81152,BiLSTM达到0.80,而BERT达到〜0.83 f1得分。
2023-03-20 16:46:11 990KB nlp svm binaryclassification JupyterNotebook
1
心脏病数据集.zip
2023-03-16 10:05:31 3KB kaggle python
1
Kaggle 癫痫检测挑战 解决方案。 卷积神经网络以一种糟糕的方式应用于原始 EEG 数据:来自不同通道的特征仅在隐藏层中组合。 描述了更好的解决方案。
2023-03-11 19:33:27 57KB Python
1
抓举 Grasp-and-Lift EEG 检测 Kaggle 比赛 设置 需要 pip 和 python 克隆仓库git clone https://github.com/jrubin01/grasp-and-lift.git cd grasp-and-lift 创建虚拟环境virtualenv venv source venv/bin/activate 安装所需的库pip install -r requirements.txt 启动 ipython ipython notebook
2023-03-04 20:14:31 17.11MB Python
1
facial_keypoint 用于面部关键点检测的Kaggle数据集。 清理数据,将图像列分离出一个数组以读取RGB值,然后将数据集分为X和Y值进行学习,使用20%的比例进行测试。 最后,实现了一个具有三个卷积层和两个密集层以及最终密集层作为输出的卷积神经网络。 尚未实施:Tensorboard以提高模型的准确性和损失。
2023-02-07 14:35:07 62KB JupyterNotebook
1
Kaggle_Disaster_Tweets 带有灾难性推文的自然语言处理:预测哪些推文与真实灾难有关,哪些不与真实灾难有关任务开始日期:2021.04.04 任务说明:使用火车数据中的信息,构建模型以预测某条推文是否与真实灾害有关 火车数据集说明: 列 描述 有效/缺失 遗失率 'ID ' 每条推文的唯一标识符(推文编号) 7613/0 0% '关键词' 推文中的特定关键字 7552/61 1% '地点' 发推文的位置 5080/2533 33% '文本' 推文的文字 7613/0 0% '目标' 这条推文是否是一场真正的灾难(标签) 7613/0 0% 测试数据集说明: 列 描述 有效/缺失 遗失率 'ID ' 每条推文的唯一标识符(推文编号) 7613/0 0% '关键词' 推文中的特定关键字 3237/26 1% '地点' 发
2023-02-04 19:10:35 2KB Python
1
Kaggle-SMS-Spam-Collection-Dataset-:使用NLTK和Scikit-learn分类为垃圾邮件或火腿邮件
1