tweets twitter.csv
2024-05-08 08:52:52 81.15MB 数据集
1
提交Kaggle竞赛“真实与否?NLP与灾难鸣叫”(排名前25%) 挑战链接: : 链接到公共Kaggle笔记本(SVM): : 在此存储库中,您将找到3个笔记本: 一种使用spaCy字向量和SVM的 一种使用BiLSTM的 一种将预训练的BERT用于序列分类 在测试集上,SVM的f1得分达到0.81152,BiLSTM达到0.80,而BERT达到〜0.83 f1得分。
2023-03-20 16:46:11 990KB nlp svm binaryclassification JupyterNotebook
1
Kaggle_Disaster_Tweets 带有灾难性推文的自然语言处理:预测哪些推文与真实灾难有关,哪些不与真实灾难有关任务开始日期:2021.04.04 任务说明:使用火车数据中的信息,构建模型以预测某条推文是否与真实灾害有关 火车数据集说明: 列 描述 有效/缺失 遗失率 'ID ' 每条推文的唯一标识符(推文编号) 7613/0 0% '关键词' 推文中的特定关键字 7552/61 1% '地点' 发推文的位置 5080/2533 33% '文本' 推文的文字 7613/0 0% '目标' 这条推文是否是一场真正的灾难(标签) 7613/0 0% 测试数据集说明: 列 描述 有效/缺失 遗失率 'ID ' 每条推文的唯一标识符(推文编号) 7613/0 0% '关键词' 推文中的特定关键字 3237/26 1% '地点' 发
2023-02-04 19:10:35 2KB Python
1
两个没有ML知识的家伙开始创建一个神经网络来进行Twitter情绪分析。 :D 如何使用: 将情感分析数据集提取到“ full_data”(或任何您想要的数据) 运行“ python3 split_data.py full_data 1000”,将训练数据分成随机的1000条不良tweets和1000条良好tweets。 运行'python3 ffn_twitter.py'。 当前,您必须对文件名进行硬编码。
2022-10-20 10:53:14 56.11MB twitter tweets sentiment-analysis neural-network
1
Twitter爬虫 从Twitter抓取推文 产品特点 刮旧推文 按用户名抓取 刮擦顶级推文
2022-03-30 00:02:13 7KB python scraper twitter tweets
1
Word2Vec_Twitter 关于 该存储库使用代码和, 。 此zip包含在Twitter数据上训练的word2vec模型,如以下所述: 戈丁,F.,Vandersmissen,B.,De Neve,W.,&Van de Walle,R.(2015)。 多媒体实验室@ ACL W-NUT NER共享任务:使用分布式单词表示法为Twitter微博命名实体识别。 Anos用户生成的文本研讨会,ACL 2015。 免责声明 如果使用该模型,请引用本文。 该zip包含2个其他文件,可使用Python读取word2vec模型。 用于此目的的代码是从Gensim库中提取的,可以在以下位置找到:
2022-03-23 15:01:54 18KB machine-learning twitter word2vec word2vec-model
1
介绍 TweetScraper可以从获得推文。 它基于构建,无需使用 。 爬网的数据不如API所获得的那么干净,但是好处是您可以摆脱API的速率限制和限制。 理想情况下,您可以从Twitter搜索获取所有数据。 警告:请保持礼貌,并遵守。 安装 安装conda ,您可以从获得它。 经过测试的python版本是3.7 。 安装Seleniumpython绑定: : 。 (注意: KeyError: 'driver'是由错误的设置引起的) 对于ubuntu或debian用户,运行: $ bash install.sh $ conda activate tweetscraper $ sc
2022-02-04 11:13:53 15KB twitter tweets scrapy twitter-search
1
Sentiment_analysis_twitter 总览 分析表情符号在改善情感分析结果中的作用。 使用Twitter StreamAPI收集Twitter数据,并使用TF-IDF对推文进行矢量化处理。 使用矩阵创建一个正向和负向矢量,并使用余弦相似度来确定给定推文为正或负的程度。 通过转换unicode将Emoji表情合并到推文中,并重复该过程。 将过程分类提高了15%。 动机 了解人类的情感和理智向来是我的痴迷。 借助我的数据科学技能,我想了解人们如何在社交网络上表达情感,也就是情感分析。 作为一个狂热的Twitter用户,我知道限制少于140个字符如何迫使人们进行创新,以及表情符号如何
2021-10-30 10:41:59 34.11MB emoji nlp machine-learning tweets
1
推特激活的加密货币交易者 2021年2月11日-已在DOGE / BTC(Kraken&Binance),DOGE / GBP,BTC / GBP(Binance)上进行过测试,并从Elon最新的Doge微博中成功获得了17%和3%的回报 想法是使用Twitter触发器购买加密货币,并在用户指定的时间/价格/%收益后出售,例如当Elon麝香关于狗狗币的推文时 市场,特别是小市值的山寨币受到``炒作''加密货币,加密泵之后有大量资金的个人的严重影响。 当发布推文时,我们可以成为第一个进行交易的人之一,以利用这一机会 发布Tweet时,它将检查与特定加密货币的关键字匹配的子字符串 这些关键字和硬币可以由用户指定 要在本地系统上配置: pip install -r requirements.txt 使用Binance运行: python twitter_binance.py 与Kraken一
2021-10-21 21:47:08 14KB twitter-bot twitter crypto tweets
1