谭松波--酒店评论语料.rar
2021-12-22 18:05:02 9.88MB
1
情感分类 情感分类是情感分类的项目。(以Yelp审查为输入) 资料资源 什么是新的 3.1 探索其他数字特征(而不是仅文本) 利用“有用”信息(由yelp提供的属性)进行weighted samples实验 使用“均值”处理缺失值 2.4 伯特转移学习 建立和调整bert模型。 可视化数据分配 2.3 改变表达句子向量的方式 建立和调整LSTM模型。 2.2 建立和调整LinearSVC模型。 建立和调整BernoulliNB模型。 建立和调整MLPClassifier模型。 建立和调整LogisticRegression模型。 建立和调整DecisionTree模型。 2.1 使用W2F创建情感分类 训练word representation模型 使用TSNE和PCA探索单词表示 1.1 使用tf-idf创建情感分类 建立和调整LinearSVC模型。 建立和调
2021-12-22 16:36:41 1.51MB visualization nlp yelp pca
1
信任飞行员刮板 适用于trustpilot.com评论的Python抓取工具。 依存关系 Python 3.6 lxml 3.7.2 要求2.12.4 用法 设置并配置以将您希望审阅的页面抓取到CSV文件中 使用模块将此CSV文件转换并清除为大多数文本分类算法使用的格式 情绪分析 运行scrape and clean之后,您可以使用sci-kit中的来学习文本分类。
2021-12-22 16:35:16 4KB JupyterNotebook
1
抖音是一款音乐创意短视频社交软件,是一个专注年轻人的15秒音乐短视频社区。用户可以通过这款软件选择歌曲,拍摄15秒的音乐短视频,形成自己的作品。此App已在Android各大应用商店和APP Store均有上线。 在design包里面 有一个 BottomSheetDialogFragment 这个Fragment,他已经帮我们处理好了手势,所以实现起来很简单。下面是代码: public class ItemListDialogFragment extends BottomSheetDialogFragment { // TODO: Customize parameter argumen
2021-12-22 10:54:20 50KB id recyclerview swiperefreshlayout
1
IMDB_Sentiment_Analysis 鉴于大量的在线评论数据(Amazon,IMDB等),情绪分析变得越来越重要。 在这个项目中,建立了一个情感分类器,用于评估一段文字的极性是正还是负。 情感分析是在Keras随附的IMDB数据集上完成的。 它由25,000个训练样本(其中20%是验证样本)和25,000个测试样本组成。 数据集中的所有单词均已预先标记。 使用自训练的单词嵌入(Keras嵌入层)。 我训练了不同的模型,其中一个模型包含一个LSTM层。 它在10个时元上的准确度为84%。 第二个示例由两组Conv1D和MaxPooling1D图层组成,后面是标准GRU图层。 观察到85%的准确性。 我已经将CuDNN层用于LSTM和GRU,因为它们在GPU上的速度比标准LSTM和GRU层快得多。 所有实现都是使用Keras进行的。 另一个具有RMS Prop精度的示例为84%,而
2021-12-21 16:05:55 95KB JupyterNotebook
1
有毒评论分类挑战笔记本 在其上查看该比赛的详细信息 要求 数据可以从下载一些笔记本使用GloVe预先训练的单词向量。 可以在下载(请注意版本)。 到目前为止,Kaggle得分 RCNN-0.9721 字符级深RCNN-0.9750 Logistic回归+朴素贝叶斯SVM-0.9797 RCNN v2-0.9799 合并的RCNN-0.9837 LG NB-SVM +合并RCNN集成-0.9850 LG NB-SVM + RCNNv3 + CharRCNN集成-0.9855
2021-12-21 16:03:56 338KB JupyterNotebook
1
之前有人买这个东西,现在放出来吧,鬼鬼js生成的结果用不了,普通V8生成的同样无法使用,RSV8可以跑得通,可以安装支持库以后就可以跑起来了。rsv8压缩后也有4m,就不分卷了。
2021-12-21 15:11:26 8KB 网络相关源码
1
Customer_satisfaction_Analysis 结果整合 Demo 演示 基于用户 UGC 的在线民宿满意度挖掘,负责数据采集、主题抽取、情感分析等任务。开发的目的是克服用户打分和评论不一致,实现了在线评论采集和用户满意度分析。 主要功能包括在线原始评论采集、主题聚类、评论情感分析与结果可视化展示等四个模块,如下所示。 提取后的民宿地址和在线评论等信息如下。 搭建了百度地图 POI 查询入口,可以进行自动化的批量查询地理信息。 通过高频词可视化展示,归纳出评论主题。 构建了基于在线民宿语料的 LDA 自动化主题聚类模型,利用主题中心词能找出对应的主题属性字典,并使用用户打分作为标注,然后通过多种分类模型,选用最优模型对提出的评价主体 进行情感分析,针对主题属性表进行主题提取后的文本进行情感分析,分别得出当前主题对应的情感趋势,横坐标为所有关于主题为“环境”的情感得分,纵坐标为
1
文本情感分析技术鉴于主题模型在文本挖掘领域的优势,基于主题的文本情感分析技术也成为人们关注的热点,其主要任务是通过挖掘用户评论所蕴含的主题、以及对这些主题的情感偏好,来提高文本情感分析的性能。
2021-12-20 23:30:15 20.79MB 内有代码,部分数据,成果图 NLP
1
随着互联网的发展,用户倾向于在购物、旅游、用餐之前参考线上评论.之后,他们也会发表评论来表达自身意见.线上评论越来越具有价值.评论对用户决策的重要导向作用催生了虚假评论.虚假评论,指用户由于利益、个人偏见等因素发布的不符合产品真实特性的评论.这些虚假评论语言上模仿真实评论,消费者很难识别出来.国内外学者综合运用自然语言处理技术来研究虚假评论检测问题.从特征工程的角度分析,虚假评论检测方法可以分为三类:基于语言特征和行为特征的方法、基于图结构的方法、基于表示学习的方法.主要描述了检测的一般流程,归纳了三类研究方法常用的特征,比较了方法的优缺点,并且介绍了研究常用的数据集.最后探讨了未来研究方向.
1