只为小站
首页
域名查询
文件下载
登录
使用Apache-Spark进行
文本分析
:这是一个使用Apache Spark,pySpark,Pandas,Numpy的文本挖掘项目。-源码
使用Apache-Spark进行
文本分析
:这是一个使用Apache Spark,pySpark,Pandas,Numpy的文本挖掘项目。
2021-07-12 14:27:54
708KB
JupyterNotebook
1
论文中用到的部分基础
文本分析
技术(包括分词、去除停用词、word2vec、TF-IDF、词云图、名称提取、词性标注、LDA主题模型)
论文中用到的部分基础
文本分析
技术(包括分词、去除停用词、word2vec、TF-IDF、词云图、名称提取、词性标注、LDA主题模型)
2021-07-08 15:02:47
6MB
分词
去除停用词
word2vec
TF-IDF
基于《诗经》语料的实验结果表明: 现有机器学习及自然语言处理技术可以对《诗经》文本做出一些有较好解释性的工作,验证已有的文学研究论点,并在传统的研究范式之外,对
诗歌在中国是一个极为重要且历史悠久的文学体裁。纵横千年的时间跨度、数量巨大的诗人群体、卷帙浩繁的诗歌文本都使得在传统的文本阅读方式下,中国诗歌的宏观把握变得极其不易。因此,随着计算机算力与计算模型的发展,越来越多的研究者将目光聚焦到了使用计算机对诗歌进行
文本分析
的研究领域,已有研究者对中国古诗进行了统计建模与宏观分析$^{[1]}$,但所用文本语料多为《全唐诗》《全宋词》等,以《诗经》为语料的
文本分析
研究,未之有也。因此需要有人在这个方面进行一些探索,本文便是一次尝试, 试图从另一个视角出发,更高效地处理《诗经》文本,并提供
文本分析
视角下对《诗经》的宏观刻画、描述与阐释。 本文从字频、词频、文本长度、文本方差、情感分析、提取主题词等各个维度,对《诗经》进行了以下
文本分析
: 首先从单字的角度,对诗经进行了字数、字频、各句长度方差等统计。 经过效果对比,选用北京大学的分词工具Pkuseg,对《诗经》进行分词处理。 在分词基础上统计词频且生成词云。 通过文本长度,文本方差来寻找风雅颂三部分之间的差异。 通过对《诗经》中篇目的情感分析,绘制出风雅颂各部分的情感变化曲线。 提取出文本中的主题词,并以此为基础构建出每篇作品的文本向量。 选定文本长度,文本方差,文本向量作为作品的三个特征,共同组成一个样本来表达一篇作品。 抽取样本,通过计算距离的方式对《诗经》中风雅颂三部分进行聚类,绘制出表达聚类效果的轮廓系数曲线。 以束皙的六首《补亡诗》与陶渊明的四首《时运》为例,计算二者作品与《诗经》的相似程度。
2021-07-08 15:02:42
6.63MB
文本分析
K-mean聚类
文本相似度
情感分析
利用爬虫爬取微博用户微博,对所发微博文本进行可视化、
文本分析
实现根据给定目标用户的微博UID,得到目标用户微博个人资料,保存到本地 依据目标用户微博UID抓取一定时期内目标用户所发(原创和转发)微博(包含图片、视频),保存到本地 依据所抓取目标用户微博内容、目标用户头像制作目标用户微博关键词词云 依据目标用户微博个人资料,制作目标用户个人电子名片 可视化目标用户日、月、年度微博点赞数、转发数 依据目标用户原创微博所@用户,可视化用户好友关系图 设置评论数阈值,爬取目标用户热门微博下热评 统计目标用户热门微博下热评次数较多用户,挖掘目标用户狂热粉丝
2021-07-08 15:02:41
8.25MB
爬虫
微博文本
可视化、
文本分析
python
文本分析
与处理
python
文本分析
与处理,比较轻量级的资源文件。 python
文本分析
与处理,比较轻量级的资源文件。
2021-07-02 22:09:13
787KB
python,文本
1
ROSTCM6+大连理工大学情感文本 做
文本分析
的有需要的自来取 免费
ROSTCM6+大连理工大学情感文本 做
文本分析
的有需要的自来取,。方便做旅游文本挖掘,在线评论的同学 !记得点赞啊
2021-06-26 03:47:35
15.72MB
ROSTCM6+大连理工大学情感
1
石油价格预测情感分析LSTM.zip
石油价格预测情感分析LSTM,通过对石油标题的进行情感分析,使用SVM,ARIMA,GARCH,LSTM模型进行预测
2021-06-23 15:06:29
955KB
机器学习
深度学习
文本分析
1
2021.6.20-股评师分析报告文本情感分析预测股价.zip
股评师分析报告文本情感分析预测股价
2021-06-23 14:06:49
36.74MB
文本分析
情感分析
1
R语言
文本分析
案例词云图.pdf
见习报告一份数据来自狗熊会。做了词云分析、回归分析。内置R语言代码。 版权声明:代码下载只能自己学习使用,切勿用于商业用途,违者必究。
2021-06-21 08:36:26
724KB
R语言案例
词云图
文本分析
统计分析
1
Stock_Market_Prediction:使用数值和
文本分析
进行的股票市场预测-源码
股票市场预测 使用Stakced LSTM使用数值和
文本分析
进行的股市预测 股票数据集-https: 新闻数据集-https: persistentId doi: /DVN/
2021-06-20 17:36:21
357KB
JupyterNotebook
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
基于S函数的BP神经网络PID控制器及Simulink仿真和对应代码模型.zip
CPLEX12.8学术版安装包:cplex_studio128.win-x86-64.exe
CUDA并行程序设计 GPU编程指南-中文扫描539页完整版pdf+高质量英文完整591页原版非扫描pdf
《MIMO-OFDM无线通信技术及MATLAB实现》高清PDF及源代码
SSM外文文献和翻译(毕设论文精品).doc
BP神经网络+PID控制simulink仿真
基于Matlab的PI/4 DQPSK的调制解调源代吗
matpower5.0b1.zip
基于ray filter的雷达点云地面过滤ROS节点
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
数字图像处理[冈萨雷斯]
中国地面气象站观测数据2000-2021
商用密码应用与安全性评估——霍炜.pdf
EBSD分析软件——Channel5下载安装教程
2019西门子杯六部十层电梯群控参考程序.zip
最新下载
国际10-20系统脑电极分布VISO图图.vsdx
校园导游系统课程设计报告
千分尺 螺旋测微器 flash动画
ROSE mirror HA 双机热备软件
魂斗罗素材
国开《计算机绘图》课程形考1-4 .dwg答案(可直接使用)
DS18B20温度采集+串口发送+模块化编程 51单片机
Plex v7.12电视端app
IBM CPLEX 12.10 学术版 mac操作系统安装包
ADC参数测试资料&matlab源程序
其他资源
win10破解多用户远程登录桌面补丁
学习图像处理最常用的图片(很齐全很强大)
compressed sensing theory and applications
中科大软院高级网络工程(张信明老师版)课后作业答案汇总
ActiveTcl-8.5.18.0.298892_64位.rar
nxt-sms-route.zip
CFAR算法 MATLAB仿真(一段CFAR 的程序)
房屋销售管理系统源码
labview 界面切换
Easysize VCL
编译好的Caffe2压缩包
深度学习方法及应用PDF高清晰完整版
基于模糊逻辑的自适应α-β滤波新算法
ht1621中文数据手册.pdf
基于Vague集的客运专线列车运行图方案优选方法
2017年同等学力申硕经济学综合真题及答案精解.pdf
依码仕喷码机通讯协议
学生信息管理系统(本系统的开发环境为Visual C# 2008和Access 2003)
VS2008 MFC简易计算器
基于单片机控制的汽车前照灯自适应系统
linux下的tftp server端的源码
JAVA雷霆战机
图像隐写F5 JAVA源代码
zmodemclass的经典源码,原来旧的代码,有很多问题,比如文件名读取错误等,都已经被我修复。
音乐播放器APP_AndroidMusicPlayerSource1.6[免积分]
双馈异步发电机