以微为代表的社交平台是信息时代人们必不可少的交流工具.挖掘微文本数据中的信息对自动问答、舆情分析等应用研究都具有重要意义.短文本数据的分类研究是短文本数据挖掘的基础.基于神经网络的Word2vec模型能很好的解决传统的文本分类方法无法解决的高维稀疏和语义鸿沟的问题.本文首先基于Word2vec模型得到词向量,然后将类别因素引入传统权重计算方法TF-IDF (Term Frequency-Inverse Document Frequency)设计词向量权重,进而用加权求和的方法得到短文本向量,最后用SVM分类器对短文本做分类训练并且通过微数据实验验证了该方法的有效性.
2023-03-16 16:35:47 977KB Word2Vec 短文本分类 TF-IDF
1
浪潮FS8500可以使用这个MIB对snmp中的oid都有解释,通过snmpwalk可以正常获取对应值
2023-03-14 22:19:56 979KB snmp mib
1
1000个男头像微信头像QQ头像微头网络头像真实头像压缩包,共大吉下载。图片来自网络,侵权请留言
2023-03-14 15:24:13 8.63MB 头像 男头像 网络头像 微信头像
1
基于安卓Android的新浪微系统毕业课程设计源码:实现了微信息的展示,发送微,发布评论,显示好友信息等! 基于安卓Android的新浪微系统毕业课程设计源码:实现了微信息的展示,发送微,发布评论,显示好友信息等!
2023-03-13 22:27:04 8.45MB 安卓 移动开发 毕业设计 课程设计
1
GP佳以太网打印机测试及设置工具,包括佳网口打印机查找,设置IP等功能。
2023-03-09 11:27:31 1.58MB 佳博ip设置 打印机IP设置
1
科SAN交换机常用命令,小白必备,老司机的整理文档笔记
2023-03-08 23:01:45 245KB 博科SAN
1
随着Internet技术的迅速发展,网络舆情监控系统正在得到广泛应用。网络舆情监控系统的数据量也急速膨胀,如何高效地存储和管理这些海量的非结构或半结构化数据成为网络舆情系统研发中的挑战课题。传统的关系数据库和分布式计算等数据处理的方式也越来越不能适应日益增长网络大数据。针对微数据的特点建立了一种面向微舆情应用的Hadoop存储平台的多层体系架构,并采用列数据库设计多种微结构化数据的表结构,以及表之间的关系模型。测试结果表明,设计的存储管理平台具有检索响应速度快、可扩展性好等特点。
2023-03-06 13:41:00 504KB 舆情分析
1
TIA途中通用函数库指令FIFO先入先出的具体使用方法
2023-03-06 00:55:22 3.09MB TIA博途 通用函数库指令 FIFO 先入先出
自然语言处理+2020年初微数据(疫情相关)+适用于nlp、数据挖掘模型训练
2023-03-06 00:53:02 2.37MB 数据挖掘 NLP
1
本程序可以连续爬取一个或多个新浪微用户(如胡歌、迪丽热巴、郭碧婷)的数据,并将结果信息写入文件或数据库。写入信息几乎包括用户微的所有数据,包括用户信息和微信息两大类。因为内容太多,这里不再赘述,详细内容见获取到的字段。如果只需要用户信息,可以通过设置实现只爬取微用户信息的功能。本程序需设置cookie来获取微访问权限,后面会讲解如何获取cookie。如果不想设置cookie,可以使用免cookie版,二者功能类似。 爬取结果可写入文件和数据库,具体的写入文件类型如下: txt文件(默认) csv文件(默认) json文件(可选) MySQL数据库(可选) MongoDB数据库(可选) SQLite数据库(可选) 同时支持下载微中的图片和视频,具体的可下载文件如下: 原创微中的原始图片(可选) 转发微中的原始图片(可选) 原创微中的视频(可选) 转发微中的视频(可选) 原创微Live Photo中的视频(免cookie版特有) 转发微Live Photo中的视频(免cookie版特有)
2023-03-04 11:00:59 111KB python 爬虫 新浪微博
1