以微博为代表的社交平台是信息时代人们必不可少的交流工具.挖掘微博文本数据中的信息对自动问答、舆情分析等应用研究都具有重要意义.短文本数据的分类研究是短文本数据挖掘的基础.基于神经网络的Word2vec模型能很好的解决传统的文本分类方法无法解决的高维稀疏和语义鸿沟的问题.本文首先基于Word2vec模型得到词向量,然后将类别因素引入传统权重计算方法TF-IDF (Term Frequency-Inverse Document Frequency)设计词向量权重,进而用加权求和的方法得到短文本向量,最后用SVM分类器对短文本做分类训练并且通过微博数据实验验证了该方法的有效性.
2023-03-16 16:35:47 977KB Word2Vec 短文本分类 TF-IDF
1
TF图神经网络样本 该存储库是代码版本,对应于介绍具有特征线性调制的图神经网络(GNN)的文章( )。 在本文中,讨论了许多GNN架构: 门控图神经网络(GGNN)( )。 关系图卷积网络(RGCN)( )。 关系图注意力网络(RGAT)-图注意力网络( )对几种边缘类型的概括。 关系图同构网络(RGIN)-图同构网络( )对几种边缘类型的概括。 带有边缘MLP的图形神经网络(GNN-Edge-MLP)-RGCN的一种变体,其中边缘上的消息是使用完整MLP而非单个层来计算的。 关系图动态卷积网络(RGDCN)-RGCN的新变体,其中动态计算卷积层的权重。 具特征线性调制(GNN-FiLM)的图形神经网络-带有FiLM层的RGCN的新扩展。 本文中提出的结果基于该存储库中提供的模型和任务的实现。 此代码已在使用TensorFlow 1.13.1的Python 3.
2023-03-11 09:22:01 25.7MB Python
1
Python 豆瓣书评 bs4多页爬虫 jieba中文分词 tf-idf向量化 kmeans聚类+统计词频 +停用词 douban图书评价 浏览器多页爬虫 jupyter notebook numpy pandas sklearn 数据分析 数据挖掘
2023-03-09 10:46:03 1.57MB 爬虫 NLP kmeans 数据挖掘
1
百度机器阅读理解竞赛 3rd 解决方案 百度机器阅读理解竞赛模型核心代码的 tensorflow 实现 ,排行榜上以0.5BLEU-4+0.5ROUGE-L计为总分来排名,一个 epoch 线上成绩可达到 41+; 获得 final 第三名,最终评审得到二等奖。
2023-03-08 15:43:37 145KB JupyterNotebook
1
情感是音乐最重要的语义信息,音乐情感分类广泛应用于音乐检索,音乐推荐和音乐治疗等领域.传统的音乐情感分类大都是基于音频的,但基于现在的技术水平,很难从音频中提取出语义相关的音频特征.歌词文本中蕴含着一些情感信息,结合歌词进行音乐情感分类可以进一步提高分类性能.本文将面向中文歌词进行研究,构建一部合理的音乐情感词典是歌词情感分析的前提和基础,因此基于Word2Vec构建音乐领域的中文情感词典,并基于情感词加权和词性进行中文音乐情感分析.本文首先以VA情感模型为基础构建情感词表,采用Word2Vec中词语相似度计算的思想扩展情感词表,构建中文音乐情感词典,词典中包含每个词的情感类别和情感权值.然后,依照该词典获取情感词权值,构建基于TF-IDF (Term Frequency-Inverse Document Frequency)和词性的歌词文本的特征向量,最终实现音乐情感分类.实验结果表明所构建的音乐情感词典更适用于音乐领域,同时在构造特征向量时考虑词性的影响也可以提高准确率.
1
PcbLib文件类型、直插元器件、贴片、Altium Designer封装库 SD、TF卡封装PCB文件3D封装Altium Designer库的型号类型如下,总有你需要的一款: Micro SD、Micro SD - duplicate、MICRO SIM、SD、SD 6IN1、SD CARD、SD CARD 全高、SD CARD 半高、SD-1、SD-2、SD-3、SD/MMC、SDCARD-M、SDCARD_A、SDCARD_B、SDPCB、SD_1、TFTF-1、TF-2、TF-3、TF-4、TF-CARD、TF卡 手机、XD
2023-03-05 11:20:49 12.92MB 3d PcbLib文件 SD卡 TF卡
Python 58同城房价bs4 beautiful soup爬虫获取 room_name room_type room_area room_addr0 room_addr1 room_price房价名称类型面积地址价格等 jieba中文分词 tf-idf向量化 kmeans聚类 浏览器多页爬虫 jupyter notebook numpy pandas sklearn 数据分析 数据挖掘
2023-02-22 22:22:27 113KB jieba NLP 爬虫 kmeans
1
PConv_in_tf “使用部分卷积对不规则Kong进行图像修补”第一个tensorflow主实例,使用tensorflow完全实现,而无需修改源代码。 部分转化 使用curr_bin_mask表示当前二进制文件的掩码; conved_mask表示二进制掩码的卷积结果,对应于文本中的sum(M); new_bin_mask表示卷积后的新二进制掩码,更新规则为: ((conved_mask == 0)== 0) 因此,局部卷积的计算如下: Pconv(x)=(Conv(x * curr_bin_mask)*隐蔽掩码+ b)* new_bin_mask 如文本中所述,使用新掩码的操作是为了确保无效输入为零。 网络结构 用局部卷积代替卷积 面膜生成 与原始版本不同,我使用opencv生成了一个掩码,并将无效零件输入设置为零。 为了确保面罩的不规则性而无填充,面罩部分中的单元数也是随机的,
2023-02-22 15:37:58 84KB 系统开源
1
在Tensorflow中使用记忆增强神经网络进行一枪学习。 更新:添加了对Tensorflow v1 *的支持。 本文采用记忆增强神经网络的一站式学习的Tensorflow实现。 目前的执行进度: 实用功能: 图像处理器 指标(精度) 相似度(余弦相似度) LSTM控制器和存储单元 批处理发生器 Omniglot测试人员代码 通过自动编码器进行无监督功能学习 牛/新出生识别 基准数据集是。 所有数据集都应放置在文件夹中。 亚当·桑托罗,谢尔盖Bartunov,马修Botvinick,大安Wierstra,蒂莫西Lillicrap,一次性学习与记忆,增强神经网络,[ ]
1
tf-gpt-2 使用Tensorflow的GPT-2文本模型的Java库 来源: 更多背景: 基本用法 导入库 < dependency> < groupId>com.simiacryptus < artifactId>tf-gpt-2 < version>1.7.1 实例化文本生成器 import com.simiacryptus.text.TextGenerator ; import com.simiacryptus.text.gpt2.GPT2Util ; TextGenerator textGenerator = GPT2Util . get345M(); 产生文字 System . out . println(textGenerat
2023-02-12 23:48:49 50KB Java
1