只为小站
首页
域名查询
文件下载
登录
医学文本数据集-癌症
文档分类
数据集
医学文本数据集-癌症
文档分类
数据集,该数据集集中于页面大小超过6页的长研究论文,分类为3类,“甲状腺癌”,“结肠癌”,“肺癌”。 医学文本数据集-癌症
文档分类
数据集,该数据集集中于页面大小超过6页的长研究论文,分类为3类,“甲状腺癌”,“结肠癌”,“肺癌”。
2022-12-23 11:26:22
55.93MB
医学
文本
癌症
文档
imdb数据集:电影用于
文档分类
。
imdb数据集:用于
文档分类
。
2022-10-26 16:59:14
154.07MB
分类
数据挖掘
人工智能
机器学习
1
Hierarchical-Attention-Network:“
文档分类
的分层注意网络”的实现
分层注意网络 我对“ ”的实现(Yang等,2016) Yelp的数据可从下载(与Yang的论文中使用的数据集相同) 下载链接: : 将数据放在名为“ data / yelp_YEAR /”的目录中(其中“ YEAR”为年份) 运行“ yelp-preprocess.ipynb”以预处理数据。 格式变为“标签\ t \ t句子1 \ t句子2 ...”。 然后运行“ word2vec.ipynb”以从训练集中训练word2vec模型。 运行“ HAN.ipynb”以训练模型。 运行“ case_study.ipynb”以运行验证集中的一些示例的可视化,包括注意力向量(句子级别和单词级别)和预测结果。 现在,我们在yelp2013测试仪上获得了约65%的准确度。 对超参数进行微调后,它可能会更好。 我们使用的超参数 时代 批量大小 GRU单位 word2vec大小 优化器 学
2022-05-06 10:34:48
5.69MB
nlp
rnn
attention-mechanism
paper-implementations
1
基于Word2vec的
文档分类
首先采用 Google 的 Word2Vec 工具,从海量的文本(本文) 中,使用神经网络学习得到词典中每个词的向量表示。然后根据向量,对词 典中的每个词进行聚类,例如聚类成 500 类(新的“词典”) 。而后,使用工具 对每个文档提取代表性的关键词。每个关键词都在前面的聚类中找到自己的 类别。这样类似多媒体技术中讲授的向量空间模型(VSM) ,每个文档都可以 用过关键词词频表示成一个 500 维的向量,这个向量就是这个文档的“特征向 量”。
2022-02-10 14:16:07
338KB
Word2vec
pdf
1
Hierarchical-attention-networks-pytorch:用于
文档分类
的分层注意网络-源码
[PYTORCH]用于
文档分类
的分层注意网络 介绍 下面是我的文件分层关注网络的
文档分类
描述的模型的pytorch实现。 Dbpedia数据集模型输出结果的应用程序演示示例。 我的模型对Dbpedia数据集的性能示例。 如何使用我的代码 使用我的代码,您可以: 使用任何数据集训练模型 给定我训练有素的模型或您的模型,您可以评估具有相同类集的任何测试数据集 运行一个简单的Web应用进行测试 要求: python 3.6 火炬0.4 张量板 tensorboardX (如果不使用SummaryWriter,则可以跳过此库) 麻木 数据集: 我用于实验的数据集的统计信息。 这些数
2021-11-26 21:50:56
49.66MB
python
nlp
deep-neural-networks
deep-learning
1
python朴素贝叶斯实战案例--
文档分类
,输入一篇文章,输出这个文章属于什么类型
使用python进行朴素贝叶斯方法预测,对具有20个主题的10万多篇文章进行训练,要求给出一篇文章,预测输出这篇文章属于什么类型
2021-11-15 11:05:40
3KB
python
机器学习
朴素贝叶斯
文档分类
1
BayesProject.rar
1. 实验数据在bayes_datasets文件夹中。其中, train为训练数据集,包含hotel和travel两个中文文本集,文本为txt格式。hotel文本集中全部都是介绍酒店信息的文档,travel文本集中全部都是介绍景点信息的文档; Bayes_datasets/test为测试数据集,包含若干hotel类文档和travel类文档。 2. 用朴素贝叶斯算法对上述两类文档进行分类。要求输出测试数据集的
文档分类
结果,即每类文档的数量。
2021-11-09 16:25:15
593KB
朴素贝叶斯
文档分类
1
用Python开发一个自然语言处理模型(
文档分类
垃圾过滤),并用Flask进行部署。
Develop a NLP Model in Python & Deploy It with Flask, Step by Step,用Python开发一个自然语言处理模型(
文档分类
垃圾过滤),并用Flask进行部署,手把手教程,by Susan Li。
2021-10-07 11:52:41
337KB
Python
NLP
文档分类
Flask
1
论文研究-基于新的关键词提取方法的快速文本分类系统.pdf
关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法(FS),并利用TFIDF算法来筛选出关键词以完成将Web文档进行快速有效分类的目的。实验表明,该方法在不影响分类准确率的情况下,分类的速度明显提高。
2021-09-15 23:23:21
251KB
计算机应用
中文信息处理
关键词提取
Web文档分类
1
Document TagExplorer V2.7 [正式版].rar
可能是目前国内最好的一款免费文档标签式分类管理工具,可以通过给文件、文件夹打标签,来对文件和文件夹实现多维度的分类、组织和维护。
2021-08-11 18:01:26
2.04MB
标签
tag
文档管理
文档分类
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
科研伦理与学术规范 期末考试2 (40题).pdf
上帝之眼和拾荒者.rar
2021华为芯片研发岗位笔试题
麻雀搜索算法(SSA)优化bp网络
RNN-LSTM卷积神经网络Matlab实现
mingw-w64-install.exe
离散时间信号处理第三版课后习题答案
CNN卷积神经网络Matlab实现
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
MPC 模型预测控制matlab仿真程序
中小型企业网络建设.pkt
数据结构课后习题答案
Spring相关的外文文献和翻译(毕设论文必备)
基于STM32的电子时钟设计
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
最新下载
这个G1810清零,被忽悠惨了,顺序弄相反的,后来终于搞明白 亲测好用!
晶创智能电梯IC卡管理系统V5.exe
WINCC OA中文手册
电工学教程(包括数电,模电).zip
Domino NotesV11开放下载啦!
代码编译器
小型编译器代码.rar
岛通MAC3系列温控仪操作流程图
xlib编程手册
东北大学软件学院软件测试期末复习题
其他资源
MATLAB仿真高速目标检测-基于keystone变换的微弱目标检测.pdf
jspdf.debug.js
软件工程课程设计----酒店客房管理系统
NanoParticleScatter.fsp
c AES, c++ AES, java AES, 互通, 加密解密
全国高校专业库,MYSQL脚本,一键导入
3dmax海洋模型
电气设计CAD常用图例(含3张图).dwg
NoteLight2013
基于单片机的自动售货机系统设计
MFCC的详细介绍PPT
h264_h265.rar
Python 笔记.txt
jdk17_source_code.zip
网络协议FAQ之二层协议篇 V2.0.pdf
#AIX+5L操作系统维护手册.docx
《嵌入式VxWorks系统开发与应用》电子书
编译原理23-30
java 汉字字典包,可以查询汉子的拼音,部首,笔画数等操作
一个招标网站的整站源代码(asp+access)
C51单片机及应用系统设计[徐煜明][电子教案]
jasperreport 生成pdf实现下载与打印
crc8字节查表算法