只为小站
首页
域名查询
文件下载
登录
医学文本数据集-癌症
文档分类
数据集
医学文本数据集-癌症
文档分类
数据集,该数据集集中于页面大小超过6页的长研究论文,分类为3类,“甲状腺癌”,“结肠癌”,“肺癌”。 医学文本数据集-癌症
文档分类
数据集,该数据集集中于页面大小超过6页的长研究论文,分类为3类,“甲状腺癌”,“结肠癌”,“肺癌”。
2022-12-23 11:26:22
55.93MB
医学
文本
癌症
文档
imdb数据集:电影用于
文档分类
。
imdb数据集:用于
文档分类
。
2022-10-26 16:59:14
154.07MB
分类
数据挖掘
人工智能
机器学习
1
Hierarchical-Attention-Network:“
文档分类
的分层注意网络”的实现
分层注意网络 我对“ ”的实现(Yang等,2016) Yelp的数据可从下载(与Yang的论文中使用的数据集相同) 下载链接: : 将数据放在名为“ data / yelp_YEAR /”的目录中(其中“ YEAR”为年份) 运行“ yelp-preprocess.ipynb”以预处理数据。 格式变为“标签\ t \ t句子1 \ t句子2 ...”。 然后运行“ word2vec.ipynb”以从训练集中训练word2vec模型。 运行“ HAN.ipynb”以训练模型。 运行“ case_study.ipynb”以运行验证集中的一些示例的可视化,包括注意力向量(句子级别和单词级别)和预测结果。 现在,我们在yelp2013测试仪上获得了约65%的准确度。 对超参数进行微调后,它可能会更好。 我们使用的超参数 时代 批量大小 GRU单位 word2vec大小 优化器 学
2022-05-06 10:34:48
5.69MB
nlp
rnn
attention-mechanism
paper-implementations
1
基于Word2vec的
文档分类
首先采用 Google 的 Word2Vec 工具,从海量的文本(本文) 中,使用神经网络学习得到词典中每个词的向量表示。然后根据向量,对词 典中的每个词进行聚类,例如聚类成 500 类(新的“词典”) 。而后,使用工具 对每个文档提取代表性的关键词。每个关键词都在前面的聚类中找到自己的 类别。这样类似多媒体技术中讲授的向量空间模型(VSM) ,每个文档都可以 用过关键词词频表示成一个 500 维的向量,这个向量就是这个文档的“特征向 量”。
2022-02-10 14:16:07
338KB
Word2vec
pdf
1
Hierarchical-attention-networks-pytorch:用于
文档分类
的分层注意网络-源码
[PYTORCH]用于
文档分类
的分层注意网络 介绍 下面是我的文件分层关注网络的
文档分类
描述的模型的pytorch实现。 Dbpedia数据集模型输出结果的应用程序演示示例。 我的模型对Dbpedia数据集的性能示例。 如何使用我的代码 使用我的代码,您可以: 使用任何数据集训练模型 给定我训练有素的模型或您的模型,您可以评估具有相同类集的任何测试数据集 运行一个简单的Web应用进行测试 要求: python 3.6 火炬0.4 张量板 tensorboardX (如果不使用SummaryWriter,则可以跳过此库) 麻木 数据集: 我用于实验的数据集的统计信息。 这些数
2021-11-26 21:50:56
49.66MB
python
nlp
deep-neural-networks
deep-learning
1
python朴素贝叶斯实战案例--
文档分类
,输入一篇文章,输出这个文章属于什么类型
使用python进行朴素贝叶斯方法预测,对具有20个主题的10万多篇文章进行训练,要求给出一篇文章,预测输出这篇文章属于什么类型
2021-11-15 11:05:40
3KB
python
机器学习
朴素贝叶斯
文档分类
1
BayesProject.rar
1. 实验数据在bayes_datasets文件夹中。其中, train为训练数据集,包含hotel和travel两个中文文本集,文本为txt格式。hotel文本集中全部都是介绍酒店信息的文档,travel文本集中全部都是介绍景点信息的文档; Bayes_datasets/test为测试数据集,包含若干hotel类文档和travel类文档。 2. 用朴素贝叶斯算法对上述两类文档进行分类。要求输出测试数据集的
文档分类
结果,即每类文档的数量。
2021-11-09 16:25:15
593KB
朴素贝叶斯
文档分类
1
用Python开发一个自然语言处理模型(
文档分类
垃圾过滤),并用Flask进行部署。
Develop a NLP Model in Python & Deploy It with Flask, Step by Step,用Python开发一个自然语言处理模型(
文档分类
垃圾过滤),并用Flask进行部署,手把手教程,by Susan Li。
2021-10-07 11:52:41
337KB
Python
NLP
文档分类
Flask
1
论文研究-基于新的关键词提取方法的快速文本分类系统.pdf
关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法(FS),并利用TFIDF算法来筛选出关键词以完成将Web文档进行快速有效分类的目的。实验表明,该方法在不影响分类准确率的情况下,分类的速度明显提高。
2021-09-15 23:23:21
251KB
计算机应用
中文信息处理
关键词提取
Web文档分类
1
Document TagExplorer V2.7 [正式版].rar
可能是目前国内最好的一款免费文档标签式分类管理工具,可以通过给文件、文件夹打标签,来对文件和文件夹实现多维度的分类、组织和维护。
2021-08-11 18:01:26
2.04MB
标签
tag
文档管理
文档分类
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
2020年数学建模B题穿越沙漠全部代码全国赛二等奖.zip
基于YOLOV5的车牌定位和识别源码.zip
上帝之眼和拾荒者.rar
基于VMD算法的信号降噪.rar
2022学术英语写作(东南大学) 章节测试+期末test答案
基于MQ2烟雾传感器的STM32F103程序
IEEE 39节点系统的Simulink模型
西安问题电缆-工程伦理案例分析.zip
Python+OpenCV实现行人检测(含配置说明)
超大规模集成电路先进光刻理论与应用.pdf
商用密码应用与安全性评估——霍炜.pdf
毕业设计:基于Python的网络爬虫及数据处理(智联招聘)
quartus II13.0器件库.zip
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
东南大学英语技术写作慕课所有答案
最新下载
轻量级编辑器-Notepad++
E-office最新完美注册机
NCSENTRYv2.1 数控系统传输通信软件
瑞美5.0SETUP2017 201902010.rar
计算机考研复试问题汇总(带答案)
压缩感知稀疏贝叶斯算法
时差定位GDOP计算
动态心电图分析软件支持TLC3000 TLC4000 直接使用。
802.1Qav-2009.pdf
circuit workstation
其他资源
小米游戏本2019黑苹果 OC引导文件分享
win10远程桌面连接工具
CISP学习资料
模糊神经网络的水质评价代码
关键词标题生成器
unity机器人模型包
spam_train.csv
java解决hive快速导数据到Hbase代码
jsp学生课绩管理系统(源代码+论文).zip
6713的程序固化和flash引导
单电机BTN驱动PCB 原理图
ionic3仿京东商城源码
Modbus Poll 9.5.0.1507.zip
2020抖音创作者生态报告-抖音&巨量算数-2020-38页.pdf
java8 API 文档
ubuntu交叉编译mysql的C语言程序到ARM开发板
Learning TensorFlow.pdf
VC++中文繁体、简体(BIG-GBK)编码转换程序
echarts与百度地图结合
如何获取Windows系统登陆用户名
Learning the bash Shell(中文版第二版)