只为小站
首页
域名查询
文件下载
登录
医学文本数据集-癌症
文档分类
数据集
医学文本数据集-癌症
文档分类
数据集,该数据集集中于页面大小超过6页的长研究论文,分类为3类,“甲状腺癌”,“结肠癌”,“肺癌”。 医学文本数据集-癌症
文档分类
数据集,该数据集集中于页面大小超过6页的长研究论文,分类为3类,“甲状腺癌”,“结肠癌”,“肺癌”。
2022-12-23 11:26:22
55.93MB
医学
文本
癌症
文档
imdb数据集:电影用于
文档分类
。
imdb数据集:用于
文档分类
。
2022-10-26 16:59:14
154.07MB
分类
数据挖掘
人工智能
机器学习
1
Hierarchical-Attention-Network:“
文档分类
的分层注意网络”的实现
分层注意网络 我对“ ”的实现(Yang等,2016) Yelp的数据可从下载(与Yang的论文中使用的数据集相同) 下载链接: : 将数据放在名为“ data / yelp_YEAR /”的目录中(其中“ YEAR”为年份) 运行“ yelp-preprocess.ipynb”以预处理数据。 格式变为“标签\ t \ t句子1 \ t句子2 ...”。 然后运行“ word2vec.ipynb”以从训练集中训练word2vec模型。 运行“ HAN.ipynb”以训练模型。 运行“ case_study.ipynb”以运行验证集中的一些示例的可视化,包括注意力向量(句子级别和单词级别)和预测结果。 现在,我们在yelp2013测试仪上获得了约65%的准确度。 对超参数进行微调后,它可能会更好。 我们使用的超参数 时代 批量大小 GRU单位 word2vec大小 优化器 学
2022-05-06 10:34:48
5.69MB
nlp
rnn
attention-mechanism
paper-implementations
1
基于Word2vec的
文档分类
首先采用 Google 的 Word2Vec 工具,从海量的文本(本文) 中,使用神经网络学习得到词典中每个词的向量表示。然后根据向量,对词 典中的每个词进行聚类,例如聚类成 500 类(新的“词典”) 。而后,使用工具 对每个文档提取代表性的关键词。每个关键词都在前面的聚类中找到自己的 类别。这样类似多媒体技术中讲授的向量空间模型(VSM) ,每个文档都可以 用过关键词词频表示成一个 500 维的向量,这个向量就是这个文档的“特征向 量”。
2022-02-10 14:16:07
338KB
Word2vec
pdf
1
Hierarchical-attention-networks-pytorch:用于
文档分类
的分层注意网络-源码
[PYTORCH]用于
文档分类
的分层注意网络 介绍 下面是我的文件分层关注网络的
文档分类
描述的模型的pytorch实现。 Dbpedia数据集模型输出结果的应用程序演示示例。 我的模型对Dbpedia数据集的性能示例。 如何使用我的代码 使用我的代码,您可以: 使用任何数据集训练模型 给定我训练有素的模型或您的模型,您可以评估具有相同类集的任何测试数据集 运行一个简单的Web应用进行测试 要求: python 3.6 火炬0.4 张量板 tensorboardX (如果不使用SummaryWriter,则可以跳过此库) 麻木 数据集: 我用于实验的数据集的统计信息。 这些数
2021-11-26 21:50:56
49.66MB
python
nlp
deep-neural-networks
deep-learning
1
python朴素贝叶斯实战案例--
文档分类
,输入一篇文章,输出这个文章属于什么类型
使用python进行朴素贝叶斯方法预测,对具有20个主题的10万多篇文章进行训练,要求给出一篇文章,预测输出这篇文章属于什么类型
2021-11-15 11:05:40
3KB
python
机器学习
朴素贝叶斯
文档分类
1
BayesProject.rar
1. 实验数据在bayes_datasets文件夹中。其中, train为训练数据集,包含hotel和travel两个中文文本集,文本为txt格式。hotel文本集中全部都是介绍酒店信息的文档,travel文本集中全部都是介绍景点信息的文档; Bayes_datasets/test为测试数据集,包含若干hotel类文档和travel类文档。 2. 用朴素贝叶斯算法对上述两类文档进行分类。要求输出测试数据集的
文档分类
结果,即每类文档的数量。
2021-11-09 16:25:15
593KB
朴素贝叶斯
文档分类
1
用Python开发一个自然语言处理模型(
文档分类
垃圾过滤),并用Flask进行部署。
Develop a NLP Model in Python & Deploy It with Flask, Step by Step,用Python开发一个自然语言处理模型(
文档分类
垃圾过滤),并用Flask进行部署,手把手教程,by Susan Li。
2021-10-07 11:52:41
337KB
Python
NLP
文档分类
Flask
1
论文研究-基于新的关键词提取方法的快速文本分类系统.pdf
关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法(FS),并利用TFIDF算法来筛选出关键词以完成将Web文档进行快速有效分类的目的。实验表明,该方法在不影响分类准确率的情况下,分类的速度明显提高。
2021-09-15 23:23:21
251KB
计算机应用
中文信息处理
关键词提取
Web文档分类
1
Document TagExplorer V2.7 [正式版].rar
可能是目前国内最好的一款免费文档标签式分类管理工具,可以通过给文件、文件夹打标签,来对文件和文件夹实现多维度的分类、组织和维护。
2021-08-11 18:01:26
2.04MB
标签
tag
文档管理
文档分类
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
基于matlab扩频通信系统仿真(整套代码)
IBM.ILOG.CPLEX.Enterprise.Server.v12.10.0.Win64.rar CPLEX下载
西门子逻辑控制设计开发_3部10层
IEEE33节点配电网Simulink模型.rar
多机器人编队及避障仿真算法.zip
ChinaMeteorologicalDataHandler.R
故障诊断数据集及实现代码
PLECS中文手册.pdf
matlab机器人工具箱实现机械臂直线轨迹&圆弧轨迹规划
西安问题电缆-工程伦理案例分析.zip
MATLAB之LSTM预测
opcua服务器模拟器+opcua客户端工具.rar
基于YOLOV5的车牌定位和识别源码.zip
2010年-2020中国地面气候资料数据集(V3.0)
科研伦理与学术规范 期末考试2 (40题).pdf
最新下载
Arduino所有库.zip
EasyMedia-ui.zip
springboot餐厅点餐管理系统【完整sql+参考源码】
JAVA后台+微信小程序实现在线扫码点餐系统
PT100温度阻值对应表.xls
python程序设计 第三版 john zelle 老师从出版社要的课后习题答案
基于STM32的武术擂台机器人的设计.pdf
whale的exe可执行文件
谢希仁计算网络思维导图.rar
EXCEL整体写入和读取labview 文件
其他资源
微信小程序星巴克咖啡源码
二叉树成绩管理系统
2021海思实习笔试.7z
绿色盖骑缝章软件1.0.rar
很炫,很简洁,很好用的 jquery选择地区控件 (源码)
内存加载动态库(dll)
jsp会员管理系统 完整版
海拉之光LucidShape1.1.part1.rar
完整骑士OnLine服务端源代码
SDL的深入探究及实践.pdf
Cobalt Strike 4.2
SI4463做接收头源码IAR
it十八掌大数据4个月全套课程(永久有效,赠送其他视频)
金融数学引论答案 配北京大学出版社
LDA参考代码和资料
C语言接口转换为JAVA
Hadoop倒排索引程序
基于java+sql的图书馆管理系统
南昌大学2014~2015学年第二学期数据结构期末考试试卷
jQuery学生信息管理
Android bikeroute自行车导航源码
LIN总线资料
ACS+802.1x+AAA+AD+CA详细记录