只为小站
首页
域名查询
文件下载
登录
医学文本数据集-癌症
文档分类
数据集
医学文本数据集-癌症
文档分类
数据集,该数据集集中于页面大小超过6页的长研究论文,分类为3类,“甲状腺癌”,“结肠癌”,“肺癌”。 医学文本数据集-癌症
文档分类
数据集,该数据集集中于页面大小超过6页的长研究论文,分类为3类,“甲状腺癌”,“结肠癌”,“肺癌”。
2022-12-23 11:26:22
55.93MB
医学
文本
癌症
文档
imdb数据集:电影用于
文档分类
。
imdb数据集:用于
文档分类
。
2022-10-26 16:59:14
154.07MB
分类
数据挖掘
人工智能
机器学习
1
Hierarchical-Attention-Network:“
文档分类
的分层注意网络”的实现
分层注意网络 我对“ ”的实现(Yang等,2016) Yelp的数据可从下载(与Yang的论文中使用的数据集相同) 下载链接: : 将数据放在名为“ data / yelp_YEAR /”的目录中(其中“ YEAR”为年份) 运行“ yelp-preprocess.ipynb”以预处理数据。 格式变为“标签\ t \ t句子1 \ t句子2 ...”。 然后运行“ word2vec.ipynb”以从训练集中训练word2vec模型。 运行“ HAN.ipynb”以训练模型。 运行“ case_study.ipynb”以运行验证集中的一些示例的可视化,包括注意力向量(句子级别和单词级别)和预测结果。 现在,我们在yelp2013测试仪上获得了约65%的准确度。 对超参数进行微调后,它可能会更好。 我们使用的超参数 时代 批量大小 GRU单位 word2vec大小 优化器 学
2022-05-06 10:34:48
5.69MB
nlp
rnn
attention-mechanism
paper-implementations
1
基于Word2vec的
文档分类
首先采用 Google 的 Word2Vec 工具,从海量的文本(本文) 中,使用神经网络学习得到词典中每个词的向量表示。然后根据向量,对词 典中的每个词进行聚类,例如聚类成 500 类(新的“词典”) 。而后,使用工具 对每个文档提取代表性的关键词。每个关键词都在前面的聚类中找到自己的 类别。这样类似多媒体技术中讲授的向量空间模型(VSM) ,每个文档都可以 用过关键词词频表示成一个 500 维的向量,这个向量就是这个文档的“特征向 量”。
2022-02-10 14:16:07
338KB
Word2vec
pdf
1
Hierarchical-attention-networks-pytorch:用于
文档分类
的分层注意网络-源码
[PYTORCH]用于
文档分类
的分层注意网络 介绍 下面是我的文件分层关注网络的
文档分类
描述的模型的pytorch实现。 Dbpedia数据集模型输出结果的应用程序演示示例。 我的模型对Dbpedia数据集的性能示例。 如何使用我的代码 使用我的代码,您可以: 使用任何数据集训练模型 给定我训练有素的模型或您的模型,您可以评估具有相同类集的任何测试数据集 运行一个简单的Web应用进行测试 要求: python 3.6 火炬0.4 张量板 tensorboardX (如果不使用SummaryWriter,则可以跳过此库) 麻木 数据集: 我用于实验的数据集的统计信息。 这些数
2021-11-26 21:50:56
49.66MB
python
nlp
deep-neural-networks
deep-learning
1
python朴素贝叶斯实战案例--
文档分类
,输入一篇文章,输出这个文章属于什么类型
使用python进行朴素贝叶斯方法预测,对具有20个主题的10万多篇文章进行训练,要求给出一篇文章,预测输出这篇文章属于什么类型
2021-11-15 11:05:40
3KB
python
机器学习
朴素贝叶斯
文档分类
1
BayesProject.rar
1. 实验数据在bayes_datasets文件夹中。其中, train为训练数据集,包含hotel和travel两个中文文本集,文本为txt格式。hotel文本集中全部都是介绍酒店信息的文档,travel文本集中全部都是介绍景点信息的文档; Bayes_datasets/test为测试数据集,包含若干hotel类文档和travel类文档。 2. 用朴素贝叶斯算法对上述两类文档进行分类。要求输出测试数据集的
文档分类
结果,即每类文档的数量。
2021-11-09 16:25:15
593KB
朴素贝叶斯
文档分类
1
用Python开发一个自然语言处理模型(
文档分类
垃圾过滤),并用Flask进行部署。
Develop a NLP Model in Python & Deploy It with Flask, Step by Step,用Python开发一个自然语言处理模型(
文档分类
垃圾过滤),并用Flask进行部署,手把手教程,by Susan Li。
2021-10-07 11:52:41
337KB
Python
NLP
文档分类
Flask
1
论文研究-基于新的关键词提取方法的快速文本分类系统.pdf
关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法(FS),并利用TFIDF算法来筛选出关键词以完成将Web文档进行快速有效分类的目的。实验表明,该方法在不影响分类准确率的情况下,分类的速度明显提高。
2021-09-15 23:23:21
251KB
计算机应用
中文信息处理
关键词提取
Web文档分类
1
Document TagExplorer V2.7 [正式版].rar
可能是目前国内最好的一款免费文档标签式分类管理工具,可以通过给文件、文件夹打标签,来对文件和文件夹实现多维度的分类、组织和维护。
2021-08-11 18:01:26
2.04MB
标签
tag
文档管理
文档分类
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
基于Matlab的IEEE14节点潮流计算.zip
王万良-人工智能导论(第五版)课件
超大规模集成电路先进光刻理论与应用.pdf
matlab时频分析工具箱+安装方法+函数说明+最新版tftb.
2019和2021年华为单板通用硬件笔试题及答案
校园网规划与设计和pkt文件
Elsevier爱思唯尔的word模板.zip
Python+OpenCV实现行人检测(含配置说明)
现代操作系统原理与实现.pdf
基于S函数的BP神经网络PID控制器及Simulink仿真和对应代码模型.zip
数据结构课后习题答案
C4.5决策树算法的Python代码和数据样本
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
Spring相关的外文文献和翻译(毕设论文必备)
华为OD机试真题.pdf
最新下载
使用xilinx的DDS生成多项数据
宝利通 电脑客户端
Kepware KEPServer v4.500.46 注册破解版 亲测 好用 内附本人编写的注册方法
QXDM5 安装包版本号:QXDM5.5.1.350.1可解析:LTE、NR包含:Qcat,QUTS,QXDM5
分类数据分析-Alan.Agresti(著)-齐亚强(译)-重庆大学出版社-带书签目录
永磁直流电机设计软件
EasyOCR训练好的模型(包含english-g2.pth、zh-sim-g2.pth、craft-mlt-25k.pth)
【电机仿真设计】基于RMxprt的永磁直流有刷电机建模与性能五轴曲线分析系统
华为校招高频选择题-2
NTK Daemon 安装程序 Windows版本
其他资源
自定义TreeView,在树节点旁添加按钮。
虚拟现实大作业-校园全景漫游
LAMMPS计算晶体结构的XRD衍射
KBP 数据集
计算机外文翻译大集合(整理的20几篇外文翻译)
SKYM2源码包+控件包
PySide2实战项目——登录界面.rar
c++学生选课系统代码
MUSIC算法AOA估计
asp.net实战项目
MFC使用双栈实现简单计算器
免杀工具箱 简体中文版
大学生课程表格子
VLSI TEST PRINCIPLE AND ARCHITECTURE
子-源码
maindianzishizh.c
计算机二级Python知识点内容高度整理.zip
js生成随机验证码111111valid.js
eclipse_oxygen_jb51.rar
MP2659 Power Path and Vbatt Minor Tuning.pdf
gostudy_zip dos下怎么样才能下go棋
仿射密码-Affine cipher
BPSK matlab代码调制
FriendlyARM USB Download Driver Setup
最简单的Struts1入门案例