只为小站
首页
域名查询
文件下载
登录
医学文本数据集-癌症
文档分类
数据集
医学文本数据集-癌症
文档分类
数据集,该数据集集中于页面大小超过6页的长研究论文,分类为3类,“甲状腺癌”,“结肠癌”,“肺癌”。 医学文本数据集-癌症
文档分类
数据集,该数据集集中于页面大小超过6页的长研究论文,分类为3类,“甲状腺癌”,“结肠癌”,“肺癌”。
2022-12-23 11:26:22
55.93MB
医学
文本
癌症
文档
imdb数据集:电影用于
文档分类
。
imdb数据集:用于
文档分类
。
2022-10-26 16:59:14
154.07MB
分类
数据挖掘
人工智能
机器学习
1
Hierarchical-Attention-Network:“
文档分类
的分层注意网络”的实现
分层注意网络 我对“ ”的实现(Yang等,2016) Yelp的数据可从下载(与Yang的论文中使用的数据集相同) 下载链接: : 将数据放在名为“ data / yelp_YEAR /”的目录中(其中“ YEAR”为年份) 运行“ yelp-preprocess.ipynb”以预处理数据。 格式变为“标签\ t \ t句子1 \ t句子2 ...”。 然后运行“ word2vec.ipynb”以从训练集中训练word2vec模型。 运行“ HAN.ipynb”以训练模型。 运行“ case_study.ipynb”以运行验证集中的一些示例的可视化,包括注意力向量(句子级别和单词级别)和预测结果。 现在,我们在yelp2013测试仪上获得了约65%的准确度。 对超参数进行微调后,它可能会更好。 我们使用的超参数 时代 批量大小 GRU单位 word2vec大小 优化器 学
2022-05-06 10:34:48
5.69MB
nlp
rnn
attention-mechanism
paper-implementations
1
基于Word2vec的
文档分类
首先采用 Google 的 Word2Vec 工具,从海量的文本(本文) 中,使用神经网络学习得到词典中每个词的向量表示。然后根据向量,对词 典中的每个词进行聚类,例如聚类成 500 类(新的“词典”) 。而后,使用工具 对每个文档提取代表性的关键词。每个关键词都在前面的聚类中找到自己的 类别。这样类似多媒体技术中讲授的向量空间模型(VSM) ,每个文档都可以 用过关键词词频表示成一个 500 维的向量,这个向量就是这个文档的“特征向 量”。
2022-02-10 14:16:07
338KB
Word2vec
pdf
1
Hierarchical-attention-networks-pytorch:用于
文档分类
的分层注意网络-源码
[PYTORCH]用于
文档分类
的分层注意网络 介绍 下面是我的文件分层关注网络的
文档分类
描述的模型的pytorch实现。 Dbpedia数据集模型输出结果的应用程序演示示例。 我的模型对Dbpedia数据集的性能示例。 如何使用我的代码 使用我的代码,您可以: 使用任何数据集训练模型 给定我训练有素的模型或您的模型,您可以评估具有相同类集的任何测试数据集 运行一个简单的Web应用进行测试 要求: python 3.6 火炬0.4 张量板 tensorboardX (如果不使用SummaryWriter,则可以跳过此库) 麻木 数据集: 我用于实验的数据集的统计信息。 这些数
2021-11-26 21:50:56
49.66MB
python
nlp
deep-neural-networks
deep-learning
1
python朴素贝叶斯实战案例--
文档分类
,输入一篇文章,输出这个文章属于什么类型
使用python进行朴素贝叶斯方法预测,对具有20个主题的10万多篇文章进行训练,要求给出一篇文章,预测输出这篇文章属于什么类型
2021-11-15 11:05:40
3KB
python
机器学习
朴素贝叶斯
文档分类
1
BayesProject.rar
1. 实验数据在bayes_datasets文件夹中。其中, train为训练数据集,包含hotel和travel两个中文文本集,文本为txt格式。hotel文本集中全部都是介绍酒店信息的文档,travel文本集中全部都是介绍景点信息的文档; Bayes_datasets/test为测试数据集,包含若干hotel类文档和travel类文档。 2. 用朴素贝叶斯算法对上述两类文档进行分类。要求输出测试数据集的
文档分类
结果,即每类文档的数量。
2021-11-09 16:25:15
593KB
朴素贝叶斯
文档分类
1
用Python开发一个自然语言处理模型(
文档分类
垃圾过滤),并用Flask进行部署。
Develop a NLP Model in Python & Deploy It with Flask, Step by Step,用Python开发一个自然语言处理模型(
文档分类
垃圾过滤),并用Flask进行部署,手把手教程,by Susan Li。
2021-10-07 11:52:41
337KB
Python
NLP
文档分类
Flask
1
论文研究-基于新的关键词提取方法的快速文本分类系统.pdf
关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法(FS),并利用TFIDF算法来筛选出关键词以完成将Web文档进行快速有效分类的目的。实验表明,该方法在不影响分类准确率的情况下,分类的速度明显提高。
2021-09-15 23:23:21
251KB
计算机应用
中文信息处理
关键词提取
Web文档分类
1
Document TagExplorer V2.7 [正式版].rar
可能是目前国内最好的一款免费文档标签式分类管理工具,可以通过给文件、文件夹打标签,来对文件和文件夹实现多维度的分类、组织和维护。
2021-08-11 18:01:26
2.04MB
标签
tag
文档管理
文档分类
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
OLED显示温度和时间-STM32F103C8T6(完整程序工程+原理图+相关资料).zip
CPLEX12.8学术版安装包:cplex_studio128.win-x86-64.exe
2010年-2020中国地面气候资料数据集(V3.0)
csma/ca和csma/cd的matlab仿真源代码带有详细的注释
PSO-LSSVM的MATLAB代码.rar
张正友相机标定Opencv实现(完整程序+棋盘图)实例源码
SSM外文文献和翻译(毕设论文精品).doc
基于YOLOV5的车牌定位和识别源码.zip
Microsoft Visual C++ 2015-2019 运行库合集,包含32位64位
大唐杯资料+题库(移动通信)
Vivado license 永久
多目标优化算法(四)NSGA3的代码(python3.6)
IEEE 39节点系统的Simulink模型
上帝之眼和拾荒者.rar
数字图像处理[冈萨雷斯]
最新下载
基于STM32的温湿度传感器+OLED屏显示项目文件压缩包
支付监控3合1工具2029版,支持自定义广告
基于单片机的金属探测器的设计
金属探测器制作程序电路图及PCB.rar
matlab的SPWM逆变电路仿真模型
412747752909824前三后四归属地查全号软件V3.0-增强版Demo.zip
科研成果申报管理系统(java web+sqlserver)
NScripter脚本解包工具
nrf51822蓝牙原理图PCB文件
广州市矢量shp数据.zip
其他资源
基于AJAX方式实现的STM32H7_WebServer网页文件
夏宇闻-Verilog经典教程.pdf
EBAZ4205转接板PCB.rar
Power Query M 函数中文帮助手册20170804
Gmres算法解线性方程组
FlowChart .net 流程图案例
3.7V锂电池电量耗电情况-程序采用此测试数据电量较准确
bootstrap登录界面
PHP支付小Demo(含支付宝、微信支付、银联支付)
灰色预测软件 数学建模
DLAU:FPGA上的可扩展深度学习加速器单元
【22考研】计算机组成原理复习全书.pdf
56.深度解密五十六:详解DSP营销推广及实战中的相关问题.pdf
lua热更模型.rar
lrzsz-0.12.20.tar.gz
文件同步插件FileSync_1.3.10.202006062100.jar
AS SSD Benchmark
C#实现两个电脑的互传信息
特征码搜索基址 c/c++源代码
平衡车卡尔曼滤波
贝叶斯网络和HMM
ACM_算法模板