只为小站
首页
域名查询
文件下载
登录
Transformers_for_Text_Classification:基于Transformers的文本分类-源码
Transformers_for_Text_Classification 基于Transformers的文本分类 基于最新的出品的v2.2.2代码进行重构。为了保证代码日后可以直接复现而不出现兼容性问题,这里将放到本地进行调用。 强调 支持transformer模型后接各种特征提取器 支持测试集预测代码 精简原始变形金刚代码,使之更适合文本分类任务 优化日志记录终端输出,使之输出内容更加合理 支持 型号: 伯特 伯特·cnn bert_lstm 伯特·格鲁 互联网 xlnet_cnn xlnet_lstm xlnet_gru 阿尔伯特 内容 数据集:存放数据集 pretrai
2021-09-15 11:40:51
30.01MB
nlp
text-classification
transformers
NaturallanguageprocessingPython
1
论文研究-模糊支持向量机及其在文本分类中的应用 .pdf
模糊支持向量机及其在文本分类中的应用,朱健,刘斌,当文本分类采用多类分类时,标准支持向量机会混分和漏分样本。针对这一问题,提出了模糊支持向量机,模糊支持向量机为了提高分类
2021-09-14 17:50:08
266KB
支持向量机
1
sklearn文本分类数据包-20newsgroups-20news-bydate
20newsgroups数据集有三个版本。第一个版本19997是原始的并没有修改过的版本。第二个版本bydate是按时间顺序分为训练(60%)和测试(40%)两部分数据集,不包含交叉文档和新闻组名(新闻组,路径,隶属于,日期)。第三个版本18828不包含交叉文档,只有来源和主题名。
2021-09-13 12:31:29
13.79MB
sklearn
文本分类
20newsgroups
20newsbydate
1
基于关键词提取方法的快速文本分类系统
关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度 考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法 ( FS) ,并利用TFIDF算法来筛选出关键词以完成将Web文档进行快速有效分类的目的。实验表明,该方法在不 影响分类准确率的情况下,分类的速度明显提高。 关键词: 计算机应用; 中文信息处理; 关键词提取; Web文档分类
2021-09-13 10:51:26
192KB
文本分类
关键词提取
nlp
1
【数据挖掘/机器学习/文本分类】2000~2019年英文文献摘要数据集,16类,每类100篇
本数据集为2000~2019年大部分英文文献摘要集合的子集,分agriculture、anatomy、business、chemistry、economics、education、geology等十六类。 每条数据由五部分组成:序号、分类、文献名称、摘要、期刊名称。 注意是英文!!!摘要!!! 可用于数据挖掘等工程。 具体应用可参考博客:https://blog.csdn.net/erwugumo/article/details/104610584 请使用python进行数据分析。 需要更大规模的数据请咨询QQ:2450520622。 全部数据集约三百万条。
2021-09-10 16:03:03
646KB
python
机器学习
数据挖掘
文本分类
1
Bert_Classifier:bert文本分类,albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度
1、run_cnews_classifier.py 原生bert实现的文本分类 原文链接: 2、run_tnews_classifier.py 基于keras_bert实现的文本分类 原文链接: 3、run_lcqmc_similarity.py 基于bert4keras实现的文本相似度计算 原文链接: 4、run_kashgari_classifier.py 基于kashgari实现的文本分类 原文链接: 5、run_ChineseDailyNerCorpus.py 基于kashgari + bert/albert实现的ner 原文链接: 6、Bert_Train.py 基于bert训练模型,并保存为pb格式 原文链接: 7、Bert_Predict.py requests调用tf serving中的bert模型 原文链接: 8、fastbert.py 基于fastbert实现文本分类
2021-09-09 19:11:30
6.44MB
附件源码
文章源码
1
【爬虫+文本分类】–新浪各类新闻标题,并用各类算法进行文本分类
自己设计的小项目,初始想法很简单,检验自己爬虫和nlp基本技能(分词、词向量(tokenize\onehot\tfidf\word2vec))和各类算法(朴素贝叶斯、svm、CNN、LSTM)掌握情况,进一步查漏补缺,提升工程能力和算法应用能力:) ** 第一部分:爬虫 ** 分析新浪网各类新闻网页结构,应用requests库,爬取并解析新浪各类新闻,包括汽车、教育、金融、娱乐、体育、科技共六类, 对于有“滚动”新闻链接的板块(如sport、tech、entertaimment),通过滚动新闻爬取数据:此类数据多为动态链接,需要异步加载,即自行分析json格式获取其中新闻url 对于没有“滚
2021-09-09 13:32:33
747KB
分类
文本分析
文本分类
1
SVM文本分类程序源码
这是SVM文本分类程序源码,既有java版本,也有C++版本。
2021-09-07 19:53:56
12.72MB
SVM文本分类程序源码
1
基于MATLAB的LSTM文本分类代码(100%可用含中文注释)
本代码利用长短期记忆神经网络(LSTM)进行文本分类,支持中英文文本分类,简单易上手,有相应视频教程介绍使用方法。
2021-09-06 17:20:16
562KB
MATLAB
LSTM
文本分类
长短期记忆神经网络
RCV1-2 英文新闻数据数据集
RCV1-2 是一个路透社(Ruters)英文新闻文本及对应新闻类别数据,可用以进行文本分类和其它自然语言处理(NLP)任务。
2021-09-06 15:12:34
806.62MB
文本分类
自然语言理解
自然语言处理
文本生成
自然语言生成
NLP
NLG
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
中国地面气候资料日值数据集(V3.0)2010-2019.rar
EEMD算法应用于信号去噪.rar
基于matlab的车牌识别系统设计
Python+OpenCV实现行人检测(含配置说明)
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
基于javaweb的网上购物系统(毕业论文+答辩PPT+开题报告+源代码)
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
Plexim Plecs Standalone 4.1.2 x64.7z
科研伦理与学术规范 期末考试2 (40题).pdf
Matpower中文使用手册(原名《MATPOWER手册(中文版)》).rar
matpower5.0b1.zip
校园网规划与设计(报告和pkt文件)
OLED显示温度和时间-STM32F103C8T6(完整程序工程+原理图+相关资料).zip
基于Servlet+jsp+mysql开发javaWeb学生成绩管理系统
最新下载
serial_port_plotter_Win_1.3.0,串口虚拟示波器
南航 数据结构 课程设计 大二.zip
mastercam出mach3代码的后处理文件
西电—DSP原理及应用视频教程 全39讲 1-6.rar
CGH40010-ADS模型
深思S4 加密狗型号快速检测V5.1, S4初始化工具和写狗工具最新授权 带说明
carsim与simulink联合仿真实现AEB功能
CircleOfPoison.rar
小波阈值MATLAB代码,可以实现软阈值、硬阈值以及5种改进阈值方法,封装好的函数快速实现
2022年电赛A题:单相交流电子负载 单相pwm整流 基于stm32f407vet6的单相DQ锁相环
其他资源
变速齿轮0.46去广告绿色版.rar
最简单的listview动态添加、删除带edittext的item例子
matlab GUI 画三次B样条
HTMl案例-网页设计案例(50,含css)
VS2015 MFC 编写 常见的CRC校验,CRC4,CRC5,CRC8,CRC16,CRC32等
HCIP-Security题库(最新2021年2月三科900分以上考过,稳定).rar
myEclipse实现购物车
鼠标精灵 自动点击
精通MATLAB与C&C++混合程序设计(第3版)源代码
培训师职业生涯规划.ppt
用C5402DSP实现的G_168自适应回声消除器
MATLAB工具箱大全-蚁群算法工具箱
9700jAllLang_PBr6.0.0_rel3170_PL6.6.0.252_A6.0.0.756.exe
BD2安装包,亲测可用
SSD8课程中的exam2答案
中国移动mm7api 源代码(中兴)
自动化专业英语教程翻译 part 6
数字电子钟verilog课程设计
HeidiSQL_9.5.0.5278最新中文版
易语言内核重载
Bursa 7参数的精确算法
吾爱破解专用版Ollydbg.zip
ugui滑动翻页