只为小站
首页
域名查询
文件下载
登录
Transformers_for_Text_Classification:基于Transformers的
文本分类
-源码
Transformers_for_Text_Classification 基于Transformers的
文本分类
基于最新的出品的v2.2.2代码进行重构。为了保证代码日后可以直接复现而不出现兼容性问题,这里将放到本地进行调用。 强调 支持transformer模型后接各种特征提取器 支持测试集预测代码 精简原始变形金刚代码,使之更适合
文本分类
任务 优化日志记录终端输出,使之输出内容更加合理 支持 型号: 伯特 伯特·cnn bert_lstm 伯特·格鲁 互联网 xlnet_cnn xlnet_lstm xlnet_gru 阿尔伯特 内容 数据集:存放数据集 pretrai
2021-09-15 11:40:51
30.01MB
nlp
text-classification
transformers
NaturallanguageprocessingPython
1
论文研究-模糊支持向量机及其在
文本分类
中的应用 .pdf
模糊支持向量机及其在
文本分类
中的应用,朱健,刘斌,当
文本分类
采用多类分类时,标准支持向量机会混分和漏分样本。针对这一问题,提出了模糊支持向量机,模糊支持向量机为了提高分类
2021-09-14 17:50:08
266KB
支持向量机
1
sklearn
文本分类
数据包-20newsgroups-20news-bydate
20newsgroups数据集有三个版本。第一个版本19997是原始的并没有修改过的版本。第二个版本bydate是按时间顺序分为训练(60%)和测试(40%)两部分数据集,不包含交叉文档和新闻组名(新闻组,路径,隶属于,日期)。第三个版本18828不包含交叉文档,只有来源和主题名。
2021-09-13 12:31:29
13.79MB
sklearn
文本分类
20newsgroups
20newsbydate
1
基于关键词提取方法的快速
文本分类
系统
关键词的提取是进行计算机自动
文本分类
和其他文本数据挖掘应用的关键。系统从语言的词性角度 考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法 ( FS) ,并利用TFIDF算法来筛选出关键词以完成将Web文档进行快速有效分类的目的。实验表明,该方法在不 影响分类准确率的情况下,分类的速度明显提高。 关键词: 计算机应用; 中文信息处理; 关键词提取; Web文档分类
2021-09-13 10:51:26
192KB
文本分类
关键词提取
nlp
1
【数据挖掘/机器学习/
文本分类
】2000~2019年英文文献摘要数据集,16类,每类100篇
本数据集为2000~2019年大部分英文文献摘要集合的子集,分agriculture、anatomy、business、chemistry、economics、education、geology等十六类。 每条数据由五部分组成:序号、分类、文献名称、摘要、期刊名称。 注意是英文!!!摘要!!! 可用于数据挖掘等工程。 具体应用可参考博客:https://blog.csdn.net/erwugumo/article/details/104610584 请使用python进行数据分析。 需要更大规模的数据请咨询QQ:2450520622。 全部数据集约三百万条。
2021-09-10 16:03:03
646KB
python
机器学习
数据挖掘
文本分类
1
Bert_Classifier:bert
文本分类
,albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度
1、run_cnews_classifier.py 原生bert实现的
文本分类
原文链接: 2、run_tnews_classifier.py 基于keras_bert实现的
文本分类
原文链接: 3、run_lcqmc_similarity.py 基于bert4keras实现的文本相似度计算 原文链接: 4、run_kashgari_classifier.py 基于kashgari实现的
文本分类
原文链接: 5、run_ChineseDailyNerCorpus.py 基于kashgari + bert/albert实现的ner 原文链接: 6、Bert_Train.py 基于bert训练模型,并保存为pb格式 原文链接: 7、Bert_Predict.py requests调用tf serving中的bert模型 原文链接: 8、fastbert.py 基于fastbert实现
文本分类
2021-09-09 19:11:30
6.44MB
附件源码
文章源码
1
【爬虫+
文本分类
】–新浪各类新闻标题,并用各类算法进行
文本分类
自己设计的小项目,初始想法很简单,检验自己爬虫和nlp基本技能(分词、词向量(tokenize\onehot\tfidf\word2vec))和各类算法(朴素贝叶斯、svm、CNN、LSTM)掌握情况,进一步查漏补缺,提升工程能力和算法应用能力:) ** 第一部分:爬虫 ** 分析新浪网各类新闻网页结构,应用requests库,爬取并解析新浪各类新闻,包括汽车、教育、金融、娱乐、体育、科技共六类, 对于有“滚动”新闻链接的板块(如sport、tech、entertaimment),通过滚动新闻爬取数据:此类数据多为动态链接,需要异步加载,即自行分析json格式获取其中新闻url 对于没有“滚
2021-09-09 13:32:33
747KB
分类
文本分析
文本分类
1
SVM
文本分类
程序源码
这是SVM
文本分类
程序源码,既有java版本,也有C++版本。
2021-09-07 19:53:56
12.72MB
SVM文本分类程序源码
1
基于MATLAB的LSTM
文本分类
代码(100%可用含中文注释)
本代码利用长短期记忆神经网络(LSTM)进行
文本分类
,支持中英文
文本分类
,简单易上手,有相应视频教程介绍使用方法。
2021-09-06 17:20:16
562KB
MATLAB
LSTM
文本分类
长短期记忆神经网络
RCV1-2 英文新闻数据数据集
RCV1-2 是一个路透社(Ruters)英文新闻文本及对应新闻类别数据,可用以进行
文本分类
和其它自然语言处理(NLP)任务。
2021-09-06 15:12:34
806.62MB
文本分类
自然语言理解
自然语言处理
文本生成
自然语言生成
NLP
NLG
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
Elsevier爱思唯尔的word模板.zip
csma/ca和csma/cd的matlab仿真源代码带有详细的注释
基于VMD算法的信号降噪.rar
芯片验证漫游指南以及源代码.zip
基于FPGA的DDS信号发生器设计(频率、幅度、波形可调)
BP_PID控制仿真.rar
计算机专业实习日记+实习周记+实习总结
基于Servlet+jsp+mysql开发javaWeb学生成绩管理系统
avantage 软件 xps 处理软件30天后不能使用问题
MTALAB NSGA2算法
工程伦理_李正风,丛杭青,王前_北京:清华大学出版社 , 2016.08_P329.pdf
QT自制精美Ui模板系列(一)桃子风格模板 - 二次开发专用
Python+OpenCV实现行人检测(含配置说明)
VideoDownloadHelper去除120分钟时间限制-高级版.zip
CNN卷积神经网络Matlab实现
最新下载
河北省及其所有地级市(包括雄安)json地图
Mybatis Generator自动生成JavaEntity带中文注释和注解[Maven]工程
DSP实验程序_dsp28335_
DSP28335简易定时器设计
全球基站信息数据库(2022-05-05)
全球移动通信信号塔数据集
昆仑通态McgsPro-串口数据收发-6.0.0.9-20230709驱动文件
西门子Smart200PLC外接电子手轮控制伺服跟随,可调速
海康威视DS-7816NB-K2固件升级包 V3.4.104_190417.rar
G1SNIPERB6.F4a,技嘉 G1.Sniper B6-CF官方可用板载NVME插槽且作为启动盘BIOS
其他资源
Delphi 10 Seattle小票打印控件 增强版TQ_Print_V2.0
基于51单片机和OV7670摄像头的颜色跟踪技术
QListWidget仿音乐播放器列表
网络安全基础:引用与标准 第五版
CASA模型计算NPP和GPP.PDF
ToWinCe.exe 进入wince界面软件
Flash小游戏黄金矿工源码
SFML Game Development Book
基于图像分析的偏色检测及颜色校正方法
2013年全国大学生数学建模大赛A题全国一等奖论文
Navicat Premium 12.0.24.rar
react-quill-plugin:具有React无状态组件的Quill.js实现-源码
MCSA_70-740.pdf
KTV点歌系统(JAVA+MYSQL)
ios-高仿支付宝.zip
Verilog自顶向下设计24进制计数器(FPGA)
PGP 10.0.2 最新注册机
Berlekamp-Massey算法
动态网页设计与制作:CSS+JavaScript
雷电模拟器中控源码