包括机器学习基本算法+数学原理、transformer及bert流程图
1
将bert应用于CAN总线的异常检测,具体的实现为LogBert,一种基于Bert的日志检测算法。资源中包含logbert的论文原文和源码,以及修改后适配了CAN数据的异常检测算法,准确率和召回率可达99%以上,所用数据集为韩国HCLR发布的Car-hacking数据集,包含spoofing/ddos/fuzzying三种攻击形式。本次实现只包含对CAN Id的检测。 可以学习到:BERT的实现,日志检测的流程,以及针对CAN数据集的处理,完整的训练调参过程。
2022-07-12 12:07:26 130.67MB 深度学习 BERT CAN总线 异常检测
Bert-Chinese-Text-Classification-Pytorch LICENSE 中文文本分类,Bert,ERNIE,基于pytorch,开箱即用。 介绍 模型介绍、数据流动过程:还没写完,写好之后再贴博客地址。 工作忙,懒得写了,类似文章有很多。 机器:一块2080Ti , 训练时间:30分钟。 环境 python 3.7 pytorch 1.1 tqdm sklearn tensorboardX pytorch_pretrained_bert(预训练代码也上传了, 不需要这个库了)
2022-07-09 11:07:18 6.11MB 深度学习 Bert Ernie 中文文本分类
李宏毅深度学习2019讲义。19年最新的课程,Attact, Mete learning, GAN, Bert, Transformer
2022-06-28 12:58:41 23.62MB 深度学习 Bert  Transformer GAN
1
NLP_Project 使用BERT的文本聚类 该存储库是DS8008-NLP课程的课程项目。 该项目是科学论文“基于加权BERT模式的文本文档聚类方法”的修改实施。 您可以找到一个摘要和一个笔记本,其中包括该项目中进行的过期代码的实现。
2022-06-23 21:57:04 1KB
1
针对互联网不良信息检测这一业务场景,探讨了基于网站文本内容进行检测的方法。回顾了经典的文本分析技术,重点介绍了Bert模型的关键技术特点及其两种不同用法。详细描述了利用其中的特征提取方法,进行网站不良信息检测的具体实施方案,并且与传统的TF-IDF模型以及word2vec+LSTM模型进行了对比验证,证实了这一方法的有效性。
2022-06-22 22:51:20 705KB 不良信息 Bert模型 文本分析 特征提取
1
这是使用BERT进行序列注释和文本分类的模板代码,方便大家将BERT用于更多任务。欢迎使用这个BERT模板解决更多NLP任务,然后在这里分享你的结果和代码。
2022-06-21 02:11:34 2.47MB Python开发-自然语言处理
1
基于transformers+bert预训练模型在语义相似度任务上的finetune
2022-06-21 01:23:44 429.65MB bert 语义相似度 transformers
1
机器学习课设大作业基于BERT和朴素贝叶斯算法的新闻文本分类项目(源码+大作业+数据集)。一个很完整的项目源码,操作没难度,新手也可放心下载。 data文件夹中已经包括了初始的数据集和处理之后的数据集。.csv文件初始数据集,另外两个是经过News_prediction.ipynb代码处理过的。在Bert和NaiveBayes训练函数中直接加载上来。 result文件夹中的文件是朴素贝叶斯和Bert模型训练后的输出文件 互联网假新闻分类 一共三种类别:真新闻、假新闻、不用判断 40000条训练文本数据,10000条测试数据。 基于正则表达式和Jieba完成特征工程 朴素贝叶斯:tf-idf词嵌入。87.4% BERT:cn-wmm预训练词向量。5-epoch,91.4%
使用keras-bert实现 谭松波 酒店评论 文本分类(情感分析)-附件资源
2022-06-06 17:00:10 106B
1