杂货店 基于LibLinear的简单高效的短文本分类工具 嵌入作为默认标记器,以支持中文标记化 其他语言: 表现 火车组合:48个带有32个标签的新闻标题 测试集:带有32个标签的16k新闻标题 与svm和朴素贝叶斯进行比较 分类器 准确性 时间成本 scikit学习(nb) 76.8% 134 scikit学习(svm) 76.9% 121 杂货店 79.6% 49 样例代码 >> > from tgrocery import Grocery # Create a grocery(don't forget to set a name) >> > grocery = Grocery ( 'sample' ) # Train from list >> > train_src = [ ( 'education' , 'Student debt to cost Brit
2022-06-22 23:35:22 71KB C++
1
针对互联网不良信息检测这一业务场景,探讨了基于网站文本内容进行检测的方法。回顾了经典的文本分析技术,重点介绍了Bert模型的关键技术特点及其两种不同用法。详细描述了利用其中的特征提取方法,进行网站不良信息检测的具体实施方案,并且与传统的TF-IDF模型以及word2vec+LSTM模型进行了对比验证,证实了这一方法的有效性。
2022-06-22 22:51:20 705KB 不良信息 Bert模型 文本分析 特征提取
1
富文本解析,折线图,MD5,bluebird小程序源码加截图.zip
2022-06-22 18:08:39 402KB 小程序
由于近期需要将一份Word文档转到Markdown格式,但是文件内容较大,自动转换工具转换不能完全满足我的要求,存在问题如下:导出的图片名乱码,一部分换行存在问题。 针对图片名乱码的问题,由于word中的图片拥有一定的顺序,所以根据该顺序对导出的md文件中图片语法识别进行更换合适的文件名。 其次,由于我需要将该文件根据章节进行拆分,这部分的内容程序也已经完成, 程序中实现了UTF-8格式转GBK格式,使用stream对TXT进行读取并识别,获取到需要的信息后对信息进行更改,最后依据一级标题对文件进行拆分。
2022-06-22 15:42:54 32.37MB C++ 文件读取 markdown 文本读取
1
vue-tinymce 封装了el-upload 控件,支持富文本编辑器自定义图片上传整合。 复制到vue的src/components文件夹下 详情博文介绍见:https://xingyun.blog.csdn.net/article/details/102492921
2022-06-22 10:35:12 9KB tinymce el-upload vue-tinymce富文本编辑
1
英国电站13台变压器冷却油中溶解气体分析记录文本数据数(2010-2015).zip
微信小程序 新闻资讯 富文本解析,折线图,MD5,bluebird (源代码+截图)微信小程序 新闻资讯 富文本解析,折线图,MD5,bluebird (源代码+截图)微信小程序 新闻资讯 富文本解析,折线图,MD5,bluebird (源代码+截图)微信小程序 新闻资讯 富文本解析,折线图,MD5,bluebird (源代码+截图)微信小程序 新闻资讯 富文本解析,折线图,MD5,bluebird (源代码+截图)微信小程序 新闻资讯 富文本解析,折线图,MD5,bluebird (源代码+截图)微信小程序 新闻资讯 富文本解析,折线图,MD5,bluebird (源代码+截图)微信小程序 新闻资讯 富文本解析,折线图,MD5,bluebird (源代码+截图)微信小程序 新闻资讯 富文本解析,折线图,MD5,bluebird (源代码+截图)微信小程序 新闻资讯 富文本解析,折线图,MD5,bluebird (源代码+截图)微信小程序 新闻资讯 富文本解析,折线图,MD5,bluebird (源代码+截图)微信小程序 新闻资讯 富文本解析,折线图,MD5,bluebird (源代码
2022-06-21 21:06:01 1.07MB 微信小程序新闻资讯富文本解析
IOS应用源码之支持丰富文本样式的工具.zip
2022-06-21 19:04:43 1014KB IOS应用源码
这是使用BERT进行序列注释和文本分类的模板代码,方便大家将BERT用于更多任务。欢迎使用这个BERT模板解决更多NLP任务,然后在这里分享你的结果和代码。
2022-06-21 02:11:34 2.47MB Python开发-自然语言处理
1
适用采集器采集文本教程
2022-06-20 18:08:54 17.19MB 采集器 爬虫 文本获取
1