这是一类比较实用的小系统,实现了从文件中读出的内容进行查找与替换
2021-11-02 15:12:08 3KB KMP、查找与替换
1
java实现web的文本编辑器,页面引入js就可以实现文本编辑器
2021-10-29 16:05:02 474KB java web 文本编辑器
1
20个新闻组文本分类 本笔记本包含使用数据集、使用和库的文本分类实现,以及使用库的一些模型解释。 本笔记本随附的博客文章:
1
本事例采用英文单词数据库,当用户在文本框中输入的字符数为两个及以上时(可以通过completeLen = 2来设置,此功能主要是防止输入字符太少时,匹配项过多,反而影响用户体验),自动从数据库中取出与之匹配的其它单词,供用户选择。
2021-10-26 20:22:15 1.73MB 自动完成 ajax json
1
本程序将文件内容读入字符串中,然后实现查找字符串,替换字符串,删除字符串,计算文件长度,插入行等文本常见操作
1
将训练集、测试集、验证集、标签集放到THUCNews/data文件夹下即可。数据格式为每行一个句子加它的标签,用\t分隔开。文件中已经包含了BERT的预训练模型。项目的详解博客在https://blog.csdn.net/Q_M_X_D_D_/article/details/120583820
2021-10-18 22:10:56 365.95MB BERT 自然语言处理 文本分类
1
功能: (1)支持全文展开/收起(按钮紧跟着文本后面显示,非另起一行),见下图。 (2)可设置收起时最大显示行数; (3) 可设置“展开/收起”的具体文字显示、字体颜色,是否带省略点等; (4) 支持 “展开/收起”点击事件(即,后缀点击事件)、剩余区间点击事件(TextView点击事件)、父容器点击事件。 博客:https://blog.csdn.net/qq_37077360/article/details/81335018
2021-10-05 20:54:54 20.77MB TextView缩放
1
主要为大家详细介绍了python TF-IDF算法实现文本关键词提取,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
1
代码已上传至github https://github.com/danan0755/Bert_Classifier 数据来源cnews,可以通过百度云下载 链接:https://pan.baidu.com/s/1LzTidW_LrdYMokN—Nyag 提取码:zejw   数据格式如下: bert中文预训练模型下载地址: 链接:https://pan.baidu.com/s/14JcQXIBSaWyY7bRWdJW7yg 提取码:mvtl 复制run_classifier.py,命名为run_cnews_cls.py。添加自定义的Processor class MyProcessor(D
2021-09-29 12:54:30 185KB 分类 多分类 多分类任务
1
TF(Term Frequency)词频,在文章中出现次数最多的词,然而文章中出现次数较多的词并不一定就是关键词,比如常见的对文章本身并没有多大意义的停用词。所以我们需要一个重要性调整系数来衡量一个词是不是常见词。该权重为IDF(Inverse Document Frequency)逆文档频率,它的大小与一个词的常见程度成反比。在我们得到词频(TF)和逆文档频率(IDF)以后,将两个值相乘,即可得到一个词的TF-IDF值,某个词对文章的重要性越高,其TF-IDF值就越大,所以排在最前面的几个词就是文章的关键词。 TF-IDF算法的优点是简单快速,结果比较符合实际情况,但是单纯以“词频”衡量一个
2021-09-23 18:21:46 53KB python python算法 tf-idf
1