中文文本相似度/文本推理/文本匹配数据集——OCNLI
2021-09-07 10:41:38 1.57MB 文本匹配
1
PyTorch的BERT中文文本分类 此存储库包含用于中文文本分类的预训练BERT模型的PyTorch实现。 代码结构 在项目的根目录,您将看到: ├── pybert | └── callback | | └── lrscheduler.py   | | └── trainingmonitor.py  | | └── ... | └── config | | └── base.py #a configuration file for storing model parameters | └── dataset    | └── io     | | └── be
2021-08-27 20:50:35 46KB nlp text-classification pytorch chinese
1
可以把十六进制转换成中文、文本、字符串,也可以把中文、文本、字符串转换成十六进制,同时生成十六进制与字符的对照表,主要用于对抓包的十六进制数据进行分析,也适用网络通信程序的开发和调试。 注意,如果十六进制数据是压缩或加密了的,生成的结果会是乱码,这不是程序的问题。
2021-08-25 21:26:04 161KB 十六进制 转换 中文 抓包
1
text_classify 以复旦中文文本分类语料库为样本,用python实现的文本分类算法 由于训练集和测试集太大,所以给出的是训练集和测试集的下载地址,以及停用词表hlt_stop_words.txt Python版本为2.7 运行顺序: step1:corpus_segment.py step2: corpus2Bunch.py (需要提前创建目录train_word_bag和test_word_bag) step3: TFIDF_space.py step4:NBayes_Predict.py
2021-08-20 18:08:05 9KB Python
1
利用VTK实现中文文本显示的现实,可以支持多行文本即“\n”字符,以及不同的中文字体,并在此基础上做的一个简单的医学图像浏览软件(不含源代码,在兴趣的话可以先测试一下,里面有个test.mhd文件,可以加载这个文件,以后会把源代码全部放出来)。
2021-08-19 11:21:28 5.3MB VTK中文显示 医学图像浏览
1
基于语义簇的中文文本聚类算法.pdf
2021-08-19 09:23:03 1.16MB 聚类 算法 数据结构 参考文献
CH-Readability 中文阅读分级工具 measure the readability of Chinese text for K12 education 07/21/2018 实现功能: 根据常用字比例、文章和句子长度计算易读性。 计算文章中各年级生字数量。(不重复) 需要改进的功能: 增加禁止多次复制的功能。 出示各年级生字。 改进难度计算公式。
2021-08-17 10:55:45 125KB Java
1
基于cnn的中文文本分类算法(python).zip
2021-08-12 22:10:33 13.31MB cnn python
TextRank4ZH可以从文章中提取摘要和关键字, TextRank4ZH 则是能用 TextRank 的算法处理中文文章
2021-08-11 18:57:17 32KB Python开发-自然语言处理
1
使用sklearn进行中文文本分类-附件资源
2021-08-08 21:44:55 23B
1