多款用于文本处理的软件,亲测有用: 1.文心中科院心理所计算网络心理实验室研发的中文文本语言分析软件系统。 2.KH Coder是一种用于计量文本分析或文本挖掘的自由软件。 3.ROST一款优秀的内容挖掘工具提供能够快速上手使用的功能。等等
2024-04-14 18:11:41 713.33MB 数据挖掘
1
基于CNN的中文文本分类算法(可应用于垃圾邮件过滤、情感分析等场景)
2024-04-14 09:54:07 13.33MB
1
海鸥文本删除重复行软件是一个可以高效率地删除重复行和空行的小工具。是一款Windows操作系统下的简单实用、美观免费的文本删除重复行软件。所有功能集成在同一界面实现,易于操作和使用。而且它是一款绿色软件,无需安装,即可使用,小巧实用。 海鸥txt文本删除重复行功能要点 1、可以一键删除重复行; 2、可以一键删除空行;  另外包含的update.exe软件可以随时将该软件更新为最新版本。 海鸥txt文本删除重复行截图
2024-04-13 12:51:41 540KB 应用软件-文件管理
1
可直接运行, 1、内容概要:本资源主要基于XGBoost与LightGBM实现文本分类,适用于初学者学习文本分类使用。 2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train,训练好的word2vec词向量模型w2v_model.pkl和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。 3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。 4、源代码:xgboost_model.py是基于xgboost模型对文本进行分类。 5、源代码:lightGBM_model.py是基于lightGBM模型对文本进行分类。
2024-04-10 20:39:49 37.99MB 数据集
1
基于PaddleNLP的深度学习对文本自动添加标点符号源码,详情查看文章:https://blog.csdn.net/YY007H/article/details/137094290
2024-04-09 20:29:29 265.84MB 深度学习
基于PaddleNLP的预测文本添加标点符号源码,通过调用test.py文件进行测试,详情请看文章https://blog.csdn.net/YY007H/article/details/134745807
2024-04-09 20:14:09 7KB
取网页文本中的指定内容(取六合特码).rar
2024-04-08 23:19:21 2KB
1
pdf 提取器 Pdf-extractor 是的包装器,用于从 node.js 上的 pdf 生成图像、svgs、html 文件、文本文件和 json 文件。 图像:DOM画布用于呈现和导出pdf的图形层。 Canvas 默认导出 *.png,但可以扩展为导出到其他文件类型,例如 *.jpg。 SVG:使用 pdf.js 的将 Pdf 对象转换为 svg。 HTML:PDF 文本转换为 HTML。 这可以用作图像上的(透明)图层以启用文本选择。 文本:PDF 文本被提取到一个文本文件中以用于不同的用途(例如索引文本)。 Node.js 上的 PDF.js 这个库的最基本形式是 pdf.js 的 node.js 包装器。 它具有默认渲染器来生成默认输出,但很容易扩展以合并自定义逻辑或生成不同的输出。 它使用 node.js DOM 和来自 pdf.js 的节点 domstub 确实
2024-04-02 11:55:20 4.05MB nodejs image-generation pdfjs html-generation
1
该资源包括一个网页文本爬虫代码,可获取指定网页小说的文本数据,并将爬取的文本数据进行保存。该资源包括一个网页文本爬虫代码,可获取指定网页小说的文本数据,并将爬取的文本数据进行保存。该资源包括一个网页文本爬虫代码,可获取指定网页小说的文本数据,并将爬取的文本数据进行保存。该资源包括一个网页文本爬虫代码,可获取指定网页小说的文本数据,并将爬取的文本数据进行保存。该资源包括一个网页文本爬虫代码,可获取指定网页小说的文本数据,并将爬取的文本数据进行保存。该资源包括一个网页文本爬虫代码,可获取指定网页小说的文本数据,并将爬取的文本数据进行保存。该资源包括一个网页文本爬虫代码,可获取指定网页小说的文本数据,并将爬取的文本数据进行保存。该资源包括一个网页文本爬虫代码,可获取指定网页小说的文本数据,并将爬取的文本数据进行保存。该资源包括一个网页文本爬虫代码,可获取指定网页小说的文本数据,并将爬取的文本数据进行保存。
2024-04-01 17:56:17 2KB python爬虫
1
cad文本直接转到Excel,很方便的工具
2024-04-01 16:07:23 686B
1