基于 pytorch-transformers 实现的 BERT 中文文本分类代码 数据: 从 THUCNews 中随机抽取20万条新闻标题,一共有10个类别:财经、房产、股票、教育、科技、社会、时政、体育、游戏、娱乐,每类2万条标题数据。数据集按如下划分: 训练集:18万条新闻标题,每个类别的标题数为18000 验证集:1万条新闻标题,每个类别的标题数为1000 测试集:1万条新闻标题,每个类别的标题数为1000
2024-05-09 10:42:25 732.57MB pytorch bert 文档资料 人工智能
1
若是你有几百万数据的一个文本,想把数据分割成每个1000条,若是人工手动分割的话。那可是累的够呛,有了这个批处理小程序,几分钟就可以搞定了,,
2024-05-03 14:08:43 67KB 文本分割 文本拆分
1
C#生成PDF文件(添加文本和图片) 然后读取文本和图片
2024-04-29 18:47:35 7.68MB 读取PDF
1
60 万吨甲醇可研文本
2024-04-29 11:44:17 1.28MB
1
Ns-3-Adding-text-in-packets 将真实文本数据添加到 ns-3 数据包中。 座右铭是成功地将真实数据从一个节点发送到另一个节点。这已在 ns-3 中的三个示例中实现。 代码执行的先决条件: 将安装 ns-3。 安装后,程序将从示例文件夹复制到 ns-3 中的临时文件夹。 以下是在Ubuntu 14.04的终端中输入 cd ns-allinone-3.19/ 光盘 ns-3.19/ ./waf --run file_name(临时文件夹中给出的名称,不带 .cc 扩展名) 要查看 .pcap 文件,请输入 ns-3.19 文件夹并双击它(前提是您在 Ubuntu 14.04 中安装了 Wire Shark)。
2024-04-27 20:48:18 40KB
1
对文本进行聚类,文本预处理-->构造特征向量-->聚类,压缩包内含有实验用语料
2024-04-27 12:01:07 685KB
1
易语言DLL隐藏模块源码,DLL隐藏模块,Hide,文本_字节集到文本,lstrcpyn_字节集
1
LabVIEW中文本与UTF8编码相互转换,一个小程序,具有参考价值
2024-04-24 15:34:03 6KB LabVIEW UTF8
1
本教程的主要目的是教读者利用OpenCV和EAST文本检测器来检测文本。EAST文本检测器需要OpenCV3.4.2或更高版本,有需要的读者可以先安装OpenCV。教程第一部分分析为何在自然场景下进行文本检测的挑战性是如此之高。接下来简要探讨EAST文本检测器,为何使用,算法新在何处,并附上相关论文供读者参考。最后提供Python+OpenCV文本检测实现方式,供读者在自己的应用中使用。由于光照条件、图片质量以及目标非线性排列等因素的限制,自然场景下的文本检测任务难度较大受约束的受控环境中的文本检测任务通常可以使用基于启发式的方法来完成,比如利用梯度信息或文本通常被分成段落呈现,并且字符一般都
2024-04-18 20:46:49 548KB
1
notepad++ v 7.6.4 中文简体版文本编辑器
2024-04-14 22:48:28 3.55MB 文本编辑器
1