从文字描述中绘制各种图表的工具。 当前,支持三种类型的图表:消息序列图,通用图和框图,将来还会添加更多类型。 有一个用于Linux的命令行版本(替换mscgen)以及一个GTK GUI。 Msc-generator可以对外观进行精细控制,并具有丰富的功能集以及详细的文档资料。 在Windows上,您可以将图表嵌入文档或演示文稿中,然后只需在Office中双击图表即可对其进行编辑。 在Linux上,GTK GUI提供了命令行版本,该版本将图表文本保存到生成的PNG文件中。 在Mac上,命令行版本适用-现在正在移植GUI。 有关详细的用户和代码文档,请参见Wiki。 GáborNémeth自愿为Ubuntu维护一个debian软件包,并且还开发了一个小型GUI。 请参阅Wiki上的安装说明。
2022-06-15 17:34:49 3.12MB 开源软件
1
Html2Epub:将 html链接, html文件 或 html文本 转换成 epub文件
2022-06-15 09:08:56 16KB html
Grim 是一个简单的 gem,用于从 pdf 中提取(获取)页面并将其转换为图像,以及从页面中提取文本作为字符串。它基本上为您提供了一个易于使用的 api,用于特定于该用例的 ghostscript、imagemagick 和 pdftotext
2022-06-15 09:07:00 718KB ruby
包含KMeans、DBSCAN、LDA和Single_Pass的文本聚类算法程序(python实现)。 详细信息: 基于KMeans的无监督中文文本聚类 基于DBSCAN的无监督中文文本聚类 基于LDA的无监督文本聚类 基于single pass 策略进行聚类,不需要事先设置类别数
2022-06-14 22:05:33 139KB 机器学习 聚类 文本聚类 课程设计
RefViz 是一个文本信息分析软件,可以根据文献标题和摘要信息进行文献分类,并指出文献间相互关系。熟练掌握这个软件,你将会轻松驾驭海量的文献信息,快速获取最重要的信息,为你提供不竭的创新思路。
2022-06-14 19:05:59 42.85MB 文本信息分析
text-summarization-tensorflow 代码来自: 这个是关于英文文本的介绍,然后自己尝试应用在中文文本上,效果不是很理想。。 中文数据集来自:
2022-06-14 17:32:56 177KB Python
1
Android TXT 文本阅读器源码.zip
2022-06-14 16:04:00 44KB 源码
Android Txt文本阅读器源码.zip
2022-06-14 16:03:59 83KB 源码
文本熵 计算给定文本的熵的代码。 我使用过旁遮普语语料库(随附上传)。
2022-06-14 11:33:50 23.05MB Python
1
表 5.2 选取的部分搜狗语料库文章类别及数目表 类别 奥运 房产 娱乐 健康 教育 体育 旅游 汽车 商业 时尚 总计 文章 数目 19940 52405 24233 4049 7539 62751 6480 4889 45616 12342 240244 数据处理及特征提取过程与上节类似,这里只介绍不同过程。 在数据预处理阶段,针对本数据集加入了新的无关词表,如图 5.39所示。 图 5.39 自建无关词表示意图 筛选每个类别中的特征词,所有类别内的保留词情况如图 5.40所示。 图 5.40 所有类别内的保留词情况示意图 利用朴素贝叶斯分类方法,2折交叉验证中每次的 classification_report、分类正确率 以及混淆矩阵如图 5.41-图 5.43所示。
2022-06-14 10:41:19 4.05MB 数据挖掘 文本分类
1