一个用 Pony 编写的文字冒险游戏,作为一种学习练习,可以让您更加熟悉该语言并用作各种语言概念的插图。在所有可能的情况下,PonyMUD 的目标是利用 Actor 模型和完全异步处理的力量。
2022-06-24 09:05:46 10KB Pony
NLP_Project 使用BERT的文本聚类 该存储库是DS8008-NLP课程的课程项目。 该项目是科学论文“基于加权BERT模式的文本文档聚类方法”的修改实施。 您可以找到一个摘要和一个笔记本,其中包括该项目中进行的过期代码的实现。
2022-06-23 21:57:04 1KB
1
文本比对工具,方便比较两个文本不同版本的差异。用于编程开发不同分支文档比较。
2022-06-23 14:52:11 421KB 工具软件
1
短文本聚类在数据挖掘中发挥着重要的作用,传统的短文本聚类模型存在维度高、数据稀疏和缺乏语义信息等问题,针对互联网短文本特征稀疏、语义存在奇异性和动态性而导致的短文本聚类性能较差的问题,提出了一种基于特征词向量的文本表示和基于特征词移动距离的短文本聚类算法。首先使用Skip-gram模型(Continuous Skip-gram Model)在大规模语料中训练得到表示特征词语义的词向量;然后利用欧式距离计算特征词相似度,引入EMD(Earth Mover's Distance)来计算短文本间的相似度;最后将其应用到Kmeans聚类算法中实现短文本聚类。在3个数据集上进行的评测结果表明,效果优于传统的聚类算法。
2022-06-23 11:19:25 1.18MB 短文本; EMD距离; 词向量; 相似度计算;
1
Visual C++源代码 175 如何在水晶报表中搜索指定文本Visual C++源代码 175 如何在水晶报表中搜索指定文本Visual C++源代码 175 如何在水晶报表中搜索指定文本Visual C++源代码 175 如何在水晶报表中搜索指定文本Visual C++源代码 175 如何在水晶报表中搜索指定文本Visual C++源代码 175 如何在水晶报表中搜索指定文本Visual C++源代码 175 如何在水晶报表中搜索指定文本Visual C++源代码 175 如何在水晶报表中搜索指定文本Visual C++源代码 175 如何在水晶报表中搜索指定文本Visual C++源代码 175 如何在水晶报表中搜索指定文本Visual C++源代码 175 如何在水晶报表中搜索指定文本Visual C++源代码 175 如何在水晶报表中搜索指定文本Visual C++源代码 175 如何在水晶报表中搜索指定文本Visual C++源代码 175 如何在水晶报表中搜索指定文本Visual C++源代码 175 如何在水晶报表中搜索指定文本Visual C++源代码 175 如何
2022-06-23 09:09:46 100KB VisualC++源代码17
杂货店 基于LibLinear的简单高效的短文本分类工具 嵌入作为默认标记器,以支持中文标记化 其他语言: 表现 火车组合:48个带有32个标签的新闻标题 测试集:带有32个标签的16k新闻标题 与svm和朴素贝叶斯进行比较 分类器 准确性 时间成本 scikit学习(nb) 76.8% 134 scikit学习(svm) 76.9% 121 杂货店 79.6% 49 样例代码 >> > from tgrocery import Grocery # Create a grocery(don't forget to set a name) >> > grocery = Grocery ( 'sample' ) # Train from list >> > train_src = [ ( 'education' , 'Student debt to cost Brit
2022-06-22 23:35:22 71KB C++
1
针对互联网不良信息检测这一业务场景,探讨了基于网站文本内容进行检测的方法。回顾了经典的文本分析技术,重点介绍了Bert模型的关键技术特点及其两种不同用法。详细描述了利用其中的特征提取方法,进行网站不良信息检测的具体实施方案,并且与传统的TF-IDF模型以及word2vec+LSTM模型进行了对比验证,证实了这一方法的有效性。
2022-06-22 22:51:20 705KB 不良信息 Bert模型 文本分析 特征提取
1
富文本解析,折线图,MD5,bluebird小程序源码加截图.zip
2022-06-22 18:08:39 402KB 小程序
由于近期需要将一份Word文档转到Markdown格式,但是文件内容较大,自动转换工具转换不能完全满足我的要求,存在问题如下:导出的图片名乱码,一部分换行存在问题。 针对图片名乱码的问题,由于word中的图片拥有一定的顺序,所以根据该顺序对导出的md文件中图片语法识别进行更换合适的文件名。 其次,由于我需要将该文件根据章节进行拆分,这部分的内容程序也已经完成, 程序中实现了UTF-8格式转GBK格式,使用stream对TXT进行读取并识别,获取到需要的信息后对信息进行更改,最后依据一级标题对文件进行拆分。
2022-06-22 15:42:54 32.37MB C++ 文件读取 markdown 文本读取
1
vue-tinymce 封装了el-upload 控件,支持富文本编辑器自定义图片上传整合。 复制到vue的src/components文件夹下 详情博文介绍见:https://xingyun.blog.csdn.net/article/details/102492921
2022-06-22 10:35:12 9KB tinymce el-upload vue-tinymce富文本编辑
1