可提取文本框输入数据中的某一段打印出标签,常用于二维码包含较多信息,而需要打印的只是其中包含的ID号等,可根据需求略改即可
2021-04-21 14:05:41 439KB VB源码
1
Simhash算法在文本去重中的应用-信息熵词频加权
2021-04-18 17:01:33 1.58MB Simhash
1
改进的Simhash算法在文本查重中的研究及应用
2021-04-18 17:01:33 1.82MB Simhash
1
终于重构好代码了,使用模式:模板模式、策略模式、建造者模式、单一职责,弄一个余弦定理、simhash文本查重代码,并使用二叉排序树和平衡二叉树(待测试)来优化查询。百万数据查重秒查
2019-12-21 21:54:34 28KB 余弦定理 simhash 文本查重
1
整体框架部分参照牛客初级项目:python2.7+flaskweb+mysql,实现界面参照https://blog.csdn.net/wangyan2647/article/details/88430404
2019-12-21 21:35:14 104KB flaskw mysql copyde
1
通过百度关键词查询工具,或者各种关键词查询软件查到的关键词,往往其中有大量的不需要的词组,我们自己写了这个小应用,可以很方便的去掉包含不需要的词组。
1
该文档是文本分类中权重计算的算法,即TF*idf算法的源代码,希望对您有所帮助
2019-12-21 19:22:43 42KB 文本权重计算
1