datasketch:大数据看起来很小 datasketch提供给您概率性的数据结构,这些数据结构可以超快地处理和搜索大量数据,而几乎不会降低准确性。 该软件包包含以下数据草图: 数据草图 用法 估计Jaccard相似度和基数 估计加权Jaccard相似度 估计基数 估计基数 提供了以下数据草图索引以支持亚线性查询时间: 指数 对于数据草图 支持的查询类型 MinHash,加权MinHash 提卡阈值 MinHash,加权MinHash Jaccard Top-K 最小哈希 遏制阈值 datasketch必须与Python 2.7或更高版本以及NumPy 1.11或更高版本一起使用。 Scipy是可选的,但有了它,LSH初始化可以更快。 请注意, 和也支持Redis和Cassandra存储层(请参见 )。 安装 要使用pip安装datasketch: pip insta
2023-03-26 14:13:18 776KB python search weighted-quantiles lsh
1
a tabu search algorithm wrote by Zhaokai
2023-03-21 18:37:09 41KB tabu
1
fir带通滤波器matlab代码使用G_best引导的布谷鸟搜索算法高效设计FIR滤波器 这项工作是我的本科论文的一部分。 抽象的: 此存储库提供了使用G最佳引导的杜鹃搜索(GCS)算法的有限冲激响应(FIR)滤波器的有效设计。 为了减少传统的Cuckoo搜索算法(CSA)中的参数依赖性以及在滤波器设计问题中更好地搜索最佳系数,在所建议的GCS中对CSA方法进行了一些修改,这导致与Cuckoo搜索算法的收敛速度显着提高。最佳解决方案。 在这里,已经使用GCS , CSA和人工蜂群(ABC)算法为Type1和Type 2 FIR设计了低通和带通滤波器。 结果: 从GCS,CSA和ABC的图形和统计观察()中可以看出, GCS在收敛速度,执行时间和过滤器响应方面均超过了竞争对手。 此外,使用建议的GCS开发的滤波器获得的阻带衰减(As)和通带纹波(Rp)远远优于使用CSA,ABC或Parks and McClellan(PM)方法设计的滤波器。 一项平均研究表明,对于较低阶的LPF(类型1和类型2的阶次均小于40),GCS显示As升高9.23% ,Rp降低26.05% 。 对于更高阶的LP
2023-03-13 20:37:17 1.6MB 系统开源
1
search-match安装包
2023-03-13 16:46:15 398.68MB search-match
1
1.直接运行main_csdn.py检查路径 2.算法的具体实现在BasicAlgorithm.py文件中,里面涵盖了BFS、DFS、Dijkstra、Greedy Best First Search、A*五种静态场景的路径规划算法,算法应用于二维的栅格场景 3.几种算法的基本关系: (BFS、DFS)广度和深度优先搜索,最基本的暴力求解算法 (Dijkstra)在BFS的基础之上添加了低成本优先的贪心策略(估价函数) (Greedy Best First Search)在BFS的基础之上添加了启发式 (A*)结合了估价函数和启发式 以上是我个人的理解以及代码实现,具体原理可参考站内其他资源~
1
用于 Elasticsearch 2.2 的 中文分词器,已构建好,直接放入 Elasticsearch 的plugins 目录下使用
2023-03-11 02:27:33 3.97MB ik elastic search
1
更新:现在可以嵌入预训练的通用句子编码器和BERT句子转换器。阅读。 Top2Vec Top2Vec是用于主题建模和语义搜索的算法。它会自动检测文本中存在的主题,并生成联合嵌入的主题,文档和单词向量。训练Top2Vec模型后,您可以: 获取检测到的主题数。 获取主题。 获取主题大小。 获取层次结构主题。 通过关键字搜索主题。 按主题搜索文档。 通过关键字搜索文档。 查找类似的单词。 查找类似的文档。 使用公开模型 有关其工作原理的更多详细信息,请参见。 好处 自动查找主题数。 无需停用词列表。 无需词干/词形限制。 适用于短文本。 创建联合嵌入的主题,文档和单词向量。 内置搜索功能。 它是如何工作的? 该算法所做的假设是,许多语义上相似的文档都表明了一个潜在的主题。第一步是创建文档和单词向量的联合嵌入。将文档和单词嵌入向量空间后,算法的目标是找到文档的密集簇,然后确定哪些单词将这些文档
2023-03-09 13:56:41 6.48MB word-embeddings topic-modeling semantic-search bert
1
通过对bootstrap-table.min.js的修改,实现了自定义搜索功能。 function search() { var keyvalue = $("#searchStr").val(); $("#tablelist").bootstrapTable("loadAddSearch", keyvalue); }
2023-03-03 10:56:59 60KB bootstrap table search
1
在Microsoft Office(Word,Excel,Power Point),LibreOffice(书写器,Calc,Impress),Visio和文本/ ASCII文件(RTF / TXT / CSV / MD / HTML等)中进行搜索。 对于所有其他文件,它将使用模糊逻辑来检查文件是文本文件还是二进制文件。 如果是文本,它将在文件内容中搜索匹配项。 在Windows 7或更高版本上运行。 需要.NET Framework 4.7或更高版本。 在VB.NET 2019中开发的开源软件。
2023-02-24 14:51:49 2.14MB 开源软件
1
PYBO-Python中的藏语NLP 概述 bo将藏文文字标记为单词。 基本用法 入门 需要安装Python3。 python3 -m pip install pybo 标记字符串 drupchen@drupchen: ~ $ bo tok-string " ༄༅། །རྒྱ་གར་སྐད་དུ། བོ་དྷི་སཏྭ་ཙརྻ་ཨ་བ་ཏ་ར། བོད་སྐད་དུ། བྱང་ཆུབ་སེམས་དཔའི་སྤྱོད་པ་ལ་འཇུག་པ། ། སངས་རྒྱས་དང་བྱང་ཆུབ་སེམས་དཔའ་ཐམས་ཅད་ལ་ཕྱག་འཚལ་ལོ། །བདེ་གཤེགས་ཆོས་ཀྱི་སྐུ་མངའ་སྲས་བཅས་དང༌། །ཕྱག་འོས་ཀུན་ལའང་གུས་པར་ཕྱག་འཚལ་ཏེ། །བདེ་གཤེགས་ སྲས་ཀྱི་སྡོམ་ལ་འཇུག་པ་ནི། །ལུང་བཞིན་མ
2023-02-18 20:49:53 170KB search nlp toolkit linguistics
1