用于 Elasticsearch 2.2 的 中文分词器,已构建好,直接放入 Elasticsearch 的plugins 目录下使用
2023-03-11 02:27:33 3.97MB ik elastic search
1
更新:现在可以嵌入预训练的通用句子编码器和BERT句子转换器。阅读。 Top2Vec Top2Vec是用于主题建模和语义搜索的算法。它会自动检测文本中存在的主题,并生成联合嵌入的主题,文档和单词向量。训练Top2Vec模型后,您可以: 获取检测到的主题数。 获取主题。 获取主题大小。 获取层次结构主题。 通过关键字搜索主题。 按主题搜索文档。 通过关键字搜索文档。 查找类似的单词。 查找类似的文档。 使用公开模型 有关其工作原理的更多详细信息,请参见。 好处 自动查找主题数。 无需停用词列表。 无需词干/词形限制。 适用于短文本。 创建联合嵌入的主题,文档和单词向量。 内置搜索功能。 它是如何工作的? 该算法所做的假设是,许多语义上相似的文档都表明了一个潜在的主题。第一步是创建文档和单词向量的联合嵌入。将文档和单词嵌入向量空间后,算法的目标是找到文档的密集簇,然后确定哪些单词将这些文档
2023-03-09 13:56:41 6.48MB word-embeddings topic-modeling semantic-search bert
1
通过对bootstrap-table.min.js的修改,实现了自定义搜索功能。 function search() { var keyvalue = $("#searchStr").val(); $("#tablelist").bootstrapTable("loadAddSearch", keyvalue); }
2023-03-03 10:56:59 60KB bootstrap table search
1
在Microsoft Office(Word,Excel,Power Point),LibreOffice(书写器,Calc,Impress),Visio和文本/ ASCII文件(RTF / TXT / CSV / MD / HTML等)中进行搜索。 对于所有其他文件,它将使用模糊逻辑来检查文件是文本文件还是二进制文件。 如果是文本,它将在文件内容中搜索匹配项。 在Windows 7或更高版本上运行。 需要.NET Framework 4.7或更高版本。 在VB.NET 2019中开发的开源软件。
2023-02-24 14:51:49 2.14MB 开源软件
1
PYBO-Python中的藏语NLP 概述 bo将藏文文字标记为单词。 基本用法 入门 需要安装Python3。 python3 -m pip install pybo 标记字符串 drupchen@drupchen: ~ $ bo tok-string " ༄༅། །རྒྱ་གར་སྐད་དུ། བོ་དྷི་སཏྭ་ཙརྻ་ཨ་བ་ཏ་ར། བོད་སྐད་དུ། བྱང་ཆུབ་སེམས་དཔའི་སྤྱོད་པ་ལ་འཇུག་པ། ། སངས་རྒྱས་དང་བྱང་ཆུབ་སེམས་དཔའ་ཐམས་ཅད་ལ་ཕྱག་འཚལ་ལོ། །བདེ་གཤེགས་ཆོས་ཀྱི་སྐུ་མངའ་སྲས་བཅས་དང༌། །ཕྱག་འོས་ཀུན་ལའང་གུས་པར་ཕྱག་འཚལ་ཏེ། །བདེ་གཤེགས་ སྲས་ཀྱི་སྡོམ་ལ་འཇུག་པ་ནི། །ལུང་བཞིན་མ
2023-02-18 20:49:53 170KB search nlp toolkit linguistics
1
突出显示您在Google中搜索的关键字 由于Chrome扩展程序采用新政策,因此请再次启用该扩展程序。请单击图标->这可以读取更改站点数据->在所有站点(推荐)或您当前所在的站点上。扩展程序,突出显示您在Google上搜索的关键字。按F5删除突出显示。 支持语言:English
2023-02-15 17:02:14 145KB 生产工具
1
关键词搜索 查找与其他(已知)关键字相关联的(可能未知)关键字。 该程序从用户定义的种子关键字开始,从Google搜索结果中找到相关的种子关键字。 来自相关的Google图片搜索的文字也会被考虑。 重复该过程,直到达到一个停止标准(即,用户停止程序或提取的关键字不再有太大变化)为止。 桂 用户可以通过gui与迭代搜索进行交互(也可以通过编程方式与程序进行交互)。 要打开gui,请从程序目录中打开一个终端,然后键入: python kwGui.py 要启动关键字搜索,请输入搜索词,然后按Enter或单击“搜索”按钮。 关键字将显示在gui的左侧,而相关图像显示在gui的右侧。 关键字类型: 顶部(绿色):所有迭代中都包含原始(“永久”)关键字。 中(白色):相关的关键字包含在搜索词中,但它们不是永久的,可以在后续迭代中降级。 底部(灰色):其余关键字按其相关性排序。 可以通过
1
用于卸载不慎安装的window search4.0,原版的卸载程序
2023-02-01 11:18:24 338KB windows search 卸载
1
非度量空间库(NMSLIB) 重要笔记 NMSLIB是通用的,但速度很快,请参阅的结果。 我们最快的方法HNSW的独立实现。 所有文档(包括使用Python绑定和查询服务器,方法和空格的描述,构建库等)都可以上找到。 对于一般性问题,请使用:GitHub问题页面用于Bug和功能请求。 目标 非度量空间库(NMSLIB)是高效的跨平台相似性搜索库,也是评估相似性搜索方法的工具包。 核心库没有任何第三方依赖。 最近它已经越来越流行。 特别是,它已成为的一部分。 该项目的目标是创建一个有效且全面的工具包,用于在通用和非度量空间中进行搜索。 即使该库包含多种度量空间访问方法,我们的主要重点还是通用和近似搜索方法,尤其是非度量空间的方法。 NMSLIB可能是第一个在原则上支持非度量空间搜索的库。 NMSLIB是一个可扩展的库,这意味着可以添加新的搜索方法和距离函数。 NMSLIB可以直接在
1
原子轨道搜索算法(AOS),是Azizi M于2021年提出的一种新型智能优化算法,被收录在Applied Mathematical Modelling中。该算法主要是基于量子力学的一些原理以及量子的原子模型行为,考虑了原子核周围电子的特性。
2023-01-04 13:26:08 7.68MB 数学建模 运筹学 现代优化算法
1