最近,自然语言处理领域的进步引发了adhoc搜索任务的复兴。特别是,大型上下文化语言建模技术,如BERT,已经为排序模型配备了比以前的单词袋(BoW)模型更深入的语言理解能力。将这些技术应用到新任务中是很棘手的,需要深度学习框架的知识,以及重要的脚本和数据分析。
2021-04-01 16:21:27 29.79MB ECIR 信息检索 BERT
1
相似性匹配系统 这个是一个《电商标题数据相似度匹配系统》,使用方法有:tfidf +词袋模型,余弦相似度,word2vec 1.基本方法 1.1结巴分词 1.2 TF-IDF 1.3余弦相似度 1.4 word2vec 2.项目:《电商标题数据相似度匹配系统》 2.1项目原理 2.2项目代码 ------------------------------------完------------- -------------------------------------------- 更多NLP知识请访问: 我的主页: : 我的博客: :
2021-03-26 15:34:30 7MB 系统开源
1
此文件是我利用原本DLoopDetector所提供的resources中的123张图片训练得到的ORB特征词袋,目标特征提取方法所使用的是常见的opencv中的目标提取方法。
2021-03-11 14:09:49 2.81MB slam 词袋模型 ROS DLoopDetector
1
OpenVSLAM对应词袋 OpenVSLAM is a monocular, stereo, and RGBD visual SLAM system. The notable features are: It is compatible with various type of camera models and can be easily customized for other camera models. Created maps can be stored and loaded, then OpenVSLAM can localize new images based
2021-01-28 05:04:37 12.25MB OpenVlam VSLAM SLAM
1
Bag-of-words模型是信息检索领域常用的文档表示方法。在信息检索中,BOW模型假定对于一个文档,忽略它的单词顺序和语法、句法等要素,将其仅仅看作是若干个词汇的集合,文档中每个单词的出现都是独立的,不依赖于其它单词是否出现。也就是说,文档中任意一个位置出现的任何单词,都不受该文档语意影响而独立选择的。
2020-01-17 03:16:03 18KB 词袋
1
本demo实现的是基于bow原理对图片进行分类,并实现对选取得测试集进行查找 BoW(Bag of Words)词袋模型最初被用在文本分类中,将文档表示成特征矢量。它的基本思想是假定对于一个文本,忽略其词序和语法、句法,仅仅将其看做是一些词汇的集合,而文本中的每个词汇都是独立的。简单说就是讲每篇文档都看成一个袋子(因为里面装的都是词汇,所以称为词袋,Bag of words即因此而来),然后看这个袋子里装的都是些什么词汇,将其分类。如果文档中猪、马、牛、羊、山谷、土地、拖拉机这样的词汇多些,而银行、大厦、汽车、公园这样的词汇少些,我们就倾向于判断它是一篇描绘乡村的文档,而不是描述城镇的。 serachFeatures.py中,前面主要是一些通过parse使得可以在敲命令行的时候可以向里面传递参数,后面就是提取SIFT特征,然后聚类,计算TF和IDF,得到单词直方图后再做一下L2归一化。一般在一幅图像中提取的到SIFT特征点是非常多的,而如果图像库很大的话,SIFT特征点会非常非常的多,直接聚类是非常困难的(内存不够,计算速度非常慢),所以,为了解决这个问题,可以以牺牲检索精度为代价,在聚类的时候先对SIFT做降采样处理。最后对一些在在线查询时会用到的变量保存下来。对于某个图像库,我们可以在命令行里通过下面命令生成BoF。 query.py只能每次查找一张图片,并返回与之匹配度(递减)最接近的6张图片
2020-01-03 11:39:45 117.35MB bow python
1
SIFT等局部特征的词袋模型实现。包括K-means聚类,直方图特征的形成,以及KNN分类。
2019-12-21 22:26:49 25.31MB BOW 词袋 K-means KNN
1
使用matlab实现蜂群SVM,粒子群SVM,遗传算法SVM,数据包含有公共数据集,公共图像数据集,图像特征提取用了词袋,保证可用(公共图像数据集太大,删除了)
2019-12-21 20:23:28 36.25MB matlan ABC_SV
1
这里面的matlab代码是BOW的实现,里面有kmeans++的部分,模块化,易理解,稍微改动就可以用于解决自己的问题
2019-12-21 19:41:03 1KB BOW matlab kmeans++
1
基于opencv的视觉词袋训练程序,用来提取图片的视觉词典
2019-12-21 18:53:39 1017KB opencv 词袋 视觉词典
1