假新闻挑战 这是NLP课程的最终项目。 我们的工作包括以下几个部分: 数据预处理 常规机器学习方法 Seq2seq注意模型 TextCNN和暹罗网络 其他(例如比赛中的相关工作,未来的工作) 1.数据预处理 我们提供了几种数据预处理方法:BoW(单词袋),TF-IDF,word2vec,doc2vec。 每个py文件都会生成x_1(文档表示形式)x_2(标题表示形式)和y(标签)。 这些数据可以作为间谍数据输出,可以在模型中使用。 2.常规机器学习 我们提供py文件以通过常规机器学习(例如SVM,随机森林)对实例进行分类,代码在sklearn上实现。 环境要求:sklearn numpy 3. Seq2seq注意模型 这些代码通常基于一个带有预训练模型的基于注意力的序列到序列模型( )。 要使用代码生成文本摘要。 运行:python3 run_summarization.py -
1
使用基于内核的激活功能为一击学习改善暹罗网络( ) 人类通过很少的示例学习新事物,例如,一个孩子可以从一张图片中概括“狗”的概念,但是机器学习系统需要大量示例来学习其功能。 特别是当受到刺激时,人们似乎能够快速理解新概念,然后在将来的感知中认识到这些概念的变体。 机器学习作为一个领域已经在各种任务(例如分类,Web搜索,图像和语音识别)上取得了巨大的成功。 但是,这些模型通常在低数据情况下效果不佳。 ' 这是一次射击学习背后的主要动机。 用较少的示例训练模型,但无需大量重新训练即可将其推广到不熟悉的类别。 引文 如果您发现我们的代码有用,请考虑使用bibtex引用我们的工作: @incollection{jadon2021improving, title={Improving Siamese Networks for One-Shot Learning Using Kerne
2022-03-29 15:07:37 12.43MB Python
1
Kaggle的Quora重复问题检测比赛的解决方案 可以通过以下链接找到比赛: ://www.kaggle.com/c/quora-question-pairs使用该解决方案,我在3307个团队中排名第23(最高1%)。 考虑到其他顶级解决方案,这是一个相对轻量级的模型。 先决条件 从下载预训练的单词向量,即Gloves.840B.300d,并将其放入项目目录。 从下载火车和测试数据。 创建一个名为“数据”的文件夹并将其放入。 将所有软件包安装在requirements.txt中。 管道 该代码是用Python 3.5编写的,并在装有Intel i5-6300HQ处理器和Nvidia G
2021-12-28 22:47:54 63KB nlp neural-network regex siamese-network
1
使用暹罗网络进行脱机签名验证 使用暹罗卷积神经网络进行脱机签名验证。 数据集=> 上面的数据集包含160个个体的印地语签名和100个个体的孟加拉语签名。 我只使用了印地语签名数据集。 参考:
1
Siamese:孪生神经网络在tf2(tensorflow2)当中的实现 目录 实现的内容 该仓库实现了孪生神经网络(Siamese network),该网络常常用于检测输入进来的两张图片的相似性。该仓库所使用的主干特征提取网络(backbone)为VGG16。 所需环境 tensorflow-gpu==2.2.0 注意事项 训练Omniglot数据集和训练自己的数据集可以采用两种不同的格式。需要注意格式的摆放噢! 文件下载 训练所需的vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5可在百度网盘中下载。 链接: 提取码: 9ij5 我一共会提供两个权重,分别是vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5和Omniglot_vgg.h5。 其中: Omniglot_vgg.h5是Omni
2021-11-03 15:16:48 27KB Python
1
SiamFC-TensorFlow SiamFC跟踪器的TensorFlow实现 介绍 这是的的TensorFlow实现。 您可以在找到MatConvNet的原始版本。 该SiamFC作者也已经发布了跟踪装置(只使用预训练的模型)中的TensorFlow端口。 此TensorFlow实现旨在实现以下目标: 自成体系。 数据准备,模型训练,跟踪,可视化和记录功能合而为一。 正确性。 跟踪性能应类似于MatConvNet版本。 效率。 训练和推理程序应尽可能高效。 模块化。 整个系统应模块化,并易于通过新思路进行扩展。 可读性。 该代码应清晰一致。 主要结果 在配备GeForce G
2021-10-19 22:28:05 2.93MB tracking real-time tensorflow siamese-network
1
之前的课程作业,找了很多网上的案例,很杂,而且都是基于TF1.0开发,琢磨几天TF2.0写了一个,给大家参考。构建Siamese网络(孪生网络)输入为两个MNIST图片,以及两者是否为相同数字的标签(0为相同数字,1为不同数字),输出为网络给出两者是否为同一数字的预测结果。
2021-08-16 12:33:19 132KB Siamese network 孪生网络 MNIST
1
Siamese:孪生神经网络在Keras当中的实现 目录 实现的内容 该仓库实现了孪生神经网络(Siamese network),该网络常常用于检测输入进来的两张图片的相似性。该仓库所使用的主干特征提取网络(backbone)为VGG16。 所需环境 tensorflow-gpu==1.13.1 keras==2.1.5 注意事项 训练Omniglot数据集和训练自己的数据集可以采用两种不同的格式。需要注意格式的摆放噢! 文件下载 训练所需的vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5可在百度网盘中下载。 链接: 提取码: 17zy 我一共会提供两个权重,分别是vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5和Omniglot_vgg.h5。 其中: Omniglot_vgg.h5是O
2021-06-02 16:48:42 23KB 附件源码 文章源码
1
Siamese:孪生神经网络在Pytorch当中的实现 目录 实现的内容 该仓库实现了孪生神经网络(Siamese network),该网络常常用于检测输入进来的两张图片的相似性。该仓库所使用的主干特征提取网络(backbone)为VGG16。 所需环境 torch==1.2.0 注意事项 训练Omniglot数据集和训练自己的数据集可以采用两种不同的格式。需要注意格式的摆放噢! 文件下载 训练所需的vgg16-397923af.pth可在百度网盘中下载。 链接: 提取码: xype 我一共会提供两个权重,分别是vgg16-397923af.pth和Omniglot_vgg.pth。 其中: Omniglot_vgg.pth是Omniglot训练好的权重,可直接使用进行下面的预测步骤。 vgg16-397923af.pth是vgg的权重,可以用于训练其它的数据集。 预测步骤 a、使用预训
2021-05-26 10:46:30 25KB 附件源码 文章源码
1
基于caffe的度量学习实现,主要是孪生网络和三元组网络(Siamese network & Triplet network)实现图像的分类和度量。包含训练测试脚本和python脚本。
2021-03-21 22:02:45 178.26MB 度量学习 孪生网络 三元组网络