python speech_recognition库的中文语音识别包
2021-04-15 09:04:54 224.70MB python speech_recogniti 语音识别
1
本人精翻的《X-VECTORS ROBUST DNN EMBEDDINGS FOR SPEAKER RECOGNITION
2021-04-14 18:47:26 388KB X-Vector 声纹识别 中文翻译 DanPovey
1
关键字识别(KWS)是智能设备上终端和服务机器人的人机交互的主要组成部分,其目的是最大程度地提高检测精度,同时又要减小占用空间。 在本文中,基于DenseNet提取局部特征图的强大功能,我们为KWS提出了一种新的网络体系结构(DenseNet-BiLSTM)。 在我们的DenseNetBiLSTM中,DenseNet主要用于获取局部特征,而BiLSTM用于获取时间序列特征。 通常,DenseNet用于计算机视觉任务,它可能会破坏语音音频的上下文信息。 为了使DenseNet适合KWS,我们提出了一个变体DenseNet,称为DenseNet-Speech,它在过渡层的时间维度上删除了池以保留语音时间序列信息。 此外,我们的DenseNet-Speech使用密度较小的块和过滤器来使模型保持较小,从而减少了移动设备的时间消耗。 实验结果表明,DenseNet-Speech的特征图可以很好地维护时间序列信息。 就Google Speech Commands数据集的准确性而言,我们的方法优于最新方法。 对于具有223K可训练参数的20条命令识别任务,DenseNet-BiLSTM能够达到96.6%的精度。
2021-04-13 17:31:45 821KB keyword spotting speech recognition
1
基于face_recognition-master的人脸识别教程代码,供学习参考。实现各种模式的人脸检测、识别,比dlib的检测精度更高。
1
这个文档有两个工程代码,一个是基于卷积神经网络人脸识别代码,还有一个是基于开源的face_recognition库的人脸代码,这个代码有详细的注释,并且有基于图片识别的和基于摄像头视频实时识别的,代码内容丰富,值的大家学习。
1
Pattern Recognition and Machine Learning高清英文版和中午版,包括笔记以及课后习题完整答案!!
2021-04-07 10:59:41 29.65MB 人工智能 机器学习 python 算法
1
该代码工程更新了启动签到,结束签到,以及在百度智能云创建用户组,用来存储人脸库。。。。。。。。。。。。。。。。
2021-04-07 00:28:29 260KB Face_Recognition 人脸识别 百度AI qt
1
本人的毕业设计,matlab实现人脸识别,效果好,不需要改参数,直接可用。
2021-04-05 21:04:43 66.29MB matlab 人脸识别 毕业设计
用知云文献翻译软件+自己的一些理解翻译的何神的这篇SlowFast Networks for Video Recognition论文
2021-04-05 10:25:36 1.22MB SlowFast论文 中文翻译 何凯明 视频识别
1
Object_Recognition_From_RGBD_Data:近年来,对象识别由于其众多的应用而引起了研究人员的越来越多的关注。 例如,对象识别使协作机器人能够执行诸如在非结构化环境中搜索对象或为人类同事检索工具之类的任务。 在这项研究中,我们提出了一种新技术,用于从红色,绿色,蓝色和深度(RGB-D)数据中进行无监督的特征提取,然后将其与多个分类器组合以执行对象识别。 具体而言,我们的体系结构首先通过无监督的聚类技术对桌面场景中的所有对象进行了细分。 然后,它分别关注每个对象,以提取形状和视觉特征。 我们对从YCB对象和模型集中选择的20个对象的子集进行实验,并评估几个分类器的性能
2021-04-03 22:10:22 10.59MB matlab object-detection rgbd collaborative-robot
1