关于 这是带有GUI的系统。 有关此项目的更多详细信息,请参见: 我们的 我们的 依存关系 可用于更轻松地开始该项目。 Linux,Python 2 , , , : pip install --user scikit-learn scikits.talkbox pyssp PyAudio ,通常可以由您的软件包管理器安装。 (可选) Python绑定: 安装闪电战,openblas,boost,然后: for p in bob.extension bob.blitz bob.core bob.sp bob.ap; do pip install --user $p done 注意:我们自己有一个MFCC实现,当bob不可用时,该实现将用作备用。 但是它不如bob中的C实现高效。 使用的算法 语音活动检测(VAD): (LTSD) 特点: (MFCC) (L
2021-10-10 17:47:55 25.69MB 系统开源
1
行人属性识别 基于VesPA,WPAL的一些行人属性识别方法。 PA-100K和RAP进行培训。
2021-10-09 16:41:45 71.9MB Python
1
行人属性识别纸张列表[ ] 人物属性识别纸质清单 从2014年到2020年在PETA和RAP数据集上的性能比较。我们发现,在两个大型基准数据集上,基线方法CNN-SVM的性能远胜于最近基于深度学习的PAR方法。 有趣的是,我们还可以发现,当前基于深度学习的方法的准确性是可比的,并且与几年前提出的深度PAR算法相比,当前方法(在2020年)没有显着改善。 那么,如果基于深度学习的PAR算法达到瓶颈,那么下一步该怎么办? 笔记: 欢迎来到我们的微信群进行进一步讨论,请扫描此 或扫描此内容以添加我的[注意:姓名+学校/公司] 如果您找到有关人的属性识别的更多相关论文,请给我发送电子邮件: [ ] [] [] 如果您发现此调查对您的研究有用,请考虑引用以下文章: @article{wang2019parsurvey, title={Pedestrian attribute re
1
简单的变形金刚 该库基于HuggingFace的库。 使用简单的Transformers,您可以快速训练和评估Transformer模型。 初始化模型,训练模型和评估模型仅需要三行代码。 技术支持 序列分类 代币分类(NER) 问题回答 语言模型微调 语言模型训练 语言生成 T5型号 Seq2Seq任务 多模态分类 对话式AI。 文本表示生成。 目录 设置 与conda 从安装Anaconda或Miniconda Package Manager 创建一个新的虚拟环境并安装软件包。 conda create -n st python pandas tqdm conda activate st如果使用cuda: conda install pytorch>=1.6 cudatoolkit=11.0 -c pytorch否则: conda install pytorch cpuonly
1
hog特征提取matlab代码字符图像识别MATLAB 图像预处理(二值化),定向梯度直方图(HOG)特征提取,SVM调整VA网格搜索(内核,内核比例,BoxConstraint),分类分析(混淆矩阵)。 在Matlab中运行代码之前,请加载FinalWorkspace文件。
2021-10-08 15:09:03 14.14MB 系统开源
1
Kaggle Landmark Recognition 2020竞赛:优胜者解决方案 该存储库包含针对我们在Kaggle举办的2020年Google Landmark Recognition竞赛获奖解决方案的代码: 完整的解决方案在arxiv上发表的一篇论文中进行了描述: 为了运行此代码,您需要来自GLDv2的训练和测试数据: 要训​​练模型,请使用配置文件作为标志运行src/train.py : python train.py --config config1 您需要在相应的配置文件中调整数据路径和其他参数,以使其正常工作。 混合和排名过程在notebooks/blend_ranking.ipynb详细notebooks/blend_ranking.ipynb 。
2021-10-05 17:04:39 38KB Python
1
matlab灰色关联度代码Matlab中模式识别的白内障分类器 利用Matlab中的模式识别神经网络将视网膜眼底彩色图像分类为各种类型的白内障。 对数据集图像进行预处理,以提取训练神经网络所需的特征。 首先将图像转换为绿色通道,以获得细节之间的最大对比度。 然后对这些图像进行上下帽子转换,然后进行对比度校正和滤波,以获得用于特征提取的最佳图像。 从每个图像的灰度共生矩阵中提取对比度,相关性,同质性和能量这四个特征。 总共处理了51张图像以进行特征提取和训练。 利用Matlab中的NPR工具箱将这些特征用于训练具有10个隐藏神经元的反向传播神经网络,并绘制混淆矩阵和ROC特性以分析训练后的神经网络的效率。 最终使用Matlab的GUIDE工具箱将该神经网络合并到图形用户界面中。 该应用程序能够将白内障的程度分为三类,即轻度,中度和严重。 PS:所有文件均为matlab代码文件说明:prefeat-用于图像预处理和特征提取的代码。 数据集-包含提取的特征矩阵和用于训练神经网络的目标矩阵。 Trainer-用于使用给定数据集训练神经网络的代码。 retinalCataractClassifi
2021-10-05 12:50:53 48KB 系统开源
1
人脸识别颤动 实时面部识别颤动应用程序。 apk文件。 脚步 人脸检测 使用Firebase ML Vision来检测人脸。 人脸识别 转换Tensorflow实施模型引入tflite。 正在安装 步骤1:下载或克隆此仓库: git clone https://github.com/Rajatkalsotra/Face-Recognition-Flutter.git 步骤2:转到项目根目录,并在控制台中执行以下命令以获取所需的依赖关系: flutter pub get 第3步:为flutter_tflite软件包添加动态库,以使其正常工作: 步骤4:安装Flutter应用 flutter run 认可度 (来自Westworld的照片) 贡献 贡献使开源社区成为了一个令人赞叹的学习,启发和创造场所。 您所做的任何贡献都将不胜感激。 分叉项目 创建您的Feature分支( gi
1
matlab掌纹识别代码掌纹_识别 这是用于 BLPOC、基于位置的匹配和用于参考点选择的 DoG 的 matlab 实现,此实现中使用的数据集是 . 有关此处应用的此技术的更多详细信息,请参阅本文:。 注意:数据库预处理(ROI 裁剪、旋转、标准化)不在此实现中。 入门 您可以通过键入以下内容来启动此代码: [dis, blpoc] = matching( ' filename ' ,mode) filename实际上是一个 txt 文件,填充了以下形式的图像路径行path\to\image\xxx0.jpg path\to\image\xxx1.jpg有一个空格表示将要匹配在一起的两个图像。 mode指定应用的方法。 0表示基于位置的方法, 1表示应用 DoG 进行参考点选择。 并且这将返回两个向量dis从位置和所获得的得分blpoc为平均每个相应图像块的BLPOC值。 ##Future work 由于这是本文实现的唯一起始版本,因此将进行进一步的重构和修订。
2021-09-30 14:46:27 352KB 系统开源
1