只为小站
首页
域名查询
文件下载
登录
MOT-sGPLDA-SRE14:
说话人
验证的PLDA多目标优化培训
MOT-sGPLDA-SRE14
说话人
验证的PLDA多目标优化培训 准备数据,创建目录./data和./temp 将NIST SRE14 i-vector挑战官方数据放在“ ./data/”上,其中有“ development_data_labels.csv,dev_ivectors.csv,ivec14_sre_segment_key_release.tsv,ivec14_sre_trial_key_release.tsv,model_ivectors.csv,target_speaker_peak。 运行./python/sre14_preprocess.py。 它将生成“ ./temp/sre14.mat” 运行./matlab/gplda_demo.m 该脚本将显示为“ ./temp/sre14.mat”,结果为2.347、2.456(开发数据集,EER),2.307(评估
2025-05-06 15:52:39
21KB
MATLAB
1
Python实现基于ClipCap的看图说话Image Caption模型.zip
资源包含文件:设计报告word+源码及数据 Image Caption即我们常说的看图说话:给定一张图片,生成该图片对应的自然语言描述。 该任务涉及到了图像与自然语言两个模态,然而图像空间与自然语言空间本就十分庞大,并且两者之间存在巨大的语义鸿沟。 如何将两个庞大的语义空间进行对齐,这是该任务的重点。本项目对ClipCap: CLIP Prefix for Image Captioning 论文进行介绍,并且对论文在Flickr30k中文数据集上进行实验复现和效果展示。 详细介绍参考:https://biyezuopin.blog.csdn.net/article/details/125617468
2024-05-27 21:05:53
5.62MB
Python
源码
课程设计
让你的IE浏览器会说话
浏览器作为每天上网必备的工具,除了选择IE、Maxthon、Opera、Firefox等知名的工具外,你还曾想过选择其它的吗?或许你一定会说放 着“名牌”不用,不是主动把自己列入“菜鸟”的队伍哟!今天我们就做第一个“吃螃蟹”的人来尝个鲜,向你介绍一款名为“Pink IE”的浏览器。
2024-03-29 09:13:26
65KB
信息技术
1
说话的汤姆-源码-Android_tom
会说话的汤姆-Android源代码,里面包含说明文档。绝对是源代码!
2023-07-07 17:57:40
2.75MB
说话的汤姆
源码
Android
tom
1
20个说话技巧让你少奋斗20年Word范文
这是一套20个说话技巧让你少奋斗20年Word范文,喜欢的人都来下载吧。该文档为20个说话技巧让你少奋斗20年Word范文,是一份很不错的参考资料,具有较高参考价值,感兴趣的可以下载看看
2023-06-19 15:46:36
20KB
微软官方word模板
1
短语音噪声环境下
说话人
识别特征提取
为了使
说话人
识别系统在语音较短和存在噪声的环境下也具有较高的识别率, 基于矢量量化识别算法, 对提取的特征参数进行研究。把小波变换与美尔频率倒谱系数(MFCC )的提取相结合, 并将改进后的特征与谱质心 特征进行了组合, 建立了一种美尔频率小波变换系数+ 谱质心(MFWTC+ SC) 的新的组合特征参数。经实验表明, 该 组合特征可以有效地提高
说话人
识别系统的性能。
2023-04-15 16:18:16
185KB
说话人识别
特征提取
1
CASR-DEMO:基于Flask Web的中文自动语音识别演示系统,包含语音识别,语音合成,声纹识别之
说话人
识别
CASR-DEMO(中文自动语音识别演示系统) 关于本项目的一些说明 首先,欢迎大家关注项目,进行学习研究。收到一些小伙伴的问题我就集中回答下,这里是demo的源码,有两个版本其一是称为speech_env,这是一个简单的语音识别功能,界面如下面的效果图一;还有一个是V2.0的目录,这个版本功能比较齐全,界面如效果图二。有一点项目只在win10平台上测试过,其他不保证能不能运行。由于月久失更,有些依赖包可能需要修改,不过应该都是小问题,根据实际过程的报错信息修复就行。再次感谢大家的关注! 最新整理了两个版本的发布版 speech_env(效果图一) speechV2.0基于第三方接口实现语音识别和语音合成,
说话人
识别功能(效果图二) 微信:LHH754086474 于2019年12月25日更新。
2023-04-09 19:54:11
116.98MB
系统开源
1
ApplicationsandEnhancementsoftheDeepRecurrentNeuralNetworkForSpeechSeparation:深度递归神经网络用于单声道信号源分离和
说话人
识别
深度递归神经网络在语音分离中的应用和增强 语音分离实验 培训代码: codes/TSP/train_TSP_demo_mini_clip.m 演示版 在codes/TSP/demo/model.mat找到预训练的模型 在codes/TSP/demo/run_test_single_model.m运行演示代码 依存关系 该软件包基于 该软件依赖Mark Schmidt的软件包进行凸面优化。 此外,我们还包括了用于处理MFCC文件的Mark Hasegawa-Johnson的。 我们将用于计算功能(MFCC,logmel)(HCopy)。 我们使用信号处理功能。 我们使用工具箱版本2.0、3.0进行评估。 处理您的数据: 要尝试对数据进行编码,请参阅mir1k,TSP设置-相应地将数据放入codes/TSP/Data/ 。 调整开发集上的参数并检查结果。 笔记 使用MATLAB
2023-03-18 16:58:37
52.13MB
MATLAB
1
11.2 基于高斯混合模型(GMM)的
说话人
识别实验.rar
有完整的代码程序,有语音,高斯混合模型的
说话人
识别
2023-02-28 15:11:38
2.68MB
matlab
1
会说话的汤姆猫android版源码下载
该源码由源码天堂Android益智休闲频道免费提供下载。源码是一款流行的游戏,汤姆是一只宠物猫,他可以在您触摸时作出反应,并且用滑稽的声音完整地复述您说的话。您可以抚摸他,用手指戳他,用拳轻打他,或捉他的尾巴。喜欢的朋友可以下载学习看看。
2023-02-20 08:47:48
1.28MB
android源码
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
大学生网页设计大作业-5个网页设计制作作品自己任选
中小型企业网络建设.pkt
Android小项目——新闻APP(源码)
C4.5决策树算法的Python代码和数据样本
锁相环simulink建模仿真.rar
2019西门子杯六部十层电梯群控参考程序.zip
基于hadoop商品推荐系统课程设计
EBSD分析软件——Channel5下载安装教程
MAC OS.X.10.8.iso 镜像文件
毕业设计:基于Python的网络爬虫及数据处理(智联招聘)
狂神说Java系列笔记.rar
Elsevier爱思唯尔的word模板.zip
简易示波器-精英板.zip
Monet智能交通场景应用
基于STM32的电子时钟设计
最新下载
码型变换的设计与仿真
TTF文件重命名工具
BPSK的误码率曲线的MATLAB代码
代码随想录项目精讲系列-Go项目.pdf
CRMEB_BZDT_v4.0.33(20210115).zip
恩尼格玛模拟器(外国的)
三江源国家公园界线矢量数据集.zip
Matlab三次均匀B样条曲线插值函数
WINCE下屏幕亮度调节工具
三阶PLL无源环路滤波器的设计与仿真 (2014年)
其他资源
《Redis实战》 高清扫描完整中文版带书签PDF
质子交换膜燃料电池建模与MATLAB仿真
绝缘检测电路的趋势.docx
recurdyn多体系统优化仿真技术.pdf
东南大学计算机视觉实验报告二图像配准
基于matlab的连杆机构运动仿真源代码
c#上位机接收STM32的数据实时显示存表格并画曲线图
mysql5.7ocp.rar
志汇叮咚同城微圈小程序源码 最新版11.3.7全开源 解决登录问题 最新亲测可用
C#网络编程TCP通信实例程序简单设计
C/C++/STL帮助手册 chm完整离线版
基于FPGA的数字密码锁的设计
高级软件工程ppt
qxdm.win.4.0_installer_00274.1..zip
metasploit下Windows的多种提权方法
GNS3镜像.rar
Docker文档.md
ios音乐播放器案例
全能电子地图下载器1.95注册版(修正了不能注册的问题)
天天(泊君)seo伪原创工具
可运行1.5.8的Bimserver版本(包括插件)第四部分 BimSurface
自动更新程序源码