只为小站
首页
域名查询
文件下载
登录
Python实现基于ClipCap的看图说话Image Caption模型.zip
资源包含文件:设计报告word+源码及数据 Image Caption即我们常说的看图说话:给定一张图片,生成该图片对应的自然语言描述。 该任务涉及到了图像与自然语言两个模态,然而图像空间与自然语言空间本就十分庞大,并且两者之间存在巨大的语义鸿沟。 如何将两个庞大的语义空间进行对齐,这是该任务的重点。本项目对ClipCap: CLIP Prefix for Image Captioning 论文进行介绍,并且对论文在Flickr30k中文数据集上进行实验复现和效果展示。 详细介绍参考:https://biyezuopin.blog.csdn.net/article/details/125617468
2024-05-27 21:05:53
5.62MB
Python
源码
课程设计
让你的IE浏览器会说话
浏览器作为每天上网必备的工具,除了选择IE、Maxthon、Opera、Firefox等知名的工具外,你还曾想过选择其它的吗?或许你一定会说放 着“名牌”不用,不是主动把自己列入“菜鸟”的队伍哟!今天我们就做第一个“吃螃蟹”的人来尝个鲜,向你介绍一款名为“Pink IE”的浏览器。
2024-03-29 09:13:26
65KB
信息技术
1
说话的汤姆-源码-Android_tom
会说话的汤姆-Android源代码,里面包含说明文档。绝对是源代码!
2023-07-07 17:57:40
2.75MB
说话的汤姆
源码
Android
tom
1
20个说话技巧让你少奋斗20年Word范文
这是一套20个说话技巧让你少奋斗20年Word范文,喜欢的人都来下载吧。该文档为20个说话技巧让你少奋斗20年Word范文,是一份很不错的参考资料,具有较高参考价值,感兴趣的可以下载看看
2023-06-19 15:46:36
20KB
微软官方word模板
1
短语音噪声环境下
说话人
识别特征提取
为了使
说话人
识别系统在语音较短和存在噪声的环境下也具有较高的识别率, 基于矢量量化识别算法, 对提取的特征参数进行研究。把小波变换与美尔频率倒谱系数(MFCC )的提取相结合, 并将改进后的特征与谱质心 特征进行了组合, 建立了一种美尔频率小波变换系数+ 谱质心(MFWTC+ SC) 的新的组合特征参数。经实验表明, 该 组合特征可以有效地提高
说话人
识别系统的性能。
2023-04-15 16:18:16
185KB
说话人识别
特征提取
1
CASR-DEMO:基于Flask Web的中文自动语音识别演示系统,包含语音识别,语音合成,声纹识别之
说话人
识别
CASR-DEMO(中文自动语音识别演示系统) 关于本项目的一些说明 首先,欢迎大家关注项目,进行学习研究。收到一些小伙伴的问题我就集中回答下,这里是demo的源码,有两个版本其一是称为speech_env,这是一个简单的语音识别功能,界面如下面的效果图一;还有一个是V2.0的目录,这个版本功能比较齐全,界面如效果图二。有一点项目只在win10平台上测试过,其他不保证能不能运行。由于月久失更,有些依赖包可能需要修改,不过应该都是小问题,根据实际过程的报错信息修复就行。再次感谢大家的关注! 最新整理了两个版本的发布版 speech_env(效果图一) speechV2.0基于第三方接口实现语音识别和语音合成,
说话人
识别功能(效果图二) 微信:LHH754086474 于2019年12月25日更新。
2023-04-09 19:54:11
116.98MB
系统开源
1
ApplicationsandEnhancementsoftheDeepRecurrentNeuralNetworkForSpeechSeparation:深度递归神经网络用于单声道信号源分离和
说话人
识别
深度递归神经网络在语音分离中的应用和增强 语音分离实验 培训代码: codes/TSP/train_TSP_demo_mini_clip.m 演示版 在codes/TSP/demo/model.mat找到预训练的模型 在codes/TSP/demo/run_test_single_model.m运行演示代码 依存关系 该软件包基于 该软件依赖Mark Schmidt的软件包进行凸面优化。 此外,我们还包括了用于处理MFCC文件的Mark Hasegawa-Johnson的。 我们将用于计算功能(MFCC,logmel)(HCopy)。 我们使用信号处理功能。 我们使用工具箱版本2.0、3.0进行评估。 处理您的数据: 要尝试对数据进行编码,请参阅mir1k,TSP设置-相应地将数据放入codes/TSP/Data/ 。 调整开发集上的参数并检查结果。 笔记 使用MATLAB
2023-03-18 16:58:37
52.13MB
MATLAB
1
11.2 基于高斯混合模型(GMM)的
说话人
识别实验.rar
有完整的代码程序,有语音,高斯混合模型的
说话人
识别
2023-02-28 15:11:38
2.68MB
matlab
1
会说话的汤姆猫android版源码下载
该源码由源码天堂Android益智休闲频道免费提供下载。源码是一款流行的游戏,汤姆是一只宠物猫,他可以在您触摸时作出反应,并且用滑稽的声音完整地复述您说的话。您可以抚摸他,用手指戳他,用拳轻打他,或捉他的尾巴。喜欢的朋友可以下载学习看看。
2023-02-20 08:47:48
1.28MB
android源码
1
android源码之会说话的汤姆猫.zip
android会说话的汤姆猫源码 这个游戏曾经在网上风靡一时,我想现在很多朋友的手机上还有这款游戏,不经意间发现这个源码和大家分享一下,android游戏源码的经典。
2023-02-20 08:47:12
2.05MB
安卓源码-益智休闲
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
夏天IC助手1.8你们懂的
SSM外文文献和翻译(毕设论文精品).doc
数字信号处理——保研复习资料.pdf
RNN-LSTM卷积神经网络Matlab实现
基于MATLAB的Filter使用,低通、带通和高通滤波器的仿真
EEMD算法应用于信号去噪.rar
代码随想录知识星球精华-大厂面试八股文第二版v1.2.pdf
Matpower中文使用手册(原名《MATPOWER手册(中文版)》).rar
Plexim Plecs Standalone 4.1.2 x64.7z
python实现的学生信息管理系统—GUI界面版
画程(版本6.0.0.127)setup个人版
Microsoft Visual C++ 2015-2019 运行库合集,包含32位64位
基于matlab的车牌识别系统设计
鲸鱼优化算法 WOA matlab源代码(详细注释)
mingw-w64-install.exe
最新下载
广东工业大学 (有代码和截图)基于LiberoSoc的数字逻辑设计仿真及验证实验 基于实验箱的数字逻辑实验 74HC系列代码
零基础学python(明日科技)PPT源代码习题及答案视频.rar
S7-1200PLC 订货号 6ES7 214-1AG40-0XB0 固件升级 V4.6
《武汉市轨道交通12号线(江北段)工程环境影响报告书》.pdf
paradox 数据库工具 Paradox Data Editor 3.7
《31天学会CRM项目开发》随书源代码
ADS_tsmc_cm013rf_v1.7.zip
台积电RF 180nm Design kit For ADS
计算机视觉:一种现代方法第二版(中文版,英文原版)
模式识别第三版-----张学工
其他资源
AOA定位的扩展卡尔曼滤波定位算法Matlab源码
HIS系统方案模板
NI-VISA下载安装使用指南
游戏感:虚拟感觉的游戏设计师指南(超清版中文译本)
北航 雷达 课件 研究生
2014年重庆理工大学《操作系统原理及应用》两套期末考试试卷.pdf
无源晶振电路设计指南
UGUI ScrollView 分页滑动
游戏编程入门 莫里森著
小米路由器3刷老毛子教程[高清版].mp4
人脸识别demo.apk
石油工程软件列表
老外最想聊的100个英语口语话题.txt
无视红域名直接打开红域名qq微信支付宝链接开源
vscodeusersetup-1.52.0.zip
EShop网上商城系统.V1.1 - 基本流程.zip
补强片自动贴片系统高精度手眼标定方法.pdf
flash图片上传.zip
gradle-6.8.1-all.zip 快速下载
计算机操作系统答案/张尧学
汇编课程设计——时钟加小闹钟
apache-tomcat-5.5.26
商品出入库例子+derby数据库
Android 设备局域网内 一台做服务器一台做客户端 UDP建立通讯,TCP 数据交换 Demo
RS编码程序和译码程序