只为小站
首页
域名查询
文件下载
登录
Python实现基于ClipCap的看图说话Image Caption模型.zip
资源包含文件:设计报告word+源码及数据 Image Caption即我们常说的看图说话:给定一张图片,生成该图片对应的自然语言描述。 该任务涉及到了图像与自然语言两个模态,然而图像空间与自然语言空间本就十分庞大,并且两者之间存在巨大的语义鸿沟。 如何将两个庞大的语义空间进行对齐,这是该任务的重点。本项目对ClipCap: CLIP Prefix for Image Captioning 论文进行介绍,并且对论文在Flickr30k中文数据集上进行实验复现和效果展示。 详细介绍参考:https://biyezuopin.blog.csdn.net/article/details/125617468
2024-05-27 21:05:53
5.62MB
Python
源码
课程设计
让你的IE浏览器会说话
浏览器作为每天上网必备的工具,除了选择IE、Maxthon、Opera、Firefox等知名的工具外,你还曾想过选择其它的吗?或许你一定会说放 着“名牌”不用,不是主动把自己列入“菜鸟”的队伍哟!今天我们就做第一个“吃螃蟹”的人来尝个鲜,向你介绍一款名为“Pink IE”的浏览器。
2024-03-29 09:13:26
65KB
信息技术
1
说话的汤姆-源码-Android_tom
会说话的汤姆-Android源代码,里面包含说明文档。绝对是源代码!
2023-07-07 17:57:40
2.75MB
说话的汤姆
源码
Android
tom
1
20个说话技巧让你少奋斗20年Word范文
这是一套20个说话技巧让你少奋斗20年Word范文,喜欢的人都来下载吧。该文档为20个说话技巧让你少奋斗20年Word范文,是一份很不错的参考资料,具有较高参考价值,感兴趣的可以下载看看
2023-06-19 15:46:36
20KB
微软官方word模板
1
短语音噪声环境下
说话人
识别特征提取
为了使
说话人
识别系统在语音较短和存在噪声的环境下也具有较高的识别率, 基于矢量量化识别算法, 对提取的特征参数进行研究。把小波变换与美尔频率倒谱系数(MFCC )的提取相结合, 并将改进后的特征与谱质心 特征进行了组合, 建立了一种美尔频率小波变换系数+ 谱质心(MFWTC+ SC) 的新的组合特征参数。经实验表明, 该 组合特征可以有效地提高
说话人
识别系统的性能。
2023-04-15 16:18:16
185KB
说话人识别
特征提取
1
CASR-DEMO:基于Flask Web的中文自动语音识别演示系统,包含语音识别,语音合成,声纹识别之
说话人
识别
CASR-DEMO(中文自动语音识别演示系统) 关于本项目的一些说明 首先,欢迎大家关注项目,进行学习研究。收到一些小伙伴的问题我就集中回答下,这里是demo的源码,有两个版本其一是称为speech_env,这是一个简单的语音识别功能,界面如下面的效果图一;还有一个是V2.0的目录,这个版本功能比较齐全,界面如效果图二。有一点项目只在win10平台上测试过,其他不保证能不能运行。由于月久失更,有些依赖包可能需要修改,不过应该都是小问题,根据实际过程的报错信息修复就行。再次感谢大家的关注! 最新整理了两个版本的发布版 speech_env(效果图一) speechV2.0基于第三方接口实现语音识别和语音合成,
说话人
识别功能(效果图二) 微信:LHH754086474 于2019年12月25日更新。
2023-04-09 19:54:11
116.98MB
系统开源
1
ApplicationsandEnhancementsoftheDeepRecurrentNeuralNetworkForSpeechSeparation:深度递归神经网络用于单声道信号源分离和
说话人
识别
深度递归神经网络在语音分离中的应用和增强 语音分离实验 培训代码: codes/TSP/train_TSP_demo_mini_clip.m 演示版 在codes/TSP/demo/model.mat找到预训练的模型 在codes/TSP/demo/run_test_single_model.m运行演示代码 依存关系 该软件包基于 该软件依赖Mark Schmidt的软件包进行凸面优化。 此外,我们还包括了用于处理MFCC文件的Mark Hasegawa-Johnson的。 我们将用于计算功能(MFCC,logmel)(HCopy)。 我们使用信号处理功能。 我们使用工具箱版本2.0、3.0进行评估。 处理您的数据: 要尝试对数据进行编码,请参阅mir1k,TSP设置-相应地将数据放入codes/TSP/Data/ 。 调整开发集上的参数并检查结果。 笔记 使用MATLAB
2023-03-18 16:58:37
52.13MB
MATLAB
1
11.2 基于高斯混合模型(GMM)的
说话人
识别实验.rar
有完整的代码程序,有语音,高斯混合模型的
说话人
识别
2023-02-28 15:11:38
2.68MB
matlab
1
会说话的汤姆猫android版源码下载
该源码由源码天堂Android益智休闲频道免费提供下载。源码是一款流行的游戏,汤姆是一只宠物猫,他可以在您触摸时作出反应,并且用滑稽的声音完整地复述您说的话。您可以抚摸他,用手指戳他,用拳轻打他,或捉他的尾巴。喜欢的朋友可以下载学习看看。
2023-02-20 08:47:48
1.28MB
android源码
1
android源码之会说话的汤姆猫.zip
android会说话的汤姆猫源码 这个游戏曾经在网上风靡一时,我想现在很多朋友的手机上还有这款游戏,不经意间发现这个源码和大家分享一下,android游戏源码的经典。
2023-02-20 08:47:12
2.05MB
安卓源码-益智休闲
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
随机森林用于分类matlab代码
YOLOv5 人脸口罩图片数据集
《应用非线性控制》(美)斯洛坦著;程代展译(清晰)
scratch版 我的世界.sb2
狂神说全部笔记内容.zip
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
MPC 模型预测控制matlab仿真程序
QT自制精美Ui模板系列(一)桃子风格模板 - 二次开发专用
IBM CPLEX 12.10 学术版 mac操作系统安装包
Plexim Plecs Standalone 4.1.2 x64.7z
Android大作业——网上购物APP(一定是你想要的)
MATLAB车牌识别系统
云视通端口扫描器.rar
2021华为芯片研发岗位笔试题
数据结构课后习题答案
最新下载
校园导游系统课程设计报告
千分尺 螺旋测微器 flash动画
ROSE mirror HA 双机热备软件
魂斗罗素材
国开《计算机绘图》课程形考1-4 .dwg答案(可直接使用)
DS18B20温度采集+串口发送+模块化编程 51单片机
Plex v7.12电视端app
IBM CPLEX 12.10 学术版 mac操作系统安装包
ADC参数测试资料&matlab源程序
城市规划GIS技术应用指南_随书练习数据
其他资源
中国电力出版社杨欢红电路答案
产生高斯白噪声和有色噪声的MATLAB程序
CMSIS-DAP仿真器
微软雅黑 JetBrainsMono 混合字体,编程字体,等宽字体(斜杠 0,基于微软 6.0)
kvm_client_windows.zip
电动牙刷开发例程(stc15系列单片机)
java的23种设计模式视频---免费共享
基于udp的多功能聊天室
微信小程序调度班表.zip
地理信息系统原理方法和应用-邬伦等编著
PHP工单管理系统在线提交二次开发免费开源.zip
屏幕取色工具
基于曲率特征混合分类的高密度点云降噪方法
navicat15安装包.rar
NC65年结手册.pdf
奇安信全球APT安全威胁报告 2021-1-21.pdf
Computer Networking A Top-Down Approach - 5 Edition
MFC GDI+练手学习
unity5超酷3D战斗机空战游戏完整源码
flash 制作mtv 可风 课程设计
数据库安全技术白皮书汇总
struts 图形报表