只为小站
首页
域名查询
文件下载
登录
Python实现基于ClipCap的看图
说话
Image Caption模型.zip
资源包含文件:设计报告word+源码及数据 Image Caption即我们常说的看图
说话
:给定一张图片,生成该图片对应的自然语言描述。 该任务涉及到了图像与自然语言两个模态,然而图像空间与自然语言空间本就十分庞大,并且两者之间存在巨大的语义鸿沟。 如何将两个庞大的语义空间进行对齐,这是该任务的重点。本项目对ClipCap: CLIP Prefix for Image Captioning 论文进行介绍,并且对论文在Flickr30k中文数据集上进行实验复现和效果展示。 详细介绍参考:https://biyezuopin.blog.csdn.net/article/details/125617468
2024-05-27 21:05:53
5.62MB
Python
源码
课程设计
让你的IE浏览器会
说话
浏览器作为每天上网必备的工具,除了选择IE、Maxthon、Opera、Firefox等知名的工具外,你还曾想过选择其它的吗?或许你一定会说放 着“名牌”不用,不是主动把自己列入“菜鸟”的队伍哟!今天我们就做第一个“吃螃蟹”的人来尝个鲜,向你介绍一款名为“Pink IE”的浏览器。
2024-03-29 09:13:26
65KB
信息技术
1
说话
的汤姆-源码-Android_tom
会
说话
的汤姆-Android源代码,里面包含说明文档。绝对是源代码!
2023-07-07 17:57:40
2.75MB
说话的汤姆
源码
Android
tom
1
20个
说话
技巧让你少奋斗20年Word范文
这是一套20个
说话
技巧让你少奋斗20年Word范文,喜欢的人都来下载吧。该文档为20个
说话
技巧让你少奋斗20年Word范文,是一份很不错的参考资料,具有较高参考价值,感兴趣的可以下载看看
2023-06-19 15:46:36
20KB
微软官方word模板
1
短语音噪声环境下
说话
人识别特征提取
为了使
说话
人识别系统在语音较短和存在噪声的环境下也具有较高的识别率, 基于矢量量化识别算法, 对提取的特征参数进行研究。把小波变换与美尔频率倒谱系数(MFCC )的提取相结合, 并将改进后的特征与谱质心 特征进行了组合, 建立了一种美尔频率小波变换系数+ 谱质心(MFWTC+ SC) 的新的组合特征参数。经实验表明, 该 组合特征可以有效地提高
说话
人识别系统的性能。
2023-04-15 16:18:16
185KB
说话人识别
特征提取
1
CASR-DEMO:基于Flask Web的中文自动语音识别演示系统,包含语音识别,语音合成,声纹识别之
说话
人识别
CASR-DEMO(中文自动语音识别演示系统) 关于本项目的一些说明 首先,欢迎大家关注项目,进行学习研究。收到一些小伙伴的问题我就集中回答下,这里是demo的源码,有两个版本其一是称为speech_env,这是一个简单的语音识别功能,界面如下面的效果图一;还有一个是V2.0的目录,这个版本功能比较齐全,界面如效果图二。有一点项目只在win10平台上测试过,其他不保证能不能运行。由于月久失更,有些依赖包可能需要修改,不过应该都是小问题,根据实际过程的报错信息修复就行。再次感谢大家的关注! 最新整理了两个版本的发布版 speech_env(效果图一) speechV2.0基于第三方接口实现语音识别和语音合成,
说话
人识别功能(效果图二) 微信:LHH754086474 于2019年12月25日更新。
2023-04-09 19:54:11
116.98MB
系统开源
1
ApplicationsandEnhancementsoftheDeepRecurrentNeuralNetworkForSpeechSeparation:深度递归神经网络用于单声道信号源分离和
说话
人识别
深度递归神经网络在语音分离中的应用和增强 语音分离实验 培训代码: codes/TSP/train_TSP_demo_mini_clip.m 演示版 在codes/TSP/demo/model.mat找到预训练的模型 在codes/TSP/demo/run_test_single_model.m运行演示代码 依存关系 该软件包基于 该软件依赖Mark Schmidt的软件包进行凸面优化。 此外,我们还包括了用于处理MFCC文件的Mark Hasegawa-Johnson的。 我们将用于计算功能(MFCC,logmel)(HCopy)。 我们使用信号处理功能。 我们使用工具箱版本2.0、3.0进行评估。 处理您的数据: 要尝试对数据进行编码,请参阅mir1k,TSP设置-相应地将数据放入codes/TSP/Data/ 。 调整开发集上的参数并检查结果。 笔记 使用MATLAB
2023-03-18 16:58:37
52.13MB
MATLAB
1
11.2 基于高斯混合模型(GMM)的
说话
人识别实验.rar
有完整的代码程序,有语音,高斯混合模型的
说话
人识别
2023-02-28 15:11:38
2.68MB
matlab
1
会
说话
的汤姆猫android版源码下载
该源码由源码天堂Android益智休闲频道免费提供下载。源码是一款流行的游戏,汤姆是一只宠物猫,他可以在您触摸时作出反应,并且用滑稽的声音完整地复述您说的话。您可以抚摸他,用手指戳他,用拳轻打他,或捉他的尾巴。喜欢的朋友可以下载学习看看。
2023-02-20 08:47:48
1.28MB
android源码
1
android源码之会
说话
的汤姆猫.zip
android会
说话
的汤姆猫源码 这个游戏曾经在网上风靡一时,我想现在很多朋友的手机上还有这款游戏,不经意间发现这个源码和大家分享一下,android游戏源码的经典。
2023-02-20 08:47:12
2.05MB
安卓源码-益智休闲
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
拾荒者扫描器.zip
20200318附加-2019年电赛综合测评方案详细计算过程(pdf版本,有朋友反映word版本乱码,特意转为pdf)
基于蒙特卡洛生成电动汽车充电负荷曲线程序
大唐杯资料+题库(移动通信)
房价预测的BP神经网络实现_python代码
西安问题电缆-工程伦理案例分析.zip
simulink仿真实现光伏发电MPPT+能量管理
2019年秋招—华为硬件工程师笔试题目.pdf
Alternative A2DP Driver 1.0.5.1 无限制版
YOLOv5 人脸口罩图片数据集
校园网规划与设计和pkt文件
中国地面气候资料日值数据集(V3.0)2010-2019.rar
cplex_studio129.win-x86-64.exe CPLEX 12.9直接安装可使用
雷达信号处理仿真程序(MTI,MTD等)
elsevier 爱思唯尔 系列期刊的word模板,template,单栏,双栏
最新下载
支持Lazarus2.10的JSON解析组件superobject
蓝宝石580 8G 2304满血 超白金原版BIOS.rar
NASA的IMS轴承数据
XPEnoboot_DS3615xs_5.2-5592.1.iso
Studio One4机架精调效果包及插件
STC89C52RC贴片元件库 原理图库+pcb库
非线性系统(中文翻译第三版) Khalil
QQ批量上号器QQ批量上号器
kkbox-music-recommendation-challenge.zip
奎享雕刻V1.2(安卓版).apk
其他资源
C++程序设计原理与实践(基础+进阶版) 第二版
同城智慧红娘相亲交友 1.0.22.rar
基于51单片机的抽奖系统
房产中介管理系统完整源码
图像处理标准测试图片
基于JavaWeb的在线教育平台的设计与实现.zip
基于Spark的PSO并行计算
Discuz论坛自动回帖软件
2017美赛题目翻译+O奖论文+参考思路+参考文献+官方英文解读
EPLAN P8 S7200以及S71500的宏文件(.EMA)
PPT实现随机数,随机人名
常用算法程序集(C语言描述) (PDF高清电子书+源代码).
C# DLL源码查看器
数据库原理课程设计学生选课管理系统
music算法matlab程序
jQuery的树形例子.zip
web信息查询系统-1201.rar
北京理工大学《大学物理下》08-13级期末考试试卷(含答案).pdf
studio-3t-x64_2019.2.1_windows.zip
Access_JDBC.jar
降压斩波电路的设计与拓扑结构
msp430模拟水位控制
[epub] 像程序员一样思考(修订版)