只为小站
首页
域名查询
文件下载
登录
Python实现基于ClipCap的看图
说话
Image Caption模型.zip
资源包含文件:设计报告word+源码及数据 Image Caption即我们常说的看图
说话
:给定一张图片,生成该图片对应的自然语言描述。 该任务涉及到了图像与自然语言两个模态,然而图像空间与自然语言空间本就十分庞大,并且两者之间存在巨大的语义鸿沟。 如何将两个庞大的语义空间进行对齐,这是该任务的重点。本项目对ClipCap: CLIP Prefix for Image Captioning 论文进行介绍,并且对论文在Flickr30k中文数据集上进行实验复现和效果展示。 详细介绍参考:https://biyezuopin.blog.csdn.net/article/details/125617468
2024-05-27 21:05:53
5.62MB
Python
源码
课程设计
让你的IE浏览器会
说话
浏览器作为每天上网必备的工具,除了选择IE、Maxthon、Opera、Firefox等知名的工具外,你还曾想过选择其它的吗?或许你一定会说放 着“名牌”不用,不是主动把自己列入“菜鸟”的队伍哟!今天我们就做第一个“吃螃蟹”的人来尝个鲜,向你介绍一款名为“Pink IE”的浏览器。
2024-03-29 09:13:26
65KB
信息技术
1
说话
的汤姆-源码-Android_tom
会
说话
的汤姆-Android源代码,里面包含说明文档。绝对是源代码!
2023-07-07 17:57:40
2.75MB
说话的汤姆
源码
Android
tom
1
20个
说话
技巧让你少奋斗20年Word范文
这是一套20个
说话
技巧让你少奋斗20年Word范文,喜欢的人都来下载吧。该文档为20个
说话
技巧让你少奋斗20年Word范文,是一份很不错的参考资料,具有较高参考价值,感兴趣的可以下载看看
2023-06-19 15:46:36
20KB
微软官方word模板
1
短语音噪声环境下
说话
人识别特征提取
为了使
说话
人识别系统在语音较短和存在噪声的环境下也具有较高的识别率, 基于矢量量化识别算法, 对提取的特征参数进行研究。把小波变换与美尔频率倒谱系数(MFCC )的提取相结合, 并将改进后的特征与谱质心 特征进行了组合, 建立了一种美尔频率小波变换系数+ 谱质心(MFWTC+ SC) 的新的组合特征参数。经实验表明, 该 组合特征可以有效地提高
说话
人识别系统的性能。
2023-04-15 16:18:16
185KB
说话人识别
特征提取
1
CASR-DEMO:基于Flask Web的中文自动语音识别演示系统,包含语音识别,语音合成,声纹识别之
说话
人识别
CASR-DEMO(中文自动语音识别演示系统) 关于本项目的一些说明 首先,欢迎大家关注项目,进行学习研究。收到一些小伙伴的问题我就集中回答下,这里是demo的源码,有两个版本其一是称为speech_env,这是一个简单的语音识别功能,界面如下面的效果图一;还有一个是V2.0的目录,这个版本功能比较齐全,界面如效果图二。有一点项目只在win10平台上测试过,其他不保证能不能运行。由于月久失更,有些依赖包可能需要修改,不过应该都是小问题,根据实际过程的报错信息修复就行。再次感谢大家的关注! 最新整理了两个版本的发布版 speech_env(效果图一) speechV2.0基于第三方接口实现语音识别和语音合成,
说话
人识别功能(效果图二) 微信:LHH754086474 于2019年12月25日更新。
2023-04-09 19:54:11
116.98MB
系统开源
1
ApplicationsandEnhancementsoftheDeepRecurrentNeuralNetworkForSpeechSeparation:深度递归神经网络用于单声道信号源分离和
说话
人识别
深度递归神经网络在语音分离中的应用和增强 语音分离实验 培训代码: codes/TSP/train_TSP_demo_mini_clip.m 演示版 在codes/TSP/demo/model.mat找到预训练的模型 在codes/TSP/demo/run_test_single_model.m运行演示代码 依存关系 该软件包基于 该软件依赖Mark Schmidt的软件包进行凸面优化。 此外,我们还包括了用于处理MFCC文件的Mark Hasegawa-Johnson的。 我们将用于计算功能(MFCC,logmel)(HCopy)。 我们使用信号处理功能。 我们使用工具箱版本2.0、3.0进行评估。 处理您的数据: 要尝试对数据进行编码,请参阅mir1k,TSP设置-相应地将数据放入codes/TSP/Data/ 。 调整开发集上的参数并检查结果。 笔记 使用MATLAB
2023-03-18 16:58:37
52.13MB
MATLAB
1
11.2 基于高斯混合模型(GMM)的
说话
人识别实验.rar
有完整的代码程序,有语音,高斯混合模型的
说话
人识别
2023-02-28 15:11:38
2.68MB
matlab
1
会
说话
的汤姆猫android版源码下载
该源码由源码天堂Android益智休闲频道免费提供下载。源码是一款流行的游戏,汤姆是一只宠物猫,他可以在您触摸时作出反应,并且用滑稽的声音完整地复述您说的话。您可以抚摸他,用手指戳他,用拳轻打他,或捉他的尾巴。喜欢的朋友可以下载学习看看。
2023-02-20 08:47:48
1.28MB
android源码
1
android源码之会
说话
的汤姆猫.zip
android会
说话
的汤姆猫源码 这个游戏曾经在网上风靡一时,我想现在很多朋友的手机上还有这款游戏,不经意间发现这个源码和大家分享一下,android游戏源码的经典。
2023-02-20 08:47:12
2.05MB
安卓源码-益智休闲
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
2022学术英语写作(东南大学) 章节测试+期末test答案
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
JPEG的Matlab实现
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
多目标优化算法(四)NSGA3的代码(python3.6)
基于蒙特卡洛生成电动汽车充电负荷曲线程序
YOLOv5 人脸口罩图片数据集
java-spring-web-外文文献翻译40篇.zip
基于OpenCV的车牌号码识别的Python代码(可直接运行)
RNN-LSTM卷积神经网络Matlab实现
商用密码应用与安全性评估——霍炜.pdf
长江流域shp.zip
随机森林用于分类matlab代码
鲸鱼优化算法 WOA matlab源代码(详细注释)
基于S函数的BP神经网络PID控制器及Simulink仿真和对应代码模型.zip
最新下载
PB实现中文语音朗读
DLNA/Airplay无线投屏安卓接收端安装软件KXCast 0.2.7
LabVIEWFM&PM调制例程
Build Report Tool v3.9.unitypackage
掌讯3158规格书安卓导航主板掌
3518C-008-root-ZL-ota-20200104-ymqn.zip
掌讯刷机程序5.1.zip
计算机视觉教程(章毓晋微课版本第3版)期末复习部分习题
Qt5.9.9-mips64.tar.gz
Android课程设计报告.docx
其他资源
Oracle公司 Java8 Java SE 8 Programmer I 认证考试1z0-808题库 总167题
thinkphp下使用soap
TCP/IP创建客户端和服务端源码
Cocos2d-x大作业 横版跑酷游戏摘星湖
腾讯自动过滑块验证登录 坐标识别算法源码
数理统计学导论第六版答案
MFC滚动字幕源码
软件需求分析报告文档模板+概要设计报告文档模板+详细设计报告文档模板+详细设计报告文档模板+软件测试
SetFSB2.1+CUP-Z(可用版)
2020电商直播消费升级微报告.pdf
自动检测技术及应用(第2版)课件 (第三章 电感传感器).ppt
酒店管理系统的设计与实现(JAVA源码+数据库sql+论文+视频)
HoloInventory:MC中块的全息图库存-源码
基于Android的爱学习监督管理系统iStudy-master.rar
Introducing Python;Modern Computing in Simple Packages
ASP.NET 在线视频点播系统
stm32飞控c语言程序
VB通过GPIB与仪器通讯
2015年上半年软件设计师真题及答案(上午下午)
基于ssh网上购物商城百度云链接
海思EC2108“死砖复燃”全过程图解
itext7 html转换为pdf
基于STM32的伤推式磁悬浮源码
最新阿狸子订单系统V2.4.2豪华版PHP订单系统源码