情感文本转语音的深度学习 关于我们尝试使用深度学习方法进行情感文字转语音的摘要 内容 数据集 数据集 演讲人数 情绪化 话语数量 不重复提示数 期间 语言 评论 优点 缺点 24(12女,12男) 8(镇静,中立,快乐,悲伤,愤怒,恐惧,惊喜和恶心) 1440 2个 约1小时 英语 每个说话者都有4种表达中性情绪的声音,而8种说话则包含所有其他情绪的声音,因此每个说话者有60种言语 容易获得 包含的情绪很容易解释 话语非常有限 词汇不佳 用不同的声音说出相同的话 5(3男,2女) 5(中立,逗乐,生气困,厌恶) 6914(1568、1315、1293、1720、1018) 1150 约7小时 英文,法文(1名男性) 尝试大型语料库进行情感表达 逗乐的情绪包含非语言提示,例如咯咯笑等,这些提示不会显示在笔录中 同样,困倦也有打哈欠的声音。 我们免费提供的唯一大规模情感语料
1
J2EE蓝图摘要(值得一看哦)
2022-05-20 00:04:26 326KB
1
MD5,即消息摘要算法(英语:MD5 Message-Digest Algorithm)。是一种被广泛使用的密码散列函数,将数据(如一段文字)运算变为另一固定长度值,是散列算法的基础原理,可以产生出一个128位(16字节)的散列值(hash value),用于确保信息传输完整一致。 MD5由美国密码学家罗纳德·李维斯特(Ronald Linn Rivest)设计,于1992年公开,用以取代MD4算法。这套算法的程序在 RFC 1321 中被加以规范。
2022-05-17 14:39:02 826KB 消息摘要算法
1
1 系统概述 当前市场存在的视频浓缩系统,普遍将不同时间段的运动目标进行提取和融合叠加,试图以此缩短视频播放时长。然而,其实际应用效果并不理想,主要存在视频运动目标多而复杂、多目标融合叠加并不完美、人类观看浓缩视频时眼花缭乱等问题。因此,这些视频浓缩系统实际上基本没有走出实验室,仅仅停留在论证、研发和演示阶段,无法真正大规模应用于实际案件侦查任务中。而且,当视频中运动目标多而复杂时,这些视频浓缩系统基本失效,浓缩视频和原始视频的播放时长几乎没什么差别,甚至会因观看不舒适而变得更糟糕。 作者完全自主研发的“梯度视频浓缩系统”,摒弃“同一地点不同时段目标同时播放”的做法,仍尊重并维持视频中运动目标的相对先后时间顺序不变,对视频内容进行详细准确分析,让同一目标在视频中做“变速运动”,即运动目标在视频中时快时慢,既能高度压缩原始视频,又确保不遗漏重要运动细节,也符合人类观看的舒适模式。 反复实测表明,梯度视频浓缩系统对原始视频的浓缩比一般在10-100倍之间,即便是场景中运动目标多而复杂,由于梯度视频浓缩算法让同一目标在视频中做“变速运动”,也能获得较大的浓缩比。 2 适用范围 1)视频量不大的场合,可以通过梯度视频浓缩系统,对原始视频进行浓缩(支持任意形状的感兴趣区域浓缩和不感兴趣区域屏蔽),再人工播放观看。播放过程中,可以跳转定位到原始视频的相应位置。 2)当碰到没有“已知场景”的海量视频侦查时,可以先通过排除等辅助方法,挑选出少量视频集合,进行视频浓缩,人工观看寻找可疑“已知场景”,提供给“梯度视频搜索系统”输入使用。 3 运行环境 电脑型号 华硕 All Series 台式电脑 操作系统 Windows 7 旗舰版 64位 SP1 ( DirectX 11 ) 处 理 器 英特尔 Core i7-4770 @ 3.40GHz 四核 主 板 华硕 Z97-C (英特尔 Haswell) 内 存 16 GB ( 金士顿 DDR3 1600MHz ) 主 硬 盘 西数 WDC WD10EZEX-08M2NA0 ( 1 TB / 7200 转/分 ) 显 卡 Nvidia GeForce GTX 750 ( 1 GB / 七彩虹 ) 显 示 器 三星 SAM0915 S22B310 ( 21.7 英寸 ) 光 驱 东芝-三星 CDDVDW SH-224DB DVD刻录机 声 卡 瑞昱 ALC892 高保真音频 网 卡 英特尔 Ethernet Connection (2) I218-V / 华硕 4 使用说明 4.1 生成浓缩视频 4.2 播放浓缩视频
1
matlab的egde源代码使用LSTM进行视频汇总 该存储库为使用LSTM(即我们的论文中的vsLSTM和dppLSTM)的视频摘要提供了数据和实现: *,赵伟伦*,费莎和克里斯汀·格劳曼。 在2016年欧洲计算机视觉会议(ECCV)会议上,荷兰阿姆斯特丹。 (*同等贡献)[] [] 如果您发现此存储库中的代码或其他相关资源很有用,请引用以下文章: @inproceedings{zhang2016video, title={Video summarization with long short-term memory}, author={Zhang, Ke and Chao, Wei-Lun and Sha, Fei and Grauman, Kristen}, booktitle={ECCV}, year={2016}, organization={Springer} } 环境 MAC OS X或Linux 具有计算能力的NVIDIA GPU 3.5+ Python 2.7以上 Theano 0.7+ Matlab的 数据 下载并解压缩到./data/ 请注意,我们以2fps对原始
2022-05-16 23:43:39 20.27MB 系统开源
1
vidDistill - 使用Captions实现自动(YouTube)视频摘要
2022-05-16 23:29:52 11KB Python开发-其它杂项
1
毕业论文-源代码- jsp的博客网站(SQLServer数据库、开题报告、内容摘要、设计文档)论.zip
2022-05-16 19:05:13 9.09MB sqlserver 数据库 文档资料 database
毕业论文-源代码- JSP科技文献管理系统(设计代码、SQLServer数据库、演示PPT、软件说明书、摘要)论.zip
2022-05-16 19:05:09 7.15MB sqlserver 数据库 科技 文档资料
毕业论文-源代码- JSP物流仓储管理系统(程序MySQL数据库、演示PPT、摘要)论文字数:51137字.zip
2022-05-16 19:05:00 12.5MB 数据库 mysql 文档资料 database
·1.【原创资源】内容简介: --------------------------------------------------------------- 这是一个压缩包,里面是东南大学2009年数模一等奖获奖论文,真实性, 可以在获奖名单中查询。对于准备数学建模美国赛的同学绝对有用,资源 难得,要的同学抓紧速下! --------------------------------------------------------------- ·2.资源使用方法 Adobe pdf浏览 --------------------------------------------------------------- ·3.文件组成形式 格式:pdf文件 /**********************************************/ 文件名如下: abstract_4046.pdf control_4046.pdf /**********************************************/ --------------------------------------------------------------- ·4. wogeguaiguai的附言: 1.我的其他数学建模资源也欢迎您下载,都是非常好的准备比赛要用的资 料。 2.本资料绝对是准备数模美国赛的超级经典资料。 希望对准备该赛的同学们有所帮助。 3.下载本文件后,您可以获得所有信息,不必再零散下载,给您带来很大 的方便。 4.10个资源分,绝对物超所值。评论后,您就可以获得11个资源分,欢迎 您评论! 5.由于我在参加完美国赛之后不会再做数模了,把资源上传在这里是为了 帮助更多的同学,所以资源上传在这里,即在本人电脑中删除。 --------------------------------------------------------------- ·5.如有问题,请在此留言,谢谢。 --------------------------------------------------------------- ·6.上传时间 2010-2-24-afternoon
2022-05-13 16:45:36 871KB MCM ICM 数学建模
1