只为小站
首页
域名查询
文件下载
登录
The Emu
Speech
Database System-开源
EMU是用于创建,操作和分析语音数据库的软件工具的集合。 EMU的核心是数据库搜索引擎,该引擎允许基于注释的顺序和层次结构进行查询。
2024-07-09 08:47:19
15.64MB
开源软件
1
离线文字转语音-Overtone - Realistic AI Offline Text to
Speech
(TTS)
离线文字转语音——Overtone - Realistic AI Offline Text to
Speech
(TTS)
2024-05-17 14:50:19
225.58MB
人工智能
Unity
1
react-native-tts:React适用于Android和iOS的Native Text-To-
Speech
库
React本地TTS React Native TTS是用于iOS,Android和Windows上的的文本到语音库。 文献资料 安装 npm install --save react-native-tts react-native link react-native-tts 用法 进口货 import Tts from 'react-native-tts' ; 视窗 在windows/myapp.sln将RNTTS项目添加到您的解决方案中: 在Visual Studio 2019中打开解决方案 右键单击解决方案资源管理器中的“解决方案”图标>添加>现有项目 选择node_modules\react-native-tts\windows\RNTTS\RNTTS.vcxproj 在windows/myapp/myapp.vcxproj添加引用RNTTS到您的主应用程序项目。 从Visu
2024-04-01 09:47:06
352KB
Java
1
speech
:语音到文本的端到端模型的PyTorch实现
演讲 语音是一个开放源代码包,用于构建用于自动语音识别的端到端模型。 当前支持关注的序列到序列模型,连接器时间分类和RNN序列转换器。 该软件的目的是促进语音识别的端到端模型的研究。 这些模型在PyTorch中实现。 该软件仅在Python3.6中经过测试。 我们不会为Python2.7提供向后兼容性。 安装 我们建议创建一个虚拟环境并在其中安装python要求。 virtualenv
source
/bin/activate pip install -r requirements.txt 然后按照适用于您的计算机的版本的安装说明进行操作。 安装所有python需求后,从顶层目录运行: make 构建过程需要CMake以及Make。 之后,从仓库根目录获取setup.sh 。 source setup
2024-01-15 10:50:42
112KB
Python
1
Speech
and Language Processing, 2nd Edition.pdf
For undergraduate or advanced undergraduate courses in Classical Natural Language Processing, Statistical Natural Language Processing,
Speech
Recognition, Computational Linguistics, and Human Language Processing.
2023-12-29 17:29:40
18.56MB
NLP
1
speech
and language processing 2nd edition
speech
and language processing英文 第二版
2023-12-29 17:27:57
14.8MB
speech
language
processing
1
语音情感识别(matlab源代码),基于matlab的语音识别的代码,matlab
基于matlab进行语音情感识别,通过特征空间得到该语音包含的离散情感
2023-11-12 10:02:54
35KB
speech
情感识别
matlab语音
Speech
Processing in Modern Communication--Challenges and Perspectives.pdf
本内斯蒂2010年作品,主要讲述通讯中的音频信号处理,值得大家下载下来仔细研读
2023-08-11 16:30:13
16.8MB
本内斯蒂
1
Speech
Enhancement in the Karhunen-Loeve Expansion Domain.pdf
本内斯蒂关于语音增强的著作,值得大家下载下来仔细研究
2023-08-11 16:29:35
1.4MB
本内斯蒂
1
Speech
-Separation:语音分离的最后一年项目
PyTorch + Catalyst实现的“ 。 该存储库处理培训过程。 为了进行推断,请检出GUI包装器:PyQT中的 。 该储存库已与合并为。 目录 要求 计算方式 我们在1050 Mobile和Tesla V100的两个GPU上运行了该程序。 我们没有进行任何基准测试,但是V100的速度大约提高了400倍。 它还取决于您下载的数据量。 因此,任何服务器级GPU都是可行的。 贮存 该程序确实会生成很多文件(下载和其他方式)。 每个音频文件的大小为96kiB。 对于7k独特的音频剪辑,并以70/30的比例进行火车和验证拆分,它占用了约120GiB的存储空间。 因此,如果您下载更多音频片段,则至少为1TB 。 记忆 至少需要4GB VRAM 。 它可以处理2个批处理大小。在20个批处理大小下,在两个GPU上,每个GPU占用16GiB VRAM。 设置 如果您使用的是Docker,则
2023-04-12 18:15:47
1.03MB
neural-network
signal-processing
pytorch
spectrogram
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
东南大学英语技术写作慕课所有答案
EEMD算法应用于信号去噪.rar
BP_PID控制仿真.rar
基于STM32的FFT频谱分析+波形识别
基于ray filter的雷达点云地面过滤ROS节点
适用于eNSP 1.3.00 可加载的USG6000V防火墙设备包
PSO-LSSVM的MATLAB代码.rar
Spring相关的外文文献和翻译(含出处).zip
CPLEX12.8学术版安装包:cplex_studio128.win-x86-64.exe
Android小项目——新闻APP(源码)
2019综合测评仿真.zip
cublas64_11.dll cublasLt64_11.dll cusolver64_11.dll
随机森林用于分类matlab代码
基于OpenCV的车牌号码识别的Python代码(可直接运行)
锁相环simulink建模仿真.rar
最新下载
ALINX AX301B FPAG开发板用户手册
词法分析器 MFC界面 编译原理
Parallels Desktop v17.0.0 for mac M1:M1 PRO官方正版.zip
Gre Math Sub REA练习题共6套
Devart SecureBridge v9.3.1 for Delphi 10.4.zip
AQ6317B光谱分析仪操作手册
mstar isp 烧录工具 ISP-Tool-5.0.13
美团外卖代付系统源码.zip
华为S2300升级文件
最优潮流内点法
其他资源
长江经济带Shp文件
modbus数据类型解析工具
opencv3.4+contrib vs2017 debug x64 编译好的库
ISO-26262-2011(完整中文版本)
Struts2开发的电子商务系统
WS2812-main (1).zip
MA7561.rar
ffmpeg-snapshot.tar.bz2
从Webpack到Ykit——前端工程构建实践
领航网络远程管理软件2018正式版.zip
STC12C5A60S2单片机控制led旋转的所有资料,包括ALTIUM原理图+8个KEIL软件工程源码文件.rar
2018a for linux R1_13
Pickit3工具软件
plc工程文件
卡Iphone在线源码
小程序获取openid(亲测通过)
兼容wpc wma 无线充电 基本原理 以及 新片介绍