包含的功能有: 使用android中的AudioRecord类,获取原始PCM数据. 将PCM数据用speex编码. 将编码后的数据打包录制成flv文件. 使用android-rtmp-client库将编码,打包后的数据直接发布到流媒体服务器. 本地与服务器端录音同时进行.
2021-11-13 10:00:18 1.76MB red5 rtmp audio
1
音频教程 TorchAudio教程
2021-11-10 03:56:20 2.91MB JupyterNotebook
1
vue-audio-recorder Vue.js的音频记录器。 它允许在服务器上创建,播放,下载和存储记录。 实时演示功能漂亮的UI干净的Vue-audio-recorder Vue.js的音频记录器。 它允许在服务器上创建,播放,下载和存储记录。 实时演示功能精美干净的UI下载/上传/播放记录时间限制记录限制大量回调个人音频播放器MP3 / WAV支持在(台式机)Chrome OS Firefox中测试在Safari浏览器中的安装vue-audio-recorder-保存AudioRecorder道具Prop类型描述尝试次数记录尝试次数的头标对象HTTP标头
2021-11-08 20:33:17 356KB Vue.js Audio / Video
1
ac97和HD Audio规范,详细描述音频规范,经历ac97到hda的变化,提供下载
2021-11-08 10:52:51 4.53MB ac97和HD Audio规范
1
此存储库包含对 Matt Frear 提交的非常有用的 2003/2004 pa-wavplay File-Exchange 提交的更新(文件 ID:#4017)。 做了两个修改: 1. 增加了 WASAPI 音频功能。 2. 该软件现在适用于 32 位和 64 位安装的 Matlab。 该存储库包含四个 32 位和四个 64 位 MEX 文件,用于使用 ASIO、WASAPI、DirectX 和 Windows 音频播放音频。 文件 pa_wavplay.m、pa_wavrecord.m 和 pa_wavplayrecord.m 为这些 MEX 提供了 m 文件接口。 有关文档,请参阅“帮助”。 MEX 文件是使用存储库中提供的源 *.cpp 文件构建的。 它们依赖于开源 PortAudio API(未提供)。
2021-11-08 10:00:18 912KB matlab
1
python-pesq 适用于Python用户的PESQ(语音质量的感知评估)包装 这段代码是专门为numpy数组设计的。 要求 C compiler numpy cython 编译安装 $ git clone https://github.com/ludlows/python-pesq.git $ cd python-pesq $ pip install . # for python 2 $ pip3 install . # for python 3 $ cd .. $ rm -rf python-pesq # remove the code folder since it exists in the python package folder 用pip安装 # PyPi Repository $ pip install pesq # The Latest Version $ pi
2021-11-07 17:48:55 212KB python signal-processing audio-processing pesq
1
含有数字语音处理的各种常见现象和应该注意的问题
2021-11-06 12:01:13 20.42MB DAFX audio effects
1
Udo Zolzer Technical University of Hamburg-Harburg,Germany
2021-11-04 11:38:20 6.57MB Digital Signal Processing DSP
1
卷积神经网络的开发,用于音乐音频文件的多标签自动标记 初步步骤 下载mp3文件,然后使用以下方法将其组合:cat mp3.zip。*> single_mp3.zip从以下子文件夹中提取文件:find。 -mindepth 2型f -print -exec mv {}。 ; 介绍 通常,音乐音频文件可以随附与其内容有关的元数据,例如自由文本描述或标签。 事实证明,标签更有用,因为它们可以提供对音频文件的更直接描述,并且可以用于与音乐相关的推荐系统中的任务,如按性别分类,艺术家,乐器等。 由于并非所有音频文件都带有标签,因此需要自动标记。 广泛使用的一种方法涉及使用无监督特征学习,例如K均值,稀疏编码和Boltzmann机器。 在这些情况下,主要关注的是捕获低水平音乐结构,这些结构可用作某些分类器的输入。 另一种方法涉及受监督的方法,例如各种体系结构类型(MLP,CNN,RNN)的深层神经
1
.NET中的音频指纹识别和识别 soundfingerprinting是一个C#框架,专门为音频和数字信号处理,数据挖掘和音频识别领域的公司,发烧友,研究人员设计。 它实现了一种高效的算法,该算法可以快速插入和检索声学指纹,并且具有很高的精度和查全率。 文献资料 下面的代码片段显示了如何从音频文件中提取声学指纹,然后将它们用作识别未知音频查询的标识符。 这些子指纹(或指纹,两个术语可互换使用)将存储在可配置的数据存储区中。 private readonly IModelService modelService = new InMemoryModelService (); // store fingerprints in RAM private readonly IAudioService audioService = new SoundFingerprintingAudioService (); // default audio library public async Task StoreForLaterRetrieval ( string pathToAudioFile ) {
2021-11-03 14:51:27 5.76MB audio c-sharp algorithm recognition
1