Tritan DSP - TXP16E Programming Guide V1.2 中文版
2021-07-06 14:02:22 1.39MB Tritan 硕呈 Audio DSP
1
视听视频字幕 这是我通过使用pytorch框架使用MSR-VTT数据集为视频字幕构建的项目,该框架涉及视觉和音频信息。 视频的视觉内容被预处理成固定数量的帧,馈入经过预训练的深度CNN(例如,ResNet 152)以提取特征,并馈入LSTM编码器。 对于音频内容,它们被预处理为MFCC,并馈入另一个LSTM编码器。 然后,将两个LSTM编码器的输出和隐藏状态通过平均池化(或多级注意,以及子总和单元 )进行组合,然后进一步馈入LSTM解码器以生成字幕。 整个项目的基本结构是从导入的。 要运行该项目,您需要以下依赖项: Python3 运行模型的步骤 第一步是预处理视频和字幕 $ python preprocess.py --video_dir path/to/the/training/video/directory --output_dir path/to/the/features/
2021-07-05 19:33:19 99.52MB Python
1
Artstudio Pro 是支持macOS和iOS的最强大的绘图和照片编辑应用程序。充分利用最新技术Metal、iCloud Drive,并针对64位多核处理器进行了优化,以实现最流畅的工作流。
2021-07-05 13:01:02 30.64MB 图和照片编辑
1
开源软件 jack audio 1.9.11版本。
2021-07-03 14:27:13 23.33MB jack audio 1.9.11
1
JACK,即 Jack Audio Connection Kit,提供低延迟、高效率的进程间音频连接,以及音频设备共享,适用于专业音频应用。 这个网站已经死了。 请使用 http://jackaudio.org/ INSTEAD
2021-07-02 20:03:02 812KB 开源软件
1
ISO_IEC_11172-3 MPEG AUDIO 文档,标准官方文档,影印版本;下载解压即可
2021-07-01 20:53:51 9.68MB ISO_IEC_1117
1
自己移植到ARM-linux下,测试可用,包括源码,makefile文件,编译出的so文件libwebrtc_audio.so,移植后的头文件webrtc_api.h,测试用例WebRtcAudioTest.c(包括AGC,AEC,NS的使用方法)及编译出的可执行文件webrtc_aec,还有一些测试所用的音频资源文件 如果系统或者cpu不一样,需要修改makefile
2021-07-01 20:41:02 1.63MB webrtc AEC AGC NS
1
Virtual Audio Cable是一种音频驱动程序,使您可以从一个应用程序传输音频串流到另一个.它创建一个双音频输入/输出设备.任何应用程序可以将音频输出到音频设备,当然其他应用程序可以收到输入音频。 官方试用版在使用一段时间会出现一个女声读‘trial’的声音。网上存在的很多破解版软件实际上仍然没有破解。博主偶然看到网上有个一Virtual Audio Cable4.10破解版。实测可用。 但在使用期间,时常会出现音频变慢的情况。慢到可以清晰听出每一个采样点的声音。 现给出解决方案。 参数设置:sample rate(采样率)=192000,Total buffer(全部缓存)=8000 Bits per sample(位深度)=32, Channel config=7.1 home theat,Priority (属性)=Realtime
2021-07-01 18:47:06 1.47MB 音频技术
1
【】 | 【】如果本文档图片没有显示,请手动切换到Gitee镜像库阅读文档。 :open_book:Recorder用于html5录音 ,支持大部分已实现getUserMedia的移动端、PC端浏览器;主要包括:Chrome、Firefox、Safari、IOS 14.3+、Android WebView、腾讯Android X5内核(QQ、微信);不支持:UC系内核(典型的支付宝),大部分国产手机厂商自研套壳娱乐浏览器,低版本IOS(11.0-14.2)上除Safari外的其他任何形式的浏览器(含PWA、WebClip、任何App内网页)。 Recorder H5 : [ ] [ ] [ ] 工具集 : [ ] [ ] [ ] [ ] RecordApp[即将废弃] : [ ] [ ] [ ] [ ] 录音默认输出mp3格式,另外可选wav格式;有限支持ogg(beta)、webm(b
2021-07-01 14:55:29 4.44MB audio javascript html5 dtmf
1
不受约束的视频中的视听事件本地化(出现在ECCV 2018中) AVE数据集和功能 可以从下载AVE数据集。 和(7.7GB)也已发布。 在运行代码之前,请先将AVE数据集的视频放入/ data / AVE文件夹,将功能放入/ data文件夹。 用于生成音频和视频功能的脚本: ://drive.google.com/file/d/1TJL3cIpZsPHGVAdMgyr43u_vlsxcghKY/view?usp=sharing(可以随意修改并使用它来处理音频和视频数据)。 要求 Python-3.6,Pytorch-0.3.0,Keras,ffmpeg。 可视化注意力图 运行:pythontention_visualization.py生成音频引导的视觉注意图。 有监督的视听事件本地化 测试: 本文中的A + V-att模型:python supervised_main.py -
1