Caption OCR Tool (abbr. COCR) 目录 其他语言 简介 一款视频硬字幕提取的工具, 使用OpenCV 进行视频/图像处理, 再利用Tesseract-OCR 识别. COCR 提供HSV, HLS, 二值形态学的过滤方法, 对于颜色偏暗的场景, 二值形态学比色彩过滤效果更佳. 系统需求 项目 最低配置 操作系统 Windows 7 x64 CPU 2C2T 内存 4 GB GPU 显存 2 GB 空闲空间 500 MB 基本使用 打开视频文件,并点击滤镜. 选择一个模块配置,重点:调整"裁剪"模块中的字幕区域,不要搞错左上角和右下角的位置! . 注: 滤镜最后得到的图像应该是白底黑字的!! 如果不是黑白的二值图像, 调整你的滤镜模块和参数; 如果是黑字白底, 需要加一个"反转" 模块; 关闭滤镜窗口后,主窗口点击开始提取字幕. 开启管理模式,标记无效的字幕
2021-12-10 10:57:05 108.97MB java opencv ffmpeg javafx
1
@[TOC](基于WASM的H265 Web播放器) 1 背景 目前这个时间点,原生支持H265(HEVC)播放的浏览器极少,可以说基本没有,主要原因一个是H265的解码有更高的性能要求,从而换取更高的压缩率,目前大多数机器CPU软解H265的超清视频还是有点吃力,硬解兼容性又不好,另外一个原因主要是H265的专利费问题。因此H265有被各大浏览器厂商放弃的趋势,转而去支持更加开放的AV1编码,但是AV1编码的商用和普及估计还有段时间。 H265与H264相比主要的好处在于相同分辨率下降低了几乎一倍的码率,对带宽压力比较大的网站来说,使用H265可以极大削减带宽消耗(尽管可能面临专利费麻烦),但是由于浏览器的支持问题,目前H265的播放主要在APP端实现,借助硬件解码,可以获得比较好的性能和体验。 本文相关的代码使用WASM、FFmpeg、WebGL、Web Audio等组件实现了一个简易
2021-12-09 23:45:12 26.47MB 附件源码 文章源码
1
ffmpeg文件生成m3u8文件及ts切片程序_1,实现输入本地文件切片成ts文件,m3u8,demo级别
2021-12-09 18:12:22 46.24MB ffmpeg
1
Advanced Media Framework AMF AMD Radeon硬件编码ffmpeg编译库源码 The AMF framework is compatible with most recent Radeon GPUs starting with the Southern Islands family and APUs of the Kabini, Kaveri, Carrizo families and newer.
2021-12-09 15:28:21 115.35MB ffmpeg amf amd gpu
1
android系统上使用编译好的ffmpeg的so库再用jni封装进行音频格式转换,主要是amr转为wav,可用于讯飞语音对wav音频格式的识别;完美解决讯飞在录音、传输和识别时因音频格式引发的难题(建议录音时用android原生API,MediaRecorder,录成amr格式,便于传输,要识别时再转换为wav格式)
2021-12-09 14:58:21 4.39MB android ffmpeg amr wav
1
B站缓存video.m4s转换成mp4,FFmpeg应用
2021-12-09 14:00:57 237KB B站缓存video.m4s FFmpeg应用
1
通过ffmpeg获取视频文件的视频时间长度信息,可以获取各种保存在本地的视频文件中的视频时长信息。完整的C代码和codeblocks工程,没有使用ffmpeg命令,是调用的ffmpeg API方式实现的,在linux下可直接编译和测试通过。
2021-12-09 12:26:20 45KB ffmpeg C语言 视频时长
1
FFmpeg是领先的多媒体框架,能够解码,编码, 转码,复用,解复用,流,过滤和播放人类和机器创造的任何东西(ffmpeg vaapi encode demo.c)
2021-12-08 20:50:56 7KB ffmpeg 例子
1
H264 H263 编解码程序,调用FFMPEG接口,并通过SOCKET/TCP协议直接把音视频数据从一端传输到另一端
2021-12-08 20:02:16 5.23MB H264 H263 FFMPEG
1
基于FFmpeg的转码工具,可将媒体文件转码为 MPG、MP4、MKV、TS格式。支持UDP发送转码后的流(封装格式TS)。 FFmpeg SDK使用的是FFmpeg Windows版本,在FFmpeg官方网下载,下载地址: http://ffmpeg.zeranoe.com/builds/ 该工具的工作原理:对输入的视频文件解码,把解码后的图像和音频帧送给FFmpeg模块编码,然后输出文件。你系统上必须安装一些Directshow的解码插件,否则可能无法解码视频或音频。 编码参数说明: bitrate_mode,编码模式,0表示CBR,1表示VBR,默认是CBR编码; quant质量系数(1-32),质量系数越小,质量越好,该参数在VBR模式下有效; outputformat 表示输出文件的路径和输出格式(扩展名表示格式),如c:\encoder.ts。 videocodec可以选择 mpeg2, mpeg4, h264; audiocodec可以选择 mp2, mp3, aac; video_bitrate和audio_bitrate分别表示视频码率、音频码率,单位为BPS; gopsize是指关键帧间距(1-200),如果gopsize=100,就是表示每100个帧插入一个关键帧 以下是几种常见的参数使用方案: 1. 转码为MP4文件 outputformat = c:\encoder.mp4 videocodec = mpeg4 audiocodec = aac 2. 转码为MPG文件 outputformat = c:\encoder.mpg videocodec = mpeg2 audiocodec = mp2 3. 转码为TS文件 outputformat = c:\encoder.ts videocodec = h264 audiocodec = aac 4. UDP发送TS流 output_to_udp = 192.168.1.102:1234 outputformat = c:\encoder.ts videocodec = h264 audiocodec = aac 其中output_to_udp表示的是目标主机的IP地址和端口信息。 UDP发送功能只能用于TS流的输出格式,并且只能发送流给一个客户端。
2021-12-08 18:55:20 6.24MB FFmpeg SDK Windows 版本
1