视频内嵌硬字幕提取OCR识别外挂字幕(srt格式)CPU、GPU显卡加速/视频字幕提取软件,视频演示教程观看地址:https://www.ixigua.com/7211914126979760675?logTag=732bc89015727ed20b03 懒人视频字幕提取工具是一款非常简单且实用的视频字幕提取软件,该软件的主要功能就是帮助用户快速提取视频中字幕区域的文字,我们在观看视频时如果需要其中的字幕就可以用到这款软件,可帮助您自动提取所有字幕,无需手动一个一个对照着进行输入,便于您对视频字幕重新进行编辑,对应的字幕提取操作非常简单,导入需要的视频,通过几个简单的步骤即可一键进行提取,提取完成后可显示提取到的字幕的保存位置,还可查看提取用时,需要的话就赶快下载试试吧!【特别提醒安装密码请输入:18603298215 】完全免费 原创软件 放心下载
1
该课题为基于MATLAB平台的PCA的人脸识别系统。传统的人脸识别都是直接人头的比对,现实意义不大,这块都做烂了。该课题识别原理为:从一副生活照中寻找到人脸,并且分割人脸图象,利用PCA算法进行降维,和库里图片进行对比,输出目标人脸以及相关个人信息。该课题还可以继续二次开发,做成库内外人脸的识别,如果是库外人脸则实现报警等。
1
Riquelme的开源岩体结构面识别软件,用于R2019b版本Matlab
2023-04-10 16:56:18 109.63MB matlab DSE
1
具体见如下博文: https://mp.csdn.net/mp_blog/creation/editor/new/129018747 包含100张指针分割数据集,更多的数据集见博文链接。
1
OpenCV激光投影虚拟键盘 基于激光投影技术的虚拟键盘设计基于OpenCV,结合硬件识别,检测手指位置,然后映射到键盘,以实现相应的KeyPress。 如何工作? 如何工作? 在红外激光的底部从一个红外范围内的覆盖空间的表面发射出红外线,当然这个平面可以覆盖整个键盘,键盘在键盘中央是投影轮廓形状的键盘,主要用于标定时,在实时摄像头顶部的图形外部并将数据传递到计算机,因为激光是水平和平行的,因此没有物体遮挡摄像头无法检测到红外信号,但是如果在红外激光区域,当被遮挡物的表面被红外摄像机覆盖时,将检测到红外信号,经过一定的算法后,计算机访问摄像机发送的信号,以获取红外点图片中的坐标,然后将坐标映射到真实的键盘位置,以实现其功能。 硬件 1.选择相机镜头 同一区域的检测摄像机,“ Camera2”为视角150°,高度为“ h2”,“ Camera1”为视角90°,高度为“ h1”,以缩小项目
2023-04-10 12:54:50 37.83MB C++
1
话说什么是OCR????? 简介 OCR技术是光学字符识别的缩写(Optical Character Recognition),是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。可应用于银行票据、大量文字资料、档案卷宗、文案的录入和处理领域。适合于银行、税务等行业大量票据表格的自动扫描识别及长期存储。相对一般文本,通常以最终识别率、识别速度、版面理解正确率及版面还原满意度4个方面作为OCR技术的评测依据;而相对于表格及票据,通常以识别率或整张通过率及识别速度为测定OCR技术的实用标准。 解析 采用
2023-04-10 10:00:11 556KB ocr python tesseract
1
提出了利用小波变换(WT)、非负稀疏矩阵分解(NMFs)和Fisher线性判别(FLD)来进行人脸识别。用小波变换分解人脸图像,选择最低分辨率的子段,既能捕获到人脸的实质特征,又有效地降低了计算复杂性;非负稀疏矩阵分解能显示地控制分解稀疏度和发现人脸图像的局部化表征;Fisher线性判别能在低维子空间中形成良好的分类。实验结果表明,这种方法对光照变化、人脸表情和部分遮挡不敏感,具有良好的健壮性和较高的识别效率。
1
IsingFit 该网络估计程序eLasso基于Ising模型,将l1正则逻辑回归与基于扩展贝叶斯信息准则(EBIC)的模型选择相结合。 EBIC是一种适合的度量,用于识别变量之间的相关关系。 生成的网络由变量(作为节点)和相关关系(作为边)组成。 可以处理二进制数据。
2023-04-10 08:02:07 16KB R
1
CASR-DEMO(中文自动语音识别演示系统) 关于本项目的一些说明 首先,欢迎大家关注项目,进行学习研究。收到一些小伙伴的问题我就集中回答下,这里是demo的源码,有两个版本其一是称为speech_env,这是一个简单的语音识别功能,界面如下面的效果图一;还有一个是V2.0的目录,这个版本功能比较齐全,界面如效果图二。有一点项目只在win10平台上测试过,其他不保证能不能运行。由于月久失更,有些依赖包可能需要修改,不过应该都是小问题,根据实际过程的报错信息修复就行。再次感谢大家的关注! 最新整理了两个版本的发布版 speech_env(效果图一) speechV2.0基于第三方接口实现语音识别和语音合成,说话人识别功能(效果图二) 微信:LHH754086474 于2019年12月25日更新。
2023-04-09 19:54:11 116.98MB 系统开源
1
UiBot初级认证试题--火车票信息识别
2023-04-09 17:04:41 185KB Uibot 火车票识别
1