针对红外试试图像处理系统构建的FPGA+多DSP的硬件平台,利用FPGA进行调度和时序控制,有效的使3个处理器并行工作,大大提高了系统处理能力。研究并实现了从红外探测器数据采集到图像校正、图像处理,以及图像显示的整个流程。
2022-07-29 11:27:35 87KB FPGA DSP 图像处理 Virtex
1
裂缝的 Unet 语义分割 使用 PyTorch、OpenCV、ONNX 运行时的实时裂缝分割 依存关系: 火炬 OpenCV ONNX 运行时 CUDA >= 9.0 指示: 1.使用您的数据集训练模型并在supervisely.ly上使用unet_train.py保存模型权重(.pt文件) 2.使用pytorch_to_onnx.py将模型权重转换为ONNX格式 3.使用crack_det_new.py获取实时推理 裂纹分割模型文件可点击此下载 结果: 图表:
1
微信小程序的基础库升级到了 1.6.0 之后,提供了许多新的 API,其中新增了 录音管理 的 API,不同于以前只有 wx.startRecord 和 wx.stopRecord 两个简单的录音功能,新的 wx.getRecorderManager 接口提供了包括扩展时长、采样率、录音通道、码率、格式等在内的许多配置项。基于此,我们能更加轻松的控制录音,新提供的 onFrameRecorded 的事件,甚至可以实现流式语音识别。 本文就介绍一下使用 Wafer Node.js SDK 提供的腾讯云智能语音识别接口来实现录音转文字的功能。请您先从 Github 下载 语音识别 Demo ,本文
2022-07-29 09:52:50 137KB 基于 腾讯 智能 语音 实时 识别 微信
1
一款用labview做的图像化噪声处理系统,直接可以拿来使用,完全没有任何问题
2022-07-29 09:00:14 462KB labview
1
RCS(Real-time control systems)是一种模块之间的实时通信系统,该系统库由美国国家标准与技术研究院(NTST)提供研发与技术支持,适用于自动驾驶等复杂系统的模块化开发应用。 RCS系统是一款基于面向对象机制开发的通信系统软件,其代码对外开放,可在此基础上方便地进行二次开放和代码重构。 在实现方式上,RCS系统可自动完成复杂的内部通信,维护多个模块之间的控制指令与状态信息的传输,对于开放人员而言,无需过多关心内部的通信细节。 RCS 系统通过共享内存缓冲区传递信息,NML(Neutral Message Language)中性消息语言负责对数据信息进行编码和解码。由于 NML 是 RCS 系统内部的数据表示方式和数据格式,与操作系统和硬件环境无关,因而可以实现数据信息在不同系统平台上的应用,实现跨平台数据通信,
2022-07-28 21:00:35 4.37MB rcs 实时通信系统
1
⠀ 后处理视频还是要在上传之前减小视频大小? 看看我们的。 像该项目一样,从中获利,还是只是想回头? 请考虑或! 需要支持,咨询或有任何其他与业务有关的问题? 随时。 CameraView CameraView是一个文档齐全的高级库,可轻松捕获照片和视频,解决大多数常见问题和需求,并在需要时仍具有灵活性。 api ' com.otaliastudios:cameraview:2.7.0 ' 快速可靠 手势支持 实时过滤器 由Camera1或Camera2驱动的引擎 框架处理支持 水印和动画叠加层 OpenGL驱动的预览 使用takePicture和takeVideo拍摄高质量的内容 使用takePictureSnapshot和takeVideoSnapshot拍摄超快速快照 智能调整大小:创建任意大小的CameraView 控制HDR,闪光灯,变焦,白平衡,曝光度,位置,网格图等 RAW图片支持 轻巧的 降至API级别15 经过测试 ⠀ ⠀ 支持 如果您喜欢该项目,从中获利,或者只是想感谢您,请考虑通过GitHub Sponsors计划为提供赞助!
2022-07-28 14:55:43 6.03MB android opengl camera picture
1
ubuntu下的划词工具实时翻译单词翻译汉译英和英译汉包括句子,安装简单,解压缩之后,在文件夹内打开终端执行sudo sh install.sh
2022-07-28 09:38:43 2KB 划词工具
1
Kaldi GStreamer服务器 这是基于Kaldi工具包和GStreamer框架并以Python实现的实时全双工实时语音识别服务器。 广告 塔林工业大学正在寻找一名从事语音识别的博士生,重点是轻度代码转换的语音(例如,芬兰语包含很多英语技术术语)。 。 注意! 该职位仍然开放! 特征 基于websocket的全双工通信:语音进入,出现部分假设(考虑Android的语音输入) 高度可扩展:服务器由主组件和工作程序组成; 每个并发识别会话需要一名工作人员; 可以独立于远程计算机上的主机启动和停止工作程序 可以进行语音分割,即,基于静音,将长语音信号分为较短的片段 支持任意长的语音输入(例如,您可以将实时语音流式传输到其中) 支持Kaldi的GMM​​和“在线DNN”模型 支持使用大型语言模型对识别格进行记录 支持在请求之间保留声学模型自适应状态 支持无限制的音频编解码器集(实际上
2022-07-27 16:06:16 233.98MB speech-recognition Python
1
本代码可通过摄像头实时获取人脸图像,并根据脸部特征信息进行专注度分析。
2022-07-27 15:57:52 11KB 实时 专注度分析
1
教育教学-微格教室课程高清实时录制系统V3.0.0.2-安装及使用指南.doc
2022-07-27 15:00:59 669KB 教育教学
1