概述 语音识别是当前人工智能的比较热门的方向,技术也比较成熟,各大公司也相继推出了各自的语音助手机器人,如百度的小度机器人、阿里的天猫精灵等。语音识别算法当前主要是由RNN、LSTM、DNN-HMM等机器学习和深度学习技术做支撑。但训练这些模型的第一步就是将音频文件数据化,提取当中的语音特征。 MP3文件转化为WAV文件 录制音频文件的软件大多数都是以mp3格式输出的,但mp3格式文件对语音的压缩比例较重,因此首先利用ffmpeg将转化为wav原始文件有利于语音特征的提取。其转化代码如下: from pydub import AudioSegment import pydub def MP3
2021-03-26 10:41:32 104KB python python函数 方法
1
文中简单介绍了多层数字高程模型的含义、特点、表示方法及其发展与研究现状。其次,主要介绍了多层数字高程模型的数据获取和其数据结构。数据获取包括数据采集,多层DEM数据结构有离散点结构、规则格网结构、不规则三角网结构、等高线结构和混合结构五种。最后介绍了多层数字高程模型(DEM)的构建、内插及其应用。构建多层DEM的方法有规则格网法(GRID)、不规则三角网法(TIN)和混合法(GRID-TIN)等;DEM内插主要有整体内插、分块内插和逐点内插三类。多层DEM主要应用于滑坡体的变形提取,为预测和防治滑坡灾害提供了必要参数。
2021-03-24 16:58:12 172KB 行业研究
1
【转发】【引用】【论文】大多数的网站的网页除了主要的内容,还包含导航栏,广告,版权等无关信息。这些额外的内容亦被称为噪声,通常与主题无关。由于这些噪声会妨碍搜索引擎对 Web 数据的挖掘性能,所 以需要过滤噪声。在本文中,我们提出基于网页文本密度与符号密度对网页进行正文内容提取,这是一种快速,准确通用的网页提取算法,而且还可以保留原始结构。通过与现有的一些算法对 比,可以体现该算法的精确度,同时该算法可以较好的支持大数据量网页正文提取操作。
2021-03-24 14:00:43 1.54MB 网页正文提取 爬虫 文本密度 符号密度
1
基于2-D Gabor滤波器的光学定穴体表特征提取方法
2021-03-17 20:12:41 1.13MB 研究论文
1
利用Matlab计算三维点云中每个点的单位法向量与特征值。 通过计算当前点与其邻域点的协方差矩阵,进而求得法向量。
2021-03-13 11:27:31 108KB Matlab 法向量 特征值 点云
1
维吾尔语词干提取方法研究
2021-03-07 21:04:32 908KB 研究论文
1
基于磁性纳米粒子的核酸提取方法的开发及其在丙型肝炎病毒化学发光检测中的应用
2021-03-03 09:10:09 1.72MB 研究论文
1
一种新型的铜浮选泡沫图像局部光谱特征提取方法
2021-02-24 18:05:16 1.12MB 研究论文
1
该文提出了一种新的基于小世界网络特性的关键词提取算法.首先,利用K最邻近耦合图构成方式,将文档表示成为词语网络.引入词语聚类系数变化量和平均最短路径变化量来度量词语的重要性,选择重要性大的词语组成候选关键词集.利用侯选关键词集词语位置关系和汉语词性搭配关系,提取出复合关键词. 实验结果表明该方法是可行和有效的,获取复合关键词比一般关键词所表达的含义更便于人们对文本的理解.
2021-02-23 14:04:07 268KB 计算机应用 ; 中文信息处理 ;
1