基于分词与BP网络的文本分类 首先下载整个文件,BP文本分类-语义特征提取.rar主要存放了相关的数据集 代码主要包括: 1.特征提取 首先对文本信息进行分词处理,采用基于字符串匹配的方法: 依次截取一到多个词,并与字典库进行匹配。如二狗,如果匹配到字典中有这个词,则将其分为一个词;发现字典中没有与之匹配的,则说明这个不是一个词语,进行顺序操作, 2.得到分词后的文本之后,就是转换成数字编码,因此电脑没办法识别汉字。这一部分叫特征表示,即用数字的方式表示中文文本,采用的方法是基于词带模型的特征表示 3.通过2我们将文本表示成了数字,但是这样的表示通常都是稀疏的,为此我们利用降维方法,消除掉这些冗余特征。 4. 文本分类,采用的就是bp网络(1)如pca的降维数,维数过高,包含冗余数据,过低又会删除掉重要信息。(2)bp网络结构的调整,如隐含层节点数,学习率等
2023-03-06 10:05:56 3.48MB BP神经网络 文本分类器 MATLAB
1
摘要:VC/C++源码,其它分类,身份证读卡器 VC++身份证读卡器二次开发例子,用有一些DLL,觉得用处不太大,有空了看下。 运行环境:Windows/Visual C/C++
2023-03-06 09:30:23 106KB VC/MFC源代码 其它分类
1
中文文本分类语料库
2023-03-04 20:51:30 113.53MB 中文文本分类
1
EEG信号处理与分类CNN模型集合+样例运行训练
2023-03-04 19:32:10 52KB 脑机接口
1
这用Jupyter完成Iris数据集的 Fisher线性分类,并学习数据可视化技术 。里写目录标题用Jupyter完成Iris数据集的 Fisher线性分类,并学习数据可视化技术 。一、完成Iris数据集的 Fisher线性分类判断准确率二、学习数据可视化1、数据概览1.1、读取文件1.2、前五行数据1.3、后五行数据1.4、查看数据整体信息1.5、描述性统计1.6、对每种特征计数2、特征工程2.1、引入可视化所需要的库2.2、去掉Species下的字符2.2、绘制花萼的长度与宽度的散点图2.3、绘制花瓣的长度与宽度的散点图2.4、Id编号与花萼长度, 花萼宽度, 花瓣长度, 花瓣宽度之间的关
2023-03-04 14:14:07 108KB her IS 分类
1
本文列出物联网应用(WIFI、BLE、ZIGBEE、GPS、GSM、SUB-G、LORA、NFC)中包含的常见类型天线的分类和特点,近场天线、内置天线、贴片天线、同轴线天线、弹簧天线、顶馈天线、胶套天线、玻璃钢天线、平板天线、吸盘天线、外置天线。
2023-03-04 01:50:43 1.66MB 13.56M HZ 天线分类 GPS
1
matlab开发-混合动力车具有自适应遗忘功能,可重复控制电网转换器。。给出了基于群的自适应遗忘重复控制器的内部工作原理。
2023-03-03 14:55:07 1.58MB 未分类
1
设计了一种基于Arduino开发板的纸币整理、分类控制系统。该系统采用ArduinoMega2560单片机作为控制核心,结合步进电机驱动板、颜色传感器、显示屏、语音播放模块等组成整套系统,实现了纸币整理、分类、显示、语音播报等功能。该系统利用Arduino IDE开发环境编写控制程序,通过模拟人工整理纸币过程实现纸币整理,通过颜色传感器采集数据以及算法控制,实现纸币分类,并通过实验证明了设计的可靠性、稳定性。
2023-03-03 12:26:26 183KB 纸币整理
1
您可以使用本数据集从严格的制图变量(与遥感数据相反)中预测森林覆盖类型(主要的树种)。给定的30 x 30米单元的实际森林覆盖类型是根据美国森林服务(USFS)区域2资源信息系统数据确定的。然后,从美国地质调查局和USFS获得的数据中得出自变量。数据为原始格式(未缩放),包含用于定性自变量(例如荒野和土壤类型)的二进制数据列。 sampleSubmission.csv test3.csv train.csv
2023-03-02 21:46:14 1.52MB 数据集
1
matlab开发-等温线深度计算。此函数将从两个数据集(即配置文件和网格数据)计算ILD。
2023-03-02 19:38:56 3KB 未分类
1