中文分词处理源代码,C++写的,用的树形构造
2022-06-07 20:05:42 6KB 中文分词 源代码 C++
1
古汉语处理数据
2022-05-15 16:03:50 1.1MB 文档资料
1
disp('展示BP的训练集分类') bp_train_accuracy=sum(J==J1)/length(J) figure stem(J,'bo'); grid on hold on plot(J1,'r*'); legend('网络训练输出','真实标签') title('BP神经网络训练集') xlabel('样本数') ylabel('分类标签') hold off %% 测试集准确率 tn_bp_sim = sim(net_bp,P_test);%测试 [I J]=max(tn_bp_sim',[],2); [I1 J1]=max(T_test',[],2); disp('展示BP的测试集分类') bp_test_accuracy=sum(J==J1)/length(J) figure stem(J,'bo'); grid on hold on plot(J1,'r*'); legend('测试输出','真实标签') title('BP神经网络测试集') xlabel('样本数') ylabel('分类标签') hold off
2022-04-20 09:06:52 3.91MB 分类 自然语言处理 人工智能 数据挖掘
统计词频,和对文档进行分词处理,计算tf-idf值。
2022-02-12 12:12:48 1.2MB tf-idf
1
该文档是网传的小黄鸡语料库,经过简单的数据预处理,已保存为conv文件格式,每一个E代表一段对话的开始,详见语料库内容,经本人测试,语料训练效果还不错,有志于学习NLP相关课程的同学可以下载做个小案例
2021-08-20 16:19:51 16.47MB 自然语言处理
1
python开发,PDF转TXT格式,处理公司年报,PDF文件处理,分词前处理。
金融词条 25万 分词处理,金融数据分析 ,金融词条 25万 分词处理,金融数据分析 ,结巴分词
2020-01-15 03:10:56 4.92MB 结巴分词 金融数据分析 金融词条
1