ICTCLAS分词的实现案例,完整的使用java代码实现,可以直接导入工程运行。
2024-01-25 07:05:23 4.48MB ICTCLAS,分词,实现
1
PHPAnalysis分词系统是基于字符串匹配的分词方法进行分词的
2023-11-12 09:02:31 2.71MB PHPAnalysis 分词系统
1
资源包含文件:课程报告word+源码+截图 对汉语自动分词技术有一个全面的了解,包括从词典的建立、分词算法的实现、性能评价和优化等环节。详细介绍参考:https://blog.csdn.net/sheziqiong/article/details/126794356
2022-10-18 14:05:00 913KB Python 汉语分词 汉语分词系统 源码
采取基于N-最短路径方法的中文词语粗分模型对中文文本进行粗切分,采取Viterbi算法对切分结果进行角色标注,在角色序列的基础上,进行模式最大匹配,最终实现中国人名的识别
2022-09-15 18:24:19 345KB 中文分词 中国人名 N最短路径
1
基于互信息改进算法的新词发现对中文分词系统改进
2022-05-02 14:06:31 16KB 文档资料
中科院的中文分词系统ICTCLAS是从事文本挖掘研究工作的学者们所广泛使用的软件,这是该软件的2015版本。
2022-04-08 14:16:41 49.06MB ICTCLAS2015
1
中科院ICTCLAS2014分词系统下载包
2022-04-03 13:35:02 46.88MB 中科院 ICTCLAS 分词
1
自己做分词系统测试程序,包含词库,运行需要.net 2.0
2022-03-03 11:27:20 351KB 分词 测试 程序 系统
1
phpanalysis PHP分词系统V2.51版
2022-02-23 20:02:56 2.66MB php PHP中文分词 中文分词
1
这是一个基于深度学习的分词系统和语料项目。背景97.5%准确率的深度学习中文分词(字嵌入 Bi-LSTM CRF)构建安装好bazel代码构建工具,clone下来tensorflow项目代码,配置好(./configure)clone 本项目地址到tensorflow同级目录,切换到本项目代码目录,运行./configure编译后台服务bazel build //kcws/cc:seg_backend_api训练1. 关注“待字闺中”公众号 回复 kcws 获取语料下载地址2. 解压语料到一个目录3. 切换到代码目录,运行:pyton kcws/train/process_anno_file  chars_for_w2v.txt 使用word2vec 训练 chars_for_w2v (注意-binary 0),得到字嵌入结果vec.txt bazel build kcws/train:generate_training ./bazel-bin/kcws/train/generate_training vec.txt  all.txt python kcws/train/filter_sentence.py all.txt (得到train.txt , test.txt)4. 安装好tensorflow,切换到kcws代码目录,运行:python kcws/train/train_cws_lstm.py --word2vec_path vec.txt --train_data_path  --test_data_path test.txt --max_sentence_len 80 --learning_rate 0.001demohttp://45.32.100.248:9090/ 标签:kcws
2022-01-10 16:48:49 4.08MB 开源项目
1