ictclas中科院分词
2021-04-08 19:44:14 2.94MB ictclas
1
基于相似度计算的主观题阅卷系统设计,此系统通过ictclas把答案进行分词,然后把分词结果对照中文停用词表把一些没有实际意义的词语过滤掉,然后根据余弦定理计算出学 生答案和标准答案的相似度。句子分词是直接用的中科院的ictclas,其他地方是自己写的,包括分词后每个词的权值啦,去除无意义的词啦(比如:的,像,是,好。。。等等 对照停用词表),最后通过自己的计算公式,计算出学生答案和标准答案的相似度百分比。 可以直接在main方法中测试,不过自己又添加了struts,所以也可以在页面当中进行测试。功能经过自己测试完全通过,至于美化页面,自己有兴趣可以完善一下。
2020-03-05 03:06:19 8.86MB 主观题 阅卷 余弦定理 ictclas
1
java实现中科大ICTCLAS2015分词,源代码和jar包之前都有提供。
2019-12-21 18:56:04 964KB ICTCLAS java
1
利用knn算法实现了一个中文网页自动分类器, 包括网页预处理,ictclas中文分词,基于tf-idf的文本特征表示,基于df的特征选取和基于knn的分类算法,最后通过struts2框架web发布
2019-12-21 18:51:55 173KB ictclas knn struts2 中文分词
1