1.2国内外研究现状 国外自动分类研究开始于1950年代末,H.P.Luhn在这一领域进行了开创性的 研究,他首先将词频统计的思想用于文本分类中。1960年Maron在Journal of ASM 上发表了有关自动分类的第一篇论文“On relevanee,pr。bab¨itic i ndexing and inf。rmation fetnral”。1962年博科(H.Borko)等人提出了利用因子分析法进行 文献的自动分类。其后许多学者在这一领域进行了卓有成效的研究。国外的自动分 类研究大体上可以分为三个阶段:第一阶段(1958年1964年)主要进行自动分类的 可行性研究:第二阶段(1965年一1974年),自动分类的实验研究:第三阶段(1975年一 至今),自动分类的实用化阶段⋯㈩⋯⋯⋯。现已在邮件分类、电子会议、信息 过滤等方面取得了较为广泛的应用,其中较为成功的系统有麻省理工学院(MIT)为 白宫丌发的邮件分类系统、卡内基集团为路透社丌发的construe系统等。 国内自动分类研究起步较晚“¨“,始于20世纪80年代初期。1981年侯汉清对 计算机在文献分类工作中的应用作了探讨,并介绍了国外在计算机管理分类表、计 算机分类检索、计算机自动分类、计算机编制分类表等方面的概况。此后,困内的 研究者在英文文本分类研究的基础上采取相应策略,结合中文文本的特定知识,然 后应用于中文之上,继而形成中文文本自动分类研究体系。到目前为止,我国陆续 研制出一批计算机辅助分类系统和自动分类系统。例如中国科学院、清华大学、北 京大学、北京信息工程学院、上海交通大学、复旦大学、东北大学、山西大学、同 济大学、南京大学、浙江大学以及西安电子科技大学等单位都有相应的研究成果, 也研制出了不少的实验系统。这其中有基于人工智能技术的分类系统,有基于统计 学技术的分类系统,还有基于模糊技术的分类系统,近几年基于统计知识的分类方 法占主流,也不乏有基于规则的分类方法。 国外当前流行的文本分类方法有k近邻法(KNN)”3、决策树”1、朴素贝叶斯(NB) ‘⋯、支持向量机(sVM)‘⋯、神经网络(NNet)Ⅲ”Ⅲ。1、线性最小平方拟合(LLsF)法⋯1、 最大熵模型“⋯、回归模型㈨㈨、遗传算法⋯1等方法。这些方法在英文文本自动分 类上有广泛的研究,而且很多研究表明KNN和SVM是英文文本分类的最好方法。国 外很多研究人员对英文文本分类领域的各个问题都有相当深入的研究,对几种流行 的方法进行了大量的对比研究。Yiming Yang and xin Liu“51对SvM、KNN、LLsF、 Nnet和NB这5种方法进行了专门的比较研究。 国内当前流行的文本分类方法有k近邻法(KNN)”6¨“1、朴素贝叶斯(naive
1
超好用的 Git 可视化工具,解决了使用git命令的繁琐 使用GitKraken工具 可以使各次提交界面化 更加便于代码管理
2022-05-04 18:04:10 111.1MB 源码软件 macos git
1
超好用的 Git 可视化工具,解决了使用git命令的繁琐 使用GitKraken工具 可以使各次提交界面化 更加便于代码管理
2022-05-04 18:04:10 112.6MB macos 源码软件
1
通过ssh批量修改主机密码(无sudo权限) https://blog.csdn.net/sjwbcb/article/details/124560366?spm=1001.2014.3001.5502
2022-05-04 14:00:45 4.25MB macos
1
通过ssh批量修改主机密码(无sudo权限) https://blog.csdn.net/sjwbcb/article/details/124560366?spm=1001.2014.3001.5502
2022-05-04 10:00:37 4.13MB macos
1
mac 好用的ssh桌面终端软件
2022-05-04 10:00:36 83.17MB macos ssh 运维
1
Redis(Remote Dictionary Server ),即远程字典服务,是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set --有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,而且这些操作都是原子性的。在此基础上,redis支持各种不同方式的排序。与memcached一样,为了保证效率,数据都是缓存在内存中。区别的是redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件,并且在此基础上实现了master-slave(主从)同步。 Redis 是一个高性能的key-value数据库。 redis的出现,很大程度补偿了memcached这类key/value存储的不足,在部 分场合可以对关系数据库起到很好的补充作用。
2022-05-04 09:04:13 69.11MB redis 数据库 windows linux
内容概要:使用Qt 写的签名可执行程序 适用人群:需要为桌面应用进行签名的程序,如Qt应用,其他 使用场景:需要签名的程序需要为标准的苹果应用格式,如发生错误,在执行时会终端显示相应错误信息
2022-05-04 09:00:42 4.56MB macos 文档资料 qt
1
mac os x 10.13.6 安装brew提示连接失败的解决方案 最后所需要的sh脚本文件,直接赋权后执行即可安装brew
2022-05-03 16:49:39 17KB brew macos shell xcode
1