搜索【词】的结果

安全技术-网络信息-模因视角下网络语言的造词机制和进化研究.pdf

2022-04-28 19:00:13 2.33MB 文档资料 安全网络

西柏坡纪念馆导游词.docx

全国各地区名胜古迹导游词

2022-04-27 09:03:30 15KB 全国各地区名胜古迹导游词

基于层叠隐马模型的汉语词法分析

提出了一种基于层叠隐马模型的汉语词法分析方法,旨在将汉语分词、词性标注、切分排歧和未登录词识别集成到一个完整的理论框架中1在分词方面,采取的是基于类的隐马模型,在这层隐马模型中,未登录词和词典中收录的普通词一样处理1未登录词识别引入了角色HMM:Viterbi算法标注出全局最优的角色序列,然后在角色序列的基础上,识别出未登录词,并计算出真实的可信度1在切分排歧方面,提出了一种基于N2最短路径的策略,即:在早期阶段召回N 个最佳结果作为候选集,目的是覆盖尽可能多的歧义字段,最终的结果会在未登录词识别和词性标注之后,从N个最有潜力的候选结果中选优得到1不同层面的实验表明,层叠隐马模型的各个层面对汉语词法分析都发挥了积极的作用1实现了基于层叠隐马模型的汉语词法分析系统ICTCLAS, 该系统在2002年的“九七三”专家组评测中获得第1名,在2003 年汉语特别兴趣研究组(ACLSpecialInterestGrou ponChineseLan guageProcessing,SIGHAN )组织的第1届国际汉语分词大赛中综合得分获得两项第1名、一项第2名1这表明:ICTCLAS 是目前最好的汉语词法分析系统之一,层叠隐马模型能够解决好汉语词法问题.

2022-04-26 17:15:00 198KB 汉语词法分析 词性标注 未登录词识别 层叠隐马模型

1

no stop .cpp

用来去除英文文章的停用词代码，是一个c++的代码，已调试成功

2022-04-24 16:35:48 576B 停用词 自然语言处理

1

word-discovery:速度更快、效果更好的中文新词发现

速度更快、效果更好的中文新词发现复现了之前的中的新词发现算法。算法细节：复现细节：实测在经过充分训练的情况下，用bakeoff2005的pku语料进行测试，能得到0.765的F1，优于ICLR 2019的的0.731 （注：这里是为了给效果提供一个直观感知，比较可能是不公平的，因为我不确定这篇论文中的训练集用了哪些语料。但我感觉在相同时间内本文算法会优于论文的算法，因为直觉论文的算法训练起来会很慢。作者也没有开源，所以有不少不确定之处，如有错谬，请读者指正。）使用使用前务必通过 chmod +x count_ngrams 赋予count_ngrams可执行权限，然后修改word_discovery.py适配自己的数据，最后执行 python word_discovery.py 更新 2019.12.04: 兼容python3，在python2.7和python3.5下测试通过

2022-04-23 21:07:21 226KB Python

1

CNWD:Chinese New Word Discover(无监督，中文新词发现)

概述 1.本程序用于中文新词发现。不依赖于已有词典、词库，输入中文文本，即可发现中文新词，属非监督式学习。 2.本程序支持中文2字新词、3字新词和4字新词的发现。 3.需要python3及以上。算法参考基于大规模语料的新词发现算法，顾森，《程序员》不过，在顾森文章中提及的次数阈值、凝固度阈值、信息熵阈值是实数值，本程序支持基于统计的比值。本程序，次数阈值、凝固度阈值、信息熵阈值参数设置分别为-c、-b、-e(统计比值)，-C、-B、-E(实数值)。使用 cnwd.py Input Output [options] options: -c CountThresholdPercent,(0,1),default=0.5 -C CountThreshold -b BindThresholdPercent,(0,1),default=0.5 -B BindThreshol

2022-04-23 20:27:39 2.28MB Python

1

Java 词海分析自然语言分析人名地名机构名提取自定义词典

中文分词最短路分词 N-最短路分词 CRF分词索引分词极速词典分词用户自定义词典词性标注命名实体识别中国人名识别音译人名识别日本人名识别地名识别实体机构名识别关键词提取 TextRank关键词提取自动摘要 TextRank自动摘要短语提取基于互信息和左右信息熵的短语提取拼音转换多音字声母韵母声调简繁转换繁体中文分词简繁分歧词（简体、繁体、臺灣正體、香港繁體）文本推荐语义推荐拼音推荐字词推荐依存句法分析基于神经网络的高性能依存句法分析器 MaxEnt依存句法分析 CRF依存句法分析语料库工具

2022-04-23 09:31:17 21.31MB 词海分析

1

华东—南京中山陵导游词.docx

全国各地区名胜古迹导游词

2022-04-23 09:02:05 296KB 全国各地区名胜古迹导游词

东北—辽宁名胜古迹导游词.docx

全国各地区名胜古迹导游词

2022-04-21 09:01:36 293KB 全国各地区名胜古迹导游词

西南—四川都江堰的导游词.docx

全国各地区名胜古迹导游词

2022-04-21 09:01:35 293KB 全国各地区名胜古迹导游词

个人信息

热门下载

最新下载

其他资源