CSC 是一个自主研制的软件系统, 核心是一个中文语义词库。该版本可查阅将近 23 万中文词语、27 万以上义项的同义、分类、反义等方面的语义信息, 其中含有超过 50 种关系类型、超过 250 万个关系实例, 15 万以上的词语或义项带有同义词。整个词库呈现为比较复杂的网络结构, 并带有多种检索手段和显示方式。该词库也是一种较简化的知识本体或知识库, 有类似著名英文词库 WordNet 的用途, 可作为智能搜索、自然语言处理等领域的辅助资源。这里是 EXE 版。请注意不是文本形式, 且在有的版本的系统中可能有时不太稳定。
1
YAGO是一个大型语义知识库,源自维基百科,WordNet,WikiData,GeoNames和其他数据源
2021-11-27 22:16:25 18.86MB Python开发-其它杂项
1
中文语义KB ChineseSemanticKB,中文语义知识库,面向中文处理的12类,百万规模的语义常用词典,包括34万抽象语义库,34万反义语义库,43万同义语义库等,可支持句子扩展,转写,事件抽象与泛化等多种应用场景。 项目介绍 语义知识是自然语言处理中非常重要的一个基础资源,与学术界追求算法模型不同,工业界的自然语言处理对于复杂的语法,语义语义等多种资源依赖度很高,具体体现在: 1,具有落地场景的自然语言处理任务都是业务高度相关,一个业务需求刚进去,需要解决的是业务的词汇问题,无基础词库,无项目冷启动; 2,规则和正则启动下的工业级应用,规则的扩展,泛化都需要缓慢的词汇网络做支撑; 3,总体包括搜索,问答,舆情监控,事件分析等应用,与标签体系的运作关系密切,而这与先验的替代词汇库容易很强; 4,自然语言场景越来越引起关注的推理尺度,即所谓的“认知”尺度,认知背后的各种逻辑关系库,
2021-11-06 16:54:00 8.2MB Python
1