自然语言处理系统 自然语言处理的基本原理 自然语言处理的基本技能 Jieba介绍、相关信息、应用、知识点和练习内容 Gensim介绍、相关信息、应用、知识点和练习内容 图像处理 Scikit-image介绍、相关信息、应用、知识点和练习内容 Pillow介绍、相关信息、应用、知识点和练习内容
2021-05-16 11:06:24 4.64MB 自然语言处理 图像处理
Clone a voice in 5 seconds to generate arbitrary speech in real-time
2021-05-15 19:09:21 123KB Python开发-自然语言处理
1
闲聊机器人(chatbot),BERT句向量-相似度(Sentence Similarity),文本分类(Text classify) 数据增强(text augment enhance),同义句同义词生成,句子主干提取(mainpart),中文汉语短文本相似度,文本特征工程,keras-http-service调用
2021-05-14 22:47:34 2.15MB Python开发-自然语言处理
1
konlpy, 面向韩国自然语言处理的python 包 KoNLPy KoNLPy是用于朝鲜语自然语言处理的python 包。英文文档:http://konlpy.org/en/latest链接KoNLPy是rewrapped使用Py4J的Steve
2021-05-14 14:07:43 21.68MB 开源
1
This repo contains a PyTorch implementation of a pretrained BERT model for multi-label text classification.
2021-05-14 10:30:38 50KB Python开发-自然语言处理
1
HanLP是一系列模型与算法组成的NLP工具包,由大快搜索主导并完全开源,目标是普及自然语言处理在生产环境中的应用.HanLP具备功能完善,性能高效,架构清晰,语料时新,可自定义的特点。 HanLP提供下列功能: 中文分词 HMM-两字组(速度与精度最佳平衡;一百兆内存) 最短路分词,N-最短路分词 由字构词(侧重精度,全世界最大语料库,可识别新词;适合NLP任务) 感知机分词,CRF分词 词典分词(侧重速度,每秒数千万字符;省内存) 极速词典分词 所有分词器都支持: 索引全切分模式 用户自定义词典 兼容繁体中文 训练用户自己的领域模型 词性标注 HMM词性标注(速度快) 感知机词性标注,CRF词性标注(精度高) 命名实体识别 基于HMM角色标注的命名实体识别(速度快) 中国人名识别,音译人名识别,日本人名识别,地名识别,实体机构名识别 基于线性模型的命名实体识别(精度高) 感知机命名实体识别,CRF命名实体识别 关键词提取 TextRank关键词提取 自动摘要 TextRank自动摘要 短语提取 基于互信息和左右信息熵的短语提取 拼音转换 多音字,声母,韵母,声调 简繁转换 简繁分歧词(简体,繁体,台湾正体,香港繁体) 文本推荐 语义推荐,拼音推荐,字词推荐 依存句法分析 基于神经网络的高性能依存句法分析器 基于ArcEager转移系统的柱搜索依存句法分析器 文本分类 情感分析 文本聚类 KMeans,Repeated Bisection,自动推断聚类数目k word2vec 词向量训练,加载,词语相似度计算,语义运算,查询,KMEANS聚类 文档语义相似度计算 语料库工具 部分默认模型训练自小型语料库,鼓励用户自行训练。模块所有提供训练接口,语料可参考98年人民日报语料库。 在提供丰富功能的同时,HanLP内部模块坚持低耦合,模型坚持惰性加载,服务坚持静态提供,词典坚持明文发布,使用非常方便。默认模型训练自全世界最大规模的中文语料库,同时自带一些语料处理工具,帮助用户训练自己的模型。
1
为提升传统LDA 模型的主题识别性能, 并给主题最优数目选择提供技术方案, 提出基于自适应聚类的K-wrLDA 模型。利用LDA 和Word2Vec 模型得出包含主题词概率信息及词义相关性的T-WV 矩 阵, 并将传统LDA 模型的主题数目选择问题转化为聚类效果评价问题, 以内部指标F 统计量作为目标函数,计算主题聚类数目的最优解, 并对新旧两种模型的主题识别效果进行比较。
2021-05-12 20:29:59 1.42MB 自然语言处理
1
书籍描述: 使用Python使用问题解决方法实现自然语言处理应用程序。这本书有许多编码练习,将帮助您快速部署自然语言处理技术,如文本分类、部分语音识别、主题建模、文本摘要、文本生成、实体提取和情感分析。 自然语言处理配方首先提供清洗和预处理文本数据的解决方案,以及使用高级算法分析文本数据的方法。您将看到文本语义和句法分析的实际应用,以及涉及文本规范化、高级预处理、pos标记和情感分析的复杂自然语言处理方法。您还将学习机器学习和自然语言处理中的深度学习的各种应用。 通过使用本书中的配方,您将拥有一个解决方案工具箱,可以应用于现实世界中您自己的项目,使您的开发时间更快、更高效。
2021-05-12 19:25:44 9.9MB NLP 自然语言处理 Apress
1
介绍了信息抽取(IE)技术的基本概念、信息抽取系统的抽取过程。对现有的信息抽取系统构建方法进行了分类和介绍,并对这些方法进行了讨论和比较,同时指出了构建中文信息抽取系统所需要解决的关键的基础问题。
1
国科大2020-12-30自然语言处理考试回忆
2021-05-11 20:02:05 2KB 考试 自然语言处理
1