textacy:NLP,spaCy之前和之后 textacy是一个基于高性能spaCy库的Python库,用于执行各种自然语言处理(NLP)任务。 通过将基础知识-令牌化,词性标记,依赖项解析等-委托给另一个库, textacy主要关注于之前和之后的任务。 产品特点 通过用于处理一个或多个文档的便捷方法访问spaCy,并通过自定义扩展名和自动语言识别扩展其功能,从而为文本应用正确的spaCy管道 下载包含文本内容和元数据的数据集,从国会演讲到历史文献再到Reddit评论 轻松以多种常用格式在磁盘之间传输数据 清理,规范化和浏览原始文本-在使用spaCy处理之前 灵活地从处理过的文档中提取单词,n-gram,名词块,实体,首字母缩写词,关键词和其他感兴趣的元素 通过各种相似性指标比较字符串,集合和文档 对文档进行标记和向量化,然后训练,解释和可视化主题模型 计算各种文本可读性统计信息,包括Flesch-Kincaid等级水平,SMOG索引和多语种Flesch Reading Ease ...还有更多! 链接 下载: : 文档: : 源代码: : 错误跟踪程序: : 维
2021-12-09 11:59:06 312KB python nlp natural-language-processing spacy
1
机器学习支持的虚假新闻检测器 从初始构想到部署,构建端到端机器学习项目的完整示例。 此回购随附于博客文章系列,描述了如何构建假新闻检测应用程序。 这里包含的帖子: :描述项目构想,设置存储库和初始项目工具。 :描述如何使用工具获取数据集并执行探索性数据分析,以便更好地理解问题。 :描述如何为第一个ML模型(随机森林分类器)获得功能训练/评估管道,包括如何正确测试管道的各个部分。 :描述如何解释通过特征分析(通过诸如类的技术)和错误分析所学的第一个模型。 也可用于由驱动的第二个模型。 :描述如何使用和部署模型以及构建随附的Chrome扩展程序。 还说明了用于以可伸缩和可复制的方式在应
1
语音情感分析器:神经网络模型能够从音频语音中检测出五种不同的男女情感。 (深度学习,NLP,Python)
1
ecco:可视化和探索NLP语言模型。 Ecco直接在Jupyter笔记本中创建交互式可视化文件,解释基于Transformer的语言模型(例如GPT2)的行为
1
会话中很棒的情感识别 有关与会话中的情感识别(ERC),上下文情感/情感/讽刺分析或语用学的共同分类(如会话中的对话行为)相关的论文的综合阅读清单。 如果列表中缺少任何新的或现有的纸张,请随时发送PR。 什么是ERC? ERC是一项旨在预测对话中每种话语的情感的任务。 以下是一段对话的摘录,其中每种话语都标有相应的情感和情感标签: 概观 ,IEEE情感计算2020交易 ,IEEE Access 2019 资料资源 ,COLING 2020 ,ACL 2020 ,IEEE Access 2020 ,Arxiv 2020 ,LREC 2020 ,ACL 2019 ,ACL 2019 人类行为计算机2019 ,LREC 2018 DailyDialog:手动标记的多回合对话数据集,AFNLP 2017 semaine数据库:人与有限代理之间带有情感色彩的对话的带注释的多
1
emoji_predictor 包含各种nlp方法来预测表情符号
1
在5秒钟内克隆语音以实时生成任意语音实时语音克隆此存储库是从语音验证到语音识别的多人语音合成语音学习(SV2TTS)的转移学习的一种实现,该声码器可以实时工作。 如果您好奇或正在寻找我未记录的信息,请随时检查我的论文。 通常,我建议您快速浏览一下引言之外的数字。 SV2TTS是一个三阶段的深度学习框架,允许从少数几个创建语音的数字表示
2021-12-03 10:26:57 200KB Python Natural Language Processing
1
本书提供了对自然语言处理的高度可理解的介绍,自然语言处理是支持各种语言技术的领域,从预测性文本和电子邮件过滤到自动摘要和翻译。
2021-12-01 13:38:28 81B 计算机科学
1
pr 用Rust编写的快速,资源少的自然语言处理和错误纠正库。 nlprule使用资源为NLP实现了基于规则和查找的方法。 from nlprule import Tokenizer , Rules tokenizer = Tokenizer . load ( "en" ) rules = Rules . load ( "en" , tokenizer ) rules . correct ( "He wants that you send him an email." ) # returns: 'He wants you to send him an email.' rules . correct ( "I can due his homework." ) # returns: 'I can do his homework.' for s in rules . suggest ( "S
1
TextAttack是一个Python框架,用于对NLP模型进行对抗性攻击。 TextAttack从四个组件构建攻击:搜索方法,目标函数,转换和约束集。 TextAttack的模块化设计使其可以轻松扩展到新的NLP任务,模型和攻击策略。 TextAttack:octopus:为NLP模型生成对抗性示例文档•关于•设置•用法•设计关于TextAttack是一个Python框架,用于对NLP模型进行对抗性攻击。 TextAttack从四个组件构建攻击:搜索方法,目标函数,转换和约束集。 TextAttack的模块化设计使其可以轻松扩展到新的NLP任务,模型和攻击策略。 TextAttack当前支持对经过分类训练的模型的攻击
2021-11-29 09:10:55 5.54MB Python Natural Language Processing
1