语言模型和自动人格预测 该存储库包含论文“ 代码,该论文发表在2020年IEEE国际数据挖掘大会上。 这是一组用tensorflow + pytorch编写的实验,旨在探索Essays数据集(使用Big-五个人格标记的特征)和Kaggle MBTI数据集上使用语言模型进行自动人格检测。 安装 通过以下方式从GitLab提取此存储库: git clone git@gitlab.com:ml-automated-personality-detection/personality.git 有关可通过以下方式安装的相关软件包的列表,请参见requirements.txt: pip -r requirements.txt 用法 首先运行LM提取器代码,该代码将数据集通过语言模型传递,并将(所有图层的)嵌入存储在pickle文件中。 创建此“新数据集”可为我们节省大量计算时间,并允许有效搜索超
1
pr 用Rust编写的快速,资源少的自然语言处理和错误纠正库。 nlprule使用资源为NLP实现了基于规则和查找的方法。 from nlprule import Tokenizer , Rules tokenizer = Tokenizer . load ( "en" ) rules = Rules . load ( "en" , tokenizer ) rules . correct ( "He wants that you send him an email." ) # returns: 'He wants you to send him an email.' rules . correct ( "I can due his homework." ) # returns: 'I can do his homework.' for s in rules . suggest ( "S
1
TextAttack是一个Python框架,用于对NLP模型进行对抗性攻击。 TextAttack从四个组件构建攻击:搜索方法,目标函数,转换和约束集。 TextAttack的模块化设计使其可以轻松扩展到新的NLP任务,模型和攻击策略。 TextAttack:octopus:为NLP模型生成对抗性示例文档•关于•设置•用法•设计关于TextAttack是一个Python框架,用于对NLP模型进行对抗性攻击。 TextAttack从四个组件构建攻击:搜索方法,目标函数,转换和约束集。 TextAttack的模块化设计使其可以轻松扩展到新的NLP任务,模型和攻击策略。 TextAttack当前支持对经过分类训练的模型的攻击
2021-11-29 09:10:55 5.54MB Python Natural Language Processing
1
科学引文知识提取器(SCKE) 关于SCKE SCKE是一个开放源代码工具,可通过分析引用他们的论文内容,帮助生物医学研究人员了解他人如何使用他们的工作。 该工具使用自然语言处理和机器学习来提取引用文档中讨论的突出主题和概念。 通过查看引用文章讨论的主题类型,研究人员可以更好地了解他们的工作如何影响同龄人和科学的各个学科。 此外,SCKE允许生物医学研究人员探索有关引用它们的出版物的其他统计数据,例如引文的发表位置(期刊),关键字的分布(关键字),论文彼此的相似性(聚类),论文的相似性其他著名作品(TextCompare)以及有关引文的一般统计信息(Statistics)。 使用Biopy
1
Visual Studio 2015 英文语言包
2021-11-28 11:37:54 204KB VS 2015 Egnlish Language
1
MultiWOZ 多域绿野仙踪数据集(MultiWOZ),是跨多个领域和主题的全人类书面对话的完整标签集合。 对话的大小为1万个,比以前所有带注释的面向任务的语料库大至少一个数量级。 感谢在上提供了最新的,经过纠正的数据集版本。 可在上获得新的,更正后的数据集版本。 可在以下访问EMNLP出版物中使用的数据集: 可在以下位置访问ACL发布中使用的数据集: 数据结构 如果该域允许,则包含3406个单域对话(包括预订),以及包含至少2个(最多5个域)的7,032个多域对话。 为了增强结果的可重复性,将语料库随机分为训练,测试和开发集。 测试和开发集各包含1k个示例。 即使所有对话都是连贯的,但其中一些对话并未按照任务描述来完成。 因此,验证和测试集仅包含完全成功的对话,因此可以对模型进行公平的比较。 在验证和测试集中没有来自医院和警察领域的对话。 每个对话都包含一个目标,多个用
1
本算法库为一个轻量级的图像基础处理框架,适合于小白或者初学者,包含了基于C语言的图像读写(支持BMP/JPG/PNG/TGA格式),自己编写实现的图像基本绘制(点/线/三角形/矩形/圆形/椭圆/任意多边形)算法内容,不依赖任何第三方库,彻底拜托MFC/LIBPNG/LIBJPG/OPENCV等,为入门者扫清障碍!
2021-11-27 22:04:39 609KB C language IMAGE READ
1
Spoken Language Processing A Guide to Theory Algorithm+and System Develop
2021-11-27 17:24:35 10.82MB SpokenLang Algorithm System
1
编码:隐匿在计算机软硬件背后的语言 pdf en
1