泰利纳 Tellina 使用自然语言处理 (NLP) 将英语句子(例如“在当前文件夹中查找文本文件”)翻译成 bash 命令,例如find . -name "*.txt" find . -name "*.txt" 。 您现在可以在尝试一下。 或者,您可以在本地安装它; 这份文件告诉你如何。 安装 安装 TensorFlow Tellina 使用 Tensorflow 2.0。 按照上的说明进行。 最简单的方法是使用安装。 安装其他依赖: pip3 install -r requirements.txt 设置tellina_learning_module子模块: git submodule update --init --remote git submodule foreach git pull origin master make submodule 要在未来更新tellin
1
CommonGen:面向生成常识推理的受限文本生成挑战 @article{lin2019comgen, author = {Bill Yuchen Lin and Wangchunshu Zhou and Ming Shen and Pei Zhou and Chandra Bhagavatula and Yejin Choi and Xiang Ren}, title = {CommonGen: A Constrained Text Generation Challenge for Generative Commonsense Reasoning}, journal = {Findings of EMNLP}, year = {2020} } CommonGen是一个新的受约束文本生成数据集,它需要不同种类的常识来生成有关日常场景的句子,并因此针对生成型
1
桥接文本和表格数据以进行跨域文本到SQL的语义解析 这是以下论文的官方代码版本: Xi Victoria Lin,Richard Socher和Caiming Xiong。 。 EMNLP 2020的发现。 概述 跨域表格语义解析(X-TSP)是在给某个数据库发出自然语言问题的情况下预测可执行结构化查询语言的任务。 在训练期间,该模型可能会或可能不会看到目标数据库。 该库实现 一个强大的基于序列到序列的跨域文本到SQL语义解析器,在两个广泛使用的基准数据集: 和上实现了最先进的性能。 从改编而来的一组用于解析,标记化和验证SQL查询的。 通过修改正式的语言预处理和后处理模块,可以使解析器适合于学习从文本到其他结构化查询语言(例如的映射。 模型 我们的模型将自然语言话语和数据库(模式+字段选择列表)作为输入,并生成SQL查询作为标记序列。 我们应用模式指导的解码和后处理,以确保最终
1
使用Python进行文本分析-第二版 自然语言处理从业者指南 文本分析有时会由于文本数据的非结构化和嘈杂的性质以及大量可用信息而变得不堪重负,令人沮丧。 “使用Python进行文本分析”是一本书,其中包含674页有用的信息,这些信息基于技术,算法,经验以及随着时间的推移在分析文本数据时吸取的各种经验教训。 该存储库包含本书中使用的数据集和代码。 我还将不时在此处添加各种笔记本和奖励内容。 继续看这个空间! 拿书 关于这本书 利用Python中的自然语言处理(NLP),并学习如何设置自己的健壮环境来执行文本分析。 第二版经过了重大修改,并根据NLP的最新趋势介绍了一些重大更改和新主题。 您将
1
FakeNewsCorpus:从精选的数据源列表中抓取的数百万条新闻报道的数据集
1
保险行业语料库 大家称为 看了下您的项目,我觉得这份数据可以用于保险领域的中文问答研究,对于某些问题的翻译很准确,长度扩展的答案翻译就有些不连贯的问题,大体上关键字信息和-华东师范大学 优秀作品! - ,中国东部师范大学 绝对 基线模型 最小批量大小= 100,hidden_​​layers = [100,50],lr = 0.0001。 纪元25,总步数36400,精度0.9031,成本1.056221。 滴水 Python3 + pip install -r Requirements.txt 跑 一个非常简单的网络作为基准模型。 python3 deep_qa_1/network
1
自然语言处理的文本预处理 用于自然语言处理中的文本预处理任务的python软件包。 用法 要使用这个文本预处理包,首先使用 pip 安装它: pip install text-preprocessing 然后,在您的 python 脚本中导入包并调用适当的函数: from text_preprocessing import preprocess_text from text_preprocessing import to_lower , remove_email , remove_url , remove_punctuation , lemmatize_word # Preprocess text using default preprocess functions in the pipeline text_to_process = 'Helllo, I am John Doe
1
动手学深度学习(D2L深度学习) | 理解深度学习的最佳方法是学以致用。 本开源项目代表了我们的一种尝试:我们将教给读者概念,背景知识和代码;我们将在同一个地方分解剖析问题所需的批判性思维,解决问题所需的数学知识,以及实现解决方案所需的工程技能。 我们的目标是创造一个为实现以下目标的统一资源: 所有人在网上免费获取; 提供足够的技术深度,从而帮助读者实际成为深度学习应用科学家:既理解数学原理,又能够实现并不断改进方法; 包括可运行的代码,为读者展示如何在实际中解决问题。这样直接直接将数学公式对应成实际代码,而且可以修改代码,观察结果并及时获取经验; 允许我们和整个社区不断快速迭代内容,从而紧跟仍在高速发展的深度学习领域; 由包含有关技术细节问答的论坛作为补充,使大家可以相互相互答疑并交换经验。 将本书(中英文版)利用教材或参考书的大学 如果本书对你有帮助,请星级(★)本仓库或引用本书英文版: @book{zhang2020dive, title={Dive into Deep Learning}, author={Aston Zhang and Zachary C.
1
得来的完整原版pdf,共361页,不是图片版,有索引,自然语言入门神书,豆瓣评分9.1
2022-10-24 01:27:17 6.46MB deeplearning NLP 深度学习
1
修剪后的依赖树上的图卷积用于关系提取 此回购包含PyTorch代码,用于修剪。 本文/代码在修剪的依赖树上引入了图卷积神经网络(GCN),用于关系提取的任务。 还引入了一种特殊的树修剪技术,称为“以路径为中心的修剪”,以从树中消除不相关的信息,同时最大程度地维护相关信息。 与诸如各种基于LSTM的模型之类的序列模型相比,此GCN模型利用依赖结构桥接远程单词,因此提高了远程关系的性能。 与以前的递归模型(如TreeLSTM)相比,此GCN模型在获得更好的性能的同时,也更早地实现了并行化,因此效率更高。 参见下面的模型架构概述: 要求 Python 3(在3.6.5上测试) PyTorch(
1