实现说明 主要实现文章前半部分的工作,PyTorch实现,基于的工作,PyTorch才是世界上最屌的框架,逃脱。 实现参考 代码说明 (1)主要修改: 输出表示形式: BertForSequenceClassification 输入表示形式: BertEmbeddings 输入和输出都实现了多种策略,可以结合具体的任务,找到最佳的组合。 (2)非主要实现:examples下的关于classification的文件 (3)服务部署:基于Flask,可以在本地开启一个服务。具体实现在中。 (4)代码正确参考,不提供数据集,不提供预训练模型,不提供训练后的模型(希望理解吧)。 (5)相
2023-01-08 22:33:03 363KB nlp relation-extraction fewrel acl2019
1
自然语言处理推荐入门&工具书 本书由 作者参与著作。 快速购书 这本书是服务于准备入门机器学习和自然语言处理的学生和软件工程师的,在理论上介绍了很多原理、算法,同时也提供很多示例程序增加实践性,这些程序被汇总到示例程序代码库,这些程序主要是帮助大家理解原理和算法的,欢迎大家下载和执行。代码库的地址是: Synonyms Chinese Synonyms for Natural Language Processing and Understanding. 更好的中文近义词:聊天机器人、智能问答工具包。 synonyms可以用于自然语言理解的很多任务:文本对齐,推荐算法,相似度计算,语义偏移,关键字提取,概念提取,自动摘要,搜索引擎等。 Table of Content: Welcome pip install -U synonyms python -c "import synonyms"
2023-01-02 13:01:53 14.35MB nlp chatbot synonyms 附件源码
1
图片字幕 介绍 建立一个模型以从图像生成字幕。 给定图像后,模型可以用英语描述图像中的内容。 为了实现这一点,我们的模型由一个编码器(一个CNN)和一个解码器(一个RNN)组成。 为CNN编码器提供了用于分类任务的图像,其输出被馈送到RNN解码器,后者输出英语句子。 该模型及其超参数的调整基于论文和。 我们使用微软Çommon在CO NTEXT(MS COCO)O bjects为这个项目。 它是用于场景理解的大规模数据集。 该数据集通常用于训练和基准化对象检测,分段和字幕算法。 有关下载数据的说明,请参见下面的“数据”部分。 代码 该代码可以分为两类: 笔记本-该项目的主要代码由一系列Jupyter笔记本构成: 0_Dataset.ipynb介绍数据集并绘制一些样本图像。 1_Preliminaries.ipynb加载和预处理数据并使用模型进行实验。 2_Training.ip
2023-01-02 13:00:14 2.09MB nlp computer-vision cnn pytorch
1
问题生成器 问题生成器是一种NLP系统,用于从诸如新闻文章或书籍摘录等文本生成阅读理解型问题。 该系统是使用来自预训练模型。 有两种模型:问题生成器本身和质量检查评估器,该评估器根据问题对的可接受性对问题和答案对进行排名和过滤。 安装 您可以克隆存储库,然后像这样安装软件包: git clone https://github.com/amontgomerie/question_generator python -m pip install -e question_generator 用法 产生问题的最简单方法是克隆github存储库,然后像这样运行qg_run.py : !git clone https://github.com/amontgomerie/question_generator !python 'question_generator/run_qg.py' --text_d
2023-01-01 14:02:29 40KB 系统开源
1
将您的文档变成数据! | | | Parsr是一个最小的文档(图像,pdf,docx,eml )清洗,解析和提取工具链,可生成JSON,Markdown(MD),CSV / Pandas DF或TXT格式的随时可用,有组织且可用的数据。 它为分析,数据科学家和开发人员提供了干净的结构化和标签丰富的信息集,这些信息集适用于即用型应用程序,包括数据输入和文档分析器自动化,归档等。 当前,Parsr可以执行:文档清理,层次结构再生(单词,行,段落),标题,表,列表,目录,页码,页眉/页脚,链接等的检测。 查看。 目录 入门 安装 -提供高级安装指南- 安装和运行Parsr API的最快方法是通过docker: docker pull axarev/parsr 如果您还希望安装用于发送文档和可视化结果的GUI: docker pull axarev/parsr-ui-localhost 注意:Parsr也可以裸机安装(不通过Docker容器安装),其过程在中进行了。 用法 -提供高级用法指南- 要运行 ,请发出: docker run -p 3001:3001 axar
2022-12-28 16:44:46 16.95MB python nlp pdf data
1
在pytorch环境搭建Attention_biLSTM模型,python版本3.7,实现NLP情感分类,内含测试数据,可直接运行
2022-12-27 11:18:15 291KB pytorch LSTM attention NLP
1
信息熵概念与公式表及在NLP上的含义:包含名称、节点、信息论含义、NLP含义、公式
2022-12-26 15:53:15 97KB 信息熵 NLP
1
LemmInflect 一个用于英语词形和词尾变化的python模块。 关于 LemmInflect使用字典方法对英语单词进行词素化,并将其转换为用户提供的或标签指定的形式。 该库通过应用神经网络技术对单词外词(OOV)进行分类,以对单词形式进行分类并选择适当的变形规则。 该系统可用作独立模块或作为 NLP系统的扩展。 字典和词法规则来自,其中包含有关英语单词形式的大量信息。 可以使用更简单的仅拐点系统。 LemmInflect的创建是为了解决该项目的某些缺点并添加功能,例如... 从spaCy lemmatizer的独立性 神经网络消除声带形态的歧义 字母拼写法消除拼写和多种单词形
2022-12-24 15:29:52 1.46MB python nlp spacy inflection
1
数据集官网:https://ai.stanford.edu/~amaas/data/sentiment/ 数据集的训练集和测试集各有25000个样本,且正负样本个数相同,均为12500个。 该数据集和官网提供的相比,去除了一些不必要的文件,其他均未改动。
2022-12-24 11:35:34 41.88MB nlp 情感分析 IMDb 深度学习
1
建立实验环境 1个安装python(2.7) 2安装点: 2.1下载pip 2.2解压缩后,安装指令python setup.py install 2.3 pip升级python -m pip install --upgrade pip 2.4 pip安装扩展包pip install jieba(这里以jieba包为例),如果速度较慢,可转换内部的阿里源,即pip install jieba -i --trusted-host mirrors.aliyun.com 3安装pycharm 4使用GitHub获取代码 4.1安装git 4.2登陆自己的GitHub账号,找到自己的项目,(别人的需要先fork过来,也可以直接git clone xxx,或者直接下载zip包放进pycharm) 4.3:pycharm,首先设置git的位置及github账号,点击Test都通过后继续,依次在菜单栏上单击,从版本控制GitHub上进行VCS检出,登陆自己的账号后选择相应的项目,得到代码。 4.4(更新fork的项目到最新的版本)同步叉子 5 ipython协同开发环境 5.
2022-12-23 21:57:16 76.57MB python nlp NaturallanguageprocessingPython
1