“MSMARCO passage ranking task”阅读理解任务排名第一的BERT解决方案
2023-02-22 17:53:26 47KB Python开发-自然语言处理
1
NL2Bash 利用自然语言处理将英语请求转换为有效的Bash命令。 该存储库由三个项目组成,其总体目标是提供一个实用程序,将自然语言的英语命令转换为Bash脚本语言的单行代码,包括可以自然拼凑的单行代码。 这三个项目是: Tellina,这是一个基于Tensorflow的机器学习系统,它使用从专家以及从StackOverflow等站点收集的培训数据,将英语翻译为Bash命令。 NL2BashWebScraper,基于JSoup的工具,可以从Internet收集更多潜在的数据对。 TesterUI,基于django的工具,允许用户验证这些数据对。 Tellina项目和TesterUI在子模块中找到。 要克隆这些子模块,请使用: $ git submodule init $ git submodule update 请查阅每个项目的README.md,以获取每个项目的进一步构
2023-02-20 19:49:12 8.57MB Java
1
Bert作为目前自然语言处理领域最流行的技术之一,文本分类作为自然语言处理领域最常见的任务之一,Pytorch作为目前最流程的深度学习框架之一,三者结合在一起将会产生什么样的花火,本套课程基于Pytorch最新1.4版本来实现利用Bert实现中文文本分类任务,延续动手学系列课程风格,全程手敲代码,跟着杨博一行一行代码撸起来。
1
是进行英文语言处理的必备工具。可以对英文语料进行词性标注,还可识别出名词性短语、命名实体,其正确性高达95%以上,是自然语言处理专业学生的不可或少的工具。
1
本文档详细分析了预训练语言模型领域的最新进展,可为自然语言处理的研究和学习人员提供参考。用于重现分析结果的代码可在github上获取。
2023-02-10 12:19:55 304KB 自然语言处理 NLP 语言模型 Bert
1
搭建LSTM网络的情感分类网络,加载预训练的word2vec语言模型参数,在IMDB训练数据集上进行模型训练,获得最优分类模型,并在IMDB测试数据集上进行测试,将训练和测试结果进行可视化展示。
2023-02-07 22:42:17 10KB 自然语言处理 pytorch LSTM word2vec
1
Kaggle_Disaster_Tweets 带有灾难性推文的自然语言处理:预测哪些推文与真实灾难有关,哪些不与真实灾难有关任务开始日期:2021.04.04 任务说明:使用火车数据中的信息,构建模型以预测某条推文是否与真实灾害有关 火车数据集说明: 列 描述 有效/缺失 遗失率 'ID ' 每条推文的唯一标识符(推文编号) 7613/0 0% '关键词' 推文中的特定关键字 7552/61 1% '地点' 发推文的位置 5080/2533 33% '文本' 推文的文字 7613/0 0% '目标' 这条推文是否是一场真正的灾难(标签) 7613/0 0% 测试数据集说明: 列 描述 有效/缺失 遗失率 'ID ' 每条推文的唯一标识符(推文编号) 7613/0 0% '关键词' 推文中的特定关键字 3237/26 1% '地点' 发
2023-02-04 19:10:35 2KB Python
1
Conll-2003 数据集:第一列是单词,第二列是词性,第三列是语法,第四列是实体标签。在NER任务中,只关心一和四列。
2023-01-31 16:37:08 729KB 自然语言处理 人工智能 nlp
1
整书PDF+代码
2023-01-24 11:20:18 390.04MB python 自然语言处理
1
适用于中文中长文本分类 原始数据集和已经划分的数据集已给出 划分的数据集经过数据预处理,删除了其中的重复文本,以及文本长度小于50的句子,最终构造的平衡语料 训练集 5800 测试集 1000条 验证集1000 (正负评论各站一半)
1