kaggle机器学习、深度学习竞赛,包含多模态、目标检测、视频监测和分类、图像分割、图像分类、图像检索、NLP 共21个方案
2022-11-11 11:31:30 338.11MB kaggle 深度学习 图像分割 NLP
1
NLP(ICL)课程:幽默检测 由于数据预处理和训练例程的差异,原始笔记本被复制了两次。 1个 第一个笔记本approach1_pretrained_roberta.ipynb包含方法1的最终RoBERTa模型,以及针对不同功能和头部架构的测试。 使用以下链接 或笔记本顶部的徽章以在Google Colab中查看。 可在以下位置获得经过训练的模型(〜0.5 GB): ://drive.google.com/file/d/1NSLn2pUc4TucEjXB4Se4w29YEqU2xH1i/view usp sharing 2个 第二个笔记本hyperparams_and_approach2.ipynb包括方法1的基本BERT植入以及超参数调整。 与此笔记本一起,还提供了关注方法2的BiLSTM。 使用以下链接 或笔记本顶部的徽章以在Google Colab中查看。 报告 项目报告已上
2022-11-10 00:16:50 93KB JupyterNotebook
1
NLP-Yelp审查:第一个NLP项目
2022-11-09 22:29:09 36KB JupyterNotebook
1
GloVe is an unsupervised learning algorithm for obtaining vector representations for words. Training is performed on aggregated global word-word co-occurrence statistics from a corpus, and the resulting representations showcase interesting linear substructures of the word vector space.
2022-11-09 10:47:50 104.79MB NLP
1
7.5 树连接语法 r 概要 树连接语法(Tree Adjoining Grammar, TAG)1975年由美 国学者 Joshi 提出。 提出的动机是试图弥补上下无关文法过于简单、不能限制 一些不合法语言现象的弱点。 TAG 是介于上下文无关和上下文有关文法之间的一种语 法表示形式。
2022-11-08 14:55:18 590KB nlp
1
文本预处理:分词,取出停用词,过滤低频词汇,编码归一化等; 文本向量化:如使用向量空间模型VSM(Vector Space Model)或者概率统计模型对文本进行表示,使计算机能够理解计算,用的方法基于集合论模型。基于代数轮模型。基于频率统计模型等等; 文本特征提取和选择:特征提取对应着特征项的选择和特征权重的计算。
2022-11-06 10:26:20 115KB NLP
1
本资源属于代码类,是一些nlp工具的使用 nlp 工具 word2vec nltk textblob crf++ (1)机器人 (2)中文翻译,及繁体转简体 (3)关键词提取,主题提取,摘要提取 (4)命名体识别 (5)分词 (6)情感分析,正负类分析 (7)近义词,同义词,句子相似性 (8)聚类,监督,无监督 (9)词性标注 (10)词向量提取
2022-11-05 14:56:59 1.49MB nlp 机器学习
1
nlp-data-augmentation:用于NLP的数据增强。 NLP数据增强
2022-11-05 14:52:43 3.18MB nlp data-augmentation Naturallanguageprocessing
1
阿里关于意图识别、机器阅读、迁移学习等深度学习的实践以及应用,主要介绍了自然语言语义理解的方面的深度学习算法的在实际业务种的应用
2022-11-03 22:19:57 11.03MB 阿里 NLP 意图识别 机器阅读
1
英文打分数据集STS-B的部分中文翻译
2022-11-02 22:13:50 339KB nlp
1