自然语言处理的文本预处理 用于自然语言处理中的文本预处理任务的python软件包。 用法 要使用这个文本预处理包,首先使用 pip 安装它: pip install text-preprocessing 然后,在您的 python 脚本中导入包并调用适当的函数: from text_preprocessing import preprocess_text from text_preprocessing import to_lower , remove_email , remove_url , remove_punctuation , lemmatize_word # Preprocess text using default preprocess functions in the pipeline text_to_process = 'Helllo, I am John Doe
1
动手学深度学习(D2L深度学习) | 理解深度学习的最佳方法是学以致用。 本开源项目代表了我们的一种尝试:我们将教给读者概念,背景知识和代码;我们将在同一个地方分解剖析问题所需的批判性思维,解决问题所需的数学知识,以及实现解决方案所需的工程技能。 我们的目标是创造一个为实现以下目标的统一资源: 所有人在网上免费获取; 提供足够的技术深度,从而帮助读者实际成为深度学习应用科学家:既理解数学原理,又能够实现并不断改进方法; 包括可运行的代码,为读者展示如何在实际中解决问题。这样直接直接将数学公式对应成实际代码,而且可以修改代码,观察结果并及时获取经验; 允许我们和整个社区不断快速迭代内容,从而紧跟仍在高速发展的深度学习领域; 由包含有关技术细节问答的论坛作为补充,使大家可以相互相互答疑并交换经验。 将本书(中英文版)利用教材或参考书的大学 如果本书对你有帮助,请星级(★)本仓库或引用本书英文版: @book{zhang2020dive, title={Dive into Deep Learning}, author={Aston Zhang and Zachary C.
1
得来的完整原版pdf,共361页,不是图片版,有索引,自然语言入门神书,豆瓣评分9.1
2022-10-24 01:27:17 6.46MB deeplearning NLP 深度学习
1
修剪后的依赖树上的图卷积用于关系提取 此回购包含PyTorch代码,用于修剪。 本文/代码在修剪的依赖树上引入了图卷积神经网络(GCN),用于关系提取的任务。 还引入了一种特殊的树修剪技术,称为“以路径为中心的修剪”,以从树中消除不相关的信息,同时最大程度地维护相关信息。 与诸如各种基于LSTM的模型之类的序列模型相比,此GCN模型利用依赖结构桥接远程单词,因此提高了远程关系的性能。 与以前的递归模型(如TreeLSTM)相比,此GCN模型在获得更好的性能的同时,也更早地实现了并行化,因此效率更高。 参见下面的模型架构概述: 要求 Python 3(在3.6.5上测试) PyTorch(
1
参考https://distill.pub/2021/understanding-gnns,学习图的谱表征方法。
2022-10-19 12:05:23 4KB 图像的谱方法表征
1
Rebiber:使用官方信息标准化bibtex的工具。 我们经常引用使用他们的arXiv的论文版本不提的是,他们在一些会议已经发布。 这些非正式的围兜条目可能会违反某些会议的提交规则或适用于摄像头的版本规则。 我们引入Rebiber ,这是Python中的一个简单工具,可以自动修复它们。 它基于来自或的官方会议信息(适用于NLP会议)! 您可以在查看支持的会议列表。 您可以用作简单的网络演示。 安装 pip install rebiber -U 要么 git clone https://github.com/yuchenlin/rebiber.git cd rebiber/ pip in
1
Coursera作业 该存储库旨在帮助在学习过程中遇到困难的Coursera学习者。 测验和编程作业属于Coursera,请不要将其用于任何其他目的。 如有任何问题,请随时与我联系,我的电子邮件是 。 经济学院专业化高级机器学习 深度学习导论 Python数据科学导论 Python中的应用机器学习 大数据导论 大数据建模与管理系统 大数据交互与处理 文字检索和搜索引擎 文本挖掘和分析 数据挖掘中的模式发现 数据挖掘中的聚类分析 数据科学家的工具箱 R编程 获取和清理数据 算法工具箱 数据结构 图上的算法 字符串算法 神经网络与深度学习 改善深度神经网络的超参数调整,正则化和优化 构建机器学习项
1
tidytext:使用整洁工具进行文本挖掘
1
目前的自然语言处理模型严重依赖有效的表示学习算法。对比学习就是这样一种学习嵌入空间的技术,它使相似的数据样本对具有相近的表示,而不同的样本彼此相距遥远。它可以用于监督或非监督设置,使用不同的损失函数来产生特定于任务的或通用的表示。虽然它最初使视觉任务的成功成为可能,但近年来,关于对比NLP的工作越来越多。这一第一行的工作不仅在各种NLP任务中提供了有前景的性能改进,而且还提供了所需的特性,如任务不可知的句子表示、忠实的文本生成、零样本和少样本设置下的数据高效学习和可解释性。 在本教程中,我们将温柔地介绍对比学习方法的基本原理及其背后的理论。然后,我们调研了对比学习对各种下游NLP应用的好处和最佳实践,包括文本分类、问题回答、摘要、文本生成、可解释性和可解释性、常识知识和推理、视觉和语言。 本教程旨在帮助自然语言处理和计算语言学领域的研究人员理解这一新兴主题,并推动将对比学习用于自然语言处理应用的未来研究方向。
2022-07-11 09:12:49 15.37MB nlp 机器学习
语言工具 LanguageTool是一款开放源代码校对软件,适用于英语,法语,德语,波兰语,俄语以及。 它会发现许多简单的拼写检查器无法检测到的错误。 ( ) 有关更多信息,请参见我们的主页,为 , 和 。 LGPL 2.1或更高版本免费提供LanguageTool。 码头工人 对于社区贡献的Docker文件,请尝试以下项目之一: ) ) 会费 描述了如何贡献错误检测规则。 请参阅问题以获取开始的问题。 有关更多技术细节,请参见。 脚本化安装和构建 要使用脚本进行安装或构建,只需键入: curl -L https://raw.githubusercontent.com/languagetool-org/languagetool/master/install.sh | sudo bash 如果希望有更多选择,请下载install.sh脚本。 使用选
1