斯坦福大学CoreNLP Stanford CoreNLP提供了一组用Java编写的自然语言分析工具。 它可以接受原始的人类语言文本输入,并给出单词的基本形式,它们的词性,是否是公司名称,人员名称等,规范化并解释日期,时间和数字量,标记句子的结构在短语或单词从属关系方面,并指出哪些名词短语指代相同的实体。 它最初是为英语开发的,但现在也为(现代标准)阿拉伯语,(大陆)中文,法语,德语和西班牙语提供不同级别的支持。 斯坦福大学的CoreNLP是一个集成的框架,这使得将大量语言分析工具应用于一段文本变得非常容易。 从纯文本开始,您只需两行代码即可运行所有工具。 它的分析为更高层次和特定领域的文本理解应用程序提供了基础构建块。 Stanford CoreNLP是一套稳定且经过测试的自然语言处理工具,已被学术界,行业和政府中的各个团体广泛使用。 这些工具使用基于规则的,概率机器学习和深度学习组件。 Stanford CoreNLP代码用Java编写,并根据GNU通用公共许可证(v3或更高版本)获得许可。 请注意,这是完整的GPL,它允许许多免费使用,但不能在分发给他人的专有软件中使用。 制
1
优化knn代码matlab ############################################### ################### PROJECT 2: COMP 551 - LANGUAGE CLASSIFICATION author: AMAR KUMAR[amar.kumar@mail.mcgill.ca] LITA FAN [lita.fan@mail.mcgill.ca] DEKLAN CHUNG [deklan.chung@mail.mcgill.ca] ############################################### ################### 文件说明: ***naive bayes.py [语言:python] - 使用朴素贝叶斯算法生成预测。 --> 输入文件: 1)输入文件必须是一个文件“train_set_x_features.csv”,它的所有列都是从训练数据中提取的特征。 该文件可以通过将 Language Classification.py 中的“savefile”变量设
2022-05-14 09:55:18 23KB 系统开源
1
Cesium Language(CZML)的第一部分Structure部分
2022-05-12 16:11:49 35KB Cesium Cesiumjs webgl czml
1
PyThaiNLP:使用Python进行泰国自然语言处理 PyThaiNLP是一个Python软件包,用于文本处理和语言分析,类似于 ,重点是泰语。 PyThaiNLPเป็นไลบารีภาษาไพทอนสำหรับประมวลผลภาษาธรรมชากับคล้ายกับNLTKโดยเน้นภาษาไทย รายละเอียดภาษาไทย 消息 我们正在进行2分钟的调查,以了解有关您使用图书馆的经验以及您对图书馆应该能够做什么的期望。参加。 版本 描述 状态 稳定的 发布候选版本2.3 请关注我们的以获取更多更新。 PyThaiNLP入门 我们提供了以探索PyThaiNLP的功能;我们也有针对特定任务的教程。请访问。 最新文档位于 。 我们尝试使该包尽可能易于使用;因此,某些其他数据(例如单词列表和语言模型)可能会在运行时自动下载。 PyThaiNLP默认在目录~/pyt
1
Copula-CoVaR R 操作说明 zhang,copula函数,R language源码
2022-05-10 12:26:53 44KB
开源哈萨克语语料库 我们已经从Wikipedia dump( )为哈萨克语构建了语料库。 使用WikiExtractor( )解析数据,然后使用nltk构建n-gram。 总共收集了2100万个单词。 具有将近60万个单词的不同派生词。 链接到语料库
2022-05-10 05:54:10 4KB Python
1
The C++ Programming Language第4版,计算机经典书籍。
2022-05-08 18:52:28 47.98MB C++ Programming
1
《The C++ Programming Language》课后习题解答,都为源文件
2022-05-06 13:52:24 99KB 《The C++ Programming Language》
1
Answers to End of Chapter Reviews and Exercises for Assembly Language for x86 Processors, 7th Edition
2022-05-05 23:33:18 472KB assembly language
1
印第安手语识别 您好,该存储库包含用于识别印度手语(ISL)手势的python实现。 由于研究较少,因此网络上没有可用的标准数据集。 因此,我们决定创建自己的手势图像。 ISL数据集包含所有字母(AZ)和数字(1-9),总类别=35。每个类别具有1200张图像。 由于涉及两只手并且由于复杂性,ISL手势实际上很难识别。 为了对图像进行分类,已使用SVM实现了词袋(弓)模型。 70:30的比例已用于训练和测试拆分。 使用这种方法,模型可以提供大约99%的准确度,而错误率却非常低。 手势 数据集中使用的所有手势均在下图所示的带有标签的图像中。 必需的设置 python 2.7(不适用于较高版本,因为openCV不支持SURF功能) opencv-python的== 3.4.2.16 opencv-contrib-python == 3.4.2.16 麻木 盗用者 执行 该实现遵循以下几个
1