只为小站
首页
域名查询
文件下载
登录
maxent-ner-tagger:最大熵命名实体识别(NER)-源码
最大熵NER标记器 可在线获得。 概述 该项目的目标是实施和培训 。 大多数功能构建器功能都是使用实现的, 是用Python / Cython编写的具有工业实力的开源NLP库。 为了分类,使用最大熵(MaxEnt)分类器。 实施细节 此任务的数据集是语料库,该语料库主要由路透社新闻数据组成。 数据文件已经过预处理,并且每行已经包含一个令牌,其词性(POS)标签,BIO(开始,内部,外部缩写)组块标签以及相应的NER标签。 事实证明,
SpaCy
的内置对功能工程最为有用。 利用外部单词列表,例如作为一部分分发的Wikipedia地名词典,通常会导致标记准确性下降。 由于数据文件相对较大,因此最终提交中不包含地名词典的源代码和文件。 我还通过将先前的状态/标记作为功能进行了尝试,以提高模型的性能。 出乎意料的是,模型性能在很大程度上保持不变,这大概是由于每个标签都是从仍然在模型中编码的同一特征
2021-12-11 10:28:15
36.57MB
classifier
clustering
spacy
maxent
1
spacy
英文模型en_core_web_sm-2.0.0(2.1.0, 2.2.5)/en_core_web_md-2.0.0(2.1.0, 2.2.5)
https://github.com/explosion/
spacy
-models/releases/download/en_core_web_md-2.0.0/en_core_web_md-2.0.0.tar.gz下载太慢,方便下载
2021-12-09 21:58:47
355.15MB
en_core_web_sm
en_core_web_md
1
textacy:NLP,
spaCy
之前和之后-源码
textacy:NLP,
spaCy
之前和之后 textacy是一个基于高性能
spaCy
库的Python库,用于执行各种自然语言处理(NLP)任务。 通过将基础知识-令牌化,词性标记,依赖项解析等-委托给另一个库, textacy主要关注于之前和之后的任务。 产品特点 通过用于处理一个或多个文档的便捷方法访问
spaCy
,并通过自定义扩展名和自动语言识别扩展其功能,从而为文本应用正确的
spaCy
管道 下载包含文本内容和元数据的数据集,从国会演讲到历史文献再到Reddit评论 轻松以多种常用格式在磁盘之间传输数据 清理,规范化和浏览原始文本-在使用
spaCy
处理之前 灵活地从处理过的文档中提取单词,n-gram,名词块,实体,首字母缩写词,关键词和其他感兴趣的元素 通过各种相似性指标比较字符串,集合和文档 对文档进行标记和向量化,然后训练,解释和可视化主题模型 计算各种文本可读性统计信息,包括Flesch-Kincaid等级水平,SMOG索引和多语种Flesch Reading Ease ...还有更多! 链接 下载: : 文档: : 源代码: : 错误跟踪程序: : 维
2021-12-09 11:59:06
312KB
python
nlp
natural-language-processing
spacy
1
NER:使用NLTK和
Spacy
的NLP命名实体识别-源码
你好 :grinning_face: 内尔 使用NLTK和
Spacy
的NLP命名实体识别 def ner ( text ) docx = nlp ( text ) html = displacy . render ( docx , style = "ent" ) html = html . replace ("\n\ n ","\n") result = HTML_WRAPPER . format ( html )
2021-11-13 19:31:57
3KB
HTML
1
spacy
中文语言包 zh_core_web_sm-3.1.0
spacy
的中文语言包,包含组件:tok2vec、tagger、parser、sender、ner、attribute_ruler。 安装方式:pip install YOUR_PATH/zh_core_web_sm-3.1.0.tar.gz 使用方式: import
spacy
nlp =
spacy
.load("zh_core_web_sm")
2021-11-01 18:14:32
47.27MB
自然语言处理
NLP
spacy
1
en_core_web_sm-3.1.0.tar.gz
spacy
无需解压,下载后直接 pip install 即可,但需要放入指定路径
2021-10-14 12:08:23
12.99MB
spacy
1
zh_core_web_md-2.3.1.tar.gz
spacy
是常用的python做NLP的包。适合
spacy
2.3.0,github上中文的
spacy
语言包下载巨慢,这个希望快一点。MIT。
2021-10-12 18:48:24
75.22MB
python
spacy
NLP
1
en_core_web_sm-3.1.0-py3-none-any.whl
spaCy
中的en_core_web_sm3.1.0
2021-09-16 22:05:00
12.99MB
spaCy
NLP
1
zh_core_web_sm-3.1.0-py3-none-any.whl
spaCy
的zh_core_web_sm 3.1.0
2021-09-16 22:04:59
47.17MB
NLP
spaCy
1
zh_core_web_sm-2.3.0.tar.gz.7z
Chinese multi-task CNN trained on OntoNotes. Assigns context-specific token vectors, POS tags, dependency parse and named entities.
2021-09-14 14:29:19
45.67MB
spacy
zh
汉语模型
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
2019综合测评仿真.zip
多目标微粒子群算法MOPSO MATLAB代码
航迹融合算法MATLAB仿真程序
opcua服务器模拟器+opcua客户端工具.rar
基于LSTM模型的股票预测模型_python
EBSD分析软件——Channel5下载安装教程
matpower5.0b1.zip
随机森林用于分类matlab代码
matlab时频分析工具箱+安装方法+函数说明+最新版tftb.
华为OD机试真题.pdf
Autojs 例子 源码 1600多个教程源码
基于傅里叶算子的手势识别的完整源代码(Python实现,包含样本库)
python爬虫数据可视化分析大作业.zip
Steam离线安装版
2020年数学建模B题(国二)论文.pdf
最新下载
基于R语言开发时间序列预测 Time Series Analysis With Applications in R 学习笔记
OIM分析软件,适用于EBSD分析使用
EZSuper_v2.2.1104.正式版破解
OPC+Core+Components+2.00+SDK+2.30
盛大易宝遥控器驱动 EZSupper破解
威胜三相电能表参数管理系统
TexTools织构分析软件
EBSD-TexTools.zip
matlab 面向对象编程
Elsevier爱思唯尔的word模板.zip
其他资源
stm32 st-link 驱动
java五子棋(可悔棋,人人+人机对弈)
取消高速公路省界收费站 ETC门架系统技术要求(征求意见稿).pdf
isbn查询书籍详细信息2.0
usrp-b210全套文档资料,labview-FPGA开发指南
FastColoredTextBox中文修正版V2(修复中文显示,光标位置,样式错位)
数据结构家族谱管理系统C语言源代码
新代系统 模拟器 6ta
C#二等精密水准实习平差程序(武大测绘二等水准实习)
lua 开发合集(含最新Programming in Lua第四版)
themo avantage XPS分析软件下载地址
空时编码的MATLAB仿真
代码-Computational Methods for Fluid Dynamics
4*4有符号数的乘法器设计的Hspice实现
计算机专业英语翻译软件
决策树-源码
光纤通道fc协议介绍.pdf
SSH框架 Struts+Spring+Hibernate+Ajax+功能齐全(验证码+二进制文件图片读写数据库)的网站.zip
arduino 循迹小车
线程并发拷贝程序和实验报告
时钟同步技术
图书管理系统c#+sql server2005
Wireshark协议插件 smgp
win7宋体字体