一项众包实验,其中,英国广播公司(BBC)电视节目的观看者(“人群”)提交了不倒翁硬币数量的估计值(在第1部分)中显示,服从对数正态分布∧ (m,s2)。 硬币估计实验是适用于众包解决方案的广泛图像分析和对象计数问题的原型。 当前文章(第2部分)的目的是通过贝叶斯方法和最大似然(ML)方法确定∧(m,s2)的位置和比例参数(m,s),并比较结果。 分析的结果之一是通过杰弗里斯的规则解决了有关适当贝叶斯先验问题的问题。 结果表明,贝叶斯分析和ML分析导致位置参数的表达式相同,但尺度参数的表达式不同,这在无限样本量的限制内变得相同。 分析的第二个结果涉及使用样本均值作为不寻求或不知道响应分布的应用程序中人群信息的度量。 在硬币估计实验中,发现样本均值与根据∧(m,s2)计算出的平均硬币数相差很大。 这种不一致性引发了关于样本平均值是否以及在何种条件下提供人群信息的可靠度量的关键问题。 本文通过使用最大熵原理(PME)解决了该问题。 PME产生了一组方程,用于找到与给定的先验信息且仅与该信息一致的最可能的分布。 如果对于指定的样本均值和样本方差没有PME方程的解,则样本均值是不可靠的统计信息
2024-01-12 17:28:44 1.59MB 行业研究
1
py-pdf-parser Py PDF Parser是帮助从结构化PDF中提取信息的工具。 完整的详细信息和安装说明可以在以下位置找到: : 该项目基于Sam Whitehall(github.com/samwhitehall)的原始设计和原型。
2023-02-13 16:42:14 509KB pdf parsing pdf-parsing py-pdf-parser
1
该资源为试用版代码~ 一行代码快速实现特征提取! 理论讲解:https://blog.csdn.net/fengzhuqiaoqiu/article/details/124979190?spm=1001.2014.3001.5501 function fea = genFeatureEn(data,featureNamesCell,options) % 特征提取函数 % 输入: % data:待特征提取的时域信号,可以是二维数据,行列方向不可出错 % options:其他设置,使用结构体的方式导入。 % featureNamesCell:拟进行特征提取的特征名称,该变量为cell类型,其中包含的特征名称为字符串,特征名称需要在下边列表中: % 目前支持的特征(2022.7.10,共8种): % psdE:功率谱熵 % svdpE:奇异谱熵 % eE:能量熵 % ApEn:近似熵 % SampleEn:样本熵 % FuzzyEn:模糊熵 % PerEn:排列熵
2022-12-06 11:26:11 16KB 特征提取 信息熵 模糊熵 近似熵
1
GROBID GROBID文档 请访问以获取更多详细信息。 概要 GROBID(或Grobid,但不是GroBid或GroBiD)表示书目数据的生成。 GROBID是一个机器学习库,用于将原始文档(例如PDF)提取,解析和重组为结构化XML / TEI编码的文档,尤其侧重于技术和科学出版物。 最早的发展始于2008年,是一种业余爱好。 在2011年,该工具已以开源形式提供。 自开始以来,作为副项目的GROBID工作就一直稳定,并有望继续进行。 可以使用以下功能: 从PDF格式的文章中提取标题并进行解析。 这里的摘录涵盖了通常的书目信息(例如标题,摘要,作者,隶属关系,关键字等)。 从.
2022-10-08 16:15:35 277.11MB metadata pdf machine-learning deep-learning
1
回答下列问题:  (1)如何能构建一个系统,以至从非结构化文本中提取结构化数据?  (2)有哪些稳健的方法识别一个文本描述的实体和关系?  (3)哪些语料库适合这项工作,如何使用它们来训练和评估模型?信息有很多种”形状“和”大小“,一个重要的形式是结构化数据:实体和关系的规范和可预测的组织。例如:我们可能对公司和地点之间的关系,可用关系数据库存储。但如果我们尝试从文本中获得相似的信息,事情就比较麻烦了。如何从一段文字中发现一个实体和关系的表呢?然后,利用强大的查询工具,如SQL,这种从文本获取意义的方法被称为“信息提取”信息提取有许多应用,包括商业智能、简历收获、媒体分析、情感检测、专利检索及
1
回答下列问题:   (1)如何能构建一个系统,以至从非结构化文本中提取结构化数据?   (2)有哪些稳健的方法识别一个文本描述的实体和关系?   (3)哪些语料库适合这项工作,如何使用它们来训练和评估模型? 信息有很多种”形状“和”大小“,一个重要的形式是结构化数据:实体和关系的规范和可预测的组织。例如:我们可能对公司和地点之间的关系,可用关系数据库存储。
1
简历解析器 一个简单的简历解析器,用于从简历/简历中提取信息 注意:这仅是吡草精的包装纸。 解析的实际源代码可以在这里找到: : 安装 pip install pyresparser 图形用户界面 Django使用 使用GUI轻松提取和解释 对于运行GUI,请执行: python resume_parser/manage.py makemigrations python resume_parser/manage.py migrate python resume_parser/manage.py runserver 访问127.0.0.1以查看GUI 在职的: 在Docker中运行应用 安装docker-compose 从项目的根执行以下命令 建立我们的形象 docker-compose build 启动我们的容器和服务 docker-compose up -d 在浏览器中访问l
2021-10-22 15:20:25 167KB python parser gui python3
1
物联网定位课程作业,注释详细,结构清晰,方便根据自身要求修改 完整工程,使用的是DEV,也可方便在其他平台移植
2021-08-31 14:57:18 374KB GPS NMEA C语言 提取信息
1
埃波伊 提取感兴趣的寄生虫(epoi)是一种取证工具,可帮助自动提取以下内容: IP地址 电邮 链接和域 base64检测 JS分机 恶意动作词 勒索软件相关词 隐藏文件 用法:bash epoi.sh只需插入带有开源脚本或资源的目标目录,分析便会开始。 请记住,这是一个取证安全工具,但不是Linux防病毒软件,因此请不要信任epoi的100%,epoi仍在持续开发中! 由Cignoraptor编码
2021-05-19 16:04:37 2KB Shell
1
除草剂 A simple resume parser used for extracting information from resumes 内置:red_heart:︎和 :hot_beverage: 通过 产品特点 提取名称 提取电子邮件 提取手机号码 提取技巧 提取总经验 提取大学名称 提取度 提取物名称 提取公司名称 安装 您可以使用以下方法安装该软件包 pip install pyresparser 对于NLP操作,我们使用spacy和nltk。 使用以下命令安装它们: # spaCy python -m spacy download en_core_web_sm # nltk python -m nltk.downloa
2021-04-13 21:53:10 5.16MB python nlp resume parser
1