不确定性工具箱 用于预测不确定性量化,校准,python工具箱。 另外:的以及的集合。 许多机器学习方法会返回预测以及某种形式的不确定性,例如分布或置信区间。 这就引出了一个问题:我们如何确定最佳的预测不确定性? 产生最佳或理想不确定性是什么意思? 我们的不确定性是否准确且经过良好校准? 不确定性工具箱提供了用于量化和比较预测性不确定性估计值的标准度量,提供了这些度量的直觉,生成了这些度量/不确定性的可视化效果,并实施了简单的“重新校准”程序来改善这些不确定性。 该工具箱当前专注于回归任务。 工具箱内容 不确定性工具箱包含: 与预测不确定性量化相关的。 评估预测不确定性估计的质量的。 预测不确定性估计和指标。 用于改善预测变量校准的方法。 有关度量标准和方法的相关。 安装 不确定性工具箱需要Python 3.6及更高版本。 要安装,请克隆并通过cd进入此仓库,然后运行: $
2021-11-01 21:29:30 1.44MB visualization metrics scoring-rules toolbox
1
汉字频率 通过处理来自各种来源的文本数据来收集汉字使用频率的统计数据。 您可以在目录中找到以下文件: 文件 汉字总数 描述 日期 〜51.5百万 小说和非小说书籍 2015年5月 〜1030万 来自各种来源的在线新闻文章 2015年6月 〜1000万 收集的Twitter消息 2015年6月 约784.6M 日语 2015年5月 请参阅下面的详细说明。 格式 每个文件包含一个数组数组(行)。 每行包含三个字段: (字符串)汉字本身。 第一行中的"all"是特例。 (整数)在分析的数据集中发现多少次。 对于"all"它是包括重复在内的汉字总数。 (浮点数)此字符表示的数据总量的
2021-10-30 16:19:50 929KB data japanese corpus data-visualization
1
漫威宇宙数据可视化网站 概括 概述 网页 资料来源 使用的技术 概述 自1939年由马丁·古德曼(Martin Goodman)创立以来,漫威漫画公司已发展成为一个巨大的大型实体,其电影作品以其最著名的超级英雄角色进行了动画再现,其故事是几十年前在漫画书中虚构的。 漫威时代正式开始于1961年,当时该公司推出了斯坦·李(Stan Lee)等人创造的“神奇四侠”和超级英雄头衔。 斯坦·李(Stan Lee)自从创立了漫威公司最著名的超级英雄(例如美国队长,蜘蛛侠,钢铁侠,金刚狼,绿巨人,雷神,蚁人(巨人),WaSP,奇异博士)以来,一直被认为是漫威漫画的父亲。 ,猩红色的女巫,看不见的女人和东西。 漫威的大部分虚构人物都在一个称为“漫威宇宙”的单一现实中运作,尽管该宇宙已被进一步描述为由成千上万个独立宇宙组成的“多重宇宙”。 这个数据可视化项目深入研究了宇宙,首先考察了它的一般历史,复杂的
2021-10-27 19:37:42 17.6MB javascript python bootstrap csv
1
electricMap用Tomorrow维护的d3.js和mapbox GL构建的实时可视化的温室气体(按二氧化碳当量计)的电力足迹。 在http://www.electricitymap.o上进行尝试。ElectricMap使用Tomorrow维护的d3.js和mapbox GL构建的实时可视化的温室气体排放量(按CO2当量计)。 可以在http://www.electricitymap.org上进行尝试,或下载该应用程序:您可以帮助我们在地图上添加新区域,从而更正数据源和翻译地图的能力,从而解决了提交想法,功能请求,或“问题”部分中的错误。 您还可以看到m的列表
2021-10-27 09:25:26 37.41MB Python Data Visualization
1
Fruchterman-Reingold算法绘制有向力图 此实现的重点不是性能,而是尝试使用这种相对简单的算法并可视化其过程。 大意 绘制图形的想法只是简单地获取图形并以“令人愉悦”的方式将其显示在屏幕上,无论这意味着什么。 Fruchterman和Reingold处理此问题的方式是将顶点视为空间中的粒子,这些粒子对彼此施加排斥力,并对通过某个边缘连接的物体施加吸引力。 可视化 使用实现实时可视化。 以下是一些起始位置(随机)和结果位置的示例: 双K5 10个顶点的随机图。 [以p = 0.41生成,种子= -957442595] 20个顶点的随机图。 [以p = 0.15,种子= -173247684生成] 用法 执行 lein run 为了尝试其他图,您可能只需要更改的以下几行: ( def W 600 ) ( def H 600 ) ( def line-weight 3 ) (
1
讽刺检测 讽刺是口头讽刺的一种形式,旨在表达蔑视或嘲笑。 嘲讽依靠说话者和听众之间的共同知识,需要机智才能理解和产生机智。 在日常互动中,我们使用手势和模拟,语调和韵律来暗示讽刺意向。 由于我们无法获得此类副语言提示,因此检测书面文本中的讽刺是一项艰巨的任务。 我研究了多种方法来检测推文中的讽刺,这些方法使用传统的机器学习(离散特征上的SVM和Logistic回归器)和深度学习模型(CNN,LSTM,GRU,双向LSTM和基于注意力的LSTM)进行评估,并在4不同的Twitter数据集( 详细信息)。 该研究项目的完成是部分满足了曼彻斯特大学计算机科学理学学士学位的要求,并且在我的导师和导
1
D3.js 4.x数据可视化-第三版 这是发布的的代码存储库。 它包含从头到尾完成本书所必需的所有支持项目文件。 关于这本书 欢迎使用D3.js 4.x数据可视化,第三版。 在本书的学习过程中,您将学习世界上最普遍,功能最强大的数据可视化库之一的基础知识,但是我们不止于此。 到我们共同度过的时光,您将拥有成为完整的D3忍者所需的所有技能,并且将能够完成从构建可视化到从头开始到在服务器上使用它以及编写自动化测试等所有工作。 如果您有一段时间没有提高自己JavaScript技能,那您就来这里了-这本书努力使用当前添加到该语言中的最新功能,同时说明它们为什么很酷以及如何使用它们与“老式” JavaScript不同。 说明和导航 所有代码都组织在文件夹中。 每个文件夹均以数字开头,后跟应用程序名称。 例如,Chapter02。 该代码将如下所示: "babel": { "presets"
2021-10-19 14:53:59 40.79MB JavaScript
1
ODAS工作室 库的桌面用户界面 描述 ODAS Studio是一个桌面界面,旨在直观地表示ODAS算法产生的数据并管理单独音频源的录音。 ODAS Studio表示单位球体上的音频能量和跟踪的音频源,并且是调整ODAS设置时的强大工具。 ODAS Studio还将分开的音频记录为不同的wav文件。 ODAS Studio建立在Electron框架上,可以在PC,Mac和Linux上本地运行。 安装 安装Node.js v12 克隆存储库 在克隆的存储库基本文件夹中运行npm install (它包含main.js ) 请注意,即使ODAS Studio可以安装在Raspberry Pi上
2021-10-19 10:10:36 1.25MB electron visualization nodejs tracking
1
Instacart市场篮子分析 抽象的 Instacart已成为北美领先的杂货配送平台,并且由于COVID-19,其增长正在Swift加速。 鉴于在线杂货店购物的增加以及作为狂热的美食爱好者,我们希望了解人们订购的商品以及他们的行为有何不同。 在探索了数据集及其包含的不同数据点之后,我们确定了购买农产品(水果,蔬菜等)时关注用户和订单行为的机会。 研究问题 1.客户的细分是什么购买有机与那些永远不要购买有机什么时候给予选择? 2.自然用户和永不自然用户之间的购买行为是否有所不同? 3.用户在Instacart上进行更多订购时,购买行为会改变吗? 购买“有机”商品是一种稳定还是动态的行为? 使用的工具 语言: Python 库: 麻木 大熊猫 matplotlib 分工 为了不给我其他小组成员的工作以功劳,每个笔记本都标上姓氏,以表示对整个研究项目的贡献。 此外,由研究团队其他成员
2021-10-16 16:43:50 4.96MB data-science numpy pandas data-visualization
1