Python在Jupyter上使用HMM进行中文分词,将新闻文本分词后提取其中的高频词,HMM训练所需的trainCorpus.txt文件
2022-05-13 16:04:14 234KB python jupyter 中文分词 小说
1
本文档是本人依照jupyter notebook官网的教程而总结的,同时加入了jupyter notebook在实际项目开发中的常见用法,例如:git----jupyter notebook----github, jupyter notebook debug, jupyter notebook workspace, jupyter notebook loading and running python file, jupyter notebook running linux command, jupyter notebook using matplotlib,etc;
2022-05-13 01:04:37 513KB Jupyter notebook Document
1
水獭 Otter Grader是由加州大学伯克利分校的数据科学教育计划开发的轻量级模块化开源自动平地机。 它旨在通过与任何讲师的作业分配和收集管道兼容的方式来抽象化自动分级内部结构,从而与任何规模的班级一起使用。 Otter支持通过并行Docker容器进行本地评分,使用第三方学习管理系统(LMS)的自动评分器平台进行评分,部署由Otter管理的评分虚拟机以及允许学生在自己的计算机上运行公共检查的客户端程序包。 Otter旨在对Python脚本和Jupyter Notebook进行分级,并且与包括Canvas和Gradescope在内的一些不同的LMS兼容。 文献资料 Otter的文档可以在找
2022-05-11 23:32:19 20.87MB python docker r jupyter
1
题目:有两碗曲奇,碗A有30个香草曲奇和10个巧克力曲奇,碗B两种曲奇各20个。取到香草曲奇,从A中拿到的概率。(jupyter notebook实现,贝叶斯定理题目编程实战)
2022-05-09 09:07:53 193KB jupyter 文档资料 ide python
1
基于Python语音,使用Jupyter notebook开发的简单图像识别算法。算法通过将图像进行缩放,并进行灰度处理。然后计算待比较的两个图片之间的汉明距离,通过汉明距离来判断图片之间的相似性,并按照概率给出相似值,用于对重复图片的检测、判断。 算法大致流程如下: 1.缩放图片,一般大小为8*8,64个像素值。 2.转化为灰度图 3.计算平均值:计算进行灰度处理后图片的所有像素点的平均值,直接用numpy中的mean()计算即可。 4.比较像素灰度值:遍历灰度图片每一个像素,如果大于平均值记录为1,否则为0. 5.得到信息指纹:组合64个bit位,顺序随意保持一致性。 最后比对两张图片的指纹,获得汉明距离即可。 汉明距离的概念: 汉明距离是使用在数据传输差错控制编码里面的,汉明距离是一个概念,它表示两个(相同长度)字符串对应位置的不同字符的数量,我们以d(x,y)表示两个字x,y之间的汉明距离。对两个字符串进行异或运算,并统计结果为1的个数,那么这个数就是汉明距离。
2022-05-09 09:07:36 1KB python 图像处理 jupyter 综合资源
PyCBC教程:有关如何使用PyCBC核心库分析引力波数据的教程和示例
2022-05-08 14:41:06 10.9MB python astronomy signal-processing jupyter-notebook
1
电影_推荐系统 该项目存储库基于构建电影推荐系统克隆 数据集详细信息: 提及用于构建此推荐引擎的数据集如下: 使用的数据集: MovieLens数据集 下载数据集:从以下链接下载数据集 下载Kaggle上托管的MovieLens数据集,然后使用 从其官方网站下载MovieLens数据集,然后使用 数据集文件格式: CSV文件(以逗号分隔的值)。 注意:将数据集下载并保存在input_data文件夹中 数据集类型: 完整的数据集:该数据集包含26,000,000个评分和270,000个用户将750,000个标签应用程序应用于45,000部电影。 包括在1,100个标签中具有1200万相关分数的标签基因组数据。 注意:我们将使用完整数据集为电影建立一个简单的建议。 小型数据集:该数据集包含100,000个评分和1,700个标签应用程序,这些应用程序由700位用户应用于9,000部电影。
1
使用Jupyter Notebook通过计算教物理 以下教程将帮助您学习markdown和Python的各个方面,以便您和您的学生可以将Jupyter用作物理教育和研究的工具。 Jupyter Notebook(以前称为iPython Notebook)是一个Web应用程序(前端),用于创建和共享包含实时代码,可视化效果以及标记的文本和公式的文档。 老师可以编写教程,学生可以编写专业的交互式报告。 Jupyter Notebook适用于学生,可扩展至专业人士,是教授计算建模,数据可视化,协作计算和报告的理想选择。 Jupyter允许教师和学生编写数据驱动和代码驱动的叙述。 这句话的关键词是“叙事”。 如果您正在寻找IDE,那么有许多比Jupyter更好的高质量开发环境。 Jupyter的好处是集成了数据,代码和叙述。 这些教程是在的研讨会开始的。 在2017年夏季的AAPT会议上,对
2022-05-07 15:52:56 7.28MB JupyterNotebook
1
股市探索数据分析笔记本 使用库Numpy,Matplotlib和Pandas进行股票市场数据集探索性数据分析的Jupyter Notebook。 数据集具有以下功能: serial_number:每个变量的唯一标识符 time_stamp:捕获数据的日期 open_value:指定日期的期初值 maximum_value:在特定日期达到的索引的最高值 minimum_value:特定日期的索引的最低值 resolve_value:结算当天的值 volume_sell:卖出指数的数量
2022-05-07 10:02:42 469KB numpy exploratory-data-analysis pandas matplotlib
1
使用Gudhi库进行拓扑数据分析的教程 拓扑数据分析(TDA)是一个新兴且发展Swift的领域,它提供了一组新的拓扑和几何工具来推断可能复杂数据的相关特征。 在这里,我们使用Python Gudhi库以及流行的机器学习库和数据科学库为TDA的实践提出了一套笔记本。 例如,请参阅了解有关数据科学的TDA的介绍。 笔记本的完整列表也可以在此页的末尾找到。 安装Python Gudhi库 请参阅或者如果您有conda,则可以进行。 TDA分析管道 01-单纯形树和简单组合 TDA通常旨在从网络中的点云中提取拓扑特征。 或在一般指标空间中。 通过研究点云的拓扑,我们实际上意味着研究以点云为中心的球的并集的拓扑,也称为偏移。 但是,非离散集(例如偏移量)以及连续的数学形状(如曲线,曲面和更一般的流形)不能轻易地编码为有限的离散结构。 因此,在计算几何中使用形来近似这样的形状。 单纯形复数是一组,它
2022-05-06 15:25:01 24.43MB JupyterNotebook
1