TCSP-时间约束满意度问题 TSCP是一个约束满足问题,其中变量代表时间点,时间信息由一元和二进制约束集表示。 我们将TCSP与图相关联,包括: 一组具有连续域的变量X_1 to X_n 一组约束,每个约束由一组间隔表示 一元约束T_i将变量X_i的域限制为给定的间隔集。 二进制约束T_{ij}将X_j - X_i的距离值约束到一组间隔。 我们用有向约束图表示,其中节点代表变量,边i -> j指定约束T_{ij} 。 为简单起见,我们还引入了X_0 = 0 ,因此一元约束由T_{0i} 。 STP-简单的时间问题 STP是TCSP,其中所有约束都指定一个间隔。 我们将这个问题与distance graph (V, E_d) ,其中V由与约束网络相同的节点组成,并且每个边缘都由权重a_{ij}标记,表示X_j - X_i <= a_{ij} 。 输入 求解器程序的输入由std
2021-12-04 17:24:26 356KB JupyterNotebook
1
dengai2 第二次尝试来自DrivenData.org的DengAI挑战。 此处提供了挑战的链接: : 。 这项挑战的目的是预测城市中的登革热病例。 该疾病是通过蚊子传播的,因此预测登革热的数量与预测蚊子的数量高度相关。 回购概述 原始数据直接从DrivenData下载,位于data / raw文件夹下。 经过处理的文件夹将数据转换成可行的格式以用于某些模型测试后,其中包含数据。 所有代码都位于py文件夹中。 笔记本-探索 该文件的目的是获得数据的第一印象并进行所有认为的绘图。 发现: 应用KPSS和ADF测试,我们看到大多数时间序列都很好,尽管有些时间必须根据KPSS和ADF的特定测试结果进行差分或逆趋势处理。 对于某些变量,我们发现大量遗漏的观测值。 为了解决这个问题,我们应用KNNImputation并测试了不同数量的邻居。 为了评估插补的性能,我们在每次插补之后预测目
2021-12-04 16:29:44 10.35MB JupyterNotebook
1
fern_fractal Python蕨类植物分形图
2021-12-04 10:31:59 5.07MB JupyterNotebook
1
python-财务
2021-12-04 09:33:54 547KB JupyterNotebook
1
Goodreads刮板机 这些Python脚本可用于从Goodreads收集书评和元数据。 我们之所以开发这种Goodreads Scraper的动机是因为Goodreads API难以使用,并且不提供对评论全文的访问权限。 相反,Goodreads抓取工具使用网络抓取库和来收集数据。 我们使用此Goodreads Scraper收集了文章“ The Goodreads'Classics':对读者,亚马逊和众包文学批评的计算研究”的数据。 为了允许其他人重现(近似)本文中使用的数据,我们包括了一个文件,其中包含我们分析的144本经典书的144个Goodreads图书ID( goodreads_classics.txt )。 您可以使用这些ID如下所述通过Goodreads Scraper收集相应的评论和元数据。 注意:对Goodreads网站的更新可能会破坏此代码。 我们不保证刮板在
2021-12-03 22:03:43 59KB JupyterNotebook
1
用于在乳腺癌微环境中基于张量的高阶相关分析的Python脚本。 如果使用此代码,请引用以下文章: Shi,M.,Klindziuk,L.和Mollah,S.,2020年。一种非负张量因子分解方法,用于消除乳腺癌中的卷积微环境。 bioRxiv。 1.ificant_test.ipynb RPPA和GCP数据的重要测试。 2. NTF_with_NCP.ipynb 基于NCP实现的非负张量分解。 3. NTF_with_Tensorly.ipynb 基于Tensorly实现的非负张量分解 4. PLSR_NCP.ipynb 基于NCP张量分解结果的PLSR相关分析。 5. PLSR_Tensorly.ipynb 基于NCP张量分解结果的PLSR相关分析。
2021-12-03 20:16:55 2.16MB JupyterNotebook
1
IEEE-CIS-欺诈检测 该存储库包含有关IEEE-CIS欺诈检测数据集的深入探索探索性数据分析(EDA)。竞争是一个二进制分类问题-即我们的目标变量是一个二进制属性(用户是否使点击欺诈?),我们的目标是尽可能将用户分类为“欺诈”或“非欺诈”。 您可以阅读IEEE-CIS欺诈检测页面中的完整数据集概述和数据描述。 在此存储库中,您可以访问; EDA.ipynb:包含深入分析的Jupyter笔记本 util_data_cleaning.py:包含大量数据清除功能的Python文件。 util_reporting.py:包含大量可视化和报告功能的Python文件。 util_feature_engineering.py:包含大量数据准备和整理功能的Python文件。 您可以看一下我的Kaggle内核,以了解如何简化EDA流程:
2021-12-03 19:33:17 1.02MB JupyterNotebook
1
棒球练习2-使用Python访问SQL表 纳什维尔软件学院的这个课堂练习是作为介绍如何使用Python访问SQL表的。 在将重点转移到我的个人顶峰项目之前,我完成了原始自述文件(如下)中显示的第一个问题的大部分。 这项任务是一个“伸展目标”,在我们开始专注于我们的个人顶峰项目时就被分配了。 Nasvhille软件学院的原始自述文件 拉曼棒球数据库练习...再次。 该数据已由Sean Lahman提供 您可以找到数据字典 使用PANDAS查找问题的答案。 你没听错! 我们之前已经经历过这一过程。首先使用SQL,现在使用python / pandas。 随之而来的是一些规则。 您仍然需要连接到Lahman Baseball数据库(所有数据都存放在此数据库中)。 对于您回答的每个问题,这应该是您SQL的范围: SELECT * FROM ; 其他所有操作
2021-12-03 13:52:51 8.89MB JupyterNotebook
1
MLP-神经网络-:多层感知(MLP)网络,对属于STL-10数据集中10个类别之一的图像数据进行分类
2021-12-03 13:01:09 992KB JupyterNotebook
1