PyTextGCN 对TextGCN的重新实现。 此实现使用Cython进行文本到图形的转换,因此速度相当快。 图形和GCN基于库。 要求 该项目的构建具有: 的Python 3.8.5 Cython 0.29.21 CUDA 10.2(GPU支持可选) scikit学习0.23.2 pytorch 1.7.0 火炬几何1.6.3 海湾合作委员会9.3.0 nltk 3.5 scipy 1.5.2 至少Text2Graph模块也应该与这些库的其他版本一起使用。 安装 cython编译可以从项目的根目录执行: cd textgcn/lib/clib && python setup.py build_ext --inplace 用法 要从称为X的字符串列表(每个字符串包含一个文档的文本)中计算出图形,请创建名为y的标签列表以及测试索引test_idx的列表,只需运行:
1
机器学习的时间序列预测 一组预测时间序列的不同机器学习模型,具体来说是给定货币图表和目标的市场价格。 要求 必需的依赖项: numpy 。 其他依赖项是可选的,但是为了使最终模型更多样化,建议安装以下软件包: tensorflow , xgboost 。 经过python版本测试:2.7.14、3.6.0。 取得资料 有一个内置的数据提供程序,可以从获取数据。 目前,所有模型都已通过加密货币图表进行了测试。 提取的数据格式是标准安全性:日期,最高,最低,打开,关闭,交易量,报价量,weightedAverage。 但是模型与特定的时间序列特征无关,并且可以使用这些特征的子集或超集进行训练。 要获取数据, 从根目录运行脚本: # Fetches the default tickers: BTC_ETH, BTC_LTC, BTC_XRP, BTC_ZEC for all time periods. $ ./run_fetch.py 默认情况下,将提取Poloniex中所有可用时间段(天,4h,2h,30m,15m,5m)的数据,并将其存储在_data目录中。 您可以通过命令行参
2023-04-21 00:06:30 101KB python machine-learning statistics deep-learning
1
神经元 并行神经网络微框架。 在阅读论文。 特征 任意形状和大小的密集、完全连接的神经网络 具有均方误差成本函数的反向传播 基于数据的并行性 几个激活函数 支持 32、64 和 128 位浮点数 入门 获取代码: git clone https://github.com/modern-fortran/neural-fortran cd neural-fortran 依赖项: Fortran 2018 兼容编译器 OpenCoarrays(可选,用于并行执行,仅限 GFortran) BLAS、MKL(可选) 使用 fpm 构建 以串行模式构建 fpm build --flag "-cpp -O3 -ffast-math fcoarray=single" 以并行模式构建 如果您使用 GFortran 并希望并行运行神经 fortran,则必须首先安装OpenCoarray
2023-04-19 17:15:26 16.22MB machine-learning neural-network fortran parallel
1
日志异常检测器 日志异常检测器是一个名为“ Project Scorpio”的开源项目代码。 LAD也简称为LAD。 它可以连接到流媒体源并生成对异常日志行的预测。 在内部,它使用无监督机器学习。 我们结合了许多机器学习模型来实现这一结果。 另外,它在回路反馈系统中还包括一个人。 项目背景 该项目的最初目标是开发一种自动方法,根据用户应用程序日志中包含的信息,在用户的应用程序出现问题时通知用户。 不幸的是,日志中充满了包含警告甚至是可以忽略的错误的消息,因此简单的“查找关键字”方法是不够的。 另外,日志的数量在不断增加,没有人愿意或无法监视所有日志。 简而言之,我们的最初目标是使用自然语言处理工具进行文本编码,并使用机器学习方法进行自动异常检测,以构建一种工具,该工具可以通过突出显示最日志来帮助开发人员针对失败的应用程序更快地执行根本原因分析如果应用程序开始产生高频率的异常日志,则很可能
2023-04-19 10:31:53 12.02MB kubernetes log word2vec machine-learning-algorithms
1
使用Flask Dockerize并将机器学习模型作为REST API部署 一个可以服务于预测机器学习模型的简单Flask应用程序。 启动Flask应用程序后,将一个腌制的sklearn模型读入内存,并通过/ predict端点返回预测。 您还可以使用/ train端点来训练/重新训练模型。 部署ML模型的步骤 安装Flask和Docker 序列化您的scikit学习模型(可以使用Pickle或JobLib完成) [可选]将列名称列表添加到scikit对象,例如:rf.columns = ['Age','Sex','Embarked','Survived'] 创建一个单独的flask_api.py文件,该文件将使用Flask构建Web服务 运行python flask_api.py 转到http地址检查其是否正常工作 创建一个执行以下项目的dockerfile 安装ubuntu,python和git 从git克隆代码回购或将本地python代码移动到容器中的/ app 将WORKDIR设置为/ app 在requirements.xt中安装软件包 露出端口以进行烧瓶定位
2023-04-17 01:08:29 62KB python docker machine-learning deployment
1
在线交易中的欺诈检测:使用欺诈检测比率小于0.00005的Anamoly检测技术(例如过采样和欠采样)来检测在线交易中的欺诈,因此,仅应用分类算法可能会导致过度拟合
2023-04-15 16:13:06 287KB finance machine-learning query deep-learning
1
本资源包含Pattern Recognition And Machine Learning的英文版和由马春鹏翻译的中文版。
2023-04-13 21:42:41 17.77MB 模式识别
1
带S-NET提取的MSMARCO(提取网) 的CNTK(Microsoft深度学习工具包)实现提取部分的并进行了一些修改。 该项目是为数据集设计的 代码结构基于 支持MSMARCO V1和V2! 要求 这是一些培训和评估所需的库。 一般的 python3.6 cuda-9.0(需要CNTK) openmpi-1.10(需要CNTK) gcc> = 6(需要CNTK) Python 请参考requirements.txt 使用预先训练的模型进行评估 此存储库提供了经过预训练的模型和经过预处理的验证数据集以测试性能 请下载和经过,并将它们分别放在MSMARCO/data和MSMARCO根目录中,然后在正确的位置将其解压缩。 代码结构应该像 MSMARCO ├── data │   ├── elmo_embedding.bin │   ├── test.tsv │   ├── vo
2023-04-13 15:17:51 2.48MB nlp cntk question-answering machine-comprehension
1
派尔蒙 PyLMNN是用于在纯python中进行度量学习的算法的实现。 此实现紧密遵循在找到的Kilian Weinberger的原始MATLAB代码。 此版本解决了无限制的优化问题,并使用L-BFGS作为后端优化器找到了线性变换。 该软件包还可以使用出色的软件包通过贝叶斯优化找到LMNN的最佳超参数。 安装 该代码是在Ubuntu 16.04下的python 3.5中开发的,并且也在Ubuntu 18.04和python 3.6下进行了测试。 您可以使用以下命令克隆存储库: git clone https://github.com/johny-c/pylmnn.git 或通过pip安装它: pip3 install pylmnn 依存关系 numpy的> = 1.11.2 scipy> = 0.18.1 scikit_learn> = 0.18.1 可选依赖项 如果要使用超参
1
ML-MT-WebApp 这是我的本科学位课程的主要项目之一。 在这里,我开发了一种疾病预测网络应用程序,该应用程序使用机器学习的概念来预测各种疾病,例如疟疾,肺炎,糖尿病等。 下面是使用的各种模型文件的名称: 癌症模型=模型 糖尿病模型=模型1 心脏模型= model2 肝模型= model4 肾脏模型= model3 疟疾模型= model111.h5 肺炎模型= my_model.h5 用于训练深度学习模型的内核 疟疾核心模型: : 肺炎模型的核心-https: 用于模型开发的各种数据集的详细信息: 癌症:cancer.csv [在资源库中] 糖尿病:dialysis.csv [在资源库中] Heart :heart.csv [在资源库中] 肝脏: : Patient- 肾脏: : 疟疾: : 疟疾 肺炎: : //www.kaggle.c
2023-04-12 00:25:55 52.86MB machine-learning cancer heart diabetes
1