SampEn 是一种复杂性度量,可以轻松应用于任何类型的时间序列数据,包括心率变异性和 EEG 数据等生理数据。 SampEn 在概念上类似于近似熵 (ApEn),但有以下区别: 1) SampEn 不计算自匹配。 通过在最后一步取对数可以避免使用 log(0) 可能带来的麻烦。 2) SampEn 不像 ApEn 那样依赖数据大小。 比较如上图所示。 此属性使其适用于数据量相对较短的应用程序。 此代码使用与 Fast Approximate Entropy 中相同的矢量化技术,这是同一作者的另一个提交。
2021-12-22 13:25:43 2KB matlab
1
基于生成对抗网络和差分隐私提出一种文本序列数据集脱敏模型,即差分隐私文本序列生成网络(DP-SeqGAN)。DP-SeqGAN通过生成对抗网络自动提取数据集的重要特征并生成与原数据分布接近的新数据集,基于差分隐私对模型做随机加扰以提高生成数据集的隐私性,并进一步降低鉴别器过拟合。DP-SeqGAN 具有直观通用性,无须对具体数据集设计针对性脱敏规则和对模型做适应性调整。实验表明,数据集经DP-SeqGAN脱敏后其隐私性和可用性明显提升,成员推断攻击成功率明显降低。
1
作者: Ivan Bongiorni ,数据科学家。 卷积递归Seq2seq GAN用于时间序列数据中缺失值的插补 描述 该项目的目标是为时间序列数据的插补实现递归卷积Seq2seq神经网络的多种配置。 提供了三种实现: 循环卷积seq2seq模型。 基于上述相同体系结构的GAN (生成对抗网络),其中训练了Imputer来欺骗试图区分真实和假(推算)时间序列的对抗网络。 一种部分对抗的模型,其中先前模型的两种损失结构都组合在一个模型中:Imputer模型必须减少真实的错误损失,同时尝试欺骗鉴别器。 模型在TensorFlow 2中实现,并在数据集中进行了训练。 档案文件 config.yaml :用于数据预处理,培训和测试的配置参数。 管道: main_processing.py :启动数据预处理管道。 其结果是将准备好训练的数据集以.npy( numpy )格式保存在/da
2021-12-19 16:26:05 3.01MB python machine-learning tensorflow cnn
1
半监督序列学习 此回购记录了重现论文给出的结果的实验​​。 简而言之,我们在未标记的文本数据上对序列自动编码器或语言模型进行预训练,然后使用标记的文本数据对使用预训练权重初始化的基于RNN的序列分类器进行微调,与随机初始化的权重相比,分类精度更高。 资料准备 IMDB数据集 我们为此实验使用。 下载并解压缩,导航至目录aclImdb/train ,该目录aclImdb/train中包含带aclImdb/train/pos的正( aclImdb/train/pos )和带标签的负性( aclImdb/train/neg )以及未标签的评论( aclImdb/train/unsup )。 然后cd进入每个子目录并运行 for f in *.txt; do (cat "${f}"; echo) >> pos.txt; done for f in *.txt; do (cat "${f}"; ec
1
SMC ++是一个用于从整个基因组序列数据估算种群大小历史的程序。 内容 遇到麻烦该怎么办 档案格式 输入数据格式 输出数据格式 快速入门指南 请遵循安装说明。 使用vcf2smc将您的VCF转换为SMC ++输入格式: $ smc++ vcf2smc my.data.vcf.gz out/chr1.smc.gz chr1 Pop1:S1,S2 此命令将解析样本S1和S2的重叠群chr1数据,样本S1和S2是总体Pop1成员。 您应该为数据集中的每个独立重叠群运行一次,从而为每个重叠群生成一个SMC ++输出文件。 使用估计值拟合模型: $ smc++ estimate -o analysis/ 1.25e-8 out/example.chr*.smc.gz 第一个强制性参数1.25e-8是每代的突变率。 其余参数是在上一步中生成的数据文件。 根据样本量和您的机器,安装过程应在
2021-12-08 16:29:55 2.33MB C++
1
超级商店时间序列数据集。超市购买的时间序列数据,可以训练和测试您的模型。 superstore_test.csv test_result.csv superstore_train.csv
2021-12-05 18:57:55 575KB 数据集
1
罗塞塔 该软件包是trRosetta蛋白质结构预测协议的一部分,该协议在以下方面开发:。 它包括从多序列比对或单个序列预测蛋白质残基间几何形状的工具。 联系人:伊万·阿尼申科( Anishchenko), 要求 tensorflow (在版本1.13和1.14上测试) 下载 # download package git clone https://github.com/gjoni/trRosetta cd trRosetta # download pre-trained network wget https://files.ipd.uw.edu/pub/trRosetta/model2019_07.tar.bz2 tar xf model2019_07.tar.bz2 用法 python ./network/predict.py -m ./model2019_07 example/T
2021-11-28 22:17:54 6.94MB Python
1
使用LSTM和其他算法进行无监督的异常检测 在合成时间序列数据上使用LSTM(长期短期记忆)算法进行无监督的异常检测。 它使用均方误差作为此类数据中离群值的度量。 原始信号,平滑信号和通过MSE进行异常检测的图表。 一些待办事项: Keras(TF后端) 估算真实数据(例如,) PyTorch端口 其他方法: 带有状态转换的有限状态自动机,用于时间序列数据分段( ) 一类NN() 待定 参考
2021-11-28 15:28:31 58KB keras lstm anomaly-detection Python
1
股票价格预测 使用实际数据并实施LSTM和GRU递归网络进行时间序列数据预测来预测公司的股价 在此示例中,它遍历了从2008年至今的亚马逊和特斯拉股价,并为时间序列数据训练了回归模型以预测可能的波动
2021-11-25 16:26:21 825KB HTML
1
使用一维卷积神经网络处理序列数据,数据类型为一维