新浪微博互动预测 介绍 比赛的详细信息可以在找到竞争主要是分析用户在中国微博平台上发布的行为和消息,并预测每条消息的转发,评论和喜欢的次数。 该项目主要使用python和pandas。 这项比赛的第二阶段仍在进行中。 这是我为第1阶段构建的数据基准线。 设计 这是一个自行设计的数据基准线。 主要思想是模块化数据项目的流程。 用户编写方法来生成功能,其存储数据帧中大熊猫在功能的文件夹,并feature.log会自动记录所有现有的功能和它们的参数。 用户可以在Train方法中组合不同的功能并选择不同的模型,模型将存储在models文件夹中,模型的信息将存储在train.log中。 用户选择不同的功能和参数组合进行测试,结果将存储在结果文件夹中,而测试信息将存储在test.log中 笔记本文件夹中的Ipython笔记本用于播放数据,迭代地查看日志。 该代码位于weiboPredict
2021-12-11 21:15:37 31.29MB Python
1
rnaSeqPipelineGLBRC.py 目的: Implementation of the Gasch lab RNA-Seq pipeline. 输入 : A text file with RNA-Seq fastq files to be processed. 请使用专用目录来运行管道。 创建您的目录并将您的 fastq 文件复制到该目录中。 通过移动到工作目录并运行 /bin/ls *.fastq > input.txt 来生成输入文件 所需参数: -f input.txt To run default enter: /home/GLBRCORG/mplace/scripts/rnaSeqPipelineGLBRC.py -f input.txt 可选参数: -r this will use "-s reverse" parameter for HTSeq
2021-12-07 11:00:23 11KB Python
1
InstaLOD Pipeline 2019 WINONLY_iND +插件
2021-12-06 16:01:29 192.81MB 插件
1
RADseq人口基因组学 奥本大学生物学家脚本课程开发了一种用于RADseq数据的群体基因组分析的管道。 入门 目标 我们的开发流程旨在使用户从从定序器获得与限制性酶切位点相关的DNA序列(RADseq)数据的步骤,到总体基因组推断的起始步骤。 具体地,我们已提供了书面在壳和R 1至解复用的序列数据的脚本和组装位点具有Stacks ,估计人口结构与两个参数和非参数人口的聚类方法( Admixture和adegenet ),并推断人口结构下面的空间直观具有conStruct模型。 数据 在TM收集的来自276个来自巴哈马,海地和多米尼加共和国的Anolis distichus蜥蜴的双消化RADseq(ddRADseq)数据集上,测试了使用Stacks解复用和组合原始序列数据的脚本。 我们还下载了从RADseq协议获得的基因组数据,并使用两个最流行的RADseq组装程序之一Stacks和Py
2021-12-01 15:10:58 1.43MB R
1
Item Pipeline介绍 Item对象是一个简单的容器,用于收集抓取到的数据,其提供了类似于字典(dictionary-like)的API,并具有用于声明可用字段的简单语法。 Scrapy的Item Pipeline(项目管道)是用于处理数据的组件。 当Spider将收集到的数据封装为Item后,将会被传递到Item Pipeline(项目管道)组件中等待进一步处理。Scrapy犹如一个爬虫流水线,Item Pipeline是流水线的最后一道工序,但它是可选的,默认关闭,使用时需要将它激活。如果需要,可以定义多个Item Pipeline组件,数据会依次访问每个组件,执行相应的数据处理功
2021-11-23 18:49:29 2.16MB c cra em
1
假新闻检测器 欢迎分类为假新闻。 目标 端到端的机器学习管道将: 提取原始文本数据。 将原始文本数据处理为段落向量 将受过训练的有监督学习分类器应用于段落向量,以将原始文本标记为fake或not_fake fake 知识 比较当今使用的词嵌入应用程序的不同方法 在两者上都使用像Gensim这样的神经嵌入实现 词向量化和 段落矢量化 超调谐神经嵌入算法作为端到端流水线的一部分 使用标准的行业分类器,并将其与端到端管道集成 对多阶段机器学习管道进行故障排除 结构 (第一阶段)假新闻分类: 分类器应用程序伪造新闻文本。 嵌入代码是为学生事先准备的,因此他们可以专注于应用分类器基础知识。 将关注度量(精度,召回率,F1)和模型选择 (第2阶段)文本嵌入技术: 什么是Word2Vec,什么是Paragraph2vec 回顾历史策略以及word2vec为什么效果更好 TF IDF(历史简
2021-11-16 18:44:41 215.26MB machine-learning pipeline word2vec classification
1
资产 一个超简单易用的资产管理PHP库。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 产品特点 很好用。 自动生成HTML标记,以包括您JavaScript和CSS文件。 自动检测资产类型(CSS,JavaScript或集合)。 支持以编程方式即时添加资产。 支持本地(包括程序包)或远程资产。 防止加载重复的资产。 随附的资产管道(将所有资产合并并缩小为一个文件),并带有URL时间戳和gzip支持。 自动为本地资产添加可配置的文件夹名称或url前缀。 支持安全( https )和协议无关( // )链接。 支持可以嵌套的集合(命名
2021-11-16 09:22:26 22KB php laravel asset-pipeline assets
1
CAProject_MIPS模拟器 此代码实现了 MIPS 模拟器(流水线的 Tomasulo 算法)。 入口在 MIPSSimulator.cpp 中。 如何使用 转到 /src 文件夹 制作 转到 /bin 文件夹。 可执行文件在这里 ./MIPSsim inputfilename outputfilename -{sim|dis} [-Tm:n] 'dis' 将输入文件反汇编为 MIPS 汇编语言 'sim' 模拟管道在每个阶段的工作方式 [-Tm:n] 是可选的,输出从 m 到 n 的周期。 它将默认输出所有周期。 所以 /src 文件夹中的 Sample Output.txt 是网站中的前一个
2021-11-15 23:29:32 28KB C++
1
fastGWA-Pipeline:使用cgatcore构建的虚拟fastGWA管道
2021-11-11 11:53:12 4KB Python
1
builtin_shaders-2021
2021-11-09 18:04:57 565KB shader buildin pipeline
1