使用Pytorch [WIP]进行情感分析 更新/注意:大家好,我不再使用此存储库了! 请自行决定使用,因为我认为强烈建议您不要使用它。 实际上,这只是我在Pytorch首次推出时对其进行的测试。 由于我基本上是用TF编写代码,因此无法回答此存储库中的任何问题。 另外,大约一年多以前,我对此进行了编码。 谢谢! 在SemEval 2014上使用RNN / GRU / LSTM进行基于方面的情感分析的Pytorch示例。 目前,我们实现了基线LSTM / RNN / GRU模型,该模型在最后一个输出上具有线性层,以及基于目标的情感分析(ABSA)的依赖于目标的TD-LSTM(Tang等,2015)模型。 序列从前面填充零,以便最后一个向量不为零。 我们使用keras pad序列将它们填充在prepare脚本中。 到目前为止,没有任何东西被掩盖,我们填充到最大长度。 有两种预测模式,即
2021-10-16 18:26:34 409KB deep-learning sentiment-analysis pytorch lstm
1
kaggle
2021-10-16 16:49:41 196.25MB 数据集
1
Instacart市场篮子分析 抽象的 Instacart已成为北美领先的杂货配送平台,并且由于COVID-19,其增长正在Swift加速。 鉴于在线杂货店购物的增加以及作为狂热的美食爱好者,我们希望了解人们订购的商品以及他们的行为有何不同。 在探索了数据集及其包含的不同数据点之后,我们确定了购买农产品(水果,蔬菜等)时关注用户和订单行为的机会。 研究问题 1.客户的细分是什么购买有机与那些永远不要购买有机什么时候给予选择? 2.自然用户和永不自然用户之间的购买行为是否有所不同? 3.用户在Instacart上进行更多订购时,购买行为会改变吗? 购买“有机”商品是一种稳定还是动态的行为? 使用的工具 语言: Python 库: 麻木 大熊猫 matplotlib 分工 为了不给我其他小组成员的工作以功劳,每个笔记本都标上姓氏,以表示对整个研究项目的贡献。 此外,由研究团队其他成员
2021-10-16 16:43:50 4.96MB data-science numpy pandas data-visualization
1
称QR迭代matlab代码矩阵分析 描述 此存储库包含Matrix Analysis 2020Spring作业的代码。 它基于Matlab,可以针对每个问题直接针对每个脚本运行。 它包含: 油煎面包块分解 QR分解(分别使用Givens和Householder算法) Moore-Penrose伪逆(分别使用列迭代和跟踪方法) ESPRIT频率估算 画Gerschgorin圆
2021-10-15 17:19:16 54KB 系统开源
1
使用R的快速随机奇异值分解 随机奇异值分解(rsvd)是一种快速概率算法,可用于高精度计算海量数据集的近乎最优的低秩奇异值分解。 关键思想是计算数据的压缩表示形式以捕获基本信息。 然后,可以使用该压缩表示来获得低阶奇异值分解分解。 据我们所知,rsvd软件包为R中的低秩矩阵逼近提供了最快的例程之一。 随着矩阵尺寸的增加(此处目标等级k = 50),计算优势变得明显: 奇异值分解在数据分析和科学计算中起着核心作用。 SVD还广泛用于计算(随机)主成分分析(PCA),这是一种线性降维技术。 随机PCA(rpca)使用近似的奇异值分解来计算最重要的主分量。 该软件包还包括一个用于计算(随机化)鲁棒主成分分析(RPCA)的功能。 此外,还提供了一些绘图功能。 有关更多详细信息,请参见: 。 SVD示例:图像压缩 library( rsvd ) data( tiger ) # Image com
2021-10-15 12:30:07 3.35MB cran pca svd principal-component-analysis
1
使用tslearn的示例代码。 目的:对波形数据或时间序列数据进行聚类。 tslearn是基于python的机器学习库之一。 tslearn: : 用日语。 使用KShape算法对样本数据执行波形聚类。 必须为算法指定簇数作为参数。这次,我预先检查了数据,并知道有2个类,因此我设置了n_clusters=2 。 有几种检查簇数的方法,但是这次我们使用弯头法进行检查。 其他可能的方法如下。 BIC / AIC GAP方法 轮廓法 肘法
1
银行营销数据分析 要求 Python 2.7 脾气暴躁> = 1.14.2 Matplotlib> = 2.2.0 熊猫> = 0.22.0 Scikit-Learn> = 0.19.1 描述 银行营销数据集是从葡萄牙语的一家银行机构的直接营销活动中收集的。 营销活动可以理解为打给客户的电话,说服他们接受他们向其银行存入定期存款。 每次通话后,他们被记为否-是客户未存入保证金,是-是通话中接受接受存入的客户。 该项目的目的是根据客户的信息预测应召客户是否愿意存入定期存款。 该项目考虑的银行营销数据集仅占全部可用数据集的一小部分(10%)。 该数据集包含约4119行数据,其中包含19个功能部件和1列Class信息。 数据集的主要问题是: 需要进行预处理以填充数据集中的未知值 需要进行预处理以决定分类数据和连续数据的使用 数据是类别不平衡的(与类别0的数量(否)相比,类别1
2021-10-14 23:03:03 4.92MB python random-forest pandas-dataframe histogram
1
脑电信号基础matlab代码波列分析 使用 2D 和 3D AUC 图,我们提高了帕金森病的检测精度 有用于分析脑电图 (EEG)、肌电图 (EMG) 和震颤图数据的 Matlab 文件。 波列电活动分析方法的思想是我们将生物医学信号视为波列的组合。 波列是信号在时间、频率和空间上局部化的功率谱密度的增加。 我们将波列检测为小波频谱图中的局部最大值。 我们不认为波列是一种特殊的信号。 我们研究了以下波列参数:波列中心频率、波列最大功率谱密度、周期中的波列持续时间和波列带宽。 我们开发了特殊的图表,称为 AUC 图,以确定哪些波列是神经退行性疾病的特征。 您可以在此处阅读我们的方法: OS Sushkova、AA Morozov、AV Gabova、AV Karabanov。 使用基于波列的电活动分析方法研究帕金森病患者肢体震颤的表面肌电图和加速信号 // 人工智能进展:第 16 届伊比利亚美洲人工智能会议,IBERAMIA 2018,秘鲁特鲁希略,11 月 13 日-16, 2018, Proceedings / GR Simari, F. Eduardo, F. Gutiérrez
2021-10-14 16:18:11 133KB 系统开源
1
下载后为zip压缩包,解压后可得到elasticsearch-analysis-ik-7.12.0.zip压缩文件
2021-10-14 12:05:53 4.37MB elasticsearch linux
1
Statistical and Econometric Methods for Transportation Data Analysis
2021-10-14 12:01:49 1.97MB 标志 规范
1