使用Python从头开始构建简单的聊天机器人(使用NLTK) 聊天机器人的历史可以追溯到1966年,当时Weizenbaum发明了一种名为ELIZA的计算机程序。 它仅从200行代码中模仿了心理治疗师的语言。 您仍然可以在这里与之交谈: 。 同样,让我们​​创建一个使用Python的NLTK库的非常基本的聊天机器人。这是一个非常简单的机器人,几乎没有任何认知技能,但是仍然是进入NLP并了解聊天机器人的好方法。 大纲 动机 这个项目的想法不是要创建具有出色认知技能的SOTA聊天机器人,而只是要利用和测试我的Python技能。这是我刚进入NLP领域并想到创建一个最初的项目之一一个简单的聊天机
2021-11-01 16:33:54 14KB python nlp machine-learning article
1
PyTorch GAN :laptop:与 :laptop: = :red_heart: 此仓库包含各种GAN架构的PyTorch实现。目的是使初学者更容易开始玩和学习GAN。 我发现的所有存储库都掩盖了某些内容,例如将某些网络层中的偏向设置为False而没有解释为什么要做出某些设计决定。此仓库使每个设计决策透明。 目录 什么是GAN? GAN最初是由Ian Goodfellow等人提出的。在一份名为“的开创性论文中。 甘斯是一个框架,2个模型(通常为神经网络),称为发电机(G)和鉴别器(d),玩游戏极大极小彼此抵靠。生成器正在尝试学习真实数据的分布,这是我们通常感兴趣的网络。在游戏中,生成器的目的是欺骗鉴别器“思考”它生成的数据是真实的。另一方面,鉴别器的目的是正确地区分生成的(伪)图像和来自某些数据集(例如MNIST)的真实图像。 设置 git clone https://github.com/gordicaleksa/py
2021-11-01 11:04:11 65.9MB python machine-learning deep-learning pytorch
1
Simd:使用以下SIMD的C ++图像处理和机器学习库:SSE,SSE2,SSE3,SSSE3,SSE4.1,SSE4.2,AVX,AVX2,AVX-512,VMX(Altivec)和VSX(Power7),NEON臂
2021-11-01 10:35:16 3.93MB c-plus-plus machine-learning arm neural-network
1
( Pattern Recognition and Machine Learning(完整答案).pdf
2021-10-31 01:06:01 1.42MB 习题答案
1
本文讨论了使用机器学习进行恶意软件分类的方法,问题和解决方案。 可以相信,被释放的恶意软件的数量可能会超过权威软件的释放。 由于恶意软件每年都会变得越来越复杂,因此需要从传统方法转变为使系统自动学习。 这里的主要重点是研究机器学习方法以及它们的检测和分类问题。 说明了特征选择和高假阳性问题,并提出了解决方案。 然后将操作码,n-gram操作码,基于图像的分类技术进行比较。 这些方法将有助于清除恶意软件并将其分类到其家族中。 与常规操作码和基于图像的分类器相比,使用n-gram操作码分类时基于准确性的结果更好,但是使用集成方法结合了这两种方法的优点,例如,过拟合和FPR较低,最终结果显示出分类精度更高和提供总体上更好的恶意软件分类。
2021-10-30 22:03:57 1.01MB Machine Learning Malware Detection
1
统计技术的创新引发了对跨种族和性别等类别的分布影响的担忧。 从理论上讲,随着统计技术的进步,分布结果取决于函数形式的变化如何与可观察特征的跨类别分布相互作用。 使用美国抵押贷款的详细管理数据,我们将传统 logit 和更复杂的机器学习违约预测模型的预测嵌入到一个简单的均衡信用模型中。 机器学习模型总体上略微增加了信贷供应,但增加了组间和组内的比率差异; 影响主要来自揭示默认值和可观察值之间结构关系的灵活性,而不是来自排除特征的三角测量。 我们预测黑人和西班牙裔借款人从新技术中获益的可能性要小得多。
2021-10-30 20:52:33 1.23MB machine learning credit
1
Sentiment_analysis_twitter 总览 分析表情符号在改善情感分析结果中的作用。 使用Twitter StreamAPI收集Twitter数据,并使用TF-IDF对推文进行矢量化处理。 使用矩阵创建一个正向和负向矢量,并使用余弦相似度来确定给定推文为正或负的程度。 通过转换unicode将Emoji表情合并到推文中,并重复该过程。 将过程分类提高了15%。 动机 了解人类的情感和理智向来是我的痴迷。 借助我的数据科学技能,我想了解人们如何在社交网络上表达情感,也就是情感分析。 作为一个狂热的Twitter用户,我知道限制少于140个字符如何迫使人们进行创新,以及表情符号如何
2021-10-30 10:41:59 34.11MB emoji nlp machine-learning tweets
1
脑电图机器学习挑战 EEG 机器学习挑战赛,Python 和 MATLAB(学者项目,2015) 本次挑战的目标包括根据 30 秒的 EEG 信号确定正确的睡眠阶段(W、R、N1、N2、N3); 数据集分别包含 10178 和 10087 个 EEG 用于训练和测试。 特征提取 首先,我编写了自己的Python脚本(参见: : ),在学校网络上应用分布式并行计算。 它将特征的计算时间除以超过 100。超过 100。 PyEEG / PyREM / MNE 感谢 PyEEG 库,我提取了这些特征: DFA:去趋势波动分析 PFD:Petrosian 分形维数 hjorth:Hjorth 移动性和复杂性 ApEn:近似熵 SampEn:样本熵(SampEn) hfd:樋口分形维数 费舍尔信息:费舍尔信息 SVD:SVD熵 bin power & bin power ratio:由
2021-10-30 10:11:33 78KB Python
1
美国运输模式 US-Transporation是我们数据集的名称,其中包含来自13个以上用户的传感器数据。 鉴于文献中缺乏针对TMD的通用基准,我们通过一个简单的Android应用程序收集了一大套属于不同主题的度量。 我们公开发布数据集,以便其他研究人员可以从中受益,以进行进一步的改进和提高研究的可重复性。 我们的数据集是由不同性别,年龄和职业的人构建的。 此外,我们不对应用程序的使用施加任何限制,因此,每个用户都记录自己习惯执行该操作的数据,以便评估现实世界的状况。 除了可下载的数据集之外,在此页面中,您还可以找到Python的代码以提取特征,并建立机器学习模型以进行预测。 您可以在找到有关数据集和我们的工作的更多信息。 如果对您的研究有所帮助,请在您的出版物中引用以下论文: @article{carpineti18, Author = {Claudia Carpineti,
1
RegNet 介绍 在这项工作中,我们提出了一种通过学习方法来解决非刚性图像配准的方法,而不是通过对预定义的相异性度量进行迭代优化来解决。 我们设计了卷积神经网络(CNN)架构,与所有其他工作相反,该架构直接从一对输入图像中估计位移矢量场(DVF)。 提议的RegNet使用大量的人工生成的DVF进行了训练,没有明确定义相异性度量标准,并且以多种比例集成了图像内容,从而为网络配备了上下文信息。 在测试时,与当前的迭代方法相反,非刚性配准是一次完成的。 引文 [1] , , , , , , 和 ,2019年。。 arXiv预印本arXiv:1908.10235。 [2] , , , , IvanaIšgum和Marius Staring ,2017年9月。 使用多尺度3D卷积神经网络进行非刚性图像配准。 在医学图像计算和计算机辅助干预国际会议上(第232-239页)。 湛
1