Kaggle TalkingData AdTracking欺诈检测挑战 第48解决方案,竞赛链接: : :笔记本电脑版本 :脚本版本,在私有LB上大约为0.9824 blending.ipynb:混合历史模型,这使我提高了约0.0002 FTRL.ipynb:由于时间有限,没有尝试过 在完整的训练数据上运行此代码需要96GB RAM和128G交换空间 一些解决方案作为参考 火车日志 请参阅
2022-06-03 04:40:17 23KB JupyterNotebook
1
talkingdata-adtracking欺诈检测 Kaggle比赛(前8%) 数据集的前景 我们的目标是预测用户点击广告后是否会下载该APP。 用户可能欺诈性地点击广告只是为了赚钱。 特征: IP:用户所在的地区或国家与他或她是否欺诈性地点击广告有关。 (一个)。 欺诈用户可以使用同一IP多次单击同一AD。 (b)。 但是,同一公司中的家庭或人可以共享同一IP,这意味着同一IP可以包含常规用户和欺诈用户。 按设备,操作系统,渠道等分组可以进一步区分。 APP :(可以按IP使用分组)用于营销的应用ID 设备:用户手机的设备类型ID(例如,iphone 6 plus,iphone 7,华为mate 7等) 操作系统:(可以按IP分组使用)用户手机的操作系统版本ID 频道:移动广告发布者的频道ID click_time: (一个)。 普通用户和欺诈用户在单击AD时会有
2022-06-03 04:31:20 68KB JupyterNotebook
1
增值税 实施虚拟对抗训练。 安装 pip install git+git://github.com/aikindergarten/vat.git 如何使用 ip ... 4 + 2 == 42 False 参考 文件 代码
2022-06-02 19:58:59 25KB JupyterNotebook
1
情感分析(Python3) 目录 项目描述 挑战包括将Yelp,IMDB和Amazon的产品评论归为正面还是负面; 给定评论评论的文本作为输入。 本练习的重点是机器学习中称为自然语言处理的一个领域。 目的是根据文字预测情绪-陈述背后的情感意图。 例如,句子:“这部电影太可怕了!” 拥有负面情绪,而“喜欢这部电影杰作”则具有正面情绪。 为了简化任务,我们将情感视为二进制:标签1表示句子具有正面情绪,标签0表示句子具有负面情绪。 数据集 数据集分为三个文件,代表三个不同的来源-Amazon,Yelp和IMDB。 任务是使用Yelp和IMDB数据作为训练集构建情感分析模型,并在Amazon数据上测试模型的性能。 每个文件都可以在输入目录中找到,并且包含1000行数据。 每行包含一个句子,一个制表符和一个标签-0或1。 技术领域 请参阅requirements.txt文件以获取完整的Pyth
2022-06-02 11:18:49 174KB JupyterNotebook
1
图像字幕:这是一个基于LSTM和编码器解码器体系结构的ML模型,可预测输入图像的字幕
2022-06-02 10:37:46 119.17MB JupyterNotebook
1
麦克蒙 micmon是一个由ML支持的库,用于检测来自文件或音频输入的音频流中的声音。 其开发的用例是创建了一个自建的婴儿监视器,以通过RaspberryPi + USB麦克风检测我的新生儿的哭声,但如果与便携式计算机一起使用,它应该足以检测任何类型的噪音或音频。训练有素的模型。 它通过将音频流分成短段进行工作,为每个段计算FFT和频谱仓,并使用此类频谱数据来训练模型以检测音频。 它适合于声音足够大以至于可以从背景中脱颖而出(例如,可以很好地检测到闹钟的声音,而不是飞蚊子的声音),而声音的大小要比块的大小长得多(非常短)声音将在音频块的频谱中留下很小的痕迹),甚至更好,如果它们的频率带宽与其他声音没有太多重叠(这很容易检测到婴儿的哭声,因为他/她的声音具有音调高于您的音调,但可能无法检测到同一年龄段的两名成年男子的声音在频谱特征上的差异)。 相反,如果您尝试使用它来检测语音,它的性能将不
2022-06-01 08:50:39 187KB JupyterNotebook
1
自然语言处理和情感分析
2022-05-31 17:30:43 1.73MB JupyterNotebook
1
Cancer_and_air_quality-
2022-05-31 05:13:53 121KB JupyterNotebook
1
空气质量预测 现在是德里的冬季,所以科迪决定去报摊散步,一见到报纸上德里的空气质量指数就感到惊讶。因此,他决定收集不同位置的空气样本,然后将这些样本带到他的实验室,在那里他提取了所收集空气的五个特征,这些特征可用于预测空气质量指数并将其与空气质量指数相结合。报纸。为您提供了Cody收集的数据,您的工作是设计一个机器学习模型,该模型可以让Cody提取的特征可以预测空气质量。
2022-05-30 17:19:42 125KB JupyterNotebook
1
K最近邻项目 介绍 K最近邻居是一种简单的算法,可以存储所有可用案例并根据相似性度量对新案例进行分类。 在这个项目中,我使用了人工数据集,并用更好的K值改进了模型。 安装 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from sklearn.preprocessing import StandardScaler from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier from sklearn.metrics import classification_report,confusion_matrix f
2022-05-30 17:07:07 1.5MB JupyterNotebook
1