高音数据集对性别分类的自然语言处理NLP 借助自然语言处理NLP,我可以从Tweeter数据集中识别性别分类 该文件包含: 加载数据集: 该数据集用于训练CrowdFlower AI性别预测器。 您可以在此处阅读有关该项目的所有信息。 要求参与者仅查看Twitter的个人资料并判断用户是男性,女性还是品牌(非个人)。 数据集包含20,000行,每个行都有一个用户名,一条随机鸣叫,帐户个人资料和图像,位置,甚至是链接和侧边栏颜色。 数据集来自这里: : 灵感 您可以尝试使用此数据集回答以下几个问题: 推文和个人资料中的单词如何预测用户的性别? 用什么词可以强烈预测男性或女性性别? 风格因素(例如链接颜色和侧边栏颜色)如何很好地预测用户的性别? 数据 数据集包含以下字段: unitid:用户的唯一ID _golden:模型的黄金标准中是否包含用户; 对或错 unitsta
2022-11-11 19:02:20 3.03MB JupyterNotebook
1
NLP(ICL)课程:幽默检测 由于数据预处理和训练例程的差异,原始笔记本被复制了两次。 1个 第一个笔记本approach1_pretrained_roberta.ipynb包含方法1的最终RoBERTa模型,以及针对不同功能和头部架构的测试。 使用以下链接 或笔记本顶部的徽章以在Google Colab中查看。 可在以下位置获得经过训练的模型(〜0.5 GB): ://drive.google.com/file/d/1NSLn2pUc4TucEjXB4Se4w29YEqU2xH1i/view usp sharing 2个 第二个笔记本hyperparams_and_approach2.ipynb包括方法1的基本BERT植入以及超参数调整。 与此笔记本一起,还提供了关注方法2的BiLSTM。 使用以下链接 或笔记本顶部的徽章以在Google Colab中查看。 报告 项目报告已上
2022-11-10 00:16:50 93KB JupyterNotebook
1
NLP-Yelp审查:第一个NLP项目
2022-11-09 22:29:09 36KB JupyterNotebook
1
社会距离检测 这是我尝试检测视频中的社交距离。
2022-11-08 16:45:41 5.01MB JupyterNotebook
1
信用卡批准
2022-11-08 00:02:56 1.36MB JupyterNotebook
1
预测信用卡批准 项目预测信用卡批准 项目简介 商业银行收到许多信用卡申请。 例如,其中许多人由于各种原因而被拒绝,例如高贷款余额,低收入水平或对个人信用报告的查询过多。 手动分析这些应用程序很普通,容易出错,而且很耗时(而且时间就是金钱!)。 幸运的是,这项任务可以借助机器学习的力量实现自动化,并且如今几乎所有的商业银行都可以做到这一点。 在这个项目中,您将像真正的银行一样,使用机器学习技术构建一个自动的信用卡批准预测器。 该项目的建议先决条件是: scikit-learn的监督学习 熊猫基金会 该项目中使用的数据集是UCI机器学习存储库中的信用卡批准数据集。 项目任务 信用卡申请 检查应用程序 处理缺失值(第一部分) 处理缺失值(第二部分) 处理缺失值(第三部分) 预处理数据(第一部分) 将数据集分为训练集和测试集 预处理数据(第二部分) 将逻辑回归模型拟合到火车上 进行
2022-11-07 20:41:16 19KB JupyterNotebook
1
nntimeseries 该存储库提供了论文的代码,以及在keras模型上运行网格serach的通用代码。 文件'nnts / models / {CNN,LSTM,LSTM2,LR,SOCNN} .py'提供了用于测试各个模型的代码,最后一个实现了建议的重要性偏移CNN,而LSTM2实现了多层LSTM。 基本用法 每个模型文件都可以作为脚本运行,例如 python ./CNN.py --dataset=artificial #默认保存文件 python ./SOCNN.py --dataset=household --save_file=results/household_0.pkl 可以在上述每个文件中指定用于网格搜索的参数。 每个文件都定义了一个模型类,可以将其导入并在外部数据集上使用,如example.ipynb文件所示。 该存储库支持在人工多元嘈杂AR时间序列和家庭用
2022-11-07 15:54:53 22.48MB JupyterNotebook
1
DataCamp项目 在这里,我介绍一些我的项目 Python 项目 描述 深度学习的ASL识别 使用CNN对美国手语的图像进行分类-TensorFlow / Keras 根据音频数据对歌曲类型进行分类 使用PCA简化功能并对功能进行决策树分类和Logistic回归分类-Scikitlearn,pandas,Matplotlib 按成分比较化妆品 通过t-SNE -bokeh / Scikitlearn使用单词标记和降维 Semmelweis博士和洗手的发现 使用熊猫进行数据分析并使用Matplotlib进行可视化-Matplotlib / pandas 探索乐高67年 乐高数据的数据探索性分析-Pandas / Matplotlib 探索比特币加密货币市场 来自JSON API的比特币数据的数据探索性分析-Pandas / Scikitlearn 探索Linux的发展 Li
2022-11-07 11:55:12 82.34MB JupyterNotebook
1
假新闻 使用自然语言处理技术检测虚假新闻
2022-11-05 00:10:06 2.26MB JupyterNotebook
1