文本多标签分类-BERT-Tf2.0 该存储库包含针对多标签文本分类的预训练BERT模型的Tensorflow2.0实现。 脚步 从下载数据 借助download_bert.sh下载预训练的模型权重 运行train_bert.py 训练损失和准确性 测试损失和准确性
1
推特航空公司 来自美国主要航空公司客户的推特的情绪分析。 可以在以下博客文章中找到该项目的描述:
2022-04-08 21:43:24 1.09MB nlp text-classification scikit-learn keras
1
简介 1、本项目是在tensorflow版本1.14.0的基础上做的训练和测试。 2、本项目为中文的文本情感分析,为多文本分类,一共3个标签:1、0、-1,分别表示正面、中面和负面的情感。 3、欢迎大家联系我 4、albert_small_zh_google对应的百度云下载地址: 链接: 提取码:wuxw 使用方法 1、准备数据 数据格式为:sentiment_analysis_albert/data/sa_test.csv 2、参数设置 参考脚本 hyperparameters.py,直接修改里面的数值即可。 3、训练 python train.py 4、推理 python predict.py 知乎代码解读
1
cnn_text_classification Tensorflow中的Kim的。 要求 的Python 3 Tensorflow> 1.0 脾气暴躁的 纳尔特克 tqdm 资料格式 我们需要2个文件,一个用于训练,一个用于验证。数据的格式很容易,文件中的每一行都有两列,第一列是标签,第二列是文本。它们用'\ t'分段。 数据格式示例 1 for a long time the film succeeds with its dark , delicate treatment of these characters and its unerring respect for them . 0 the film seems all but destined to pop up on a television screen in the background of a scene in a
1
LSTM文本分类情感分析 使用LSTM进行文本分类/情感分析。使用LSTM对数据执行文本分类/情感分析。这些推文已从Twitter撤出,然后进行了手动标记。列: 地点 鸣叫于 原始推文 标签
2022-03-04 22:50:53 4.77MB Python
1
简介 1、本项目是在tensorflow版本1.14.0的基础上做的训练和测试。 2、本项目为中文的多标签文本分类。 3、欢迎大家联系我 4、albert_small_zh_google对应的百度云下载地址: 链接: 提取码:wuxw 使用方法 1、准备数据 数据格式为:classifier_multi_label_textcnn/data/test_onehot.csv 2、参数设置 参考脚本 hyperparameters.py,直接修改里面的数值即可。 3、训练 python train.py 4、预测 python predict.py 知乎代码解读
1
介绍 再现EMNLP '14论文 作者 /
2022-02-24 12:26:50 55.74MB nlp deep-learning text-classification cnn
1
CLUEDatasetSearch 中英文NLP数据集。可以点击。 您可以通过贡献你的力量。上传五个或以上数据集信息并审核通过后,该同学可以作为项目贡献者,并显示出来。 如果数据集有问题,欢迎提出问题。 所有数据集均压缩网络,只做整理供大家提取方便,如果有缺陷等问题,请及时联系我们删除。 内尔 ID 标题 更新日期 数据集提供者 许可 说明 关键字 类别 论文地址 备注 1个 2017年5月 北京极目云健康科技有限公司 数据统计其云医院平台的真实电子病历数据,共计800条(个别病人单次就诊记录),经脱敏处理 电子病历 命名实体识别 \ 中文 2 2018年 医渡云(北京)技术有限公司 CCKS2018的电子病历命名实体识别的评估任务提供了600份标注好的电子病历文本,共需识别含解剖部位,独立症状,症状描述,手术和药物五类实体 电子病历 命名实体识别 \ 中文 3 \ MSRA 数据抽样MSRA,标注形式为BIO,共有46365条语料 姆斯拉 命名实体识别 \ 中文 4 1998年1月 人民日报 数据来源为98年人民日报,标注形式为BIO,共有23061条语料 98人民日报 命名实体识
2022-02-24 08:45:26 695KB nlp qa sentiment-analysis text-classification
1
此代码从我们的团队“carl and snow”生成了 Tradeshift 文本分类的第一名解决方案 它主要包括两种模型: 使用 Xgboost 和 sklearn 的两阶段模型。 在线逻辑回归。 依赖关系 Python 2.7 pypy 2.4.0 Scikit learn-0.15.2 numpy 1.7.1 scipy 0.11.0 Xgboost 0.3 要生成解决方案: 设置所有依赖 更改 run.py 中的数据目录 更改 ./src/xgb_classifier.py 中的 xgboost 包装器路径 Python运行.py 最佳单解:xgb-part1-d18-e0.09-min6-tree120-xgb_base.csv private LB 0.0044595 最佳集成解决方案:best-solution.csv 私有 LB 0.0043324(第一名)
2022-02-12 21:17:09 508KB Python
1
Scikit学习教程 一组用于scikit学习自学习的示例。 工作正在进行中... 本教程正在创建中。 还没结束 如何衡量模型性能 标准指标精度,召回率,F1指标- 该示例显示了如何计算基本分类器度量值,例如精度,召回率,f1 文件: 精确召回曲线 示例说明了如何在理想的随机情况下解释精确调用曲线。 如果两个模型的曲线看起来相似该怎么办。 文件: 开发环境 python> 3.6 吹牛 sklearn> 0.21.3
2022-01-31 03:47:07 35.64MB tutorial text-classification scikit-learn roc-curve
1