文字分类器 此仓库是基于Tensorflow2.3的文本分类任务,分别支持: 随机初始单词嵌入+ TextCNN 随机初始词嵌入+注意+ TextCNN 随机初始单词嵌入+ TextRCNN Word2Vec + TextCNN Word2Vec +注意+ TextCNN Word2Vec + TextRCNN 伯特嵌入(没有微调,直接取向量)+ TextCNN Bert嵌入(没有微调,直接取向量)+ TextRCNN 代码支持二分类和多分类,此项目基于爬取的游戏评论正是个二元的情感分类作为演示。 环境 python 3.6.7 张量流== 2.3.0 gensim == 3.8.3 杰巴== 0.42.1 sklearn == 0.0 其他环境见requirements.txt 更新历史 日期 版本 描述 2018-12-01 v1.0.0 初始仓库 2020-10-
2021-12-19 13:33:47 65.45MB word2vec textcnn textrcnn tensorflow2
1
怎样确定用例的粒度?(用例规模的大小) 用例的粒度可大可小,一般一个系统控制在20个左右,但没有严格规定 用例是系统级的、抽象的描述,不是细化的(考虑的是“做什么what”,而不是“怎样做how”) 对复杂的系统可以划分为若干子系统处理,然后再为子系统分别创建用例
2021-12-17 15:21:50 5.17MB uml
1
这个jar包是重新编译过后的 可以使用useSmart粒度分词
2021-12-14 14:38:58 1.11MB IK分词
1
提出了一种基于多尺度特征融合的细粒度图像分类方法。通过运用特征金字塔结构对不同层次的特征进行尺度变换,再进行信息融合;之后筛选其中包含细节特征最多的前三个区域图,将其与图像的全局特征共同作用以判断图片所属的子类类别。在公开的细粒度数据集CUB-200-2011、Stanford Dogs上进行了实验,得到的分类精度分别为85.7%和83.5%。实验结果表明该方法对于精细化物体分类具有一定的优越性。
2021-12-11 15:55:18 1.66MB 图像处理 细粒度图 多尺度特 特征金字
1
C#学习资料源码工具
2021-12-10 15:02:25 3.21MB C#
机器学习的双向注意力流 这是的原始实现。 可找到提交的CodaLab工作表。 对于TensorFlow v1.2兼容版本,请参阅分支。 如有问题和建议,请联系 ( )。 0.要求 一般 Python(已在3.5.2。上验证。Python2已报告问题!) 解压缩,wget(仅用于运行download.sh ) Python包 tensorflow(深度学习库,仅适用于r0.11) nltk(NLP工具,已在3.2.1上验证) tqdm(进度条,已在4.7.4上验证) jinja2(用于虚假化;如果只培训和测试,则不需要) 1.预处理 首先,准备数据。 下载SQuAD数据以及GloVe和nltk语料库(〜850 MB,这会将文件下载到$HOME/data ): chmod +x download.sh; ./download.sh 其次,预处理Stanford QA数据集(以及GloVe向量),并将其保存在$PWD/data/squad (约5分钟): python -m squad.prepro 2.培训 该模型具有〜2.5M参数。 该模型由NVidia Titan
2021-12-07 19:10:35 137KB nlp tensorflow question-answering squad
1
主要用于方面级的细粒度文本情感分析,是全球性的细粒度情感分析赛事,16年增加了中文情感分析,数据集格式为.XML,实际使用还需要进行预处理
1
计算浇注料安德森公式的粒径分布,英文版
2021-11-25 01:31:34 4.43MB 材料 粒度计算 粒径分布 安德森公式
1
共包含6大类20个细粒度要素的情感倾向.数据集分为训练、验证、测试A与测试B四部分。数据集中的评价对象按照粒度不同划分为两个层次,层次一为粗粒度的评价对象,例如评论文本中涉及的服务、位置等要素;层次二为细粒度的情感对象,例如“服务”属性中的“服务人员态度”、“排队等候时间”等细粒度要素。每个细粒度要素的情感倾向有四种状态:正向、中性、负向、未提及
2021-11-10 16:07:48 50.39MB 细粒度感情分
1
本文研究的数据集来源于全球 AI 挑战赛(AI Challenger)的第二个赛道——细粒度用户评论情感分析。该比赛要求参赛者对互联网平台上用户的在线评论文本进行分析并判断文中是否提及 6 个目标的 20 个方面。如果方面被提及,则需要判断该方面所对应的情感极性。接下来通过几张表来详细地介绍数据集的情况。
1