带有元数据的文本的最小监督分类 该项目提供了一个对文本与元数据进行分类的弱监督框架。 安装 为了进行培训,强烈建议您使用GPU。 凯拉斯 该代码基于Keras库。 您可以找到安装说明。 相依性 该代码是用Python 3.6编写的。 依赖关系总结在文件requirements.txt 。 您可以像这样安装它们: pip3 install -r requirements.txt 快速开始 要在我们的论文中再现结果,您需要首先下载。 我们的论文中使用了五个数据集。 不幸的是,由于我们对数据提供者的承诺,因此无法发布GitHub-Sec数据集。 其他四个数据集可用。 解压缩下载的文件后,您可以分别看到对应于这四个数据集的四个文件夹。 数据集 文件夹名称 #文件 #班 类名(该类中的#Repository) bio/ 876 10 序列分析(210),基因组分析(176),基因表达(6
1
Sublime Text 2 中文包,运行软件,依次点击菜单Preferneces -> Browse Packages ,在打开的目录的父目录中有一个Packages,把下载下来的压缩包中的Default文件夹放到那里面就可以了。
2023-04-13 20:22:14 9KB Sublime Text 2 中文包
1
版本21.13 更新日期Feb 2022 详细解释了Innovus中各指令和参数
2023-04-10 15:47:56 60.07MB Innovus P&R
1
提取与抽象文本摘要方法:分析 文本摘要解决了将信息压缩为更紧凑形式的问题,同时又将重要信息保留在文本中。 自动文本摘要的方法分为两个主要类别:提取性和抽象性。 提取摘要的常见方法包括根据句子的相关性,选择最能代表原始文本表达信息的最具代表性的句子。 一种流行的抽象文本摘要方法是使用编码器-解码器结构,该结构会生成数据的潜在因子表示形式,并将其解码以生成摘要。 该项目的目的是分析和比较两种方法在专门用于科学文献时的有效性。 动机 我从事此项目的动力来自个人经验。 作为一名大学学生,我经常会遇到大量与我的兴趣相关的科学论文和研究文章,但我没有时间阅读所有内容。 我希望有一种方法能够对论文的主要思想进行汇总,而又不会显着减少重要内容。 文本摘要是一种广泛实施的算法,但是我想探索特别适用于科学写作的不同文本摘要方法。 介绍 自动文本摘要是使用信息优先级排序系统缩短文本文档的过程。 生成摘要的技术会
2023-04-06 16:24:21 1.85MB JupyterNotebook
1
2016-ccf-data-mining-competition text classfication 大数据精准营销中搜狗用户画像挖掘 rank61/880 2016-ccf-data-mining-competition 大数据精准营销中搜狗用户画像挖掘 竞赛简介 在现代广告投放系统中,多层级成体系的用户画像构建算法是实现精准广告投放的基础技术之一。其中,基于人口属性的广告定向技术是普遍适用于品牌展示广告和精准竞价广告的关键性技术。人口属性包括自然人的性别、年龄、学历等基本属性。 在搜索竞价广告系统中,用户通过在搜索引擎输入具体的查询词来获取相关信息。因此,用户的历史查询词与用户的基本属性及潜在需求有密切的关系。 举例如下: 1、 年龄在19岁至23岁区间的自然人会有较多的搜索行为与大学生活、社交等主题有关 2、 男性相比女性会在军事、汽车等主题有更多的搜索行为 3、 高学历人群会更
2023-04-05 15:30:47 1.88MB Python
1
WebGL文字 将文字写到WebGL画布上 :fire: 安装 使用安装: npm install webgl-text 例 该示例使用 ,但是此库可与任何webgl canvas一起使用。 import React , { Component } from 'react' ; import { autobind } from 'core-decorators' ; import WebGLCanvas from 'webgl-canvas' ; import WebGLText from 'webgl-text' ; import provideDimensions from 'provide-d
2023-03-31 09:16:01 91KB font webgl typescript canvas
1
用Load方法在窗体上添加一个文本程序(VB6.0源代码编写),每点击一次就增加一个Text控件. Load Text1(i) Text1(i).Width = 800 Text1(i).Height = 300 Text1(i).Top = 200 Text1(i).Left = Text1(i - 1).Left + 1000 Text1(i).Visible = True i = i + 1
1
Describable Textures 纹理图像数据.gz
2023-03-26 22:06:21 596.28MB Describable Text
1
颜色分类leetcode 用于文本的 Grad-CAM 这是文本分类模型的实现。 使用的模型是用于文本分类的 1D-CNN,在 . 使用的数据是重新精炼的版本,其重新标记以进行二元分类。 输入功能是 word2vec 的精简版。 它特别需要 python>=3, tensorflow>=1.4,<2>>> pip3 install -r requirements.txt 特征 在训练之前,它需要 word2vec 二进制文件。 通过word2vec.sh下载,会下载到 word2vec/ 目录下。 >>> ./word2vec.sh 所有 word2vec 二进制文件都必须位于 word2vec/ 目录中。 word2vec/GoogleNews-vectors-negative300-SLIM.bin 训练时会自动下载。 训练 usage: train.py [-h] [--epoch EPOCH] [--batch-size BATCH_SIZE] [--lea
2023-03-21 11:32:51 119KB 系统开源
1
Chinese-Text-Classification-Pytorch-master。 数据齐全,说明文档详细。点击即用! # 训练并测试: # TextCNN python run.py --model TextCNN # TextRNN python run.py --model TextRNN # TextRNN_Att python run.py --model TextRNN_Att # TextRCNN python run.py --model TextRCNN # FastText, embedding层是随机初始化的 python run.py --model FastText --embedding random # DPCNN python run.py --model DPCNN # Transformer python run.py --model Transformer
2023-03-20 10:32:05 15.94MB Chinese-Text-Cla
1