卷积神经网络的开发,用于音乐音频文件的多标签自动标记 初步步骤 下载mp3文件,然后使用以下方法将其组合:cat mp3.zip。*> single_mp3.zip从以下子文件夹中提取文件:find。 -mindepth 2型f -print -exec mv {}。 ; 介绍 通常,音乐音频文件可以随附与其内容有关的元数据,例如自由文本描述或标签。 事实证明,标签更有用,因为它们可以提供对音频文件的更直接描述,并且可以用于与音乐相关的推荐系统中的任务,如按性别分类,艺术家,乐器等。 由于并非所有音频文件都带有标签,因此需要自动标记。 广泛使用的一种方法涉及使用无监督特征学习,例如K均值,稀疏编码和Boltzmann机器。 在这些情况下,主要关注的是捕获低水平音乐结构,这些结构可用作某些分类器的输入。 另一种方法涉及受监督的方法,例如各种体系结构类型(MLP,CNN,RNN)的深层神经
1
隐马尔可夫模型词性标注器 概述 一种用于英语,印地语和中文的隐马尔可夫模型词性标记器。 训练数据被标记标记; 测试数据也会被标记化,标记器会将标记添加到测试数据中。 对看不见的单词加一个平滑处理。 培训和发展数据: 两个文件(一个英文,一个中文),带有单词/标签格式的带标签的训练数据,单词之间用空格分隔,每个句子换行。 两个文件(一个英文,一个中文),带有未标记的开发数据,单词之间用空格分隔,每个句子换行。 两个文件(一个英语,一个中文),带有单词/标签格式的带标签的开发数据,单词之间用空格分隔,每个句子用换行符表示,作为答案键。 程式 由两个程序组成:hmmlearn.py从训练数据中学习隐藏的马尔可夫模型,hmmdecode.py使用该模型标记新数据。 通过以下方式调用学习程序: python hmmlearn.py / path / to / input 参数是一个包含训练
2021-10-27 16:11:11 2.05MB Python
1
噪声标签生成和重新标记 在给定噪声率的情况下为数据集生成噪声标签,并使用重新标记算法对这些噪声标签进行重新标记 f1.test.py为all_tickets.csv数据集生成嘈杂的标签,使用“ body”作为特征,使用“ urgency”和“ ticket_type”作为预测标签。 我们假设'紧急'标签可能有一些嘈杂的标签,所以我们在'紧急'上添加了噪音。我们将48000数据拆分为火车数据集,将左侧的数据拆分为测试数据。在为'紧急'生成嘈杂标签's'之后,我们将' body。,'ticket_type'和's'到train_data.csv。在category.py中,我们生成重新标记的标签'relabel'并将其写入relabel.csv文件。除了门票数据集之外,我们还测试了其他数据集。 资料集 文件 结果文件夹 all_tickets.csv test.py 票 情绪训练 tes
2021-10-26 23:05:23 196.28MB Python
1
DeepLabCut是一个工具箱,用于无标记地估计执行各种任务的动物的姿势。 。 只要您可以看到(标记)要跟踪的内容,就可以使用此工具箱,因为它与动物和物体无关。 最新更新: :purple_heart: DeepLabCut支持多动物姿势估计(BETA版本,请给我们提供反馈! pip install deeplabcut==2.2b8 )。 :purple_heart: 我们有一个实时软件包! 快速pip install deeplabcut : pip install deeplabcut 您还需要tensorflow和wxPython参见 项目管理的管道和工作流程的概述。 有关循序渐进的用户指南,请阅读《! 为了更深入地
1
适用于日常办公数据处理场景,功能是比对2张工作表相同列号之间单元格内容的不同,并用颜色标记出两列(相同列号)之间包含不同内容的单元格,可以极大的减少人工比对的时间,支持2个工作簿内的工作表数据比对和单个工作簿内的2张工作表数据比对
GYTB, 用于 3DS 主菜单的超级简单定制标记 Homebrew GYTB用于 3 DS的超级简单定制徽章 Homebrew 。 只需在徽章文件夹中添加想要的64 x64 png,然后运行 Homebrew 将它们传输到你的主菜单。 将自动分割较大的图像( 比如 。64 x128 ) 。运行徽标街机
2021-10-22 18:30:10 1.4MB 开源
1
Ambar是一个开源文档搜索引擎,具有自动抓取,OCR,标记和实时全文搜索功能
2021-10-22 09:36:53 56.41MB Node.js开发-其它杂项
1
Neural (LSTM) version of the partial CRF model
2021-10-20 15:15:58 23KB Python开发-自然语言处理
1
CwsPosNerEntityRecognition 中英文Cws Pos Ner实体识别工具,使用CNN双向lstm和crf模型,并带有char嵌入。基于字向量的CNN池化双向BiLSTM与CRF模型的网络,可能一体化的完成中文和英文分词,词性标注,实体识别。主要包括原始文本数据,数据转换,训练脚本,预训练模型,可用于序列标注研究。注意:唯一需要实现的逻辑是将用户数据转化为序列模型。分词准确率约为93%,词性标注准确率约为90%,实体标注(在本样本上)约为85%。 提示 中文分词,词性标注,实体识别,在使用上述模型时,本质是就是标注问题!!!如果您第一次使用相关的模型,只需加上self.c
2021-10-18 22:10:58 52.4MB nlp tensorflow crf keras
1
该工具可以免安装,直接对图片中各个元素进行标记距离、直径,打标尺等功能。进行图像分析时十分好用
2021-10-16 16:36:55 21.72MB 图像标记工具
1