低等级多模式融合 Liu和Shen等人,这是“具有模态特定因素的高效低秩多模态融合”的存储库。 al。 ACL 2018。 依存关系 Python 2.7(现在实验性地支持Python 3.6+) torch=0.3.1 sklearn numpy 您可以通过python -m pip install -r requirements.txt安装库。 实验数据 实验的处理数据(CMU-MOSI,IEMOCAP,POM)可在此处下载: 要运行代码,您应该下载腌制的数据集并将其放在data目录中。 请注意,声学特征中可能存在NaN值,您可以将其替换为0。 训练模型 要运行代码进行实验(网格搜索),请使用脚本train_xxx.py 。 它们具有一些命令行参数,如下所示: `--run_id`: an user-specified unique ID to ensure that save
2021-11-05 09:54:51 1.69MB Python
1
MMSA 多模态情感分析中代码的 Pytorch 实现。 注意:我们强烈建议您首先浏览我们代码的整体结构。 如果您有任何疑问,请随时与我们联系。 支持模型 在这个框架中,我们支持以下方法: 类型 型号名称 从 单任务 单任务 —— 单任务 单任务 单任务 单任务 单任务 (无 CTC) 单任务 米萨 米萨 多任务 MLF_DNN MMSA 多任务 MTFN MMSA 多任务 MLMF MMSA 多任务 自我_MM 自我MM 结果 详细结果见results/result-stat.md 用法 克隆代码 克隆这个 repo 并安装需求。 git clone https://github.com/thuiar/MMSA cd MMSA pip install -r requirements.txt 数据集和预训练的 berts 从以下链接下载数据集特征和
1
CMU-Multimodal SDK版本1.2.0(mmsdk) CMU-Multimodal SDK提供了一些工具,可以轻松加载知名的多峰数据集并快速构建神经多峰深度模型。 因此,SDK包含两个模块:1)mmdatasdk:使用计算序列下载和处理多峰数据集的模块。 2)mmmodelsdk:利用复杂神经模型以及用于构建新模型的层的工具。 先前论文中的融合模型将在这里发布。 这里的所有数据集都是使用SDK处理的(甚至是使用SDK V0的old_processed_data文件夹)。 您可以通过在数据集上调用以下函数来获取项目中使用的计算序列的引用: >> > mydataset . bib_citations ( open ( 'mydataset.bib' , 'w' )) >> > mycompseq . bib_citations ( open ( 'mycompseq.bib
2021-09-10 10:51:12 307KB sdk dataset alignment multimodal-datasets
1
《A Partial Intensity Invariant Feature Descriptor for multimodal retinal image registration》论文的matlab源代码
2021-09-01 15:58:57 20KB Matlab; multimodal image registration
1
上传者不拥有讲义的原始版权。所有版权归属CMU。 该文件集是CMU开设的11-777课程,名为multimodal machine learning,每年fall学期开设。 本讲义是2019 Fall的版本。 课程介绍: Description Multimodal machine learning (MMML) is a vibrant multi-disciplinary research field which addresses some of the original goals of artificial intelligence by integrating and modeling multiple communicative modalities, including linguistic, acoustic and visual messages. With the initial research on audio-visual speech recognition and more recently with language vision projects such as image and video captioning, this research field brings some unique challenges for multimodal researchers given the heterogeneity of the data and the contingency often found between modalities. The course will present the fundamental mathematical concepts in machine learning and deep learning relevant to the five main challenges in multimodal machine learning: (1) multimodal representation learning, (2) translation mapping, (3) modality alignment, (4) multimodal fusion and (5) co-learning. These include, but not limited to, multimodal auto-encoder, deep canonical correlation analysis, multi-kernel learning, attention models and multimodal recurrent neural networks. We will also review recent papers describing state-of-the-art probabilistic models and computational algorithms for MMML and discuss the current and upcoming challenges. The course will discuss many of the recent applications of MMML including multimodal affect recognition, image and video captioning and cross-modal multimedia retrieval. This is a graduate course designed primarily for PhD and research master students at LTI, MLD, CSD, HCII and RI; others, for example (undergraduate) students of CS or from professional master programs, are advised to seek prior permission of the instructor. It is required for students to have taken an introduction machine learning course such as 10-401, 10-601, 10-701, 11-663, 11-441, 11-641 or 11-741. Prior knowledge of deep learning is recommended.
2021-07-13 15:10:01 89.93MB multimodal CMU
1
Multimodal Sentiment Analysis (Socio-Affective Computing, Book 8) by Soujanya Poria and Amir Hussain This latest volume in the series, Socio-Affective Computing, presents a set of novel approaches to analyze opinionated videos and to extract sentiments and emotions.
2021-06-16 20:59:28 3.17MB 分析
1
测试函数的官方详细介绍,因为自己找了很久才找到,所以放上来方便大家看
1
自从2010年以来,深度学习技术对语音,语言,视觉等子领域的推动,在语言和视觉跨模态交叉学科领域我们也取得了很多激动人心的进展,包括跨语言与图像的理解、推理和生成。多模态智能旨在融合多种模态的信息进行处理实现智能应用,在5G时代将会是重要的热点技术之一。最近IEEE Fellow何晓东和邓力等作者撰写关于多模态智能的综述论文《Multimodal Intelligence: Representation Learning, Information Fusion, and Applications》,详述了多模态智能研究进展,涵盖259篇参考文献,本文从学习多模态表示、多模态信号在不同层次上的融合以及多模态应用三个新角度对多模态深度学习的最新研究成果进行了综合分析。
2021-04-01 20:45:54 240KB multimodal representation fusion
1
多模态配准方法和应用综述 武汉大学电子信息学院
2021-03-30 14:22:42 22.68MB 多模态 配准 综述
1
对于面向服务的软件开发,Web服务搜索一直是一个严重的问题。 面临的挑战是如何针对给定的开发任务有效地找到合适的Web服务。 在开发用于搜索服务的技术或系统方面已经进行了许多努力。 尽管在某些情况下有效,但现有技术并未形成可供公众使用的系统; 或基于一种查询模式-关键字查询,无法准确提供匹配的服务。 在本文中,我们介绍了提议的多模式查询搜索,用户可以在其中使用关键字和文件作为查询或自定义查询。 多模式查询基于一种创新的相似性度量方法,该方法同时包含Web服务的语义信息和结构信息。 我们的实验和测试案例验证了该方法的有效性。 与替代系统Seekda相比,它可以通过关键字查询获得更高的搜索准确性(匹配率是Seekda的2-4倍)。 自定义搜索可以达到100个前3个匹配率,而Seekda在大多数情况下使用关键字会失败。
1