适用人群
新手小白:只需具备基础的Python语法知识,无需深度学习背景。
AI入门者:希望系统了解多模态AI、谣言检测等实际工程流程的同学。
工程实践者:需要可复现、可扩展的多模态AI项目代码作为参考的开发者。
使用场景
自学入门:从最基础的单模态模型(如CNN、TextCNN、BERT等)到多模态融合(早期拼接、注意力、投票等),循序渐进,适合零基础到进阶学习。
课程实验:可作为高校AI课程、数据科学课程的实验项目。
工程参考:为实际多模态项目开发提供结构化、模块化的代码范例。
目录结构
img:图像模态(2D-CNN)建模与实验
txt:文本模态(FastText、TextCNN、Transformer等)建模与实验
html_mod:网页模态(HTML文本、BERT等)建模与实验
fusion:多模态融合(特征拼接、注意力、投票等)全流程实现与对比
其他说明
路径问题:由于不同操作系统或解压方式,部分代码中的数据/模型路径可能需根据实际情况手动调整。
依赖环境:建议参考各子文件夹下的requirements.txt或README.md,提前安装所需依赖。
数据集:部分实验需下载MR2等公开数据集,详见各期说明或README指引。
完整复现:所有代码均可独立运行,支持超参数调优、实验结果可视化等功能。
1