基于视觉和语言的跨媒体问答与推理是人工智能领域的研究热点之一,其目的是基于给定的视觉内容和相关问题,模型能够返回正确的答案。
2021-03-17 22:13:51 1.69MB 跨媒体问答
1