跨语言字幕
迄今为止,图像字幕大多以英语进行探索,因为大多数可用的数据集都使用这种语言。 但是,图像字幕的应用不应受到语言的限制。 跨语言图像字幕的研究对于地球上不会说英语的大量人口至关重要。 我们正在开发新颖的算法,以最小的标记工作量就能学习除英语以外的目标语言的图像字幕模型。
代码
数据集
Flickr8k-cn
Flickr30k-cn
中国可可
火车
值
测试
火车
值
测试
火车
值
测试
图片
6,000
1,000
1,000
29,783
1,000
1,000
18,341
1,000
1,000
人工注释中文句子
30,000
5,000
5,000
--
--
--
20,065
1,100
1,053
机器翻译中文句子
30,000
5,000
--
148,915
5,000
--
91,758
5,004
2022-03-20 21:40:12
1.88MB
1