文本数据的序列性使得RNN的循环迭代模式成为显而易见的选择,但如果我们把文本编码后的结果(Batch×sequence×embedding)看做一张图片,那么通过卷积的方式提取文本信息也理所当然。这就是TextCNN算法的初衷。
TextCNN是一种高效的文本卷积算法,其可以捕捉相邻文本间的局部结构关系,同时卷积的特性又使得其支持并行操作。该算法在文本分类问题上的效果与TextRNN算法相当,因此被广泛使用。
那么如何从图片编码的角度,来合理的看待文本数据编码呢?这里提供两种视角:
视角1: 宽度为1的长条状图片,其embedding的尺寸可视为图片的channel大小。
对此,可直接应用1
2022-05-11 23:10:41
237KB
ex
ext
卷积
1