告密者:用于长序列时间序列预测的超越高效变压器(AAAI'21最佳论文)
这是以下文章中Informer的原始Pytorch实现: 。 特别感谢 Jieqi Peng @ 建立此存储库。
:triangular_flag: 新闻(2021年2月22日):我们提供了供友好使用。
:triangular_flag: 新闻(2021年2月8日):我们的线人论文被授予! 我们将继续进行这方面的研究,并对此仓库进行更新。 如果您发现我们的工作对您有帮助,请加注该回购并引用我们的论文。
图1. Informer的体系结构。
稀疏注意
自我注意分数形成一个长尾分布,其中“活动”查询位于“头”分数中,而“懒惰”查询位于“尾”区域中。 我们设计了ProbSparse Attention以选择“活动”查询而不是“惰性”查询。 带有Top-u查询的ProbSparse Attention通过概率分布形成了一个稀疏的Transformer。 Why not us
1