利用时间稀疏编码实现自然数据的非线性解耦

作者: | David Klindt | Lukas Schott | Yash Sharma | Ivan Ustyuzhaninov | Wieland Brendel | Matthias Bethge | Dylan Paiton |

摘要:我们构建了一个无监督学习模型,实现了自然视频中潜在变异因素的非线性解耦。以前的工作表明,如果环境中除了几个因素之外的所有因素在任何时间点都保持不变,表示可以解开。因此,针对这个问题提出的算法只在具有这种确切属性的精心构建的数据集上进行了测试,因此不清楚它们是否会转移到自然场景中。在这里,我们提供的证据表明,分段的自然电影中的目标经历的转变通常幅度很小,偶尔会有大的跳跃,这是时间稀疏分布的特征。我们利用这一发现并提出了SlowVAE,这是一种无监督表示学习模型,它使用时间相邻观测的稀疏先验来分离生成因素,而不需要对变化因素的数量做出任何假设。我们提供了可识别性的证明,并表明该模型可靠地学习了几个已建立的基准数据集上的解耦表示,通常超过了当前的最先进水平。此外,我们还展示了向具有自然动态、Natural Sprite和Kitti蒙版的视频数据集的可转移性,我们将其作为指导解耦研究向更自然的数据领域发展的基准。

论文地址

https://arxiv.org/abs/2007.10930v1

下载地址

https://arxiv.org/pdf/2007.10930v1.pdf

全部源码

https://github.com/bethgelab/slow_disentanglement 类型: pytorch

表征学习无监督表征学习

相关推荐

暂无评论

微信扫一扫,分享到朋友圈

利用时间稀疏编码实现自然数据的非线性解耦