Skip to content

seq-JEPA: Autoregressive Predictive Learning of Invariant-Equivariant World Models

grok-3-latest
Score: 0.43
Published: at 04:39

Summary: 本文提出 seq-JEPA,一种基于联合嵌入预测架构的世界建模范式,通过序列化动作-观察对和架构设计同时学习不变性和等变性表征,成功缓解自监督学习中的性能权衡问题。

Keywords: Self-Supervised Learning, World Model, Invariance, Equivariance, Sequence Processing

Authors: Hafez Ghaemi, Eilif B. Muller, Shahab Bakhtiari

Institution(s): Université de Montréal, Mila - Quebec AI Institute, Centre de Recherche Azrieli du CHU Sainte-Justine

Problem Background

自监督学习(SSL)中的主流双视图范式通过数据增强等变换诱导不变性或等变性,但在不变性相关任务(如图像分类)和等变性相关任务(如旋转预测)之间存在性能权衡,限制了表征在下游任务中的适应性。 论文旨在通过引入序列化动作-观察对处理,模仿人类和动物通过多视角观察学习的方式,解决这一权衡问题,同时探索序列聚合在特定任务(如路径积分)中的潜力。

Method

Experiment

Further Thoughts

seq-JEPA 通过序列化动作-观察对和架构归纳偏见隐式诱导不变性和等变性分离,这一思想启发我们可以在其他模态(如视频、文本)或多模态数据上应用类似序列化处理,利用时间或空间序列增强表征学习;此外,其引入显著性采样和返回抑制(IoR)机制的生物启发方法,提示我们可以在 AI 模型中更多借鉴神经科学原理,设计更接近生物系统的学习机制。