技术实现上,研究团队采用了一种创新的分层架构。底层是一个因果变分自编码器,负责将复杂的人体动作压缩成更易于处理的数字表示,同时保证能够实时处理而不需要"预知未来"。这就像一个速记员,能够将复杂的会议内容快速转换成简洁的笔记,既保留了核心信息,又便于后续处理。