作者:聂通,秦国阳,马玮,孙剑;同济大学,香港理工大学
01 摘要
时空交通数据(STTD)可测量多尺度交通系统的复杂动态行为。现有方法旨在使用低维模型重建 STTD。然而,这些方法仅限于特定数据维度或依赖于来源的模式,限制了它们的统一表征。在此,我们提出了一种新的范式,通过将 STTD 参数化为隐式神经表征来解决 STTD 学习问题。为了辨别低维状态下的潜在动力学,我们采用了能编码高频结构的基于坐标的神经网络,将坐标直接映射到交通变量。为了揭示纠缠在一起的时空相互作用,可变性被分解成不同的过程。我们还利用频谱嵌入技术进一步实现了不规则空间(如传感器图)的建模。通过连续表示法,我们的方法可以用统一的输入建立各种 STTD 模型,从而成为底层交通动力学的通用学习器。研究还表明,该方法可以从数据中学习隐含的低秩先验和平滑度正则化,从而使其成为学习不同主导数据模式的通用方法。我们通过在真实世界场景中的大量实验验证了它的有效性,展示了从廊道到网络规模的各种应用。实证结果不仅表明我们的模型明显优于传统的低秩模型,还凸显了该方法在不同数据域、输出分辨率和网络拓扑结构方面的通用性。全面的模型分析让我们进一步了解了 STTD 的归纳偏置。我们期望这一新的建模视角将为 STTD 在各种实际任务中的通用表示奠定基础。
02 核心挑战与动机
近些年来数据驱动的交通统计变量建模问题得到广泛关注,例如时空变量的重建、估计、以及预测问题。由于宏观交通系统的高维度、大规模特性,直接从海量观测数据中建立模型存在难度。因此现有研究通常采用一些基本假设,例如分布特性以及物理规则,建立预测性模型以从观测中推断交通系统的宏观行为表现。这些先验假设通常被具象化为低维模型结构,例如“低秩”结构和物理方程损失函数,与矩阵/张量分解、物理启发神经网络等架构结合。然而,现有的方法受限于数据特定的维度(离散化输入的限制)或数据源依赖模式(预定义先验的限制),这导致了现有方法难以采用统一的表示方法或模型结构来应对不同类型的数据与问题类型。同时,由于传统机器学习模型的“频域偏置(Spectral bias)”问题,现有研究通常将观测数据中的高频信号视作噪声而忽略,限制了对数据细节的捕捉能力。
图1:用隐式神经函数表示时空交通数据。(a) 任意时空坐标上的交通数据可表示为隐式空间中的连续函数。(b) 基于坐标的 MLP 将输入坐标映射到感兴趣的交通状态。(c) 凭借与分辨率无关的特性,我们的模型可以学习来自不同来源的各种时空交通数据。
03 解决思路与方案
为了解决上述挑战,本文提出了一种新的范式,用于解决时空交通数据(Spatiotemporal Traffic Data, STTD)的表示与学习问题(见图1)。本文试图通过隐式神经表征(Implicit Neural Representations, INRs)来学习交通数据的生成动力学,将 STTD 以连续的形式参数化为神经网络权重,从而为不同的真实世界任务提供 STTD 的统一、通用的表示。具体来说,论文的主要贡献包括:
提出了一种新的范式,将交通变量参数化为域坐标的隐式映射。
提出了一种坐标解耦策略,以降低整个域上的学习复杂性,并开发了一种图谱嵌入技术,用于在拓扑空间上建模不规则数据。
展现了模型良好的解析性质,这些属性可以作为STTD的可学习正则化,包括高频编码、隐式低秩性和固有平滑性。
通过在真实世界的场景中进行广泛的评估,展示了方法在多类型STTD学习问题上的有效性,涵盖了从微观到宏观尺度的任务。
图2:ST-INR 模型的总体结构(三维情况)。
图3:ST-INR 学习目标示意图。总目标包括对所有观测点的监督损失,以及根据深度神经网络特性得出的可学习正则化。
图4:频谱特性分析:高频特征增强模型表达能力。
论文提出了一种名为时空隐式神经表示(Spatiotemporal Implicit Neural Representations, ST-INR)的方法。具体来说,ST-INR包含以下几个关键技术:
隐式映射参数化:将STTD参数化为一个隐式神经表示,使用基于坐标的多层感知器(Coordinate-based MLP)直接将输入坐标映射到交通状态变量(见图2)。
高频组件编码:为了学习STTD中的复杂细节,论文采用了周期激活函数和随机傅里叶特征(Random Fourier Features, RFF)来编码输入MLP的高频组件(见图4)。
坐标解耦:通过坐标解耦技术,将空间和时间的相互作用分解为独立的变量,以简化模型学习过程。
图谱嵌入:为了在不规则空间(如传感器图)上建模STTD,论文提出了一种图谱嵌入技术,以学习非欧几里得空间的映射。
连续表示:通过连续的表示,该方法能够适应不同尺度或分辨率的STTD,允许使用统一的输入来建模各种尺度与维度的STTD。
梯度下降优化:利用梯度下降方法优化模型参数,同时通过梯度下降过程隐式地学习数据的低秩和平滑先验(见图3)。
理论分析:论文还提供了模型的理论分析,包括高频编码、隐式低秩正则化、固有平滑性和降低的计算复杂性。
04 实验验证
论文中进行了多项实验来验证所提出的时空隐式神经表示(ST-INR)模型的有效性,覆盖了不同的应用场景,包括廊道级别的高速公路交通状态估计、网格级别的城市网格流量估计以及路网级别的交通网络状态估计。以下是主要实验结果总结:
廊道级别应用:高速公路交通状态估计:
数据集:NGSIM US 101数据。
两种输入场景:基于离散网格的估计和基于连续轨迹的估计。
图5:离散网格上的交通状态估计
图6: 连续轨迹点上的交通状态估计
网格级别应用:城市网格流量估计:
数据集:TaxiBJ和TaxiNYC,城市区域的出租车流量记录。
对TaxiBJ数据,训练了不同分辨率的模型来估计不同分辨率下的流量。
对TaxiNYC数据,由于OD流量的稀疏性,随机抽取40%的OD对作为训练数据。
图7:模型在 TaxiBJ 数据(第10个时间步)上的表现。
图8: TaxiNYC 数据上的模型性能(2020年1月至5月)。
路网级别应用:交通网络状态估计:
数据集: PeMS-BAY和Seattle的高速公路环路速度数据,以及NeurIPS2021-traffic4cast竞赛中的芝加哥和柏林网络数据。
创建了“缺失传感器”估计问题,即估计没有环路传感器位置的交通状态。
图9:PeMS-BAY和Seattle数据上的模型性能。
图10:Chicago和Berlin网络数据上的模型性能。
05 总结与展望
在这项工作中,我们展示了一种基于隐式神经表征的新型STTD学习方法,称为ST-INR。通过将STTD参数化为连续深度神经网络,我们训练ST-INR直接将时空坐标映射到交通状态。ST-INR显式编码高频结构,以学习STTD的复杂细节,同时隐式学习数据本身的低秩偏置和平滑正则化,以重构主要模式。由于这种表示方法的通用性,它可以用来模拟各种STTD,如车辆轨迹、起点-终点流、网格流、高速公路传感器网络和城市网络。各种实际基准的实验结果表明,我们的模型优于传统的低秩模型,如张量因式分解和核规范最小化。它还具有在不同数据结构和问题设置中进行推广的潜力。此外,其他一些重要特性,如高频结构、隐式低秩和固有平滑性,可以作为STTD建模的新归纳偏置,为传统低秩模型提供了一种替代方案。未来可以进一步探索的点例如:
物理信息引导的交通动态学习:如何将当前框架与基于物理的机器学习方法(如物理信息神经网络)结合,以提高模型的性能和解释性。
不规则采样时间序列的建模:现实世界的交通数据可能由具有不同采样频率的传感器记录,或者由变化数量的移动传感器收集。由于模型的连续性,可以采用它来建模则交通数据。