Strada-LLM: 시공간 교통 예측을 위한 그래프 강화 대규모 언어 모델

1. 서론

교통 예측은 지능형 교통 시스템(ITS)의 핵심 요소로, 정확한 예측은 운영 효율성, 안전성 및 도시 계획에 직접적인 영향을 미칩니다. 핵심 과제는 서로 다른 위치 간 교통 상황의 이질성에 있으며, 이는 전통적인 모델이 일반화하기 어려운 매우 다양한 데이터 분포를 초래합니다. 대규모 언어 모델(LLM)은 이러한 동적 시나리오에서 소수 샘플 학습에 유망한 가능성을 보여주었지만, 기존 LLM 기반 솔루션은 종종 프롬프트 튜닝에 의존하여 교통 네트워크에 내재된 복잡한 그래프 관계와 시공간 의존성을 완전히 포착하는 데 어려움을 겪습니다. 이러한 한계는 실제 응용에서 모델의 적응성과 해석 가능성을 저해합니다.

Strada-LLM은 이러한 격차를 해소하기 위해 도입되었습니다. 이는 시간적 및 공간적 교통 패턴을 명시적으로 모델링하는 새로운 다변량 확률적 예측 LLM입니다. 근접 교통 정보를 공변량으로 통합하고 경량 도메인 적응 전략을 사용함으로써, Strada-LLM은 기존 프롬프트 기반 LLM 및 전통적인 그래프 신경망(GNN) 모델을 능가하는 성능을 목표로 하며, 특히 데이터가 희소하거나 새로운 네트워크 시나리오에서 두각을 나타냅니다.

2. 방법론

2.1. 모델 아키텍처

Strada-LLM의 아키텍처는 LLM의 시퀀스 모델링 능력과 GNN의 구조적 귀납 편향을 융합하도록 설계되었습니다. 핵심 아이디어는 교통 네트워크를 그래프 $G = (V, E)$로 취급하는 것입니다. 여기서 노드 $V$는 센서 또는 도로 구간을 나타내고, 간선 $E$는 공간적 연결성을 나타냅니다. 과거 교통 데이터(예: 속도, 유량)는 $C$개의 채널을 가진 $N$개의 노드에 대해 $T$ 시간 단계 동안 다변량 시계열 $X \in \mathbb{R}^{N \times T \times C}$를 형성합니다.

모델은 이 데이터를 이중 경로 인코더를 통해 처리합니다: (1) 시간적 인코더(GPT 또는 LLaMA와 같은 LLM 백본 기반)는 각 노드의 시계열 내 장기 의존성과 주기적 패턴을 포착합니다. (2) 공간적 인코더(경량 GNN)는 그래프 구조에서 작동하여 인접 노드의 정보를 집계하며, 서론에서 언급된 전이 및 피드백 효과를 포착합니다. 이러한 인코더의 출력이 융합되어 시공간적으로 풍부한 표현이 생성됩니다.

2.2. 근접 공변량 통합

핵심 혁신은 근접 교통 정보를 공변량으로 사용하는 것입니다. Strada-LLM은 대상 노드의 과거 기록에만 의존하는 대신, 위상적으로 인접한 노드들의 최근 상태를 기반으로 예측을 수행합니다. 공식적으로, 시간 $t$에서의 대상 노드 $i$에 대한 입력은 $X_i^{(t-H:t)}$와 $\{X_j^{(t-H:t)} | j \in \mathcal{N}(i)\}$를 포함합니다. 여기서 $\mathcal{N}(i)$는 이웃 노드 집합이고 $H$는 과거 시간 창입니다. 이는 대상 위치에서 완전히 나타나기 전에 발생하는 정체 또는 유량 패턴에 대한 중요한 맥락적 신호를 제공합니다.

2.3. 분포 기반 도메인 적응

분포 변화(예: 도시 A에서 훈련된 모델을 도시 B에 적용)를 해결하기 위해, Strada-LLM은 매개변수 효율적인 도메인 적응 전략을 제안합니다. 모든 모델 매개변수를 미세 조정하는 대신, 새로운 대상 데이터의 통계적 분포(예: 평균, 분산, 자기상관)를 분석하여 도출된 작은 부분 집합의 매개변수만을 업데이트합니다. 이를 통해 소수 샘플 제약 하에서도 빠른 적응이 가능해져, 다양한 도시 네트워크에 배포하기에 매우 실용적인 모델이 됩니다.

3. 기술적 세부사항 및 수학적 공식화

예측 목표는 미래 교통 상태의 조건부 확률을 모델링하는 것입니다: $$P(X^{(t+1:t+F)} | X^{(t-H:t)}, G)$$ 여기서 $F$는 예측 기간입니다. Strada-LLM은 이를 다변량 가우시안 분포로 매개변수화합니다: $$\hat{X}^{(t+1:t+F)} \sim \mathcal{N}(\mu_{\theta}, \Sigma_{\theta})$$ 모델 매개변수 $\theta$는 음의 로그 가능도를 최소화하도록 학습됩니다: $$\mathcal{L} = -\log P_{\theta}(X^{(t+1:t+F)} | X^{(t-H:t)}, G)$$ GNN 구성 요소의 공간 집계는 메시지 전달 체계로 설명할 수 있습니다. 레이어 $l$에서 노드 $i$에 대해: $$h_i^{(l)} = \text{UPDATE}\left(h_i^{(l-1)}, \text{AGGREGATE}\left(\{h_j^{(l-1)} | j \in \mathcal{N}(i)\}\right)\right)$$ 여기서 $h_i$는 노드 임베딩입니다. AGGREGATE 함수는 평균 풀링 또는 어텐션 기반일 수 있으며, 연결된 노드 간 영향력의 강도를 포착합니다.

4. 실험 결과 및 분석

4.1. 데이터셋 및 비교 모델

평가는 센서 네트워크의 교통 속도/유량 데이터를 포함하는 PeMS 및 METR-LA와 같은 표준 시공간 교통 데이터셋에서 수행되었습니다. 비교 모델은 다음과 같습니다:

전통적 시계열 모델: ARIMA, VAR.
딥러닝 모델: TCN, LSTM.
GNN 기반 최신 모델: DCRNN, STGCN, GraphWaveNet.
LLM 기반 모델: GPT-3, LLaMA의 프롬프트 튜닝 버전.

4.2. 성능 평가 지표

주요 평가 지표는 점 예측을 위한 평균 제곱근 오차(RMSE) 및 평균 절대 오차(MAE)였으며, 확률적 예측을 위한 지표는 연속 순위 확률 점수(CRPS)였습니다.

성능 향상

17%

장기 예측에서 최신 LLM 기반 모델 대비 RMSE 감소.

효율성 향상

16%

LLM 백본의 전체 미세 조정 대비 더 효율적인 매개변수 사용.

견고성

최소

LLM 백본 변경 시(예: GPT에서 LLaMA로) 성능 저하.

4.3. 주요 결과

우수한 예측 정확도: Strada-LLM은 모든 비교 모델을 꾸준히 능가했으며, 특히 장기 예측(예: 60-90분 후)에서 두각을 나타냈습니다. 프롬프트 기반 LLM 대비 17%의 RMSE 향상은 그래프 구조를 명시적으로 모델링하는 가치를 강조합니다.

효과적인 소수 샘플 적응: 분포 기반 적응 전략 덕분에 Strada-LLM은 새로운 도시의 데이터를 단 며칠의 샘플만 본 후에도 최고 성능의 90% 이상을 달성하여 놀라운 데이터 효율성을 입증했습니다.

해석 가능성: LLM 시간적 인코더의 어텐션 가중치와 GNN에서 학습된 간선 가중치를 분석함으로써, 모델은 주어진 예측에 대해 어떤 과거 시점과 어떤 인접 노드가 가장 큰 영향을 미쳤는지에 대한 통찰을 제공할 수 있었습니다.

5. 분석 프레임워크: 핵심 통찰 및 비판

핵심 통찰

Strada-LLM은 단순히 교통을 위한 또 다른 AI 모델이 아닙니다. 이는 하이브리드 인텔리전스에 대한 전략적 투자입니다. 저자들은 교통 네트워크와 같은 구조화된 관계형 데이터에 대해 단일화된 LLM의 순수 프롬프트 튜닝이 막다른 길임을 올바르게 지적합니다. 그들의 핵심 통찰은 LLM이 시간적 추론 엔진이 되어야 하고, GNN이 공간 구조 컴파일러 역할을 해야 한다는 것입니다. 이는 모든 것을 텍스트 프롬프트를 통해 강제하려는 시도보다 더 건전한 아키텍처 접근 방식으로, 시각-언어 모델이 이미지와 텍스트에 대해 별도의 인코더를 사용하는 방식과 유사합니다.

논리적 흐름

논리는 설득력이 있습니다: 1) 교통에는 내재된 그래프 구조가 있음 → GNN 사용. 2) 교통 시계열에는 복잡한 장기 의존성이 있음 → LLM 사용. 3) 이를 단순히 결합하면 매개변수가 많아지고 양식이 일치하지 않을 수 있음 → 근접 공변량을 통한 집중된 융합 메커니즘 설계. 4) 실제 배포에는 분포 변화가 발생함 → 경량의 통계 기반 어댑터 발명. 이는 ML 시스템 설계에서 문제 분해의 교과서적인 예입니다.

강점과 한계

강점: 매개변수 효율적인 도메인 적응은 실제 적용 가능성 측면에서 본 논문의 결정적 장점입니다. 이는 도시 규모 ITS 배포에서의 "콜드 스타트" 문제를 직접적으로 해결합니다. 확률적 예측에 초점을 맞춘 점도 칭찬할 만하며, 점 추정을 넘어 불확실성 정량화로 나아가 교통 분야의 위험 인식 의사 결정에 중요한 기여를 합니다.

한계 및 미해결 질문: 가장 큰 문제는 계산 비용입니다. 전체 미세 조정보다 효율적이지만, 수백 개의 센서에 대해 LLM 백본(심지어 70억 매개변수 모델)을 실시간으로 실행하는 것은 사소한 일이 아닙니다. 논문에는 온라인 예측을 위한 엄격한 지연 시간 분석이 부족합니다. 또한, "그래프"는 정적(도로 네트워크)이라고 가정합니다. 이는 사고나 도로 폐쇄와 같은 일시적 사건을 나타낼 수 있는 동적 그래프를 무시하며, 이는 Dynamic Graph Neural Networks (Pareja et al., NeurIPS 2020)와 같은 연구에서 탐구되는 최전선 분야입니다. 표준 벤치마크에 대한 평가는 확실하지만, 진정한 스트레스 테스트는 더 이질적인 도시 조합(예: 유럽의 격자형 도로망 vs. 미국의 확산형 도시)을 포함해야 합니다.

실행 가능한 통찰

실무자에게: 계산 비용을 관리하기 위해 도시 전체가 아닌, 우선 복도 수준 관리에 이 아키텍처를 시범 적용하십시오. 도메인 적응 모듈은 추출되어 다른 시공간 모델과 함께 사용될 가능성이 있습니다. 연구자에게: 가장 큰 기회는 범용 LLM 백본을 시계열 특화 기초 모델(예: Google의 TimesFM)로 대체하는 것으로, 이는 효율성을 극적으로 향상시킬 수 있습니다. 또 다른 방향은 외부 데이터(날씨, 이벤트)를 단순한 공변량이 아닌 다중 양식 융합 계층을 통해 통합하여 진정한 "도시 디지털 트윈" 모델을 만드는 것입니다.

6. 응용 전망 및 향후 방향

단기(1-3년): 정체 예측 및 완화를 위한 교통 관리 센터에 배포. Strada-LLM은 예측된 유량을 기반으로 타이밍을 사전에 조정하는 동적 교통 신호 제어 시스템을 구동할 수 있습니다. 소수 샘플 적응 능력 덕분에 역사적 데이터는 희소하지만 패턴이 빠르게 나타나는 특별 행사 관리(스포츠 경기, 콘서트)에 적합합니다.

중기(3-5년): 자율주행차(AV) 경로 시스템과의 통합. AV 차량군은 Strada-LLM의 확률적 예측을 사용하여 다양한 경로의 위험을 평가하고, 현재 이동 시간뿐만 아니라 예측된 안정성과 신뢰성을 최적화할 수 있습니다. 또한 화물 및 물류 계획을 향상시킬 수 있습니다.

장기 및 연구 최전선:

생성적 도시 계획: Strada-LLM을 시뮬레이터로 사용하여 제안된 인프라 변경(새로운 도로, 구역법)의 교통 영향을 평가.
다중 양식 통합: 차량 교통을 넘어 보행자 흐름, 공유 자전거 수요, 대중교통 점유율을 포함한 통합 이동성을 모델링하도록 확장. 이는 이질적 그래프 표현이 필요합니다.
인과 추론: 상관관계에서 인과관계로 이동. 특정 차선을 폐쇄하는 것의 정확한 영향과 같은 "만약에" 질문에 답할 수 있는가? 이는 인과 표현 학습이라는 성장하는 분야와 일치합니다.
이동성을 위한 기초 모델: Strada-LLM의 아키텍처는 확장되어 전 세계 교통 데이터에 대해 사전 훈련되어 도시 환경의 모든 시공간 예측 작업을 위한 기초 모델을 생성할 수 있습니다.

7. 참고문헌

Moghadas, S. M., Cornelis, B., Alahi, A., & Munteanu, A. (2025). Strada-LLM: Graph LLM for traffic prediction. Proceedings of the 31st ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '25).
Vaswani, A., et al. (2017). Attention is All You Need. Advances in Neural Information Processing Systems 30 (NeurIPS 2017).
Kipf, T. N., & Welling, M. (2017). Semi-Supervised Classification with Graph Convolutional Networks. International Conference on Learning Representations (ICLR).
Li, Y., et al. (2018). Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting. International Conference on Learning Representations (ICLR).
Pareja, A., et al. (2020). EvolveGCN: Evolving Graph Convolutional Networks for Dynamic Graphs. Proceedings of the AAAI Conference on Artificial Intelligence.
Wu, N., et al. (2023). TimesFM: A Foundation Model for Time Series Forecasting. Google Research. [Preprint].
OpenStreetMap contributors. (2024). Planet dump. Retrieved from https://www.openstreetmap.org.
California Department of Transportation (Caltrans). (2024). Performance Measurement System (PeMS). Retrieved from http://pems.dot.ca.gov.