Stop Thinking, Just Do!

Sungsoo Kim's Blog

Traffic Prediction with Transfer Learning

tagsTags

7 April 2023


Article Source


Traffic Prediction with Transfer Learning

본 문서는 테스트를 위해 chatGPT를 활용하여 정리해 봤다.

Abstract

교통 예측 모델 구축 연구는 실제 응용 분야에서 큰 발전을 이루어 왔습니다. 그러나 이러한 훌륭한 결과는 대규모 데이터셋에서 주로 생성되어, 한정된 데이터로 모델을 학습하기 어렵습니다. 이러한 문제를 해결하기 위해 RegionTrans [43] 및 MetaST [44]와 같은 방법들이 전이 학습 기술을 적용하여 데이터 부족 문제에 대처하려고 시도하고 있습니다. 이 두 가지 방법은 도시 간 지역 일치 및 공동 교육 원칙을 구축하여 지식을 전이하는 데 초점을 두고 있습니다. RegionTrans [43]는 지역 유사성 규제를 통해 도시 간 지식을 전이시킵니다. MetaST [44]는 소스 도시의 지역 클러스터의 메타 정보를 저장하기 위해 ST-mem이라는 벡터 배열을 사용합니다. 이후, 어텐션 메커니즘 기반의 방법으로 목표 도시의 지역을 ST-mem과 일치시켜 지식을 전이시킵니다. 그러나 두 방법 모두 초기 도로 클러스터링의 품질에 크게 의존하며, 이상한 클러스터링은 전이 가능성을 해칠 수 있습니다. 또한 두 방법 모두 모델 학습 및 전이 중에 네트워크 매개변수를 공유하는 매개변수 공유에 기반을 두고 있습니다. 그들은 서로 다른 일치 지역에서 예측과 실제 값 간의 손실을 계산하고 미리 정의된 계수로 결합하여 모델을 최적화합니다. 그러나 이들은 소스와 타겟 도메인 간의 귀납적 공유 편향을 무시하여, 지역 일치에 따라 클러스터링 된 서로 다른 하위 데이터셋에서 계산된 기울기가 경사 하강 방향에서 충돌을 일으켜 전반적인 모델 성능을 저하시키는 가능성이 있습니다.

이전에 언급된 “전역적” 매개변수 공유 체계의 결점을 고려하면, 지역적 매개변수 공유는 모델 간의 부정적 전이를 줄이는 데 가치 있는 전략입니다. TL DCRNN [19]은 그래프 분할을 통해 상관 관계가 적은 그래프에서 정보 공유를 줄입니다. 그러나 이 그래프 분할 접근 방식은 하위 그래프의 크기가 일치해야 합니다. 그렇지 않으면 일치하지 않는 부분은 0 값으로 채워져 학습 성능에 부정적인 영향을 미칠 수 있습니다. 게다가, 그래프 분할 작업이 소스와 대상 데이터셋 모두에 필요하므로, 교통 그래프의 정확성은 전달 효율에 영향을 미치는 중요한 기준이 됩니다. 이 연구에서는, 우리는 지역적인 영역에서 매개변수를 공유하는 이러한 아이디어를 따릅니다. 이것은 클러스터링 방법이 그래프 구조에 대한 강력한 의존성을 완화해야 함을 의미합니다. 다음으로, 기존의 시계열 클러스터링 방법을 간단하게 소개한다.


comments powered by Disqus