GluonTS의 사전 훈련된 모델 모음인 Chronos는 몇 가지 주요 측면에서 다른 사전 훈련된 모델과 다릅니다.
1. 제로샷 예측: Chronos는 제로샷 시계열 예측을 위해 설계되었습니다. 즉, 훈련 중에 볼 수 없는 새로운 시계열에 대한 정확한 확률적 예측을 생성할 수 있습니다. 이는 좋은 성능을 달성하기 위해 특정 데이터 세트에 대한 미세 조정이 필요한 다른 모델과 대조됩니다[1][2].
2. 언어 모델 아키텍처: Chronos 모델은 시계열 값을 버킷으로 토큰화하고 토큰으로 처리하는 언어 모델 아키텍처를 기반으로 합니다. 이 접근 방식을 사용하면 새로운 시계열 데이터를 효율적으로 처리하고 예측할 수 있습니다[2][3].
3. 사전 교육: Chronos 모델은 합성 데이터 생성 기술로 강화된 대규모 오픈 소스 시계열 데이터 모음에서 사전 교육됩니다. 이 사전 훈련을 통해 모델은 새로운, 보이지 않는 데이터에 적용할 수 있는 시계열 데이터의 일반적인 패턴과 특징을 학습할 수 있습니다[2][3].
4. 모델 크기: Chronos 모델은 소형(8M 매개변수), 미니(20M), 소형(46M), 기본(200M), 대형(710M)의 5가지 크기로 제공됩니다. 이러한 크기는 다양한 수준의 복잡성과 계산 요구 사항을 제공하며 더 큰 모델에는 효율적인 추론을 위해 더 강력한 하드웨어가 필요합니다[2].
5. 추론: 다른 모델과 달리 Chronos 모델은 작업별 교육을 수행하지 않습니다. 대신 데이터 세트의 시계열 수에 따라 선형적으로 확장되는 추론 중에 더 비싼 계산을 수행합니다. 따라서 대규모 제로샷 예측 작업에 적합합니다[2].
6. 미세 조정: Chronos 모델은 제로 샷 성능을 위해 설계되었지만 특정 데이터세트에 대해 미세 조정하여 정확도를 더욱 향상시킬 수 있습니다. 이러한 미세 조정은 일반적인 딥러닝 기술과 도구를 사용하여 수행할 수 있습니다[3].
요약하면, Chronos는 제로샷 예측, 언어 모델 아키텍처, 사전 훈련 및 효율적인 추론 기능에 중점을 두는 점에서 GluonTS의 다른 사전 훈련된 모델보다 돋보입니다. 이러한 기능을 통해 볼 수 없는 대규모 시계열 데이터를 처리하기 위한 강력한 도구가 됩니다.
인용:[1] https://ts.gluon.ai/stable/
[2] https://auto.gluon.ai/stable/tutorials/timeseries/forecasting-chronos.html
[3] https://arxiv.org/html/2403.07815v1
[4] https://github.com/awslabs/gluonts
[5] https://ts.gluon.ai/stable/tutorials/forecasting/quick_start_tutorial.html