Чем Chronos отличается от других предварительно обученных моделей в GluonTS

Chronos, набор предварительно обученных моделей в GluonTS, отличается от других предварительно обученных моделей несколькими ключевыми моментами:

1. Прогнозирование с нулевым выстрелом: Chronos предназначен для прогнозирования временных рядов с нулевым выстрелом, то есть он может генерировать точные вероятностные прогнозы для новых временных рядов, не наблюдаемых во время обучения. В этом отличие от других моделей, которые требуют тонкой настройки конкретных наборов данных для достижения хорошей производительности[1][2].

2. Архитектура языковой модели. Модели Chronos основаны на архитектуре языковых моделей, которая разбивает значения временных рядов на сегменты и обрабатывает их как токены. Этот подход позволяет эффективно обрабатывать и прогнозировать новые данные временных рядов[2][3].

3. Предварительное обучение. Модели Chronos предварительно обучаются на большом массиве данных временных рядов с открытым исходным кодом, дополненных методами генерации синтетических данных. Такое предварительное обучение позволяет моделям изучить общие закономерности и особенности данных временных рядов, которые можно применять к новым, ранее неизвестным данным[2][3].

4. Размеры моделей. Модели Chronos выпускаются пяти размеров: крошечные (параметры 8M), мини (20M), маленькие (46M), базовые (200M) и большие (710M). Эти размеры предлагают различные уровни сложности и вычислительных требований, при этом более крупные модели требуют более мощного оборудования для эффективного вывода[2].

5. Вывод. В отличие от других моделей, модели Chronos не выполняют обучение для конкретных задач. Вместо этого они выполняют более дорогостоящие вычисления во время вывода, которые линейно масштабируются в зависимости от количества временных рядов в наборе данных. Это делает их подходящими для крупномасштабных задач прогнозирования с нулевым выстрелом[2].

6. Точная настройка. Хотя модели Chronos рассчитаны на нулевую производительность, их можно точно настроить на конкретных наборах данных, чтобы еще больше повысить их точность. Эту тонкую настройку можно выполнить, используя распространенные методы и инструменты глубокого обучения[3].

Таким образом, Chronos выделяется среди других предварительно обученных моделей в GluonTS благодаря своей ориентации на прогнозирование с нулевым выстрелом, архитектуру языковой модели, предварительное обучение и эффективные возможности вывода. Эти функции делают его мощным инструментом для обработки крупномасштабных, невидимых данных временных рядов.

Цитаты:
[1] https://ts.gluon.ai/stable/
[2] https://auto.gluon.ai/stable/tutorials/timeseries/forecasting-chronos.html
[3] https://arxiv.org/html/2403.07815v1
[4] https://github.com/awslabs/gluonts
[5] https://ts.gluon.ai/stable/tutorials/forecasting/quick_start_tutorial.html