Jak se Chronos liší od ostatních předtrénovaných modelů v GluonTS

Chronos, sada předtrénovaných modelů v GluonTS, se liší od ostatních předtrénovaných modelů v několika klíčových ohledech:

1. Zero-Shot Forecasting: Chronos je navržen pro předpovídání časových řad s nulovým záběrem, což znamená, že může generovat přesné pravděpodobnostní předpovědi pro nové časové řady, které se během tréninku nezobrazují. To je na rozdíl od jiných modelů, které pro dosažení dobrého výkonu vyžadují jemné doladění konkrétních datových sad[1][2].

2. Architektura jazykového modelu: Modely Chronos jsou založeny na architekturách jazykových modelů, které tokenizují hodnoty časových řad do segmentů a zacházejí s nimi jako s tokeny. Tento přístup umožňuje efektivní zpracování a predikci nových dat časových řad[2][3].

3. Předškolení: Modely Chronos jsou předtrénovány na velkém korpusu dat časových řad s otevřeným zdrojovým kódem rozšířeným o techniky generování syntetických dat. Toto předběžné školení umožňuje modelům naučit se obecné vzorce a funkce v datech časových řad, které lze aplikovat na nová, neviditelná data[2][3].

4. Velikosti modelů: Modely Chronos se dodávají v pěti velikostech: malý (8M parametry), mini (20M), malý (46M), základní (200M) a velký (710M). Tyto velikosti nabízejí různé úrovně složitosti a výpočetních požadavků, přičemž větší modely vyžadují výkonnější hardware pro efektivní vyvozování[2].

5. Inference: Na rozdíl od jiných modelů modely Chronos neprovádějí školení pro konkrétní úkol. Místo toho provádějí během inference nákladnější výpočet, který se lineárně mění s počtem časových řad v souboru dat. Díky tomu jsou vhodné pro rozsáhlé úlohy prognózování s nulovým záběrem[2].

6. Jemné doladění: Modely Chronos jsou sice navrženy pro výkon nulového záběru, lze je však doladit na konkrétních datových sadách a dále zlepšit jejich přesnost. Toto jemné doladění lze provést pomocí běžných technik a nástrojů hlubokého učení[3].

Stručně řečeno, Chronos se odlišuje od ostatních předtrénovaných modelů v GluonTS díky svému zaměření na předpovědi nulového záběru, architekturu jazykového modelu, předškolení a efektivní schopnosti odvození. Tyto funkce z něj dělají výkonný nástroj pro práci s rozsáhlými, neviditelnými daty časových řad.

Citace:
[1] https://ts.gluon.ai/stable/
[2] https://auto.gluon.ai/stable/tutorials/timeseries/forecasting-chronos.html
[3] https://arxiv.org/html/2403.07815v1
[4] https://github.com/awslabs/gluonts
[5] https://ts.gluon.ai/stable/tutorials/forecasting/quick_start_tutorial.html