A Chronos különbözik a Gluonts más előre kiképzett modelljeitől, elsősorban annak alapjain keresztül, mint egy előrejelzett nyelvmodell, amelyet az idősorok előrejelzésére adaptáltak. Transzformátor-alapú architektúrát használ, amelyet eredetileg a nyelvmodellezéshez terveztek, de ezt újra megcélozza az idősorok adatainak értelmezésére és előrejelzésére. Ez a megközelítés ellentétben áll a hagyományos és mély tanulási modellekkel, amelyeket általában a semmiből képznek az egyes adatkészleteken vagy az idősorok gyűjteményein, amelyeket kifejezetten az előrejelzési feladatokhoz formáznak.
A Chronos tokenizálja az idősorok értékeit egy rögzített szókincsré, méretezés és kvantálás felhasználásával, amely lehetővé teszi a transzformátor-alapú nyelvmodellek, például a T5 család, a Corpora nagy és változatos idősorokon történő kiképzését. Az idősorok előrejelzésének a nyelvmodellezéshez hasonló szekvencia -modellezési problémává történő átalakításával a Chronos előrelépéseket eredményez az előrejelzett nyelvmodellekben az előnyök előrejelzésére. A képzés kereszt-entrópia veszteséget használ egy valószínűségi előrejelzési keretben, amely támogatja a gazdag bizonytalanság számszerűsítését közvetlenül az előrejelzési kimenetekben.
A modellt a nyilvánosan elérhető idősorok adatkészleteinek kiterjedt gyűjteményén, amelyet a Gaussian folyamatok felhasználásával generált szintetikus adatok kiegészítenek az általánosítás javítása érdekében. Ez a változatos és nagy előzetes corpus lehetővé teszi a Chronos számára, hogy jól teljesítsen olyan feladatokon, ahol nem történt feladat-specifikus képzés, amelyet nulla lövés előrejelzésnek neveznek. A nulla lövés beállításokban a Chronos előrejelzéseket generál az új, láthatatlan idősorokra, figyelemre méltó pontossággal, gyakran megfelelve vagy meghaladja az ezen adatkészleteken kifejezetten képzett modelleket.
A Chronos modelleket általában összehasonlítják a modellek két széles osztályával: a klasszikus statisztikai módszerekkel (mint például az ARIMA, ETS, szezonális naiv) és speciális mély tanulási modellek, amelyeket az adott előrejelzési adatkészletekre (például a Deepar, a TFT, az N-Beats és még sok más) képzettek. Különböző referenciaértékek között, beleértve a különböző domaineket és frekvenciákat átfedő 42 adatkészletet, a Chronos következetesen felülmúlja a klasszikus alapvonalakat és a legtöbb feladat-specifikus mély tanulási modellt a domain belüli adatkészleteken, ahol azt előzetesen előzetesen. A nulla lövés adatkészleteken, azoknál, akik nem láttak az előzetes előadás során, a Chronos modellek továbbra is fenntartják a versenyképes teljesítményt, felülmúlják a sok helyi modellt és megfelelnek a legfontosabb mély tanulási modelleknek, amelyeket kifejezetten ezekre a feladatokra képztek.
Az egyik kulcsfontosságú megkülönböztető a Chronos azon képessége, hogy hatékonyan működjön a dobozból anélkül, hogy feladat-specifikus hangolást vagy átképzést igényelne, lehetővé téve a csővezetékek előrejelzésében sokkal egyszerűbb és gyorsabb telepítést. Ennek ellenére a felhasználók opcionálisan finomíthatják a krónókat a saját adatkészletükön, hogy tovább javítsák a pontosságot, ha elegendő adat és számítási erőforrások állnak rendelkezésre.
Az építészet szempontjából a Chronos elfogadja a transzformátor kialakítását, de az idősor adatait alkalmazza azáltal, hogy bemeneteket kódol, mint a méretezett és kvantált numerikus értékeket, nem pedig a szavak vagy a szöveges tokeneket. Ez a megközelítés lehetővé teszi, hogy kihasználja a transzformátorok erősségeit a hosszú távú függőségek és az összetett időbeli minták modellezésében, miközben valószínűsítve a bizonytalanságot.
A Chronos-modellek különböző méretben kaphatók, tízmillió és több százmillió paraméter (20–710 m), tükrözve a modell kapacitása és a számítási igények közötti kompromisszumokat. Ennek ellenére a Chronosnak sikerül megőriznie a viszonylag mérsékelt modellméretet, mint a nagyon nagy nyelvi modellek, így hozzáférhetővé teszi a szerény GPU erőforrásokkal rendelkező gyakorlók számára. Ez ellentétben áll más, nagy, előzetesen eloltott idősoros modellekkel vagy együttesekkel, amelyeknek jelentősebb kiszámítást igényelhetnek az edzéshez és a következtetésekhez.
A képzési rendszer átfogó adatnövelési stratégiákat tartalmaz, beleértve a szintetikus adatkészlet előállítását, hogy javítsa a modell robusztusságát a különböző domainek és a mintavételi frekvenciák között. Ez a szintetikus augmentáció lehetővé teszi a modell számára, hogy általánosítsa az idősorok jellemzőit, amelyek nem ábrázolják a rendelkezésre álló valós adatkészleteket.
Számítási és telepítési szempontból a Chronos egy nagy modell, és jelentős erőforrásokat igényelhet az edzéshez és a finomhangoláshoz, a hatékonyság érdekében a GPU gyorsulását ajánlva. A klasszikus hagyományos modellekkel összehasonlítva magasabb a következtetési memóriával és a számítási követelményekkel, de ezeket a kompromisszumokat gyakran a jobb pontosság és általánosítási képességek igazolják. A Docker képmérete a krónók telepítéséhez nagyobb lehet, mint a tipikus klasszikus gépi tanulási modellek, amelyet fontos figyelembe venni a termelési környezetben erőforrás -korlátozásokkal vagy több párhuzamos példányokkal.
Chronos's performance is carefully benchmarked across multiple evaluations. A domain beállításokban, ahol a benchmarkinghoz használt adatkészletek átfedésben vannak az előzetes előkészítéssel, a Chronos a legmagasabb rangú előrejelzési pontosságot eléri a különféle mutatók között, felülmúlja a statisztikai és mély tanulási alapvonalakat. A nulla lövésű értékelés során az előzetes előadásból kizárt adatkészletekkel a Chronos továbbra is felülmúlja az önálló helyi statisztikai modelleket, sőt néhány feladat által képzett mély tanulási modelleket, amelyek erős általánosítást mutatnak. Például a valószínűségi előrejelzés során a több versengő módszer közül a tetején áll.
A Chronos a valószínűségi előrejelzési képességein keresztül is megkülönbözteti magát, inkább eloszlásokat hoz létre, nem pedig csak pontbecsléseket, amelyek gazdagabb információkat szolgáltatnak az előrejelzési bizonytalanságról. Ez ellentétben áll néhány klasszikus modelldel vagy determinisztikus előrejelzési megközelítéssel, amelyek csak az egyértékű előrejelzéseket adják ki.
Ezenkívül a Chronos összhangban van a gépi tanulás változó tendenciáival, ahol az alapítvány modellek és az átadási tanulási technikák dominálnak. Az idősorok előrejelzésének nyelvmodellezési problémaként történő kialakításával a Chronos megnyitja az utat a nagy nyelvi modellek (LLMS) és az alapmodell kutatásának integrációjához. Ez a kialakítás ígéretes platformot jelent a jövőbeli innovációk számára az egységes modellezési megközelítésekben a domainek között.
Az olyan előrehaladott idősoros modellekkel való összehasonlítás, mint például a Moirai-1.0-R, a Lag-LLAMA, az LLMTime, az előrejelzéspfn és a finomhangolt GPT-2 modellek, a krónókat következetesen előre vagy paranccsal jelzik, gyakran meghaladva ezeket a nulla lövéshez. A krónók bevonása utáni finomhangolása tovább javítja az eredményeket, ezáltal az egyik legkorszerűbb előrejelzés mind a hagyományos, mind a nulla-lövés kontextusban. Ezt a túlteljesítményt egy nagyon változatos korpuszon végzett képzésnek tulajdonítják, a nyelvmodell-alapú tokenize-és előzetes megközelítéssel kombinálva.
Összefoglalva: a Chronos megkülönbözteti magát a többi Gluonts által készített modellektől azáltal, hogy alapvetően eltérő architektúrát alkalmaz, amelyet a Transformer Language Models ihlette, és nagyszabású előzetes előzetes előírást használ fel a tokenizált idősorokra, és robusztus nulla lövés előrejelzési teljesítményt ér el. Kiegyensúlyozza a modell méretét és a számítási igényeket a nagy pontossággal és az általánosságban, támogatja a valószínűségi előrejelzést és a finomhangolást, és új paradigmát képvisel az idősorok előrejelzési keretein, amelyek áthidalják az NLP és az idősorok elemzésében.