Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Kuo chronos skiriasi nuo kitų iš anksto apmokytų modelių „Gluonts“


Kuo chronos skiriasi nuo kitų iš anksto apmokytų modelių „Gluonts“


„Chronos“ skiriasi nuo kitų iš anksto apmokytų modelių „Gluonts“, pirmiausia dėl jo pagrindo, kaip iš anksto pritvirtintą kalbos modelį, pritaikytą laiko eilučių prognozavimui. Jis naudoja transformatorių pagrįstą architektūrą, iš pradžių sukurtą kalbų modeliavimui, tačiau tai vėl pradeda aiškinti ir numatyti laiko eilučių duomenis. Šis požiūris kontrastuoja tradicinius ir giluminio mokymosi modelius, kurie paprastai yra mokomi nuo nulio atskirų duomenų rinkinių ar laiko eilučių kolekcijų, specialiai suformatuotų, kad būtų galima prognozuoti užduotis.

„Chronos“ laiko eilučių vertes žymi į fiksuotą žodyną, naudodamas mastelio keitimą ir kiekybinį nustatymą, o tai leidžia treniruoti transformatorių pagrįstus kalbos modelius, tokius kaip T5 šeimos, esant didelėms ir įvairioms laiko serijos korporacijoms. Konvertuodami laiko eilučių prognozavimą į sekos modeliavimo problemą, panašią į kalbos modeliavimą, „Chronos“ panaudoja pažangą iš anksto pateiktuose kalbų modeliuose, kad būtų galima prognozuoti naudą. Mokymuose naudojami kryžminės entropijos praradimai tikimybinėje prognozavimo sistemoje, palaikant turtingo neapibrėžtumo kiekybinį įvertinimą tiesiogiai prognozuojant.

Modelis yra iš anksto įtrauktas į plačią viešai prieinamų laiko eilučių duomenų rinkinių kolekciją, papildytą sintetinių duomenų, sugeneruotų naudojant Gauso procesus, siekiant pagerinti apibendrinimą. Šis įvairus ir didelis išankstinis korpusas leidžia „Chronos“ gerai atlikti užduotis, kai neįvyko jokių užduoties mokymų, kurie yra žinomi kaip nulinio šūvio prognozavimas. „Zero-Shot“ nustatymuose „Chronos“ generuoja naujų, nematytų laiko eilučių prognozes, turinčias nepaprastą tikslumą, dažnai suderinančius ar pranokdami modelius, kurie buvo specialiai apmokyti tose duomenų rinkiniuose.

„Chronos“ modeliai paprastai lyginami su dviem plačiomis modelių klasėmis: klasikiniais statistiniais metodais (tokiais kaip arima, ETS, sezoniniai naivūs) ir specializuoti giliojo mokymosi modeliai, apmokyti konkrečiuose prognozavimo duomenų rinkiniuose (tokiuose kaip „Deepar“, „TFT“, „N-Beats“ ir dar daugiau). Daugybėje etalonų, įskaitant 42 duomenų rinkinius, apimančius skirtingus domenus ir dažnius, „Chronos“ nuosekliai lenkia klasikines bazines linijas ir daugumą užduoties specifinių giluminio mokymosi modelių, esančių domenų duomenų rinkiniuose, kur jis buvo iš anksto iš anksto. „Zero-Shot“ duomenų rinkiniuose tie, kurie nebuvo matomi prieš pradedant, „Chronos“ modeliai vis dar palaiko konkurencinius rezultatus, pralenkia daugelį vietinių modelių ir atitinka aukščiausio lygio giluminio mokymosi modelius, specialiai apmokytus šioms užduotims.

Vienas iš pagrindinių diferencialų yra „Chronos“ galimybė efektyviai veikti iš dėžutės nereikalaujant konkrečios užduoties derinimo ar perkvalifikavimo, įgalinant daug paprastesnį ir greitesnį diegimą prognozuojant vamzdynus. Nepaisant to, vartotojai gali pasirinktinai tiksliai sureguliuoti „Chronos“ savo duomenų rinkiniuose, kad dar labiau padidintų tikslumą, jei yra pakankamai duomenų ir skaičiavimo išteklių.

Kalbant apie architektūrą, „Chronos“ priima transformatoriaus dizainą, tačiau taiko jį laiko eilučių duomenims, koduojant įvestis kaip žetonus, vaizduojančius mastelį ir kiekybiškai įvertintas skaitines vertes, o ne žodžius ar teksto žetonus. Šis požiūris leidžia jam panaudoti transformatorių stipriąsias puses modeliuojant tolimojo nuotolio priklausomybes ir sudėtingus laikinus modelius, tuo pačiu kartu valdant netikrumą tikimybiškai.

„Chronos“ modeliai yra įvairių dydžių, nuo dešimčių milijonų iki šimtų milijonų parametrų (nuo 20 m iki 710 m), atspindintys kompromisus tarp modelio talpos ir skaičiavimo poreikių. Nepaisant to, „Chronos“ sugeba išlaikyti santykinai vidutinį modelio dydį, palyginti su labai dideliais kalbos modeliais, todėl jis yra prieinamas specialistams, turintiems kuklius GPU išteklius. Tai prieštarauja kai kuriems kitiems dideliems iš anksto apdorotoms laiko eilučių modeliams ar ansambliams, kuriems gali prireikti reikšmingesnio skaičiavimo mokymui ir išvadoms.

Treniruotės režimą įtrauktos išsamios duomenų padidinimo strategijos, įskaitant sintetinio duomenų rinkinio generavimą, siekiant pagerinti modelio tvirtumą skirtingose ​​srityse ir mėginių ėmimo dažnius. Šis sintetinis padidinimas leidžia modeliui apibendrinti iki laiko eilučių charakteristikas, kurios nėra žymiai vaizduojamos turimuose realiuose duomenų rinkiniuose.

Kompiuterinio ir diegimo požiūriu „Chronos“ yra didelis modelis ir gali reikalauti reikšmingų išteklių mokymui ir tobulinimui, o efektyvumui rekomenduojama GPU pagreitis. Palyginti su klasikiniais tradiciniais modeliais, jis turi didesnę išvadų atmintį ir skaičiavimo reikalavimus, tačiau šiuos kompromisus dažnai pateisina patobulintas tikslumas ir apibendrinimo galimybės. „Docker“ vaizdo dydis, skirtas diegti „Chronos“, gali būti didesnis nei tipiški klasikinių mašinų mokymosi modeliai, kuriuos svarbu atsižvelgti į gamybos aplinką su išteklių apribojimais ar keliais lygiagrečiais egzemplioriais.

„Chronos“ našumas yra kruopščiai pažymėtas atliekant kelis vertinimus. Domeno nustatymuose, kuriuose duomenų rinkiniai, naudojami etaloninei analizei sutapti su išankstiniu būdu, „Chronos“ pasiekia aukščiausio lygio prognozavimo tikslumą įvairiose metrikose, nuosekliai pralenkdamas statistinius ir giluminius mokymosi bazines linijas. Atliekant „Zero-Shot“ vertinimą naudojant duomenų rinkinius, neįtrauktus į išankstinį pranešimą, „Chronos“ vis dar lenkia autonominius vietinius statistinius modelius ir net kai kuriuos užduoties išmokytus giluminio mokymosi modelius, parodančius stiprų apibendrinimą. Pavyzdžiui, tikimybiniu prognozavimu jis patenka į viršų tarp kelių konkuruojančių metodų.

„Chronos“ taip pat išsiskiria per savo tikimybines prognozavimo galimybes, sukuria paskirstymus, o ne tik į taškų įvertinimus, kurie suteikia turtingesnę informaciją apie prognozės neapibrėžtumą. Tai prieštarauja kai kuriems klasikiniams modeliams ar deterministiniams prognozavimo metodams, kurie išveda tik vienkartines prognozes.

Be to, „Chronos“ yra suderinta su besikeičiančiomis mašinų mokymosi tendencijomis, kai dominuoja pamatų modeliai ir perdavimo mokymosi metodai. Framavimo laiko eilučių prognozavimas kaip kalbos modeliavimo problema, „Chronos“ atveria integracijos į didelių kalbos modelius (LLMS) ir pamatų modelio tyrimus. Šis dizainas daro jį perspektyvia būsimų naujovių platforma vieningais modeliavimo metodais tarp sričių.

Palyginimai su kitais išankstiniais laiko eilučių modeliais, tokiais kaip „Moirai-1.0-R“, „Lag-Llama“, „LLMTime“, „FRACCASTPFN“ ir tiksliai suderinti GPT-2 modeliai rodo „Chronos“ nuosekliai į priekį ar parą, dažnai pranokdami tai atliekant „Zero-Shot“ užduotis. Po to, kai chronos buvo pritaikytas, rezultatai dar labiau pagerina rezultatus, todėl tai yra viena iš moderniausių prognozių tiek įprastiniuose, tiek nuliniuose šūvio kontekstuose. Šis pranašumas priskiriamas jo mokymui labai įvairiam korpusui kartu su kalbos modeliais pagrįstu ženklo ir prognozės metodu.

Apibendrinant galima pasakyti, kad „Chronos“ išsiskiria iš kitų „Gluonts“ išankstinių modelių, naudodama iš esmės skirtingą architektūrą, įkvėptą „Transformerių“ kalbų modelių, pasitelkdama didelio masto išankstines prieskonines laiko eilutes ir pasiekdamas tvirtą nulinio šaudymo prognozavimo našumą. Tai subalansuoja modelio dydį ir skaičiavimo poreikius su dideliu tikslumu ir bendruoju, palaiko tikimybinį prognozavimą ir tobulinimą bei yra nauja paradigma laiko eilučių prognozavimo sistemose, kurios tilto pažangiai pažeidžia NLP ir laiko eilučių analizę.