Ο Chronos διαφέρει από άλλα προ-εκπαιδευμένα μοντέλα στο Gluonts κυρίως μέσω της θεμελίωσης ως προ-προ-γλωσσικού μοντέλου προσαρμοσμένο για πρόβλεψη χρονοσειρών. Χρησιμοποιεί μια αρχιτεκτονική που βασίζεται σε μετασχηματιστές που σχεδιάστηκε αρχικά για τη μοντελοποίηση της γλώσσας, αλλά επαναπροσδιορίζει αυτό για να ερμηνεύσει και να προβλέψει δεδομένα χρονοσειρών. Αυτή η προσέγγιση έρχεται σε αντίθεση με τα παραδοσιακά και βαθιά εκμάθησης μοντέλα που συνήθως εκπαιδεύονται από το μηδέν σε μεμονωμένα σύνολα δεδομένων ή συλλογές χρονοσειρών ειδικά διαμορφώνονται για πρόβλεψη καθηκόντων.
Το Chronos διατηρεί τις τιμές των χρονικών σειρών σε ένα σταθερό λεξιλόγιο χρησιμοποιώντας κλιμάκωση και κβαντισμό, η οποία του επιτρέπει να εκπαιδεύει μοντέλα γλωσσών με μετασχηματιστή όπως αυτά από την οικογένεια T5 σε μεγάλες και διαφορετικές ομάδες χρονοσειρών. Με τη μετατροπή των προβλέψεων των χρονοσειρών σε ένα πρόβλημα μοντελοποίησης αλληλουχίας παρόμοιο με τη μοντελοποίηση της γλώσσας, ο Χρόνος αξιοποιεί τις προόδους σε προ -γλωσσικά μοντέλα για τα οφέλη πρόβλεψης. Η κατάρτιση χρησιμοποιεί απώλεια διασταυρούμενης εντροπίας σε ένα πιθανό πλαίσιο πρόβλεψης, υποστηρίζοντας τον ποσοτικό προσδιορισμό πλούσιας αβεβαιότητας απευθείας στις εξόδους πρόβλεψης.
Το μοντέλο προ -προετοιμάζεται σε μια εκτεταμένη συλλογή δεδομένων που είναι διαθέσιμα στο κοινό χρονολογικών σειρών, συμπληρωμένα από συνθετικά δεδομένα που δημιουργούνται χρησιμοποιώντας Gaussian διαδικασίες για τη βελτίωση της γενίκευσης. Αυτό το διαφορετικό και μεγάλο προετοιμασμένο σώμα επιτρέπει στον Chronos να αποδίδει καλά σε εργασίες όπου δεν έχει συμβεί καμία εκπαίδευση ειδικών εργασιών, η οποία είναι γνωστή ως πρόβλεψη μηδενικής λήψης. Στις ρυθμίσεις μηδενικού πυροβολισμού, ο Chronos δημιουργεί προβλέψεις για νέες, αόρατες χρονοσειρές με αξιοσημείωτη ακρίβεια, συχνά ταιριάζουν ή ξεπερνούν τα μοντέλα που έχουν εκπαιδευτεί ειδικά σε αυτά τα σύνολα δεδομένων.
Τα μοντέλα Chronos συνήθως συγκρίνονται με δύο ευρείες κατηγορίες μοντέλων: κλασσικές στατιστικές μεθόδους (όπως ARIMA, ETS, εποχιακή αφελές) και εξειδικευμένα μοντέλα βαθιάς μάθησης που εκπαιδεύονται για συγκεκριμένα σύνολα δεδομένων πρόβλεψης (όπως Deepar, TFT, N-Beats και πολλά άλλα). Σε μια ποικιλία σημείων αναφοράς, συμπεριλαμβανομένων 42 συνόλων δεδομένων που καλύπτουν διαφορετικούς τομείς και συχνότητες, το chronos ξεπερνά σταθερά τις κλασσικές βασικές γραμμές και τα περισσότερα μοντέλα βαθιάς μάθησης που αφορούν συγκεκριμένες εργασίες σε σύνολα δεδομένων σε τομέα, όπου έχουν προ-προαναφερθεί. Σε σύνολα δεδομένων μηδενικού πυροβολισμού, εκείνα που δεν παρατηρήθηκαν κατά τη διάρκεια της προκαταρκτικής προκατάληψης, τα μοντέλα Chronos εξακολουθούν να διατηρούν ανταγωνιστικές επιδόσεις, να ξεπεράσουν πολλά τοπικά μοντέλα και να ταιριάζουν με τα κορυφαία μοντέλα βαθιάς μάθησης ειδικά εκπαιδευμένα για αυτά τα καθήκοντα.
Ένας από τους βασικούς διαφοροποιητές είναι η ικανότητα του chronos να λειτουργεί αποτελεσματικά από το κουτί χωρίς να απαιτείται ειδική για την εργασία συντονισμός ή επανεκπαίδευση, επιτρέποντας πολύ απλούστερη και ταχύτερη ανάπτυξη στους αγωγούς πρόβλεψης. Παρ 'όλα αυτά, οι χρήστες μπορούν προαιρετικά να τελειοποιήσουν τα chronos στα δικά τους σύνολα δεδομένων για να βελτιώσουν περαιτέρω την ακρίβεια εάν υπάρχουν επαρκή δεδομένα και υπολογιστικοί πόροι.
Από την άποψη της αρχιτεκτονικής, ο Chronos υιοθετεί το σχεδιασμό του μετασχηματιστή, αλλά το εφαρμόζει σε δεδομένα χρονοσειρών, κωδικοποιώντας τις εισόδους ως μάρκες που αντιπροσωπεύουν κλιμακωτές και κβαντισμένες αριθμητικές τιμές, αντί για λέξεις ή μάρκες κειμένου. Αυτή η προσέγγιση της επιτρέπει να αξιοποιήσει τα πλεονεκτήματα των μετασχηματιστών μοντελοποίησης εξαρτήσεων μεγάλης εμβέλειας και σύνθετων χρονικών μοτίβων, ενώ παράλληλα διαχειρίζονται πιθανότητα αβεβαιότητας.
Τα μοντέλα Chronos έρχονται σε διάφορα μεγέθη, από δεκάδες εκατομμύρια έως εκατοντάδες εκατομμύρια παραμέτρους (20m έως 710m), αντανακλώντας τις συμβιβασμούς μεταξύ της χωρητικότητας του μοντέλου και των υπολογιστικών απαιτήσεων. Παρ 'όλα αυτά, ο Chronos καταφέρνει να διατηρήσει ένα σχετικά μέτριο μέγεθος μοντέλου σε σύγκριση με πολύ μεγάλα μοντέλα γλωσσών, καθιστώντας το προσιτό σε επαγγελματίες με μέτριους πόρους GPU. Αυτό έρχεται σε αντίθεση με κάποια άλλα μεγάλα προ -προ -χρονοσειρά μοντέλα ή σύνολα που μπορεί να απαιτούν πιο σημαντικό υπολογισμό για την κατάρτιση και το συμπέρασμα.
Το σχήμα κατάρτισης περιλαμβάνει ολοκληρωμένες στρατηγικές αύξησης δεδομένων, συμπεριλαμβανομένης της παραγωγής συνθετικών συνθετικών δεδομένων για τη βελτίωση της ευρωστίας μοντέλων σε διάφορους τομείς και τις συχνότητες δειγματοληψίας. Αυτή η συνθετική αύξηση επιτρέπει στο μοντέλο να γενικεύσει τα χαρακτηριστικά των χρονικών σειρών που δεν αντιπροσωπεύονται σε μεγάλο βαθμό στα διαθέσιμα πραγματικά σύνολα δεδομένων.
Από την άποψη του υπολογισμού και της ανάπτυξης, το Chronos είναι ένα μεγάλο μοντέλο και μπορεί να απαιτεί σημαντικούς πόρους για την κατάρτιση και την τελειοποίηση, με την επιτάχυνση της GPU που συνιστάται για την αποτελεσματικότητα. Σε σύγκριση με τα κλασσικά παραδοσιακά μοντέλα, έχει υψηλότερες απαιτήσεις μνήμης και υπολογισμού, αλλά αυτές οι συμβιβασμούς συχνά δικαιολογούνται από τις βελτιωμένες δυνατότητες ακρίβειας και γενίκευσης. Το μέγεθος της εικόνας Docker για την ανάπτυξη του Chronos μπορεί να είναι μεγαλύτερο από τα τυπικά μοντέλα κλασικής μηχανικής μάθησης, τα οποία είναι σημαντικά να εξεταστούν σε περιβάλλοντα παραγωγής με περιορισμούς πόρων ή πολλαπλές παράλληλες περιπτώσεις.
Η απόδοση του Chronos συγκρίνεται προσεκτικά με πολλαπλές αξιολογήσεις. Σε ρυθμίσεις εντός του τομέα όπου τα σύνολα δεδομένων που χρησιμοποιούνται για την επικάλυψη συγκριτικής αξιολόγησης με την προκαταρκτική πρόβλεψη, ο Chronos επιτυγχάνει ακρίβεια πρόβλεψης κορυφαίων σε διάφορες μετρήσεις, ξεπερνά τις στατιστικές και βαθιές βασικές γραμμές μάθησης με συνέπεια. Στην αξιολόγηση μηδενικού πυροβολισμού με σύνολα δεδομένων που εξαιρούνται από την προκαταρκτική προκατάληψη, ο Chronos εξακολουθεί να ξεπερνά τα αυτόνομα τοπικά στατιστικά μοντέλα και ακόμη και ορισμένα μοντέλα βαθιάς μάθησης που έχουν εκπαιδευτεί από εργασίες, δείχνοντας ισχυρή γενίκευση. Για παράδειγμα, σε πιθανολογικές προβλέψεις, κατατάσσεται κοντά στην κορυφή μεταξύ αρκετών ανταγωνιστικών μεθόδων.
Ο Χρόνος διακρίνεται επίσης μέσω των πιθανοτικών δυνατοτήτων πρόβλεψης, δημιουργώντας κατανομές και όχι μόνο εκτιμήσεις σημείων, οι οποίες παρέχουν πλουσιότερες πληροφορίες σχετικά με την αβεβαιότητα των προβλέψεων. Αυτό έρχεται σε αντίθεση με ορισμένα κλασικά μοντέλα ή ντετερμινιστικές προσεγγίσεις πρόβλεψης που εξάγουν μόνο προβλέψεις με μία αξία.
Επιπλέον, ο Χρόνος ευθυγραμμίζεται με τις εξελισσόμενες τάσεις στη μηχανική μάθηση όπου κυριαρχούν τα μοντέλα θεμελίωσης και οι τεχνικές μάθησης μεταφοράς. Με την πρόβλεψη των χρονοσειρών ως πρόβλημα μοντελοποίησης γλωσσών, ο Chronos ανοίγει τις οδούς για την ενσωμάτωση με την πρόοδο σε μεγάλα γλωσσικά μοντέλα (LLMS) και την έρευνα μοντέλου θεμελίωσης. Αυτός ο σχεδιασμός καθιστά μια πολλά υποσχόμενη πλατφόρμα για μελλοντικές καινοτομίες σε ενοποιημένες προσεγγίσεις μοντελοποίησης σε όλους τους τομείς.
Συγκρίσεις με άλλα μοντέλα προ-χρονοσειρών, όπως τα μοντέλα Moirai-1.0-R, Lag-LLAMA, LLMTIME, FEROCASSASTPFN και τελειοποιημένα GPT-2, δείχνουν τα chronos με συνέπεια μπροστά ή από την ισοτιμία, συχνά ξεπερνούν αυτά τα καθήκοντα μηδενικού πυροβολισμού. Η μεταπτυχιακή ρύθμιση του chronos βελτιώνει περαιτέρω τα αποτελέσματα, καθιστώντας το ένα από τα υπερσύγχρονα προβλέψεις τόσο σε συμβατικά όσο και σε μηδενικά περιβάλλοντα. Αυτή η υπεραπόδοση αποδίδεται στην εκπαίδευσή της σε ένα πολύ διαφορετικό σώμα σε συνδυασμό με τη γλωσσική της προσέγγιση που βασίζεται σε μοντέλα.
Συνοπτικά, ο Chronos διαφοροποιείται από άλλα μοντέλα Gluonts, χρησιμοποιώντας μια θεμελιωδώς διαφορετική αρχιτεκτονική εμπνευσμένη από τα μοντέλα γλωσσών μετασχηματιστή, αξιοποιώντας την προκατάληψη μεγάλης κλίμακας σε tokenized χρονοσειρές και την επίτευξη ισχυρής απόδοσης πρόβλεψης μηδενικής λήψης. Εξισορροπεί το μέγεθος του μοντέλου και τις υπολογιστικές ανάγκες με υψηλή ακρίβεια και γενικότητα, υποστηρίζει τις πιθανολογικές προβλέψεις και την τελειοποίηση και αντιπροσωπεύει ένα νέο πρότυπο στα πλαίσια πρόβλεψης των χρονοσειρών που προχωράει η γέφυρα σε NLP και χρονοσειρές.