Chronos, một bộ mô hình được đào tạo trước trong GluonTS, khác với các mô hình được đào tạo trước khác ở một số điểm chính:
1. Dự báo không có lần bắn: Chronos được thiết kế để dự báo chuỗi thời gian không có lần bắn, nghĩa là nó có thể tạo ra các dự đoán xác suất chính xác cho chuỗi thời gian mới chưa từng thấy trong quá trình đào tạo. Điều này trái ngược với các mô hình khác yêu cầu tinh chỉnh trên các bộ dữ liệu cụ thể để đạt được hiệu suất tốt[1] [2].
2. Kiến trúc mô hình ngôn ngữ: Mô hình Chronos dựa trên kiến trúc mô hình ngôn ngữ, mã hóa các giá trị chuỗi thời gian thành các nhóm và coi chúng là mã thông báo. Cách tiếp cận này cho phép xử lý và dự đoán hiệu quả dữ liệu chuỗi thời gian mới[2] [3].
3. Đào tạo trước: Các mô hình Chronos được đào tạo trước trên một kho lớn dữ liệu chuỗi thời gian nguồn mở được tăng cường bằng các kỹ thuật tạo dữ liệu tổng hợp. Quá trình đào tạo trước này cho phép các mô hình tìm hiểu các mẫu và tính năng chung trong dữ liệu chuỗi thời gian có thể áp dụng cho dữ liệu mới, chưa được nhìn thấy[2] [3].
4. Kích thước mẫu: Mẫu Chronos có năm kích cỡ: nhỏ (thông số 8M), nhỏ (20M), nhỏ (46M), cơ sở (200M) và lớn (710M). Các kích thước này cung cấp các mức độ phức tạp và yêu cầu tính toán khác nhau, với các mô hình lớn hơn yêu cầu phần cứng mạnh hơn để suy luận hiệu quả [2].
5. Suy luận: Không giống như các mẫu khác, mẫu Chronos không thực hiện đào tạo theo nhiệm vụ cụ thể. Thay vào đó, họ thực hiện một phép tính tốn kém hơn trong quá trình suy luận có tỷ lệ tuyến tính với số chuỗi thời gian trong tập dữ liệu. Điều này làm cho chúng phù hợp với các nhiệm vụ dự báo quy mô lớn, không cần thực hiện [2].
6. Tinh chỉnh: Mặc dù các mẫu Chronos được thiết kế để đạt hiệu suất không bắn, nhưng chúng có thể được tinh chỉnh trên các tập dữ liệu cụ thể để cải thiện hơn nữa độ chính xác của chúng. Việc tinh chỉnh này có thể được thực hiện bằng cách sử dụng các công cụ và kỹ thuật học sâu phổ biến [3].
Tóm lại, Chronos nổi bật so với các mô hình được đào tạo trước khác trong GlaonTS do tập trung vào dự báo không bắn, kiến trúc mô hình ngôn ngữ, đào tạo trước và khả năng suy luận hiệu quả. Những tính năng này làm cho nó trở thành một công cụ mạnh mẽ để xử lý dữ liệu chuỗi thời gian quy mô lớn, chưa được nhìn thấy.
Trích dẫn:[1] https://ts.gluon.ai/stable/
[2] https://auto.gluon.ai/stable/tutorials/timeseries/forecasting-chronos.html
[3] https://arxiv.org/html/2403.07815v1
[4] https://github.com/awslabs/gluonts
[5] https://ts.gluon.ai/stable/tutorials/forecasting/quick_start_tutorial.html