Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Chronos, gluonts'daki diğer önceden eğitilmiş modellerden nasıl farklıdır?


Chronos, gluonts'daki diğer önceden eğitilmiş modellerden nasıl farklıdır?


Chronos, zaman serisi tahmini için uyarlanmış ön hazırlıklı bir dil modeli olarak temel olarak temel olarak Gluonts'taki diğer önceden eğitilmiş modellerden farklıdır. Başlangıçta dil modellemesi için tasarlanmış transformatör tabanlı bir mimari kullanır, ancak zaman serisi verilerini yorumlamak ve tahmin etmek için bunu yeniden amaçlamaktadır. Bu yaklaşım, tipik olarak bireysel veri kümelerinde sıfırdan eğitilmiş geleneksel ve derin öğrenme modellerini veya tahmin görevleri için özellikle biçimlendirilmiş zaman serileri koleksiyonları ile zıttır.

Chronos, zaman serisi değerlerini, büyük ve çeşitli zaman serileri Corpora'da T5 ailesinden olanlar gibi transformatör tabanlı dil modellerini eğitmeye izin veren ölçeklendirme ve nicemleme kullanarak sabit bir kelime dağarcığına dönüştürür. Zaman serisi tahminlerini dil modellemesine benzer bir dizi modelleme problemine dönüştürerek Chronos, tahmini avantajlar için ön planlı dil modellerindeki ilerlemeleri kullanır. Eğitim, olasılıksal bir tahmin çerçevesinde entropi kaybı kullanır ve zengin belirsizlik miktarını doğrudan tahmin çıktılarında destekler.

Model, genellemeyi geliştirmek için Gauss süreçleri kullanılarak üretilen sentetik verilerle desteklenen, halka açık zaman serisi veri kümelerinin kapsamlı bir koleksiyonunda önlenmiştir. Bu çeşitli ve büyük önyargılı korpus, Chronos'un sıfır atlama tahmini olarak bilinen göreve özgü bir eğitimin gerçekleşmediği görevler üzerinde iyi performans göstermesini sağlar. Sıfır atış ayarlarında, Chronos, yeni, görünmeyen zaman serileri için olağanüstü bir doğrulukla tahminler oluşturur, genellikle bu veri kümeleri üzerinde özel olarak eğitilmiş modelleri eşleştirir veya aşar.

Chronos modelleri tipik olarak iki geniş model sınıfı ile karşılaştırılır: klasik istatistiksel yöntemler (ARIMA, ETS, mevsimsel saf) ve belirli tahmin veri kümeleri (Deepar, TFT, N-Beats ve daha fazlası gibi) için eğitilmiş özel derin öğrenme modelleri. Farklı alan ve frekansları kapsayan 42 veri kümesi de dahil olmak üzere çeşitli kriterlerde, kronolar klasik taban çizgilerinin ve ön hazırlıklı durumlarda alan içi veri kümelerinde göreve özgü derin öğrenme modellerinin çoğunu sürekli olarak daha iyi performans gösterir. Sıfır gösterim veri kümelerinde, önyargı sırasında görülmeyenler, Chronos modelleri hala rekabetçi performansı koruyor, birçok yerel modelden daha iyi performans gösteriyor ve bu görevler için özel olarak eğitilmiş en iyi derin öğrenme modellerini eşleştiriyor.

Anahtar farklılaştırıcılardan biri, Chronos'un göreve özgü ayarlama veya yeniden eğitim gerektirmeden, boru hatlarını tahmin etmede çok daha basit ve daha hızlı dağıtım yapılmasını sağlayan kutudan etkili bir şekilde çalışabilme yeteneğidir. Bununla birlikte, kullanıcılar yeterli veri ve hesaplama kaynakları mevcutsa doğruluğu daha da artırmak için isteğe bağlı olarak Chronos'u kendi veri kümelerinde ince ayar yapabilirler.

Mimarlık açısından Chronos, transformatör tasarımını benimser, ancak girişleri kelimeler veya metin jetonlarından ziyade ölçekli ve nicelenmiş sayısal değerleri temsil eden jetonlar olarak kodlayarak zaman serisi verilerine uygular. Bu yaklaşım, transformatörlerin uzun menzilli bağımlılıkları ve karmaşık zamansal kalıpları modelleyen güçlü yanlarından yararlanırken, aynı zamanda belirsizliği olasılıkla yönetir.

Chronos modelleri, model kapasitesi ve hesaplama talepleri arasındaki değiş tokuşları yansıtan on milyonlarca milyondan yüz milyonlarca parametreye (20m ila 710m) çeşitli boyutlarda gelir. Buna rağmen Chronos, çok büyük dil modellerine kıyasla nispeten ılımlı bir model boyutunu korumayı başarıyor ve bu da onu mütevazı GPU kaynaklarına sahip uygulayıcılar için erişilebilir hale getiriyor. Bu, eğitim ve çıkarım için daha önemli bir hesaplama gerektirebilecek diğer büyük ön hazırlıklı zaman serisi modelleri veya toplulukları ile tezat oluşturur.

Eğitim rejimi, farklı alanlarda ve örnekleme frekanslarında model sağlamlığını artırmak için sentetik veri kümesi üretimi de dahil olmak üzere kapsamlı veri büyütme stratejileri içerir. Bu sentetik büyütme, modelin mevcut gerçek veri kümelerinde yoğun bir şekilde temsil edilmeyen zaman serisi özelliklerine genelleştirmesini sağlar.

Hesaplamalı ve dağıtım açısından, Chronos büyük bir modeldir ve verimlilik için GPU hızlanması ile eğitim ve ince ayar için önemli kaynaklar gerektirebilir. Klasik geleneksel modellerle karşılaştırıldığında, daha yüksek çıkarım belleği ve hesaplama gereksinimlerine sahiptir, ancak bu değiş tokuşlar genellikle iyileştirilmiş doğruluk ve genelleme yetenekleri ile haklıdır. Chronos'u dağıtmak için Docker görüntü boyutu, kaynak kısıtlamaları veya çoklu paralel örneklerle üretim ortamlarında dikkate alınması gereken tipik klasik makine öğrenme modellerinden daha büyük olabilir.

Chronos'un performansı çoklu değerlendirmelerde dikkatlice kıyaslanıyor. Kıyaslama için kullanılan veri kümelerinin ön planlama ile örtüştüğü alan içi ayarlarda, Chronos çeşitli metriklerde üst sıradaki tahmin doğruluğu elde eder, istatistiksel ve derin öğrenme taban çizgilerini tutarlı bir şekilde daha iyi performans gösterir. Ön işlemden hariç tutulan veri kümeleri ile sıfır atış değerlendirmesinde, Chronos hala bağımsız yerel istatistiksel modellerden ve hatta bazı görev eğitimli derin öğrenme modellerinden daha iyi performans göstermektedir ve güçlü genelleme göstermektedir. Örneğin, olasılıksal tahminlerde, birkaç rakip yöntem arasında tepenin yakınında yer alır.

Chronos, olasılıksal tahmin yetenekleri ile kendini ayırt eder, tahmin belirsizliği hakkında daha zengin bilgiler sağlayan sadece nokta tahminlerinden ziyade dağılımlar üretir. Bu, sadece tek değerli tahminleri üreten bazı klasik modeller veya deterministik tahmin yaklaşımlarıyla tezat oluşturur.

Ek olarak, Chronos, temel modellerin ve transfer öğrenme tekniklerinin hakim olduğu makine öğreniminde gelişen eğilimlerle uyumludur. Bir dil modelleme problemi olarak zaman serisi tahminlerini çerçeveleyerek Chronos, büyük dil modellerindeki gelişmelerle (LLMS) ve vakıf modeli araştırmalarıyla entegrasyon yolları açar. Bu tasarım onu ​​alanlardaki birleşik modelleme yaklaşımlarında gelecekteki yenilikler için umut verici bir platform haline getiriyor.

Moirai-1.0-R, Lag-Llama, LLMTime, ForecastPFN ve ince ayarlı GPT-2 modelleri gibi diğer ön zaman serisi modelleriyle karşılaştırma, kronoları sürekli olarak önde veya eşit olarak gösterir ve bunları sıfır gösterim görevleri için sık sık aşar. Chronos'un prespraice sonrası ince ayarlanması sonuçları daha da iyileştirir, bu da onu hem geleneksel hem de sıfır atış bağlamlarında son teknoloji tahminlerden biri haline getirir. Bu performans, dil modeli tabanlı tokenize ve tahmin yaklaşımı ile birlikte çok çeşitli bir ceset üzerindeki eğitimine atfedilir.

Özetle, Chronos, transformatör dili modellerinden esinlenen temel olarak farklı bir mimari kullanarak, tokenize edilmiş zaman serilerinde büyük ölçekli önyargılardan yararlanarak ve sağlam sıfır atlama tahmin performansı elde ederek kendisini diğer Gluonts ön kaynaklı modellerden ayırır. Model boyutu ve hesaplama ihtiyaçlarını yüksek doğruluk ve genellikle dengeler, olasılık tahminini ve ince ayarlamayı destekler ve NLP ve zaman serisi analizinde ilerlemeleri köprüleyen zaman serileri tahmin çerçevelerinde yeni bir paradigmayı temsil eder.