Szereg czasowy to ciąg obserwacji pokazujący kształtowanie się badanego zjawiska w kolejnych okresach (dniach, miesiącach, kwartałach, latach, itp.). W szeregu czasowym można wyodrębnić kilka składowych będących wynikiem wpływu różnych czynników na dane zjawisko.
Wyróżnia się następujące składowe szeregów czasowych:
- Tendencja rozwojowa, zwana trendem, wyraża długookresową skłonność do jednokierunkowych zmian (wzrostu lub spadku) wartości badanej zmiennej. Jest rozpatrywana jako konsekwencja działania stałego zestawu czynników.
- Wahania cykliczne (składowa cykliczna) wyrażają się w postaci długookresowych, rytmicznych wahań wartości szeregu wokół tendencji rozwojowej. Wiąże się je zwykle z cyklem koniunkturalnym gospodarki.
- Wahania sezonowe (składowa sezonowa) są wahaniami wartości szeregu wokół jego tendencji rozwojowej o okresie nie przekraczającym jednego roku. Reprezentują efekty powtarzające się z pewną prawidłowością, co roku w tych samych okresach. Odzwierciedlają zwykle wpływ pogody (związane głównie z następstwem pór roku) lub kalendarza. Efekty wynikające z wpływu kalendarza mogą odzwierciedlać: różnice pomiędzy długością (liczbą dni) poszczególnych okresów - 28, 29, 30, 31 dni dla miesięcy, 90, 91, 92, 93 dla kwartałów, różnice pomiędzy liczbą różnych dni tygodnia w okresie, strukturę dni wolnych uwzględniającą święta ruchome i święta narodowe itp.
Wymienione składowe określa się mianem systematycznych, tworzą bowiem systematyczną część szeregu, tzn. możliwą do objaśnienia.
- Część resztowa, tj. nie podlegająca objaśnieniu (nie dająca się przypisać do wymienionych źródeł zmienności) nazywana jest składową przypadkową (niesystematyczną). Zawiera ona przypadkowe wahania szeregu wokół części systematycznej, które trudno jest zidentyfikować a priori.
Składowe szeregu czasowego połączone mogą być związkiem
- addytywnym,
- multiplikatywnym,
- addytywno-multiplikatywnym.
W przypadku sezonowości addytywnej mamy do czynienia z efektami sezonowymi polegającymi na zaniżeniu lub zawyżeniu wartości zjawiska w okresach tego samego typu, np. we wszystkich styczniach, czy np. w II kwartale każdego roku, o w przybliżeniu stałą wartość przez cały czas obserwacji. W przypadku sezonowości multiplikatywnej efekty sezonowe są w przybliżeniu stałe w ujęciu procentowym, tzn. gdy większe są wartości zjawiska, to większe i wahania sezonowe. Wskaźnik addytywny jest dodawany do wartości trendu, multiplikatywny mnożony.
Występowanie w szeregu czasowym składowej sezonowej prowadzi do problemów z interpretowaniem zmian zjawiska z okresu na okres. Aby właściwie analizować aktualne tendencje dotyczące wskaźników krótkookresowych, konieczne jest wyeliminowanie wpływów sezonowych, w przeciwnym razie uprawnione jest ich porównanie tylko dla okresów jednoimiennych (np. styczeń 2004 do stycznia 2003) i tylko wewnątrz danego kraju.
Wyrównanie sezonowe szeregu czasowego polega na usunięciu z szeregu składowej sezonowej (szereg wyrównany jest to złożenie wszystkich składowych poza składową sezonową). Aby można było wykonać tę operację, należy, w przypadku większości metod wyrównania sezonowego, wyodrębnić wszystkie składowe, a więc dokonać dekompozycji.
Główne etapy dekompozycji szeregu czasowego obejmują procedurę wyrównań wstępnych (rozszerzenie wartości szeregu na jego końcach, badanie charakteru związku pomiędzy składowymi, wykrywanie wartości odstających, korekta dniami roboczymi/handlowymi, wstępna identyfikacja modelu), dekompozycję na składowe nieobserwowalne i wyrównanie sezonowe, przyporządkowanie efektów regresji do poszczególnych składowych i diagnostyki. Wszystkie te etapy zależą od wyborów dokonywanych przez wbudowany algorytm (w procedurze automatycznej) lub - w znacznej części - są dokonywane przez użytkownika pakietu statystycznego.
Procedura wyrównań sezonowych zwykle składa się z dwóch etapów. Pierwszy jest określany jako etap eliminacji wstępnej, w drugim dokonuje się właściwa dekompozycja i eliminowanie wpływów sezonowych.
Procedury wstępne testują między innymi możliwość zastosowania transformacji logarytmicznej (czy związek ma charakter addytywny czy multiplikatywny), poszukują wartości odstających (AO - np. strajk, anomalie pogodowe, błędy wprowadzania), zmian poziomu (LS - np. zmiany nomenklatury, zmiany w definicjach), zmian tymczasowych czyli zmian poziomu w określonym przedziale czasu (TC), testują regresory dla wszystkich dni tygodnia, efektu Wielkanocy i struktury dni wolnych, dokonują wstępnej identyfikacji modelu ARIMA.
Często rzeczywiste szeregi są trudne do modelowania, ponieważ zawierają bardzo nieregularne zdarzenia, których istota sprawia, że nie powinny być modelowane. Dlatego te obserwacje są usuwane aby uniknąć zniekształceń w analizie szeregów.
Dzięki procedurom wstępnym możliwe staje się "wyczyszczenie" szeregu z tych efektów, tzn. uzyskanie takich danych, jak gdyby te efekty nie miały miejsca (ze względu na nie można wyrównać szereg analogicznie jak ma to miejsce w przypadku wyrównania sezonowego). Analiza wszystkich wymienionych tu efektów i usuwanie ich wpływu z szeregu obserwacji stanowi etap wyrównania wstępnego (pre-adjustment).
Szczególne znaczenie dla obydwu procedur ma identyfikacja modelu. Model powinien możliwie najlepiej opisywać badaną rzeczywistość i być uwiarygodniony przez odpowiednie testy statystyczne, dostępne dla analityka w procedurach wyrównań. Biorąc pod uwagę postulat stabilności wskazane jest również unikanie częstych zmian modelu.
W praktyce, dwiema powszechnie używanymi procedurami stosowanymi do wyrównań sezonowych są:
- X12-ARIMA jest rozwinięciem systemów X11-ARIMA i X11-ARIMA/88. Dekompozycja, czyli wyodrębnienie składowych (trend, składowa cykliczna, składowa sezonowa, składowa resztowa) odbywa się przez zastosowanie odpowiedniego algorytmu, opartego na wykorzystaniu filtrów średnich ruchomych, często nazywanych filtrami typu X-11. Chociaż w nazwie procedury występuje termin ARIMA (Autoregressive Integrated Moving Average), to model wykorzystywany jest jedynie do estymacji współczynników regresji i przedłużania szeregu po to, aby uzyskać wartości teoretyczne potrzebne do obliczenia średnich ruchomych na krańcach szeregu.
- Metoda Tramo/Seats (TRAMO - Time series Regression with ARIMA noise, Missing observations, and Outliers/ SEATS - Signal Extraction in ARIMA Time Series). Tramo/Seats jest metodą ściśle opartą na metodologii ARIMA wykorzystując ją nie tylko jako pomocnicze narzędzie prognozowania i wygładzania szeregu, lecz także jako podstawowe narzędzie właściwej dekompozycji (wydzielenia składowych).
Obydwie procedury wyrównywań sezonowych szeregów czasowych są rekomendowane przez Eurostat. W Głównym Urzędzie Statystycznym do wyrównań sezonowych publikowanych szeregów czasowych wykorzystywana jest metoda Tramo/Seats.
Kontakt w GUS:
Katarzyna Walkowska k.walkowska@stat.gov.pl,
Grzegorz Kurowski g.kurowski@stat.gov.pl
Wybrane strony internetowe zawierające informacje nt. wyrównywania sezonowego szeregów czasowych:
Eurostat - http://www.forum.europa.eu.int/Public/irc/dsis/eurosam/home
Bank of Spain (Tramo/Seats) - http://www.bde.es/servicio/software/econome.htm
Census Bureau (X12-ARIMA) - http://www.census.gov/srd/www/x12a/