Przenoszenie średnio zawsze stacjonarne
4.2 Liniowe modele stacjonarne dla szeregów czasowych, w których zmienna losowa nazywana jest innowacją, ponieważ reprezentuje część obserwowanej zmiennej, która jest nieprzewidywalna, biorąc pod uwagę wartości przeszłe. Ogólny model (4.4) zakłada, że jest to wynik filtra liniowego, który przekształca poprzednie innowacje, czyli proces liniowy. To założenie liniowości bazuje na twierdzeniu o rozkładzie Woldsa (Wold 1938), które mówi, że każdy dyskretny stacjonarny proces kowariancji może być wyrażony jako suma dwóch nieskorelowanych procesów, gdzie jest czysto deterministyczny i jest czysto indeterministycznym procesem, który można zapisać jako liniowy. suma procesu innowacji: gdzie znajduje się sekwencja szeregowo nieskorelowanych zmiennych losowych o zerowej średniej i powszechnej wariancji. Warunek jest konieczny dla stacjonarności. Preparat (4.4) jest skończoną reparametryzacją nieskończonej reprezentacji (4.5) - (4.6) ze stałą. Zwykle jest to napisane przez operatora opóźnienia zdefiniowanego przez, który daje krótszą ekspresję: gdzie operator wielomianów opóźnienia jest nazywany odpowiednio wielomianem i wielomianem. Aby uniknąć redundancji parametrów, zakładamy, że nie ma wspólnych czynników między tymi komponentami. Następnie przeanalizujemy wykres szeregu czasowego generowanego przez modele stacjonarne w celu określenia głównych wzorców ich czasowej ewolucji. Rysunek 4.2 zawiera dwie serie wygenerowane z następujących procesów stacjonarnych obliczonych za pomocą kwantu genarma: Rysunek 4.2: Szeregi czasowe generowane przez modele Zgodnie z oczekiwaniami, obie serie czasowe poruszają się wokół stałego poziomu bez zmian wariancji ze względu na nieruchomość nieruchomą. Co więcej, ten poziom jest zbliżony do teoretycznej średniej procesu, a odległość każdego punktu do tej wartości jest bardzo rzadko wykraczająca poza granice. Co więcej, ewolucja serii pokazuje lokalne odejścia od średniej tego procesu, znanej jako średnie zachowanie zwrotne, które charakteryzuje stacjonarne szeregi czasowe. Przeanalizujmy z pewnymi szczegółami właściwości różnych procesów, w szczególności funkcji autokowariancji, która wychwytuje dynamiczne właściwości stochastycznego procesu stacjonarnego. Ta funkcja zależy od jednostek miary, więc zwykłą miarą stopnia liniowości między zmiennymi jest współczynnik korelacji. W przypadku procesów stacjonarnych współczynnik autokorelacji w czasie opóźnienia, oznaczony przez, jest zdefiniowany jako korelacja pomiędzy i: W związku z tym funkcja autokorelacji (ACF) jest funkcją autokowariancji znormalizowaną przez wariancję. Własności ACF są następujące: Z uwagi na właściwość symetrii (4.10), ACF jest zwykle reprezentowana za pomocą wykresu słupkowego na nieujemnych opóźnieniach, który jest nazywany prostym korelogramem. Innym przydatnym narzędziem opisującym dynamikę procesu stacjonarnego jest funkcja częściowej autokorelacji (PACF). Współczynnik częściowej autokorelacji w czasie opóźnienia mierzy liniowe powiązanie i koryguje wpływ wartości pośrednich. Dlatego jest to tylko współczynnik w modelu regresji liniowej: Właściwości PACF są równoważne właściwościom ACF (4.8) - (4.10) i łatwo to udowodnić (Box i Jenkins 1976). Podobnie jak ACF, funkcja częściowej autokorelacji nie zależy od jednostek miary i jest reprezentowana za pomocą wykresu słupkowego na nieujemnych opóźnieniach, które są nazywane korelacjami częściowymi. Właściwości dynamiczne każdego stacjonarnego modelu określają konkretny kształt korelogramów. Co więcej, można pokazać, że dla dowolnego procesu stacjonarnego obie funkcje, ACF i PACF, zbliżają się do zera, ponieważ opóźnienie dąży do nieskończoności. Modele nie zawsze są procesami stacjonarnymi, dlatego konieczne jest najpierw określenie warunków stacjonarności. Istnieją podklasy modeli, które mają specjalne właściwości, więc będziemy je oddzielnie badać. Tak więc, kiedy i, jest to proces białego szumu. kiedy jest to czysty, ruchomy przeciętny proces porządku. i kiedy jest to czysto autoregresyjny proces porządku. . 4.2.1 Proces białego szumu Najprostszym modelem jest proces białego szumu, w którym znajduje się ciąg nieskorelowanych zmiennych średnich zerowych o stałej wariancji. Jest oznaczony przez. Ten proces jest stacjonarny, jeśli jego wariancja jest skończona, ponieważ biorąc pod uwagę, że: weryfikuje warunki (4.1) - (4.3). Co więcej, jest nieskorelowany z upływem czasu, więc jego funkcja autokowariancji jest: Rysunek 4.7 pokazuje dwie symulowane szeregi czasowe wygenerowane z procesów o zerowej średniej i parametrach oraz -0,7, odpowiednio. Parametr autoregresyjny mierzy trwałość przeszłych zdarzeń w bieżących wartościach. Na przykład, jeśli pozytywny (lub negatywny) wstrząs wpływa pozytywnie (lub negatywnie) na dłuższy okres czasu, tym większa jest wartość. Kiedy seria porusza się bardziej zgrubnie wokół średniej ze względu na przemianę w kierunku działania, to jest szok, który wpływa pozytywnie w momencie, ma negatywny wpływ na, pozytywny w. Proces jest zawsze odwracalny i jest nieruchomy, gdy parametr modelu jest ograniczony do regionu. Aby udowodnić stan stacjonarny, najpierw piszemy w formie średniej ruchomej przez rekursywne zastąpienie w (4.14): Rysunek 4.8: Korelogramy populacji dla procesów, to znaczy jest ważoną sumą przeszłych innowacji. Wagi zależą od wartości parametru: kiedy, (lub), wpływ danej innowacji rośnie (lub zmniejsza) w czasie. Biorąc pod uwagę oczekiwania (4.15) w celu obliczenia średniej procesu, otrzymujemy: biorąc pod uwagę, że wynik jest sumą nieskończonych terminów, które zbiegają się dla wszystkich wartości tylko wtedy, gdy w takim przypadku. Podobny problem pojawia się, gdy obliczymy drugą chwilę. Dowód można uprościć, zakładając, że tak jest. Następnie wariancja: znowu wariancja idzie w nieskończoność, z wyjątkiem, w takim przypadku. Łatwo jest sprawdzić, czy zarówno średnia, jak i wariancja eksplodują, gdy warunek ten nie zostanie spełniony. Funkcja autokowariancji w procesie stacjonarnym jest zatem funkcją autokorelacji dla modelu stacjonarnego: to znaczy, że korelogram wykazuje wykładniczy rozkład z wartościami dodatnimi zawsze, jeśli jest dodatni i z ujemnymi dodatnimi oscylacjami, jeśli jest ujemny (patrz rysunek 4.8). Co więcej, tempo zaniku maleje wraz ze wzrostem, więc im większa wartość silniejszej korelacji dynamicznej w procesie. Wreszcie, w pierwszym opóźnieniu występuje odcięcie w częściowej funkcji autokorelacji. Rysunek 4.9: Korelogramy populacyjne dla procesów Można wykazać, że ogólny proces (Box i Jenkins 1976): jest stacjonarny tylko wtedy, gdy korzenie charakterystycznego równania wielomianu leżą poza okręgiem koła. Średnia modelu stacjonarnego to. Jest zawsze odwracalny dla dowolnych wartości parametrów. Jego ACF idzie do zera wykładniczo, gdy korzenie są prawdziwe lub z fluktuacjami fal sinuso-cosinusowych, gdy są one złożone. Jeśli PACF ma wartość odcięcia przy opóźnieniu, to jest. Niektóre przykłady Korelogramy dla bardziej złożonych modeli, takich jak, można zobaczyć na rysunku 4.9. Są bardzo podobne do wzorców, kiedy procesy mają prawdziwe korzenie, ale przyjmują zupełnie inny kształt, gdy korzenie są złożone (patrz pierwsza para grafiki z rysunku 4.9). 4.2.4 Autoregresyjny model średniej ruchomej Ogólny (autoregresyjny) model średniej ruchomej z zamówieniami, to: Modele średniej ruchomej i wykładniczej wygładzania Jako pierwszy krok w wychodzeniu poza modele średnie, modele spacerów losowych i modele trendów liniowych, niesezonowe wzorce i trendy można ekstrapolować za pomocą modelu ruchomego lub wygładzającego. Podstawowym założeniem modeli uśredniania i wygładzania jest to, że szeregi czasowe są lokalnie stacjonarne z wolno zmieniającą się średnią. W związku z tym bierzemy średnią ruchomą (lokalną), aby oszacować aktualną wartość średniej, a następnie wykorzystać ją jako prognozę na najbliższą przyszłość. Można to uznać za kompromis pomiędzy modelem średnim a modelem losowego chodzenia bez dryftu. Ta sama strategia może zostać wykorzystana do oszacowania i ekstrapolacji lokalnego trendu. Średnia ruchoma jest często nazywana wersją quotsmoothedquot oryginalnej serii, ponieważ krótkoterminowe uśrednianie ma wpływ na wygładzenie nierówności w oryginalnej serii. Dostosowując stopień wygładzenia (szerokość średniej ruchomej) możemy mieć nadzieję na uzyskanie optymalnej równowagi między wydajnością modeli średniej i losowej. Najprostszym rodzajem modelu uśredniającego jest. Prosta (równo ważona) Średnia ruchoma: Prognoza wartości Y w czasie t1, która jest dokonywana w czasie t, jest równa prostej średniej z ostatnich obserwacji: (Tu i gdzie indziej będę używał symbolu 8220Y-hat8221, aby stać dla prognozy szeregu czasowego Y dokonanego najwcześniej jak to możliwe wcześniej przez dany model.) Ta średnia jest wyśrodkowana w okresie t - (m1) 2, co oznacza, że oszacowanie średniej lokalnej będzie opóźniać się w stosunku do rzeczywistej wartości wartość średniej lokalnej o około (m1) 2 okresy. Tak więc, mówimy, że średni wiek danych w prostej średniej kroczącej wynosi (m1) 2 w stosunku do okresu, dla którego obliczana jest prognoza: jest to ilość czasu, o którą prognozy będą się opóźniać za punktami zwrotnymi w danych . Na przykład, jeśli uśrednisz 5 ostatnich wartości, prognozy będą o około 3 opóźnienia w odpowiedzi na punkty zwrotne. Zauważ, że jeśli m1, model prostej średniej ruchomej (SMA) jest równoważny modelowi chodzenia swobodnego (bez wzrostu). Jeśli m jest bardzo duże (porównywalne z długością okresu szacowania), model SMA jest równoważny modelowi średniemu. Podobnie jak w przypadku każdego parametru modelu prognostycznego, zwyczajowo koryguje się wartość k, aby uzyskać najlepsze dopasowanie do danych, tj. Średnio najmniejsze błędy prognozy. Oto przykład serii, która wydaje się wykazywać losowe fluktuacje wokół wolno zmieniającej się średniej. Po pierwsze, spróbujmy dopasować go do modelu losowego spaceru, który jest odpowiednikiem prostej średniej kroczącej z 1 słowa: model losowego spaceru bardzo szybko reaguje na zmiany w serii, ale czyniąc to, wybiera dużą część quota w tekście. dane (fluktuacje losowe), a także quotsignalquot (średnia miejscowa). Jeśli zamiast tego spróbujemy prostej średniej kroczącej z 5 terminów, otrzymamy gładszy zestaw prognoz: Pięciokrotna prosta średnia ruchoma daje znacznie mniejsze błędy niż model losowego spaceru w tym przypadku. Średni wiek danych w tej prognozie wynosi 3 ((51) 2), więc ma tendencję do pozostawania w tyle za punktami zwrotnymi o około trzy okresy. (Na przykład, pogorszenie koniunktury zdaje się mieć miejsce w okresie 21, ale prognozy nie zmieniają się aż do kilku kolejnych okresów.) Zwróć uwagę, że długoterminowe prognozy z modelu SMA są prostą poziomą, tak jak w przypadku losowego spaceru Model. Tak więc model SMA zakłada, że nie ma trendu w danych. Jednakże, podczas gdy prognozy z modelu losowego spaceru są po prostu równe ostatniej obserwowanej wartości, prognozy z modelu SMA są równe średniej ważonej ostatnich wartości. Limity ufności obliczone przez Statgraphics dla długoterminowych prognoz prostej średniej kroczącej nie stają się szersze wraz ze wzrostem horyzontu prognozy. To oczywiście nie jest poprawne Niestety, nie istnieje żadna podstawowa teoria statystyczna, która mówi nam, w jaki sposób przedziały ufności powinny poszerzyć się dla tego modelu. Jednak nie jest zbyt trudno obliczyć empiryczne szacunki limitów zaufania dla prognoz o dłuższym horyzoncie. Można na przykład skonfigurować arkusz kalkulacyjny, w którym model SMA byłby używany do prognozowania 2 kroków do przodu, 3 kroków do przodu itp. W próbie danych historycznych. Następnie można obliczyć standardowe odchylenia standardowe błędów w każdym horyzoncie prognozy, a następnie skonstruować przedziały ufności dla prognoz długoterminowych, dodając i odejmując wielokrotności odpowiedniego odchylenia standardowego. Jeśli spróbujemy 9-dniowej prostej średniej kroczącej, otrzymamy jeszcze bardziej wygładzone prognozy i większy efekt opóźniający: Średni wiek to teraz 5 okresów ((91) 2). Jeśli weźmiemy 19-dniową średnią ruchomą, średni wiek wzrośnie do 10: Należy zauważyć, że w rzeczywistości prognozy obecnie pozostają w tyle za punktami zwrotnymi o około 10 okresów. Jaka ilość wygładzania jest najlepsza dla tej serii Oto tabela, która porównuje ich statystyki błędów, w tym także średnią 3-dniową: Model C, 5-punktowa średnia ruchoma, daje najniższą wartość RMSE o niewielki margines w porównaniu z 3 - term i 9-term średnich, a ich inne statystyki są prawie identyczne. Tak więc, wśród modeli z bardzo podobnymi statystykami błędów, możemy wybrać, czy wolelibyśmy nieco większą reakcję, czy nieco większą płynność w prognozach. (Powrót do początku strony.) Browns Simple Exponential Smoothing (wykładniczo ważona średnia ruchoma) Opisany powyżej prosty model średniej ruchomej ma niepożądaną właściwość, że traktuje ostatnie k obserwacji równo i całkowicie ignoruje wszystkie poprzednie obserwacje. Intuicyjnie, przeszłe dane powinny być dyskontowane w bardziej stopniowy sposób - na przykład ostatnia obserwacja powinna mieć nieco większą wagę niż druga ostatnia, a druga ostatnia powinna mieć nieco większą wagę niż trzecia ostatnia; wkrótce. Wykonywany jest prosty model wygładzania wykładniczego (SES). Niech 945 oznacza stałą kwotową (liczbę od 0 do 1). Jednym ze sposobów napisania modelu jest zdefiniowanie serii L, która reprezentuje aktualny poziom (tj. Miejscową średnią wartość) serii oszacowanej na podstawie danych do chwili obecnej. Wartość L w czasie t jest obliczana rekurencyjnie z jego własnej poprzedniej wartości w następujący sposób: Zatem bieżącą wygładzoną wartością jest interpolacja między poprzednią wygładzoną wartością a bieżącą obserwacją, gdzie 945 kontroluje bliskość interpolowanej wartości do najnowszej. obserwacja. Prognoza na następny okres jest po prostu bieżącą wygładzoną wartością: Równoważnie, możemy wyrazić następną prognozę bezpośrednio w odniesieniu do wcześniejszych prognoz i poprzednich obserwacji, w dowolnej z następujących równoważnych wersji. W pierwszej wersji prognozą jest interpolacja między poprzednią prognozą i poprzednią obserwacją: w drugiej wersji następna prognoza jest uzyskiwana przez dostosowanie poprzedniej prognozy w kierunku poprzedniego błędu o wartość 945. jest błąd popełniony przy czas t. W trzeciej wersji prognozą jest ważona ruchoma średnia ważona wykładniczo (tj. Zdyskontowana) ze współczynnikiem dyskontowym 1- 945: Wersja interpolacyjna formuły prognostycznej jest najprostsza do zastosowania, jeśli wdraża się model w arkuszu kalkulacyjnym: pasuje on do pojedyncza komórka i zawiera odwołania do komórek wskazujące poprzednią prognozę, poprzednią obserwację i komórkę, w której przechowywana jest wartość 945. Należy zauważyć, że jeśli model 945 1, model SES jest równoważny modelowi chodzenia swobodnego (bez wzrostu). Jeśli 945 0, model SES jest równoważny modelowi średniemu, przy założeniu, że pierwsza wygładzona wartość jest równa średniej. (Powrót do początku strony.) Średni wiek danych w prognozie wygładzania prostego wykładniczego wynosi 1 945 w stosunku do okresu, dla którego obliczana jest prognoza. (To nie powinno być oczywiste, ale można je łatwo wykazać, oceniając nieskończoną serię.) Dlatego prosta prognoza średniej ruchomej ma tendencję do pozostawania w tyle za punktami zwrotnymi o około 1 945 okresów. Na przykład, gdy 945 0,5 opóźnienie wynosi 2 okresy, gdy 945 ± 0,2 opóźnienie wynosi 5 okresów, gdy 945 ± 0,1 opóźnienie wynosi 10 okresów, i tak dalej. Dla danego średniego wieku (to jest ilości opóźnienia), prosta prognoza wygładzania wykładniczego (SES) jest nieco lepsza od prognozy prostej średniej ruchomej (SMA), ponieważ umieszcza względnie większą wagę w najnowszej obserwacji - ie. jest nieco bardziej obojętny na zmiany zachodzące w niedawnej przeszłości. Na przykład model SMA z 9 terminami i model SES z 945 0.2 mają średnią wieku 5 lat dla danych w swoich prognozach, ale model SES przykłada większą wagę do ostatnich 3 wartości niż model SMA i do w tym samym czasie nie ma on całkowicie 8220forget8222 o wartościach większych niż 9 okresów, jak pokazano na tym wykresie: Kolejną ważną zaletą modelu SES w porównaniu z modelem SMA jest to, że model SES używa parametru wygładzania, który jest nieustannie zmienny, dzięki czemu można go łatwo zoptymalizować za pomocą algorytmu quotsolverquot, aby zminimalizować błąd średniokwadratowy. Optymalna wartość 945 w modelu SES dla tej serii okazuje się być 0,2961, jak pokazano tutaj: Średni wiek danych w tej prognozie wynosi 10,2961 3,4 okresów, co jest podobne do 6-okresowej prostej średniej kroczącej. Prognozy długoterminowe z modelu SES są prostą poziomą. jak w modelu SMA i modelu chodzenia bez wzrostu. Należy jednak zauważyć, że przedziały ufności obliczone przez Statgraphics teraz rozchodzą się w rozsądny sposób, i że są one znacznie węższe niż przedziały ufności dla modelu losowego spaceru. Model SES zakłada, że seria jest w pewnym stopniu przewidywalna, podobnie jak model losowego spaceru. Model SES jest w rzeczywistości szczególnym przypadkiem modelu ARIMA. więc teoria statystyczna modeli ARIMA zapewnia solidną podstawę do obliczania przedziałów ufności dla modelu SES. W szczególności model SES jest modelem ARIMA z jedną niesezonową różnicą, terminem MA (1) i nie ma stałego okresu. inaczej znany jako model DAIMA (0,1,1) bez stałej wartości. Współczynnik MA (1) w modelu ARIMA odpowiada ilości 1-945 w modelu SES. Na przykład, jeśli dopasujesz model ARIMA (0,1,1) bez stałej do analizowanej tutaj serii, szacowany współczynnik MA (1) okaże się równy 0,7029, czyli prawie dokładnie jeden minus 0,2961. Możliwe jest dodanie do modelu SES założenia niezerowego stałego trendu liniowego. Aby to zrobić, po prostu określ model ARIMA z jedną niesezonową różnicą i terminem MA (1) ze stałą, tj. Model ARIMA (0,1,1) ze stałą. Prognozy długoterminowe będą miały tendencję równą średniej tendencji obserwowanej w całym okresie szacowania. Nie można tego zrobić w połączeniu z korektą sezonową, ponieważ opcje korekty sezonowej są wyłączone, gdy typ modelu jest ustawiony na ARIMA. Można jednak dodać stały, długotrwały trend wykładniczy do prostego modelu wygładzania wykładniczego (z korektą sezonową lub bez niego) za pomocą opcji korekty inflacji w procedurze prognozowania. Odpowiednia stopa inflacji (procent wzrostu) na okres może być oszacowana jako współczynnik nachylenia w liniowym modelu trendu dopasowany do danych w połączeniu z logarytmem naturalnym, lub może być oparty na innych, niezależnych informacjach dotyczących długoterminowych perspektyw wzrostu . (Powrót do początku strony.) Browns Linear (tzn. Podwójnie) Exponential Smoothing Modele SMA i modele SES zakładają, że nie ma żadnego trendu w danych (co jest zwykle w porządku lub przynajmniej niezbyt dobre dla 1- prognozy wyprzedzające, gdy dane są stosunkowo hałaśliwe) i mogą być modyfikowane w celu włączenia stałego trendu liniowego, jak pokazano powyżej. A co z trendami krótkoterminowymi Jeśli w serii pojawiają się zmienne stopy wzrostu lub cykliczny wzór, który wyraźnie odróżnia się od hałasu, i jeśli istnieje potrzeba przewidywania z wyprzedzeniem dłuższym niż 1 okres, wówczas można również oszacować trend lokalny. problem. Prosty model wygładzania wykładniczego można uogólnić w celu uzyskania liniowego modelu wygładzania wykładniczego (LES), który oblicza lokalne oszacowania zarówno poziomu, jak i trendu. Najprostszym modelem trendu zmiennym w czasie jest liniowy model wygładzania wykładniczego Browns, który wykorzystuje dwie różne wygładzone serie, które są wyśrodkowane w różnych punktach czasowych. Formuła prognozowania opiera się na ekstrapolacji linii przez dwa ośrodki. (Bardziej wyrafinowana wersja tego modelu, Holt8217s, jest omówiona poniżej.) Algebraiczna postać liniowego modelu wygładzania wykładniczego Brown8217, podobnie jak model prostego wykładniczego wygładzania, może być wyrażana w wielu różnych, ale równoważnych formach. "Norma" w tym modelu jest zwykle wyrażana następująco: Niech S oznacza serie wygładzone pojedynczo, otrzymane przez zastosowanie prostego wygładzania wykładniczego dla szeregu Y. Oznacza to, że wartość S w okresie t jest określona przez: (Przypomnijmy, że w prostym wygładzanie wykładnicze, to byłaby prognoza dla Y w okresie t1.) Następnie pozwól oznaczać podwójnie wygładzoną serię uzyskaną przez zastosowanie prostego wygładzania wykładniczego (używając tego samego 945) do serii S: Na koniec, prognozy dla Y tk. dla każdego kgt1, jest podana przez: To daje e 1 0 (to jest trochę oszukiwać, i niech pierwsza prognoza równa się faktycznej pierwszej obserwacji), i e 2 Y 2 8211 Y 1. po którym prognozy są generowane za pomocą równania powyżej. Daje to takie same dopasowane wartości, jak formuła oparta na S i S, jeśli te ostatnie zostały uruchomione przy użyciu S 1 S 1 Y 1. Ta wersja modelu jest używana na następnej stronie ilustrującej połączenie wygładzania wykładniczego z korektą sezonową. Holt8217s Linear Exponential Smoothing Brown8217s Model LES oblicza lokalne oszacowania poziomu i trendu, wygładzając najnowsze dane, ale fakt, że robi to za pomocą pojedynczego parametru wygładzania, nakłada ograniczenia na wzorce danych, które może dopasować: poziom i trend nie mogą się różnić w niezależnych stawkach. Model LES Holt8217s rozwiązuje ten problem, włączając dwie stałe wygładzania, jedną dla poziomu i drugą dla trendu. W każdej chwili t, jak w modelu Brown8217s, istnieje oszacowanie Lt poziomu lokalnego i oszacowanie T t trendu lokalnego. Tutaj są one obliczane rekurencyjnie od wartości Y obserwowanej w czasie t oraz poprzednich oszacowań poziomu i trendu za pomocą dwóch równań, które oddzielnie stosują wygładzanie wykładnicze. Jeżeli szacowany poziom i tendencja w czasie t-1 to L t82091 i T t-1. odpowiednio, wówczas prognoza dla Y tshy, która zostałaby dokonana w czasie t-1, jest równa L t-1 T t-1. Gdy obserwowana jest wartość rzeczywista, zaktualizowana estymacja poziomu jest obliczana rekurencyjnie poprzez interpolację między Y tshy i jej prognozą L t-1 T t-1, przy użyciu wag o wartości 945 i 1-945. Zmiana szacowanego poziomu, mianowicie L t 8209 L t82091. można interpretować jako hałaśliwy pomiar trendu w czasie t. Zaktualizowane oszacowanie trendu jest następnie obliczane rekursywnie przez interpolację pomiędzy L t 8209 L t82091 a poprzednim oszacowaniem trendu, T t-1. używając ciężarów 946 i 1-946: Interpretacja stałej wygładzania trendu 946 jest analogiczna do stałej wygładzania poziomu 945. Modele o małych wartościach 946 przyjmują, że trend zmienia się bardzo powoli w czasie, natomiast modele z większe 946 zakłada, że zmienia się szybciej. Model z dużym 946 uważa, że odległe jutro jest bardzo niepewne, ponieważ błędy w oszacowaniu trendów stają się dość ważne przy prognozowaniu na więcej niż jeden okres. (Powrót do początku strony.) Stałe wygładzania 945 i 946 można oszacować w zwykły sposób, minimalizując średni błąd kwadratowy prognoz 1-krokowych. Po wykonaniu tej czynności w Statgraphics, szacunkowe wartości wynoszą 945 0,3048 i 946 0,008. Bardzo mała wartość wynosząca 946 oznacza, że model przyjmuje bardzo niewielką zmianę trendu z jednego okresu do drugiego, więc w zasadzie ten model próbuje oszacować długoterminowy trend. Analogicznie do pojęcia średniego wieku danych, które są używane do oszacowania lokalnego poziomu serii, średni wiek danych wykorzystywanych do oszacowania lokalnego trendu jest proporcjonalny do 1 946, chociaż nie jest dokładnie taki sam jak ten. . W tym przypadku okazuje się, że jest to 10.006 125. Nie jest to bardzo dokładna liczba, ponieważ dokładność oszacowania 946 wynosi 2182 tak naprawdę 3 miejsca po przecinku, ale jest tego samego ogólnego rzędu wielkości co wielkość próby 100, więc model ten uśrednia dość długą historię w szacowaniu trendu. Poniższy wykres prognozy pokazuje, że model LES szacuje nieco większy lokalny trend na końcu serii niż stały trend oszacowany w modelu SEStrend. Szacowana wartość 945 jest prawie identyczna z wartością uzyskaną przez dopasowanie modelu SES z trendem lub bez niego, więc jest to prawie ten sam model. Teraz, czy wyglądają one jak rozsądne prognozy dla modelu, który ma oszacować lokalny trend Jeśli wyobrazisz sobie 8220eyeball8221 ten wykres, wygląda na to, że lokalny trend spadł na końcu serii Co się stało Parametry tego modelu zostały oszacowane poprzez zminimalizowanie błędu kwadratów prognoz 1-krok naprzód, a nie prognoz długoterminowych, w którym to przypadku trend doesn8217t robi dużą różnicę. Jeśli wszystko, na co patrzysz, to błędy 1-etapowe, nie widzisz większego obrazu trendów w ciągu (powiedzmy) 10 lub 20 okresów. Aby uzyskać ten model lepiej dopasowany do ekstrapolacji danych przez gałkę oczną, możemy ręcznie dostosować stałą wygładzania trendu, aby wykorzystała krótszą linię podstawową do oszacowania trendu. Na przykład, jeśli zdecydujemy się ustawić 946 0,1, średnia wieku danych wykorzystywanych do oszacowania trendu lokalnego wynosi 10 okresów, co oznacza, że uśredniamy trend w ciągu ostatnich 20 okresów. W tym przypadku wygląda wykres prognozy, jeśli ustawimy 946 0,1, zachowując 945 0,3. Jest to intuicyjnie uzasadnione dla tej serii, chociaż prawdopodobnie ekstrapolowanie tego trendu prawdopodobnie nie będzie dłuższe niż 10 okresów w przyszłości. A co ze statystykami błędów? Oto porównanie modeli dla dwóch modeli pokazanych powyżej oraz trzech modeli SES. Optymalna wartość 945. Dla modelu SES wynosi około 0,3, ale podobne wyniki (z odpowiednio mniejszą lub większą reaktywnością) uzyskuje się przy 0,5 i 0,2. (A) Holts linear exp. wygładzanie z alfa 0,3048 i beta 0,008 (B) Holts linear exp. wygładzanie z alfa 0.3 i beta 0.1 (C) Proste wygładzanie wykładnicze z alfa 0,5 (D) Proste wygładzanie wykładnicze z alfa 0.3 (E) Proste wygładzanie wykładnicze z alfa 0.2 Ich statystyki są prawie identyczne, więc naprawdę nie możemy dokonać wyboru na podstawie błędów prognozy 1-krokowej w ramach próby danych. Musimy odwołać się do innych kwestii. Jeśli mocno wierzymy, że oparcie obecnego szacunku trendu na tym, co wydarzyło się w ciągu ostatnich 20 okresów, ma sens, możemy postawić argumenty za modelem LES z 945 0,3 i 946 0,1. Jeśli chcemy być agnostyczni w kwestii, czy istnieje lokalny trend, to jeden z modeli SES może być łatwiejszy do wyjaśnienia, a także dałby więcej prognoz w połowie drogi na następne 5 lub 10 okresów. (Powrót do początku strony.) Który rodzaj ekstrapolacji trendów jest najlepszy: poziomy lub liniowy Dowody empiryczne sugerują, że jeśli dane zostały już skorygowane (w razie potrzeby) o inflację, może być nieostrożnością ekstrapolować krótkoterminowe liniowe trendy bardzo daleko w przyszłość. Dzisiejsze trendy mogą się w przyszłości zanikać ze względu na różne przyczyny, takie jak starzenie się produktów, zwiększona konkurencja i cykliczne spadki lub wzrosty w branży. Z tego powodu proste wygładzanie wykładnicze często zapewnia lepszą pozapróbkę, niż można by się było tego spodziewać, pomimo cytowania ekwiwalentu trendów poziomych. Tłumione modyfikacje trendów liniowego modelu wygładzania wykładniczego są również często stosowane w praktyce, aby wprowadzić nutę konserwatyzmu do swoich projekcji trendów. Model LES z tłumioną tendencją może być zaimplementowany jako specjalny przypadek modelu ARIMA, w szczególności modelu ARIMA (1,1,2). Możliwe jest obliczenie przedziałów ufności wokół długoterminowych prognoz generowanych przez modele wygładzania wykładniczego, poprzez uznanie ich za szczególne przypadki modeli ARIMA. (Uwaga: nie wszystkie programy poprawnie obliczają przedziały ufności dla tych modeli). Szerokość przedziałów ufności zależy od (i) błędu RMS modelu, (ii) rodzaju wygładzania (prostego lub liniowego) (iii) wartości (s) stałej (ów) wygładzania (-ych) i (iv) liczbę okresów, które prognozujesz. Ogólnie rzecz biorąc, interwały rozkładają się szybciej, gdy 945 staje się większy w modelu SES i rozprzestrzeniają się znacznie szybciej, gdy stosuje się liniowe zamiast prostego wygładzania. Ten temat jest omówiony dalej w sekcji modeli ARIMA notatek. (Powrót do początku strony.) Krótkie wprowadzenie do współczesnej serii czasowej Definicja Szeregi czasowe to funkcja losowa x t argumentu t w zbiorze T. Innymi słowy szereg czasowy jest rodziną zmiennych losowych. x t-1. x t. x t1. odpowiadający wszystkim elementom w zbiorze T, gdzie T ma być zbiorem nieograniczonym, nieskończonym. Definicja Obserwowany szereg czasowy t T e T o T traktowany jest jako część jednej realizacji funkcji losowej x t. Nieskończony zestaw możliwych realizacji, które można było zaobserwować, nazywa się zespołem. Aby bardziej rygorystycznie rzecz ujmować, szereg czasowy (lub funkcja losowa) jest rzeczywistą funkcją x (w, t) dwóch zmiennych w i t, gdzie wW i t T. Jeśli ustalimy wartość w. mamy prawdziwą funkcję x (t w) czasu t, która jest realizacją szeregów czasowych. Jeśli ustalimy wartość t, mamy zmienną losową x (w t). Dla danego punktu w czasie istnieje rozkład prawdopodobieństwa na x. Zatem funkcja losowa x (w, t) może być traktowana jako rodzina zmiennych losowych lub jako rodzina realizacji. Definicja Definiujemy funkcję rozkładu zmiennej losowej w danej t 0 jako P o) x (x). Podobnie możemy zdefiniować wspólny rozkład dla n zmiennych losowych Punkty, które odróżniają analizę szeregów czasowych od zwykłych analiz statystycznych, są następujące (1) Zasadniczą rolę odgrywa zależność między obserwacjami w różnych chronologicznych momentach w czasie. Innymi słowy, kolejność obserwacji jest ważna. W zwykłej analizie statystycznej zakłada się, że obserwacje są wzajemnie niezależne. (2) Domena t jest nieskończona. (3) Musimy wywnioskować z jednej realizacji. Realizacja zmiennej losowej można zaobserwować tylko raz w każdym momencie. W analizie wielowymiarowej mamy wiele obserwacji dotyczących skończonej liczby zmiennych. Ta krytyczna różnica wymaga założenia stacjonarności. Definicja Funkcja losowa x t jest uważana za ściśle stacjonarną, jeśli wszystkie funkcje rozkładu skończonego wymiaru określające x t pozostają takie same, nawet jeśli cała grupa punktów t 1. t 2. t n jest przesuwane wzdłuż osi czasu. Oznacza to, że dla dowolnych liczb całkowitych t 1. t 2. t n i k. Graficznie można sobie wyobrazić realizację serii stacjonarnej jako mającej nie tylko ten sam poziom w dwóch różnych przedziałach, ale także tę samą funkcję rozkładu, aż do parametrów, które ją definiują. Założenie stacjonarności czyni nasze życie prostszym i mniej kosztownym. Bez stacjonarności musielibyśmy często próbować proces w każdym punkcie czasowym, aby uzyskać charakterystykę funkcji rozkładu we wcześniejszej definicji. Stacjonarność oznacza, że możemy skupić naszą uwagę na kilku najprostszych funkcjach numerycznych, tj. Momentach dystrybucji. Centralne momenty są określone przez Definicję (i) Średnia wartość szeregu czasowego t jest t j. Momentem pierwszego rzędu. (ii) Funkcja autokowariancji t to t j. drugi moment wokół średniej. Jeśli ts, masz wariancję x t. Będziemy używać do oznaczenia autokowariancji stacjonarnej serii, gdzie k oznacza różnicę między t i s. (iii) Funkcja autokorelacji (ACF) t jest używana do oznaczenia autokorelacji stacjonarnej serii, gdzie k oznacza różnicę między t i s. (iv) Częściowa autokorelacja (PACF). f kk. jest korelacją między z t i z tk po usunięciu ich wzajemnej liniowej zależności od zmiennych pośrednich z t1. z t2. z tk-1. Jednym prostym sposobem obliczenia częściowej autokorelacji między z t i z tk jest przeprowadzenie dwóch regresji, a następnie obliczenie korelacji między dwoma resztkowymi wektorami. Lub po zmierzeniu zmiennych jako odchyleń od ich średnich, częściowa autokorelacja może być znaleziona jako współczynnik regresji LS dla z t w modelu, w którym kropka nad zmienną wskazuje, że jest mierzona jako odchylenie od jej średniej. (v) Równania Yule-Walkera zapewniają istotną zależność pomiędzy częściowymi autokorelacjami a autokorelacjami. Pomnóż obie strony równania 10 przez z tk-j i spełnij oczekiwania. Ta operacja daje nam następujące równanie różnicowe w autokowariancji lub, jeśli chodzi o autokorelacje Ta pozornie prosta reprezentacja jest naprawdę potężnym wynikiem. Mianowicie, za j1,2. k możemy napisać pełny układ równań, znany jako równania Yule-Walker, Z algebry liniowej wiadomo, że macierz r s ma pełną rangę. Dlatego możliwe jest stosowanie reguły Cramerów kolejno dla k1,2. aby rozwiązać system częściowych autokorelacji. Pierwsze trzy to Mamy trzy ważne wyniki w serii ściśle stacjonarnej. Implikacją jest to, że możemy użyć dowolnej skończonej realizacji sekwencji do oszacowania średniej. Druga . jeśli t jest ściśle stacjonarne, a E t 2 lt. Sugeruje to, że autokowariancja zależy tylko od różnicy między t i s, a nie od ich momentu chronologicznego. W obliczeniach autokowariancji moglibyśmy użyć dowolnej pary interwałów, o ile czas między nimi był stały. I możemy użyć dowolnej skończonej realizacji danych do oszacowania autokowariancji. Po trzecie, funkcja autokorelacji w przypadku ścisłej stacjonarności jest podawana przez. Sugeruje się, że autokorelacja zależy również tylko od różnicy między ti s, i znowu mogą być oszacowane przez dowolną skończoną realizację danych. Jeśli naszym celem jest oszacowanie parametrów opisujących możliwe realizacje szeregów czasowych, to być może ścisła stacjonarność jest zbyt restrykcyjna. Na przykład, jeśli średnia i kowariancje x t są stałe i niezależne od chronologicznego punktu w czasie, to być może nie jest dla nas ważne, aby funkcja rozkładu była taka sama dla różnych przedziałów czasu. Definicja Funkcja losowa jest stacjonarna w szerokim sensie (lub słabo stacjonarna lub stacjonarna w sensie Khinchina lub kowariancja stacjonarna), jeśli m 1 (t) mi m 11 (t, s). Ścisła stacjonarność sama w sobie nie oznacza słabej stacjonarności. Słaba stacjonarność nie oznacza ścisłej stacjonarności. Ścisła stacjonarność z E t 2 lt oznacza słabą stacjonarność. Twierdzenia Ergodyczne dotyczą kwestii niezbędnych i wystarczających warunków do wnioskowania z jednej realizacji szeregu czasowego. Zasadniczo sprowadza się to do przyjęcia słabej stacjonarności. Twierdzenie Jeżeli t jest słabo stacjonarne ze średnią m i funkcją kowariancji, to znaczy, że dla dowolnego danego e gt 0 i h gt 0 istnieje pewna liczba T o taka, że dla wszystkich T gt T o. wtedy i tylko wtedy, gdy Warunkiem koniecznym i wystarczającym jest wymieranie autokowiarian, w którym to przypadku średnia próby stanowi spójny estymator średniej populacji. Wniosek Jeśli t jest słabo stacjonarne z E tk xt 2 lt dla dowolnego t, a E tk xtx tsk x ts jest niezależne od t dla dowolnej liczby całkowitej s, to wtedy i tylko wtedy, gdy A Konsekwencją następstwa jest założenie, że xtx tk jest słabo stacjonarny. Twierdzenie Ergodyczne nie jest niczym więcej jak prawem wielkich liczb, gdy obserwacje są skorelowane. Ktoś mógłby zapytać w tym miejscu o praktyczne implikacje stacjonarności. Najczęstszym zastosowaniem technik szeregów czasowych jest modelowanie danych makroekonomicznych, zarówno teoretycznych, jak i ateistycznych. Jako przykład tego pierwszego można mieć model mnożnika-akceleratora. Aby model był nieruchomy, parametry muszą mieć określone wartości. Test modelu polega wówczas na zebraniu odpowiednich danych i oszacowaniu parametrów. Jeżeli oszacowania nie są zgodne ze stacjonarnością, wówczas należy ponownie przemyśleć model teoretyczny lub model statystyczny, lub oba. Mamy teraz dość maszyn, aby zacząć mówić o modelowaniu jednokierunkowych danych szeregów czasowych. Proces składa się z czterech etapów. 1. budowanie modeli z wiedzy teoretycznej i teoretycznej 2. identyfikacja modeli na podstawie danych (obserwowanych serii) 3. dopasowanie modeli (oszacowanie parametrów modelu (ów)) 4. sprawdzenie modelu Jeśli w czwartym kroku nie jesteśmy zadowolony, że wróciliśmy do pierwszego kroku. Proces jest iteracyjny, dopóki dalsze sprawdzanie i ponowna certyfikacja nie przyniosą dalszej poprawy wyników. Definicja diagramu Niektóre proste operacje obejmują: Operator przesunięcia wstecznego Bx tx t-1 Operator do przodu Fx tx t1 Operator różnicy 1 - B xtxt - x t-1 Operator różnicy zachowuje się w sposób zgodny ze stałą w nieskończonej serii . Oznacza to, że jego odwrotnością jest granica nieskończonej sumy. Mianowicie, -1 (1-B) -1 1 (1-B) 1BB 2. Operator integrujący S -1 Ponieważ jest to odwrotność operatora różnicy, operator integracji służy do konstruowania sumy. BUDOWANIE MODELU W tej sekcji przedstawiamy krótki przegląd najczęstszych rodzajów modeli szeregów czasowych. Na podstawie wiedzy na temat procesu generowania danych wybiera się klasę modeli do identyfikacji i oceny z następujących możliwości. Definicja Załóżmy, że Ex t m jest niezależne od t. Model taki jak z cechami nazywa się autoregresyjnym modelem porządku p, AR (p). Definicja Jeśli zmienna zależna od czasu (proces stochastyczny) t spełnia, wówczas t odpowiada właściwości Markowa. Na LHS oczekiwanie uwarunkowane jest nieskończoną historią x t. Na RHS jest on uwarunkowany tylko w części historii. Z definicji wynika, że model AR (p) jest zgodny z własnością Markowa. Korzystając z operatora wstecznego przesunięcia możemy napisać nasz model AR jako twierdzenie. Warunkiem koniecznym i wystarczającym do tego, aby model AR (p) był stacjonarny, jest to, że wszystkie korzenie wielomianu leżą poza okręgiem koła. Przykład 1 Rozważmy AR (1) Jedynym pierwiastkiem z 1 - f 1 B 0 jest B 1 f 1. Warunek stacjonarności wymaga tego. Jeśli wtedy obserwowana seria okaże się bardzo szalona. Na przykład. rozważmy, w którym termin szumu białego ma rozkład normalny ze średnią zerową i wariancją jednej. Obserwacje zmieniają znak prawie przy każdej obserwacji. Jeśli, z drugiej strony, obserwowana seria będzie znacznie płynniejsza. W tej serii obserwacja ma tendencję do przekraczania 0, jeśli jej poprzednik był powyżej zera. Wariancja e t jest s 2 dla wszystkich t. Wariancja x t. kiedy ma on zero średnie, jest podane przez Ponieważ seria jest stacjonarna, możemy pisać. Stąd funkcja autokowariancji z serii AR (1) jest, zakładając bez utraty ogólności m 0 Aby zobaczyć, jak to wygląda pod względem parametrów AR, skorzystamy z faktu, że możemy napisać xt w następujący sposób Mnożenie przez x tk i przyjmowanie oczekiwań Zauważ, że autokowiary wymierają, gdy rośnie. Funkcja autokorelacji to autokowariancja podzielona przez wariancję terminu szumu białego. Lub,. Stosując wcześniejsze formuły Yule-Walker dla częściowych autokorelacji, które mamy Dla AR (1) autokorelacje wymierają wykładniczo, a częściowe autokorelacje wykazują szczyt z jednym opóźnieniem, a następnie zero. Przykład 2 Rozważmy AR (2) Powiązany wielomian w operatorze lagów. Korzenie można znaleźć za pomocą równania kwadratowego. Korzenie są wtedy, gdy korzenie są prawdziwe i w konsekwencji seria spadnie wykładniczo w odpowiedzi na szok. Kiedy korzenie są złożone, a seria pojawi się jako fala z tłumionym znakiem. Twierdzenie o stacjonarności nakłada następujące warunki na współczynniki AR. Autowariancja dla procesu AR (2), ze średnią zerową, dzieli się przez wariancję xt daje funkcję autokorelacji. Ponieważ możemy pisać podobnie dla drugiego i trzeciego autokorelacji. autokorelacje są rozwiązywane rekurencyjnie. Ich wzór jest sterowany przez korzenie równania różniczkowego liniowego drugiego rzędu. Jeśli korzenie są prawdziwe, wówczas autokorelacje będą się wykładać wykładniczo. Gdy korzenie są złożone, autokorelacje pojawią się jako wytłumiona fala sinusoidalna. Używając równań Yule-Walker, częściowe autokorelacje są ponownie, autokorelacje powoli wymierają. Częściowa autokorelacja z drugiej strony jest dość charakterystyczna. Ma skoki na jednym i dwóch opóźnieniach, a następnie zero. Twierdzenie Jeśli x t jest stacjonarnym procesem AR (p), to może być równoważnie zapisany jako model filtra liniowego. Oznacza to, że wielomian w operatorze przesunięcia wstecznego może być odwrócony, a AR (p) zapisany jako średnia ruchoma nieskończonego rzędu. Przykład Załóżmy, że z t jest procesem AR (1) ze średnią zerową. To, co jest prawdziwe w bieżącym okresie, musi również być prawdziwe w odniesieniu do poprzednich okresów. Tak więc przez rekursywne podstawianie możemy pisać Kwadrat po obu stronach i przyjmować oczekiwania po prawej stronie znikają jako k od f 1. Dlatego suma zbiega się do zt w średniej kwadratowej. Możemy przepisać model AR (p) jako filtr liniowy, o którym wiemy, że jest stacjonarny. Funkcja autokorelacji i częściowo autokorelacja Załóżmy, że stacjonarna seria zt ze średnią zero jest autoregresyjna. Funkcję autokorelacji AR (p) można znaleźć, przyjmując oczekiwania i dzieląc ją przez wariancję z t. Mówi nam to, że rk jest liniową kombinacją poprzednich autokorelacji. Możemy użyć tego w zastosowaniu reguły Cramerów do (i) w rozwiązywaniu dla fkk. W szczególności widzimy, że ta liniowa zależność spowoduje f kk 0 dla k gt p. Ta charakterystyczna cecha autoregresyjnych serii będzie bardzo przydatna, jeśli chodzi o identyfikację nieznanej serii. Jeśli masz MathCAD lub MathCAD Explorer, możesz eksperymentować z niektórymi pomysłami AR (p) przedstawionymi tutaj. Modele średniej ruchomej Rozważmy model dynamiczny, w którym seria zainteresowań zależy tylko od części historii terminu białego szumu. W uproszczeniu może to być reprezentowane jako Definicja Załóżmy, że t jest nieskorelowaną sekwencją i. i.d. zmienne losowe o zerowej średniej i skończonej wariancji. Następnie proces średniej ruchomej rzędu q, MA (q), podaje Twierdzenie: Proces średniej ruchomej jest zawsze stacjonarny. Dowód: Zamiast zacząć od ogólnego dowodu, zrobimy to dla konkretnego przypadku. Załóżmy, że z t jest MA (1). Następnie . Oczywiście t ma zerową średnią i skończoną wariancję. Średnia z t jest zawsze równa zero. Autocowary zostaną podane przez Ciebie. Możesz zobaczyć, że średnia zmiennej losowej w żaden sposób nie zależy od czasu. Można również zauważyć, że autokowariancja zależy tylko od przesunięcia s, a nie od miejsca w serii, którą rozpoczynamy. Możemy udowodnić ten sam wynik bardziej ogólnie, zaczynając od, który ma alternatywną reprezentację średniej ruchomej. Zastanówmy się najpierw nad wariancją z t. Przez rekursywne podstawianie można pokazać, że jest to równe sumie, którą znamy jako szereg zbieżny, więc wariancja jest skończona i niezależna od czasu. Na przykład kowariancje Można również zauważyć, że automatyczne kowariancje zależą tylko od względnych punktów w czasie, a nie od momentu chronologicznego. Naszym wnioskiem z tego wszystkiego jest to, że proces MA () jest stacjonarny. Dla ogólnego procesu MA (q) funkcja autokorelacji jest określona przez funkcję częściowej autokorelacji, która wygasa płynnie. Możesz to zobaczyć, odwracając proces, aby uzyskać proces AR (). Jeśli masz MathCAD lub MathCAD Explorer, możesz eksperymentować interaktywnie z niektórymi przedstawionymi tu ideami MA (q). Autoregresja mieszana - średnia ruchoma Definicja Definicja Załóżmy, że t jest nieskorelowaną sekwencją i. i.d. zmienne losowe o zerowej średniej i skończonej wariancji. Następnie autoregresyjny, ruchomy średni proces porządku (p, q), ARMA (p, q), jest podany przez Korzenie autoregresyjnego operatora muszą wszystkie leżeć poza okręgiem koła. Liczba niewiadomych to pq2. P i q są oczywiste. 2 zawiera poziom procesu, m. i wariancja szumu białego, sa 2. Załóżmy, że łączymy nasze reprezentacje AR i MA tak, że model jest i współczynniki są znormalizowane tak, że bo 1. Wtedy ta reprezentacja jest nazywana ARMA (p, q), jeśli korzenie (1) leżą poza kołem jednostki. Załóżmy, że y t są mierzone jako odchylenia od średniej, abyśmy mogli opuścić o. wtedy funkcja autokowariancji jest wyprowadzana z tego, że jeśli jgtq, a następnie warunki MA ulegną przerwaniu w oczekiwaniu na to, że to jest, funkcja autokowariancji wygląda jak typowy AR dla opóźnień po q wymykają się gładko po q, ale nie możemy powiedzieć, jak 1,2,133, q będzie wyglądać. Możemy również zbadać PACF dla tej klasy modelu. Model można zapisać jako: Możemy to napisać jako proces MA (inf), który sugeruje, że PACF giną powoli. Z pewną arytmetyką możemy pokazać, że dzieje się tak tylko po pierwszych pikach wnoszonych przez część AR. Prawo empiryczne W rzeczywistości stacjonarne szeregi czasowe mogą być reprezentowane przez p 2 i q 2. Jeśli twoim celem jest zapewnienie dobrego przybliżenia rzeczywistości, a dobroć dopasowania jest twoim kryterium, preferowany jest model marnotrawny. Jeśli twoim zainteresowaniem jest skuteczność predykcyjna, preferowany jest model oszczędny. Eksperymentuj z przedstawionymi powyżej pomysłami ARiM z arkuszem MathCADa. Autoregressive Integruj ruchome średnie modele Filtr MA Filtr AR Zintegruj filtr Czasami proces lub seria, którą próbujemy modelować, nie jest stacjonarna na poziomach. Ale może być stacjonarne, powiedzmy, w pierwszych różnicach. Oznacza to, że w swojej pierwotnej postaci autokowiary dla serii mogą nie być niezależne od chronologicznego punktu w czasie. Jeśli jednak skonstruujemy nową serię, która jest pierwszą różnicą w oryginalnej serii, ta nowa seria spełnia definicję stacjonarności. Dzieje się tak często w przypadku danych ekonomicznych, które są bardzo popularne. Definicja Załóżmy, że z t nie jest nieruchomy, ale z t - z t-1 spełnia definicję stacjonarności. Również przy, termin szumu białego ma skończoną średnią i wariancję. Możemy napisać model jako "Ten nazywa się modelem ARIMA (p, d, q). p identyfikuje kolejność operatora AR, d identyfikuje moc. q określa kolejność operatora IZ. Jeśli korzenie f (B) leżą poza okręgiem koła, możemy przepisać ARIMA (p, d, q) jako filtr liniowy. To znaczy. może być zapisany jako MA (). Zastrzegamy sobie dyskusję na temat wykrywania korzeni jednostki dla innej części notatek z wykładu. Rozważmy system dynamiczny z x t jako serią wejściową i y t jako serią wyjściową. W sposób schematyczny Te modele są dyskretną analogią liniowych równań różniczkowych. Przyjmujemy następującą relację, w której b wskazuje na czyste opóźnienie. Przypomnij sobie (1-B). Dokonując tego podstawienia można zapisać model Jeśli współczynnik wielomianu na y t można odwrócić, wówczas model można zapisać jako V (B) znany jako funkcja odpowiedzi impulsowej. Natkniemy się na tę terminologię ponownie w naszej późniejszej dyskusji na temat autoregresji wektorowej. modele kointegracji i korekcji błędów. IDENTYFIKACJA MODELU Po wybraniu klasy modeli należy teraz określić kolejność procesów generujących dane. Oznacza to, że najlepiej jest odgadnąć kolejność procesów AR i MA napędzających stacjonarne serie. Seria stacjonarna jest całkowicie scharakteryzowana przez średnią i autokowariancje. Ze względów analitycznych zwykle pracujemy z autokorelacjami i częściowymi autokorelacjami. Te dwa podstawowe narzędzia mają unikalne wzorce dla stacjonarnych procesów AR i MA. Można obliczyć przykładowe oszacowania funkcji autokorelacji i częściowej autokorelacji i porównać je z wynikami w tabelach dla modeli standardowych. Funkcja autokorelacji próbki Funkcja autokorelacji Przykładowe częściowe autokorelacje będą Używać autokorelacji, a częściowe autokorelacje są zasadniczo proste. Załóżmy, że mamy serię z t. ze średnią zerową, czyli AR (1). Gdybyśmy mieli uruchomić regresję z t2 na z t1 i z t, spodziewalibyśmy się, że współczynnik na z t nie różni się od zera, ponieważ ta częściowa autokorelacja powinna wynosić zero. Z drugiej strony, autokorelacje dla tej serii powinny maleć wykładniczo dla wzrastających opóźnień (patrz przykład AR (1) powyżej). Załóżmy, że seria jest naprawdę średnią ruchomą. Autokorelacja powinna wynosić zero wszędzie, ale przy pierwszym opóźnieniu. Częściowa autokorelacja powinna wygasnąć wykładniczo. Nawet od bardzo pobieżnego omówienia podstaw analizy szeregów czasowych jest oczywiste, że istnieje dwoistość między procesami AR i MA. Ta dwoistość może zostać podsumowana w poniższej tabeli.
Comments
Post a Comment