Friday 24 November 2017

Autoregresywno Ruchome Średnia Modelowa Definicja


Autoregresywna średnia ruchoma - ARIMA. Definicja autoregresji zintegrowanej średniej ruchomej - ARIMA. A model statystyczny, który wykorzystuje dane szeregowe do przewidywania przyszłych trendów Jest to forma analizy regresji, która ma na celu przewidywanie przyszłych ruchów wzdłuż pozornie losowego chodu prowadzonego przez zapasy a rynek finansowy, analizując różnice między wartościami w szeregu zamiast używać rzeczywistych wartości Znaczenie różnicowanych serii jest określane jako autoregresywne i opóźnienia w przewidywanych danych są określane jako średnia ruchoma. BREAKING DOWN Autoregresywna średnia ruchoma - ARIMA . Ten typ modelu zazwyczaj nazywany jest ARIMA p, d, q, z liczbami całkowitymi odnoszącymi się do autoregresywnych zintegrowanych i przeciętnych części danych zestawu danych, odpowiednio modelowanie ARIMA może uwzględniać trendy, cykle sezonowości, błędy i niestacjonarne aspekty zestawu danych podczas prognozowania. RIMA oznacza autoregresywną zintegrowaną średnią przemieszczania modele Jednostka jednowymiarowa ARIMA jest techniką prognozowania, która przewiduje przyszłe wartości serii oparte całkowicie na własnej bezwładności Jego główna aplikacja dotyczy obszaru prognoz krótkoterminowych wymagających co najmniej 40 historycznych punktów danych Działa najlepiej, gdy dane są stabilne lub spójny wzorzec w czasie z minimalną ilością odstępów Czasami nazywany Box-Jenkins po pierwotnych autorach, ARIMA jest zwykle lepszy od technik wygładzania wykładniczego, gdy dane są dość długie i korelacja między obserwacjami jest stabilna Jeśli dane są krótkie lub wysoce zmienna, a następnie niektóre metody wyrównywania mogą działać lepiej Jeśli nie masz co najmniej 38 punktów danych, należy rozważyć inną metodę niż ARIMA. Pierwszym krokiem w stosowaniu metodologii ARIMA jest sprawdzenie stacjonarności. Stacjonarność sugeruje, że serie pozostają w dość stały poziom w czasie Jeśli trend istnieje, podobnie jak w większości aplikacji ekonomicznych lub biznesowych, dane są NIE stat jonaryczne Dane powinny również wykazywać stałą wahania wahań w czasie Z łatwością widać to serie, które są mocno sezonowe i rosną w szybszym tempie W takim przypadku wzrosty i upływy sezonowości staną się bardziej dramatyczne w czasie Bez te warunki stacjonarności są spełnione, wiele obliczeń związanych z procesem nie może być obliczane. Jeżeli graficzna mapa danych wskazuje na brak ciągliwości, to należy różnicować serię Differencing jest doskonałym sposobem przekształcania serii niestacjonarnych w stacjonarne zrobione przez odjęcie obserwacji w bieżącym okresie od poprzedniego Jeśli transformacja jest wykonywana tylko raz na szereg, mówisz, że dane zostały najpierw differenced Ten proces zasadniczo eliminuje trend, jeśli seria rośnie w dość stałą szybkość Jeśli rośnie z coraz szybszym tempem, możesz zastosować tę samą procedurę i różnicę danych znowu Twoje dane będą drugie nced. Autokorelacje są wartościami liczbowymi, które wskazują, jak serie danych są powiązane ze sobą z upływem czasu Dokładniej, mierzy, jak silne wartości danych w określonej liczbie okresów są ze sobą skorelowane z czasem Liczba okresów oddzielonych zwykle nazywana jest opóźnieniem przykład autokorelacja w punkcie 1 opóźnia korelację między wartościami okresu 1 w stosunku do siebie w całej serii. Autokorelacja w punkcie 2 mierzy, jak dane między dwoma okresami są skorelowane w całej serii Autokorelacje mogą wahać się od 1 do -1 A w przybliżeniu 1 wskazuje na wysoką dodatnią korelację, przy czym wartość zbliżona do -1 sugeruje wysoką ujemną korelację Te działania są najczęściej oceniane za pomocą graficznych działek zwanych skorelagami. Korelagram przedstawia wartości autokorelacji dla danej serii w różnym opóźnieniu. Jest to określane jako funkcji autokorelacji i jest bardzo ważna w metodzie ARIMA. Metodologia metodyARIMA próbuje opisać ruchy w a stacjonarne szeregy czasowe w funkcji tzw. parametrów autoregresywnych i ruchomych średnich Parametry te określa się jako parametry AR, autoregesywne i parametry MA przenoszące średnie. Model AR z tylko jednym parametrem może być zapisany jako. gdzie seria czasowa X t została zbadana. A 1 autoregresywny parametr rzędu 1.X t-1 szereg czasowy opóźniał się o jeden okres. E t termin błędu modelu. Oznacza to w prosty sposób, że każda wartość Xt może być wyjaśniona przez pewną funkcję jego poprzedniej wartości, X t - 1, plus niewyjaśniony błąd losowy, E t Jeśli szacunkowa wartość A 1 wyniosła 30, wówczas aktualna wartość serii będzie związana z 30 jego wartości 1 przedziału czasowego Oczywiście, seria może być związana z czymś więcej niż tylko jedna z poprzednich wartości Na przykład. X t A 1 X t-1 A 2 X t-2 E t. Wskazuje to, że bieżącą wartością serii jest kombinacja dwóch poprzednich wartości, X t-1 i X t - 2 plus kilka przypadkowych błędów E t Nasz model jest teraz autoregresywnym modelem zamówienia 2.Moving Aver wiek modeli. Drugi typ modelu Box-Jenkins nazywa się modelem średniej ruchomości. Choć modele te wyglądają bardzo podobnie do modelu AR, pojęcie za nimi jest zupełnie inne. Ruchome średnie parametry dotyczą tego, co dzieje się w okresie t tylko do przypadkowych błędów , tzn. E t-1, E t-2 itd., a nie do X t-1, X t-2, Xt-3, jak w podejściach autoregresywnych. następująco. Termin B 1 nazywany jest MA o kolejności 1 Znak negatywny przed parametrem jest używany tylko do konwencjonalizacji i zwykle drukowany jest automatycznie przez większość programów komputerowych Powyższy model po prostu mówi, że każda wartość X t jest bezpośrednio związana tylko z błędem losowym w poprzednim okresie, E t-1 i bieżącym błędem, E t Podobnie jak w przypadku modeli autoregresji, średnie ruchome modele mogą być rozszerzone do struktur wyższego rzędu, obejmujących różne kombinacje średniej długości ruchomej o pozwala budować modele, które zawierają zarówno parametry autoregresji, jak i ruchome średnie razem Modele te są często określane jako modele mieszane Chociaż to sprawia, że ​​bardziej skomplikowane narzędzie prognozowania, struktura może rzeczywiście symulować serię i tworzyć bardziej dokładną prognozę. sugerują, że struktura składa się wyłącznie z parametrów AR lub MA - nie obu. Modele opracowane przez to podejście są zwykle nazywane modelami ARIMA, ponieważ używają kombinacji autoregresywnego AR, integracji I - nawiązującego do odwrotnego procesu różnicowania w celu wygenerowania prognozy, i średnie operacje MA operacyjne Model ARIMA jest zwykle określany jako ARIMA p, d, q Oznacza to kolejność składowych autoregresji p, liczby operatorów różnicujących d i najwyższego rzędu średniej ruchomej Na przykład ARIMA 2, 1,1 oznacza, że ​​masz autoregresywny model drugiego rzędu ze średnim ruchem pierwszego rzędu, którego seria została zróżnicowana e do wywołania stacjonowania. Plikowanie właściwej specyfikacji. Głównym problemem klasycznego Box-Jenkins jest próba określenia, która specyfikacja ARIMA ma być używana - jak wiele parametrów AR i MA ma zawierać Do tego jest wiele Box-Jenkings 1976 poświęconych proces identyfikacji zależny od graficznej i numerycznej oceny autokorelacji próbki i częściowych funkcji autokorelacji Cóż, dla podstawowych modeli zadanie nie jest zbyt trudne Każda funkcja autokorelacji wygląda pewnie W miarę uproszczenia , wzorce nie są tak łatwo wykryte Aby utrudnić sytuacje, dane reprezentują tylko próbkę procesu, co oznacza, że ​​błędy próbkowania błędów, błędy pomiarowe itp. mogą zniekształcać teoretyczny proces identyfikacji. Dlatego tradycyjne modelowanie ARIMA jest sztuką a nie nauka. Wstęp do modeli bezsynalnych ARIMA. PORADY ARIMA, d, q równań prognozowania Modele ARIMA są teoretycznie najbardziej generalne l klasa modeli do prognozowania szeregów czasowych, które mogą być stacjonarne, w razie potrzeby różnicowanie, być może w połączeniu z przekształceniami nieliniowymi, takimi jak rejestrowanie lub deflacja w razie potrzeby zmienna losowa, która jest szeregiem czasowym, jest stacjonarna, jeśli jej właściwości statystyczne są wszystkie stała w czasie Seria stacjonarna nie ma tendencji, jej odchylenia wokół jego średniej mają stałą amplitudę, i wiggles w sposób spójny, tzn. jego krótkotrwałe losowe wzorce czasu zawsze wyglądają tak samo w sensie statystycznym Ten ostatni warunek oznacza, że ​​jego autokorelacje korelacje z własnymi wcześniejszymi odchyleniami od średniej pozostają niezmienne w czasie lub równoważnie, że jego widmo mocy pozostaje stale w czasie Zmienna losowa tego formatu może być postrzegana jak zwykle jako kombinacja sygnału i hałasu, a sygnał, jeśli jest pozorny może być wzorem szybkiego lub powolnego odwrotnego odwrotu lub oscylacji sinusoidalnej lub szybkiej zmiany w znaku, a może także mieć składnik sezonowy Model ARIMA może być postrzegany jako filtr, który próbuje oddzielić sygnał od hałasu, a następnie sygnał jest ekstrapolowany w przyszłość w celu uzyskania prognoz. Równanie ARIMA dla stacjonarnych szeregów czasowych jest liniowym regresją typu równanie, w którym predykcyjne składają się z opóźnień zmiennej zależnej i / lub opóźnień prognozowanych błędów. Prawidłowa wartość Y jest stała i lub ważona suma jednej lub więcej ostatnich wartości Y i lub ważonej sumy jednego lub więcej ostatnie wartości błędów. Jeśli predykatorzy składają się wyłącznie z opóźnionych wartości Y, jest to czysty, autoregresywny samoregulowany model, który jest tylko szczególnym przypadkiem modelu regresji, który może być wyposażony w standardowe oprogramowanie regresji. Na przykład pierwszy - rozmowy autoregresywnego modelu AR1 dla Y jest prostym modelem regresji, w którym zmienna niezależna jest po prostu Y z opóźnieniem o jeden okres LAG Y, 1 w Statgraphics lub YLAG1 w RegressIt Jeśli niektóre predykatory są opóźnione Błędy, model ARIMA nie jest modelem regresji liniowej, ponieważ nie ma sposobu, aby określić błąd ostatniego okresu jako niezależną zmienną, błędy muszą być obliczane okresowo, gdy model jest dopasowany do danych Od techniczny punkt widzenia, problem z wykorzystaniem opóźnionych błędów jako predykcyjnych jest taki, że przewidywania modelu nie są funkcjami liniowymi współczynników, nawet jeśli są to liniowe funkcje poprzednich danych. Więc współczynniki w modelach ARIMA, w których występują opóźnienia błędów, należy oszacować przez nieliniowe metody optymalizacji wspinaczka górska, a nie tylko rozwiązywanie systemu równań. Akronim ARIMA oznacza automatyczną regresywną ruchome średnie opóźnienia stacjonarnych serii w równaniach prognozujących nazywane są terminami autoregresywnymi, opóźnienia błędów prognozowania nazywane są średnią ruchoma , a seria czasowa, która powinna być różniczkowa, aby była stacjonarna, jest zintegrowaną wersją serii stacjonarnej Random-walk and random - modele trendencji, modele autoregresji i modele wygładzania wykładniczego są przypadkami szczególnymi modeli ARIMA. Nieprzerwany model ARIMA jest klasyfikowany jako model ARIMA p, d, q, gdzie. p jest liczbą terminów autoregresji. d jest liczbą nierównomierne różnice potrzebne do stacjonarności, i. q jest liczbą opóźnionych błędów prognozy w równaniu predykcyjnym. Równanie prognozowania jest skonstruowane w następujący sposób: Po pierwsze, niech y oznacza dtową różnicę Y, co oznacza. Zwróć uwagę, że druga różnica Y d 2 przypadku nie różni się od 2 okresów temu Raczej jest to pierwsza różniczka pierwszej różnicy, która jest dyskretnym analogiem drugiej pochodnej, tj. lokalnym przyspieszeniem serii, a nie jej lokalnym trendem. warunki y ogólny wzór prognozowania jest tutaj. Tutaj poruszają się średnie parametry s tak, że ich znaki są ujemne w równaniu, zgodnie z konwencją wprowadzoną przez Boxa i Jenkinsa. Niektórzy autorzy i oprogramowanie, w tym programowanie R l Anguage definiują je tak, aby miały znaki plus Gdy rzeczywiste liczby są podłączone do równania, nie ma niejasności, ale ważne jest, aby wiedzieć, która konwencja używa Twojego oprogramowania podczas odczytywania danych wyjściowych Często parametry są oznaczone przez AR 1 , AR 2, i MA 1, MA 2 itp. Aby zidentyfikować odpowiedni model ARIMA dla Y rozpoczyna się od określenia kolejności różnicowania d wymagających stacjonowania serii i usunięcia cech brutto sezonowości, być może w połączeniu z wariancją stabilizująca transformacja, taka jak rejestrowanie lub deflacja Jeśli zatrzymasz się w tym punkcie i przewidujesz, że zróżnicowane serie są stałe, masz tylko dopasowany losowy chód lub losowy model tendencji Jednak stacjonarne serie mogą wciąż mieć błędy autokorelacji, co sugeruje, że niektóre liczby W równaniu prognozowym potrzebne są również warunki AR p 1 i lub niektóre liczby MA q 1. Proces wyznaczania wartości p, d i q, które są najlepsze dla danego przedziału czasowego s zostaną omówione w dalszych sekcjach notatek, których linki są u góry tej strony, ale podgląd niektórych typów niejednorodnych modeli ARIMA, które są powszechnie spotykane, jest podany poniżej. ARIMA 1,0,0 autoregresja pierwszego rzędu model, jeśli seria jest stacjonarna i autocorrelated, być może może być przewidywana jako wielokrotność własnej poprzedniej wartości, a także stała Równanie prognozowania w tym przypadku jest. Jest to regresja Y z opóźnieniem przez jeden okres Jest to ARIMA 1, 0,0 Stały model Jeśli średnia Y jest równa zeru, wówczas nie będzie uwzględnione stałe wyrażenie. Jeżeli współczynnik nachylenia 1 jest dodatni i mniejszy niż 1 w skali, to musi być mniejszy niż 1 w skali jeśli Y jest nieruchome, model opisuje zachowanie średnie-zwrotne, w którym przewiduje się, że wartość następnego okresu 1 razy jest daleko od średniej, ponieważ wartość tego okresu Jeśli 1 jest ujemna, przewiduje on zachowanie średnie z odwróceniami oznaczeń, tzn. przewiduje również, że Y będzie poniżej średniej następnej str eriod, jeśli jest powyżej średniej tego okresu. W modelu autoregresji drugiego rzędu ARIMA 2,0,0 na drugim końcu byłby również termin Y t-2 po prawej, i tak dalej W zależności od oznaczeń i wielkości współczynnik, model ARIMA 2,0,0 mógłby opisać system, którego średnie odwrócenie zachodzi w sinusoidalnie oscylujący sposób, podobnie jak ruch masy na sprężynie poddawanej przypadkowemu wstrząsowi. ARIMA 0,1,0 przypadkowy spacer If seria Y nie jest stacjonarna, najprostszym modelem jest model losowego spaceru, który może być uważany za ograniczający przypadek modelu AR1, w którym współczynnik autoregresji wynosi 1, tj. szereg z nieskończenie powolnym średnim odwróceniem równanie predykcji dla tego modelu można zapisać jako. gdzie stały termin oznacza średnią zmianę okresu między okresem tj. długoterminowy dryft w Y Ten model może być dopasowany jako model regresji bez przecięcia, w którym pierwsza różnica Y jest zmienną zależną, ponieważ zawiera ona jedynie nierównomierną różnicę rute i stały okres, jest on klasyfikowany jako model ARIMA 0,1,0 ze stałą Modelem bez dostępu swobodnego będzie model ARIMA 0,1,0 bez stałej. ARIMA 1,1,0 różni się najpierw Jeśli błąd błędy modelu swobodnego spaceru jest autokorelencyjny, być może problem może zostać rozwiązany przez dodanie jednego opóźnienia zmiennej zależnej do równania predykcji - tzn. przez regresję pierwszej różnicy Y na samej sobie opóźnionej przez ten okres dałoby to następującą zależność predykcyjną, którą można przestawić na: Jest to model autoregresyjny pierwszego rzędu z jednym porządkiem nierównomiernego różnicowania i stałym terminem - tj. modelem ARIMA 1,1,0.ARIMA 0,1,1 bez stała prosta wygładzanie wykładnicze Inna strategia korygowania błędów autokorelacji w modelu losowego spaceru jest sugerowana przez prosty model wygładzania wykładnicza Przypomnijmy, że w przypadku niektórych niestałych serii czasowych np. tych, które wykazują hałaśliwą fluktuacje wokół zmiennej wolnej od różnicy, tryb losowego chodu l nie wykonuje się podobnie jak średnia ruchoma poprzednich wartości Innymi słowy, zamiast brać ostatnią obserwację jako prognozę następnej obserwacji, lepiej jest użyć średniej z ostatnich kilku obserwacji w celu odfiltrowania hałas i dokładniej oszacować lokalną średnią Prosty model wygładzania wykładniczego wykorzystuje wykładnikowaną ważoną średnią ruchową poprzednich wartości w celu osiągnięcia tego efektu Równanie predykcji dla prostego modelu wygładzania wykładniczego można zapisać w formie matematycznie równoważnych, z których jeden jest tak zwana korekcyjna korekcja błędów, w której poprzednia prognoza jest korygowana w kierunku popełnionego błędu. Ze względu na e t-1 Y t-1-t-1 z definicji, można ją przepisać jako., co oznacza ARIMA 0 , 1,1 - cieskie równanie prognozowania z 1 1 - Oznacza to, że można wyrównać proste wyrównanie wykładnicze, określając go jako model ARIMA 0,1,1 bez stałej, a szacowany współczynnik MA 1 odpowiada 1 m inus-alpha w formule SES Przypomnijmy, że w modelu SES średni wiek danych w prognozach na 1 rok jest 1, co oznacza, że ​​będą one wykazywały tendencję do opóźnienia trendów lub punktów zwrotnych o około 1 okresy. Wynika z tego, że średni wiek danych w prognozie 1-wyprzedzającej ARIMA 0,1,1 - bez modelu stałego wynosi 1 1 - 1 Na przykład, jeśli 1 0 8 średni wiek wynosi 5 W miarę zbliżania się 1 , model ARIMA 0,1,1 - bezterminowy staje się bardzo długotrwałą średnią ruchomej, a gdy 1 zbliża się do 0, staje się modelem losowego chodzenia bez drift. Jaki jest najlepszy sposób poprawienia autokorelacji dodawania AR lub dodanie terminów MA W poprzednich dwóch omówionych modelach problem autokorelacji błędów w modelu losowego spaceru został ustalony na dwa różne sposoby, dodając zaległą wartość różnicowanych serii do równania lub dodając opóźnioną wartość prognozy błąd Jakie podejście jest najlepszym Zasadą w tej sytuacji, która zostanie szczegółowo omówiona później, i że pozytywna autokorelacja jest zazwyczaj lepiej traktowana przez dodanie terminu AR do modelu, a ujemna autokorelacja najlepiej jest najlepiej traktowana przez dodanie określenia MA W serii biznesowych i ekonomicznych, ujemna autokorelacja często pojawia się jako artefakt różnicowania Ogólnie rzecz biorąc, różnicowanie zmniejsza pozytywne autokorelacji i może nawet powodować przejście z dodatniej do ujemnej autokorelacji Więc model ARIMA 0,1,1, w którym wyróżnia się określenie MA, jest częściej używany niż model ARIMA 1,1,0.ARIMA 0, 1,1 przy stałym, prostym wyrównywaniu wykładniczym ze wzrostem Wdrażając model SES jako model ARIMA, rzeczywiście zyskujesz pewną elastyczność Przede wszystkim szacowany współczynnik MA1 może być ujemny, co odpowiada współczynnikowi wygładzania większym niż 1 w Model SES, który zazwyczaj nie jest dozwolony w procedurze dopasowywania modelu SES Po drugie, masz możliwość włączenia stałego określenia w modelu ARIMA, jeśli chcesz, w celu oszacowania średniej tendencja niezerowa Model ARIMA 0,1,1 ze stałą ma równanie predykcyjne. Prognozy wyprzedzające z tego modelu są jakościowo podobne do prognozowanych w modelu SES, z wyjątkiem tego, że trajektoria prognoz długoterminowych jest zwykle nachyloną linię, której nachylenie jest równe mu, a nie w linii poziomej. ARIMA 0,2,1 lub 0,2,2 bez stałych liniowych wygładzeń wykładniczych Liniowe modele wygładzania wykładniczego są modelami ARIMA, które wykorzystują dwie odmienne nierówności w połączeniu z warunkami MA Druga różnica serii Y nie jest po prostu różnicą między Y i sobą opóźnione przez dwa okresy, ale jest to pierwsza różnica pierwszej różnicy - ie zmiana w Y w okresie t Tak więc, druga różnica Y w okresie t jest równa Y t - Y t-1 - Y t-1 - Y t-2 Y t - 2Y t-1 Y t-2 Druga różnica funkcji dyskretnej jest analogiczna do druga pochodna funkcji ciągłej mierzy przyspieszenie lub krzywiznę w funkcji na danym punkt czasowy. Model ARIMA 0,2,2 bez stałej przewiduje, że druga różnica serii jest równa liniowej funkcji dwóch ostatnich błędów prognozowania, które mogą być przekształcone jako. gdzie 1 i 2 to MA 1 i MA 2 współczynniki Jest to ogólny linearny wykładnik wykładniczy wykładniczy model wygładzania zasadniczo taki sam jak model Holt, a model Brown's jest szczególnym przypadkiem Wykorzystuje średnie ruchome ważone wykładniczo, aby oszacować zarówno poziom lokalny, jak i lokalny trend w serii. Długoterminowe prognozy z model ten jest zsynchronizowany z linią prostą, której nachylenie zależy od średniej tendencji obserwowanej pod koniec serii. ARIMA 1,1,2 bez stałego wyrównania wykładniczego liniowo tłumionego trendu. Ten model jest zilustrowany na załączonych slajdach w modelach ARIMA. lokalny trend pod koniec serii, ale spłaszczając go w dłuższych horyzontach prognoz, aby wprowadzić notatkę konserwatyzmu, praktykę, która ma empiryczne wsparcie Zobacz artykuł o tym, dlaczego firma Damped Trend pracuje w firmie Gardner d McKenzie i artykuł Golden Rule firmy Armstrong i inni o szczegóły. Zazwyczaj zaleca się trzymanie się modeli, w których co najmniej jedna z p i q nie jest większa niż 1, tzn. nie próbuj dopasować modelu takiego jak ARIMA 2, 1,2, ponieważ prawdopodobnie doprowadzi to do problemów związanych z nadmiernym dopasowaniem i czynnikami wspólnymi, omawianych bardziej szczegółowo w uwagach dotyczących struktury matematycznej modeli ARIMA. Implementacja arkusza ARIMA, takie jak opisane powyżej, są łatwe do wdrożenia w arkuszu kalkulacyjnym Równanie predykcji jest po prostu równaniem liniowym, które odnosi się do poprzednich wartości oryginalnych serii czasowych i wartości przeszłych błędów W ten sposób można utworzyć arkusz kalkulacyjny ARIMA, przechowując dane w kolumnie A, formułę prognozowania w kolumnie B oraz dane o błędach pomniejszone o prognozy w kolumnie C Formuła prognozowania w typowej komórce w kolumnie B będzie po prostu wyrażeniem liniowym odnoszącym się do wartości poprzednich wierszy kolumn A i C, pomnożonych przez odpowiednie współczynniki AR lub MA przechowywane w komórkach gdzie indziej w arkuszu kalkulacyjnym.

No comments:

Post a Comment