Wednesday, 27 September 2017

Moving Average Model Autokorrelation


Schritte zur Auswahl eines Prognosemodells Ihr Prognosemodell sollte Merkmale beinhalten, die alle wichtigen qualitativen Eigenschaften der Daten erfassen: Muster der Veränderung von Niveau und Trend, Effekte von Inflation und Saisonalität, Korrelationen zwischen Variablen etc. Darüber hinaus werden die Annahmen, Gewählten Modell sollte mit Ihrer Intuition darüber übereinstimmen, wie sich die Serie wahrscheinlich in der Zukunft verhalten wird. Wenn Sie ein Prognosemodell anpassen, haben Sie einige der folgenden Optionen: Diese Optionen werden im Folgenden kurz beschrieben. Sehen Sie dazu die zugehörige Prognose-Flussdiagramm für eine bildliche Ansicht des Modellspezifikationsprozesses und verweisen Sie zurück auf das Statgraphics Model Specification-Bedienfeld, um zu sehen, wie die Modelleigenschaften in der Software ausgewählt sind. Deflation Wenn die Serie inflationäres Wachstum zeigt, wird die Deflation dazu beitragen, das Wachstumsmuster zu berücksichtigen und die Heterosedastizität in den Resten zu reduzieren. Sie können entweder (i) die bisherigen Daten deflationieren und die langfristigen Prognosen mit einer konstanten angenommenen Rate wieder auflösen oder (ii) die vergangenen Daten durch einen Preisindex, wie beispielsweise den CPI, deflationieren und dann die langfristigen Prognosen mithilfe von " Eine Prognose des Preisindex. Option (i) ist die einfachste. In Excel können Sie einfach eine Spalte mit Formeln erstellen, um die ursprünglichen Werte durch die entsprechenden Faktoren zu teilen. Zum Beispiel, wenn die Daten monatlich sind und Sie mit einer Rate von 5 pro 12 Monate deflationieren möchten, würden Sie durch einen Faktor von (1.05) (k12) teilen, wobei k der Zeilenindex (Beobachtungsnummer) ist. RegressIt und Statgraphics haben eingebaute Werkzeuge, die dies automatisch für Sie tun. Wenn Sie diesen Weg zu gehen, ist es in der Regel am besten, um die angenommene Inflationsrate gleich Ihrem besten Schätzung der aktuellen Rate festgelegt, vor allem, wenn Sie gehen zu prognostizieren mehr als einen Zeitraum vor. Wenn Sie stattdessen die Option (ii) wählen, müssen Sie zuerst die deflationierten Prognosen und Vertrauensgrenzen in Ihre Datenkalkulation ablegen, eine Prognose für den Preisindex generieren und speichern und schließlich die entsprechenden Spalten miteinander multiplizieren. (Rückkehr nach oben.) Logarithmus-Transformation Wenn die Reihe zusammenhängendes Wachstum und ein multiplikatives saisonales Muster darstellt, kann eine Logarithmus-Transformation zusätzlich zu oder anstelle von Deflation hilfreich sein. Das Protokollieren der Daten wird ein inflationäres Wachstumsmuster nicht abflachen, sondern es wird es gerade ausrichten, so dass es durch ein lineares Modell (z. B. ein Zufallsweg oder ein ARIMA-Modell mit konstantem Wachstum oder ein lineares exponentielles Glättungsmodell) angebracht werden kann. Außerdem wird das Protokollieren multiplikative saisonale Muster zu additiven Mustern umwandeln, so dass, wenn Sie saisonale Anpassung nach der Protokollierung durchführen, sollten Sie den additive Typ verwenden. Protokollierung befasst sich mit Inflation implizit, wenn Sie möchten, dass die Inflation explizit modelliert wird - d. H. Wenn Sie möchten, dass die Inflationsrate ein sichtbarer Parameter des Modells ist oder wenn Sie Plots von deflationierten Daten anzeigen möchten - dann sollten Sie eher deflate als log. Eine weitere wichtige Verwendung für die Protokolltransformation ist die Linearisierung von Beziehungen zwischen Variablen in einem Regressionsmodus l. Wenn z. B. die abhängige Variable eine multiplikative und nicht additive Funktion der unabhängigen Variablen ist oder wenn die Beziehung zwischen abhängigen und unabhängigen Variablen in Form von prozentualen Änderungen und nicht absoluten Änderungen linear ist, dann wird eine Protokolltransformation auf eine oder mehrere Variablen angewendet Kann angemessen sein, wie im Bier Verkaufsbeispiel. (Rückkehr nach oben.) Saisonale Anpassung Wenn die Serie ein starkes saisonales Muster aufweist, von dem angenommen wird, dass es von Jahr zu Jahr konstant ist, kann die saisonale Anpassung ein geeigneter Weg sein, um das Muster abzuschätzen und zu extrapolieren. Der Vorteil der saisonalen Anpassung ist, dass es das saisonale Muster explizit modelliert, so dass Sie die Möglichkeit haben, die Saisonindizes und die saisonbereinigten Daten zu studieren. Der Nachteil ist, dass es die Schätzung einer großen Anzahl zusätzlicher Parameter erfordert (insbesondere für monatliche Daten), und es liefert keine theoretische Begründung für die Berechnung der Konfidenzintervalle. Eine Out-of-Sample-Validierung ist besonders wichtig, um das Risiko einer Überalterung der vergangenen Daten durch saisonale Anpassung zu reduzieren. Wenn die Daten stark saisonal sind, aber Sie keine saisonale Anpassung wählen, besteht die Alternative darin, (i) ein saisonales ARIMA-Modell zu verwenden. Die implizit das saisonale Muster mit saisonalen Verzögerungen und Unterschieden prognostizieren, oder (ii) das Winters saisonale exponentielle Glättungsmodell verwenden, das zeitabhängige saisonale Indizes schätzt. (Rückkehr nach oben.) QuotIndependentquot-Variablen Wenn es andere Zeitreihen gibt, die Sie glauben, Erklärungskraft in Bezug auf Ihre Interessensreihe zu haben (zB führende ökonomische Indikatoren oder politische Variablen wie Preis, Werbung, Promotions usw.) Können Sie Regression als Modelltyp betrachten. Unabhängig davon, ob Sie Regression wählen oder nicht, müssen Sie die oben erwähnten Möglichkeiten berücksichtigen, um Ihre Variablen zu verändern (Deflation, Protokoll, saisonale Anpassung - und vielleicht auch differenzierend), um die Zeitdimension auszunutzen und die Beziehungen zu linearisieren. Selbst wenn Sie die Regression an dieser Stelle nicht wählen, können Sie erwägen, Regressoren später in ein Zeitreihenmodell (z. B. ein ARIMA-Modell) aufzunehmen, wenn die Residuen signifikante Kreuzkorrelationen mit anderen Variablen aufweisen. (Zum Seitenanfang zurückkehren.) Glättung, Mittelwertbildung oder Zufallswiedergabe Wenn Sie sich für eine saisonale Anpassung der Daten entschieden haben - oder wenn die Daten nicht saisonal beginnen -, dann möchten Sie vielleicht ein Mittelungs - oder Glättungsmodell verwenden Passen Sie die nicht-saisonale Muster, die in den Daten an dieser Stelle bleibt. Ein einfaches gleitendes Mittel oder ein einfaches exponentielles Glättungsmodell berechnet lediglich einen lokalen Datenmittelwert am Ende der Reihe, unter der Annahme, daß dies die beste Abschätzung des aktuellen Mittelwertes ist, um den sich die Daten fluktuieren. (Diese Modelle gehen davon aus, dass der Mittelwert der Serie langsam und zufällig ohne anhaltende Trends variiert.) Eine einfache exponentielle Glättung wird normalerweise einem einfachen gleitenden Durchschnitt bevorzugt, weil ihr exponentiell gewichteter Durchschnitt eine sinnvollere Aufgabe macht, die älteren Daten zu diskontieren, weil ihre Glättungsparameter (alpha) kontinuierlich ist und leicht optimiert werden kann und weil er eine theoretische Basis für die Berechnung von Konfidenzintervallen hat. Wenn Glättung oder Mittelwertbildung nicht hilfreich zu sein scheint - d. h. Wenn der beste Prädiktor des nächsten Wertes der Zeitreihe einfach der vorherige Wert ist - dann wird ein Zufallswegmodell angezeigt. Dies ist beispielsweise dann der Fall, wenn die optimale Anzahl von Termen im einfachen gleitenden Mittelwert 1 ist oder wenn der optimale Wert von alpha bei einfacher exponentieller Glättung 0,9999 beträgt. Browns lineare exponentielle Glättung kann verwendet werden, um eine Serie mit langsam zeitabhängigen linearen Trends passen, aber vorsichtig sein, solche Trends sehr weit in die Zukunft zu extrapolieren. (Die schnell wachsenden Konfidenzintervalle für dieses Modell belegen ihre Ungewissheit über die ferne Zukunft.) Holts Linearglättung schätzt auch zeitabhängige Trends ein, verwendet jedoch separate Parameter zur Glättung von Pegel und Trend, was in der Regel eine bessere Anpassung an die Daten ermöglicht Als Brown8217s Modell. Q uadratische Exponentialglättung versucht, zeitvariable quadratische Trends abzuschätzen und sollte praktisch nie verwendet werden. Eine lineare exponentielle Glättung mit gedämpfter Tendenz (d. h. ein Trend, der in entfernten Horizonten abflacht) wird oft in Situationen empfohlen, in denen die Zukunft sehr unsicher ist. (Dies würde einem ARIMA-Modell mit drei Ordnungen von nicht seasonalen Differenzen entsprechen. Die verschiedenen exponentiellen Glättungsmodelle sind Sonderfälle von ARIMA-Modellen (siehe unten) und können mit der ARIMA-Software ausgerüstet werden. Insbesondere ist das einfache exponentielle Glättungsmodell ein ARIMA (0,1,1) - Modell, wobei das Holt8217s lineare Glättungsmodell ein ARIMA (0,2,2) - Modell ist und das gedämpfte Trendmodell ein ARIMA (1,1,2 ) - Modell. Eine gute Zusammenfassung der Gleichungen der verschiedenen exponentiellen Glättungsmodelle finden Sie auf dieser Seite auf der SAS-Website. (Die SAS-Menüs zur Spezifizierung von Zeitreihenmodellen werden auch dort gezeigt, wo sie denen von Statgraphics ähnlich sind.) Lineare, quadratische oder exponentielle Trendlinienmodelle sind weitere Optionen, um eine entsalzte Serie zu extrapolieren, sie übertreffen jedoch selten zufällig, glätten oder ARIMA-Modelle auf Geschäftsdaten. (Zurück nach oben.) Winters Saisonale Exponentialglättung Winters Saisonale Glättung ist eine Erweiterung der exponentiellen Glättung, die zeitgleiche Zeit-, Trend - und Saisonfaktoren unter Verwendung rekursiver Gleichungen schätzt. (Wenn Sie dieses Modell verwenden, würden Sie die Daten nicht saisonal anpassen.) Die Winters-Saisonfaktoren können entweder multiplikativ oder additiv sein: Normalerweise sollten Sie die multiplikative Option auswählen, sofern Sie die Daten nicht protokolliert haben. Obwohl das Winters-Modell clever und einigermaßen intuitiv ist, kann es schwierig sein, in der Praxis anzuwenden: Es hat drei Glättungsparameter - Alpha, Beta und Gamma - zur getrennten Glättung der Pegel-, Trend - und Saisonfaktoren, die geschätzt werden müssen gleichzeitig. Die Bestimmung der Ausgangswerte für die saisonalen Indizes kann durch Anwendung der Verhältnis-zu-gleitenden Durchschnittsmethode der Saisonanpassung auf einen Teil oder die Gesamtheit der Reihe und oder durch Rückprognose erfolgen. Der Schätzalgorithmus, den Statgraphics für diese Parameter verwendet, kann manchmal nicht konvergieren und liefert Werte, die bizarr aussehende Prognosen und Konfidenzintervalle ergeben, so dass ich vorsichtig sein würde, wenn ich dieses Modell verwende. (Zurück nach oben.) ARIMA Wenn Sie keine saisonale Anpassung wählen (oder wenn die Daten nicht saisonal sind), können Sie das ARIMA-Modell-Framework verwenden. ARIMA Modelle sind eine sehr allgemeine Klasse von Modellen, die zufällige gehen, zufällige Trend, exponentielle Glättung und autoregressive Modelle als Sonderfälle. Die herkömmliche Weisheit ist, dass eine Reihe ein guter Kandidat für ein ARIMA-Modell ist, wenn (i) sie durch eine Kombination aus differenzierenden und anderen mathematischen Transformationen wie dem Protokollieren stationarisiert werden kann, und (ii) Sie über eine beträchtliche Menge an Daten verfügen müssen : Mindestens 4 volle Jahreszeiten bei saisonalen Daten. (Wenn die Serie nicht durch Differencing adäquat stationarisiert werden kann - zB wenn sie sehr unregelmäßig ist oder ihr Verhalten im Laufe der Zeit qualitativ verändert - oder wenn Sie weniger als 4 Datenperioden haben, dann können Sie mit einem Modell besser abschneiden Dass saisonale Anpassung und eine Art einfache Mittelung oder Glättung.) ARIMA-Modelle haben eine spezielle Namenskonvention eingeführt von Box und Jenkins. Ein nicht-saisonales ARIMA-Modell wird als ARIMA-Modell (p, d, q) klassifiziert, wobei d die Anzahl der nicht-saisonalen Unterschiede ist, p die Anzahl der autoregressiven Terme (Verzögerungen der differenzierten Serien) und q die Anzahl der beweglichen - (Verzögerungen der Prognosefehler) in der Vorhersagegleichung. Ein saisonales ARIMA-Modell wird als ARIMA (p, d, q) x (P, D, Q) klassifiziert. Wobei D, P und Q die Anzahl saisonaler Unterschiede, saisonale autoregressive Terme (Verzögerungen der differenzierten Reihen bei Mehrfachen der saisonalen Periode) und saisonale gleitende Durchschnittsterme sind (Verzögerungen der prognostizierten Fehler bei Vielfachen der saisonalen) Periode). Der erste Schritt bei der Montage eines ARIMA-Modells ist die Bestimmung der geeigneten Reihenfolge der Differenzierung benötigt, um die Stationarisierung der Serie und entfernen Sie die Brutto-Merkmale der Saisonalität. Dies ist gleichbedeutend mit der Bestimmung, welches quotnaivequot random-walk oder random-trend Modell den besten Ausgangspunkt liefert. Versuchen Sie nicht, mehr als 2 Gesamtaufträge von differencing (nicht saisonal und saisonal kombiniert) zu verwenden, und verwenden Sie nicht mehr als 1 Saisonunterschied. Der zweite Schritt ist, um festzustellen, ob ein konstanter Begriff in das Modell enthalten: in der Regel enthalten Sie einen konstanten Begriff, wenn die gesamte Reihenfolge der Differenzierung 1 oder weniger ist, andernfalls nicht. In einem Modell mit einer Ordnung der Differenzierung repräsentiert der konstante Term den durchschnittlichen Trend in den Prognosen. In einem Modell mit zwei Abweichungsordnungen wird der Trend in den Prognosen durch den am Ende der Zeitreihe beobachteten lokalen Trend bestimmt und der konstante Term repräsentiert den Trend-in-the-Trend, dh die Krümmung des Langzeit - Langfristige Prognosen. Normalerweise ist es gefährlich, Trends-in-Trends zu extrapolieren, so dass Sie unterdrücken den Kontinent in diesem Fall. Der dritte Schritt besteht darin, die Anzahl autoregressiver und gleitender Durchschnittsparameter (p, d, q, P, D, Q) zu wählen, die erforderlich sind, um jegliche Autokorrelation zu beseitigen, die in den Resten des naiven Modells verbleibt Bloße Differenzierung). Diese Zahlen bestimmen die Anzahl der Verzögerungen der differenzierten Serien und / oder Verzögerungen der Prognosefehler, die in der Prognosegleichung enthalten sind. Wenn es zu diesem Zeitpunkt keine signifikante Autokorrelation in den Resten gibt, dann STOP, wird das getan: das beste Modell ist ein naives Modell Wenn bei den Verzögerungen 1 oder 2 eine signifikante Autokorrelation vorliegt, sollten Sie die Einstellung q1 versuchen, wenn eine der folgenden Bedingungen zutrifft: I) es gibt einen nicht saisonalen Unterschied im Modell, (ii) die Lag-1-Autokorrelation ist negativ. Und (iii) das Rest-Autokorrelationsdiagramm ist sauberer aussehende (weniger isolierte Spikes) als das verbleibende partielle Autokorrelationsdiagramm. Wenn es keinen nicht-saisonalen Unterschied im Modell gibt unddie Verzögerung 1 Autokorrelation positiv ist unddas restliche partielle Autokorrelationsdiagramm sauberer aussieht, dann versuchen Sie p1. (Manchmal sind diese Regeln für die Wahl zwischen p1 und q1 in Konflikt mit einander, in welchem ​​Fall es wahrscheinlich nicht viel Unterschied machen, die Sie verwenden. Test sie beide und vergleichen.) Wenn es Autokorrelation bei lag 2, die nicht durch die Einstellung p1 entfernt wird Oder q1, können Sie dann versuchen, p2 oder q2, oder gelegentlich p1 und q1. Seltener kann es Situationen geben, in denen p2 oder 3 und q1 oder umgekehrt die besten Ergebnisse liefern. Es wird dringend empfohlen, dass Sie pgt1 und qgt1 nicht im selben Modell verwenden. Im Allgemeinen sollten Sie bei der Anpassung von ARIMA-Modellen eine Erhöhung der Modellkomplexität vermeiden, um nur geringe Verbesserungen der Fehlerstatistik oder des Erscheinungsbildes der ACF - und PACF-Diagramme zu erzielen. Auch in einem Modell mit sowohl pgt1 als auch qgt1 gibt es eine gute Möglichkeit der Redundanz und Nicht-Eindeutigkeit zwischen der AR - und der MA-Seite des Modells, wie in den Anmerkungen zur mathematischen Struktur des ARIMA-Modells s erläutert. Es ist in der Regel besser, in einer vorwärts schrittweise vorgehen, anstatt rückwärts schrittweise, wenn tweaking die Modell-Spezifikationen: Start mit einfacheren Modellen und nur mehr Begriffe, wenn es eine klare Notwendigkeit. Die gleichen Regeln gelten für die Anzahl der saisonalen autoregressiven Terme (P) und die Anzahl der saisonal gleitenden Durchschnittsterme (Q) in Bezug auf die Autokorrelation bei der Saisonzeit (z. B. Verzögerung 12 für monatliche Daten). Versuchen Sie Q1, wenn es bereits einen saisonalen Unterschied im Modell gibt unddie saisonale Autokorrelation negativ ist unddas restliche Autokorrelationsdiagramm in der Nähe der saisonalen Verzögerung sauberer aussieht, sonst versuchen Sie P1. (Wenn es logisch ist, dass die Serie eine starke Saisonalität aufweist, dann müssen Sie einen saisonalen Unterschied verwenden, sonst wird das saisonale Muster bei Langzeitprognosen ausblenden.) Gelegentlich können Sie P2 und Q0 oder vice v ersa ausprobieren, Oder PQ1. Es wird jedoch dringend empfohlen, dass PQ nie größer als 2 sein sollte. Saisonale Muster haben selten die Art der perfekten Regelmäßigkeit über eine ausreichend große Anzahl von Jahreszeiten, die es ermöglichen würde, zuverlässig zu identifizieren und zu schätzen, dass viele Parameter. Auch der Rückprognosealgorithmus, der bei der Parameterschätzung verwendet wird, führt wahrscheinlich zu unzuverlässigen (oder sogar verrückten) Ergebnissen, wenn die Anzahl der Jahreszeiten von Daten nicht signifikant größer als PDQ ist. Ich würde nicht weniger als PDQ2 volle Jahreszeiten empfehlen, und mehr ist besser. Auch bei der Montage von ARIMA-Modellen sollten Sie darauf achten, die Daten nicht zu überladen, trotz der Tatsache, dass es eine Menge Spaß machen kann, sobald Sie den Hang davon bekommen. Wichtige Sonderfälle: Wie oben erwähnt, ist ein ARIMA (0,1,1) - Modell ohne Konstante identisch mit einem einfachen exponentiellen Glättungsmodell, und es nimmt einen Floating-Level an (d. H. Keine mittlere Reversion), aber mit null langfristigem Trend. Ein Modell mit konstantem ARIMA-Modell (0,1,1) ist ein einfaches exponentielles Glättungsmodell mit einem ungleichen linearen Trendbegriff. Ein ARIMA (0,2,1) oder (0,2,2) Modell ohne Konstante ist ein lineares exponentielles Glättungsmodell, das einen zeitlichen Trend ermöglicht. Ein ARIMA-Modell (1,1,2) ohne Konstante ist ein lineares exponentielles Glättungsmodell mit gedämpftem Trend, d. h. ein Trend, der schließlich in längerfristigen Prognosen abflacht. Die häufigsten saisonalen ARIMA Modelle sind das ARIMA (0,1,1) x (0,1,1) Modell ohne Konstante und das ARIMA (1,0,1) x (0,1,1) Modell mit Konstante. Das erstere dieser Modelle verwendet prinzipiell eine exponentielle Glättung sowohl der nicht saisonalen als auch der saisonalen Komponenten des Musters in den Daten, während es einen zeitlich variierenden Trend zulßt, und das letztere Modell ist etwas ähnlich, nimmt jedoch einen konstanten linearen Trend und daher ein wenig länger an - term Vorhersagbarkeit. Sie sollten immer diese beiden Modelle unter Ihren Lineup von Verdächtigen bei der Montage von Daten mit konsistenten saisonalen Muster. Einer von ihnen (vielleicht mit einer geringfügigen Veränderung wie zunehmende p oder q um 1 undeiner Einstellung P1 sowie Q1) ist oft die beste. ARIMA (p, d, q) Voraussagegleichung: ARIMA-Modelle sind in der Theorie die allgemeinste Klasse von Modellen zur Prognose einer Zeitreihe, die 8220 stationär gemacht werden kann8221 (Falls notwendig), vielleicht in Verbindung mit nichtlinearen Transformationen, wie zum Beispiel Protokollierung oder Abscheidung (falls erforderlich). Eine Zufallsvariable, die eine Zeitreihe ist, ist stationär, wenn ihre statistischen Eigenschaften alle über die Zeit konstant sind. Eine stationäre Reihe hat keinen Trend, ihre Variationen um ihren Mittelwert haben eine konstante Amplitude, und sie wackelt in einer konsistenten Weise. D. h. seine kurzzeitigen Zufallszeitmuster sehen immer im statistischen Sinne gleich aus. Die letztgenannte Bedingung bedeutet, daß ihre Autokorrelationen (Korrelationen mit ihren eigenen vorherigen Abweichungen vom Mittelwert) über die Zeit konstant bleiben oder daß ihr Leistungsspektrum über die Zeit konstant bleibt. Eine zufällige Variable dieser Form kann (wie üblich) als eine Kombination von Signal und Rauschen betrachtet werden, und das Signal (wenn eines offensichtlich ist) könnte ein Muster einer schnellen oder langsamen mittleren Reversion oder einer sinusförmigen Oszillation oder eines schnellen Wechsels im Vorzeichen sein , Und es könnte auch eine saisonale Komponente. Ein ARIMA-Modell kann als 8220filter8221 betrachtet werden, das versucht, das Signal vom Rauschen zu trennen, und das Signal wird dann in die Zukunft extrapoliert, um Prognosen zu erhalten. Die ARIMA-Vorhersagegleichung für eine stationäre Zeitreihe ist eine lineare Gleichung (d. H. Regressionstyp), bei der die Prädiktoren aus Verzögerungen der abhängigen Variablen und oder Verzögerungen der Prognosefehler bestehen. Das heißt: Vorhergesagter Wert von Y eine Konstante undeine gewichtete Summe aus einem oder mehreren neuen Werten von Y und einer gewichteten Summe aus einem oder mehreren neuen Werten der Fehler. Wenn die Prädiktoren nur aus verzögerten Werten von Y bestehen, handelt es sich um ein reines autoregressives Modell (8220 selbst-regressed8221), das nur ein Spezialfall eines Regressionsmodells ist und mit einer Standard-Regressions-Software ausgestattet werden kann. Beispielsweise ist ein autoregressives Modell erster Ordnung (8220AR (1) 8221) für Y ein einfaches Regressionsmodell, bei dem die unabhängige Variable nur um eine Periode (LAG (Y, 1) in Statgraphics oder YLAG1 in RegressIt) verzögert ist. Wenn einige der Prädiktoren Verzögerungen der Fehler sind, handelt es sich bei einem ARIMA-Modell nicht um ein lineares Regressionsmodell, da es keine Möglichkeit gibt, 8220last period8217s error8221 als eine unabhängige Variable festzulegen: Die Fehler müssen auf einer Periodenperiode berechnet werden Wenn das Modell an die Daten angepasst ist. Aus technischer Sicht ist das Problem der Verwendung von verzögerten Fehlern als Prädiktoren, dass die Vorhersagen von model8217s keine linearen Funktionen der Koeffizienten sind. Obwohl es sich um lineare Funktionen der vergangenen Daten handelt. Daher müssen Koeffizienten in ARIMA-Modellen, die verzögerte Fehler enthalten, durch nichtlineare Optimierungsmethoden (8220hill-climbing8221) abgeschätzt werden, anstatt nur ein Gleichungssystem zu lösen. Das Akronym ARIMA steht für Auto-Regressive Integrated Moving Average. Die Verzögerungen der stationären Reihe in der Prognose-Gleichung werden als autoregressiveQuot-Terme bezeichnet, die Verzögerungen der Prognosefehler werden als mittlere Mittelwert-Terme bezeichnet und eine Zeitreihe, die differenziert werden muß, um stationär gemacht zu werden, wird als eine integrierte quotierte Version einer stationären Reihe bezeichnet. Random-walk und random-trend Modelle, autoregressive Modelle und exponentielle Glättungsmodelle sind alle Sonderfälle von ARIMA Modellen. Ein nicht seasonales ARIMA-Modell wird als ein quotarIMA-Modell (p, d, q) klassifiziert, wobei p die Anzahl der autoregressiven Terme ist, d die Anzahl der für die Stationarität benötigten Nicht-Seasonal-Differenzen ist und q die Anzahl der verzögerten Prognosefehler ist Die Vorhersagegleichung. Die Vorhersagegleichung ist wie folgt aufgebaut. Zuerst bezeichne y die d - te Differenz von Y. Das bedeutet, daß die zweite Differenz von Y (der Fall d2) nicht die Differenz von 2 Perioden ist. Es ist vielmehr die erste Differenz der ersten Differenz. Was das diskrete Analogon einer zweiten Ableitung ist, d. h. die lokale Beschleunigung der Reihe anstatt ihres lokalen Takts. In Bezug auf y. Ist die allgemeine Prognose-Gleichung: Hier sind die gleitenden Durchschnittsparameter (9528217s) so definiert, daß ihre Vorzeichen in der Gleichung negativ sind, und zwar nach der Konvention von Box und Jenkins. Einige Autoren und Software (einschließlich der Programmiersprache R) definieren sie so, dass sie stattdessen Pluszeichen haben. Wenn tatsächliche Zahlen in die Gleichung gesteckt werden, gibt es keine Mehrdeutigkeit, aber es ist wichtig zu wissen, welche Konvention Ihre Software verwendet, wenn Sie die Ausgabe lesen. Oft werden dort die Parameter mit AR (1), AR (2), 8230 und MA (1), MA (2), 8230 usw. bezeichnet. Um das entsprechende ARIMA-Modell für Y zu identifizieren, beginnt man die Reihenfolge der Differenzierung zu bestimmen (D) Notwendigkeit, die Serie zu stationarisieren und die Brutto-Merkmale der Saisonalität zu beseitigen, möglicherweise in Verbindung mit einer variationsstabilisierenden Transformation, wie beispielsweise Protokollierung oder Entleerung. Wenn Sie an diesem Punkt anhalten und voraussagen, dass die differenzierten Serien konstant sind, haben Sie lediglich ein zufälliges oder zufälliges Trendmodell angebracht. Die stationäre Reihe kann jedoch weiterhin autokorrelierte Fehler aufweisen, was nahe legt, daß in der Vorhersagegleichung auch einige Anzahl von AR-Terme (p 8805 1) und einige MA-MA-Terme (q 8805 1) benötigt werden. Der Prozess der Bestimmung der Werte von p, d und q, die für eine gegebene Zeitreihe am besten sind, werden in späteren Abschnitten der Notizen (deren Links oben auf dieser Seite sind), aber eine Vorschau von einigen der Typen erörtert Von nicht-saisonalen ARIMA-Modellen, die üblicherweise angetroffen werden, ist unten angegeben. ARIMA (1,0,0) erstes autoregressives Modell: Wenn die Serie stationär und autokorreliert ist, kann sie vielleicht als ein Vielfaches ihres eigenen vorherigen Wertes plus einer Konstante vorhergesagt werden. Die Prognose-Gleichung ist in diesem Fall 8230, die Y auf sich selbst zurückgeblieben um eine Periode zurückgeblieben ist. Dies ist ein 8220ARIMA (1,0,0) constant8221 Modell. Wenn der Mittelwert von Y Null ist, dann würde der konstante Term nicht eingeschlossen werden. Wenn der Steigungskoeffizient 981 & sub1; positiv und kleiner als 1 in der Grße ist (er muß kleiner als 1 in der Grße sein, wenn Y stationär ist), beschreibt das Modell ein Mittelrücksetzverhalten, bei dem der nächste Periodenblockwert 981 1 mal als vorhergesagt werden sollte Weit weg vom Durchschnitt, wie dieser Zeitraum8217s Wert. Wenn 981 & sub1; negativ ist, prognostiziert es ein Mittelwert-Wiederherstellungsverhalten mit einer Veränderung von Vorzeichen, d. h. es sagt auch voraus, daß Y unterhalb der mittleren nächsten Periode liegt, wenn sie über dem Mittel dieser Periode liegt. In einem autoregressiven Modell zweiter Ordnung (ARIMA (2,0,0)), würde es auch einen Yt-2-Term auf der rechten Seite geben, und so weiter. Abhängig von den Zeichen und Größen der Koeffizienten kann ein ARIMA (2,0,0) - Modell ein System beschreiben, dessen mittlere Reversion sinusförmig oszillierend erfolgt, wie die Bewegung einer Masse auf einer Feder, die zufälligen Schocks ausgesetzt ist . ARIMA (0,1,0) zufälliger Weg: Wenn die Reihe Y nicht stationär ist, ist das einfachste mögliche Modell ein zufälliges Wandermodell, das als Begrenzungsfall eines AR (1) - Modells betrachtet werden kann, in dem die autoregressive Koeffizient ist gleich 1, dh eine Reihe mit unendlich langsamer mittlerer Reversion. Die Vorhersagegleichung für dieses Modell kann folgendermaßen geschrieben werden: wobei der konstante Term die mittlere Periodenperiodenänderung (dh die Langzeitdrift) in Y ist. Dieses Modell könnte als ein No-Intercept-Regressionsmodell angepasst werden, in dem die Die erste Differenz von Y ist die abhängige Variable. Da es nur einen nicht sonderbaren Unterschied und einen konstanten Term enthält, wird er als quotarima (0,1,0) - Modell mit constant. quot klassifiziert. Das random-walk-ohne - driftmodell wäre ein ARIMA (0,1, 0) - Modell ohne konstantes ARIMA (1,1,0) differenziertes autoregressives Modell erster Ordnung: Wenn die Fehler eines Zufallswegmodells autokorreliert werden, kann das Problem möglicherweise durch Hinzufügen einer Verzögerung der abhängigen Variablen zu der Vorhersagegleichung - - ie Durch Rückgang der ersten Differenz von Y auf sich selbst verzögert um eine Periode. Dies würde die folgende Vorhersagegleichung ergeben, die umgeordnet werden kann: Dies ist ein autoregressives Modell erster Ordnung mit einer Ordnung der Nichtsaisonaldifferenzierung und einem konstanten Term - d. e. Ein ARIMA (1,1,0) - Modell. ARIMA (0,1,1) ohne konstante einfache exponentielle Glättung: Eine weitere Strategie zur Korrektur autokorrelierter Fehler in einem Random-Walk-Modell wird durch das einfache exponentielle Glättungsmodell vorgeschlagen. Es sei daran erinnert, dass für einige nichtstationäre Zeitreihen (z. B. diejenigen, die geräuschschwankungen um einen langsam variierenden Mittelwert aufweisen) das Zufallswegmodell nicht ebenso gut funktioniert wie ein gleitender Durchschnitt von vergangenen Werten. Mit anderen Worten, anstatt die letzte Beobachtung als Prognose der nächsten Beobachtung zu nehmen, ist es besser, einen Durchschnitt der letzten Beobachtungen zu verwenden, um das Rauschen herauszufiltern und das lokale Mittel genauer zu schätzen. Das einfache exponentielle Glättungsmodell verwendet einen exponentiell gewichteten gleitenden Durchschnitt vergangener Werte, um diesen Effekt zu erzielen. Die Vorhersagegleichung für das einfache exponentielle Glättungsmodell kann in einer Anzahl mathematisch äquivalenter Formen geschrieben werden. Von denen eine die sogenannte 8220-Fehlerkorrektur8221-Form ist, in der die vorhergehende Prognose in der Richtung ihres Fehlers angepasst wird: Weil e t-1 Y t-1 - 374 t-1 per Definition umgeschrieben werden kann : Es handelt sich um eine ARIMA (0,1,1) - konstante Vorhersagegleichung mit 952 1 1 - 945. Dies bedeutet, dass Sie eine einfache exponentielle Glättung durch Angabe als ARIMA (0,1,1) - Modell ohne passen Konstant und der geschätzte MA (1) - Koeffizient entspricht 1-minus-alpha in der SES-Formel. Denken Sie daran, dass im SES-Modell das durchschnittliche Alter der Daten in den 1-Periodenprognosen 1 945 beträgt, was bedeutet, dass sie tendenziell hinter Trends oder Wendepunkten um etwa 1 945 Perioden zurückbleiben werden. Daraus folgt, dass das Durchschnittsalter der Daten in den 1-Periodenprognosen eines ARIMA-Modells (0,1,1) ohne Konstante 1 (1 - 952 1) ist. Wenn beispielsweise 952 1 0,8 beträgt, ist das Durchschnittsalter 5. Da sich 952 1 1 nähert, wird das ARIMA-Modell (0,1,1) ohne Konstante zu einem sehr langfristigen gleitenden Durchschnitt und als 952 1 Ansätze 0 wird es ein random-walk-ohne-Drift-Modell. What8217s der beste Weg, um für Autokorrelation zu korrigieren: Hinzufügen von AR-Begriffe oder Hinzufügen von MA-Begriffen In den vorherigen beiden Modellen, die oben diskutiert wurden, wurde das Problem der autokorrelierten Fehler in einem zufälligen Fußmodell auf zwei verschiedene Arten behoben: durch Hinzufügen eines Verzögerungswertes der differenzierten Reihe Auf die Gleichung oder das Hinzufügen eines verzögerten Wertes des Prognosefehlers. Welcher Ansatz am besten ist Eine Regel für diese Situation, die später noch ausführlicher diskutiert wird, besteht darin, dass die positive Autokorrelation normalerweise am besten durch Hinzufügen eines AR-Terms zum Modell behandelt wird und negative Autokorrelation in der Regel am besten durch Hinzufügen eines MA-Semester. In der Wirtschafts - und Wirtschaftszeitreihe entsteht häufig eine negative Autokorrelation als Artefakt der Differenzierung. (Im allgemeinen differenziert die Differenzierung die positive Autokorrelation und kann sogar einen Wechsel von positiver zu negativer Autokorrelation bewirken.) Daher wird das ARIMA (0,1,1) - Modell, in dem die Differenzierung von einem MA-Begriff begleitet wird, häufiger verwendet als ein ARIMA-Modell (1,1,0). ARIMA (0,1,1) mit konstanter einfacher exponentieller Glättung mit Wachstum: Durch die Implementierung des SES-Modells als ARIMA-Modell gewinnen Sie tatsächlich etwas Flexibilität. Zuerst darf der geschätzte MA (1) - Koeffizient negativ sein. Dies entspricht einem Glättungsfaktor von mehr als 1 in einem SES-Modell, das nach dem SES-Modellanpassungsverfahren üblicherweise nicht zulässig ist. Zweitens haben Sie die Möglichkeit, einen konstanten Term in das ARIMA-Modell zu integrieren, wenn Sie es wünschen, um einen durchschnittlichen Trend, der nicht Null ist, abzuschätzen. Das Modell ARIMA (0,1,1) mit Konstante hat die Vorhersagegleichung: Die Ein-Perioden-Prognosen aus diesem Modell sind qualitativ denjenigen des SES-Modells ähnlich, mit der Ausnahme, dass die Trajektorie der Langzeitprognosen typischerweise a ist (Deren Neigung gleich mu ist) und nicht eine horizontale Linie. ARIMA (0,2,1) oder (0,2,2) ohne konstante lineare exponentielle Glättung: Lineare exponentielle Glättungsmodelle sind ARIMA-Modelle, die zwei nicht-sauren Differenzen in Verbindung mit MA-Begriffen verwenden. Die zweite Differenz einer Folge Y ist nicht einfach die Differenz von Y und selbst von zwei Perioden verzögert, sondern sie ist die erste Differenz der ersten Differenz - i. e. Die Änderung in der Änderung von Y in der Periode t. Somit ist die zweite Differenz von Y in der Periode t gleich (Yt - Yt - 1) - (Yt - 1 - Yt - 2) Yt - 2Yt - 1Yt - 2. Eine zweite Differenz einer diskreten Funktion ist analog zu einer zweiten Ableitung einer stetigen Funktion: sie mißt zu einem gegebenen Zeitpunkt die Quota-Beschleunigungquot oder quotvequot in der Funktion. Das ARIMA (0,2,2) - Modell ohne Konstante sagt voraus, daß die zweite Differenz der Reihe eine lineare Funktion der letzten beiden Prognosefehler ist, die umgeordnet werden können: wobei 952 1 und 952 2 die MA (1) und MA (2) Koeffizienten. Dies ist ein allgemeines lineares exponentielles Glättungsmodell. Im Wesentlichen das gleiche wie Holt8217s Modell, und Brown8217s Modell ist ein spezieller Fall. Es verwendet exponentiell gewichtete gleitende Mittelwerte, um sowohl eine lokale Ebene als auch einen lokalen Trend in der Reihe abzuschätzen. Die Langzeitprognosen von diesem Modell konvergieren zu einer Geraden, deren Steigung von dem durchschnittlichen Trend abhängt, der gegen Ende der Reihe beobachtet wird. ARIMA (1,1,2) ohne konstante gedämpfte lineare Exponentialglättung. Dieses Modell ist in den begleitenden Dias auf ARIMA-Modellen dargestellt. Es extrapoliert die lokale Tendenz am Ende der Serie, sondern flacht es auf längere Prognose Horizonte, um eine Notiz von Konservatismus, eine Praxis, die empirische Unterstützung hat einzuführen. Siehe den Artikel auf quotWarum die Damped Trend Werke von Gardner und McKenzie und die quotGolden Rulequot Artikel von Armstrong et al. für Details. Es ist grundsätzlich ratsam, bei Modellen zu bleiben, bei denen mindestens einer von p und q nicht größer als 1 ist, dh nicht versuchen, ein Modell wie ARIMA (2,1,2) anzubringen, da dies zu Überbeanspruchungen führen kann Die in den Anmerkungen zur mathematischen Struktur von ARIMA-Modellen näher erläutert werden. Spreadsheet-Implementierung: ARIMA-Modelle wie die oben beschriebenen lassen sich einfach in einer Tabellenkalkulation implementieren. Die Vorhersagegleichung ist einfach eine lineare Gleichung, die sich auf vergangene Werte von ursprünglichen Zeitreihen und vergangenen Werten der Fehler bezieht. Auf diese Weise können Sie eine ARIMA-Prognosekalkulation einrichten, indem Sie die Daten in Spalte A, die Prognoseformel in Spalte B und die Fehler (Daten minus Prognosen) in Spalte C speichern. Die Prognoseformel in einer typischen Zelle in Spalte B wäre einfach Ein linearer Ausdruck, der sich auf Werte in vorhergehenden Zeilen der Spalten A und C bezieht, multipliziert mit den entsprechenden AR - oder MA-Koeffizienten, die in Zellen an anderer Stelle auf der Kalkulationstabelle gespeichert sind.

No comments:

Post a Comment