Sunday, 15 October 2017

Limits Of Moving Durchschnitt In Zeit Serie


Short Term Trading Techniques 8211 Erstellen kurzfristiger Trading-Strategie Kurzfristige Trading-Techniken sollte leicht zu verstehen, Guten Tag Trader, vor ein paar Tagen ging ich über grundlegende kurzfristige Trading-Techniken, die gezeigt, wie die Länge eines gleitenden Durchschnitt oder die Länge eines Breakout Moving Average, ändert sich die Chancen drastisch. Für diejenigen, die nicht den ersten Teil dieser Serie gelesen haben, können Sie den vollständigen Bericht lesen und das Video hier ansehen. Kurz und bündig zeigte ich den 20 Tage gleitenden Durchschnitt, den 40 Tage gleitenden Durchschnitt, den 60 Tage gleitenden Durchschnitt, den 80 Tage gleitenden Durchschnitt und den 100 Tage gleitenden Durchschnitt. Als ich die Länge des gleitenden Durchschnitts erhöhte, stiegen die Gewinnchancen der Gewinne ebenfalls zu. Das beste Ergebnis wurde mit einem 90 Tage einfachen gleitenden Durchschnitt erreicht. Die schlechtesten Ergebnisse wurden mit dem 20 Tage gleitenden Durchschnitt erzielt. Alles nach 90 Tagen verursachte die Methode, den Prozentsatz der Rentabilität zu verringern. Wenn eine Strategie hat schreckliche Gewinn-Verhältnis, betrachten Sie es umzukehren Während der Prüfung der unterschiedlichen Länge der gleitenden Durchschnitt, entdeckten wir, dass 20-Tage-Ausbrüche tendenziell genau sind nur 29,7 Prozent der Zeit. Das ist nicht vielversprechend. Allerdings, wenn wir diese Technik umkehren werden wir am Ende mit einem Eintrag Methode, die 70,3 genau ist. Stellen Sie sich vor, Handel kurzfristige Trading-Techniken mit über 70 Genauigkeit. Heute werde ich Ihnen zeigen, wie wir eine Einstiegsmethode, die schrecklichen Prozentsatz der Rentabilität und umgekehrt produzieren kann, um Rentabilität über 70 Prozent zu produzieren. Unsere Testergebnisse entdeckten, dass 20 Tage Ausbrüche 70 Prozent falsche Ausbrüche produzieren, was ich tat, war eine Strategie zu schaffen, die 20 Tage Ausbrüche verblasst. Ich fügte dann ein paar Filter, um die Rentabilität noch weiter zu erhöhen. Lange Eintrag Regeln. Der Vorrat oder irgendein anderer Markt, den Sie handeln, muss einen 20 Tagespreis niedrig bilden, außerdem muss der Markt am oberen Viertel des täglichen Bereichs schließen. Dies ist der Filter, über den ich gesprochen habe. Es wird mir zeigen, die Aktien oder andere Märkte, die Dampf verlieren, nachdem die 20 Tage hoch. Hier sind ein paar Bilder, so dass Sie sehen können, wie es visuell aussieht. Darüber hinaus, und dies ist ein großes, wollen Sie sicherstellen, dass die 20 Tage niedrig ist GEGEN den Haupttrend. Bedeutet, dass Sie diese Methode nur in Richtung des Haupttrends handeln möchten. Hier ist eine visuelle, so können Sie ein gutes Gefühl für diese Methode. Hinweis Der Trend ist bis 8211 Dies ist die Richtung, die wir diesen Markt handeln wollen. Der nächste Schritt ist, um eine Bestellung 0,25 Cent über dem hohen, dass an diesem Tag erreicht wurde. Ich habe 18217t Deckung Schutz Stop Loss Orders oder Ziele in diesem Tutorial, that8217s für morgen Tutorial. Diese Einstellung ist nur wirksam für einen Tag nach dem 20 Tage niedrig gemacht wurde, wenn Sie nicht gefüllt sind bitte stornieren Reihenfolge. Indem wir nur in Richtung des Haupttrends gehen und nur die Märkte, die im oberen Quartal abschließen, auswählen, erhöhen wir unsere Quote noch weiter. Diese Strategie hat eine der höchsten Profitraten, die ich in 20 Jahren gesehen habe. Morgen werde ich über Stop-Stop-Platzierung und Gewinnziele für diese Methode gehen. Es gibt kurzfristige Handelstechniken, die Tausende von Dollar kosten, die diese einfache Methode nicht ausführen können. Denken Sie daran, kompliziert und teuer nicht gleich Rentabilität. Dies ist einer meiner Lieblings-Trading-Techniken, können Sie sehen, wie schnell die Dynamik in Richtung der wichtigsten Trend fortgesetzt. Kurzeintragsregeln. Die Aktie oder ein anderer Markt, den Sie handeln, muss einen 20-tägigen Preis niedrig machen, zusätzlich muss sich der Markt im oberen Viertel des Tagesbereichs schließen. Dies ist der Filter, über den ich gesprochen habe, wird zeigen, die Aktien oder andere Märkte, die Dampf verlieren, nachdem die 20 Tage hoch. Hier sind ein paar Bilder, so dass Sie sehen können, wie es visuell aussieht. Darüber hinaus, und dies ist ein großes, wollen Sie sicherstellen, dass die 20 Tage niedrig ist GEGEN den Haupttrend. Bedeutet, dass Sie diese Methode nur in Richtung des Haupttrends handeln möchten. Hier ist eine visuelle, so können Sie ein gutes Gefühl für diese Methode. Beispiel für die Aufnahme von Signalen auf der kurzen Seite. Denken Sie daran, Sie müssen mit dem Haupttrend gehen. In diesem Beispiel können Sie genau sehen, wo zu verkaufen Stop geht. Denken Sie daran, der Markt muss gegen die Richtung der Break-und schließen an der Unterseite 25 Prozent der täglichen Reichweite an diesem Tag schließen. Dies ist ein sehr wichtiger Schritt, dass viele Händler ignorieren, empfehle ich, diese Regeln genau zu folgen. Sie können genau sehen, wo die Kauf-Verkaufsstopp in diesem Beispiel platziert ist. Die Lagerhaltung wird ausgelöst und der Markt fällt in Richtung Haupttrend zurück. Dies ist sehr wichtig und kann den Unterschied machen, wenn der Handel dieser Strategie. Vergewissern Sie sich, dass Sie Ihre Bestellung stornieren, wenn Ihr Einstiegsbeginn nicht einen Tag nach 20 Tagen erreicht wird. Diese Beispiele sollten Ihnen eine gute Idee der 20-Tage-Fade-Strategie. Morgen werde ich genau gehen, wie Sie Ihre Stop-Loss-Ebene zu berechnen und wie Sie Ihr Gewinnziel zu berechnen. Ich werde zeigen, die ATR-Indikator, die dies sehr leicht erreichen wird. Die 20-tägige Fade-Strategie ist eine meiner bevorzugten kurzfristigen Trading-Techniken. Ich hoffe, dass Sie uns für tomorrow8217s Tutorium verbinden. Für mehr zu diesem Thema gehen Sie bitte zu: Viele Leute fragen mich ist Swing Trading für ein lebendes möglich und Swing Trading für Anfänger von Trainer Market Geeks. Understanding Time Series Forecasting Concepts Von Zeit zu Zeit müssen SQL Server-Profis Schätzungen bereitstellen Der zukünftigen Werte wie Umsatzprognosen oder Umsatzprognosen. Organisationen verlassen sich manchmal auf Data-Mining-Technologie, um Prognosemodelle für diese Schätzungen zu erstellen. Ich werde die wichtigsten Konzepte erläutern, die notwendig sind, um zu verstehen, wie diese Data-Mining-Technologien funktionieren. Ich stelle Ihnen auch einige der zugrunde liegenden Einzelheiten vor, damit sie bei der ersten Begegnung nicht so fremd und gewaltig erscheinen. Mit einem Verständnis der wichtigsten Konzepte und die Exposition gegenüber einigen der Details, you39ll in einer besseren Position, um mit der Verwendung der Prognosefähigkeiten in SQL Server Analysis Services (SSAS). Warum Data Mining Isn39t mehr populär In den letzten zehn Jahren, sobald Nische Business Intelligence (BI) Technologien wie OLAP haben sich breit angelegt. Während dieser Zeit hat Microsoft auch eine weitere BI-Technologie, Data Mining, in populäre Tools wie Microsoft SQL Server und Microsoft Excel geschoben, aber Data Mining ist noch nicht zu einer Mainstream-Technologie geworden. Warum ist das Obwohl die meisten Menschen grundlegende Data-Mining-Konzepte auch ohne formale Ausbildung zu erfassen, sind die zugrunde liegenden Details der Algorithmen durchdrungen in mathematischen Konzepten und Formeln. Zwischen dem begrifflichen Verstehen auf hoher Ebene und den Implementierungsdetails besteht ein erheblicher Quotient. Als Ergebnis wird Data Mining als Black Box von IT-Profis und Business-Anwender gleichermaßen gesehen, die Vertrauen in die Nutzung und die Annahme der Technologie senkt. "Unverzichtbare Zeitreihenprognose Conceptsquot ist mein Versuch, das quotdrop offquot für Zeitreihenprognosen weniger steil zu machen. Prognosemethoden Es gibt verschiedene Ansätze zur Prognose. Beispielsweise klassifiziert die Website der Prognosemethoden die Prognosemethoden in verschiedene Kategorien, darunter lässige (aka ökonometrische), bewertungsrelevante, Zeitreihen, künstliche Intelligenz, Prognosemarkt, probabilistische Prognose, Prognosesimulationen und Prognose der Referenzklasse. Die Vorhersage-Prinzipien-Website hat einen Methodenbaum, der die Methoden klassifiziert, beginnend mit einer Aufteilung zwischen urteilenden Methoden (d. H. Methoden, die verwendet werden, wenn die verfügbaren Daten für eine quantitative Analyse unzureichend sind) und statistische Verfahren (d. h. Verfahren, die verwendet werden, wenn relevante numerische Daten verfügbar sind). In diesem Artikel konzentrieren wir uns auf die Zeitreihenvorhersage, einen statistischen Ansatz, in dem historische Daten für die zu prognostizierenden Werte zur Verfügung stehen. Zeitreihenprognosen gehen davon aus, dass vergangene Daten dazu beitragen können, zukünftige Werte zu erklären. Es ist wichtig zu wissen, dass in einigen Situationen möglicherweise Umstände nicht in den historischen Daten wider. Zum Beispiel könnte es einen neuen Konkurrenten geben, der die künftigen Einnahmen oder einen raschen Wandel in der Belegschaftszusammensetzung beeinträchtigen könnte (z. B. eine Zunahme der in den sechziger Jahren entstandenen Familienstrukturen mit zwei Einkommen), die die künftigen Arbeitslosenraten beeinflussen könnte. In diesen Situationen ist eine Zeitreihenprognose möglicherweise nicht der beste Ansatz oder sollte nicht der einzige Ansatz sein. Oft werden verschiedene Prognosemethoden kombiniert, um die genauesten Vorhersagen zu liefern. Verstehen der Grundlagen der Zeitreihenvorhersage Eine Zeitreihe ist ein Satz von Werten, die über einen Zeitraum beobachtet werden, typischerweise in regelmäßigen Intervallen. Häufige Beispiele sind wöchentliche Umsatzbeträge, vierteljährliche Ausgaben und monatliche Arbeitslosenquoten. Die Zeitreihendaten werden häufig in einem grafischen Format dargestellt, wobei das Zeitintervall entlang der x-Achse eines Diagramms und die Werte entlang der y-Achse, wie in Fig. 1 gezeigt, dargestellt sind. In Bezug auf das Verständnis, wie sich ein Wert von einer Periode zur nächsten ändert und wie zukünftige Werte zu prognostizieren, hat die Zeitreihendaten mehrere Hauptmerkmale: Basisniveau. Der Basispegel ist typischerweise als der Durchschnittswert der Serie definiert. Bei einigen Prognosemodellen ist die Basisstufe als Anfangswert der Seriendaten definiert. Trend. Ein Trend ist typischerweise so definiert, wie sich die Serie von einer Periode zur nächsten ändert. Zum Beispiel in Abbildung 1, die Zahl der Arbeitslosen tendenziell Trend nach oben von Anfang 2008 bis Januar 2010, nach denen es scheint einen Abwärtstrend zu zeigen. (Informationen über den Beispieldatensatz, der für die Erstellung der Diagramme in diesem Artikel verwendet wird, finden Sie in der Seitenleiste unter "Berechnen der Arbeitslosigkeit".) Berechnen der Arbeitslosigkeit In den Unvereinbarten Zeitreihenprognosekonzepten stammen die Daten für die Diagramme aus den Beschäftigungsdaten des US-Büros Der Arbeitsstatistiken. Die BLS veröffentlicht die Arbeitslosenquote basierend auf einer monatlichen US-Volkszählung Bureau Umfrage, dass die Gesamtzahl der Beschäftigten und Arbeitslosen extrapoliert. Insbesondere die BLS nutzt die Formel: Arbeitslosenquote arbeitslos (Arbeitslose beschäftigt) Interessanterweise ist die Arbeitslosenquote in der Regel zitiert in den Nachrichten eine saisonbereinigte Rate. Die saisonale Anpassung erfolgt mit der öffentlich verfügbaren autoregressiven integrierten gleitenden Durchschnitt (ARIMA) Umsetzung. Dies ist im Wesentlichen der gleiche Algorithmus, der von vielen Data-Mining-Paketen für die Zeitreihenvorhersage verwendet wird, einschließlich SQL Server Analysis Services (SSAS). Weitere Informationen über die ARIMA-Implementierung, die vom Census Bureau verwendet wird, finden Sie auf der Webseite des X-12-ARIMA Seasonal Adjustment Program. Beachten Sie, dass im Beispielprojekt für diesen Artikel sowohl die saisonbereinigten als auch die nicht saisonbereinigten Werte berücksichtigt wurden. Saisonalität. Bestimmte Werte werden tendenziell steigen und fallen auf der Grundlage bestimmter Zeiträume, wie der Tag der Woche oder des Monats des Jahres. Beispiele schließen Einzelverkauf ein, die häufig während der Weihnachtsjahreszeit spitzen. Im Fall der Arbeitslosigkeit gibt es eine saisonale Tendenz mit einer höheren Anzahl von Arbeitslosen im Januar und Juli und niedrigeren Zahlen im Mai und Oktober, wie Abbildung 2 zeigt. Lärm. Einige Prognosemodelle beinhalten ein viertes Merkmal, Rauschen, das sich auf zufällige Variationen und unregelmäßige Bewegungen in den Daten bezieht. Lärm wird hier nicht behandelt. Wenn Sie also einen Trend identifizieren, diesen Trend auf die Basisebene anwenden und jegliche Saisonalität in den Daten berücksichtigen, verfügen Sie über ein Prognosemodell, mit dem zukünftige Werte vorhergesagt werden können: Prognostizierter Wert Basiswert Trend Saisonalität Identifizieren Ein Basiswert und Trend Eine Möglichkeit, einen Basiswert und Trend zu identifizieren, besteht darin, eine Regressionstechnik anzuwenden. Der Begriff Regression bedeutet, die Beziehung zwischen Variablen zu studieren. In diesem Fall ist die Beziehung zwischen der unabhängigen Zeitvariablen und der abhängigen Variablen der Zahl der Arbeitslosen. Man beachte, dass die unabhängige Variable manchmal als Prädiktor bezeichnet wird. Sie können ein Tool wie Microsoft Excel verwenden, um die Regressionstechnik anzuwenden. Beispielsweise können Sie Excel automatisch berechnen und eine Trendlinie zu einem Zeitreihen-Diagramm hinzufügen, indem Sie das Trendline-Menü auf der Registerkarte Diagrammwerkzeuge oder Registerkarte PivotChart-Werkzeuge im Excel 2010- oder Excel 2007-Farbband verwenden. In Abbildung 1 fügte ich eine gerade Linie Trendline hinzu, indem Sie die Option Lineare Trendlinie im Trendline-Menü auswählen. Danach wählte ich mehr Trendlinien-Optionen im Trendline-Menü und wählte die Anzeigegleichung im Diagramm und den R-Quadrate-Wert auf Diagrammoptionen aus, die in Abbildung 3 dargestellt sind. Dieser Prozeß der Anpassung einer Trendlinie an die historischen Daten wird als lineare Regression bezeichnet. Wie Sie in Abbildung 1 sehen können, wird die Trendlinie mit einer Gleichung berechnet, die den Basispegel (8248.8) und den Trend (104.67x) identifiziert: y 104.67x 8248.8 Sie können sich die Trendlinie als Reihe von verbundenen xy-Koordinaten vorstellen Kann eine Zeitspanne (dh die x-Achse) anschließen, um zu einem Wert (der y-Achse) zu gelangen. Excel bestimmt die Quotebestquot-Trendlinie mit der sogenannten least-squared-Methode (identifiziert als Rsup2 in Abbildung 1). Die kleinste quadratische Linie ist die Linie, die den quadratischen vertikalen Abstand von jedem Trendlinienpunkt zu seinem entsprechenden Linienpunkt minimiert. Quadratwerte werden verwendet, so dass Abweichungen oberhalb und unterhalb der tatsächlichen Linie don39t einander auslöschen. In Abbildung 1 erklärt Rsup2 0.5039, die die lineare Beziehung anzeigt, 50.39 Prozent der Veränderungen in den arbeitslosen Statistiken über die Zeit. Die Identifizierung einer genauen Trendlinie in Excel beinhaltet oft Versuch und Irrtum, zusammen mit visuellen Inspektion. In Abbildung 1 ist die lineare Trendlinie nicht optimal. Excel stellt weitere Trendlinienoptionen zur Verfügung, die in Abbildung 3 zu sehen sind. Beispielsweise habe ich in 4 eine vierzeilige gleitende durchschnittliche Trendlinie hinzugefügt, die Punkte basierend auf einem Durchschnitt der aktuellen und der letzten festgelegten Perioden in der Zeitreihe punktiert. Ich habe auch eine polynomische Trendlinie, die eine algebraische Gleichung verwendet, um eine Linie zu bauen. Beachten Sie, dass die Polynom-Trendlinie einen Rsup2-Wert von 0,9318 aufweist, was eine bessere Anpassung bei der Erläuterung der Beziehung zwischen der unabhängigen und der abhängigen Variablen anzeigt. Ein höheres Rsup2 doesn39t muss jedoch unbedingt angeben, ob die Trendlinie genaue Prognosen liefert. Es gibt andere Methoden, um die Prognosegenauigkeit zu berechnen, die ich kurz erörtern werde. Einige der Trendline-Optionen in Excel (z. B. linear, polynomial) können Sie prognostizieren voraus und rückwärts durch eine Reihe von Perioden, mit den daraus resultierenden Prognose-Werte in der Grafik aufgetragen. Sagen, dass Sie quotforecast backwardquot kann seltsam erscheinen. Der beste Weg, um es zu erklären, ist mit einem Beispiel. Angenommen, ein neues factormdasha schnelles Wachstum in der Regierung Arbeitsplätze (z. B. Homeland Defense Arbeitsplätze in den frühen 2000er Jahren, temporäre US-Census Bureau Arbeiter) mdash verursacht einen schnellen Rückgang der Arbeitslosigkeit. Sie wollen die Wachstumsrate dieses neuen Arbeitssektors für mehrere Monate rückwärts prognostizieren und dann die Arbeitslosigkeit neu berechnen, um zu einer geglätteten Veränderungsrate zu gelangen. Sie können die Trendliniengleichung auch manuell verwenden, um prognostizierte Werte zu berechnen. In Fig. 5 fügte ich eine polynomische Trendlinie mit einer sechsmonatigen Prognose hinzu, nachdem die letzten sechs Monate der Daten (d. h. Daten von April bis September 2012) aus den ursprünglichen Zeitreihen entfernt worden waren. Wenn Sie Abbildung 5 mit Abbildung 1 vergleichen, können Sie sehen, dass die Polynomprognosen nach oben tendieren, was nicht mit dem Abwärtstrend der tatsächlichen Zeitreihen übereinstimmt. Es ist wichtig, zwei zusätzliche Punkte zur Regression zu beachten: Wie bereits erwähnt, beinhaltet die lineare Regression eine unabhängige und eine abhängige Variable. Wenn Sie verstehen wollen, wie zusätzliche unabhängige Variablen die Änderung einer abhängigen Variablen erklären können, können Sie ein multiples Regressionsmodell erstellen. Im Zusammenhang mit der Prognose der Zahl der Arbeitslosen in den Vereinigten Staaten könnten Sie in der Lage sein, die Rsup2 (und die Prognosegenauigkeit) zu erhöhen, indem sie auch das Wirtschaftswachstum, die US-Bevölkerung und die Zunahme der Zahl der Beschäftigten berücksichtigt haben Beschäftigten. SSAS kann mehrere Variablen (d. H. Regressoren) in einem Zeitreihenvorhersagemodell unterbringen. Zeitreihen-Prognosealgorithmen, einschließlich jener in SSAS, könnten Autokorrelation berechnen, die die Korrelation zwischen benachbarten Werten in einer Zeitreihe ist. Prognosemodelle, die Autokorrelation direkt einbeziehen, heißen autoregressive (AR) Modelle. In einem AR-Modell sind die Prädiktoren die Vergangenheitswerte der Reihe und nicht irgendein Faktor der unabhängigen Variablen. Beispielsweise liefert ein lineares Regressionsmodell eine Trendgleichung, die auf der Periode (z. B. 104,67 x) basiert, während ein AR-Modell-Trend auf vergangenen Werten basiert (z. B. -0,417 arbeitslos (-1) 0,549 Beschäftigt (-1)). AR-Modelle haben das Potenzial, die Prognosegenauigkeit zu verbessern, indem zusätzliche Informationen jenseits von Trend - und Saisonalität hinzugefügt werden. Buchhaltung für Saisonalität Es ist üblich für Saisonalität zu zeigen, in einer Zeitreihe, ob it39s am Tag der Woche, Tag des Monats oder Monat des Jahres. Wie bereits erwähnt, steigt die Zahl der Arbeitslosen in den USA typischerweise in einem bestimmten Kalenderjahr. (Dies gilt auch, wenn die Wirtschaft sehr gut funktioniert, wie Abbildung 2 zeigt.) Im Hinblick auf die Prognose, müssen Sie für diese Saisonalität, um genaue Vorhersagen. Ein gemeinsamer Ansatz ist, die Saisonalität zu glätten. Galit Shmueli empfiehlt die Verwendung einer von drei Methoden: Berechnen Sie einen gleitenden Durchschnitt Aggregieren Sie die Zeitreihe auf einer weniger körnigen Ebene (z. B. Blick auf die Arbeitslose Zahlen pro Quartal statt monatlich) Generierung von separaten Zeitreihen (und Prognosen) nach Saison Eine Basisebene und Trend wird dann abgeleitet, um Prognosen gegen die geglättete Zeitreihe zu generieren. Wahlweise können Saisonalität oder körnige Anpassungen wieder auf die prognostizierten Werte angewendet werden, indem sie in der ursprünglichen Saisonalität nach der Holt-Winters-Methode zurückversetzt werden. Wenn Sie sehen möchten, wie Sie in Saisonalität mit Excel Faktor könnte, führen Sie eine Internet-Suche mit dem Ausdruck Winters-Methode in Excel. Sie können auch eine genaue Erklärung der Holt-Winters-Methode in Wayne L. Winston39s Microsoft Office Excel 2007: Datenanalyse und Business-Modellierung, zweite Ausgabe (Microsoft Press, 2007). In vielen Data-Mining-Paketen wie SSAS berücksichtigen Zeitreihenprognose-Algorithmen automatisch die Saisonalität, indem sie die saisonalen Beziehungen quantifizieren und in das Prognosemodell aufnehmen. Allerdings möchten Sie oftmals Hinweise über das aktuelle saisonale Muster geben. Messung der Prognosemodellgenauigkeit Wie bereits erwähnt, entspricht die Anfangsanpassung eines Modells (gemessen nach der Methode der kleinsten Quadrate) nicht unbedingt einer genauen Prognose. Der beste Weg, um Prädiktionsgenauigkeit zu testen, besteht darin, die Zeitreihe in zwei Datensätze aufzuteilen: eine für das Gebäude (d. H. Das Training) des Modells und die andere zur Validierung. Der Validierungsdatensatz ist der jüngste Teil des ursprünglichen Datensatzes und sollte idealerweise eine Zeitspanne umfassen, die gleich der zukünftigen Prognosezeitleiste ist. Zur Validierung des Modells werden die prognostizierten Werte mit Istwerten verglichen. Beachten Sie, dass nach der Validierung das Modell unter Verwendung der gesamten Zeitreihe neu erstellt werden soll, damit zukünftige Prognosen von den aktuellsten tatsächlichen Werten profitieren können. Bei der Messung der Genauigkeit eines Prognosemodells gibt es zwei häufig gestellte Fragen. Wie kann ich Prädiktionsgenauigkeit definieren? In einigen Szenarien können vorhergesagte Werte, die höher als der tatsächliche Wert sind, nachteilig sein (z. B. Vorhersagen über die Investitionsleistung). In anderen Situationen könnten vorhergesagte Werte, die niedriger als der tatsächliche Wert sind, schädlich sein (z. B. voraussagend das niedrigste gewinnende Gebot auf einem Auktionselement). Aber in Fällen, in denen Sie eine gewichtete gewichtete Punktzahl für alle Vorhersagen berechnen wollen (keine Sorge, wenn die Vorhersagen höher oder niedriger als der tatsächliche Wert sind), können Sie durch Quantifizierung des Fehlers in einer einzigen Prognose mit der Definition: Fehler vorhergesagt Wert ndash actual value Mit dieser Definition eines Fehlers sind zwei der beliebtesten Methoden zur Messgenauigkeit der mittlere absolute Fehler (MAE) und der mittlere absolute prozentuale Fehler (MAPE). Bei der MAE-Methode werden die Absolutwerte der Prognosefehler summiert und dann durch die Gesamtzahl der Prognosen dividiert. Bei der MAPE-Methode werden die durchschnittlichen Abweichungen der Prognosen als Prozentsatz berechnet. Wenn Sie ein Beispiel dieser und einiger anderer Methoden zur Messgenauigkeit sehen möchten, ist auf der Seite Demand Metrics Diagnostics Template eine Excel-Vorlage (mit Beispielprognosedaten und Genauigkeitscores) verfügbar. Wie viel historische Daten sollte ich verwenden, um mein Modell trainieren Bei der Arbeit mit einer Zeitreihe, die weit zurück in die Vergangenheit geht, könnten Sie geneigt, alle historischen Daten in das Modell enthalten. Irgendwann kann jedoch eine zusätzliche Historie die Prognosegenauigkeit nicht verbessern. Ältere Daten können die Prognose sogar verkürzen, wenn die vergangenen Bedingungen weit unter den gegenwärtigen Bedingungen liegen (z. B. gibt es heute eine andere Belegschaftszusammensetzung als in der Vergangenheit). Ich habe keine bestimmte Formel oder Faustregel, die erzählt, wie viel historische Daten enthalten, so dass mein Vorschlag ist es, mit einer Zeitreihe, die mehrmals größer als die Prognose Zeitrahmen, dann testen Sie auf Genauigkeit zu starten. Als nächstes versuchen Sie, die Höhe der Geschichte nach oben oder unten und Wiederholen. Arbeiten mit Zeitreihenvorhersage in SSAS Zeitreihenvorhersage erschien erstmals im SSAS 2005. Sein Microsoft-Zeitreihenalgorithmus verwendete einen einzigen Algorithmus namens autoregressiver Baum mit Kreuzvorhersage (ARTXP), um Prognosen zu generieren. ARTXP vermischt AR-Techniken mit einem Data-Mining-Querverweis-Baumquot, so dass sich die Vorhersagegleichung auf der Grundlage bestimmter Kriterien ändern kann (d. h. geteilt). Beispielsweise könnte ein Prognosemodell eine engere Anpassung (und eine bessere Prognosegenauigkeit) erzeugen, wenn es zuerst nach dem Datum geteilt wird und dann durch den Wert einer unabhängigen Variablen aufgeteilt wird, wie in 6 gezeigt. In SSAS 2008 ist der Microsoft Time Series-Algorithmus Begann mit einem zweiten Algorithmus namens autoregressive integrierten gleitenden Durchschnitt (ARIMA) zusätzlich zu ARTXP, um langfristige Prognosen zu verbessern. ARIMA gilt als Industriestandard und kann als Kombination der AR - und Moving-Average-Techniken betrachtet werden. Außerdem werden historische Prognosefehler ausgewertet, um das Modell zu verbessern. Das Standardverhalten des Microsoft Time Series-Algorithmus besteht darin, die Ergebnisse der ARIMA - und ARTXP-Algorithmen zu kombinieren, um optimale Prognosen zu erzielen. Nach SQL Server Books Online (BOL): Der Algorithmus trainiert zwei separate Modelle auf den gleichen Daten: Ein Modell verwendet den ARTXP-Algorithmus und ein Modell verwendet den ARIMA-Algorithmus. Der Algorithmus kombiniert dann die Ergebnisse der beiden Modelle, um die beste Vorhersage über eine variable Anzahl von Zeitscheiben zu liefern. Da ARTXP für kurzfristige Prognosen am besten geeignet ist, wird es am Anfang einer Reihe von Vorhersagen stärker gewichtet. Jedoch, wie die Zeitscheiben, die Sie vorhersagen, bewegen sich weiter in die Zukunft, ARIMA wird schwerer gewichtet. Wenn Sie mit Zeitreihenvorhersage in SSAS arbeiten, müssen Sie folgendes beachten: Obwohl es eine Registerkarte mit dem Namen Mining Accuracy Chart in SSAS, diese Registerkarte doesn39t Arbeit mit Zeitreihen-Data-Mining-Modelle. Infolgedessen müssen Sie die Genauigkeit manuell messen mit einer der Methoden, die ich erwähnt habe (z. B. MAE, MAPE) mit einem Werkzeug wie Excel, um mit den Berechnungen zu unterstützen. Mit der Enterprise Edition von SSAS können Sie ein einziges Zeitreihenmodell in mehrere quothistorische Modelle segmentieren, so dass Sie die Daten nicht manuell in Trainings - und Validierungsdatensätze aufteilen müssen, wenn Sie auf prädiktive Genauigkeit testen. Aus Sicht eines Endbenutzers gibt es noch immer nur ein Zeitreihenmodell, aber Sie können die tatsächlichen Ergebnisse mit den vorhergesagten Ergebnissen im Modell vergleichen, wie in Abbildung 7 dargestellt. Wenn Sie mit der Enterprise Edition aren39t oder wenn Sie nicht nutzen möchten Diese Funktion müssen Sie zuerst manuell teilen Sie die Daten. Der nächste Schritt In diesem Artikel stellte ich Ihnen die Konzepte vor, die zum Verständnis der Grundlagen der Zeitreihenvorhersage notwendig sind. Ich habe Ihnen auch einige der Details der zugrundeliegenden Algorithmen vorgestellt, so dass sie kein Hindernis für die Implementierung von Zeitreihen werden. Als nächsten Schritt lade ich Sie ein, eine Zeitreihenprognose mit SSAS durchzuführen. Ich schloß ein Beispielprojekt ein, das die Arbeitslosendaten benutzt, die in diesem Artikel referenziert werden. (Um dieses Projekt zu erhalten, klicken Sie oben auf der Seite auf das Symbol "Code herunterladen"). Anschließend können Sie das TechNet-Tutorial "Tutorial für animierte Data Mining" (Analysis Services ndash Data Mining)

No comments:

Post a Comment