diverse Anfängerfragen zu NN

Lieber Besucher, herzlich willkommen bei: INVESTOX-Forum. Falls dies Ihr erster Besuch auf dieser Seite ist, lesen Sie sich bitte die Hilfe durch. Dort wird Ihnen die Bedienung dieser Seite näher erläutert. Darüber hinaus sollten Sie sich registrieren, um alle Funktionen dieser Seite nutzen zu können. Benutzen Sie das Registrierungsformular, um sich zu registrieren oder informieren Sie sich ausführlich über den Registrierungsvorgang. Falls Sie sich bereits zu einem früheren Zeitpunkt registriert haben, können Sie sich hier anmelden.

Jens

unregistriert

Montag, 30. Dezember 2002, 22:33

diverse Anfängerfragen zu NN

Hallo allerseits,

Da ich erst vor kurzem von Investox V1 ST auf V3 XL umgestiegen bin, sind NNs noch Neuland für mich. Einige für den Anfänger sehr erhellende Beiträge u.a. von Fritz, Hungerturm und Herrn Knöpfel habe ich in anderern Threads schon gelesen. Untenstehende Fragen sind aber noch offen geblieben und ich bitte die NN-Experten unter Euch, mich auch hier ein wenig zu erleuchten. Sollten auch diese Themen bereits anderswo erschöpfend behandelt worden sein, bitte ich um Nachsicht und entspr. Hinweise auf die Threads.

1. Mehrere Outputs

Zitat Investox-Hilfe:
Prognoseziel in Bewertung einschließen: Gibt an, ob der Output dieses Prognoseziels in die Bewertung des Neuronalen Netzes eingeschlossen werden soll. Sie können ein Prognoseziel zum Beispiel deswegen von der Bewertung ausschließen, weil es nur das Training unterstützen soll, selbst aber für Prognosen (in einem Handelssystem) nicht relevant ist.

© 2002 Andreas Knöpfel

Wann ist es sinnvoll, mehrere Outputs zu definieren und wie können sie das Training verbessern? Können sie auch - wie zu viele, redundante Inputs - das Training in Richtung Curve-Fitting verschlechtern?

2. Vorauswahl von Inputs

Ist es sinnvoll, dass ich Inputs, die ich später in einem NN kombinieren will, vorab einzeln in gesonderten NNs einsetze (eventuell mit einer immer gleichen zweiten Schablone um dem NN überhaupt genug Futter zu bieten) und trainiere, um eine Vorauswahl von Inputs mit potentiell hoher Korrelation zur Basis zu erhalten? Oder wird erst das NN, dem alle Inputs gemeinsam zur Verfügung stehen, die nichtlinearen Zusammenhänge erkennen?

PS: Ich weiss, dass man über die GA-Optimierung eines NN weniger sinnvolle Inputs später noch untergewichten kann. Aber um den Preis eines hohen (Rechen-)Zeitaufwands - daher die Frage nach der Vorauswahl.

3. NN mit GA optimieren

Zu GA-Optimierung auch gleich noch eine Frage: Ich war eigentlich davon ausgegangen, dass Optimierungsvariablen, die ich in Input-Schablonen verwende, während des Netz-Trainings mit GA optimiert werden. In einem einfach aufgebauten Testnetz war dies jedoch nicht der Fall. Es wurde nur die Netzarchitektur verändert nicht die Variablen. Habe ich hier etwas falsch verstanden?

4. Bewertung von NN

Sicherlich die am wenigsten eindeutig zu beantwortende Frage: Wann ist ein NN gut oder zumindest noch ausbaufähig und wann ist es wertlos? Eine Trefferzahl im Kontrollzeitraum von um die 50% und eine Korrelation zur Basis von nullkommanullnochirgendwas spricht ja wohl eher für andere Input-Schablonen. Aber was ist mit z.B. 54% Treffern und Korrelation 0,16? Und wie sind die übrigen Bewertungszahlen zu interpretieren?

5. Was man von NN erwarten kann

Hier eine Frage zum grundlegenden Verständnis dessen, was man von NN überhaupt erwarten kann: Ich gehe mal von der klassischen Emfehlung aus, in Trendmärkten Trendfolgindikatoren und in Seitwärtsmärkten Stochastik-Indikatoren einzusetzen und z.B. über den ADX zu ermitteln, welche Marktphase gerade vorliegt.

Wenn ich einem NN jetzt z.B. ein 20-Tage-Momentum, eine Stochastik und einen ADX als Inputs serviere, werden - abhängig davon welche Marktphase im Trainingszeitraum überwog - Trendfolge- oder Oszillatorsignale stärker das Netz beeinflussen. Falls der ADX einen bestimmten Bezug sur Basis zeigt, wird auch er wohl stärker ins NN-Ergebnis einfließen.

Ich kann aber wohl nicht erwarten, dass das NN selbst aus den Verlaufsmustern erkennen wird, dass bei hohem ADX eher dem Momentum Beachtung geschenkt werden sollte und bei niedrigerem ADX mehr der Stochastik, oder?

6. unterschiedliche Inputs in einer Schablone

Beim Variieren Vorhandener oder dem Erstellen eigener Input-Schablonen kann ich ja mehrere, auch völlig voneinander unabhängige Inputdefinitionen in einer Schablone zusammenfassen. Ich gehe davon aus, dass die Schablonen nur dem Komfort und der Wiederverwendbarkeit dienen. Oder macht es auch einen Unterschied beim Netztraining und dem Ergebnis, ob die Einzelinputs sinnvoll in Schablonen zusammengefasst, oder jweils einzeln eingegeben wurden?

Viele Fragen, ich weiss, aber ich dachte mir: Lieber dumm fragen als dumm sterben...

Zum Seitenanfang

Thomas

unregistriert

Dienstag, 31. Dezember 2002, 00:31

RE: diverse Anfängerfragen zu NN

Hallo Jens,
ich kenne auch nicht alle Antworten auf deine Fragen, etwas fällt mir aber dennoch dazu ein:

Zitat

Original von Jens
Wann ist es sinnvoll, mehrere Outputs zu definieren und wie können sie das Training verbessern? Können sie auch - wie zu viele, redundante Inputs - das Training in Richtung Curve-Fitting verschlechtern?

Ich glaube nicht, dass dieser Fall (Curve-Fitting) dadurch eintritt, zumindest dann nicht wenn man sinnvolle Outputziele wählt. Bislang habe ich erst zweimal damit experimentiert und es ist keine Verbesserung dabei aufgetreten. Dabei hat es sich um die Prognose der Wertänderung mehrerer Zeithorizonte der gleichen Basis gehandelt (1 und 3 Tage). Ich vermute, der Effekt ist ähnlich wie bei einer Glättung der Basis.

Man könnte natürlich auch ein Outputziel auf einen anderen Titel definieren, der einen engen Intermarketzusammenhang aufweist, beispielsweise den Bund Future bei einer Prognose auf den FDax. Ich denke, dass wäre einer der Fälle in denen man das Prognoseziel von der Bewertung ausschließen sollte. Ob diese Option aber für solche Fälle vorgesehen ist weiß ich auch nicht genau.

zu 2.
Auf diese Art habe ich schon sinnvolle Inputs gefunden. Allerdings kann die Kombination mit anderen Inputs wieder völlig andere Ergebnisse hervorrufen. Ganz so einfach ist es also nicht. Auch die Erweiterung eines schon relativ gut funktionierenden NN um zusätzliche Inputschablonen kann dazu führen, dass das NN insgesamt schlechter wird. Inputs die die Qualität der Prognose verschlechtern werden also nicht grundsätzlich ausgefiltert.

Zitat

Zu GA-Optimierung auch gleich noch eine Frage: Ich war eigentlich davon ausgegangen, dass Optimierungsvariablen, die ich in Input-Schablonen verwende, während des Netz-Trainings mit GA optimiert werden. In einem einfach aufgebauten Testnetz war dies jedoch nicht der Fall. Es wurde nur die Netzarchitektur verändert nicht die Variablen. Habe ich hier etwas falsch verstanden?

Wie die Optimierungsvariablen verändert wurden kannst du in der Beschreibung des NN sehen, nicht in der Inputschablone, dort bleiben alle Inputs so stehen wie sie ursprünglich eingegeben wurden. Was auch sein kann ist, dass du die Optimierungsvariablen fixiert hast, dann werden sie nicht optimiert.

zu 4.
Grundsätzlich haben die Kennziffern den höchsten Aussagegehalt in Bezug auf den Vergleich verschiedener Generationen eines Netzes, bzw. verschiedener Netze mit gleichem Prognoseziel und gleichem Basistitel. Es macht wenig Sinn die Kennzahlen verschiedener Prognoseziele miteinander zu vergleichen. Ein NN mit 54% Treffern und 0,16 Korrelation kann schon sehr gut sein, wenn es antizyklisch handelt und dabei die wesentlichen Marktwendepunkte richtig erwischt. Im Handelssystem selbst kannst du noch andere Filter mit aufnehmen, die die Prognosefähigkeit des HS verbessern. Als Beispiel einmal ein HS welches auf einem NN mit ähnlichen Kennzahlen basiert (rein technischer Test ohne Slippage und Transaktionskosten):

Testergebnis von System 'mit Zielkurs'
Datum 30.12.2002 23:47:01

Getesteter Titel: Deu: DAX-Index
Ergebnis im Kontrollzeitraum

System Start 25.10.2001
System Ende 30.12.2002
Anzahl aller Trades 51
Anzahl Trades/Jahr 43,2
Getestete Perioden 297
Perioden mit Trades 94,3%
Netto-Profit 1.135,33
Buy/Hold-Profit -398,59
Profit-Ratio zu Buy/Hold 153,39%
Profit/Periode-Ratio zu Buy/Hold 0,54%
Profitable Trades (%) 70,59%
Durchschn. Return 2,23%
Std.-Abw. aller Returns 4,92%
Portfolio-Faktor 100,00
Sharpe Ratio 2,83
Max. realisiertes Kapitalrisiko -3,47%
Anteil(%) Stop-Exits 7,84%
Anzahl Long Trades 25
Anzahl Short Trades 26
Durchschn. Länge der Gewinnserien 3,27
Durchschn. Länge der Verlustserien 1,36
Durchschn. Return pro Zeitabschnitt 64,16%
Durchschn. Trade-Länge 5,49
Max. realisierter Einzelverlust -6,81%
Max. realisierter Kapitalverlust -2,34%
Netto-Profit% 113,53%
Netto-Profit/Jahr 96,15%
Netto-Profit/Periode 4,07
Profitable Long Trades (%) 64,00%
Profitable Short Trades (%) 76,92%

Ob es auch in Zukunft ähnlich Ergebnisse liefert bleibt abzuwarten, schön wärs.

zu 5.
Mein bisheriger Eindruck ist, dass man dem NN eine ganze Menge zumuten kann. Die von dir beschriebenen Indikatoren korrelieren alle sehr stark, da sie Derivate des Kurses sind, der prognostiziert werden soll. Ich würde dem NN nicht zu viele korrelierende Inputdaten geben, damit erhöhst du die Gefahr des Curve Fitting. Stattdessen könnte man solche Indikatoren ergänzend in das Handelssystem aufnehmen, wenn man den Eindruck hat, dass das NN Schwachstellen hat, die durch den Einsatz von Standardindikatoren vermieden werden können. Insgesamt hat es sich als sinnvoll erwiesen Marktindikatoren, Intermarketdaten und Sentimentindikatoren miteinander zu kombinieren.

zu 6.
In Abhängigkeit der Netzarchitektur macht es durchaus einen Unterschied wie die Schablonen gestaltet sind. Bei Verwendung der Reduktionsschicht werden zunächst die Informationen aus einer Inputschablone verarbeitet, was grundsätzlich zu anderen Ergebnissen führen kann.

Zum Seitenanfang

Jens

unregistriert

Dienstag, 31. Dezember 2002, 20:39

Hallo Thomas,

vielen Dank für die schnelle und umfassende Beantwortung meiner Fragen. Du hast mir sehr geholfen.

Ich wünsche Dir und allen anderen hier einen guten Rutsch!

Zum Seitenanfang