Hallo Jens,
ich kenne auch nicht alle Antworten auf deine Fragen, etwas fällt mir aber dennoch dazu ein:
Original von Jens
Wann ist es sinnvoll, mehrere Outputs zu definieren und wie können sie das Training verbessern? Können sie auch - wie zu viele, redundante Inputs - das Training in Richtung Curve-Fitting verschlechtern?
Ich glaube nicht, dass dieser Fall (Curve-Fitting) dadurch eintritt, zumindest dann nicht wenn man sinnvolle Outputziele wählt. Bislang habe ich erst zweimal damit experimentiert und es ist keine Verbesserung dabei aufgetreten. Dabei hat es sich um die Prognose der Wertänderung mehrerer Zeithorizonte der gleichen Basis gehandelt (1 und 3 Tage). Ich vermute, der Effekt ist ähnlich wie bei einer Glättung der Basis.
Man könnte natürlich auch ein Outputziel auf einen anderen Titel definieren, der einen engen Intermarketzusammenhang aufweist, beispielsweise den Bund Future bei einer Prognose auf den FDax. Ich denke, dass wäre einer der Fälle in denen man das Prognoseziel von der Bewertung ausschließen sollte. Ob diese Option aber für solche Fälle vorgesehen ist weiß ich auch nicht genau.
zu 2.
Auf diese Art habe ich schon sinnvolle Inputs gefunden. Allerdings kann die Kombination mit anderen Inputs wieder völlig andere Ergebnisse hervorrufen. Ganz so einfach ist es also nicht. Auch die Erweiterung eines schon relativ gut funktionierenden NN um zusätzliche Inputschablonen kann dazu führen, dass das NN insgesamt schlechter wird. Inputs die die Qualität der Prognose verschlechtern werden also nicht grundsätzlich ausgefiltert.
Zu GA-Optimierung auch gleich noch eine Frage: Ich war eigentlich davon ausgegangen, dass Optimierungsvariablen, die ich in Input-Schablonen verwende, während des Netz-Trainings mit GA optimiert werden. In einem einfach aufgebauten Testnetz war dies jedoch nicht der Fall. Es wurde nur die Netzarchitektur verändert nicht die Variablen. Habe ich hier etwas falsch verstanden?
Wie die Optimierungsvariablen verändert wurden kannst du in der Beschreibung des NN sehen, nicht in der Inputschablone, dort bleiben alle Inputs so stehen wie sie ursprünglich eingegeben wurden. Was auch sein kann ist, dass du die Optimierungsvariablen fixiert hast, dann werden sie nicht optimiert.
zu 4.
Grundsätzlich haben die Kennziffern den höchsten Aussagegehalt in Bezug auf den Vergleich verschiedener Generationen eines Netzes, bzw. verschiedener Netze mit gleichem Prognoseziel und gleichem Basistitel. Es macht wenig Sinn die Kennzahlen verschiedener Prognoseziele miteinander zu vergleichen. Ein NN mit 54% Treffern und 0,16 Korrelation kann schon sehr gut sein, wenn es antizyklisch handelt und dabei die wesentlichen Marktwendepunkte richtig erwischt. Im Handelssystem selbst kannst du noch andere Filter mit aufnehmen, die die Prognosefähigkeit des HS verbessern. Als Beispiel einmal ein HS welches auf einem NN mit ähnlichen Kennzahlen basiert (rein technischer Test ohne Slippage und Transaktionskosten):
Testergebnis von System 'mit Zielkurs'
Datum 30.12.2002 23:47:01
Getesteter Titel: Deu: DAX-Index
Ergebnis im Kontrollzeitraum
System Start 25.10.2001
System Ende 30.12.2002
Anzahl aller Trades 51
Anzahl Trades/Jahr 43,2
Getestete Perioden 297
Perioden mit Trades 94,3%
Netto-Profit 1.135,33
Buy/Hold-Profit -398,59
Profit-Ratio zu Buy/Hold 153,39%
Profit/Periode-Ratio zu Buy/Hold 0,54%
Profitable Trades (%) 70,59%
Durchschn. Return 2,23%
Std.-Abw. aller Returns 4,92%
Portfolio-Faktor 100,00
Sharpe Ratio 2,83
Max. realisiertes Kapitalrisiko -3,47%
Anteil(%) Stop-Exits 7,84%
Anzahl Long Trades 25
Anzahl Short Trades 26
Durchschn. Länge der Gewinnserien 3,27
Durchschn. Länge der Verlustserien 1,36
Durchschn. Return pro Zeitabschnitt 64,16%
Durchschn. Trade-Länge 5,49
Max. realisierter Einzelverlust -6,81%
Max. realisierter Kapitalverlust -2,34%
Netto-Profit% 113,53%
Netto-Profit/Jahr 96,15%
Netto-Profit/Periode 4,07
Profitable Long Trades (%) 64,00%
Profitable Short Trades (%) 76,92%
Ob es auch in Zukunft ähnlich Ergebnisse liefert bleibt abzuwarten, schön wärs.
zu 5.
Mein bisheriger Eindruck ist, dass man dem NN eine ganze Menge zumuten kann. Die von dir beschriebenen Indikatoren korrelieren alle sehr stark, da sie Derivate des Kurses sind, der prognostiziert werden soll. Ich würde dem NN nicht zu viele korrelierende Inputdaten geben, damit erhöhst du die Gefahr des Curve Fitting. Stattdessen könnte man solche Indikatoren ergänzend in das Handelssystem aufnehmen, wenn man den Eindruck hat, dass das NN Schwachstellen hat, die durch den Einsatz von Standardindikatoren vermieden werden können. Insgesamt hat es sich als sinnvoll erwiesen Marktindikatoren, Intermarketdaten und Sentimentindikatoren miteinander zu kombinieren.
zu 6.
In Abhängigkeit der Netzarchitektur macht es durchaus einen Unterschied wie die Schablonen gestaltet sind. Bei Verwendung der Reduktionsschicht werden zunächst die Informationen aus einer Inputschablone verarbeitet, was grundsätzlich zu anderen Ergebnissen führen kann.