Hallo Kollegen!
Ich bin gerade auf diesen Thread gestoßen, der zwar schon etwas älter, aber umso beachtenswerter ist. Ein gutes Beispiel dafür, dass Menschen im Internet offenbar alle Anstandsformen vergessen.
Ich möchte gerne aus eigener Erfahrung zu diesem Thema etwas beitragen, vielleicht interessiert es ja den einen oder anderen, der sich mit historischen Tickdaten beschäftigt?
Zuallererst möchte ich anführen, dass es zwei unterschiedliche Datenformate für die Eurex Tickdaten gibt. Das ältere, welches irgendwann 2003 geändert wurde, enthielt Daten zu Instrument, Handelszeit- und datum, Verfallstermin, Kurswert und Stückzahlen. Einzelne Unterscheidungen, der Trades in Basistrade, Volatrade etc. gab es nicht.
Das neue Format enthält zu jedem einzelnen Tick, eine Klassifizierung. Somit ist es einfacher, bestimmte Trades zu filtern. Blocktrades zum Beispiel können getrost gefiltert werden, da diese im normalen Datenstrom nichts zu suchen haben. Letztendlich bleibt eine Kategorie von Trades übrig, die man als reale Marktereignisse bezeichnen kann.
Aber auch in diesen finden sich teilweise recht große Ausreißer, bei den einzelnen Ticks. Zum Beispiel im FESX ist dies oft zu beobachten, dort tauchen Tickabweichungen von mehr als 0.25 Prozent auf.
Die Daten, die von Online Datenprovidern zu beziehen sind, können nur begrenzt mit den Originaldaten der Eurex verglichen werden. Aus zwei Gründen, tauchen hier Abweichungen auf, die dem User schöne saubere Daten vorgaukeln.
a) Die Menge an Tickdaten, die letztendlich übertragen wird und beim User ankommt ist geringer, als die eigentliche Handelstätigkeit. das heißt, ein gewisser Teil der Daten, geht einfach verloren. Wenn in 500000 Ticks etwa 100 solche Spikes enthalten sind, so ist es nur nachvollziehbar, das viele davon einfach verschwinden. Der Grund liegt einfach in den technischen Kapazitäten
b) Es wird Seitens der Online Provider eine Filterung vorgenommen.
Man kann also sagen, dass die Daten der Online Anbieter NICHT mehr im vollem Umfang dem realen Marktgeschehen entsprechen. Sicher ist, die Wahrscheinlichkeit, einem solchen Spike in der Realität mit einer eigenen Order aufzusitzen sehr gering, aber sie besteht.
Was also, sollte der Verkäufer von Tickdaten unternehmen? Filtert er auf eigene Faust, unliebsame Spikes, wäre ihm auch der Vorwurf zu machen, das Marktgeschehen zu verzerren, filtert er sie nicht, werden ihm diese vermeindlichen Datenfehler als Betrug vorgeworfen.
Abschließend, für diejenigen, die sich schwer tun, die Wahrheit zu erkennen:
Die Spikes in den Tickdaten sind zum Teil echte Geschäfte!!