Donnerstag, 18. April 2024, 15:47 UTC+2

Sie sind nicht angemeldet.

  • Anmelden
  • Registrieren

Lieber Besucher, herzlich willkommen bei: INVESTOX-Forum. Falls dies Ihr erster Besuch auf dieser Seite ist, lesen Sie sich bitte die Hilfe durch. Dort wird Ihnen die Bedienung dieser Seite näher erläutert. Darüber hinaus sollten Sie sich registrieren, um alle Funktionen dieser Seite nutzen zu können. Benutzen Sie das Registrierungsformular, um sich zu registrieren oder informieren Sie sich ausführlich über den Registrierungsvorgang. Falls Sie sich bereits zu einem früheren Zeitpunkt registriert haben, können Sie sich hier anmelden.

Reiner

unregistriert

1

Samstag, 30. Januar 2010, 12:25

"Benford´s Gesetz“ oder „Das Gesetz der ersten Ziffer"

Teil 1



Hallo!

Vergangene Woche habe ich mich erinnert, dass es eine Gesetzmäßigkeit gibt, welche die Verteilung der ersten Ziffern in (natürlichen / unmanipulierten) Datensätzen beschreibt. Das sogenannte Benford Gesetz. Mit seiner Hilfe können Unregelmäßigkeiten, wie zum Beispiel in Bilanzen entdeckt werden.

Mit einem Indikator, welcher auf Grundlage dieser Gesetzmäßigkeit, in Investox erstellt wird, ließen sich so auch „Unregelmäßigkeiten“ im Marktgeschehen eines bestimmten Titel diagnostizieren.

Doch zunächst einmal die Grundlagen:

Das Benfordsche Gesetz, auch Newcomb-Benford’s Law (NBL) beschreibt eine Gesetzmäßigkeit in der Verteilung der Ziffernstrukturen von Zahlen in empirischen Datensätzen, zum Beispiel ihrer ersten Ziffern. Es lässt sich etwa in Datensätzen über Einwohnerzahlen von Städten, Geldbeträge in der Buchhaltung, Naturkonstanten etc. beobachten. Kurz gefasst besagt es:

„Je niedriger der zahlenmäßige Wert einer Ziffernsequenz bestimmter Länge an einer bestimmten Stelle einer Zahl ist, umso wahrscheinlicher ist ihr Auftreten. Für die Anfangsziffern in Zahlen des Zehnersystems gilt zum Beispiel: Zahlen mit der Anfangsziffer ‚1‘ treten etwa 6,5-mal so häufig auf wie solche mit der Anfangsziffer ‚9‘.“

Das Benfords Gesetz besagt in seiner einfachsten Konsequenz, dass die führenden Ziffern n (n = 1…9) mit folgenden Wahrscheinlichkeiten erscheinen

Führende Ziffer Wahrscheinlichkeit

1 30,1 %
2 17,6 %
3 12,5 %
4 9,7 %
5 7,9 %
6 6,7 %
7 5,8 %
8 5,1 %
9 4,6 %

Quelle: Wikipedia, Benford Gesetz

Dass die ‚1’ immer „die Nase vorn“ hat, kann man sich schnell plausibel machen, wenn man z.B. Zahlen aus dem Wirtschaftsleben betrachtet: Wenn etwa der Deutsche Aktien-Index DAX von 1000 auf 2000 Punkte steigt, muss er um 100 Prozent zulegen.

Der gleiche 1000er-Sprung von 8000 auf 9000 Punkte hingegen ist schon mit einem Zuwachs von nur 12,5 Prozent geschafft. Die Werte verharren also im Bereich der führenden ‚1’ deutlich länger als in den anderen.

Aber auch für andere Zahlen, wie etwa die Größe der Dateien auf der Festplatte eines Computers, die Einwohnerzahlen deutscher Städte oder die Geldbeträge im Rahmen des Rechnungs- bzw. Steuerwesens folgen approximativ der Benford-Verteilung.

Noch skeptisch? Selber experimentieren:

Dann denken Sie sich irgendeine – etwa vierstellige – Zahl und schreiben eine ‚1’ davor. Nach dieser (dann fünfstelligen) Zahl lassen Sie bei Google suchen. Machen Sie das auch mit einer ‚2’ am Anfang usw. Sie werden Häufigkeiten erhalten, die in etwa denen des nachfolgend dargestellten Experiments ähneln.

Die praktische Bedeutung und Anwendung:

In der Wirtschaft

Zur Aufdeckung von Betrug bei der Bilanzerstellung, der Fälschung in Abrechnungen, generell zum raschen Auffinden eklatanter Unregelmäßigkeiten im Rechnungswesen. Mit Hilfe des Benfordschen Gesetzes wurde das bemerkenswert "kreative" Rechnungswesen bei Enron und Worldcom aufgedeckt, durch welches das Management die Anleger um ihre Einlagen betrogen hatte

Heute benutzen Wirtschaftsprüfer und Steuerfahnder Methoden, die auf dem Benfordschen Gesetz beruhen. Diese Methoden stellen einen wichtigen Teil der mathematisch-statistischen Methoden dar, die seit mehreren Jahren zur Aufdeckung von Bilanzfälschung, Steuer- und Investorenbetrug und allgemein Datenbetrug in Verwendung sind.

In der Forschung

Das benfordsche Gesetz ermöglicht die Aufdeckung konsequenter Datenfälschung auch in der Wissenschaft. Es waren schließlich Messwerte aus der Natur, die zum Wissen über die Existenz des benfordschen Gesetzes führten. Dessen ungeachtet ist das benfordsche Gesetz nicht allen Wissenschaftern bekannt, wie Wissenschaftsskandale mit gewisser Periodizität belegen.

Quelle: LB Dr. Stefan Hagl – WS 2005/2006 – FH Deggendorf

Auf Verbrecherjagd mit Benford

Es stellt sich die Frage, ob man mit bloßer Ziffern-Analyse Verbrechern auf die Spur kommt?

Axel Bach vom Magazin Quarks & Co wollte dies genauer erfahren und bat die Mitarbeiter der Revisionsabteilung des WDR um Hilfe. Rechnungen der letzten zwei Monate wurde nach Auffälligkeiten untersucht, aber man konnte keine feststellen. Nun wurden die Zahlen dreimal auf unterschiedliche Art und Weise manipuliert und von Wirtschaftsprüfern untersucht. Die folgenden drei Fälle zeigen die Chancen und Grenzen des Benford Gesetz auf:

· Die Unterschriftengrenze: Betrügerische Mitarbeiter können ein Unternehmen im Extremfall in den Ruin treiben.

· Die Bagatellegrenze: Verdächtig ist es, wenn oft Beträge knapp unterhalb der Bagatellegrenze gebucht werden.

· Erfundene Rechnungen: Am schwersten zu entdecken: Mitarbeiter steckt mit Lieferant unter einer Decke und zeichnet falsche Rechnungen ab.

Erster Fall: Die Unterschriftengrenze

Ein Mitarbeiter im Einkauf bevorzugt einen bestimmten Lieferanten, obwohl der nicht der günstigste ist. Solange die Bestellungen aber 5.000 Euro nicht überschreiten, merkt das niemand. Seinen Chef muss er nämlich erst bei größeren Anschaffungen informieren. Die Lieferfirma zeigt sich erkenntlich und spendiert hin und wieder einen Kurzurlaub.

Für diesen ersten Fall veränderten wir die ursprünglichen Rechnungsdaten: Bei 63 Rechnungen eines Lieferanten gingen wir auf Beträge knapp unter der gedachten Unterschriftengrenze von 5.000 Euro. Wir waren gespannt: Würden die 63 geänderten Rechnungen unter den 12.372 anderen auffallen?

Hier die Analyse der Experten von Ernst & Young:

"Bei der Untersuchung dieser Daten haben wir beim Erste-Ziffer-Test Auffälligkeiten bei der Vier gefunden. Daraufhin sind wir auf einen Lieferanten gekommen, der eine vermehrte Häufigkeit bei dieser Ziffer Vier aufweist. Bei genauerem Hinsehen erkannten wir, dass diese Beträge mit der Vier als 1. Ziffer alle knapp unter 5.000 Euro liegen. Dafür kann es mehrere Gründe geben: zum Beispiel eine Unterschriftenregelung oder Ähnliches im Unternehmen."

Zweiter Fall: Die Bagatellegrenze

Verdächtig ist es, wenn oft Beträge knapp unterhalb der Bagatellegrenze gebucht werden Ein schönes Ritual: Jeden Tag überweist ein Mitarbeiter Geld auf sein eigenes Konto. Das fällt nicht auf, weil es in der Firma eine Bagatellegrenze gibt: Kleinbeträge werden nicht überprüft. Aufs Jahr gerechnet kommt dabei aber einiges zusammen.

In unserer Datei mit den ungefälschten Daten erfanden wir einen neuen Lieferanten und fügten für jede Woche fünf Überweisungen ein. Alle Beträge lagen zwischen 70 und 80 Euro. Wieder waren die Wirtschaftsprüfer an der Reihe. Dieses Mal waren aber noch weniger Zahlen geändert. Aber trotzdem wurden sie fündig:

"Bei der Ziffer Sieben haben wir eine Auffälligkeit festgestellt. Wir haben uns diese Beträge näher angeschaut und sind auf einen Lieferanten aufmerksam geworden, der bestimmte Rechnungsbeträge zwischen 70 und knapp unter 80 Euro hatte. Es könnte sein, dass es in diesem Unternehmen eine Bagatellegrenze gibt, unter der diese Beträge liegen. Es könnte aber auch ein Systemfehler sein, weil die Beträge immer werktags gebucht wurden."

Dritter Fall: Erfundene Rechnungen

Am schwersten zu entdecken: Mitarbeiter steckt mit Lieferant unter einer Decke und zeichnet falsche Rechnungen ab. Ein Händler stellt neben den normalen Rechnungen noch weitere aus. In der belieferten Firma zeichnet sie ein Mitarbeiter ab, obwohl dafür gar keine Leistungen erbracht wurden. Am Monatsende machen die beiden halbe-halbe.
In unserer Originaldatei erfanden wir bei einem Lieferanten für jede echte Rechnung noch eine zusätzliche gefälschte. Dieser Test war besonders schwierig: Insgesamt fügten wir nämlich nur 20 Rechnungsposten ein. Und tatsächlich: In der großen Datenmenge waren diese 20 zufällig ausgedachten Rechnungssummen nicht mehr auffällig. Aber: Immerhin zwei der drei Betrüger wären schon mit der einfachen Benford-Analyse aufgeflogen.

Quelle: Sebastian Klink, Moritz Henke, Universität Kassel

Reiner

unregistriert

2

Samstag, 30. Januar 2010, 12:26

„Benford´s Gesetz“ oder „Das Gesetz der ersten Ziffer“

Teil 2



Vorstehendes sollte als Einleitung dienen.

Somit könnte also die Analyse der Verteilung von Ziffern bei Wertpapier – Titeln (z.B. das Volumen beim FDAX) unter Umständen, wenn diese nicht der erwarteten Verteilung nach dem Benford – Gesetz entsprechen, wertvolle Hinweise auf eventuelle „Unregelmäßigkeiten“ geben.

Wobei „Unregelmäßigkeiten“ dann verschiedene Ursachen haben können, wie zum Beispiel:

· (Massen)psychologische Phänomene

· Panik

· Wendepunkte

· Reaktionen auf Ereignisse

· beginnende Marktverschiebungen

· etc.

Salopp gesagt: Der normale Markt (mit seinen „Gesetzmäßigkeiten“) ist wahrscheinlich gestört, es ist „etwas im Busch“!

Natürlich muss man diesen Indikator zunächst „kalibrieren“. Durch Beobachtung seiner Ergebnisse bei Anwendung in vergangenen Zeiten, welche nach heutiger Erkenntnis als „Krise“, Unregelmäßigkeit“, etc., bekannt sind.

So lässt sich in Investox leicht ein Indikator programmieren, der für ein festes oder fließendes Zeitintervall einen bestimmten Wert (z.B. Volumen) eines Titel, bezüglich der Verteilung der ersten Ziffern, analysiert.

Grobes Schema:

1)

Zunächst ist eine Renommierung durchzuführen, um den zu untersuchenden Wert in den Bereich 1 – 9 zu transformieren.

Um bestehende Werte zwischen min und max in einen Bereich zwischen minnorm (z.B. 0) und maxnorm (z.B. 1) zu normalisieren, wird folgende Formel angewandt:

v´= (v - min) * (maxnorm - minnorm) / (max - min) + minnorm

wobei max - min der alten Wertespanne und maxnorm - minnorm der neuen, normalisierten Wertespanne entsprechen.

Wikipedia, Normierung

2)

Dann die jeweiligen Vorkommaanteile ermitteln. (1,567 --> 1, 7,432 --> 7, usw.)

3)

Die Anzahl der Ziffern 1 bis 9 in dem betreffenden Untersuchungszeitraum zählen und deren prozentualen Anteil ermitteln.

4)

Dann mit der zu erwartenden Häufigkeit nach dem Benford Gesetz vergleichen, eventuell mit einer wählbaren Toleranz (z.B. +/- 4 %).

-Ist die prozentuale Häufigkeit der Ziffer 1 größer / kleiner als 30,1 %, dann …

-(oder)

-Ist die prozentuale Häufigkeit der Ziffer 2 größer / kleiner als 17,6 %, dann …

-(oder)

.

.
.
-Ist die prozentuale Häufigkeit der Ziffer 9 größer / kleiner als 4,6 %, dann …

5)

Individuelle Gestaltung, Funktionen.

Beachtet werden muss natürlich eine hinlänglich große Menge der zu untersuchenden Ziffern.

Unter 100 Elemente ist wohl keine aussagekräftige Analyse möglich. (hier muss experimentiert werden)

Daher folgender Gedanke:

Handelt man einen Titel mit hohen Komprimierungen (EoD, Stunden, etc.), so wird es erforderlich sein sich mit RTT (auch wenn man EoD – Daten bezieht) von diesen Titel den gewünschten Wert (z.B. Volumen) in einer niedrigen Komprimierung (Beispiel: 2 Sekunden) aufzuzeichnen und diese Zeitreihe mit dem Indikator zu untersuchen, um die Aussagefähigkeit zu erhalten/erhöhen.

Denn wenn „Unregelmäßigkeiten“ in der niedrigen Komprimierung erkannt werden, so sind diese, wenn sie denn eine „Gefahr“ oder auch einen „Hinweis“ darstellen, auch in der höheren Komprimierung relevant.

Mit diesem Beitrag wollte ich nur die Idee eines möglichen Verfahrens beschreiben, eine Art Grobskizze, welche bei Interesse ausgearbeitet werden muss.

Sollte der Eine oder Andere dieses Verfahren umsetzen, verfeinern, die Gültigkeit oder aber auch Ungültigkeit feststellen, so wäre es schön dies hier kundzutun.



Anmerkung: Kursiver Text ist aus angegebenen Quellen kopiert, nicht kursiver ist mein Text!

Viele Grüße

Reiner

Tradeteufel1

unregistriert

3

Samstag, 30. Januar 2010, 15:16

Hochinteressant, vielen Dank, Reiner, für die fundierte kompakte Darstellung.

Lenzelott Männlich

Experte

Registrierungsdatum: 30. Dezember 2002

Beiträge: 3 051

Wohnort: Giessen

4

Sonntag, 31. Januar 2010, 13:18

Hallo Reiner,

schön mal wieder was von Dir zu hören.
Ich habe mich auch schon einmal einige Zeit mit dem Ansatz von Benford beschäftigt.

Als erstes muss man sich fragen, warum Benford überhaupt so funktioniert wie es funktioniert.
Das kann man mit einem einfachen Excelsheet ausprobieren. Dazu später mehr.

1)

Zunächst ist eine Renommierung durchzuführen, um den zu untersuchenden Wert in den Bereich 1 ? 9 zu transformieren.

Um bestehende Werte zwischen min und max in einen Bereich zwischen minnorm (z.B. 0) und maxnorm (z.B. 1) zu normalisieren, wird folgende Formel angewandt:

v´= (v - min) * (maxnorm - minnorm) / (max - min) + minnorm

wobei max - min der alten Wertespanne und maxnorm - minnorm der neuen, normalisierten Wertespanne entsprechen.

Wikipedia, Normierung

2) Dann die jeweiligen Vorkommaanteile ermitteln. (1,567 --> 1, 7,432 --> 7, usw.)


Imho wird genau das nicht zielführend sein!
Warum dazu auch im nächsten Post mehr.
If you think it´s expensive to hire a professional, wait until you hire an amateur.

Lenzelott Männlich

Experte

Registrierungsdatum: 30. Dezember 2002

Beiträge: 3 051

Wohnort: Giessen

5

Sonntag, 31. Januar 2010, 13:36

Hier mal bisschen graue Theorie zu Benford (von Wikipedia geklaut):

Zitat

Warum folgen so viele reale Datensätze dem NBL?
Das NBL besagt, dass die Auftretenswahrscheinlichkeiten der Ziffernsequenzen in den Zahlen von realen Datensätzen (damit sind hier solche gemeint, die keinen Manipulationen unterlagen) genügend umfangreich sind und Zahlen in der Größenordnung von x bis mindestens 10000 x aufweisen. Daten also, welche einigermaßen weit verteilt (dispergiert sind), nicht gleichverteilt sind, sondern logarithmischen Gesetzen folgen. Das bedeutet, dass die Auftretenswahrscheinlichkeit einer Ziffernsequenz umso höher ist, je kleiner sie wertmäßig ist und je weiter links sie in der Zahl beginnt. Am häufigsten ist die Anfangssequenz ‚1‘ mit theoretisch 30,103 %. Das NBL beruht auf der Gleichverteilung der Mantissen der Logarithmen der Zahlenwerte des Datensatzes. Der Grund für das erstaunlich häufige Gelten des NBL liegt an dem Umstand, dass viele reale Datensätze log-normalverteilt sind, nicht also die Häufigkeiten der Daten selbst, sondern die Häufigkeiten der Logarithmen dieser Daten einer Normalverteilung folgen. Bei genügend breiter Dispersion der normalverteilten Logarithmen (wenn die Standardabweichung größer/gleich etwa 0.74 ist) kommt es dazu, dass die Mantissen der Logarithmen stabil einer Gleichverteilung folgen. Ist die Standardabweichung allerdings kleiner, sind auch die Mantissen normalverteilt, und das NBL gilt nicht mehr, zumindest nicht mehr in der dargestellten einfachen Form. Ist die Standardabweichung kleiner als 0.74, kommt es zu dem in der Statistik nicht allzu häufigen Effekt, dass sogar der jeweilige Mittelwert der Normalverteilung der Logarithmen die Auftretenshäufigkeit der Ziffernsequenzen beeinflusst. Geht man einerseits vom NBL in der heutigen Form aus, so existieren zahlreiche Datensätze, die dem NBL nicht genügen. Andererseits gibt es bereits eine Formulierung des NBL in der Form, dass ihm sämtliche Datensätze genügen. Die Formulierung des „allgemeinen NBL“ ist wesentlich komplexer und enthält die bekannte Form des NBL als Grenzverteilung. Ihre Darstellung würde den Rahmen dieser Seite sprengen.
Das Benfordsche Gesetz gilt insbesondere für Zahlenmaterial, das natürlichen Wachstumsprozessen unterliegt. Dann nämlich verändern sich die Zahlen im Laufe der Zeit und verzehnfachen sich. Die erste Position der Mantisse verharrt für ca. 30% der Zeit auf der 1, 18% der Zeit auf der 2 usw: Das entspricht der logarithmischen Verteilung, die das benfordsche Gesetz vorhersagt und ist unabhängig von der Zeit in der eine Verzehnfachung erfolgt. Dann beginnt der Zyklus von Neuem bei der 1. Bei einer Momentaufnahme der Preise eines Supermarktes wird man genau diese Verteilung finden, egal wann die Erhebung durchgeführt wird.
Aufgrund dieses Sachverhaltes sind beispielsweise einmal Betrügereien bei Krankenkassen aufgedeckt worden, weil die Betrüger bei den Rechnungen zu viele Rechnungsbeträge mit der ersten Ziffer 6 erstellt hatten.


In dem Du also die Ausgangsmenge normalisierst auf die Zahlen 1 bis 9 sorgst Du imho dafür, dass Benford per se nicht gelten kann (siehe fettgedruckter Teil).
Zum letzten Teil mit dem natürlichen Wachstumsprozess gibt´s gleich eine Exceltabelle zum spielen.
If you think it´s expensive to hire a professional, wait until you hire an amateur.

Lenzelott Männlich

Experte

Registrierungsdatum: 30. Dezember 2002

Beiträge: 3 051

Wohnort: Giessen

6

Sonntag, 31. Januar 2010, 14:02

Wie versprochen eine kleine Exceltabelle mit der man bisschen "Benford" spielen kann.

Sie simuliert den "natürlichen" Wachstumsprozess eines verzinsten Kontos.
Keine Steuern, 100% Wiederanlage.

In den Feldern B2 & B3 kann man mit unterschiedlichen Werten experimentieren

Quellcode

1
2
Zinssatz	5,00%
Startkapital	 125,00 €

Es wird der Kontostand unter der Zinseszinsrechnung für 1000 Jahre simuliert und dabei ermittelt wie oft die Ziffern 1 bis 9 an führender Position stehen.

In Spalte G wird das ganze mit der normierten Version durchgeführt.
Hier kann man sehr deutlich erkennen, dass für diesen Anwendungsfall eine Normierung absolut nicht zielführend wäre.

EDIT:
Gerade beim Upload festgestellt, dass die Datei zu groß geworden ist.
Daher habe ich Sie im Downloadbereich zur Verfügung gestellt.

Viel Spass beim simulieren.
If you think it´s expensive to hire a professional, wait until you hire an amateur.

Registrierungsdatum: 30. August 2002

Beiträge: 8 155

Wohnort: Trade-Planet

7

Sonntag, 31. Januar 2010, 14:19

Hallo,

hierzu ein wenig Geschichte , weshalb ich mich hinsichtlich der Verteilung doch eher für MarktPlus als zielführendes Instrument der Verteilung entscheiden würde!

Lenzelott Männlich

Experte

Registrierungsdatum: 30. Dezember 2002

Beiträge: 3 051

Wohnort: Giessen

8

Sonntag, 31. Januar 2010, 14:43

Hallo Udo,

das sind aber jetzt schon Äpfel mit Birnen verglichen.
An Benford/Newcomb ist definitiv was dran, auch wenn´s auf den ersten Blick merkwürdig klingt.
Auch der von Dir verlinkte Bericht bestreitet dies nicht im Gegenteil.

Zitat

Letzte Zweifel konnte vor vier Jahren der Mathematiker Theodore Hill vom Georgia Institute of Technology ausräumen. Benfords Gesetz, fand er heraus, ist gewissermaßen die Mutter aller Verteilungshäufigkeiten.

Auch wenn das ganze skaleninvariant ist, führt die von Reiner vorgeschlagene Normierung zum versagen desselben.

Ob man es im Bereich der Börse dies gewinnbringend einsetzen kann?
ich weiß es nicht.
Aber was steht unter meinen Posts immer?
If you think it´s expensive to hire a professional, wait until you hire an amateur.

Bernd

Experte

Registrierungsdatum: 5. Juni 2005

Beiträge: 4 070

Wohnort: Iringsweg

9

Sonntag, 31. Januar 2010, 14:59

Hallo Lenzelott

Also, ich finde die Idee interessant! Nun nützt sie uns Investoxies ...
Wie versprochen eine kleine Exceltabelle mit der man bisschen "Benford" spielen kann.

... als Excel Sheet nicht so arg viel für diese Fragestellung:

Somit könnte also die Analyse der Verteilung von Ziffern bei Wertpapier ? Titeln

Aber wer sich schon so genau mit der Materie auseinandergesett hat wie Du um ein Excell Sheet "zum Spielen" zu erstellen, könnte vielleicht spielerisch einen Investox Indiaktor zusammenstellen? Dann könnte man das statt mit Exel gleich mit Invetox probieren!

------------------------------------------------------------

Hallo Udo

Wie kann ...
hinsichtlich der Verteilung doch eher für MarktPlus als zielführendes Instrument der Verteilung entscheiden würde!

... Markt Plus denn genau *diese* Fragen beantworten:
· (Massen)psychologische Phänomene

· Panik

· Wendepunkte

· Reaktionen auf Ereignisse

· beginnende Marktverschiebungen


@Udo, ohne Prosa in 1000 Worten, mit welchen Investox Formeln genau bekommst Du die einzelnen Fragestellungen denn in den Griff? Mach' doch mal bitte Formelbeispiele für Panik, Wendepunkt, Reaktionen auf News und auch beginnende Marktverschiebungen! Konkret als Formel, nicht in Worten. Geht das?
Gruss
Bernd

Reiner

unregistriert

10

Sonntag, 31. Januar 2010, 15:53

Anderes Verfahren die Daten für die Untersuchung nach dem Benford Gesetz zu transformieren!

Hallo!

Wenn eine Normalisierung tatsächlich die ursprüngliche Verteilung beeinflusst (verändert), so ist nachstehendes Verfahren, laut den zitierten Autoren, für Untersuchungen nach dem Benford Gesetz uneingeschränkt geeignet.



-------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Natürlich können wir für jede (positive) Zahl die wissenschaftliche Schreibweise benutzen, also diejenige, die der Taschenrechner die der Taschenrechner für sehr große oder sehr kleine Zahlen automatisch wählt;

7 330 251 = 7,330251 * 10^6 oder 0,023 = 2,3 * 10^-2

Diese Notation ist so gestaltet, dass nur eine Zahl vor dem Komma steht.

Insbesondere lassen sich durch die wissenschaftliche Notation alle Zahlen auf 1 bis 9 abbilden, ohne dass eine Verzerrung der Verteilung (erste Ziffer) eintritt.

Diese Abbildung berücksichtigt nicht die Größenordnung einer Zahl, sondern nur ihre Ziffernfolge.

Selbstverständlich ist stets die erste Ziffer dieser Abbildung gleich der ersten von Null verschiedenen Ziffer der ursprünglichen Zahl.

Also ist die Umformung der Datensätze mit Hilfe der wissenschaftlichen Notation für die Untersuchung der Verteilung, gemäß Benfords Gesetz geeignet.

Quelle: Stochastik-Struktur im Zufall von Dr. Holger Knöpfel, Prof. Dr. Matthias Löwe, Kapitel 6.6, Benfords Gesetz



---------------------------------------------------------------------------------------------------------------------------------------------------------------------



Viele Grüße



Reiner

Lenzelott Männlich

Experte

Registrierungsdatum: 30. Dezember 2002

Beiträge: 3 051

Wohnort: Giessen

11

Sonntag, 31. Januar 2010, 21:02

Aber wer sich schon so genau mit der Materie auseinandergesett hat wie Du um ein Excell Sheet "zum Spielen" zu erstellen, könnte vielleicht spielerisch einen Investox Indiaktor zusammenstellen? Dann könnte man das statt mit Exel gleich mit Invetox probieren!


Hallo Bernd,

Prinzipiell kein Hexenwerk sowas.
Man muss nur die erste Stelle einer Zahl ermitteln.

Mathematisch korrekt in Excel wie folgt formulierbar:

Quellcode

1
=ABRUNDEN(+B19/10^ABRUNDEN(LOG10(B19);0);0)

EDIT: stimmt leider nicht ganz. Es gilt für Zahlen >1.

für meine Excelspieltabelle hab ich´s nicht ganz so mathematisch gemacht:

Quellcode

1
=LINKS(TEXT(B19;"0,00");1)


Blöd dabei ist, dass Investox leider nur den Logarithmus zur Basis e berechnen kann und nicht zur Basis10.
Und was soll ich Dir verraten, meines Wissens nach kann es VB Script auch nicht.
If you think it´s expensive to hire a professional, wait until you hire an amateur.

hajo

Meister

Registrierungsdatum: 20. Oktober 2002

Beiträge: 553

12

Sonntag, 31. Januar 2010, 21:20

Hallo Reiner ,

eine kleine "andere" Frage :

Hast Du denn "zufällig" zwischenzeitlich auch eine andere Idee für Dein "altes" EOD-NN entwickelt ?

Gruß,
hajo

Lenzelott Männlich

Experte

Registrierungsdatum: 30. Dezember 2002

Beiträge: 3 051

Wohnort: Giessen

13

Sonntag, 31. Januar 2010, 21:24

VB Indikator zu Ermittlung der 1. Ziffer

Das ist jetzt arg behindert für meine Begriffe, sollte aber eigentlich funktionieren:

Quellcode

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Dim i
Dim merker

Startindex = ErsteDatenPeriode(Daten)
Endindex = LetzteDatenPeriode(Daten)

for i=startindex  to endindex 
  if daten(i)>1 then
    merker=daten(i)
    while merker>1
	 merker=merker/10
	wend
	 merker=merker*10
  else
    merker=daten(i)
    while merker<1
	 merker=merker*10
	wend
  end if
  ergebnis(i)=INT(merker)
next


EDIT:

Wenn man jetzt obigen VBS Code als ErsteZiffer() Indikator anlegt
bekommt man mit

Quellcode

1
SUM(ErsteZiffer(daten)=ziffer,perioden)/perioden*100


den Prozentwert, wie oft eine Ziffer an erster Stelle im Zeitraum Perioden in den Daten auftaucht
If you think it´s expensive to hire a professional, wait until you hire an amateur.

Dieser Beitrag wurde bereits 3 mal editiert, zuletzt von »Lenzelott« (31. Januar 2010, 21:55)


Reiner

unregistriert

14

Sonntag, 31. Januar 2010, 21:31

Anbei eine Grafik, mit Maple 12 erstellt, Verteilung Umsatz XOM, Tagesdaten l. Zeitraum

Hallo!

Anbei die Verteilung des Umsatzes des angegebenen Titels (zufällig ausgewählt) XOM, als EoD - Daten.

Wobei die Balken die Umsatzverteilung zeigen und die rote Linie die Benford - Verteilung darstellt. Man erkennt, dass im "Groben" die Verteilungen korrelieren.

Der Autor des Worksheets Samir Khan schreibt im Maplesoft Blog:

From my brief investigation, trading volumes tend to follow Benford’s Law (at some level) better than any other quantities. Anything dramatically different may demand greater attention...

Der Ansatz lässt hoffen, dass eine Untersuchung nach dem Benford - Gesetz eventuell wirklich geeignet ist "Unregelmäßigkeiten" aufzuzeigen.

Viele Grüße

Reiner
»Reiner« hat folgende Datei angehängt:
  • Benford_01.zip (81,83 kB - 658 mal heruntergeladen - zuletzt: 9. April 2024, 02:55)

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »Reiner« (31. Januar 2010, 21:49)


hajo

Meister

Registrierungsdatum: 20. Oktober 2002

Beiträge: 553

15

Sonntag, 31. Januar 2010, 22:01

edit von hajo

. Anything dramatically different may demand greater attention...

Der Ansatz lässt hoffen, dass eine Untersuchung nach dem Benford - Gesetz eventuell wirklich geeignet ist "Unregelmäßigkeiten" aufzuzeigen.

Nun, z.B. jeweils der "große Verfallstag" sowie die anderen "kleinen Verfallstage" sind "Unregelmäßigkeiten". Auch wenn deren Datum bereits zuvor feststeht und man damit Rechnung halten würde, so treten auch in den Tagen zuvor oftmals erhebliche Verwerfungen auf. Habe diese bereits auch am Donnerstag in der Woche vor dem großen Verfall festgestellt.
Also müßte man eine "längere Periode" ausschließen.

So mal eine Überlegung aus der Praxis.

Gruß,
hajo

Reiner

unregistriert

16

Montag, 1. Februar 2010, 09:38

Logarithmus zur Basis 10

Hallo!


Blöd dabei ist, dass Investox leider nur den Logarithmus zur Basis e berechnen kann und nicht zur Basis10.
Und was soll ich Dir verraten, meines Wissens nach kann es VB Script auch nicht.


Der Logarithmus zur Basis 10 kann alleine mit der Funktion des natürlichen Logarithmus zur Basis e ermittelt werden. Es gilt:

log10(x) = ln(x)/ln(10)

Viele Grüße

Reiner

sten

Experte

Registrierungsdatum: 6. September 2002

Beiträge: 2 879

17

Montag, 1. Februar 2010, 14:32

Hallo,

kann man nicht vielleicht für die Zählung der ersten Ziffer das Markt+ Tool verwenden?

Über einen definierbaren Zeitraum, z.B. 60 Minuten, werden z.B. die Up- und Downticks gezählt und man kann noch eine frei definierbare Zusatzbedingungung angeben, z.B. das bestimmte Volumenlevel überschritten werden (siehe Tradersbeispiel vom Hr. Knöpfel zum Markt+ Tool). Nun müsste man über die Zusatzbedingungung die Ziffernauswertung irgendwie einbauen.

Am Ende könnte es dann so aussehen, das alle 60 Minuten ein POC berechnet wird, der über die Ziffernwertebereich 1, 2 bis 9 verteilt liegt und nach dem Benfords Gesetz bei 1 liegen muss. Der Value-bereich nach unten gibt es dann nicht, sondern nur nach oben und je nach Breite würde er dann bei den Ziffern 2, 3 oder 4 liegen.

Liegt dann mal der POC > 1, dann hat man eine Abnormalität im Marktverhalten gefunden...

Viele Grüße
Torsten

Registrierungsdatum: 30. August 2002

Beiträge: 8 155

Wohnort: Trade-Planet

18

Montag, 1. Februar 2010, 22:49

Hallo Bernd,

zu Deiner ersten Frage. Ich stelle mir die Frage, worin äußern sich die genannten Punkte am ehesten, und wie kann man sie transformieren? Für mich gibt es eine Antwort: Anhand des Volumens bzw. der Tickhäufigkeit!

Zitat

Udo, ohne Prosa in 1000 Worten, mit welchen Investox Formeln genau bekommst Du die einzelnen Fragestellungen denn in den Griff? Mach' doch mal bitte Formelbeispiele für Panik, Wendepunkt, Reaktionen auf News und auch beginnende Marktverschiebungen! Konkret als Formel, nicht in Worten. Geht das?
Das ganze geht nur zum Teil,da M+ leider noch nicht in die Tiefe des Ticks programmiert werden kann! Aber ich möchte die genannten Punkten (ohne Prosa) anhand der Messwerte wenngleich auch nicht alles mathematisch aufbereitbar) mit M+ beschreiben:


Panik:Hohes aufkommen auf BID-ASK bzw, des Differenzergebnisses am Anfang, dann hoher Zukauf auf der ein oder anderen Seite mit anschliessenden heftigen und kurzen Pullbacks!


Wendepunkt: Beim steigenden Trend werden innerhalb der Kerzen (Tickbetrachtung mit M+ in der Kerze) immer mehr Abverkäufe klar erkennbar.wogegen vermeintliche Zukäufe keine Kurssteigerungen mehr bringen! Beim fallenden Trend tritt die analoge Abfolge ein!


Reaktionen auf News: News sind im Vorfeld unberechenbar wenn nicht Insider vorher klare (Volumen)Tendenzen erkennen lassen. Aber diese sind auch mit M+ sehr schwer von Fakes abzugrenzen! Die besten Chancen hätte man mit Hilfe von Frontrunning oder Newstrader-Software wie im Forum schon mal beschrieben. Bei IB sollte man vorsichtig sein weil sie nicht zu den schnellsten Brokern gehören! Daher kann die Strategie hier nur heissen: Mit dem Trend wenn man einscalet oder den PullBack abwarten!


Marktverschiebungen: Die Zeitreihe läuft immer innerhalb bestimmter Grenzen. Bei Markt Plus kann man beispielsweise die ValueArea heranziehen. Diese ist programmierbar und kann mit Hilfe des Backtests ausgetestet werden! Die VA beschreibt die "faire Handelszone" innerhalb einer Range. Wenn der Kurs aus der VA nachhaltig ausbricht,kann man davon ausgehen, das der Markt ein neues Preisniveau sucht!Ohne Markt Plus verwendet man simple Support-Resistance Levels heran. Marktverschiebungen sind für Systeme deshalb problematisch, weil sich die komplette Ablaufstruktur ändern kann
Happy Trading

Registrierungsdatum: 30. August 2002

Beiträge: 8 155

Wohnort: Trade-Planet

19

Montag, 1. Februar 2010, 22:56

Hallo Kalli,

die in der Story angesprochenen Anwendungen des Gesetztes beinhalten keine Hinweise und Untersuchungen auf Börsenzeitreihen. Wenn ich beispielsweise den FDAX intraday betrachte, gelten dort zwar auch Gesetze der Regelmäßigkeit aber ebenso Anomalien und Ausreisser. Meine resultierende Meinung bezieht sich insbesondere auf diese Passage:

Zitat

Selbst für Statistiker ist Benfords Gesetz eine harte Nuss. So häufig es gilt, so häufig gilt es scheinbar auch wieder nicht. Der Preis aller Biermarken etwa, die im Supermarkt in der Dose angeboten werden, bewegt sich aus Konkurrenzgründen innerhalb einer bestimmten Spanne durchaus möglich, dass sie alle zwischen 90 und 99 Pfennige kosten. Die Temperaturschwankungen zwischen Tag und Nacht folgen einer Wellenlinie, keineswegs Benfords Gesetz. Andererseits gibt es Verteilungen, die vollständig dem Zufall unterworfen sind - Lotteriezahlen sind ein bekanntes Beispiel, ihre Ziehung lässt sich nicht vorhersagen.Zwischen schierem Zufall und strikter Notwendigkeit liegt ein dritter Bereich, der sich mit der Gaußschen Glockenkurve beschreiben lässt. Unter dieser so genannten Normalverteilung streuen die Werte um eine Mittelachse, Abweichungen nach oben oder unten sind entsprechend seltener, was ebenfalls nicht der Benfordschen Häufigkeit entspricht.
Es ist klar, das man MarktPlus nicht dem dem BF-Gesetzt direkt vergleichen kann aber das Ziel der Prognose zieht an der Oberfläche m.A. in die gleiche Richtung und entspringt der Häufigkeitsverteilung!Nur das man bei M+ die Volumenentwicklung im Anfangsstadium betrachtet und prüft, welche Levels am "beliebtesten" sind und nicht wie häufig eine erste Zahl auftritt!
Happy Trading

Bernd

Experte

Registrierungsdatum: 5. Juni 2005

Beiträge: 4 070

Wohnort: Iringsweg

20

Dienstag, 2. Februar 2010, 21:47

Hallo Udo

Bei uns Programmierern gibt es Prosa und Coding. Coding habe ich keines gesehen bei der so deklarierten Nicht-Prosa, aber hab' vielen Dank für Deine Ausführungen ;)

Ich habe bisher mit Markt Plus desswegen noch am wenigsten von allen Knöpfel'schen Moduln anfangen können, weil die Umsetzung schwammig bleibt. Ähnliche Rezepte wie Deine Zusammenstellung lassen sich ganz gut am Bildschirm darstellen und bei geübtem Blick kann das sicher auch jemand wie Du handeln. In der Systementwicklung ist mir bisher aber noch keine gute Umsetzung von HistoAnalyse und Co. geglückt; wie es nach der Lektüre aussieht, bleibt es für mich vorerst trotz "Nicht-Prosa" dabei. Schade, M+ sieht aber trotzdem weiterhin nett aus.
Gruss
Bernd