Der Friedman-Test
Der Friedman-Test geht von folgender Frage aus:
Wie groß ist die Wahrscheinlichkeit, dass zwei zufällig aus einem Text herausgegriffene Buchstaben übereinstimmen?
Es sei eine Buchstabenfolge von n Buchstaben gegeben. Weiter bezeichnet man mit n1 die Anzahl der a's, mit n2 die Anzahl der b's,... und mit n26 die Anzahl der z's.
Dann ist die Anzahl von Paaren mit zwei gleichen Buchstaben G gerade:
G = (n1/2)*(n1-1) + (n2/2)*(n2-1) + ... + (n26/2)*(n26-1).
Da es insgesamt genau (n/2)*(n-1) Buchstabenpaare gibt. Ist die gesuchte Wahrscheinlichkeit gleich:
Ic = 2G / n(n-1)
Die Zahl heißt der Friedmansche Koinzidenzindex.
Ist bekannt, daß die einzelnen Buchstaben in dem Text mit der Wahrscheinlichkeit pi (i=1...26) auftreten, so ergibt sich
Ic = p12+ p22 + p32 + ... + p262.
Handelt es sich um einen deutschen Text, so ist Ic=0,0762
während bei einem englischen Text Ic=0,066 gilt.
Besteht der Text aus zufällig gewählten Buchstaben, so ist pi=1/26 für i=1...26 und damit Ic=0,0385.
Bei einfacher Substitution ist der Koinzidenzindex des Geheimtextes Ic=0,0762. Bei der polyalphabetischen Chiffrierung mit dem Vigenère-Verfahren sind die Geheimtextbuchstaben annähernd gleichverteilt. Ist l die gesuchte Länge des Schlüsselwortes und besteht dieses aus lauter verschiedenen Buchstaben, so schreibt man den Geheimtext in l Spalten. Die Wahrscheinlichkeit dafür, daß zwei Buchstaben einer Spalte übereinstimmen ist etwa 0,0762. Die Wahrscheinlichkeit für das Übereinstimmen von zwei Buchstaben verschiedener Spalten ist etwa 0,0385.
Da jede Spalte n/l Buchstaben enthält, ist die Anzahl der Buchstabenpaare aus einer Spalte (n/2)*(n/l-1).
Die Anzahl gleicher Buchstabenpaare aus verschiedenen Spalten ist (n/2)*(n-n/l).
Die Anzahl A gleicher Buchstabenpaare ist dann A=(n/2l) * 0,0762(n-l) + (n/2l) * 0,0385(l-1)n2
Berücksichtigt man, daß Ic in etwa A / ( (n/2)*(n-1) ) ist, so erhält man eine Näherung für die Größenordnung von l:
l = 0,0377n / ( (n-1)*Ic - 0,0385n + 0,0762 ).
Ja nee, is klaaar.
Wie groß ist die Wahrscheinlichkeit, dass zwei zufällig aus einem Text herausgegriffene Buchstaben übereinstimmen?
Es sei eine Buchstabenfolge von n Buchstaben gegeben. Weiter bezeichnet man mit n1 die Anzahl der a's, mit n2 die Anzahl der b's,... und mit n26 die Anzahl der z's.
Dann ist die Anzahl von Paaren mit zwei gleichen Buchstaben G gerade:
G = (n1/2)*(n1-1) + (n2/2)*(n2-1) + ... + (n26/2)*(n26-1).
Da es insgesamt genau (n/2)*(n-1) Buchstabenpaare gibt. Ist die gesuchte Wahrscheinlichkeit gleich:
Ic = 2G / n(n-1)
Die Zahl heißt der Friedmansche Koinzidenzindex.
Ist bekannt, daß die einzelnen Buchstaben in dem Text mit der Wahrscheinlichkeit pi (i=1...26) auftreten, so ergibt sich
Ic = p12+ p22 + p32 + ... + p262.
Handelt es sich um einen deutschen Text, so ist Ic=0,0762
während bei einem englischen Text Ic=0,066 gilt.
Besteht der Text aus zufällig gewählten Buchstaben, so ist pi=1/26 für i=1...26 und damit Ic=0,0385.
Bei einfacher Substitution ist der Koinzidenzindex des Geheimtextes Ic=0,0762. Bei der polyalphabetischen Chiffrierung mit dem Vigenère-Verfahren sind die Geheimtextbuchstaben annähernd gleichverteilt. Ist l die gesuchte Länge des Schlüsselwortes und besteht dieses aus lauter verschiedenen Buchstaben, so schreibt man den Geheimtext in l Spalten. Die Wahrscheinlichkeit dafür, daß zwei Buchstaben einer Spalte übereinstimmen ist etwa 0,0762. Die Wahrscheinlichkeit für das Übereinstimmen von zwei Buchstaben verschiedener Spalten ist etwa 0,0385.
Da jede Spalte n/l Buchstaben enthält, ist die Anzahl der Buchstabenpaare aus einer Spalte (n/2)*(n/l-1).
Die Anzahl gleicher Buchstabenpaare aus verschiedenen Spalten ist (n/2)*(n-n/l).
Die Anzahl A gleicher Buchstabenpaare ist dann A=(n/2l) * 0,0762(n-l) + (n/2l) * 0,0385(l-1)n2
Berücksichtigt man, daß Ic in etwa A / ( (n/2)*(n-1) ) ist, so erhält man eine Näherung für die Größenordnung von l:
l = 0,0377n / ( (n-1)*Ic - 0,0385n + 0,0762 ).
Ja nee, is klaaar.
Tanzlehrer - 24. Jul, 13:16
684mal gelesen