Worte zählen

Um meine Texte einmal aus technischer Sicht zu analysieren, wollte ich gerne wissen, welche Worte ich wie oft verwende. Leider habe ich in meiner Textverarbeitung keine Funktion gefunden, die alle Worte im Text nach Häufigkeit sortiert in einer Tabelle darstellt. Darum habe ich mir selber kurzerhand ein kleines PHP-Programm geschrieben, dass einen Text zerlegt und die Worte dann nach Anzahl des Vorkommens auflistet und außerdem noch die prozentuale Häufigkeit angibt.

Erstaunlicherweise musste ich feststellen, dass das mit Abstand häufigste Wort, das ich im getesteten Text verwendet habe, das Wort “und” war. Dabei kam “und” mit einer Häufigkeit von 3% vor. Darum habe ich mir im Internet ein paar Leseproben anderer Texte genommen und getestet und auch die hatten in etwas das gleiche Ergebnis. Zumindest, was die Romantexte anging,  Nachrichtentexte hatten eine leicht geringe “und”-Quote von etwa 2%. Nach “und” kamen dann üblicher die Artikel “der”, “die” und “das” und das in der Geschichte passende Personalpronomen, also “Ich”, bei Erzählungen aus der Selbstperspektive ansonsten entsprechend  “Er” oder “Sie”.

Falls jemand gerne selber die Häufigkeit von Worten in seinen eigenen Texten zählen will, habe ich das Tool online gestellt. Ich habe es erstmal auf Texte von 50000 Zeichen (das sind etwa 10-15 DIN A4 Seiten) beschränkt, weil ich nicht weiß, wie das Programm auf die Eingabe der kompletten Harry-Potter-Reihe oder ähnlich umfangreiche Texte reagiert:

Online Wörter in Texten zählen

You may also like...