Ermitteln der Anzahl und Häufigkeit von Worten in Texten
Grundgedanke:
Bei der Bewertung des Schreibstils eines Textes stellt sich mitunter die Frage, welche Worte der Autor besonders häufig verwendet. Worte, die zu bestimmten Wortarten gehören, wie Artikel, Personalpronomen und Präpositionen werden sicherlich in den meisten Texten am häufigsten vorkommen. Doch bereits hier unterscheiden sich verschiedene Texte in der Häufigkeit der Verwendung dieser Wörter. Noch größer wird dieser Unterschied, wenn man die Häufigkeit der anderen Worte vergleicht. Insbesondere für einen Autoren selbst kann dies eine wertvolle Hilfe sein, um seinen Schreibstil statistisch zu analysieren und bestimmte Wortvorlieben festzustellen. Gegebenenfalls bietet sich dadurch die Möglichkeit, über die Verwendung von Alternativformulierungen nachzudenken, wenn einzelne Wörter zu häufig in einem Text auftauchen.
Verfahren:
Im ersten Schritt entfernt das Programm die Satzzeichen und überzählige Leerzeichen aus dem Text und zerlegt ihn anschließend in die einzelnen Worte. Alle Worte werden komplett in Kleinbuchstaben verwandelt, so dass verschiedene Schreibungen des Wortes (etwa an Satzanfängen) zusammengeführt werden. Als "Wort" wird danach alles betrachtet, was durch Leerzeichen von den restlichen Textfragmenten getrennt ist.
Das Programm zählt die Häufigkeit des Vorkommens jedes Wortes innerhalb des gegebenen Textes und gibt die unterschiedlichen Worte sortiert nach der Anzahl der Fundstellen in einer Tabelle aus. Worte, die genau gleich häufig vorkommen, werden zudem alphabetisch sortiert. Für jedes Wort wird eine Tabellenzeile generiert, bestehend aus den Informationen Anzahl im Text ("#"), Bezeichnung des Worts ("Wort") und statisches Auftreten des Wortes pro 1000 Worten ("‰"). Um die Ausgabetabelle nicht übermäßig lang zu machen, wurden in einer früheren Version Worte, die nur eine sehr geringe Häufigkeit innerhalb des Texts aufweisen, nicht mehr aufgelistet. Die aktuelle Version zeigt nun jedoch alle im Text gefundenen Worte an. Die Nutzer können damit selbst entscheiden, welche Worthäufigkeiten sie als relevant betrachten und in Ihre Textanalyse einbeziehen möchten.
Durchführung:
Der zu prüfende Text wird in das Textfeld eingegeben oder dort hineinkopiert. Dabei gibt es eine Wortbegrenzung, um die Rechenzeit und den Umfang der Ausgabe des Ergebnisses überschaubar zu halten. Längere Texte werden automatisch auf die Maximallänge gekürzt. Unter der Texteingabe besteht die Möglichkeit, bestimmte Worte aufzulisten, die nicht in der Ergebnisliste auftauchen sollen. Diese Worte werden dann nicht als Ergebnis ausgegeben - die relative Häufigkeit ("‰"-Wert) der verbleibenden Wörter wird davon jedoch nicht beeinträchtigt, da sich diese weiterhin an der gesamten Wortzahl misst.
Text eingeben:
Analysiere den folgenden Text (max. 300000 Zeichen):