5.1. Übergangswahrscheinlichkeiten von Wortklassen
Da das Karl-May-Korpus aus Texten besteht, in denen jede Wortform mit einer Angabe über ihre Wortklasse versehen ist, lassen sich aus ihm sofort Daten über die Abhängigkeit des Auftretens einer Wortklasse vom Kontext, in dem sie steht, ableiten.
So kann man zum Beispiel aus einer Statistik der Wortklassen-Trigramme Aussagen über die Wahrscheinlichkeit für das Auftreten von Wortklassen als Vorgänger oder Nachfolger einer bestimmten Wortklasse ablesen.
5.2. Indikatoren für die Handlungsintensität
Die Untersuchungen der Abschnitte 4.2.1. und 4.2.2. haben aufgezeigt, daß - bei dem Autor Karl May - die Intensität der Handlung in einem Textabschnitt einigermaßen parallel läuft mit der durchschnittlichen Länge von Substantiven und mit dem Umfang des Substantiv- und Adjektiv-Wortschatzes in diesem Textabschnitt.
Dadurch wird ein Aspekt der Handlung - nämlich die "Intensität" - meßbar, zumindest so weit meßbar, daß man an den statistisch ermittelten Maßzahlen Abschnitte mit starker und weniger starker "ACTION" erkennen kann.
5.3. Vergleiche zwischen verschiedenen Schaffensperioden
Manche statistischen Erscheinungen zeigen eine charakteristische Veränderung von einer Schaffensperiode eines Autors zu einer anderen.
Obwohl das Karl-May-Korpus in seiner augenblicklichen Zusammensetzung keineswegs alle Schaffensperioden des Autors Karl May repräsentiert, kann man doch schon bemerken, daß das Werk "Am Jenseits", das der späten Schaffensperiode Karl May's zugerechnet wird, sich dadurch von den Werken aus früheren Perioden unterscheidet, daß sowohl die Wortlängen (siehe Abschnitt 4.1.1.4.) als auch die Satzlängen (siehe Abschnitt 4.1.2.2.) beträchtlich länger sind.
5.4. Erkenntnisse zum Wortschatz
Die Abhängigkeit des Wortschatzes von dem Umfang der betrachteten Textmenge ist im Laufe der Untersuchungen deutlich geworden. Die Untersuchung eines oder einiger weniger Werke eines Autors läßt keine Aussage über seinen Gesamtwortschatz zu.
Die prozentualen Anteile von Substantiven, Adjektiven, Verben und Partikeln am Gesamttext sind recht konstant, wobei sich die Streuung mit wachsender Textmenge verringert; die prozentualen Anteile am Wortschatz zeigen aber mit wachsender Textmenge:
5.5. Schlußwort
Nach den bisher vorgenommenen Untersuchungen, zu denen in Zukunft natürlich noch weitere hinzukommen sollen, ist bereits zu erkennen, daß statistische Analysen von Texten nicht nur äußerliche Kennzeichen - wie Wortlängen, Satzlängen, Worthäufigkeiten usw. - zahlenmäßig beschreiben können, sondern gegebenenfalls auch in der Lage sind, Hinweise auf die Handlung und Hinweise auf eine Entwicklung des Autors zu geben.