5. Schlußfolgerungen

Der Aufbau des Karl-May-Korpus - in seiner momentanen Zusammensetzung - und die darauf fußenden, bisher durchgeführten Untersuchungen haben zu Ergebnissen geführt, die sowohl eine gewisse allgemeine sprachwissenschaftliche Bedeutung besitzen, als auch Erkenntnisse über die sprachliche Entwicklung des Autors Karl May mit sich bringen.

5.1. Übergangswahrscheinlichkeiten von Wortklassen

Da das Karl-May-Korpus aus Texten besteht, in denen jede Wortform mit einer Angabe über ihre Wortklasse versehen ist, lassen sich aus ihm sofort Daten über die Abhängigkeit des Auftretens einer Wortklasse vom Kontext, in dem sie steht, ableiten.

So kann man zum Beispiel aus einer Statistik der Wortklassen-Trigramme Aussagen über die Wahrscheinlichkeit für das Auftreten von Wortklassen als Vorgänger oder Nachfolger einer bestimmten Wortklasse ablesen.

5.2. Indikatoren für die Handlungsintensität

Die Untersuchungen der Abschnitte 4.2.1. und 4.2.2. haben aufgezeigt, daß - bei dem Autor Karl May - die Intensität der Handlung in einem Textabschnitt einigermaßen parallel läuft mit der durchschnittlichen Länge von Substantiven und mit dem Umfang des Substantiv- und Adjektiv-Wortschatzes in diesem Textabschnitt.

Dadurch wird ein Aspekt der Handlung - nämlich die "Intensität" - meßbar, zumindest so weit meßbar, daß man an den statistisch ermittelten Maßzahlen Abschnitte mit starker und weniger starker "ACTION" erkennen kann.

5.3. Vergleiche zwischen verschiedenen Schaffensperioden

Manche statistischen Erscheinungen zeigen eine charakteristische Veränderung von einer Schaffensperiode eines Autors zu einer anderen.

Obwohl das Karl-May-Korpus in seiner augenblicklichen Zusammensetzung keineswegs alle Schaffensperioden des Autors Karl May repräsentiert, kann man doch schon bemerken, daß das Werk "Am Jenseits", das der späten Schaffensperiode Karl May's zugerechnet wird, sich dadurch von den Werken aus früheren Perioden unterscheidet, daß sowohl die Wortlängen (siehe Abschnitt 4.1.1.4.) als auch die Satzlängen (siehe Abschnitt 4.1.2.2.) beträchtlich länger sind.

5.4. Erkenntnisse zum Wortschatz

Die Abhängigkeit des Wortschatzes von dem Umfang der betrachteten Textmenge ist im Laufe der Untersuchungen deutlich geworden. Die Untersuchung eines oder einiger weniger Werke eines Autors läßt keine Aussage über seinen Gesamtwortschatz zu.

Die prozentualen Anteile von Substantiven, Adjektiven, Verben und Partikeln am Gesamttext sind recht konstant, wobei sich die Streuung mit wachsender Textmenge verringert; die prozentualen Anteile am Wortschatz zeigen aber mit wachsender Textmenge:

5.5. Schlußwort

Nach den bisher vorgenommenen Untersuchungen, zu denen in Zukunft natürlich noch weitere hinzukommen sollen, ist bereits zu erkennen, daß statistische Analysen von Texten nicht nur äußerliche Kennzeichen - wie Wortlängen, Satzlängen, Worthäufigkeiten usw. - zahlenmäßig beschreiben können, sondern gegebenenfalls auch in der Lage sind, Hinweise auf die Handlung und Hinweise auf eine Entwicklung des Autors zu geben.