Statistische Linguistik

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Die Statistische Linguistik (andere Bezeichnungen der Disziplin: Sprachstatistik, Linguostatistik) fasst die Bestrebungen der Linguistik zusammen, sprachliche Phänomene statistisch zu erheben. Die Bezeichnung Statistische Linguistik ist in der Linguistik etwas aus dem Sprachgebrauch geraten und wird auch nicht ganz einheitlich verstanden. So verweist Glück (2002) vom Stichwort Statistische Linguistik auf Sprachstatistik, während Bußmann (2005) auf Quantitative Linguistik weiterleitet. Die beiden Disziplinen sind aber nicht identisch: Die moderne Quantitative Linguistik versteht sich als eine theoriebildende Wissenschaft, ein Anspruch, der mit der Statistischen Linguistik nicht unbedingt verfolgt wird.

Anwendungen[Bearbeiten | Quelltext bearbeiten]

Vorkommenshäufigkeit von Zeigewörtern in einem Korpus des Serbokroatischen

Zu den Aufgaben der Statistischen Linguistik gehört die Ermittlung der Häufigkeiten sprachlicher Elemente, zum Beispiel mit dem Ziel zu entscheiden, welche Wörter in Wörterbücher aufgenommen werden, da sie dem Sprachgebrauch entsprechen, und welche nicht. Die von der Dudenredaktion aufgebaute Volltextdatenbank beispielsweise enthält zu diesem Zweck als Grundlage 1,4 Milliarden Wortformen (Stand Frühjahr 2009).[1] Aufgrund dieser Basis werden auch einige statistische Angaben zu Sprachphänomenen des Deutschen vorgestellt: Buchstabenhäufigkeit, Häufigkeitsverteilung der Wortlängen und der Wortarten, die Häufigkeit der grammatischen Geschlechter am Beispiel der Artikel.

Etliche weitere praktische Anwendungen sprachstatistischer Befunde können genannt werden: so das Morsealphabet, bei dem die häufigsten Buchstaben die kürzesten Kodierungen erhielten[2], die Entwicklung der Stenographie und die Organisation der Schreibmaschinentastatur[3] sowie die Kryptologie, bei der Entschlüsselungstechniken auch auf statistische Erhebungen zurückgreifen.[4]

Literatur[Bearbeiten | Quelltext bearbeiten]

  • Hadumod Bußmann (Hrsg.) unter Mitarbeit von Hartmut Lauffer: Lexikon der Sprachwissenschaft. 4., durchgesehene und bibliographisch ergänzte Auflage. Kröner, Stuttgart 2008, ISBN 978-3-520-45204-7.
  • Duden: Die deutsche Rechtschreibung (Kapitel: Sprache in Zahlen, Seite 155–165). 25., völlig neu bearbeitete und erweiterte Auflage. Dudenverlag, Mannheim/Wien/Zürich 2009. ISBN 978-3-411-04015-5.
  • Duden: Deutsches Universalwörterbuch (Kapitel: Sprache in Zahlen, Seite 2106–2112). 7., überarbeitete und erweiterte Auflage. Dudenverlag, Mannheim/Zürich 2011. ISBN 978-3-411-05507-4.
  • Helmut Glück (Hrsg.): Metzler-Lexikon Sprache. 4. Auflage; Verlag J.B. Metzler, Stuttgart und Weimar, 2010, ISBN 3-476-02335-4.
  • Werner König: dtv-Atlas Deutsche Sprache. 15., durchgesehene und aktualisierte Auflage. Deutscher Taschenbuch Verlag, München 2005, ISBN 3-423-03025-9, Kapitel Deutsche Sprachstatistik, Seite 114–119.
  • Helmut Meier: Deutsche Sprachstatistik. 2., erweiterte und verbesserte Auflage. Olms, Hildesheim 1967, 1978, ISBN 3-487-00735-5. (1. Aufl. 1964)

Weblinks[Bearbeiten | Quelltext bearbeiten]

Wiktionary: Statistische Linguistik – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Duden: Die deutsche Rechtschreibung, 25., völlig neu bearbeitete und erweiterte Auflage. Dudenverlag, Mannheim/Wien/Zürich 2009, ISBN 978-3-411-04015-5, Seite 155–165.
  2. Wolfgang Boettcher, Wolfgang Herrlitz, Ernst Nündel, Bernd Switalla: sprache. Das Buch, das alles über Sprache sagt. Westermann, Braunschweig 1983, ISBN 3-14-508881-5, Seite 337.
  3. Helmut Meier: Deutsche Sprachstatistik. Zweite erweiterte und verbesserte Auflage. Olms, Hildesheim 1967, Seite 329ff.
  4. Friedrich L. Bauer: Entzifferte Geheimnisse. Codes und Chiffren und wie sie gebrochen werden. Springer, Berlin/Heidelberg 1995, Seite 213ff.