Statistiksoftware
Die beste Wahl für Korpuslinguisten und Computerlinguisten ist die kostenlose Statistiksoftware
R.
R eignet sich nicht nur für statistische Analysen und grafische Visualisierungen, sondern ist eine vollwertige Programmiersprache und Laufzeitumgebung.
Standardmäßig wird R kommandozeilenbasiert ausgeführt, es werden aber auch grafische Benutzeroberflächen angeboten.
Verschiedene Korpuslinguisten und Computerlinguisten haben Pakete mit R-Programmen zur statistischen Analyse speziell von Sprachdaten entwickelt und zur Verfügung gestellt.
Geeignete Einführungen hierzu:
Außerdem nützlich:
-
RSeek.org
– Suchmaschine für R-Ressourcen (Dokumentation, Mailinglisten, Programme, ...)
-
Evert, Stefan (2007): Corpora and collocations, Extended Manuscript, 13 October 2007 (für Berechnungen von Collocations/Kookkurrenzen)
-
Gries, Stefan Th. (2010): Useful statistics for corpus linguistics.
In: Sánchez, Aquilino & Almela, Moisés (eds.), A mosaic of corpus linguistics: Selected approaches.
Frankfurt/Main: Lang,
269-291.
(Vorab-Version)
-
Oakes, Michael P. (1998): Statistics for corpus linguistics.
Edinburgh: Edinburgh University Press.
– nützliches Nachschlagewerk für relevante statische Konzepte und Methoden (allerdings nicht in Bezug auf R)