Cyril Belica: Kookkurrenzdatenbank CCDB - V3.2
Eine korpuslinguistische Denk- und Experimentierplattform
© 2001 ff.,
Institut für Deutsche Sprache, Mannheim.
Informieren Sie sich bitte vor der Nutzung über die damit
verbundenen Urheberrechte.
Vor dem Hintergrund eines korpusgeleiteten empirisch-linguistischen Ansatzes ist es von grundlegender Bedeutung, eine wissenschaftsmethodisch kohärente Methodik zu konzipieren, die es ermöglicht, die im Sprachgebrauch manifesten emergenten Strukturen systematisch aufzudecken, zu inventarisieren, zu interpretieren und theoretisch zu begründen. Als empirische Basis für dieses Forschungsvorhaben wurde im Programmbereich Korpuslinguistik des Instituts für Deutsche Sprache auf der Grundlage eines Korpus geschriebener Gegenwartssprache von ca. 2,2 Milliarden laufenden Textwörtern eine große Sammlung von Kookkurrenzprofilen zu ca. 220.000 verschiedenen Lemmata aufgebaut. Die Sammlung enthält zu jedem Lemma die Ergebnisse von bis zu fünf verschiedenen Kookkurrenzanalysen in Form von Hierarchien von ähnlichen Verwendungen, mit bis zu 100.000 Verwendungsbeispielen pro Lemma und Analyse.
Durch die explorative Analyse dieses Sprachmaterials geleitet bemühen wir uns, neue Einsichten in die Strukturen, Gesetzmäßigkeiten, Eigenschaften und Funktionen von Sprache zu erlangen. Derzeit konzentrieren wir uns dabei auf Themenbereiche wie Ähnlichkeit von Kookkurrenzprofilen und semantische Nähe, auf die Wechselbeziehungen zwischen lokalen, lexikalischen und globalen, situativen Kontexten und auf diverse Untersuchungen zur Quasisynonymie.
Über diese Webseite möchten wir Teile unserer Denk- und Experimentierplattform im Sinne eines "gläsernen Labors" auch allen interessierten Fachkollegen zugänglich machen.
Wichtige Hinweise
Die Kookkurrenzdatenbank CCDB, die zugrundeliegenden
korpuslinguistischen Analysemethoden
und die mit deren Hilfe erstellten Internetseiten sind Werke im Sinne des
§ 2 UrhG,
da sie wesentliche individuelle Züge eigener geistiger
Schöpfung tragen und in ihrer Gesamtheit einzigartig sind.
Das zulässige Zitieren kleiner Teile in einem eigenen selbständigen Werk
(§ 51 UrhG)
erfordert stets die Angabe der Quelle
(§ 63 UrhG)
in einer geeigneten Form
(§ 13 UrhG).
Wir erwarten in diesem Zusammenhang folgende Quellenangabe:
Belica, Cyril: Kookkurrenzdatenbank CCDB.
Eine korpuslinguistische Denk- und Experimentierplattform
für die Erforschung und theoretische
Begründung von systemisch-strukturellen Eigenschaften
von Kohäsionsrelationen zwischen
den Konstituenten des Sprachgebrauchs.
© 2001 ff.,
Institut für Deutsche Sprache, Mannheim.
Belica, Cyril: Statistische Kollokationsanalyse und -clustering.
Korpuslinguistische Analysemethode.
© 1995
Institut für Deutsche Sprache, Mannheim.
Eine Verletzung des Urheberrechts kann Rechtsfolgen nach sich ziehen
(§ 97 UrhG).
Bei der Veröffentlichung hierauf aufbauender Forschungsergebnisse
bittet der Autor um eine entsprechende kollegiale Information an
belica@ids-mannheim.de.
Keywords:
Institut für Deutsche Sprache Mannheim Germany
collocation analysis computational lexicography corpus
IDS Deutsch Text Texte Korpus Korpora Linguistik Sprache
Kollokationsanalyse Kookkurrenzanalyse Konkordanz
Korpuslinguistik Lexikografie Lexikographie Gebrauchsmuster
German texts text corpus corpora linguistics language resources
linguistics corpus pattern analysis concordance COSMAS
semantic relatedness word sense disambiguation
semantic proximity model
clustering related contexts
contrasting synonyms antonyms
identifying similar words and contexts