Cyril Belica: Kookkurrenzdatenbank CCDB - V3.3
Eine korpuslinguistische Denk- und Experimentierplattform
© 2001 ff., Institut für Deutsche Sprache, Mannheim.
Informieren Sie sich bitte vor der Nutzung über die damit verbundenen Urheberrechte.


Vor dem Hintergrund eines korpusgeleiteten empirisch-linguistischen Ansatzes ist es von grundlegender Bedeutung, eine wissenschaftsmethodisch kohärente Methodik zu konzipieren, die es ermöglicht, die im Sprachgebrauch manifesten emergenten Strukturen systematisch aufzudecken, zu inventarisieren, zu interpretieren und theoretisch zu begründen. Als empirische Basis für dieses Forschungsvorhaben wurde im Programmbereich Korpuslinguistik des Instituts für Deutsche Sprache auf der Grundlage eines Korpus geschriebener Gegenwartssprache von ca. 2,2 Milliarden laufenden Textwörtern eine große Sammlung von Kookkurrenzprofilen zu ca. 220.000 verschiedenen Lemmata aufgebaut. Die Sammlung enthält zu jedem Lemma die Ergebnisse von bis zu fünf verschiedenen Kookkurrenzanalysen in Form von Hierarchien von ähnlichen Verwendungen, mit bis zu 100.000 Verwendungsbeispielen pro Lemma und Analyse.

Durch die explorative Analyse dieses Sprachmaterials geleitet bemühen wir uns, neue Einsichten in die Strukturen, Gesetzmäßigkeiten, Eigenschaften und Funktionen von Sprache zu erlangen. Derzeit konzentrieren wir uns dabei auf Themenbereiche wie Ähnlichkeit von Kookkurrenzprofilen und semantische Nähe, auf die Wechselbeziehungen zwischen lokalen, lexikalischen und globalen, situativen Kontexten und auf diverse Untersuchungen zur Quasisynonymie.

Über diese Webseite möchten wir Teile unserer Denk- und Experimentierplattform im Sinne eines "gläsernen Labors" auch allen interessierten Fachkollegen zugänglich machen.


Wichtige Hinweise



Datenschutzerklärung

Alle Zugriffe auf diesen Server werden registriert. Es werden Datum, Rechneradresse und gelesenes Dokument gespeichert. Diese Daten werden für statistische Zwecke ausgewertet. Darüber hinaus werden keine pesonenbezogenen Daten gespeichert. Eine Weitergabe an Dritte findet nicht statt. Weitere Hinweise finden Sie hier.


Urheberrechte

Die Kookkurrenzdatenbank CCDB, die zugrundeliegenden korpuslinguistischen Analysemethoden und die mit deren Hilfe erstellten Internetseiten sind Werke im Sinne des § 2 UrhG, da sie wesentliche individuelle Züge eigener geistiger Schöpfung tragen und in ihrer Gesamtheit einzigartig sind. Das zulässige Zitieren kleiner Teile in einem eigenen selbständigen Werk (§ 51 UrhG) erfordert stets die Angabe der Quelle (§ 63 UrhG) in einer geeigneten Form (§ 13 UrhG).

Wir erwarten in diesem Zusammenhang folgende Quellenangabe:

Belica, Cyril: Kookkurrenzdatenbank CCDB. Eine korpuslinguistische Denk- und Experimentierplattform für die Erforschung und theoretische Begründung von systemisch-strukturellen Eigenschaften von Kohäsionsrelationen zwischen den Konstituenten des Sprachgebrauchs. © 2001 ff., Institut für Deutsche Sprache, Mannheim.

Belica, Cyril: Statistische Kollokationsanalyse und -clustering. Korpuslinguistische Analysemethode. © 1995 Institut für Deutsche Sprache, Mannheim.


Eine Verletzung des Urheberrechts kann Rechtsfolgen nach sich ziehen (§ 97 UrhG). Bei der Veröffentlichung hierauf aufbauender Forschungsergebnisse bittet der Autor um eine entsprechende kollegiale Information an belica@ids-mannheim.de.

Dieser Hinweis wurde verfasst mit freundlicher Unterstützung von http://www.traumhaft-schoen.de

Keywords:
Institut für Deutsche Sprache Mannheim Germany collocation analysis computational lexicography corpus IDS Deutsch Text Texte Korpus Korpora Linguistik Sprache Kollokationsanalyse Kookkurrenzanalyse Konkordanz Korpuslinguistik Lexikografie Lexikographie Gebrauchsmuster German texts text corpus corpora linguistics language resources linguistics corpus pattern analysis concordance COSMAS semantic relatedness word sense disambiguation semantic proximity model clustering related contexts contrasting synonyms antonyms identifying similar words and contexts