Cyril Belica: Kookkurrenzdatenbank CCDB - V3.3
Eine korpuslinguistische Denk- und Experimentierplattform
© 2001
Institut für Deutsche Sprache, Mannheim.
Informieren Sie sich bitte vor der Nutzung über die damit
verbundenen Urheberrechte.
Vor dem Hintergrund eines korpusgeleiteten empirisch-linguistischen Ansatzes
ist es von grundlegender Bedeutung, eine wissenschaftsmethodisch kohärente
Methodik zu konzipieren, die es ermöglicht, die im Sprachgebrauch manifesten
emergenten Strukturen systematisch aufzudecken, zu inventarisieren, zu
interpretieren und theoretisch zu begründen.
Als empirische Basis für dieses Forschungsvorhaben wurde im
Programmbereich Korpuslinguistik des
Instituts für Deutsche Sprache
auf der Grundlage eines Korpus geschriebener Gegenwartssprache von ca.
2,2 Milliarden laufenden Textwörtern eine große Sammlung von Kookkurrenzprofilen
zu ca. 220.000 verschiedenen Lemmata aufgebaut.
Die Sammlung enthält zu jedem Lemma die Ergebnisse von bis zu fünf verschiedenen
Kookkurrenzanalysen in Form von Hierarchien von ähnlichen Verwendungen, mit
bis zu 100.000 Verwendungsbeispielen pro Lemma und Analyse.
Durch die explorative Analyse dieses Sprachmaterials geleitet bemühen wir uns, neue Einsichten in die Strukturen, Gesetzmäßigkeiten, Eigenschaften und Funktionen von Sprache zu erlangen. Derzeit konzentrieren wir uns dabei auf Themenbereiche wie Ähnlichkeit von Kookkurrenzprofilen und semantische Nähe, auf die Wechselbeziehungen zwischen lokalen, lexikalischen und globalen, situativen Kontexten und auf diverse Untersuchungen zur Quasisynonymie.
Über diese Webseite möchten wir Teile unserer Denk- und Experimentierplattform im Sinne eines "gläsernen Labors" auch allen interessierten Fachkollegen zugänglich machen.
Auf der Suche nach einer aktuelleren Datengrundlage?
In unserem neuen Angebot DeReKoVecs finden Sie ähnliche Analysen wie in der CCDB, die aber auf DeReKo-Worteinbettungen und einer aktuelleren Datengrundlage (z. Zt. DeReKo-2017-II) beruhen.
Nutzungshinweise
Alle Zugriffe auf diesen Server werden registriert. Es werden Datum, Rechneradresse und gelesenes Dokument gespeichert. Diese Daten werden für statistische Zwecke ausgewertet. Darüber hinaus werden keine pesonenbezogenen Daten gespeichert. Eine Weitergabe an Dritte findet nicht statt. Weitere Hinweise finden Sie hier.
Die Kookkurrenzdatenbank CCDB, die zugrundeliegenden
korpuslinguistischen Analysemethoden
und die mit deren Hilfe erstellten Internetseiten sind Werke im Sinne des
§ 2 UrhG,
da sie wesentliche individuelle Züge eigener geistiger
Schöpfung tragen und in ihrer Gesamtheit einzigartig sind.
Das zulässige Zitieren kleiner Teile in einem eigenen selbständigen Werk
(§ 51 UrhG)
erfordert stets die Angabe der Quelle
(§ 63 UrhG)
in einer geeigneten Form
(§ 13 UrhG).
Wir erwarten in diesem Zusammenhang folgende Quellenangabe:
Belica, Cyril: Kookkurrenzdatenbank CCDB.
Eine korpuslinguistische Denk- und Experimentierplattform
für die Erforschung und theoretische
Begründung von systemisch-strukturellen Eigenschaften
von Kohäsionsrelationen zwischen
den Konstituenten des Sprachgebrauchs.
© 2001
Institut für Deutsche Sprache, Mannheim.
Belica, Cyril: Statistische Kollokationsanalyse und -clustering.
Korpuslinguistische Analysemethode.
© 1995
Institut für Deutsche Sprache, Mannheim.
Eine Verletzung des Urheberrechts kann Rechtsfolgen nach sich ziehen
(§ 97 UrhG).
Bei der Veröffentlichung hierauf aufbauender Forschungsergebnisse
bittet der Autor um eine entsprechende kollegiale Information an
belica@ids-mannheim.de.
Keywords:
Institut für Deutsche Sprache Mannheim Germany
collocation analysis computational lexicography corpus
IDS Deutsch Text Texte Korpus Korpora Linguistik Sprache
Kollokationsanalyse Kookkurrenzanalyse Konkordanz
Korpuslinguistik Lexikografie Lexikographie Gebrauchsmuster
German texts text corpus corpora linguistics language resources
linguistics corpus pattern analysis concordance COSMAS
semantic relatedness word sense disambiguation
semantic proximity model
clustering related contexts
contrasting synonyms antonyms
identifying similar words and contexts