🧑🎓 Deine perfekte Bachelorarbeit
Studenten-Rabatt sichernBachelorarbeit
Weitere Themen
- Anleitungen + Beispiele
- Bachelorarbeit
- Diplomarbeit
- Masterarbeit
- Plagiate, KI, Zitation
- Plagiate
- Richtig Zitieren
- Wissenschaftliche Arbeit schreiben
- Experten helfen dir 🎓
- Bücher + Kurse
- Thesis-Start-Coaching
Keyword-Kookkurrenz- und Clusteranalyse für die Literaturrecherche
Die Literaturrecherche bildet das Fundament jeder wissenschaftlichen Arbeit. Je umfangreicher das Forschungsfeld, desto wichtiger wird eine gezielte Literaturrecherche.
Hierfür kannst du die Methoden Keyword-Kookkurrenzanalyse und die Clusteranalyse nutzen. Beide Verfahren ermöglichen, große Mengen an Text- oder Literaturdaten methodisch auszuwerten, thematische Strukturen zu erkennen und Forschungsfelder visuell abzubilden.
Dadurch kannst du leichter Trends, Lücken und Verbindungen zwischen Studien sichtbar machen. Der Nutzen liegt insbesondere in der datenbasierten Orientierung: anstatt zufällig Literatur zu lesen, lassen sich gezielt Cluster bilden, Themen verdichten und Begriffe nach Relevanz gewichten.
In diesem 1a-Studi Artikel lernst du, wie du die Keyword-Kookkurrenz- und Clusteranalyse für die Literaturrecherche für deine Bachelorarbeit verwenden kannst.
Thesis-Sprint
Schreiben mit System, und fertig! Für Literaturarbeit und empirische Arbeit (Bachelor & Master).
- Anleitung & Beispiele
- Formulierungshilfen
- Zeit- & Aufgabenplanung
- Print & E-Book 🛡️
Inhaltsverzeichnis
Keyword-Kookkurrenzanalyse vs. Clusteranalyse
Die Kookkurrenzanalyse untersucht, welche Begriffe häufig gemeinsam in wissenschaftlichen Texten vorkommen. Dadurch wird sichtbar, welche Konzepte inhaltlich miteinander verknüpft sind.
Die Clusteranalyse hingegen gruppiert Datenpunkte (z. B. Publikationen oder Keywords) anhand von Ähnlichkeiten.
Beide Verfahren dienen also der Mustererkennung, unterscheiden sich aber in ihrem methodischen Fokus.
| Merkmal | Kookkurrenzanalyse | Clusteranalyse |
|---|---|---|
| Zielsetzung | Ermittlung semantischer Beziehungen zwischen Begriffen | Bildung thematischer Gruppen auf Basis von Ähnlichkeiten |
| Datenbasis | Sprachliche Einheiten (Wörter, Phrasen, Begriffe) | Numerische oder kategorische Datenpunkte (z. B. Keywords, Publikationen) |
| Verfahrenstyp | Linguistisch-semantisch | Statistisch-mathematisch |
| Analyseebene | Wort- und Bedeutungsebene | Objekt- und Merkmalsebene |
| Typische Verfahren | Frequenzanalyse, Assoziationsnetzwerke, Kontextanalyse | Hierarchische Clusteranalyse, k-Means Clusteranalyse, agglomeratives und divisives Verfahren |
| Ergebnisse | Netzwerke und thematische Knotenpunkte | Cluster mit ähnlichen Datenpunkten oder Forschungsobjekten |
| Interpretation | Semantische Nähe und Diskursstrukturen | Statistische Nähe und thematische Gruppenzugehörigkeit |
| Visualisierung | Wortnetzwerke, Co-Occurrence Maps | Dendrogramme, Elbow-Kurven, Wissenslandkarten |
Vorteile der Kookkurrenzanalyse liegen in der inhaltlichen Präzision und der Offenlegung semantischer Beziehungen.
Die Clusteranalyse punktet durch ihre objektive Datenstrukturierung und Visualisierung, etwa über Dendrogramme.
Ein Nachteil beider Verfahren liegt im hohen Datenaufwand, der ohne Software-Unterstützung kaum zu bewältigen ist.
KookkurrenzanalyseKookkurrenzanalyse in der Literaturrecherche
Die Kookkurrenzanalyse untersucht, wie oft und in welchem Kontext bestimmte Begriffe gemeinsam in einem Korpus auftreten.
Bei deiner Literaturrecherche kannst du dadurch:
- Themenfelder
- theoretische Konzepte
- methodische Verbindungen
leichter finden. Durch die Analyse der Häufigkeit von Wortpaaren entstehen Netzwerke, die semantische Beziehungen zwischen Forschungsschwerpunkten abbilden.
Strukturelle Bestandteile und linguistische Muster (Konstituenten)
Die Untersuchung der Konstituenten – also sprachlicher Bestandteile wie Substantive oder Verben – ermöglicht es dir, Schwerpunkte in der Forschungssprache zu erkennen. Diese Muster bilden den Ausgangspunkt, um Themen nicht zufällig, sondern systematisch zu identifizieren.
Schritt 1: Textkorpus festlegen
Wähle eine Sammlung wirtschaftswissenschaftlicher Texte zu einem abgegrenzten Thema, z. B. Digitalisierung im Mittelstand oder nachhaltige Unternehmensführung.
Grundlage sind wissenschaftliche Artikel, Reports oder Dissertationen aus Datenbanken wie EconBiz, ScienceDirect oder SpringerLink.
Schritt 2: Linguistische Einheiten bestimmen
Zerlege die Texte in sprachliche Bestandteile. Besonders relevant sind:
- Substantive: z. B. Innovation, Produktivität, Nachhaltigkeit
- Verben: z. B. investieren, optimieren, transformieren
- Adjektive: z. B. digital, effizient, resilient
Diese bilden die Basis, um inhaltliche Muster und Schwerpunkte zu erkennen.
Schritt 3: Häufigkeiten analysieren
Ermittle, welche Begriffe am häufigsten vorkommen.
Beispielhafte Häufigkeiten:
| Keyword | Häufigkeit |
|---|---|
| Digitalisierung | 68 |
| Unternehmen | 54 |
| Innovation | 47 |
| Prozessoptimierung | 29 |
Häufige Substantive sind Indikatoren für Kernthemen eines Forschungsfeldes.
Schritt 4: Kookkurrenzen identifizieren
Untersuche, welche Begriffe regelmäßig gemeinsam auftreten.
Beispiele wirtschaftlicher Kookkurrenzen:
- Digitalisierung – Effizienzsteigerung
- Nachhaltigkeit – Wettbewerbsvorteil
- Investition – Risikomanagement
Derartige Wortpaare zeigen, welche Konzepte in der wirtschaftswissenschaftlichen Diskussion zusammengehören.
Schritt 5: Muster linguistisch interpretieren
Analysiere, wie die Begriffe verwendet werden. Stehen z. B. Substantive häufig mit wertenden Adjektiven wie nachhaltig, strategisch oder profitabel, weist das auf normative Ausrichtungen der Forschung hin.
Dadurch wird deutlich, ob der Diskurs stärker innovations-, ressourcen- oder effizienzorientiert geprägt ist.
Schritt 6: Ergebnisse visualisieren
Erstelle ein semantisches Netzwerk oder eine Kookkurrenzkarte.
Schritt 7: Themen ableiten
Nutze die identifizierten Muster, um Forschungslücken und Schwerpunkte für deine geplante Abschlussarbeit in der wirtschaftswissenschaftlichen Literatur zu erkennen.
Wenn z. B. Digitalisierung häufig mit Kostenreduktion, aber selten mit Mitarbeiterzufriedenheit verknüpft ist, kann daraus ein neues Forschungsthema entstehen.
ClusteranalyseClusteranalyse in der Literaturrecherche
Die Clusteranalyse fasst ähnliche Objekte oder Begriffe zu Gruppen zusammen (Cluster). In der Literaturrecherche werden so einzelne Datenpunkte (z. B. Publikationen, Autoren, Keywords) anhand gemeinsamer Merkmale gruppiert.
Das Ziel ist, Strukturen in großen Datenmengen zu erkennen und die inhaltliche Nähe von Quellen messbar zu machen.
Methodische Grundlagen – Distanzmaße, Datenaufbereitung und Clusterbildung
Grundlage der Clusteranalyse sind Distanzmaße, die Ähnlichkeiten oder Unterschiede zwischen Datenpunkten berechnen. Besonders verbreitet ist die euklidische Distanz, die den geometrischen Abstand zwischen zwei Punkten im Merkmalsraum beschreibt. Je kleiner der Wert, desto ähnlicher sind sich die Objekte.
Zur Bildung von Clustern wird häufig ein hierarchisches Verfahren eingesetzt, das Daten Bottom up aggregiert. Dabei entstehen zunächst viele kleine Cluster, die schrittweise zu größeren Gruppen zusammengefasst werden. Dieser Prozess wird auch als Agglomeratives Verfahren bezeichnet.
Im Gegensatz dazu steht das Divisive Verfahren, das mit einem Gesamtcluster beginnt und diesen sukzessive in kleinere Gruppen unterteilt.
Umsetzung mit SPSS, R, Python und Excel für bibliometrische Datensätze
Programme wie SPSS, R oder Python ermöglichen eine automatisierte Clusteranalyse. Hierfür importierst du bibliometrische Datensätze, definierst Distanzmaße und wählst das geeignete Verfahren, z. B.:
- Single Linkage
- k-Means Clusteranalyse
Anschließend werden die Anzahl der Cluster und die Gruppenzugehörigkeiten der einzelnen Datenpunkte ermittelt.
Interpretation von Clustern
Die Interpretation von Clustern besteht darin, die inhaltliche Bedeutung der gebildeten Cluster zu deuten. Dabei wird analysiert, welche Publikationen oder Begriffe in einem Cluster gehören und wie sich die Cluster unterscheiden. Dadurch lassen sich Forschungsthemen voneinander abgrenzen und wissenschaftliche Schwerpunkte sichtbar machen.
Visualisierung: Dendrogramm, Elbow-Kriterium, Wissenslandkarten
Ein Dendrogramm zeigt, wie sich Cluster hierarchisch entwickeln.
Das Elbow-Kriterium hilft, die optimale Anzahl von Clustern zu bestimmen, indem der Punkt identifiziert wird, an dem zusätzliche Cluster kaum noch Erkenntnisgewinn bringen.
In der Literaturrecherche lassen sich die Ergebnisse als Wissenslandkarten darstellen, die Zusammenhänge zwischen Themenfeldern anschaulich visualisieren.
Anwendungsbeispiel: ClusteranalyseAnwendungsbeispiel: Clusteranalyse in der Bachelorarbeit
Die Clusteranalyse kann nicht nur für empirische Daten, sondern auch gezielt für die Literaturrecherche eingesetzt werden. Hierfür werden wissenschaftliche Publikationen, Autoren oder Keywords analysiert und in Gruppen mit ähnlichen thematischen Merkmalen zusammengefasst.
Ziel ist, Forschungsfelder systematisch zu strukturieren, Überschneidungen zu erkennen und neue Themencluster zu identifizieren.
Schritt 1: Ziel und Fragestellung definieren
Bestimme, was durch die Clusteranalyse erreicht werden soll. Soll die Analyse helfen, Forschungsschwerpunkte zu erkennen, Publikationen thematisch zu gruppieren oder untersuchte Variablen (z. B. Digitalisierung, Effizienz) zu ordnen?
Beispiel:
Ziel ist es, herauszufinden, welche Themenfelder die Forschung zu nachhaltigem Wirtschaften dominieren und wie diese sich voneinander abgrenzen lassen.
Schritt 2: Literaturdaten sammeln
Sammle relevante Quellen aus wissenschaftlichen Datenbanken (z. B. EconBiz, Scopus, Web of Science). Exportiere für jede Publikation grundlegende Daten:
- Titel
- Abstract
- Keywords
- Erscheinungsjahr
- Autoren
- ggf. Zitationszahlen
Hier erfährst du mehr über das Exzerpieren.
Schritt 3: Keywords und Variablen aufbereiten
Extrahiere die Schlüsselbegriffe (Keywords) aus allen Quellen. Entferne Füllwörter und vereinheitliche Synonyme (z. B. CSR = Corporate Social Responsibility).
Als Ergebnis entsteht eine standardisierte Liste, mit der sich Themen statistisch vergleichen lassen.
Beispielhafte Keywords:
Nachhaltigkeit, Green Economy, Kreislaufwirtschaft, Digitalisierung, Wettbewerbsfähigkeit, ESG, Innovation.
Schritt 4: Distanzmaße berechnen
Zur Bestimmung der thematischen Nähe zwischen Publikationen wird ein Distanzmaß verwendet. Am häufigsten wird die euklidische Distanz genutzt, um die Ähnlichkeit zwischen Texten oder Keyword-Profilen zu berechnen. Je kleiner die Distanz, desto stärker ähneln sich die Publikationen inhaltlich.
Beispiel:
Zwei Artikel mit ähnlichen Keyword-Profilen (z. B. Digitalisierung, Innovation) haben eine geringe euklidische Distanz – diese gehören wahrscheinlich demselben Themencluster an.
| Artikel A | Artikel B | Gemeinsame Keywords | Distanzmaß | Interpretation |
|---|---|---|---|---|
| Digitalisierung, Innovation, Effizienz | Innovation, Technologie, Effizienz | Innovation, Effizienz | Euklidische Distanz = niedrig | Thematisch stark verwandt → gehören demselben Cluster an |
| Nachhaltigkeit, Umwelt, Politik | Digitalisierung, KI, Innovation | – | Euklidische Distanz = hoch | Thematisch verschieden → unterschiedliche Cluster |
Schritt 5: Verfahren zur Clusterbildung wählen
Nachdem die Distanz zwischen den Publikationen berechnet wurde, folgt die Entscheidung, wie diese thematisch gruppiert werden sollen.
1. Überlege, welches Ziel deine Analyse hat
Willst du bestehende Themenfelder erkunden (explorativ)? → Dann eignet sich die hierarchische Clusteranalyse.
Willst du bereits bekannte Themenbereiche prüfen oder vergleichen? → Dann ist die k-Means Clusteranalyse sinnvoll, da du die Anzahl der Cluster vorher festlegen kannst.
2. Führe das gewählte Verfahren in der Software durch
In SPSS, R oder Python wählst du unter „Clusteranalyse“ dein Verfahren aus. Definiere, welche Variablen bzw. Literaturmerkmale (z. B. Keywords, Abstracts, Zitationshäufigkeit) in die Analyse einfließen.
3. Interpretiere, was das Verfahren macht
Beim hierarchischen, agglomerativen Verfahren (Bottom-up-Verfahren) werden zuerst einzelne Publikationen zu kleinen Gruppen zusammengefasst, die sich Schritt für Schritt zu größeren Clustern verbinden.
Beim divisiven Verfahren (Top-down) startet die Analyse mit einem Gesamtcluster und teilt diesen sukzessive in kleinere thematische Gruppen.
Beim k-Means-Verfahren werden die Datenpunkte automatisch so verteilt, dass die Varianz innerhalb der Cluster minimal ist.
4. Beobachte die entstehenden Themencluster
In der Literaturrecherche kannst du nun erkennen, welche Publikationen inhaltlich nah beieinander liegen. Überprüfe, ob sich die gefundenen Gruppen logisch interpretieren lassen.
5. Dokumentiere deine Entscheidung
Beschreibe deine Recherche im Methodikteil der Bachelorarbeit, welches Verfahren du gewählt hast, warum, und wie es zur thematischen Strukturierung der Literatur beiträgt.
Schritt 6: Anzahl der Cluster bestimmen
Nach der Clusterbildung wird überprüft, wie viele Themencluster die Literatur sinnvoll abbilden. Mithilfe des Elbow-Kriteriums kann sichtbar gemacht werden, ab welcher Clusteranzahl der Erkenntnisgewinn abnimmt.
In der Praxis bedeutet das: Ab diesem Punkt beginnen sich Themen künstlich zu trennen, statt echte Unterschiede zu zeigen.
Beispiel:
- 3 Cluster: Überblick über zentrale Forschungsfelder (nachhaltige Geschäftsmodelle, technologische Innovation, Politik).
- 5 Cluster: feinere Differenzierung, etwa Trennung zwischen ökologischer und sozialer Nachhaltigkeit.
Entscheide dich für die Ebene, die deiner Forschungsfrage am besten dient. Zu viele Cluster erschweren, zu wenige verflachen die Aussagekraft.
Schritt 7: Cluster bilden und interpretieren
Nachdem die optimale Anzahl der Cluster festgelegt wurde, folgt die eigentliche Analyse. Führe in SPSS, R oder Python die Clusteranalyse aus. Die Software gruppiert die Publikationen automatisch nach ihrer thematischen Ähnlichkeit – also danach, wie stark sich ihre Keyword-Profile oder Abstracts überschneiden.
1. Überprüfe die Zuordnung der Publikationen
Lies stichprobenartig die Titel und Abstracts innerhalb jedes Clusters. Prüfe, ob die inhaltliche Nähe nachvollziehbar ist. Entferne oder korrigiere Ausreißer (z. B. Artikel, die thematisch nicht passen).
2. Lege für jedes Cluster ein thematisches Label fest
Benenne die Gruppen nach ihrem gemeinsamen Schwerpunkt, z. B.:
- Cluster 1: Nachhaltige Geschäftsmodelle und CSR
- Cluster 2: Technologische Innovation und Digitalisierung
- Cluster 3: Umweltpolitik und Regulierung
Die Benennung dient später als Grundlage für Kapitelüberschriften oder Themenblöcke im Forschungsstand.
3. Vergleiche die Cluster untereinander
Welche Themen überschneiden sich? Wo liegen klare Abgrenzungen? Gibt es kleine Cluster mit Spezialthemen oder große, dominante Bereiche?
4. Ziehe Rückschlüsse für deine Literaturrecherche
Die großen Cluster zeigen, wo bereits viel geforscht wurde. Kleine oder isolierte Cluster weisen oft auf Forschungslücken hin. So kannst du gezielt entscheiden, welche Themenbereiche du vertiefst und welche du kritisch reflektierst.
Schritt 8: Ergebnisse visualisieren und für deine Arbeit nutzen
Nachdem die Cluster gebildet und interpretiert wurden, folgt die Visualisierung. Sie dient nicht nur der Illustration, sondern hilft, komplexe Themenlandschaften der Literatur verständlich darzustellen.
Wähle die passende Darstellungsform nach deinem Ziel:
- Dendrogramm: Zeigt die hierarchische Entwicklung der Cluster – ideal, wenn du ein agglomeratives Verfahren (bottom up) verwendet hast.
→ Erkenne, welche Publikationen sich zuerst verbinden und wo sich thematische Zweige trennen. - Elbow-Kurve: Nutze diese, um im Methodikteil zu begründen, wie du die optimale Anzahl an Clustern gewählt hast.
→ Markiere den „Knickpunkt“, an dem zusätzliche Cluster kaum noch Erkenntnis bringen. - Wissenslandkarte: Erstelle eine Übersicht der themenbezogenen Cluster (z. B. mit Gephi oder VOSviewer).
→ Zeige, welche Felder stark vernetzt sind (z. B. Nachhaltigkeit ↔ Digitalisierung) und wo isolierte Themen bestehen.
Verknüpfe Visualisierung und Interpretation.
Weise in der Darstellung jedem Cluster eine Farbe oder Bezeichnung zu (z. B. CSR-Forschung, Green Tech, Politische Steuerung). Füge erklärende Legenden hinzu, damit der Zusammenhang zwischen Grafik und Text klar erkennbar bleibt.
Nutze die Visualisierungen strategisch in der Arbeit.
Im Methodikteil, um das Verfahren und deine Auswahlentscheidungen transparent zu machen.
Im Ergebnisteil, um das Forschungsfeld anschaulich zu strukturieren.
Im Diskussionsteil, um die Bedeutung einzelner Cluster für deine Fragestellung zu reflektieren.
- Welche Forschungsrichtungen sind neu oder unterrepräsentiert?
- Wie lassen sich die Cluster zur Gliederung des Theoriekapitels oder Forschungsstandes nutzen?