Anleitung für deine Bachelorarbeit

Fahrplan für deine perfekte Bachelorarbeit

Experten erklären dir, wir du eine vollständige Bachelorarbeit schreibst – Thema finden, Zeitplan erstellen & Kapitel schreiben.

(Reading time: 5 - 10 minutes)

🧑‍🎓 Deine perfekte Bachelorarbeit

Studenten-Rabatt sichern

Bachelorarbeit

Keyword-Kookkurrenz- und Clusteranalyse für die Literaturrecherche

Keyword-Kookkurrenz- und Clusteranalyse für die Literaturrecherche

Die Literaturrecherche bildet das Fundament jeder wissenschaftlichen Arbeit. Je umfangreicher das Forschungsfeld, desto wichtiger wird eine gezielte Literaturrecherche.

Hierfür kannst du die Methoden Keyword-Kookkurrenzanalyse und die Clusteranalyse nutzen. Beide Verfahren ermöglichen, große Mengen an Text- oder Literaturdaten methodisch auszuwerten, thematische Strukturen zu erkennen und Forschungsfelder visuell abzubilden.

Dadurch kannst du leichter Trends, Lücken und Verbindungen zwischen Studien sichtbar machen. Der Nutzen liegt insbesondere in der datenbasierten Orientierung: anstatt zufällig Literatur zu lesen, lassen sich gezielt Cluster bilden, Themen verdichten und Begriffe nach Relevanz gewichten.

In diesem 1a-Studi Artikel lernst du, wie du die Keyword-Kookkurrenz- und Clusteranalyse für die Literaturrecherche für deine Bachelorarbeit verwenden kannst.

Thesis-Sprint

Schreiben mit System, und fertig! Für Literaturarbeit und empirische Arbeit (Bachelor & Master).

  • Anleitung & Beispiele
  • Formulierungshilfen
  • Zeit- & Aufgabenplanung
  • Print & E-Book 🛡️
Mehr erfahren
Buch Thesis Sprint
 
Kookkurrenzanalyse vs. Clusteranalyse

Keyword-Kookkurrenzanalyse vs. Clusteranalyse

Die Kookkurrenzanalyse untersucht, welche Begriffe häufig gemeinsam in wissenschaftlichen Texten vorkommen. Dadurch wird sichtbar, welche Konzepte inhaltlich miteinander verknüpft sind.

Die Clusteranalyse hingegen gruppiert Datenpunkte (z. B. Publikationen oder Keywords) anhand von Ähnlichkeiten.

Beide Verfahren dienen also der Mustererkennung, unterscheiden sich aber in ihrem methodischen Fokus.

Merkmal Kookkurrenzanalyse Clusteranalyse
Zielsetzung Ermittlung semantischer Beziehungen zwischen Begriffen Bildung thematischer Gruppen auf Basis von Ähnlichkeiten
Datenbasis Sprachliche Einheiten (Wörter, Phrasen, Begriffe) Numerische oder kategorische Datenpunkte (z. B. Keywords, Publikationen)
Verfahrenstyp Linguistisch-semantisch Statistisch-mathematisch
Analyseebene Wort- und Bedeutungsebene Objekt- und Merkmalsebene
Typische Verfahren Frequenzanalyse, Assoziationsnetzwerke, Kontextanalyse Hierarchische Clusteranalyse, k-Means Clusteranalyse, agglomeratives und divisives Verfahren
Ergebnisse Netzwerke und thematische Knotenpunkte Cluster mit ähnlichen Datenpunkten oder Forschungsobjekten
Interpretation Semantische Nähe und Diskursstrukturen Statistische Nähe und thematische Gruppenzugehörigkeit
Visualisierung Wortnetzwerke, Co-Occurrence Maps Dendrogramme, Elbow-Kurven, Wissenslandkarten

Vorteile der Kookkurrenzanalyse liegen in der inhaltlichen Präzision und der Offenlegung semantischer Beziehungen.

Die Clusteranalyse punktet durch ihre objektive Datenstrukturierung und Visualisierung, etwa über Dendrogramme.

Ein Nachteil beider Verfahren liegt im hohen Datenaufwand, der ohne Software-Unterstützung kaum zu bewältigen ist.

Kookkurrenzanalyse

Kookkurrenzanalyse in der Literaturrecherche

Die Kookkurrenzanalyse untersucht, wie oft und in welchem Kontext bestimmte Begriffe gemeinsam in einem Korpus auftreten.

Bei deiner Literaturrecherche kannst du dadurch:

  • Themenfelder
  • theoretische Konzepte
  • methodische Verbindungen

leichter finden. Durch die Analyse der Häufigkeit von Wortpaaren entstehen Netzwerke, die semantische Beziehungen zwischen Forschungsschwerpunkten abbilden.

Kookkurrenzanalyse

Strukturelle Bestandteile und linguistische Muster (Konstituenten)

Die Untersuchung der Konstituenten – also sprachlicher Bestandteile wie Substantive oder Verben – ermöglicht es dir, Schwerpunkte in der Forschungssprache zu erkennen. Diese Muster bilden den Ausgangspunkt, um Themen nicht zufällig, sondern systematisch zu identifizieren.

Schritt 1: Textkorpus festlegen

Wähle eine Sammlung wirtschaftswissenschaftlicher Texte zu einem abgegrenzten Thema, z. B. Digitalisierung im Mittelstand oder nachhaltige Unternehmensführung.

Grundlage sind wissenschaftliche Artikel, Reports oder Dissertationen aus Datenbanken wie EconBiz, ScienceDirect oder SpringerLink.

Schritt 2: Linguistische Einheiten bestimmen

Zerlege die Texte in sprachliche Bestandteile. Besonders relevant sind:

  • Substantive: z. B. Innovation, Produktivität, Nachhaltigkeit
  • Verben: z. B. investieren, optimieren, transformieren
  • Adjektive: z. B. digital, effizient, resilient

Diese bilden die Basis, um inhaltliche Muster und Schwerpunkte zu erkennen.

Schritt 3: Häufigkeiten analysieren

Ermittle, welche Begriffe am häufigsten vorkommen.

Beispielhafte Häufigkeiten:

Keyword-Häufigkeiten
Keyword Häufigkeit
Digitalisierung 68
Unternehmen 54
Innovation 47
Prozessoptimierung 29

Häufige Substantive sind Indikatoren für Kernthemen eines Forschungsfeldes.

Schritt 4: Kookkurrenzen identifizieren

Untersuche, welche Begriffe regelmäßig gemeinsam auftreten.

Beispiele wirtschaftlicher Kookkurrenzen:

  • Digitalisierung – Effizienzsteigerung
  • Nachhaltigkeit – Wettbewerbsvorteil
  • Investition – Risikomanagement

Derartige Wortpaare zeigen, welche Konzepte in der wirtschaftswissenschaftlichen Diskussion zusammengehören.

Schritt 5: Muster linguistisch interpretieren

Analysiere, wie die Begriffe verwendet werden. Stehen z. B. Substantive häufig mit wertenden Adjektiven wie nachhaltig, strategisch oder profitabel, weist das auf normative Ausrichtungen der Forschung hin.

Dadurch wird deutlich, ob der Diskurs stärker innovations-, ressourcen- oder effizienzorientiert geprägt ist.

Schritt 6: Ergebnisse visualisieren

Erstelle ein semantisches Netzwerk oder eine Kookkurrenzkarte.

Kookkurrenzanalyse

Schritt 7: Themen ableiten

Nutze die identifizierten Muster, um Forschungslücken und Schwerpunkte für deine geplante Abschlussarbeit in der wirtschaftswissenschaftlichen Literatur zu erkennen.

Wenn z. B. Digitalisierung häufig mit Kostenreduktion, aber selten mit Mitarbeiterzufriedenheit verknüpft ist, kann daraus ein neues Forschungsthema entstehen.

Clusteranalyse

Clusteranalyse in der Literaturrecherche

Die Clusteranalyse fasst ähnliche Objekte oder Begriffe zu Gruppen zusammen (Cluster). In der Literaturrecherche werden so einzelne Datenpunkte (z. B. Publikationen, Autoren, Keywords) anhand gemeinsamer Merkmale gruppiert.

Das Ziel ist, Strukturen in großen Datenmengen zu erkennen und die inhaltliche Nähe von Quellen messbar zu machen.

Clusteranalyse

Methodische Grundlagen – Distanzmaße, Datenaufbereitung und Clusterbildung

Grundlage der Clusteranalyse sind Distanzmaße, die Ähnlichkeiten oder Unterschiede zwischen Datenpunkten berechnen. Besonders verbreitet ist die euklidische Distanz, die den geometrischen Abstand zwischen zwei Punkten im Merkmalsraum beschreibt. Je kleiner der Wert, desto ähnlicher sind sich die Objekte.

Clusteranalyse

Zur Bildung von Clustern wird häufig ein hierarchisches Verfahren eingesetzt, das Daten Bottom up aggregiert. Dabei entstehen zunächst viele kleine Cluster, die schrittweise zu größeren Gruppen zusammengefasst werden. Dieser Prozess wird auch als Agglomeratives Verfahren bezeichnet.

Clusteranalyse

Im Gegensatz dazu steht das Divisive Verfahren, das mit einem Gesamtcluster beginnt und diesen sukzessive in kleinere Gruppen unterteilt.

Clusteranalyse

Umsetzung mit SPSS, R, Python und Excel für bibliometrische Datensätze

Programme wie SPSS, R oder Python ermöglichen eine automatisierte Clusteranalyse. Hierfür importierst du bibliometrische Datensätze, definierst Distanzmaße und wählst das geeignete Verfahren, z. B.:

  • Single Linkage
  • k-Means Clusteranalyse

Anschließend werden die Anzahl der Cluster und die Gruppenzugehörigkeiten der einzelnen Datenpunkte ermittelt.

Interpretation von Clustern

Die Interpretation von Clustern besteht darin, die inhaltliche Bedeutung der gebildeten Cluster zu deuten. Dabei wird analysiert, welche Publikationen oder Begriffe in einem Cluster gehören und wie sich die Cluster unterscheiden. Dadurch lassen sich Forschungsthemen voneinander abgrenzen und wissenschaftliche Schwerpunkte sichtbar machen.

Visualisierung: Dendrogramm, Elbow-Kriterium, Wissenslandkarten

Ein Dendrogramm zeigt, wie sich Cluster hierarchisch entwickeln.

Das Elbow-Kriterium hilft, die optimale Anzahl von Clustern zu bestimmen, indem der Punkt identifiziert wird, an dem zusätzliche Cluster kaum noch Erkenntnisgewinn bringen.

Clusteranalyse

In der Literaturrecherche lassen sich die Ergebnisse als Wissenslandkarten darstellen, die Zusammenhänge zwischen Themenfeldern anschaulich visualisieren.

Anwendungsbeispiel: Clusteranalyse

Anwendungsbeispiel: Clusteranalyse in der Bachelorarbeit

Die Clusteranalyse kann nicht nur für empirische Daten, sondern auch gezielt für die Literaturrecherche eingesetzt werden. Hierfür werden wissenschaftliche Publikationen, Autoren oder Keywords analysiert und in Gruppen mit ähnlichen thematischen Merkmalen zusammengefasst.

Ziel ist, Forschungsfelder systematisch zu strukturieren, Überschneidungen zu erkennen und neue Themencluster zu identifizieren.

Schritt 1: Ziel und Fragestellung definieren

Bestimme, was durch die Clusteranalyse erreicht werden soll. Soll die Analyse helfen, Forschungsschwerpunkte zu erkennen, Publikationen thematisch zu gruppieren oder untersuchte Variablen (z. B. Digitalisierung, Effizienz) zu ordnen?

Beispiel:
Ziel ist es, herauszufinden, welche Themenfelder die Forschung zu nachhaltigem Wirtschaften dominieren und wie diese sich voneinander abgrenzen lassen.

Schritt 2: Literaturdaten sammeln

Sammle relevante Quellen aus wissenschaftlichen Datenbanken (z. B. EconBiz, Scopus, Web of Science). Exportiere für jede Publikation grundlegende Daten:

  • Titel
  • Abstract
  • Keywords
  • Erscheinungsjahr
  • Autoren
  • ggf. Zitationszahlen

Hier erfährst du mehr über das Exzerpieren.

Schritt 3: Keywords und Variablen aufbereiten

Extrahiere die Schlüsselbegriffe (Keywords) aus allen Quellen. Entferne Füllwörter und vereinheitliche Synonyme (z. B. CSR = Corporate Social Responsibility).

Als Ergebnis entsteht eine standardisierte Liste, mit der sich Themen statistisch vergleichen lassen.

Beispielhafte Keywords:
Nachhaltigkeit, Green Economy, Kreislaufwirtschaft, Digitalisierung, Wettbewerbsfähigkeit, ESG, Innovation.

Schritt 4: Distanzmaße berechnen

Zur Bestimmung der thematischen Nähe zwischen Publikationen wird ein Distanzmaß verwendet. Am häufigsten wird die euklidische Distanz genutzt, um die Ähnlichkeit zwischen Texten oder Keyword-Profilen zu berechnen. Je kleiner die Distanz, desto stärker ähneln sich die Publikationen inhaltlich.

Beispiel:
Zwei Artikel mit ähnlichen Keyword-Profilen (z. B. Digitalisierung, Innovation) haben eine geringe euklidische Distanz – diese gehören wahrscheinlich demselben Themencluster an.

Artikel A Artikel B Gemeinsame Keywords Distanzmaß Interpretation
Digitalisierung, Innovation, Effizienz Innovation, Technologie, Effizienz Innovation, Effizienz Euklidische Distanz = niedrig Thematisch stark verwandt → gehören demselben Cluster an
Nachhaltigkeit, Umwelt, Politik Digitalisierung, KI, Innovation Euklidische Distanz = hoch Thematisch verschieden → unterschiedliche Cluster

Schritt 5: Verfahren zur Clusterbildung wählen

Nachdem die Distanz zwischen den Publikationen berechnet wurde, folgt die Entscheidung, wie diese thematisch gruppiert werden sollen.

1. Überlege, welches Ziel deine Analyse hat

Willst du bestehende Themenfelder erkunden (explorativ)? → Dann eignet sich die hierarchische Clusteranalyse.

Willst du bereits bekannte Themenbereiche prüfen oder vergleichen? → Dann ist die k-Means Clusteranalyse sinnvoll, da du die Anzahl der Cluster vorher festlegen kannst.

2. Führe das gewählte Verfahren in der Software durch

In SPSS, R oder Python wählst du unter „Clusteranalyse“ dein Verfahren aus. Definiere, welche Variablen bzw. Literaturmerkmale (z. B. Keywords, Abstracts, Zitationshäufigkeit) in die Analyse einfließen.

3. Interpretiere, was das Verfahren macht

Beim hierarchischen, agglomerativen Verfahren (Bottom-up-Verfahren) werden zuerst einzelne Publikationen zu kleinen Gruppen zusammengefasst, die sich Schritt für Schritt zu größeren Clustern verbinden.

Beim divisiven Verfahren (Top-down) startet die Analyse mit einem Gesamtcluster und teilt diesen sukzessive in kleinere thematische Gruppen.

Beim k-Means-Verfahren werden die Datenpunkte automatisch so verteilt, dass die Varianz innerhalb der Cluster minimal ist.

4. Beobachte die entstehenden Themencluster

In der Literaturrecherche kannst du nun erkennen, welche Publikationen inhaltlich nah beieinander liegen. Überprüfe, ob sich die gefundenen Gruppen logisch interpretieren lassen.

5. Dokumentiere deine Entscheidung

Beschreibe deine Recherche im Methodikteil der Bachelorarbeit, welches Verfahren du gewählt hast, warum, und wie es zur thematischen Strukturierung der Literatur beiträgt.

Schritt 6: Anzahl der Cluster bestimmen

Nach der Clusterbildung wird überprüft, wie viele Themencluster die Literatur sinnvoll abbilden. Mithilfe des Elbow-Kriteriums kann sichtbar gemacht werden, ab welcher Clusteranzahl der Erkenntnisgewinn abnimmt.

In der Praxis bedeutet das: Ab diesem Punkt beginnen sich Themen künstlich zu trennen, statt echte Unterschiede zu zeigen.

Beispiel:

  • 3 Cluster: Überblick über zentrale Forschungsfelder (nachhaltige Geschäftsmodelle, technologische Innovation, Politik).
  • 5 Cluster: feinere Differenzierung, etwa Trennung zwischen ökologischer und sozialer Nachhaltigkeit.

Entscheide dich für die Ebene, die deiner Forschungsfrage am besten dient. Zu viele Cluster erschweren, zu wenige verflachen die Aussagekraft.

Schritt 7: Cluster bilden und interpretieren

Nachdem die optimale Anzahl der Cluster festgelegt wurde, folgt die eigentliche Analyse. Führe in SPSS, R oder Python die Clusteranalyse aus. Die Software gruppiert die Publikationen automatisch nach ihrer thematischen Ähnlichkeit – also danach, wie stark sich ihre Keyword-Profile oder Abstracts überschneiden.

1. Überprüfe die Zuordnung der Publikationen

Lies stichprobenartig die Titel und Abstracts innerhalb jedes Clusters. Prüfe, ob die inhaltliche Nähe nachvollziehbar ist. Entferne oder korrigiere Ausreißer (z. B. Artikel, die thematisch nicht passen).

2. Lege für jedes Cluster ein thematisches Label fest

Benenne die Gruppen nach ihrem gemeinsamen Schwerpunkt, z. B.:

  • Cluster 1: Nachhaltige Geschäftsmodelle und CSR
  • Cluster 2: Technologische Innovation und Digitalisierung
  • Cluster 3: Umweltpolitik und Regulierung

Die Benennung dient später als Grundlage für Kapitelüberschriften oder Themenblöcke im Forschungsstand.

3. Vergleiche die Cluster untereinander

Welche Themen überschneiden sich? Wo liegen klare Abgrenzungen? Gibt es kleine Cluster mit Spezialthemen oder große, dominante Bereiche?

4. Ziehe Rückschlüsse für deine Literaturrecherche

Die großen Cluster zeigen, wo bereits viel geforscht wurde. Kleine oder isolierte Cluster weisen oft auf Forschungslücken hin. So kannst du gezielt entscheiden, welche Themenbereiche du vertiefst und welche du kritisch reflektierst.

Schritt 8: Ergebnisse visualisieren und für deine Arbeit nutzen

Nachdem die Cluster gebildet und interpretiert wurden, folgt die Visualisierung. Sie dient nicht nur der Illustration, sondern hilft, komplexe Themenlandschaften der Literatur verständlich darzustellen.

Wähle die passende Darstellungsform nach deinem Ziel:

  • Dendrogramm: Zeigt die hierarchische Entwicklung der Cluster – ideal, wenn du ein agglomeratives Verfahren (bottom up) verwendet hast.
    → Erkenne, welche Publikationen sich zuerst verbinden und wo sich thematische Zweige trennen.
  • Elbow-Kurve: Nutze diese, um im Methodikteil zu begründen, wie du die optimale Anzahl an Clustern gewählt hast.
    → Markiere den „Knickpunkt“, an dem zusätzliche Cluster kaum noch Erkenntnis bringen.
  • Wissenslandkarte: Erstelle eine Übersicht der themenbezogenen Cluster (z. B. mit Gephi oder VOSviewer).
    → Zeige, welche Felder stark vernetzt sind (z. B. Nachhaltigkeit ↔ Digitalisierung) und wo isolierte Themen bestehen.

Verknüpfe Visualisierung und Interpretation.
Weise in der Darstellung jedem Cluster eine Farbe oder Bezeichnung zu (z. B. CSR-Forschung, Green Tech, Politische Steuerung). Füge erklärende Legenden hinzu, damit der Zusammenhang zwischen Grafik und Text klar erkennbar bleibt.

Nutze die Visualisierungen strategisch in der Arbeit.
Im Methodikteil, um das Verfahren und deine Auswahlentscheidungen transparent zu machen.

Im Ergebnisteil, um das Forschungsfeld anschaulich zu strukturieren.
Im Diskussionsteil, um die Bedeutung einzelner Cluster für deine Fragestellung zu reflektieren.

  • Welche Forschungsrichtungen sind neu oder unterrepräsentiert?
  • Wie lassen sich die Cluster zur Gliederung des Theoriekapitels oder Forschungsstandes nutzen?
Studiere dich schlau

Artikel zum entdecken

Teile oder zitiere diesen Artikel:

Literaturverzeichnis

Verweis im Text

Quellen:
Im Text:
Icon
Hol dir 10 % Rabatt.
Melde dich beim Newsletter an.
  • Exklusive Rabatte und Aktionen
  • Regelmäßig Insiderwissen für dein Studium
Noch unsicher?
Finde dir zu dir passenden Services
Bedarfsanalyse starten