Wie erstelle ich gute Grafiken in R? | Dr. Magdalene Ortmann | Statistik für Mediziner (2024)

von Dr. Magdalene Ortmann | Feb 9, 2022 | Grafiken | 0 Kommentare

Wie erstelle ich gute Grafiken in R? | Dr. Magdalene Ortmann | Statistik für Mediziner (1)

In diesem Artikel zeige ich dir, wie du ganz einfach professionelle Grafiken in R erstellst.

Bevor meine Doktoranden ihre Dissertation abgeben, gebe ich ihnen immer zwei Tipps:

1. Kontrolliere, ob deine Grafiken bzw. Diagramme richtig gut sind
2. Lass dir dein Manuskript von einem Lektor editieren, damit alles schick aussieht.

Warum ist das wichtig?

Menschen sind visuelle Wesen. Sie lieben schöne Dinge. Deswegen kaufen wir Schmuck und achten darauf unsere Wohnungen ansprechend einzurichten. Schönheit erzeugt bei uns das Gefühl von Sicherheit und Wohlbefinden.

Wissenschaftler – und das sind deine Gutachter ja auch – sind da nicht anders: Sie lieben die Schönheit wissenschaftlicher Arbeiten. Und diese drückt sich über Struktur und Ordnung aus. Ein schön editiertes Manuskript mit guten Diagrammen erweckt bei ihnen den Eindruck, dass du als Doktorand auch in der Tiefe – also bei der Datenanalyse, der Literaturrecherche, und der Argumentation – strukturiert und gewissenhaft gearbeitet hast.

Gute Grafiken erhöhen also das Vertrauen in die wissenschaftliche Qualität deiner Dissertation – und glaub mir eins – das wirkt sich positiv auf die Benotung deiner Arbeit aus.

In dieser Blogartikelserie werde ich dir deshalb zeigen, wie du ganz einfach gute Grafiken für deine Dissertation erstellst.

Inhalt

Die Wahl des richtigen Diagramms

1. Liniendiagramme

1.1 Messwiederholungen
1.2 Messwiederholungen mit verschiedenen Gruppen
1.3 Verschiedene Gruppen über verschiedene Bedingungen

2. Boxplots

3. Balkendiagramme

3.1 Balkendiagramme für Mittelwerte
3.2 Balkendiagramme für Häufigkeiten

4. Streudiagramme

5. Zeitverläufe

Inhalt

Die Wahl des richtigen Diagramms

1. Liniendiagramme

1.1 Messwiederholungen
1.2 Messwiederholungen mit verschiedenen Gruppen
1.3 Verschiedene Gruppen über verschiedene Bedingungen

2. Boxplots

3. Balkendiagramme

3.1 Balkendiagramme für Mittelwerte
3.2 Balkendiagramme für Häufigkeiten

4. Streudiagramme

5. Zeitverläufe

Die Wahl des richtigen Diagramms

Bevor es aber losgeht, müssen wir erstmal klären, welche Grafiken du wann benutzen solltest.

Ist dir schon mal aufgefallen, dass manche Grafiken sehr schwer zu verstehen sind? Das liegt oft daran, dass die Art des Diagramms nicht zum Design der Studie passt. Die dargestellten Effekte sind in Folge kaum zu erkennen.

Um dieses Problem zu umgehen, solltest du dir bevor du damit beginnst deine Grafiken zu erstellen, genau überlegen, welche Fragestellungen deiner Grafik zugrunde liegen.

Um das herauszufinden, stelle ich dir im Folgenden die verschiedenen Diagrammtypen vor und erkläre dir, welche Fragestellungen bzw. Studiendesigns du mit ihnen am besten darstellen kannst und welche Variablentypen du dafür benötigst.

Hast du das für dich passende Diagramm gefunden, zeigen wir dir in einem kleinen Tutorial, wie du die entsprechende Grafik schnell erstellst.

1. Liniendiagramme

Ein Liniendiagramm darfst du immer dann verwenden, wenn du Mittelwerte und ein Streuungsmaß wie z.B. die Standardabweichung über mehrere Bedingungen hinweg darstellen möchtest.

Dafür müssen deine Daten normalverteilt und metrisch skaliert sein.

Für folgende Studiendesigns solltest du Liniendiagramme verwenden:

1.1 Messwiederholungen

Liniendiagramme sind definitiv für Messwiederholungen erfunden worden. Das liegt daran, dass Linien sehr gut dazu geeignet sind, einzelne Zeitpunkte der Messung optisch miteinander zu verbinden und somit Veränderungen über die Zeit hinweg klar herauszustellen.

Im einfachsten Fall sieht eine Liniengrafik für Messwiederholungen so aus:

Dargestellt wird die Veränderungen der Beweglichkeit über 3 Zeitpunkte hinweg: T1, T2 und T3. Da die Linie ansteigt, wird intuitiv klar: Die Beweglichkeit steigt über die Zeit hinweg an.

FYI: Das dazu gehörige Testverfahren wäre die Innersubjekt-ANOVA (= ANOVA für Messwiederholungen).

Eine einfache Anleitung für Liniendiagramme in R erhältst du hier:

zum Video-Tutorial

1.2 Messwiederholungen mit verschiedenen Gruppen:

Dieses einfache Studiendesign kann sich aber auch etwas komplexer gestalten. Und gerade dann sind Liniengrafiken perfekt geeignet, um Effekte klar herauszustellen:

Im folgenden Liniendiagramm bekommen zwei Gruppen von Patientinnen entweder Ibuprofen (Gruppe 1) oder Paracetamol (Gruppe 2) und ihre Regelschmerzen zu behandeln. Dafür erhalten sie über die folgenden 3 Monate hinweg verschiedene Dosierungen: Einmal eine geringe, einmal eine mittlere und einmal eine hohe (in randomisierter Reihenfolge). Gemessen wird die Anzahl der Stunden, in denen die Frauen schmerzfrei sind.

Anhand der ansteigenden Linien wird sofort klar: Eine höhere Dosierung scheint in einer längeren Wirkdauer zu resultieren, wobei sich dieser Effekt etwas stärker für Paracetamol zeigt, im Vergleich zu Ibuprofen. Und da die Linie von Ibuprofen über der von Paracetamol liegt, erkennt man leicht, dass Ibuprofen generell ein bisschen länger wirkt (zumindest in der niedrigen und mittleren Dosis).

Wie übersichtlich und einfach zu verstehen! Der gleiche Effekt als Balkendiagramm dargestellt, wäre ein pain in the ass gewesen. Daher solltest du für Studiendesigns wie dieses unbedingt Liniendiagramme verwenden.

Zur Info: Das dazu gehörige Testverfahren wäre die Mixed-Modell-ANOVA
(= ANOVA für Gruppenvergleiche x Messwiederholung).

Eine einfache Anleitung für Liniendiagramme in R erhältst du hier:

zum Video-Tutorial

1.3 Verschiedene Gruppen über verschiedene Bedingungen:

Manchmal bietet sich an, Liniendiagramme auch für Studiendesigns ohne Messwiederholungen zu verwenden, in denen du verschiedene Gruppen über verschiedene Bedingungen vergleichst. Dafür ist es aber notwendig, dass du ein faktorielles Design verwendest.

Das würde z.B. dann vorliegen, wenn du wie im obigen Beispiel zwei Medikamente mit jeweils 3 verschiedenen Dosierungen vergleichst und die 6 Faktorkombinationen dann je einer Gruppe zuordnest.

In diesem konkreten Fall würdest du also 6 Gruppen miteinander vergleichen, wobei die Gruppen, die den gleichen Wirkstoff bekämen, durch eine Linie entlang der verschiedenen Dosierungen optisch verbunden wären.

Eine gute Alternative wäre hier allerdings auch ein Balkendiagramm für Mittelwerte.

Wie erstelle ich gute Grafiken in R? | Dr. Magdalene Ortmann | Statistik für Mediziner (4)

Kurs R Grafiken

mehr Infos

Zur Info: Das dazu gehörige Testverfahren wäre die Mixed-Modell-ANOVA
(= ANOVA für Gruppenvergleiche x Messwiederholung).

Eine einfache Anleitung für Liniendiagramme in R erhältst du hier:

zum Video-Tutorial

Du siehst, mit dem Liniendiagramm kann man relativ komplexe Studiendesigns sehr übersichtlich und intuitiv darstellen – und das willst du, denn so sammelst du spielend Punkte bei deiner Betreuerin.

2. Boxplots

Boxplots verwendest du immer dann, wenn deine Variablen ordinal– oder metrisch skaliert, aber leider nicht normalverteilt.

Boxplots sind unsere Retter in der Not, da sie immer dann einspringen, wenn unsere Variablen nicht den Anforderungen des Liniendiagramms entsprechen.

In diesem Fall gibt uns der Boxplot sehr viel wertvolle Information über die Verteilung der Variablen.

Boxplots können für folgende Studiendesigns verwendet werden:

Messwiederholungen, Messwiederholungen für verschiedene Gruppen, und für den Vergleich von verschiedenen Gruppen über verschiedene Bedingungen.

Du siehst, die passenden Studiendesigns sind genau gleich zu denen des Liniendiagramms – denn der Boxplot springt immer dann ein, wenn die Vorbedingungen des Liniendiagramms nicht erfüllt werden.

Da ein Boxplot sehr viele Informationen über die Verteilung der dargestellten Variablen bietet, wäre es schlicht weg zu unübersichtlich eine optische Verbindung wie Linien zwischen den Bedingungen oder Zeitpunkten einzubauen. Daher wird jede Bedingung anhand eines einzelnen Boxplots dargestellt. Die Interpretation der Effekte erfolgt über den im Boxplot dargestellten Median (= die dicke Linie in der Mitte der Box) und ist demzufolge nicht so leicht wie im Liniendiagramm.

Wie du einen Boxplot interpretierst und wie du ihn ganz einfach in einer Grafik für deine Dissertation erstellen kannst, zeige ich dir in diesem Artikel.

zum Video-Tutorial

FYI:
Die zugrundeliegenden Testverfahren für die beschriebenen Studiendesigns bei metrisch skalierten, aber nicht normalverteilten Variablen sind:

    • Für Messwiederholungen: die robuste ANOVA für Messwiederholungen oder die Friedmann – ANOVA
    • Für Messwiederholungen bei verschiedenen Gruppen: die robuste ANOVA für Messwiederholung x Gruppenvergleiche
    • Für den Vergleich verschiedener Gruppen über verschiedene Bedingungen: die robuste ANOVA für Gruppenvergleiche oder der Kruskall-Wallis Test.

Die zugrunde liegende Testverfahren für die beschriebenen Studiendesigns bei ordinal skalierten, Variablen sind:

    • Für Messwiederholungen: die Friedmann- ANOVA
    • Für den Vergleich von verschiedenen Gruppen: der Kruskall-Wallis Test.
    • Spezialfall ordinale Daten: Es kann immer nur ein einzelnerFaktorgetestet werden, also z.B. nur eine Gruppe über verschiedene Dosierungen hinweg, nicht mehrere. Interaktionen entfallen somit.

3. Balkendiagramme

Balkendiagramme werden auch Säulendiagramme genannt und in 2 Typen unterteilt:

Solche, die Mittelwerte darstellen und solche, die Häufigkeiten darstellen.

3.1 Balkendiagramme für Mittelwerte

Balkendiagramme für Mittelwerte verwendest du immer dann, wenn du Mittelwerte und ein Streuungsmaß wie z.B. die Standardabweichung für mehrere Gruppen über viele verschiedene Bedingungen hinweg darstellen möchtest.

Sie sind also die beste Lösung für alle Szenarien, die keine Messwiederholungen beinhalten.

Eine wichtige Voraussetzung ist dafür allerdings, dass deine Variablen normalverteilt und metrisch skaliert sind. Ist diese Voraussetzung nicht erfüllt, verwende lieber Boxplots.

FYI: Das dazu gehörige Testverfahren wäre die Zwischensubjekt-ANOVA
(auch ANOVA für Gruppenvergleiche genannt).

Eine einfache Anleitung für Balkendiagramme für Mittelwerte in R erhältst du hier:

zum Video-Tutorial

3.2 Balkendiagramme für Häufigkeiten:

Balkendiagramme für Häufigkeiten werden für nominale Variablen verwendet, also Variablen, die zwei oder mehr, klar voneinander abgrenzbare Ausprägungen haben (z.B. die Anzahl von Respondern bei einem oder mehreren verschiedenen Medikamenten).

Dabei können sowohl die absoluten (n) als auch die relativen Häufigkeiten (%) im Säulendiagramm dargestellt werden.

Es wäre dabei sowohl möglich Häufigkeitsvergleiche zwischen verschiedenen Gruppen als auch zwischen verschiedenen Messzeitpunkten darzustellen:

FYI:
Das richtige Testverfahren für den Vergleich von Häufigkeiten zwischen verschiedenen Gruppen wäre die Kreuztabelle mit dem Chi2-Test.

Das richtige Testverfahren für den Vergleich von Häufigkeiten zwischen verschiedenen Messzeitpunkten wäre die Kreuztabelle mit dem McNemar-Test.

Eine einfache Anleitung für Balkendiagramme für Häufigkeiten in R erhältst du hier:

zum Video-Tutorial

4. Streudiagramme

Streudiagramme werden immer dann verwendet, wenn du bei deiner Stichprobe zwei verschiedene Maße erhoben hast und dann die Zusammenhänge zwischen diesen zwei metrischen, zwei ordinalen oder einer metrischen und einer ordinalskalierten Variablen darstellen möchtest.

Sie eignen sich prima dafür, die Stärke und die Richtung dieser Zusammenhängen herauszuarbeiten und diese dann in Form von Korrelationsgeraden darzustellen.

Das Beste ist aber, dass man Streudiagramme (auch Scatter Plots genannt) nach Gruppen getrennt erstellen kann, und somit den Vergleich von Effekten stark vereinfachen kann.

In der folgenden Grafik erkennst du zum Beispiel intuitiv, dass mehr Training für Frauen keinen positiven Effekt auf die Ausdauer hat, bei Männern aber schon (das ist natürlich glatt gelogen).

FYI:
Das dazu gehörige Testverfahren wäre für zwei metrische Variablen die Korrelation nach Pearson.
Für zwei ordinalskalierte Variablen oder die Korrelation einer ordinalen und einer metrischen Variablen die Korrelation nach Spearman.

Eine einfache Anleitung für Streudiagramme in R erhältst du hier:

zum Video-Tutorial

5. Diagramme für Zeitverläufe

Diagramme für Zeitverläufe benötigst du immer dann, wenn du die Häufigkeit bestimmter Vorkommnisse über sehr viele einzelne Zeitpunkte (z.B. Tage, Wochen, Monate) hinweg darstellen möchtest.

Sie werden insbesondere im Bereich der Epidemiologie häufig verwendet. Diesen Diagrammtyp erläutere ich hier nicht, wir haben dir aber hier eine Anleitung erstellt, mit der du entsprechende Diagramme ganz leicht erstellen kannst.

← So erstellst du mühelos ein Balkendiagramm für Häufigkeiten in R – Video-Tutorial! So berechnest und berichtest du die ANOVA für Gruppenvergleiche in 9 Schritten →

Kommentar absenden

Wie erstelle ich gute Grafiken in R? | Dr. Magdalene Ortmann | Statistik für Mediziner (2024)

References

Top Articles
40% Off Dorianstudio Coupons & Promo Codes
The Best Virtual Reality Games Of All Time
Funny Roblox Id Codes 2023
Worcester Weather Underground
Top 11 Best Bloxburg House Ideas in Roblox - NeuralGamer
Riverrun Rv Park Middletown Photos
Patreon, reimagined — a better future for creators and fans
Body Rubs Austin Texas
Nwi Police Blotter
Gore Videos Uncensored
Craigslist Greenville Craigslist
Top Hat Trailer Wiring Diagram
World History Kazwire
R/Altfeet
George The Animal Steele Gif
Red Tomatoes Farmers Market Menu
Nalley Tartar Sauce
Chile Crunch Original
Teenleaks Discord
Immortal Ink Waxahachie
Craigslist Free Stuff Santa Cruz
Mflwer
Spergo Net Worth 2022
Costco Gas Foster City
Obsidian Guard's Cutlass
Mccain Agportal
Amih Stocktwits
Fort Mccoy Fire Map
Uta Kinesiology Advising
Kcwi Tv Schedule
What Time Does Walmart Auto Center Open
Nesb Routing Number
Olivia Maeday
Random Bibleizer
10 Best Places to Go and Things to Know for a Trip to the Hickory M...
Receptionist Position Near Me
Black Lion Backpack And Glider Voucher
Gopher Carts Pensacola Beach
Duke University Transcript Request
Lincoln Financial Field, section 110, row 4, home of Philadelphia Eagles, Temple Owls, page 1
Jambus - Definition, Beispiele, Merkmale, Wirkung
Ark Unlock All Skins Command
Craigslist Red Wing Mn
Jail View Sumter
Birmingham City Schools Clever Login
Thotsbook Com
Funkin' on the Heights
Caesars Rewards Loyalty Program Review [Previously Total Rewards]
Vci Classified Paducah
Www Pig11 Net
Ty Glass Sentenced
Latest Posts
Article information

Author: Eusebia Nader

Last Updated:

Views: 6133

Rating: 5 / 5 (60 voted)

Reviews: 83% of readers found this page helpful

Author information

Name: Eusebia Nader

Birthday: 1994-11-11

Address: Apt. 721 977 Ebert Meadows, Jereville, GA 73618-6603

Phone: +2316203969400

Job: International Farming Consultant

Hobby: Reading, Photography, Shooting, Singing, Magic, Kayaking, Mushroom hunting

Introduction: My name is Eusebia Nader, I am a encouraging, brainy, lively, nice, famous, healthy, clever person who loves writing and wants to share my knowledge and understanding with you.