Kleine Sektflaschen Hochzeit
Typischerweise würde man links neben den Balken einen vertikalen Strich – die y-Achse – erwarten. Dies kann man mit dem Befehl "" nachholen. Das Argument 1 steht dabei für eine durchgezogene Linie. Es gibt noch weitere Argumente (2-6), die für gestrichelte, gepunktete usw. Linien stehen. Die 1 ist hier empfehlenswert main = "TITEL", sub = "UNTERTITEL", = 1. 5,, = 1. 5,,, = 1) Zusatz: Farbe der Balken, Achsen usw. ändern Mit dem Argument " col " könnt ihr euren Balken zusätzlich einen farbigen Anstrich geben. Allerdings vergebt ihr mehrere Farben – je Geschlecht eines – mit col=c(). In die Klammer kommen dann in Anführungszeichen die Farben für, in meinem Fall, die Geschlechter. Z. B. col=c("darkblue", "darkred"). färbt die Achsen, die Achsenbeschriftung, den Titel und den Untertitel des Balkendiagramms ein. Mit Farbe würde ich allerdings sparsam umgehen. Schwarze oder in Graustufen gehaltene Balken sind am unverfänglichsten. Zu den Farben in R gibt es hier noch mal einen ausführlichen Artikel: Farben in R, der "col"-Befehl.
Die Anzahl der Intervalle haben wir mit der Option breaks festgelegt. Das Argument seq(-3, 3, length=30) legt fest, dass die Intervalle bei -3 starten, bei 3 enden bei Insgesamt 30 Schritten. Die so erzeugte Graphik sieht folgendermaßen aus: Als letztes erstellen wir ein Histogramm mit eingezeichneter Dichtefunktion einer Normalverteilung. Eine solche Graphik wird häufig gezeichnet um zu überprüfen ob Daten mit der Normalverteilung übereinstimmen. Wir geben zu diesem Zweck den folgenden Code ein: xlab="Zufallszahlen", ylab="Wahrscheinlichkeitsdichte", breaks=seq(-3, 3, length=30), freq=FALSE) m <- mean(x) s <- sd(x) curve(dnorm(x, m, s), add=TRUE, lwd=3) Mit diesem Code wird die folgende Graphik erzeugt: Die Befehle, die im Vergleich zu vorigen Schritt dazugekommen sind, bewirken das Folgende: Die Option freq=FALSE bewirkt, dass auf der y-Achse nicht mehr die Anzahl an Werten, sondern die sogenannte Wahrscheinlichkeitsdichte abgebildet ist. Dementsprechend wurde die y-Achsenbeschriftung mit dem Befehl ylab="Wahrscheinlichkeitsdichte" angepasst.
Ich bin hier unkreativ und vergebe lediglich TITEL als Titel. Der Befehl heißt dann main="TITEL". Auch hier ist auf die Anführungszeichen zu achten. Das Argument wird mit einem Komma einfach an den bisherigen Code angehängt. plot(data_xls$Gewicht, data_xls$Größe, xlab = "Alter", ylab = "Häufigkeit", main = "TITEL", sub = "UNTERTITEL") Größe der Beschriftungen ändern Die Größe der Achsenbeschriftung kann ebenfalls angepasst werden. Mit dem Argument werden die Achsenwerte in ihrer Größe verändert. Das Argument sorgt für eine andere Größe der y-Achsenbeschriftung, für eine andere Größe der x-Achsenbeschriftung. ist für den Titel und für den Untertitel verantwortlich. In meinem Falle vergrößere ich die Achsenwerte und die Achsenbezeichnung des Balkendiagramms etwas mit jeweils 1. 5. Der Standardwert ist 1. Ihr könnt auch mit 0. 5 eine Verkleinerung erzielen. Der Code sieht wie folgt aus. main = "TITEL", sub = "UNTERTITEL",,,,, ) y-Achse einzeichnen Beim Betrachten des Diagramms fällt auf, dass die y-Achse nicht wirklich eingezeichnet ist.
Durch die Verwendung der Option freq=FALSE werden die Höhen der Balken des Histogramms so normiert, dass die Fläche aller Balken zusammen in Summe 1 ergibt. Dies ist notwendig, um die Kurve der Normalverteilung einzeichnen zu können, da bei einer solchen Kurve die Fläche unter der Kurve immer genau 1 beträgt. Weiterhin werden mit mean() und sd() der Mittelwert und die Standardabweichung der Werte von x berechnet. Diese werden dann als Parameter der Wahrscheinlichkeitsdichte verwendet, welche mit der Funktion dnorm gezeichnet wird. Der Teil dnorm(x, m, s) in obigem Behel steht als für die Dichte einer Normalverteilung, wobei der Mittelwert und die Standardabweichung aus den Werten der Variable x berechnet werden. Ein solches Histogramm eignet sich sehr gut, um zu prüfen ob eine metrische Variable eine Normalverteilung aufweist. Das erkennt man daran, wie gut die Balken des Histogrammes mit der eingezeichneten Normalverteilungskurve übereinstimmen. In unserem Beispiel sehen Sie in der zuletzt erzeugten Graphik, dass die Balken des Histogrammes fast die selbe Form aufweisen, wie die Kurve der Normalverteilung.
", probability=TRUE). Es lassen sich noch weitere Parameter ändern; einen Einblick kriegen wir, wenn wir uns die Dokumentation unter? hist anzeigen lassen. Plots für eine kategorische Variable Auch für kategorische Variablen haben wir verschiedene Möglichkeiten. Für Balkendiagramme benutzen wir barplot. Beispiel: barplot(1:3). Wir übergeben hier an die Funktion einen Vektor mit den Werten 1, 2, und 3. Entsprechend gibt es drei Balken mit den jeweiligen Höhen. Für ein Tortendiagramm benutzen wir pie. Beispiel: pie(c(1, 4, 5)). Diese Möglichkeiten können wir uns zunutze machen, wenn wir zum Beispiel Häufigkeiten darstellen möchten. Angenommen wir haben einen Vektor der Länge 100 mit drei verschiedenen Kategorien (z. B. Gruppen in einem Experiment), so können wir uns die Häufigkeiten auch ganz einfach darstellen lassen. Für unser Beispiel erstellen wir einen Vektor des Typs factor (siehe hier für die verschiedenen Typen eines Vektors): fact <- rep(1, 100) fact[x >= 9] <- 2 fact[x >= 12] <- 3 fact <- factor(fact, labels=c("Control", "Exp1", "Exp2")) Einfach barplot(fact) eingeben wird allerdings nicht funktionieren, da der Funktion ganz klar gesagt werden muss, was für Werte sie anzeigen soll.