R Streudiagramm


Streudiagramme

Sie haben aus dem Plot-Kapitel gelernt , dass die plot()Funktion verwendet wird, um Zahlen gegeneinander zu plotten.

Ein "Streudiagramm" ist eine Art von Diagramm, das verwendet wird, um die Beziehung zwischen zwei numerischen Variablen anzuzeigen, und zeichnet einen Punkt für jede Beobachtung.

Es benötigt zwei Vektoren gleicher Länge, einen für die x-Achse (horizontal) und einen für die y-Achse (vertikal):

Beispiel

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y)

Ergebnis:

Die Beobachtung im obigen Beispiel soll das Ergebnis von 12 vorbeifahrenden Autos zeigen.

Das ist für jemanden, der das Diagramm zum ersten Mal sieht, möglicherweise nicht klar, also fügen wir eine Überschrift und verschiedene Beschriftungen hinzu, um das Streudiagramm besser zu beschreiben:

Beispiel

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y, main="Observation of Cars", xlab="Car age", ylab="Car speed")

Ergebnis:

Zur Erinnerung: Die Beobachtung im obigen Beispiel ist das Ergebnis von 12 vorbeifahrenden Autos.

Die x-Achse zeigt, wie alt das Auto ist.

Die y-Achse zeigt die Geschwindigkeit des Autos, wenn es vorbeifährt.

Gibt es Zusammenhänge zwischen den Beobachtungen?

Es scheint, dass je neuer das Auto ist, desto schneller fährt es, aber das könnte Zufall sein, schließlich haben wir nur 12 Autos angemeldet.


Plots vergleichen

Im obigen Beispiel scheint es einen Zusammenhang zwischen der Autogeschwindigkeit und dem Alter zu geben, aber was ist, wenn wir auch die Beobachtungen eines anderen Tages aufzeichnen? Wird uns das Scatterplot noch etwas sagen?

Um das Diagramm mit einem anderen Diagramm zu vergleichen, verwenden Sie die points()Funktion:

Beispiel

Zeichnen Sie zwei Diagramme auf derselben Figur:

# day one, the age and speed of 12 cars:
x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86)

# day two, the age and speed of 15 cars:
x2 <- c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12)
y2 <- c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85)

plot(x1, y1, main="Observation of Cars", xlab="Car age", ylab="Car speed", col="red", cex=2)
points(x2, y2, col="blue", cex=2)

Ergebnis:

Hinweis: Um den Unterschied des Vergleichs sehen zu können, müssen Sie den Diagrammen unterschiedliche Farben zuweisen (über den colParameter). Rot stellt die Werte von Tag 1 dar, während Blau Tag 2 darstellt. Beachten Sie, dass wir auch den cexParameter hinzugefügt haben, um die Größe der Punkte zu erhöhen.

Schlussfolgerung der Beobachtung: Durch den Vergleich der beiden Diagramme kann ich mit Sicherheit sagen, dass sie uns beide zu derselben Schlussfolgerung führen: Je neuer das Auto, desto schneller fährt es.