Maschinelles Lernen – Streudiagramm
Streudiagramm
Ein Streudiagramm ist ein Diagramm, in dem jeder Wert im Datensatz durch einen Punkt dargestellt wird.
Das Matplotlib-Modul hat eine Methode zum Zeichnen von Streudiagrammen, es benötigt zwei Arrays gleicher Länge, eines für die Werte der x-Achse und eines für die Werte der y-Achse:
x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
Das x
Array repräsentiert das Alter jedes Autos.
Das y
Array repräsentiert die Geschwindigkeit jedes Autos.
Beispiel
Verwenden Sie die scatter()
Methode, um ein Streudiagramm zu zeichnen:
import matplotlib.pyplot as plt
x =
[5,7,8,7,2,17,2,9,4,11,12,9,6]
y =
[99,86,87,88,111,86,103,87,94,78,77,85,86]
plt.scatter(x, y)
plt.show()
Ergebnis:
Streudiagramm erklärt
Die x-Achse repräsentiert das Alter und die y-Achse repräsentiert die Geschwindigkeiten.
Was wir aus dem Diagramm ablesen können, ist, dass die beiden schnellsten Autos beide 2 Jahre alt waren und das langsamste Auto 12 Jahre alt war.
Anmerkung: Es scheint, dass je neuer das Auto ist, desto schneller fährt es, aber das könnte Zufall sein, schließlich haben wir nur 13 Autos angemeldet.
Zufällige Datenverteilungen
Beim maschinellen Lernen können die Datensätze Tausende oder sogar Millionen von Werten enthalten.
Möglicherweise haben Sie beim Testen eines Algorithmus keine Daten aus der realen Welt, Sie müssen möglicherweise zufällig generierte Werte verwenden.
Wie wir im vorherigen Kapitel gelernt haben, kann uns das NumPy-Modul dabei helfen!
Lassen Sie uns zwei Arrays erstellen, die beide mit 1000 Zufallszahlen aus einer normalen Datenverteilung gefüllt sind.
Beim ersten Array wird der Mittelwert auf 5,0 mit einer Standardabweichung von 1,0 festgelegt.
Beim zweiten Array wird der Mittelwert auf 10,0 mit einer Standardabweichung von 2,0 gesetzt:
Beispiel
Ein Streudiagramm mit 1000 Punkten:
import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0,
1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)
plt.scatter(x, y)
plt.show()
Ergebnis:
Streudiagramm erklärt
Wir können sehen, dass sich die Punkte um den Wert 5 auf der x-Achse und 10 auf der y-Achse konzentrieren.
Wir können auch sehen, dass die Streuung auf der y-Achse breiter ist als auf der x-Achse.