Maschinelles Lernen – mittlerer Medianmodus
Mittelwert, Median und Modus
Was können wir lernen, wenn wir eine Gruppe von Zahlen betrachten?
Beim maschinellen Lernen (und in der Mathematik) gibt es oft drei Werte, die uns interessieren:
- Mittelwert - Der Durchschnittswert
- Median – Der Mittelpunktwert
- Modus - Der häufigste Wert
Beispiel: Wir haben die Geschwindigkeit von 13 Autos registriert:
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
Was ist der durchschnittliche, der mittlere oder der häufigste Geschwindigkeitswert?
Bedeuten
Der Mittelwert ist der Durchschnittswert.
Um den Mittelwert zu berechnen, finden Sie die Summe aller Werte und dividieren Sie die Summe durch die Anzahl der Werte:
(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 =
89.77
Das NumPy-Modul hat dafür eine Methode. Lernen Sie das NumPy-Modul in unserem NumPy-Tutorial kennen .
Beispiel
Verwenden Sie die NumPy mean()
-Methode, um die Durchschnittsgeschwindigkeit zu ermitteln:
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)
Median
Der Medianwert ist der Wert in der Mitte, nachdem Sie alle Werte sortiert haben:
77, 78, 85, 86, 86, 86,
87
, 87, 88, 94, 99, 103, 111
Es ist wichtig, dass die Zahlen sortiert werden, bevor Sie den Median finden können.
Das NumPy-Modul hat dafür eine Methode:
Beispiel
Verwenden Sie die NumPy- median()
Methode, um den mittleren Wert zu finden:
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
Wenn es zwei Zahlen in der Mitte gibt, teilen Sie die Summe dieser Zahlen durch zwei.
77, 78, 85, 86, 86,
86, 87
,
87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5
Beispiel
Verwenden des NumPy-Moduls:
import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
Modus
Der Mode-Wert ist der Wert, der am häufigsten vorkommt:
99,
86
, 87, 88, 111,
86
, 103, 87, 94, 78, 77, 85,
86
= 86
Das SciPy-Modul hat dafür eine Methode. Erfahren Sie mehr über das SciPy-Modul in unserem SciPy-Tutorial .
Beispiel
Verwenden Sie die SciPy- mode()
Methode, um die Nummer zu finden, die am häufigsten vorkommt:
from scipy import stats
speed =
[99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)
Kapitelzusammenfassung
Mittelwert, Median und Modus sind Techniken, die häufig beim maschinellen Lernen verwendet werden, daher ist es wichtig, das Konzept dahinter zu verstehen.