Maschinelles Lernen
Maschinelles Lernen bringt den Computer dazu, aus dem Studium von Daten und Statistiken zu lernen.
Machine Learning ist ein Schritt in Richtung Künstliche Intelligenz (KI).
Maschinelles Lernen ist ein Programm, das Daten analysiert und lernt, das Ergebnis vorherzusagen.
Wo soll man anfangen?
In diesem Tutorial gehen wir zurück auf Mathematik und Studienstatistik und wie man wichtige Zahlen anhand von Datensätzen berechnet.
Wir werden auch lernen, wie man verschiedene Python-Module verwendet, um die benötigten Antworten zu erhalten.
Und wir werden lernen, wie man Funktionen erstellt, die das Ergebnis basierend auf dem, was wir gelernt haben, vorhersagen können.
Datensatz
In der Vorstellung eines Computers ist ein Datensatz jede Sammlung von Daten. Es kann alles sein, von einem Array bis zu einer vollständigen Datenbank.
Beispiel für ein Array:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
Beispiel einer Datenbank:
Carname | Farbe | Das Alter | Geschwindigkeit | AutoPass |
BMW | rot | 5 | 99 | Y |
Volvo | Schwarz | 7 | 86 | Y |
VW | grau | 8 | 87 | n |
VW | Weiß | 7 | 88 | Y |
Ford | Weiß | 2 | 111 | Y |
VW | Weiß | 17 | 86 | Y |
Tesla | rot | 2 | 103 | Y |
BMW | Schwarz | 9 | 87 | Y |
Volvo | grau | 4 | 94 | n |
Ford | Weiß | 11 | 78 | n |
Toyota | grau | 12 | 77 | n |
VW | Weiß | 9 | 85 | n |
Toyota | Blau | 6 | 86 | Y |
Wenn wir uns das Array ansehen, können wir vermuten, dass der Durchschnittswert wahrscheinlich bei etwa 80 oder 90 liegt, und wir können auch den höchsten und den niedrigsten Wert bestimmen, aber was können wir sonst tun?
Und wenn wir uns die Datenbank ansehen, sehen wir, dass die beliebteste Farbe Weiß ist und das älteste Auto 17 Jahre alt ist, aber was wäre, wenn wir vorhersagen könnten, ob ein Auto einen AutoPass hat, nur indem wir uns die anderen Werte ansehen?
Dafür ist maschinelles Lernen da! Daten analysieren und das Ergebnis vorhersagen!
Beim maschinellen Lernen ist es üblich, mit sehr großen Datensätzen zu arbeiten. In diesem Tutorial werden wir versuchen, es so einfach wie möglich zu machen, die verschiedenen Konzepte des maschinellen Lernens zu verstehen, und wir werden mit kleinen, leicht verständlichen Datensätzen arbeiten.
Datentypen
Um Daten zu analysieren, ist es wichtig zu wissen, mit welcher Art von Daten wir es zu tun haben.
Wir können die Datentypen in drei Hauptkategorien einteilen:
- Numerisch
- Kategorisch
- Ordinal
Numerische Daten sind Zahlen und können in zwei numerische Kategorien unterteilt werden:
- Diskrete Daten
- Zahlen, die auf ganze Zahlen beschränkt sind. Beispiel: Die Anzahl der vorbeifahrenden Autos. - Kontinuierliche Daten
- Zahlen, die von unendlichem Wert sind. Beispiel: Der Preis eines Artikels oder die Größe eines Artikels
Kategoriale Daten sind Werte, die nicht miteinander gemessen werden können. Beispiel: ein Farbwert oder beliebige Ja/Nein-Werte.
Ordinale Daten sind wie kategoriale Daten, können aber aneinander gemessen werden. Beispiel: Schulnoten, wo A besser ist als B und so weiter.
Wenn Sie den Datentyp Ihrer Datenquelle kennen, wissen Sie, welche Technik Sie bei der Analyse verwenden müssen.
In den nächsten Kapiteln erfahren Sie mehr über Statistiken und die Analyse von Daten.