Python -Tutorial

Python-HOME Python-Einführung Python-Erste Schritte Python-Syntax Python-Kommentare Python-Variablen Python-Datentypen Python-Zahlen Python-Casting Python-Strings Python-Booleans Python-Operatoren Python-Listen Python-Tupel Python-Sets Python-Wörterbücher Python Wenn ... Sonst Python-While-Schleifen Python-For-Schleifen Python-Funktionen Python-Lambda Python-Arrays Python-Klassen/Objekte Python-Vererbung Python-Iteratoren Python-Bereich Python-Module Python-Daten Python-Mathematik Python-JSON Python-RegEx Python-PIP Python Versuchen ... Außer Python-Benutzereingabe Formatierung von Python-Strings

Umgang mit Dateien

Umgang mit Python-Dateien Python-Dateien lesen Python-Dateien schreiben/erstellen Python-Dateien löschen

Python-Module

NumPy-Tutorial Panda-Komplettlösung Scipy-Tutorial

Python-Matplotlib

Matplotlib-Einführung Matplotlib loslegen Matplotlib-Pyplot Matplotlib-Plotten Matplotlib-Marker Matplotlib-Linie Matplotlib-Labels Matplotlib-Raster Matplotlib-Subplots Matplotlib-Scatter Matplotlib-Bars Matplotlib-Histogramme Matplotlib-Kreisdiagramme

Maschinelles Lernen

Einstieg Mittlerer Medianmodus Standardabweichung Perzentil Datenverteilung Normale Datenverteilung Streudiagramm Lineare Regression Polynomiale Regression Mehrfache Regression Skala Trainieren/Testen Entscheidungsbaum

Python-MySQL

MySQL-erste Schritte MySQL-Datenbank erstellen MySQL-Tabelle erstellen MySQL-Einfügung MySQL-Auswahl MySQL-Wo MySQL-Reihenfolge nach MySQL löschen MySQL-Drop-Tabelle MySQL-Update MySQL-Limit MySQL-Beitritt

Python-MongoDB

Beginnen Sie mit MongoDB MongoDB Datenbank erstellen MongoDB-Create-Sammlung MongoDB-Einfügung MongoDB-Suche MongoDB-Abfrage MongoDB-Sortierung MongoDB löschen MongoDB-Drop-Sammlung MongoDB-Update MongoDB-Limit

Python-Referenz

Python-Übersicht Eingebaute Python-Funktionen Python-String-Methoden Python-Listenmethoden Methoden des Python-Wörterbuchs Python-Tupelmethoden Python-Set-Methoden Python-Dateimethoden Python-Schlüsselwörter Python-Ausnahmen Python-Glossar

Modulreferenz

Zufallsmodul Anforderungsmodul Statistikmodul Mathe-Modul cMath-Modul

Python-Anleitung

Listenduplikate entfernen Einen String umkehren Fügen Sie zwei Zahlen hinzu

Python-Beispiele

Python-Beispiele Python-Compiler Python-Übungen Python-Quiz Python-Zertifikat

Maschinelles Lernen – Streudiagramm


Streudiagramm

Ein Streudiagramm ist ein Diagramm, in dem jeder Wert im Datensatz durch einen Punkt dargestellt wird.

Das Matplotlib-Modul hat eine Methode zum Zeichnen von Streudiagrammen, es benötigt zwei Arrays gleicher Länge, eines für die Werte der x-Achse und eines für die Werte der y-Achse:

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]

y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

Das xArray repräsentiert das Alter jedes Autos.

Das yArray repräsentiert die Geschwindigkeit jedes Autos.

Beispiel

Verwenden Sie die scatter()Methode, um ein Streudiagramm zu zeichnen:

import matplotlib.pyplot as plt

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

plt.scatter(x, y)
plt.show()

Ergebnis:

Streudiagramm erklärt

Die x-Achse repräsentiert das Alter und die y-Achse repräsentiert die Geschwindigkeiten.

Was wir aus dem Diagramm ablesen können, ist, dass die beiden schnellsten Autos beide 2 Jahre alt waren und das langsamste Auto 12 Jahre alt war.

Anmerkung: Es scheint, dass je neuer das Auto ist, desto schneller fährt es, aber das könnte Zufall sein, schließlich haben wir nur 13 Autos angemeldet.



Zufällige Datenverteilungen

Beim maschinellen Lernen können die Datensätze Tausende oder sogar Millionen von Werten enthalten.

Möglicherweise haben Sie beim Testen eines Algorithmus keine Daten aus der realen Welt, Sie müssen möglicherweise zufällig generierte Werte verwenden.

Wie wir im vorherigen Kapitel gelernt haben, kann uns das NumPy-Modul dabei helfen!

Lassen Sie uns zwei Arrays erstellen, die beide mit 1000 Zufallszahlen aus einer normalen Datenverteilung gefüllt sind.

Beim ersten Array wird der Mittelwert auf 5,0 mit einer Standardabweichung von 1,0 festgelegt.

Beim zweiten Array wird der Mittelwert auf 10,0 mit einer Standardabweichung von 2,0 gesetzt:

Beispiel

Ein Streudiagramm mit 1000 Punkten:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)

plt.scatter(x, y)
plt.show()

Ergebnis:

Streudiagramm erklärt

Wir können sehen, dass sich die Punkte um den Wert 5 auf der x-Achse und 10 auf der y-Achse konzentrieren.

Wir können auch sehen, dass die Streuung auf der y-Achse breiter ist als auf der x-Achse.