Data Science – Was sind Daten?


Was sind Daten?

Daten sind eine Sammlung von Informationen.

Ein Zweck von Data Science besteht darin, Daten zu strukturieren, sie interpretierbar und einfach zu bearbeiten zu machen.

Daten können in zwei Gruppen eingeteilt werden:

  • Strukturierte Daten
  • Unstrukturierte Daten

Unstrukturierte Daten

Unstrukturierte Daten sind nicht organisiert. Wir müssen die Daten zu Analysezwecken organisieren.

Unstrukturierte Daten

Unstrukturierte Daten


Strukturierte Daten

Strukturierte Daten sind organisiert und einfacher zu bearbeiten.

Strukturierte Daten


Wie strukturiert man Daten?

Wir können ein Array oder eine Datenbanktabelle verwenden, um Daten zu strukturieren oder darzustellen.

Beispiel für ein Array:

[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]

Das folgende Beispiel zeigt, wie Sie ein Array in Python erstellen:

Beispiel

Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)

Es ist üblich, in Data Science mit sehr großen Datensätzen zu arbeiten.

In diesem Tutorial werden wir versuchen, es so einfach wie möglich zu machen, die Konzepte von Data Science zu verstehen. Wir werden daher mit einem kleinen Datensatz arbeiten, der leicht zu interpretieren ist.