Grundlagen Sklearn

Überblick über die Bibliothek auf calmcode.
Mehr Details über Sklearn Pipelines: Elaborate Sklearn Pipelines
- Wie laden ich die Daten?
- Wie verwende ich ein Model an?
  - Learn (fit) & Predict.
  - Warum ist scikit learn so simple? —> Generischer aufbau: ich kann leicht das dahinterliegende Model ändern, ohne den Code zu verändern.
- Skalierung der Daten.
  - Wie stelle ich die Prediction für eine Regression bildlich dar?
  - Wie funktioniert KNeighborsRegressor?
  - Warum ist es wichtig, das alle Daten ungefähr eine gleiche Skalierung besitzten?
- Pipeline
  - ML Pipeline
  - Falls preprocessing benötigt wird, ergiebt sich daraus ganz logisch, dass das was wir als Model ansehen, neu definiert werden muss. Eine sckit-learn pipeline nimmt diesen Umstand mit auf und führt auf elegante Art und Weise eine gewisse konsistents wieder ein.
- GridSearchCV
  - Eine weitere Definition des Begriffs Model. Der Datensatz wird wie ein Gitter aufgespannt. Auf einen Teil der Daten wird trainiert, der Rest der daten wird verwendet um zu predicten.
  - Konkrete Anwendung!!!
- Die Pipeline kann visuell erstellt werden, was sehr hilfreich sein kann.
The upcoming Scikit-learn 1.2.0 contains a new major feature:

Pipelines can finally return Pandas DataFrames 🤩