Mehr Details über Sklearn Pipelines: Elaborate Sklearn Pipelines
- Wie laden ich die Daten?
- Wie verwende ich ein Model an?
- Learn (fit) & Predict.
- Warum ist scikit learn so simple? —> Generischer aufbau: ich kann leicht das dahinterliegende Model ändern, ohne den Code zu verändern.
- Skalierung der Daten.
- Wie stelle ich die Prediction für eine Regression bildlich dar?
- Wie funktioniert KNeighborsRegressor?
- Warum ist es wichtig, das alle Daten ungefähr eine gleiche Skalierung besitzten?
- Pipeline
- ML Pipeline
- Falls preprocessing benötigt wird, ergiebt sich daraus ganz logisch, dass das was wir als Model ansehen, neu definiert werden muss. Eine sckit-learn pipeline nimmt diesen Umstand mit auf und führt auf elegante Art und Weise eine gewisse konsistents wieder ein.
- GridSearchCV
- Eine weitere Definition des Begriffs Model. Der Datensatz wird wie ein Gitter aufgespannt. Auf einen Teil der Daten wird trainiert, der Rest der daten wird verwendet um zu predicten.
- Konkrete Anwendung!!!
- Die Pipeline kann visuell erstellt werden, was sehr hilfreich sein kann.
The upcoming Scikit-learn 1.2.0 contains a new major feature:
Pipelines can finally return Pandas DataFrames 🤩
