Um die Model-Performance zu erhöhen, können wir 2 Dinge probieren:

Beim labeln tretten allerdings immer wieder Probleme und Herausforderungen auf. Diese werden in diesem Artikel aufgegriffen.

Siehe Google Colab file

Tools zum Labeln

OpenRefine

CleanLab

Finding BAD LABELS for TEXT CLASSIFICATION with Jupyter and Prodigy

https://youtu.be/khZ5-AN-n2Y