1. Was ist kdd Prozess
  2. Was ist CRISPR? Vergleichen sie bitte
  3. Was ist Overfitting?
  4. Was ist der One Rule Classifier?
  5. Was könnte hier ein Problem sein?
    1. Stehe auf dem Schlauch
  6. (Hilfestellung) Nehmen wir Mal an wir arbeiten mit numerischen Werten
  7. Können wir auch bei Klassifikation overfitten?
    1. Ja, Beispiel Decision Tree
  8. Wie können wir bei Decision Trees Overfitting vermeiden?
    1. Post und Prepruning erklärt
  9. Können Ensembles Overfitting verringern/vermeiden?
    1. Bagging, Boosting, Stacking (wie funktioniert das und warum das Varianz verringert)
  10. Können wir auch bei Clustering Overfitten?
  11. (Hilfestellung) Schauen wir uns Mal k-means an, wie können wir hier Overfitten?
    1. k zu groß
  12. Wie wählen wir das k?
    1. Silhouette Coefficient + Formel
  13. Was sind gute und schlechte Werte für den Silhouette Coef.?
    1. Anhand der Formel erklärt (-1 schlecht, 1 gut)
  14. Können wir bei DBSCAN overfitten?
    1. Beispiel → kommt auf die Wahl von MinPoints und Epsilon an
  15. Wie wählen wir epsilon und MinPoints?
    1. Faustregel mit MinPoints = 2*d, und Epsilon aus Plot rauslesen (Elbow). (Leider wusste ich nicht mehr wie genau der Plot entsteht)
  16. Nachfrage zur Entstehung des Plots?
    1. Wusste ich nicht
  17. Kann es vorkommen das dieser Plot kein Elbow hat, wenn ja wann ist das der Fall?
    1. Wenn die Cluster unterschiedliche Dichte haben → Daten ggf. anschauen oder Hierarchischen Ansatz wählen
  18. Zeit ist rum.