ANLEITUNGEN

Im Folgenden wird erläutert, welche Voraussetzungen auf Ihrem PC vorliegen müssen um den ENTER zu verwenden, wie Sie den ENTER starten und ggf. eine ausführbare Datei des Entscheidungsbaum-Erstellers erzeugen können. Im Abschnitt Funktionen wird kurz gezeigt, wie Sie den ENTER verwenden können.

Detailliertere Informationen finden Sie in den jeweils verlinkten Video-Tutorials bzw. in den entsprechenden Abschnitten des Handbuchs.

Die Software Entscheidungsbaum-Ersteller ENTER wird in Form von Python-Skripten zur Verfügung gestellt und ist deshalb problemlos unter Windows nutzbar. Eine Nutzung unter MacOS und Linux ist prinzipiell auch möglich. Allerdings wurde die Software noch nicht für diese Systeme getestet und optimiert. Damit Sie die Software Entscheidungsbaum-Ersteller ENTER ausführen können, muss auf Ihrem System lediglich Python mit dem Python-Paket Graphviz, sowie die Graphviz-Software installiert sein.

a) Installation von Graphviz:
Der ENTER benötigt für die Darstellung des Entscheidungsbaums in graphischer Form im Hintergrund eine Installation der Software Graphviz bzw. deren Bibliotheken. Diese lässt sich einfach mit Hilfe des von Graphviz zur Verfügung gestellten Installers installieren.

  1. Laden Sie sich von der Graphviz-Homepage den Installer für Ihr System herunter.
  2. Wichtig:
    Aktivieren Sie bei Ausführung des Installers die Option Add Graphviz to the system PATH

b) Installation von Python:
Nutzen Sie für die Installation von Python am besten den auf der Python-Homepage zur Verfügung gestellten Installer. Dieser richtet, neben der Installation, Python auf Ihrem System ein.

  1. Laden Sie sich den Python-Installer für Ihr System von der Python-Hompage herunter.
  2. Wichtig:
    Setzen Sie im ersten Fenster des Installers den Haken bei Add python.exe to PATH
  3. Klicken Sie dann auf „Install Now”. Dadurch wird Python installiert, die notwendigen Tools eingerichtet und Python für die Verwendung vorbereitet.

c) Installation des Python-Pakets Graphviz:
Am einfachsten lassen sich Pakete für Python mit dem Paket-Installer pip installieren. Dieser wird bei Nutzung des Installers zur Installation von Python automatisch mitinstalliert.

  1. Öffnen Sie die Kommandozeile/Eingabeaufforderung (Windows).
  2. Geben Sie dort den Befehl
    pip install graphviz
    ein und bestätigen Sie den Befehl mit der Eingabetaste. Das Paket Graphviz wird nun automatisch heruntergeladen und installiert.

Video-Tutorial Teil 01: Voraussetzungen

Der folgende Teil der Video-Tutorials zeigt, wie Sie die notwendigen Voraussetzungen auf Ihrem PC herstellen.

Im Folgenden werden zwei unterschiedliche Möglichkeiten aufgezeigt, wie der ENTER gestartet werden kann. Weitere Startmöglichkeiten finden Sie im Handbuch und Teil 2 des Video-Tutorials.

Laden Sie sich zuerst den ENTER herunter und entpacken Sie die heruntergeladene .zip-Datei.

a) Start via Doppelklick:
Doppelklicken Sie auf die Datei Starte_ENTER.py. Es öffnet sich die Oberfläche des Entscheidungsbaum-Erstellers.

Hinweis:
Wollen Sie verhindern, dass sich mit der Oberfläche des ENTERs eine Eingabeaufforderung öffnet, ändern Sie die Dateiendung .py der Datei Starte_ENTER.py zu .pyw

b) Start über die Eingabeaufforderung:
Sie können die Python-Skripte auch über den Aufruf in der Eingabeaufforderung ausführen.

  1. Öffnen Sie den entpackten Ordner.
  2. Öffnen Sie eine Konsole für den geöffneten Ordner. Rechtsklicken Sie hierfür in den Ordner und wählen In Terminal öffnen aus. Es öffnet sich eine Konsole, welche bereits den Pfad des Ordners besitzt.
    Hinweis:
    Bei älteren Windows-Versionen ist die Auswahl Im Terminal öffnen nicht verfügbar. Im Handbuch ist erklärt, wie in diesem Fall vorzugehen ist.
  3. Geben Sie in der Konsole den Befehl python Starte_ENTER.py ein und bestätigten Sie den Befehl mit der Eingabetaste. Es öffnet sich die Oberfläche des ENTERs.

Weitere Möglichkeiten den ENTER zu starten, sowie detailliertere Informationen finden Sie im Handbuch.

Erstellen einer ausführbaren Datei:

Mit Hilfe des Pakets PyInstaller (https://pyinstaller.org/en/stable/) ist es möglich aus Python-Skripten ausführbare Dateien für Windows und MacOS zu erstellen. Eine solche ausführbare Datei kann auf einem beliebigen Rechner des jeweiligen Systems ausgeführt werden, ohne dass dafür eine Installation von Python oder zusätzlicher Pakete notwendig ist, da diese in der ausführbaren Datei „gebündelt” werden. Die Installation der Graphviz-Software muss dennoch auf dem Rechner vorhanden sein, da diese nicht in der ausführbaren Datei „gebündelt” wird.
Auf dem Rechner, auf dem die ausführbare Datei erstellt wird, muss Python mit den notwendigen Paketen installiert sein.

a) Installation des PyInstallers:
Öffnen Sie eine Konsole und geben Sie dort den Befehl pip install pyinstaller ein. Bestätigen Sie den Befehl mit der Eingabetaste. Das Paket Pyinstaller wird nun automatisch heruntergeladen und installiert.

b) Erstellen einer ausführbaren .exe-Datei:

  1. Öffnen Sie die Konsole im Ordner des Entscheidungsbaum-Erstellers, d.h. in dem Ordner, in dem sich die Datei Starte_ENTER.py befindet.
  2. Geben Sie den Befehl pyinstaller --noconfirm --windowed --onefile --name ENTER_Entscheidungsbaum_Ersteller --icon Grafiken/Logo_Entscheidungsbaum.ico Starte_ENTER.py ein und bestätigen Sie den Befehl mit der Eingabetaste.
    Die Erstellung der ausführbaren Datei kann einige Minuten in Anspruch nehmen.
  3. Im Ordner des Entscheidungsbaum-Erstellers wurde automatisch ein Ordner dist erstellt, welcher die ausführbare Datei enthält.
    Kopieren Sie den Ordner Grafiken in den erstellten dist-Ordner.
  4. Doppelklick auf die .exe-Datei startet nun den Entscheidungsbaum-Ersteller.
  5. Wenn Sie die ausführbare Datei auf einem anderen Rechner nutzen wollen, kopieren Sie den dist-Ordner (mit enthaltenem Ordner Grafiken) auf den anderen Rechner. Auf diesem muss kein Python installiert sein. Lediglich die Graphviz-Software (siehe Voraussetzungen) muss installiert sein.

Weitere Informationen finden Sie im Handbuch des ENTERs.

Hinweis:
Die Lizenzen der ggf. gebündelten Dateien sind zu beachten.

Video-Tutorial Teil 02: Starten des ENTERs

Der folgende Teil der Video-Tutorials beinhaltet verschiedene Möglichkeiten den ENTER zu starten und zeigt, wie Sie eine ausführbare Datei des ENTERs erstellen können.

Hinweis:
Die im Video als Start_Entscheidungsbaum.py bezeichnete Datei entspricht der Datei Starte_ENTER.py des ENTERs ab der Version 1.3.
Verwenden Sie an den entsprechneden Stellen diesen neuen Dateinamen.

Im Folgenden werden die wichtigsten Schritte für die Hauptverwendungszwecke des ENTERs kurz erklärt. Ergänzend dazu wird das Ansehen von Teil 3 der Video-Tutorials empfohlen.
Detaillierte Informationen über alle Funktionen des ENTERs finden Sie im Handbuch des Entscheidungsbaum-Erstellers.

Erstellen eines Entscheidungsbaums:

  1. Laden Sie einen Trainingsdatensatz in den ENTER durch Klick auf den Button Öffnen. Die geladenen Trainingsdaten werden automatisch in der Ansicht Trainingsdaten angezeigt.
  2. Wählen Sie im Bereich Informationsgewinn ein Split-Kriterium aus, welches für die Berechnung des besten Attributs verwendet werden soll. Zur Verfügung stehen u.a. Fehlklassifikationen zählen, Entropie,....
  3. (Optional) Wählen Sie die von Ihnen gewünschten Hyperparameter im Bereich Hyperparameter durch Aktivierung der jeweiligen Checkbox und Eingabe des gewünschten Werts im jeweiligen Eingabefeld aus. Eine Erläuterung der zur Verfügung stehenden Hyperparameter finden Sie im Handbuch.
  4. Durch Klick auf den Button Entscheidungsbaum erstellen wird ein Entscheidungsbaum mit den von Ihnen geladenen Trainingsdaten unter Verwendung des ausgewählten Split-Kriteriums und unter Berücksichtigung von ggf. ausgewählten Hyperparametern trainiert.
    Der trainierte Entscheidungsbaum wird unter Ansicht Entscheidungsbaum angezeigt.

Testen eines Entscheidungsbaums:
Voraussetzung für das Testen ist, dass bereits ein Entscheidungsbaum trainiert ist.

  1. Durch Klick auf den Button Testmodus aktivieren wird das Testen des trainierten Entscheidungsbaums ermöglicht.
  2. Laden Sie in der Ansicht Testphase die Testdaten durch Klick auf den Button Öffnen in den ENTER. Diese werden nun unter Testdaten angezeigt.
  3. Durch Klick auf den Button Ausführen werden die geladenen Testdaten mit dem trainierten Entscheidungsbaum ausgewertet und es wird jeweils das vom Baum berechnete Label mit dem Label des Testdatenpunkts verglichen. Unter Berechnete Labels werden die vom Baum berechneten Labels angezeigt.
    Stimmt das berechnete Label nicht mit dem erwarteten Label des Testdatenpunkts überein, wird der jeweilige Eintrag rot hervorgehoben.
  4. Durch Klick auf den Button Ausführen im vorherigen Schritt wurde auch die Ansicht Konfusionsmatrix und Gütemaß eingeblendet.
    In dieser Ansicht finden Sie eine übersichtliche Darstellung der Ergebnisse des Testens in Form einer Konfusionsmatrix und die Berechnung des Gütemaßes Genauigkeit.

Automatische Datenaufteilung:

  1. Laden Sie einen Datensatz, welchen Sie als Trainings- und Testdatensatz verwenden möchten, durch Klick auf den Button Öffnen in den ENTER.
  2. Geben Sie im Bereich Autom. Datenaufteilung den Prozentsatz ein, welcher für die Trainingsdaten aus dem geladenen Datensatz verwendet werden soll.
    Aktivieren Sie dann die Checkbox Anteil der Trainingsdaten in %.
    Die geladenen Daten werden nun in Trainings- und Testdaten aufgeteilt. Der auf die Trainingsdaten entfallende Teildatensatz wird direkt unter Ansicht Trainingsdaten angezeigt. Die verbleibenden Daten werden als Testdaten verwendet und in der Oberfläche des Testmodus angezeigt. Diese ist erst nach dem Training eines Baums sichtbar.
  3. Durch Klick auf den Button Entscheidungsbaum erstellen wird ein Entscheidungsbaum mit dem auf die Trainingsdaten entfallenden Anteil des geladenen Datensatzes trainiert.

Video-Tutorial Teil 03: Funktionen

Der folgende Teil der Video-Tutorials zeigt, welche Funktionen der ENTER im Detail bietet und wie Sie diese verwenden können.