ID3 (algoritm)

ID3-algoritmen  är en av algoritmerna för att bygga ett beslutsträd . Designad av John R. Quinlan .  John R. Quinlan . Därefter skapade Quinlan en förbättrad version - C4.5-algoritmen .

Algoritm

  1. Ta alla oanvända funktioner och beräkna deras entropi i förhållande till testprover
  2. Välj en funktion för vilken entropin är minimal (och informationsvinsten är maximal)
  3. Gör en trädnod som innehåller denna egenskap

Algoritmen är följande:

ID3(Tabell med exempel, målfunktion, funktioner)

  1. Om alla exempel är positiva, returnera noden märkt "+".
  2. Om alla exempel är negativa, returnera noden märkt "-".
  3. Om funktionsuppsättningen är tom, returnera noden med den etikett som förekommer mest i målfunktionsvärdena i exemplen.
  4. Annat:
    1. A är den funktion som bäst klassificerar exempel (med maximal informationsnytta).
    2. Skapa en beslutsträdrot; tecknet i roten kommer att vara .
    3. För varje möjligt värde ( ):
      1. Lägg till en ny trädgren under roten med en nod med värde
      2. Välj en delmängd av exempel som har .
      3. Om delmängden av exempel är tom, lägg till en nod under denna nya gren med den etikett som förekommer mest i målfunktionens värden i exemplen.
      4. Annars, under denna nya gren, lägg till ett underträd genom att anropa rekursivt ID3( , Target Feature, Features)
  5. Returnera rot.

Litteratur