>> Ressourcen > Theses > Reif, Gerald: M[..] > 09. Neuronale F[..]

next up previous contents
Nächste Seite: 10. Intelligente Agenten Aufwärts: I. Der Untersuchungsbereich Vorherige Seite: 8. Neuronale Netze   Inhalt



9. Neuronale Fuzzy Systeme

In den beiden vorangegangenen Abschnitten über Fuzzy Logic und Neuronale Netze wurde einerseits ein regelbasiertes System vorgestellt, welches durch die Verwendung von linguistischen Werten einfach zu modellieren ist, und andererseits ein lernfähiges System, welches mit der Hilfe von Trainingsdaten auf seine zukünftige Aufgabe trainiert wird. Durch die Kombination von Neuronalen Netzen und der Fuzzy Logic in Neuronalen Fuzzy Systemen wird nun versucht, die Schwächen der einen Technik durch die Stärken der anderen zu kompensieren. Daher ist es zu Beginn dieses Abschnitts notwendig, die Vor- und Nachteile der Fuzzy Logic und der Neuronalen Netze zu analysieren. Eine entsprechende gegenüberstellung ist in Tabelle 9.1 zu finden. [Seraphin1994]


Tabelle: Gegenüberstellung der Vor- und Nachteile von Neuronalen Netzen und der Fuzzy Logic. [Nauck1994]
Neuronale Netze Fuzzy Logic
Vorteile
$\bullet$
Kein mathematisches Modell notwendig
$\bullet$
Kein Regelwissen notwendig
$\bullet$
Es stehen unterschiedliche Lernalgorithmen zu Verfügung
$\bullet$
Kein mathematisches Modell notwendig
$\bullet$
A-priori (Regel-)Wissen nutzbar
$\bullet$
Einfache Interpretation und Implementierung
Nachteile
$\bullet$
Black-Box Verhalten
$\bullet$
Kein Regelwissen extrahierbar
$\bullet$
Anpassung an veränderte Aufgabenstellung ist eventuell schwierig und kann eine Wiederholung des Lernvorgangs erfordern
$\bullet$
Kein A-priori Wissen9.1 verwendbar
$\bullet$
Der Lernvorgang konvergiert nicht garantiert
$\bullet$
Regelwissen muß verfügbar sein
$\bullet$
Nicht Lernfähig
$\bullet$
Keine formalen Methoden für das ,,Tuning'' bekannt
$\bullet$
Anpassung an veränderte Parameter eventuell schwierig
$\bullet$
Ein ,,Tuning''-Versuch kann erfolglos bleiben


Betrachtet man die oben angeführten Vor- und Nachteile der beiden Techniken, wird deutlich, daß eine geeignete Kombination der beiden Ansätze in der Lage ist, die Vorteile zu vereinen und Nachteile zu kompensieren. Das Hauptargument für eine Kombination der Fuzzy Logic mit Neuronalen Netzen ist deren Lernfähigkeit. Der Neuro-Fuzzy-Ansatz versucht somit die Transparenz der intuitiven Regeln von Fuzzy Systemen mit der Lernfähigkeit von Neuronalen Netzen zu vereinen. Ein daraus entstandenes System sollte in der Lage sein, linguistische Regeln und/oder Zugehörigkeitsfunktionen zu erlernen oder bestehende zu optimieren. [Nauck1994]

Bei der Kombination von Neuronalen Netzen und Fuzzy Systemen lassen sich grundsätzlich zwei Ansätze unterscheiden. In kooperativen Systemen arbeitet das Neuronale Netz gänzlich unabhängig vom Fuzzy System. Die Kopplung der beiden Techniken besteht darin, daß Parameter des Fuzzy Systems durch das Neuronale Netz bestimmt bzw. optimiert werden. Das somit erzeugte Fuzzy System arbeitet im Betrieb ohne das Neuronale Netz. In hybriden Systemen werden hingegen beide Prinzipien vereinigt. Man kann ein hybrides System sowohl als spezielles Neuronales Netz, wie in Kapitel 8 ausgeführt, als auch als konventionelles Fuzzy System, wie in Kapitel 7 vorgestellt, interpretieren. Eine Trennung der Teilsysteme der einen oder anderen Art ist nicht mehr möglich. [Kruse1997]

Mit dem Begriff ,,Neuro Fuzzy'' werden jedoch auch Systeme bezeichnet, die getrennt ein Fuzzy System und ein Neuronales Netz zur Behandlung von Teilen des Gesamtproblems enthalten; z.B. kann das Neuronale Netz jenen Teil des Problems behandeln, über den kein Regelwissen vorhanden ist, das Fuzzy System bearbeitet jenen Teil, in dem Wissen über die Zusammenhänge der Größen bekannt ist. [Kruse1997]

Nachfolgend werden kooperative und hybride Systeme näher besprochen.

9.1 Kooperative Systeme

Ein Fuzzy System ist einerseits bestimmt durch die Definition der unscharfen Mengen, das heißt der Zugehörigkeitsfunktionen die hinter den linguistischen Ausdrücken, wie z.B. ,,niedrige Temperatur'' stehen, und andererseits durch die Angabe der Regeln, die die linguistischen Begriffe miteinander verknüpfen. Sowohl die Mengen als auch die Regeln sind durch wenige Parameter beschreibbar. Ein kooperatives Neuro Fuzzy System kann nun entweder unscharfe Mengen bei festelegten Regeln lernen oder die Regeln, bei unveränderlichen unscharfen Mengen. Variiert man die unscharfen Mengen zugleich mit den Regeln, so existieren für kooperative Systeme zuviele freie Parameter. Diese komplexe Aufgabe wird erst durch die Verwendung von hybriden Systemen, die in Abschnitt 9.2 betrachtet werden, bewältigt. Es kann jedoch sinnvoll sein, zwischen beiden Lernverfahren abzuwechseln. [Kruse1997]

Lernen von unsicheren Mengen

Im Fall des Erlenens von unsicheren Mengen geht man davon aus, daß die Regeln, mit denen das System arbeitet, korrekt sind. Eine Fehlfunktion des Systems wird somit auf die nichtopimale Modellierung der Fuzzy Mengen zurückgeführt. In einer Anwendung läßt man z.B. die Regel ,,Wenn die Temperatur niedrig ist, drehe das Ventil weit auf.'' unangetastet und veranlaßt das System seine Vorstellung von dem linguistischen Begriff ,,niedrige Temperatur'' zu revidieren. Zu diesem Zweck kann man ein modifiziertes Backpropagation-Verfahren anwenden, welches Anstelle der Gewichte die Lage und Form der Zugehörigkeitsfunktion verändert. Man verwendet somit nicht explizit ein Neuronales Netz, sondern nur dessen Lernalgorithmus.

Da es sich beim Backpropagation-Verfahren, wie in Abschnitt 8.4 erläutert, um ein Gradientenverfahren handelt, muß die entstehende Fehlerfunktion am Ausgang differenzierbar sein. Aus diesem Grund dürfen für die Fuzzymengen nur differenzierbare Zugehörigkeitsfunktionen verwendet werden. Da die Dreiecks- und die Trapezfunktion diese Eigenschaft nicht erfüllen, sind sie für die Anwendung in kooperativen Neuro Fuzzy Systemen ungeeignet. An ihrer Stelle wird vorzugsweise die Gaus'sche Glockenkurve als Zugehörigkeitsfunktion verwendet. Weiters müssen die in Abschnitt 7 vorgestellten Verfahren zur Inferenz und zur Komposition durch Verfahren ersetzt werden, die die Differenzierbarkeit der Fehlerfunktion aufrecht erhalten. Daher wird anstelle der Minimumsbildung bei der Inferenz die Produktbildung verwendet. Die Maximumsbildung bei der Komposition und die anschließende Defuzzyfizierung wird durch einen Regler des Sugeno-Typs9.2 ersetzt. Bei einem Regler des Sugeno-Typs handelt es sich um eine Einheit, die direkt aus den Werten der Inferenzbildung mit der Hilfe einer Funktion einen Ausgangswert ermittelt. Eine Defuzzyfizierung ist dabei nicht mehr notwendig. [Nauck1994]

Bei Systemen, die die Fuzzy Mengen durch Lernen bestimmen, muß darauf geachtet werden, daß die wichtigsten Eigenschaften von Fuzzy Systemen, die Transparenz und Interpretierbarkeit, durch den Lernprozeß nicht beeinträchtigt werden. Es muß z.B. darauf geachtet werden, daß zwei Regeln in denen der linguistische Ausdruck ,,niedrige Temperatur'' vorkommt, die entsprechenden Zugehörigkeitsfunktionen nicht unabhängig voneinander verändern und somit unterschiedlich interpretieren. Weiters muß darauf geachtet werden, daß die Fuzzy Menge für den Ausdruck ,,niedrige Temperatur'' nicht in einen Bereich verschoben wird, den man umgangssprachlich als heiß bezeichnen würde. Dies würde der ursprünglichen Intuition bei der Erstellung der Regeln widersprechen. Dies kann durch eine geeignete Beschränkung des erlaubten Variationsbereichs erfolgen. [Kruse1997]

Lernen von Regeln

Bei der Strategie des Erlernens von Regeln bei vorgegebenen unscharfen Mengen wird dem zu trainierendem System eine große Anzahl von Trainingsbeispielen vorgelegt. Für das oben verwendete Beispiel der Heizungsregelung wären das Paare aus Temperaturwerten und der daraufhin gewählten Stellung des Heizkörperventils. Dies kann auch interpretiert werden, als würde das System einem erfahrenem Bediener bei seiner Arbeit beobachten. Während der Lernphase wird nicht das eigentliche Fuzzy System modifiziert, sondern ein Neuronales Netz trainiert. Im Verlauf des Lernprozesses kristallisieren sich gewisse Regelmäßigkeiten im Verhalten des Bedieners heraus. So wird sich z.B ein Neuron auf die Erkennung der Kombination von niedriger Temperatur und weit offenem Heizungsventil spezialisieren, falls diese Kombination oft genug in den Trainingsdaten vorkommt.

Erst nach dem Abschluß der Lernprozesses werden in einem gesonderten Rechenschritt die gefundenen Regelmäßigkeiten mit Hilfe der vorgegebenen unscharfen Mengen in Regeln ausgedrückt. Auf diesem Weg wird für ein System ohne Vorwissen eine Regelbasis gewonnen. Aus der Beobachtung des Systems ,,Wenn $X$ vorliegt, dann stellt der Bediener $Y$ ein.'' wird nach der Umsetzung auf die unscharfen Mengen die Regel ,,Wenn $X$ vorliegt, stelle $Y$ ein.''. [Kruse1997]

Die oben beschriebenen Systeme lernen vor dem eigentlichen Betrieb. Man spricht auch von Offline Systemen. Das resultierende Fuzzy System gelangt erst zum Einsatz, wenn der Lernprozeß bereits abgeschlossen ist. Ein Online System lernt hingegen während des laufenden Betriebs. Zu Beginn wird ein solches Online System mit einer Regelbasis ausgestattet, in der grob entworfene Fuzzy Mengen miteinander verknüpft werden. Während das System arbeitet wird nun seine Leistung bewertet. Weicht die Ausgabe erheblich vom gewünschten Wert ab, so wird eine Fehlerkorrektur notwendig. Diese kann z.B. mit der Hilfe eines modifizierten Backpropagation Algorithmus erfolgen. Die Fehlerkorrektur kann sich dabei entweder auf die unscharfen Mengen oder auf die Regeln auswirken.

Ein Online System ist grundsätzlich nur in Fällen anwendbar, in denen ein Versagen des Systems keinen großen Schaden anrichten kann. So darf z.B. eine Regelung für einen Kühlraum nie eine Temperatur von $+20^\circ$ C zulassen, um erst beim Auftreten dieser Situation eine Regel für diesen Systemzustand zu lernen. Als Lösung dieses Problems kann man ein System vor dem Einsatz mit Hilfe einer Simulation lernen lassen.

Der Vorteil von Online Systemen ist, daß sie in der Lage sind, während des Betriebs weiter zu lernen. Dadurch können sie sich auf Änderungen in ihrer Aufgabenstellung anpassen. Bei solchen Online Systemen wird das Neuronale Netz, bzw. der neuronale Lernalgorithmus nicht nach dem Abschluß des Trainings entfernt. [Kruse1997]


9.2 Hybride Systeme

In hybriden Neuro Fuzzy Systemen sind die Eigenschaften der Fuzzy Logic und der Neuronalen Netze untrennbar vereint. Zu den wesentlichen Eigenschaften dieses Ansatzes zählen:

  • Wissen wird in transparenten Regeln gespeichert
  • Die Verwendung von Linguistische Ausdrücke
  • Die Lernfähigkeit
Vereint werden diese Eigenschaften im formalen Modell des Fuzzy-Perzeptrons. Das Fuzzy-Perzeptron ist ähnlich einem zweischichtigen Multi Layer Perzeptron aufgebaut. Dabei macht man sich zunutze, daß die Abarbeitung innerhalb eines Fuzzy Systems in zwei Schritten erfolgt. Im Ersten Schritt werden die Regeln ausgewertet (Inferenz), im zweiten Schritt erfolgt die Vereinigung dieser Auswertung (Komposition). Jeder dieser Schritte besteht dabei aus einer Anzahl getrennt ausführbarer Einzelaktionen. Diese Einzelaktionen können parallel in einem modifizieren Neuron abgearbeitet werden, sofern die Verbindungen entsprechend der des Fuzzy Systems geknüpft sind. [Seraphin1994]

Das Fuzzy-Perzeptron ist, wie oben bereits erwähnt, von einem zweischichtigen Multi Layer Perzeptron abgeleitet. Anstelle der Gewichte der einzelnen Verbindungen treten beim Fuzzy-Perzeptron die unscharfen Mengen. Anstelle der gewichteten Summe und der Aktivierungsfunktion tritt bei den Neuronen in der inneren Schicht die Fuzzyfizierung und die Inferenz, bei den Neuronen in der Ausgangsschicht die Komposition und die Defuzzyfizierung. Ein solches Fuzzy-Perzeptron ist in Abbildung 9.1 dargestellt.

Damit ein solches Modell immer eindeutig als Fuzzy System interpretiert werden kann, müssen ähnliche Einschränkungen wie bei kooperativen Systemen getroffen werden. So muß darauf geachtet werden, daß sich die unscharfen Mengen nicht in einem Bereich verschieben, der nicht mehr der Interpretation des linguistischen Wertes entspricht. Weiters stellt man durch Kopplung von Verbindungen sicher, daß sich anfangs gleiche unscharfe Mengen, während des Lernprozesses, nicht unterschiedlich entwickeln. Diese Kopplung ist in Abbildung 9.1 durch Ringe um die gekoppelten Verbindungen dargestellt. [Nauck1994]

Der Lernalgorithmus zur Anpassung der Fuzzy-Mengen beruht auf einer Variation des Backpropagation Algorithmus. Bei dem an der Otto-von-Guericke-Universität Magdeburg entwickelten NEFCON-Modell (Neuro Fuzzy Control) wird der Fehler am Ausgang des Systems nicht durch einen konkreten Wert beschrieben, sondern durch eine unscharfe Menge. Dadurch erhält der Benutzer die Freiheit, nicht nur die Regeln umgangssprachlich auszudrücken, sondern auch das Ziel des Systems. Dies kommt vielen Anwendungsfällen in der Realität entgegen. So es ist z.B. nicht notwendig, daß die Regelung einer Raumheizung die Temperatur auf ein Zehntel Grad genau auf $22^\circ$ C hält. Als Ziel des Systems genügt die Formulierung ,,Wenn die Temperatur angenehm ist, dann ist die Leistung des Systems hoch (und somit der Fehler gering).'' Der linguistische Wert ,,angenehme Temperatur'' wird dabei durch eine Fuzzy Menge beschrieben. Das System wertet diese Regel wie alle anderen aus und zieht das Ergebnis zur Korrektur der Fuzzy Mengen heran.

Für das Erlernen der Fuzzy Regeln stehen zwei Methoden zur Verfügung: Man beginnt ohne Regeln und fügt eine Regel nach der anderen hinzu bis das System eine zufriedenstellende Leistung erbringt, oder man beginnt mit einer Basis aus allen möglichen erzeugbaren Regeln und streicht nicht benötigte nacheinander wieder heraus. Die erste der oben angeführten Methoden ist weniger aufwendig, jedoch nicht für das online-lernen anwendbar, da ein solches System zu Beginn der Lernphase nur durch Raten die einzufügende Regel bestimmen kann um die Regelbasis in weiterer Folge langwierig nachzubessern.

Die Zweite Methode ist für online lernende Modelle geeignet. Die Komplexität eines solchen Systems steigt jedoch rasch mit der Anzahl der Ein- und Ausgangsvariablen und der Anzahl der Fuzzy Mengen, da für jede Kombination eine Regel generiert werden muß. Für ein Beispiel mit zwei Eingangsvariablen, einer Ausgangsvariable und einer Fuzzy Partitionierung von je acht Fuzzy Mengen zu jeder Variable existieren bereits 512 mögliche Regeln. Erhöht man die Zahl der Eingangsvariablen auf vier, so sind es bereits 32.768 Regeln. Die Komplexität des Systems steigt somit exponentiell mit der Anzahl der Freiheitsgrade. Daraus ist ersichtlich, daß die Regelbasis nur für kleine Systeme vollständig erlernbar ist. In vielen Fällen lassen sich jedoch für einen Teil des Problems Regeln angeben, sodaß nur die fehlenden Regeln hinzugelernt werden müssen. [Kruse1997]

Die Vorgänge während des Lernvorganges eines hybriden Neuro Fuzzy Systems, welches mit einer Basis aus allen möglichen erzeugbaren Regeln startet, soll an dieser Stelle mit Hilfe des Beispiels der Heizungsregelung erläutert werden. Im ersten Schritt wird durch die Definition der Fuzzy Mengen festgelegt, welche Temperaturen man als angenehm empfindet. Dies kann z.B. durch die Einteilung der Temperaturskala in die linguistischen Werte ,,zu niedrig'', ,,angenehm'' und ,,zu hoch'' erfolgen. Anschließend formuliert man das Ziel des Systems, die Raumtemperatur im angenehmen Bereich zu halten.

Da das System zu Beginn des Lernprozesses noch keine Informationen über die korrekte Vorgehensweise besitzt, wird man anfangs eine ,,chaotische'' Heizperiode überstehen müssen, in der das System herauszufinden versucht, welche Fuzzy Regeln für eine angenehme Raumtemperatur relevant sind. In dieser Phase überprüft das System zu welchem Grad die aktuelle Raumtemperatur mit der vorgegebenen Vorstellung einer angenehmen Temperatur übereinstimmt. Besteht keine ausreichend große Übereinstimmung, so weiß das System, daß es sich in einem Fehlzustand befindet und bewertet jene Regeln schlecht, die zu diesem Zustand geführt haben. Entspricht die Temperatur jedoch der Vorstellung von ,,angenehm'', so werden die dafür verantwortlichen Regeln als gut bewertet. Nach einer Weile hat das System durch Probieren und Bewerten selbständig eine Regelbasis für das Problem gefunden. In einem weiteren Schritt kann nun noch eine Optimierung des Systems durch eine Anpassung der Fuzzy Mengen erfolgen. Dies erfolgt, wie oben angeführt, mit der Hilfe eines modifizierten Backpropagation Algorithmus. [Kruse1997]

Nach dem Abschluß der Lernphase kann man sich die Regeln und die Fuzzy Mengen anzeigen lassen und auf ihre Plausibilität hin überprüfen. Man erhält somit nicht nur eine Lösung des Problems, sondern auch Wissen über die Gesetzmäßigkeiten der Lösung. Ein hybrides Neuro Fuzzy System kann somit auch zum Wissenserwerb eingesetzt werden. Dabei entwickelt das System, ähnlich dem Problemlösungsverhalten des Menschen, durch Vorgabe eines Ziels und durch die Beobachtung des Prozeßverlaufs eine geeignete Vorgehensweise. Die Möglichkeiten des Wissenserwebs mit der Hilfe von hybriden Neuro Fuzzy Systemen sind jedoch auf kleine, eingegrenzte Probleme beschränkt, da für größere Probleme die Komplexität exponentiell anwächst. [Kruse1997]


next up previous contents
Nächste Seite: 10. Intelligente Agenten Aufwärts: I. Der Untersuchungsbereich Vorherige Seite: 8. Neuronale Netze   Inhalt
Gerald Reif
2000-02-01