Kurt Reinschke Lineare Regelungs- und Steuerungstheorie
Kurt Reinschke
Lineare Regelungsund Steuerungstheorie · Modellierung von Regelstrecken · Robuste Stabilität und Entwurf robuster Regler · Trajektoriensteuerung mit Folgeregelung · Polynomiale Beschreibung von MIMO-Systemen · Zeitdiskrete und Abtastregelkreise
Mit 155 Abbildungen und 104 Beispielen
123
Professor Dr. Kurt Reinschke Technische Universität Dresden Institut für Regelungs- und Steuerungstheorie 01062 Dresden Deutschland
[email protected]
Bibliografische Information der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.ddb.de abrufbar.
ISBN-10 3-540-21886-6 1. Aufl. Springer Berlin Heidelberg New York ISBN-13 978-3-540-21886-9 1. Aufl. Springer Berlin Heidelberg New York Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Springer ist ein Unternehmen von Springer Science+Business Media springer.de © Springer-Verlag Berlin Heidelberg 2006 Printed in Germany Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, daß solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Sollte in diesem Werk direkt oder indirekt auf Gesetze, Vorschriften oder Richtlinien (z. B. DIN, VDI, VDE) Bezug genommen oder aus ihnen zitiert worden sein, so kann der Verlag keine Gewähr für die Richtigkeit, Vollständigkeit oder Aktualität übernehmen. Es empfiehlt sich, gegebenenfalls für die eigenen Arbeiten die vollständigen Vorschriften oder Richtlinien in der jeweils gültigen Fassung hinzuziehen. Satz: Digitale Druckvorlage des Autors Herstellung: LE-TEX Jelonek, Schmidt & Vöckler GbR, Leipzig Umschlaggestaltung: medionet AG, Berlin Gedruckt auf säurefreiem Papier 7/3142/YL - 5 4 3 2 1 0
Meiner lieben Frau Gertrud in Dankbarkeit
Juvat integros accedere fontes, Atque haurire: juvatque novos decerpere flores. Lucretius, DE RERUM NATURA
Vorwort
Das Bildungswesen in Deutschland befindet sich im Umbruch. Die forcierte Einf¨ uhrung gestufter Studieng¨ ange, in der Regel als Bachelor-, Master- und Promotionsstudieng¨ ange ausgewiesen, stellt neue Anforderungen an die Lehrund Forschungsmaterialien. Dieses Buch wendet sich an Leser, die eine praxisund anwendungsbezogene Einf¨ uhrung in die Steuerungs- und Regelungstechnik w¨ ahrend des Grund- oder Bachelorstudiums erfolgreich absolviert haben und nun danach streben, tiefer in die Gesetzm¨aßigkeiten und Methoden der linearen Regelungs- und Steuerungstheorie einzudringen. Eine ausreichende mathematische Vorbildung auf dem Niveau des universit¨aren Vordiploms in einer natur- oder ingenieurwissenschaftlichen Fachrichtung wird vorausgesetzt ¨ Der Ubergang von der regelungstechnischen Fachkunde zur Regelungsund Steuerungstheorie als einer mathematisierten Wissenschaft vollzog sich in der zweiten H¨alfte des 20. Jahrhunderts. Die f¨ ur die Regelungs- und Steuerungstechnik relevanten Innovationssch¨ ube basierten stets auf der Schaffung und Nutzbarmachung neuer Klassen mathematischer Modelle. Viele Details der regelungstechnischen Kunstfertigkeit einer fr¨ uheren Generation von Ingenieuren verloren dabei an Bedeutung, weil sie in den Fr¨ uchten eines wissenschaftlich anspruchsvolleren Zugangs in verallgemeinerter Form aufgehoben sind. Durch eine dementsprechende modernere Ausbildung fallen sie der n¨ achsten Generation gewissermaßen von selbst zu. Eine solche neue Ausbildungsgrundlage f¨ ur Master- und Promotionsstudenten bietet das vorliegende Buch. Die Stoffauswahl kann dem Inhaltsverzeichnis entnommen werden. Sie ist unkonventionell und unterscheidet sich in Inhalt und Darstellungsweise relativ stark von den Lehrb¨ uchern, die im deutschen Sprachraum verbreitet sind. Die einzelnen Kapitel beginnen jeweils mit einer Einf¨ uhrung, in der der Inhalt des Kapitels kommentiert wird. Jedem Leser wird empfohlen, sich diese Einf¨ uhrungen zuerst vorzunehmen, um nach den individuellen Vorkenntnissen und Interessenlagen zu entscheiden, welche Abschnitte er u agt und welche er liest. ¨ berschl¨
VIII
Vorwort
Viele Kernaussagen sind in der Form eines Satzes“ (in Kursivschrift) mit ” anschließendem f¨ ormlichen Beweis“ formuliert worden. Jeder Beweis endet ” mit dem K¨ urzel qed. Um das anwendungsbezogene Verst¨ andnis zu erleichtern, wurden zahlreiche Beispiele zur Illustration der allgemeinen Tatbest¨ande eingef¨ ugt. Die Beispiele wurden im Kleindruck gesetzt und enden mit der Marke . Das Buch ist aus Pflicht- und Wahlvorlesungen entstanden, die ich an der TU Dresden f¨ ur Studenten der Diplom-Studieng¨ange Elektrotechnik, Mechatronik und Informationssystemtechnik – beginnend jeweils nach dem Vordiplom – sowie der entsprechenden Masterstudieng¨ange gehalten habe. Zum Schreiben des Buches ermuntert haben mich einige Fachkollegen – genannt seinen Prof. P.C. M¨ uller, Wuppertal, Prof. A. Kugi, Saarbr¨ ucken, und Prof. F. Svaricek, M¨ unchen – und mein Sohn Johannes, u ¨ ber den ich einen Einblick in die Gestaltung und das Niveau eines Promotionsstudiums f¨ ur Ingenieure an der Universit¨ at Cambridge, U.K., bekam. Bekanntlich gab es ein solches Promotionsstudium bisher in Deutschland nicht. Inspirieren ließ ich mich auch von Lehrkonzepten f¨ ur das Graduiertenstudium, die sich an anderen international f¨ uhrenden Forschungs- und Lehrst¨atten bew¨ahrt haben. Diskussionen mit Herrn Prof. M. Zeitz, Stuttgart, und meinem habilitierten Mitarbeiter, Herrn Dr. J. Rudolph, regten mich zur Sch¨arfung einiger Begriffe und Bezeichnungen an. Bei der Niederschrift und bei der Gestaltung des Buchmanuskripts haben mich mehrere Diplomanden und wissenschaftliche Mitarbeiter tatkr¨aftig unterst¨ utzt. Daf¨ ur m¨ ochte ich den Herren Dipl.-Ing. S.-O. Lindert, Dr. U. Potthoff, Dipl.-Ing. O. Fritsche, Dr. K. R¨ obenack, Dipl.-Ing. A. Fischer und cand.ing. C. Collon herzlich danken. Mein Kollege, Herr HS-Dozent Dr.-Ing. Helmut Buchta, der viele Jahre hindurch die Lehre im Hauptstudium an der TU Dresden wesentlich mitgestaltete, hat alle Abschnitte des Buches, manche in mehreren Fassungen, mit gr¨ oßter Sorgfalt durchgesehen und mich auf viele gr¨oßere und kleinere Unzul¨ anglichkeiten hingewiesen. F¨ ur dieses außerordentliche Engagement und zeitliche Opfer schulde ich Herrn Dr. Buchta gr¨oßten Dank. Schließlich danke ich dem Springer-Verlag f¨ ur die freundliche Zusammenarbeit und Geduld.
Dresden, Juni 2005
Kurt Reinschke
Inhaltsverzeichnis
1
2
Einf¨ uhrung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Historische Entwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Beschreibung des Steuerungs- und Regelungsproblems . . . . . . . 1.3 Die regelungstechnische Wirkungsplan-Darstellung . . . . . . . . . . 1.4 Vorbetrachtungen zur quantitativen Behandlung gesteuerter Prozesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1 Auswirkungen von Signalbegrenzungen . . . . . . . . . . . . . . 1.4.2 Linearisierung um Gleichgewichtslagen und Kleinsignal“–Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . ” 1.4.3 Zur Modellgenauigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mathematische Beschreibung von Signalen und ¨ Ubertragungssystemen ................................... 2.1 Einf¨ uhrung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Spektraldarstellung reellwertiger Signale . . . . . . . . . . . . . . . . . . . 2.2.1 Periodische Signale und ihre Fourier -Reihen . . . . . . . . . 2.2.2 Nichtperiodische Signale und ihre Spektralfunktionen . 2.2.3 Von der Fourier - zur einseitigen Laplace-Transformation ¨ 2.3 Eigenschaften von Ubertragungssystemen .................. 2.3.1 Linearit¨ at . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Zeitinvarianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Kausalit¨ at . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ 2.3.4 LTI-Ubertragungssysteme ......................... 2.4 Darstellungsformen von LTI-Systemen . . . . . . . . . . . . . . . . . . . . ¨ ¨ 2.4.1 Ubertragungsfunktionen und Ubertragungsmatrizen .. ¨ 2.4.2 Berechnung von Ubertragungsmatrizen f¨ ur Systeme in Deskriptor-Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ 2.4.3 Gewichtsfunktion, Ubergangsfunktion und Frequenzgangdarstellungen . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Extremalprinzipien und Bewegungsgleichungen . . . . . . . . . . . . . 2.5.1 Vorbemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 1 7 9 13 13 23 31
39 39 41 41 43 48 50 52 53 54 55 55 55 57 60 64 64
X
Inhaltsverzeichnis
2.5.2 Variationsproblem und Euler sche Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.3 Bewegungsgleichungen mechanischer Systeme . . . . . . . . 2.5.4 Lagrangescher und Hamiltonscher Formalismus, Erhaltungss¨ atze und Phasenraum . . . . . . . . . . . . . . . . . . 2.5.5 Bewegungsgleichungen unter Nebenbedingungen . . . . . . 2.5.6 Variationsaufgaben unter Nebenbedingungen . . . . . . . . .
65 69 82 91 99
3
¨ Stabilit¨ at rationaler Ubertragungsfunktionen . . . . . . . . . . . . . 103 3.1 Einf¨ uhrung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 3.2 Definition der Stabilit¨ at f¨ ur lineare zeitinvariante SISO¨ ¨ Ubertragungsglieder mit rationaler Ubertragungsfunktion . . . . 108 3.3 Ermittlung des gr¨ oßten gemeinsamen Teilers zweier Polynome 110 3.3.1 Euklid ischer Algorithmus und B´ezout sche Identit¨at . . . 110 3.3.2 Anzahl der gemeinsamen Nullstellen zweier Polynome . 112 3.3.3 Anzahl und Lage der reellen Nullstellen eines Polynoms 116 3.4 Stabilit¨ atsuntersuchungen nach E. J. Routh . . . . . . . . . . . . . . . . 118 3.4.1 Herleitung des Routhschen Algorithmus . . . . . . . . . . . . . 119 3.4.2 Erweiterung des Routhschen Algorithmus auf nichtregul¨ are F¨ alle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 3.5 Folgerungen aus den Routhschen Stabilit¨atsuntersuchungen . . 132 3.5.1 Erg¨ anzungshinweise zur praktischen Anwendung . . . . . 132 3.5.2 Das Determinantenkriterium von A. Hurwitz, die Erkenntnisse von Li`enard-Chipart und die Formel von Orlando . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 3.5.3 Die Stabilit¨ atskriterien von Michailov, LeonhardCremer und Hermite-Biehler . . . . . . . . . . . . . . . . . . . . . . 149 3.6 Stabilit¨ at von Polynomen mit unbestimmten Koeffizienten . . . 153 3.6.1 Stabilit¨ at von Intervallpolynomen: Kriterium von Charitonov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 3.6.2 Stabilit¨ at von Polynomen mit parameterabh¨angigen Koeffizienten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
4
Grundkonzepte der linearen Regelungstheorie . . . . . . . . . . . . 169 4.1 Einf¨ uhrung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 4.2 Wohldefiniertheit und Stabilit¨ at des geregelten Systems . . . . . 172 4.3 Charakteristisches Polynom des Standardregelkreises . . . . . . . . 173 4.4 Stabilit¨ atskriterium von Strecker-Nyquist . . . . . . . . . . . . . . . . . . 174 4.4.1 Erinnerung an die Funktionentheorie . . . . . . . . . . . . . . . . 175 4.4.2 Anwendung f¨ ur den SISO-Standardregelkreis . . . . . . . . . 176 4.4.3 Nutzung des Strecker-Nyquist-Kriteriums in der regelungstechnischen Praxis . . . . . . . . . . . . . . . . . . . . . . . . 182 4.4.4 Maße f¨ ur Stabilit¨ atsreserven im SISO-Standardregelkreis183 4.5 SISO-Standardregelkreis mit PID-Reglern . . . . . . . . . . . . . . . . . 185 4.5.1 Berechnung aller stabilisierenden P-Regler . . . . . . . . . . . 185
Inhaltsverzeichnis
4.5.2 Berechnung aller stabilisierenden PI-Regler und PD-Regler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.3 Berechnung aller stabilisierenden PID-Regler . . . . . . . . . 4.6 Regelg¨ ute eines SISO-Standardregelkreises . . . . . . . . . . . . . . . . . 4.6.1 Forderungen an die station¨ are Genauigkeit . . . . . . . . . . 4.6.2 Forderungen an das Einschwingverhalten . . . . . . . . . . . . 4.6.3 Forderungen im Frequenzbereich . . . . . . . . . . . . . . . . . . . 4.7 Stabilit¨at und Regelg¨ ute bei Unbestimmtheiten der Regelstrecke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7.1 Strukturierte Unbestimmtheiten und Empfindlichkeitsfunktionen . . . . . . . . . . . . . . . . . . . . . . . . 4.7.2 Mathematische Erfassung unstrukturierter Unbestimmtheiten der Regelstrecke . . . . . . . . . . . . . . . . . 4.7.3 Robuste Stabilit¨ at . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7.4 Robuste G¨ ute . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7.5 Frequenzganggestaltung f¨ ur minimalphasige Regelstrecken mit Unbestimmtheiten . . . . . . . . . . . . . . . . 4.8 Trajektoriensteuerung mit Folgeregelung . . . . . . . . . . . . . . . . . . 4.8.1 Regelungsstruktur mit zwei Entwurfsfreiheitsgraden . . 4.8.2 Trajektoriensteuerung f¨ ur Deskriptorsysteme . . . . . . . . . 4.8.3 Folgeregelung f¨ ur gesteuerte Deskriptorsysteme . . . . . . . 5
6
XI
188 194 197 198 200 204 210 211 213 218 221 223 225 226 229 234
Regelbarkeit aus mathematischer Sicht . . . . . . . . . . . . . . . . . . . 5.1 Einf¨ uhrung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Funktionentheoretische Eigenschaften von stabilen ¨ Ubertragungsfunktionen ................................. 5.3 Algebraische Eigenschaften von stabilen ¨ Ubertragungsfunktionen ................................. 5.4 Reglerentwurf mittels teilerfremder Zerlegung des Regelstreckenmodells . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.1 Charakterisierung aller stabilisierenden Regler . . . . . . . 5.4.2 Gangbare Wege des algebraischen Reglerentwurfs . . . . . 5.4.3 Zur Unvermeidbarkeit von instabilen Reglern . . . . . . . .
239 239
Beschreibung von LTI-Systemen durch Polynommatrizen . 6.1 Einf¨ uhrung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 MIMO-LTI-Systeme in polynomialer Darstellung . . . . . . . . . . . 6.2.1 Polynomiale Systembeschreibung und allgemeine ¨ Ubertragungsmatrix .............................. 6.2.2 Linksteiler polynomialer Matrizenpaare . . . . . . . . . . . . . 6.2.3 Linksteiler und Nichtsteuerbarkeit . . . . . . . . . . . . . . . . . . 6.2.4 Rechtsteiler polynomialer Matrizenpaare . . . . . . . . . . . . 6.2.5 Rechtsteiler und Nichtbeobachtbarkeit . . . . . . . . . . . . . . 6.2.6 Basisgr¨ oßen f¨ ur LTI-Regelstrecken . . . . . . . . . . . . . . . . . . 6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen . . . . . . .
271 271 273
240 256 260 260 262 267
273 275 279 286 288 291 301
XII
Inhaltsverzeichnis
6.3.1 Charakteristisches Polynom des r¨ uckgef¨ uhrten Systems und Nullstellenzuweisung . . . . . . . . . . . . . . . . . . 6.3.2 Rekonstruktion nicht gemessener Systemgr¨oßen und beobachterbasierte R¨ uckf¨ uhrung . . . . . . . . . . . . . . . . . . . . 6.3.3 Strecker-Nyquist-Kriterium f¨ ur den MIMO-Standardregelkreis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 LTI-Systeme in Zustandsbeschreibung . . . . . . . . . . . . . . . . . . . . . 6.4.1 Zustandssteuerbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.2 Zustandsbeobachtbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.3 Dekomposition des Zustandsraumes und minimale ¨ Realisierungen von Ubertragungsmatrizen ........... 6.4.4 Basisgr¨ oßen f¨ ur zustandssteuerbare Systeme . . . . . . . . . 7
Zeitdiskrete LTI-Systeme und Abtastregelkreise . . . . . . . . . . 7.1 Einf¨ uhrung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Zeitdiskrete lineare Prozessmodelle . . . . . . . . . . . . . . . . . . . . . . . 7.3 Stabilit¨ at zeitdiskreter linearer zeitinvarianter Systeme . . . . . . 7.4 Zeitdiskreter Standard-Regelkreis . . . . . . . . . . . . . . . . . . . . . . . . . 7.5 Abtastregelkreis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.5.1 Abtast- und Halteglieder . . . . . . . . . . . . . . . . . . . . . . . . . . 7.5.2 Zeitdiskrete Beschreibung eines Abtastregelkreises . . . . 7.5.3 Zeitkontinuierliche Beschreibung der ¨ Ubertragungsglieder eines Abtastregelkreises . . . . . . . . . ¨ 7.6 Parametrische Ubertragungsmatrizen in geschlossenen Abtastregelkreisen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
301 320 326 332 332 339 342 347 361 361 363 367 370 372 372 379 385 408
Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 421 Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429
1 Einfu ¨hrung
Die Ingenieurwissenschaften bem¨ uhen sich um ein Verst¨andnis von Naturerscheinungen in der Absicht, Ger¨ ate und Anlagen zu entwerfen, die zuverl¨ assig zum Nutzen des Menschen funktionieren. Automatisierungs- und Regelungstechnik geh¨ oren zum harten Kern der modernen Ingenieurwissenschaften. Automatisierungs- und Regelungstechniker entwerfen, bauen und betreiben selbstt¨ agig wirkende Steuerungs- und Regelungseinrichtungen f¨ ur alle nur denkbaren Einsatzfelder, denn die Methoden der Steuerungsund Regelungstheorie sind gleichermaßen anwendbar in Verkehrssteuerungssystemen, in der chemischen Verfahrenstechnik, in der elektrischen Antriebstechnik, der Kraftfahrzeugtechnik, dem Hochpr¨azisions-Werkzeugmaschinenbau, der Flugzeug- und Raketentechnik wie auch in der biomedizinischen Technik, der Heizungs- und L¨ uftungstechnik, der Roboter- und der Umwelttechnik.
1.1 Von fru agig ¨ hhistorischen Beispielen fu ¨ r selbstt¨ wirkende, vom Menschen geschaffene Steuerungsund Regelungssysteme bis zum modernen Wissenschaftszweig Uralt ist das menschliche Verlangen nach einem selbstt¨atig und verl¨asslich arbeitenden Aggregat zur Bestimmung der Zeit. Die ersten Ger¨ate zur Zeitmessung wurden bereits von den alten Kulturv¨olkern (in Mesopotamien, ¨ Agypten, Griechenland) geschaffen. Neben den Sonnenuhren“ ersannen sie ” auch Wasseruhren“. Nach [Mey90] haben die Assyrer die Wasseruhr (Kle” psydra, d. h. Wasserdiebin) schon 600 v. Chr. benutzt. Das Wirkungsprinzip entspricht dem der Sanduhr. Die Zeitdauer f¨ ur das Ausfließen von Wasser aus einem Speicherbeh¨ alter wird gemessen. Um einen guten Gleichlauf zu erreichen, bediente man sich bereits regelungstechnischer Prinzipien. Viele weitere Beispiele (M¨ unzautomaten, automatische T¨ ur¨offner, Wasserstands-
2
1 Einf¨ uhrung
¨ regulierungen, Lampe mit automatischer Olnachf¨ ullung u. a.) findet der interessierte Leser in [Gar77], [May70], [NGK57], [Hor63], [Kal88]. In diesem Zusammenhang erw¨ ahnenswert sind auch die zahlreichen Unterhaltungsautomaten - genannt seien Fl¨ otenspieler und k¨ unstliche Tiere - , an denen sich die h¨ ofische Gesellschaft an den europ¨ aischen H¨ ofen im 16. Jahrhundert erfreute. Beispiele kann man noch heute im Mathematisch-Physikalischen Salon“ der ” Dresdener Kunstsammlungen bewundern. Wir wollen darauf hier nicht n¨ aher eingehen, sondern zun¨achst beim Thema der selbstt¨ atigen Regelungsmechanismen zum Zwecke der Zeitmessung verweilen. Mechanische Uhren kamen im Mittelalter in Europa auf. Der Sarazenen-Sultan Saladin (1138-1193) soll dem deutschen Kaiser Friedrich Barbarossa (1122-1190) eine R¨ aderuhr geschenkt haben. Der Bau von Turmuhren l¨ asst sich in Deutschland bis ins 14. Jahrhundert verfolgen. Der N¨ urnberger Handwerker Peter Henlein fertigte um 1500 die erste Taschenuhr. Galileo Galilei (1568-1642) regte den Bau von Pendeluhren an. Aber erst Christian Huygens (1629-1695) konstruierte 1656 die erste Pendeluhr und ver¨ offentlichte 1673 sein Werk Horologium oscillatorium“, das ins Deutsche ” mit Schwingungsstundenzeiger“ u ¨ bersetzt werden k¨onnte. Die mechanische ” Pendeluhr, die in Gestalt einer Standuhr oder einer Wanduhr seit dem 19. Jahrhundert zum u urgerlichen deutschen Wohnzimmer ¨blichen Inventar der b¨ geh¨ orte, wurde und wird noch immer in der deutschen Umgangssprache oft als Regulator“ bezeichnet (engl.: grandfather clock, franz.: la pendule). ” Wir wenden uns nun historischen Beispielen von selbstt¨atigen Regelungsmechanismen in der Antriebstechnik zu. Die regenerativen Energiequellen, die Wasser und Wind innewohnen, wurden im europ¨aischen Mittelalter mit Hilfe von Wasser- und Windm¨ uhlen1 genutzt. Im 18. Jahrhundert wurde das Wasserrad als wichtigste Antriebsvorrichtung abgel¨ost durch die Dampfmaschine. Als Pioniere in diesem technischen Neuland seien der Franzose Dionysios Papin (1647-1714), der mit einem Dampfschiff die Fulda befuhr, die Engl¨ ander Th. Savery, Th. Newcomen und G. Cauley, die die Wasserkunst in Bergwerken weiterentwickelten, sowie der Russe I. I. Polzunov (17281766) genannt. Das Prinzip der Wasserstandsregelung wurde wiederentdeckt und zur gleichm¨aßigen Dampferzeugung genutzt. Die Vervollkommnung der Dampfmaschine, die die erste industrielle Revolution ausl¨oste, ist vor allem mit dem Namen des englischen Erfinders und Unternehmers James Watt (1736-1819) verkn¨ upft. Er ließ sich seinen Fliehkraftregler 1784 patentieren. Fliehkraftregler werden bis in die j¨ ungste Zeit praktisch eingesetzt, z.B. f¨ ur die Drehzahlregelung von Turbinen in Wasserkraftwerken. Die Monographie [Tol05] zeugt von dem hohen Entwicklungsstand, den die Kraftmaschinenregelung gegen Ende des 19. Jahrhunderts erreicht hatte. Seinerzeit begann die allm¨ ahliche Abl¨ osung der zentralen Antriebe und der 1
Die a uhle (mit einem unterschl¨ achtigen ¨lteste genaue Beschreibung einer Wasserm¨ Wasserrad) verdanken wir dem r¨ omischen Architekten Pollio Vitruvius, der zur Zeit des Kaisers Augustus lebte.
1.1 Historische Entwicklung
3
nachfolgenden Kraft¨ ubertragung mittels Transmissionsriemen, weil der Elektromotor einen dezentralen Antrieb von Wellen erm¨oglichte. In den ersten Jahrzehnten des 20. Jahrhunderts bewirkten regelungstechnische Methoden bedeutende Fortschritte auf verschiedenen Technik-Feldern, siehe [K¨ up28], [Leo40]. Der Verein Deutscher Ingenieure (VDI) gr¨ undete in den 1930er Jahren einen Fachausschuss f¨ ur Regelungstechnik. Die VDI-Zeitschrift berichtet im Januar 1941 in einem Sonderheft u ¨ ber die Arbeit dieses Fachausschusses. Die Pr¨ aambel gibt Aufschluss u ¨ ber den erreichten Stand: Die Regelungstechnik ist u unglichen engen Wirkungs¨ ber ihren urspr¨ kreis, die Kraftmaschinenregelung, weit hinausgewachsen und umfasst heute alle Gebiete des technischen Schaffens. Der VDI-Fachausschuss f¨ ur Regelungstechnik, der sich mit der Kl¨arung der vielf¨altigen und schwierigen Probleme der Regelungstechnik befasst, hat zun¨achst die Ausarbeitung einheitlicher Begriffsbestimmungen in Angriff genommen, um die auf den verschiedenen Gebieten der Technik entstehenden regeltechnischen Entwicklungszweige zusammenfassen zu k¨ onnen. Um die wissenschaftliche wie auch die wirtschaftliche Bedeutung der Regelungstechnik als eine gesamte Technik und dar¨ uber hinaus auch andere Zweige der Wissenschaften umfassende Aufgabe aufzuzeigen, hat der Fachausschuß am 17. Oktober 1940 dem Wissenschaftlichen Beirat des VDI durch Vortr¨ age aus verschiedenen Bereichen der Rege¨ lungstechnik einen Uberblick u ¨ ber sein Arbeitsgebiet gegeben. Dabei gaben auch zwei Physiologen mit einigen Beispielen aus der Regelung von Vorg¨ angen im lebenden K¨ orper Einblick in die grunds¨atzliche Bedeutung der Regelungsvorg¨ ange f¨ ur das Leben. Die f¨ unf Vortr¨age sind im vorliegenden Heft zusammengefasst. Hermann Schmidt (1894-1968), der Obmann des VDI-Fachausschusses, schreibt im Vorspann seines Beitrages: Die wirtschaftliche, sozialpolitische ” und kulturpolitische Bedeutung der Regelungstechnik, in der sich die Technik methodisch vollendet, begr¨ undet die Forderung: Alles regeln, was regelbar ist, und das nicht Regelbare regelbar machen.“ 2 In einer noch heute lesenswerten Denkschrift [Sch41] wirbt Schmidt f¨ ur die Schaffung eines Hochschulinstituts f¨ ur Regelungstechnik. Tats¨achlich wird der weltweit erste Lehrstuhl f¨ ur Regelungstechnik 1944 an der Fakult¨at f¨ ur Maschinenwesen der TH Berlin-Charlottenburg errichtet, mit Hermann Schmidt als Ordinarius. Im selben Jahr ver¨ offentlichte der von Schmidt geleitete VDIFachausschuss eine 63-seitige Brosch¨ ure zur deutschsprachigen Normung der 2
Bemerkenswert ist die auff¨ allige sprachliche Parallele zum Grundansatz der neuzeitlichen Naturwissenschaft, den Bertolt Brecht im “Leben des Galilei“ seinen Helden aussprechen l¨ asst: Messen, was meßbar ist, und meßbar machen, was ” noch nicht meßbar ist!“
4
1 Einf¨ uhrung
regelungstechnischen Bezeichnungen und Begriffe [VDI44]. Unabh¨angig davon erschien ein erstes, auf die allgemeinen Methoden orientiertes Fachbuch u atiger Regelungen“ [OS44]. Die Autoren Rudolf C. ¨ ber die Dynamik selbstt¨ ” Oldenbourg (geb. 1911) und Hans Sartorius (geb. 1913) erl¨autern ihr Anliegen im Vorwort: Die selbstt¨ atige Regelung hat sich in den letzten Jahrzehnten nahezu alle Zweige der Technik und Naturwissenschaften erschlossen und steht heute auf den mannigfaltigsten Gebieten im Blickpunkt allgemeinen Interesses. Ein eigenartiger Reiz dieses Gebietes zieht auch den zun¨ achst nur fl¨ uchtig mit ihm in Ber¨ uhrung Kommenden oftmals nachhaltig in seinen Bann. Und doch ist der Weg zu diesem Wissenszweig nicht leicht. . . . Absicht war, die gleichartigen Wesensz¨ uge aller Regelungen, die Dynamik“ der Regelung, entkleidet ” aller ger¨ atetechnischen und technologischen Einzelheiten, herauszustellen.3 . . . Unmittelbar nach dem Zusammenbruch des III. Deutschen Reiches orientierte sich die Politik der alliierten Besatzungsm¨achte am Morgenthau-Plan (vorgelegt vom US-amerikanischen Finanzminister H. Morgenthau jr. auf der 2. Konferenz von Quebec im September 1944), der Deutschland auf den Status eines Agrarlandes reduzieren wollte, so dass von modernen Forschungsund Lehrst¨ atten f¨ ur Ingenieurwissenschaften im Nachkriegsdeutschland zun¨ achst keine Rede sein konnte. Die inhaltlichen Vorstellungen von einer fach¨ ubergreifenden Wissenschaftsdisziplin, welche die gemeinsamen Gesetzm¨ aßigkeiten der Steuerung und selbstt¨ atigen Regelung, die in allen Sparten der Technik, aber auch in Organismen und Soziogemeinschaften anzutreffen sind, untersucht – wie sie der VDI-Ausschuss f¨ ur Regelungstechnik um 1940 formuliert hatte –, leb¨ ten jedoch weltweit fort und gewannen an Uberzeugungskraft. Als ein wesentlicher Markstein ist das 1948 von dem US-amerikanischen Mathematiker Norbert Wiener (1894-1964) ver¨ offentlichte Buch Cybernetics“ [Wie48] ” zu nennen. Er versah es mit einem f¨ ur sich sprechenden Untertitel Rege” lung und Nachrichten¨ ubertragung im Lebewesen und in der Maschine“.4 1951 fand die Cranfield Conference statt, die erste gr¨oßere internationale Tagung u atige Steuerung und Regelung. Der Tagungsband [Tus52] wurde ¨ ber selbstt¨ von dem britischen Ingenieur Arnold Tustin (1899-1994), der sich vielf¨altige Verdienste um die Regelungstechnik als neuem Wissenszweig erworben hat, 3
4
Vermutlich haben Oldenbourg und Sartorius bei der Wahl des Buchtitels nicht nur an die aus Mechanik und Musik seinerzeit allgemein vertrauten Deutungen des Wortes Dynamik gedacht, sondern auch die urspr¨ ungliche Bedeutung des griechischen Wortes δυναµις – n¨ amlich (innere) Kraft, Macht und St¨ arke – im Sinn gehabt. Cybernetics, zu deutsch Kybernetik, kommt vom griechischen κυβ νητ ησ, d. h. Steuermann“, Lenker“. ” ”
1.1 Historische Entwicklung
5
herausgegeben. Er gab auch einen neuen wesentlichen Anstoß f¨ ur die Anwendung von Regelungsmethoden auf volkswirtschaftliche Prozesse [Tus53]. Nach dem Beginn des Kalten Krieges zwischen den West- und Ostblockstaaten spielte der Morgenthau-Plan f¨ ur Deutschland bald keine Rolle mehr. Fast gleichzeitig wurden an drei deutschen Technischen Hochschulen Institute und Lehrst¨ uhle f¨ ur Regelungstechnik eingerichtet, • 1955 an der Fakult¨ at f¨ ur Elektrotechnik der TH Dresden mit Heinrich Kindler (1909-1985), • 1956 an der Fakult¨ at f¨ ur Elektrotechnik der TH Darmstadt mit Winfried Oppelt (1912-1999), • 1957 an der Fakult¨ at f¨ ur Maschinenwesen der RWTH Aachen mit Otto Sch¨afer (1909-2000). Auch Hermann Schmidt war im Oktober 1954 als ordentlicher Professor f¨ ur die Theorie der Regelungstechnik an die TU Berlin zur¨ uckgekehrt, wo er bis zu seiner Emeritierung im Jahre 1960 t¨ atig war5 [Dit99] [Fas02]. In den 1970er und 1980er Jahren erreichte der Terminus Kybernetik“ ” große Popularit¨ at im deutschen Sprachraum. Sowohl in Ost- als auch in Westdeutschland wurden Professuren f¨ ur Technische Kybernetik“, Mathe” ” matische Kybernetik“ oder ¨ ahnlichen Widmungen geschaffen und kybernetische Studieng¨ ange angeboten. Seit der Vereinigung Deutschlands kann man eine gewisse Bevorzugung des Etiketts Automatisierungstechnik“ registrie” ren. Auch die seit 1953 monatlich erscheinende deutsche Fachzeitschrift rt ” Regelungstechnik“ wurde umbenannt in at - Automatisierungstechnik“.6 ” Trotz dieses modischen Wandels in den Bezeichnungen, am inhaltlichen Konzept des neuen Wissenszweiges, das im deutschen Sprachraum bereits um 1940 recht klar formuliert worden war, hat sich kaum etwas ge¨andert. Sein Wesen bleibt von Mode-Bezeichnungen unber¨ uhrt und fasziniert die nachgeborenen Generationen nach wie vor. Des Wesens Zauber bindet wieder, ” was der Mode Schwert geteilt.“ So k¨ onnte man es im Schiller jahr 2005 mit Friedrich Schiller s Worten sagen. In den 1990er Jahren wurde der Wissenszweig in Deutschland von rund 100 Professuren an Universit¨ aten in Forschung und Lehre gepflegt. Hinzu kamen nochmals etwa ebensoviele Fachhochschulprofessuren. In den USA und anderen Industriestaaten erfuhr die regelungstechnische Hochschulausbildung einen vergleichbaren Aufschwung. Einen verschiedene Nationen vergleichen¨ den Uberblick gibt ein Sonderheft des IEEE Control Systems Magazine (Band 16 (1996) No.2). 5
6
Kurioserweise wurde Prof. Schmidts Lehrstuhl keiner Fakult¨ at zugeordnet, sondern dem Rektor der TU Berlin quasi direkt unterstellt. Die Hochschullehrer der Fakult¨ aten f¨ ur Maschinenwesen und f¨ ur Elektrotechnik mochten den Pionier f¨ ur transdisziplin¨ ares Forschen und Lehren wohl nicht in ihr traditionell fachspezifisch ausgerichtetes Kollegium integrieren. Dieses Wort stammt ebenfalls aus dem Griechischen und bedeutet in etwa Kunst ” der (Schaffung von) selbstt¨ atigen Anlagen”.
6
1 Einf¨ uhrung
Das Leben in der heutigen Industriegesellschaft ist ohne die extensive Nutzung der Steuerungs- und Regelungstechnik nicht mehr vorstellbar: Waschmaschinen, Geschirrsp¨ uler, Mikrowellen, Fahrstuhlaufz¨ uge, Zentralheizungsanlagen, . . . sind mit speicherprogrammierten Steuerungen (SPS) ausger¨ ustet. Der Entwurf von SPS und die zugeh¨ orende Theorie der bin¨aren Schaltsysteme werden in diesem Buch nicht behandelt, da wir uns auf die Steuerung und Regelung von zeitkontinuierlichen Prozessen, die grunds¨atzlich durch AlgebroDifferentialgleichungen modelliert werden und f¨ ur die Signalr¨ uckkopplungen eine wesentliche Beeinflussung erm¨ oglichen, konzentrieren wollen. Als Paradebeispiel f¨ ur implementierte Steuerungs- und Regelungstechnik k¨onnen moderne Automobile betrachtet werden. Der Benzinmotor mit einer intelligenten, variablen Ventilsteuerung sorgt nicht nur daf¨ ur, dass das Fahrzeug in wenigen Sekunden von 0 auf 100 km/h beschleunigt werden kann, sondern zugleich der Kraftstoffverbrauch und die Schadstoffemission auf ein Minumum reduziert werden. Beim Hybridantrieb wird w¨ahrend der Fahrt automatisch ein optimaler Betriebsmodus durch zweckm¨aßigen Wechsel zwischen Benzin- und Elektroantrieb gew¨ ahlt. Der Benzinmotor treibt – außer den R¨ adern – einen Generator an, der Strom f¨ ur den Elektromotor liefert und, bei Bedarf, die Batterie aufl¨ adt. Beim Bremsen wirkt der Elektromotor als Generator und l¨ adt die Batterie auf. Unbemerkt vom Fahrer arbeiten Batterie, Benzin- und Elektromotor als autarkes, in sich geschlossenes System zusammen. Eine Klimaautomatik gew¨ahrleistet in kurzer Zeit die vom Fahrer gew¨ unschte Wohlf¨ uhltemperatur und gute Sicht, auch bei kalten Außentemperaturen und zun¨ achst beschlagenen Scheiben. Ein satellitengesteuertes Navigationssystem berechnet eine optimale Fahrtroute und weist dem Fahrer auf einem Farbmonitor und mit akustischen Signalen verl¨aßlich den Weg. Wenn die R¨ ader beim Beschleunigen, besonders bei nasser Fahrbahn, durchzudrehen drohen, steuert eine aktive Antriebsschlupfregelung die Motorleistung. Ein elektronischer Stabilit¨ atsregler h¨alt das Fahrzeug sicher in seiner Spur. Bei Gefahrenbremsungen sorgt eine automatisierte Bremsvorrichtung f¨ ur kurze Bremswege. Das Anti-Blockiersystem ABS verhindert ein Blockieren der R¨ ader, so dass die Lenkbarkeit des Fahrzeuges auch bei Vollbremsungen erhalten bleibt. Allt¨ aglich genutzte Steuerungs- und Regelungsvorrichtungen werden uns nicht immer als so spektakul¨ are Errungenschaften bewusst wie beim modernen Automobil. Eingebaute Regelungstechnik dient uns aber auch in Gestalt unscheinbarerer Aggregate, die mitunter ganz ohne elektronische Informationsverarbeitung auskommen. Als Beispiel mag ein Druckregulierventil in einer Hauswasserversorgungsanlage, bei dem der gew¨ unschte Leitungsdruck an einer Justierschraube eingestellt wird, dienen.
1.2 Beschreibung des Steuerungs- und Regelungsproblems
7
1.2 Allgemeine Beschreibung des Steuerungs- und Regelungsproblems Der Ingenieur geht von Zielvorgaben oder quantifizierbaren Zielvorstellungen aus. Diese k¨ onnen u ¨berschaubar sein, wie z. B. die Einhaltung einer bestimmten Toleranz eines geometrischen Parameters w¨ahrend des Fertigungsprozesses f¨ ur ein Massenerzeugnis, oder sehr komplex, wie z. B. die wirtschaftliche Effizienz eines kommunalen Verkehrssystems. Es werde angenommen, dass sich die Zielvorstellungen durch einen Satz von skalarwertigen, zeitabh¨angigen Gr¨ oßen v1 (t), . . . , vq (t) ausdr¨ ucken lassen. Die vorhandenen Einrichtungen (Ger¨ ate, Anlagen, . . . ) bilden den (zu steuernden) Prozess P (plant, Strecke, Objekt), auf den m Stell- oder Steuersignale u1 (t), . . . , um (t) als Eingangsgr¨ oßen einwirken. Als Ergebnis der Signalverarbeitung im Prozess P m¨ ogen r Ausgangssignale y1 (t), . . . , yr (t) zur Verf¨ ugung stehen. Grunds¨ atzlich m¨ ussen die Zielvorstellungen v1 (t), . . . , vq (t) in einem Wandlungsmechanismus in geeignete Steuersignale u1 (t), . . . , um (t) u ¨ bersetzt werden. Die Struktur des gesteuerten Prozesses l¨asst sich gem¨aß Bild 1.1 grob veranschaulichen. Nur selten wird man davon ausgehen d¨ urfen, dass eine St¨ oreing¨ ange ... v1 v2 .. . vq v ∈ Rq
Wandlungsmechanismus W
u1 u2 .. . um
Prozess P
y1
mit
y2 .. .
Unbestimmtheiten
u ∈ Rm
yr y ∈ Rr
Bild 1.1. Struktur des gesteuerten Prozesses
Prozessbeschreibung vorliegt, die die Signalverarbeitung von den steuernden Eingangsgr¨ oßen u1 , . . . , um zu den geregelten Ausgangsgr¨oßen y1 , . . . , yr eindeutig bestimmt. Vielmehr wird die Prozesskenntnis in den meisten F¨allen mit Unbestimmtheiten behaftet sein. Einerseits strukturierte Unbestimmtheiten wie die Fertigungstoleranzen, Alterungs- und Temperaturabh¨angigkeiten der mechanischen und elektrischen Parameterwerte der implementierten Bauelemente, andererseits unstrukturierte Unbestimmtheiten, die mit der Modellbildung zusammenh¨ angen, wie z. B. die Vernachl¨assigung elastischer oder plastischer Werkstoffeigenschaften bei Verwendung eines Starrk¨orpermodells. Hinzu kommt der Einfluss von St¨orungen, mit denen die Umgebung“ auf den ” betrachteten Prozess in nicht vorhersehbarer Weise einwirkt, z. B. Windb¨oen oder Wolkenschichten beim Flugzeug oder Frequenzschwankungen im Wechselstromversorgungssystem.
8
1 Einf¨ uhrung
Die Aufgabe besteht nun darin, die gew¨ unschten Zielvorstellungen mit dem gegebenen Prozess zu verwirklichen, zumindestens in einer akzeptablen N¨aherung - trotz der vorhandenen Unbestimmtheiten. Gesetzt den Fall, dass die Zielvorstellungen als gew¨ unschte Ausgangsgr¨oßenverl¨aufe y1d (t), . . . , yrd (t) formuliert werden, also q = r und v1 (t) = y1d (t), . . . , vr (t) = yrd (t) gilt, so bietet sich der Gedanke der R¨ uckkopplung als L¨osungsprinzip an. Man muss die tats¨ achlichen Ausgangsgr¨ oßen y1 (t), . . . , yr (t) st¨andig messen und die Messwerte mit den gew¨ unschten Sollwerten y1d (t), . . . , yrd (t) vergleichen. Die Abweichungen y1d (t) − y1 (t) =: e1 (t), . . . , yrd (t) − yr (t) =: er (t) lassen sich m¨ oglicherweise nutzen, um die Steuersignale u1 (t), . . . , um (t) so zu bestimmen, dass die Abweichungen e1 (t), . . . , er (t) hinreichend klein werden. Zur Erl¨ auterung der allgemeinen Aussagen wollen wir in Gedanken eine Fahrrad-Tour machen, z. B. den morgendlichen Weg zur Arbeit vom Wohnhaus zur Arbeitsstelle mit dem Fahrrad zur¨ ucklegen und uns die damit verbundene Steuerungs- und Regelungsproblematik vergegenw¨artigen. Das zu bew¨ altigende Problem bedarf keiner ausf¨ uhrlichen Erl¨auterung. Ein Arbeitnehmer m¨ ochte morgens rechtzeitig an seinem Arbeitsplatz erscheinen. Dies kann er auf verschiedene Weise bewerkstelligen: zu Fuß gehen, mit dem eigenen Auto fahren, ¨ offentliche Verkehrsmittel benutzen, sich einer Mitfahrgemeinschaft anschließen, . . . . Bei der Entscheidung zwischen solchen Alternativen werden diverse Aspekte eine Rolle spielen: f¨ ur den Arbeitsweg aufzuwendende Zeit und Kosten, aber auch gesundheitsf¨ordernder sportlicher Ausgleich, eigenes Auto als Statussymbol, Kontaktpflege zu Arbeitskollegen u. a. Nach Abw¨ agung aller direkt oder mittelbar quantifizierbaren Zielvorstellungen m¨ oge die Entscheidung f¨ ur das Fahrrad gefallen sein. Somit hat sich unser fiktiver Arbeitnehmer f¨ ur eine L¨ osung seines Problems mittels eines Prozesses“ entschieden, den er mit einem funktionst¨ uchtigen Fahrrad auf ” den ihm bekannten Straßen und Wegen zwischen Wohnhaus und Arbeitsstelle realisieren kann. Die gew¨ unschten Ausgangsgr¨ oßensignale ergeben sich aus der gew¨ahlten Fahrtroute, die der Arbeitnehmer auf Befragen im voraus in einem zweidimensionalen Stadtplan eintragen k¨ onnte, und den Geschwindigkeiten, mit denen der Fahrer die einzelnen Streckenabschnitte zu durchfahren gedenkt. Daraus lassen sich prinzipiell die zeitabh¨ angigen Stellsignale (zum Lenken, zum in die Pedalen Treten und zum Bremsen), die von den Stellgliedern des Prozesses – das sind hier Arme und Beine des Radfahrers – eingepr¨agt werden m¨ ussen, um die gew¨ unschten Ausgangssignalverl¨aufe zu erzielen, im voraus berechnen. Bei der Berechnung, die im allgemeinen kein eindeutiges Ergebnis haben wird, sind die Stellgr¨ oßenbeschr¨ ankungen, die in erster Linie aus der mehr oder minder großen k¨ orperlichen Leistungsf¨ahigkeit des Radfahrers herr¨ uhren, zu beachten. Dennoch werden die im voraus berechneten Steuersignalverl¨ aufe nur bedingt n¨ utzlich sein, weil die nicht vorhersagbaren Unbestimmtheiten und St¨ orgr¨ oßen nicht ber¨ ucksichtigt wurden. Man braucht sich nur vergegenw¨ artigen, dass die Fahrtroute u ¨ ber Straßen mit Ampelkreuzungen und Fußg¨ anger¨ uberwegen f¨ uhrt – vorbei an parkenden Fahrzeugen und
1.3 Die regelungstechnische Wirkungsplan-Darstellung
9
tempor¨ aren Baustellen, dass Vorfahrtsgebote z. B. beim Wechsel zwischen Radwegen und Straßen zu beachten sind, dass Wind und Wetter unterschiedliche Anforderungen an das k¨ orperliche Leistungsverm¨ogen des Fahrers stellen und dessen Kondition vom allgemeinen gesundheitlichen Wohlbefinden abh¨ angt, ganz zu schweigen von Reifenpannen, Kettenrissen und Verkehrsunf¨ allen. Auch wenn man die zuletzt genannten relativ seltenen Vorkommnisse unbeachtet l¨ asst, verwirklichen und konkretisieren sich die u ¨ brigen Unbestimmtheiten von Tag zu Tag und von Fahrtroutenabschnitt zu Fahrtroutenabschnitt auf immer neue Weise. Um dennoch t¨aglich p¨ unktlich und unbeschadet zur Arbeitsstelle zu gelangen, werden die Augen des radfahrenden Arbeitnehmers w¨ahrend der Fahrt quasi st¨ andig als Sensoren und Komparatoren ben¨ otigt, ebenso sein Gehirn als Echtzeit–Datenverarbeitungsprozessor. Sobald Abweichungen im zeitlichen Verlauf der gew¨ unschten FahrtrouteTrajektorien von den tats¨ achlich verwirklichten Trajektorien auftreten, wird das Gehirn des Fahrers Steuersignale an Arme und Beine senden, die auf eine Verkleinerung der Abweichungen zielen. Wir wollen nun die Grundaufgaben der regelungstechnischen Praxis grob umreißen. Generell geht es um die zielgerichtete Beeinflussung von (technischen) Prozessen. Dabei sind mehrere wichtige Aspekte zu unterscheiden: 1. Prozess¨ uberwachung und -sicherung • Anzeige wichtiger Prozessgr¨ oßen • Protokollierung von Abl¨ aufen • Parameteridentifikation und Sch¨ atzung von Prozessgr¨oßen • Signalisierung von Grenzwert¨ uberschreitungen • Noteingriff bzw. Notabschaltung 2. Prozessstabilisierung • Aufrechterhaltung eines gew¨ unschten Prozessregimes • Automatische Kompensation von St¨ oreinfl¨ ussen 3. Steuerung und Regelung von Prozessgr¨ oßen 4. Prozessf¨ uhrung von An- und Abfahrvorg¨ angen 5. Prozessoptimierung bez¨ uglich sinnvoller G¨ utekriterien
1.3 Die regelungstechnische Wirkungsplan-Darstellung Zur Konkretisierung und Veranschaulichung der prinzipiellen Zusammenh¨ange betrachten wir ein beliebtes Lehrbuchbeispiel, vgl. z.B. [Opp64], [F¨ol05], die F¨ ullstandsregelung in einem Beh¨ alter (siehe Bild 1.2). Die spezifisch regelungstechnische Aufgabenstellung – die Ausgangsgr¨oßen eines Prozesses (der Regelstrecke“) sollen durch das Einwirken der Stell” gr¨oßen ein gew¨ unschtes Verhalten zeigen, und zwar trotz des Einflusses von St¨ orgr¨ oßen und von Unbestimmtheiten des Prozesses – stellt sich im Beispiel so dar: Die F¨ ullstandsh¨ ohe x fungiert als Regelgr¨ oße. Sie soll auf einem konstanten
10
1 Einf¨ uhrung Generator der F¨ uhrungsgr¨ oße w
Zulaufmenge = St¨ orgr¨ oße z
r
Regelungseinrichtung
Regelgr¨ oße x Stellgr¨ oße y
Wirkungskreislauf Bild 1.2. Aufbau einer F¨ ullstandsregelung
Wert gehalten werden, der durch Fixierung der F¨ uhrungsgr¨oße w – sie wird hier mit einer Justierkurbel eingestellt – bestimmt wird. Der Schieber im Auslaufstrang wirkt als Stellglied, der Schwimmer auf der (Wasser-)Oberfl¨ache als Messglied. In der Regelungseinrichtung stehen der gemessene Wert r der Regelgr¨oße x und der vorgegebene Sollwert w, der vom F¨ uhrungsgr¨oßengenerator geliefert wird, f¨ ur eine zielgerichtete Bestimmung der Stellgr¨oße y zur Verf¨ ugung. Zun¨ achst muss ein Vergleich zwischen dem gemessenen Istwert r und dem Regelgr¨ oßen-Sollwert w stattfinden. Die Regeldifferenz e = w − r wird im Regler transformiert auf ein Signal yR , das geeignet ist, u ¨ ber eine Stelleinrichtung auf den Prozess einzuwirken. Das Bild 1.3a zeigt eine denkbare Realisierung der Regelungseinrichtung. Der Vergleich zwischen Messwert r und Sollwert w erfolgt mittels einer Zeigerskala. Ein Mensch als Regler mißt per Augenmaß die Differenz w − r = e und berechnet daraus im Kopf einen Drehwinkel yR seines Stellrades (=Steller), um die Differenz auszugleichen. Der Drehwinkel ist fest mit der Stellgr¨oße y, verk¨ orpert durch die H¨ ohenstellung des Schiebers (=Stellglied), gekoppelt. Auch andere Realisierungen der Regelungseinrichtung sind vorstellbar. Im Bild 1.3b wurde eine etwas aufw¨ andigere Informationsverarbeitung im Regler, der nun zwei Menschen beansprucht, skizziert. Schließlich zeigt Bild 1.3c eine rein mechanische Probleml¨ osung. Ein zweckm¨aßig ausgelegtes Gest¨ange dient zugleich als Vergleichsglied, Regelglied und Steller. Irgendeine angenommene Ver¨ anderung an einer der Gr¨oßen x oder y wandert in einem geschlossenen Wirkungskreislauf durch die geregelte Anlage. Die Ver¨ anderung wird in einer bestimmten Richtung weitergegeben. Der geschlossene Wirkungskreislauf wird als Regelkreis bezeichnet.
1.3 Die regelungstechnische Wirkungsplan-Darstellung
11
Generator der F¨ uhrungsgr¨ oße w (Sollwert-Vorgabe) Zulaufmenge = St¨ orgr¨ oße z r
Regelungseinrichtung
w yR
Regelgr¨ oße x Stellgr¨ oße y
a)
r
Wirkungskreislauf
000000 w111111 000000 111111 000000 111111 000000 111111 yR 000000 111111 000000 111111 000000 111111 00 11 00 11 00 11 00 11 Stellgr¨ oße y
b) Bild 1.3.
Stellgr¨ oße y c)
Verschiedene Regelungseinrichtungen f¨ ur eine F¨ ullstandsregelung a) mit einer Person als Regler, einem Stellrad als Steller und einem Schieber als Stellglied b) mit zwei Personen als Regler c) mit einem mechanischen Gest¨ ange als Regler und Steller
Ohne die R¨ uckf¨ uhrung der gemessenen Regelgr¨oße kommt kein Wirkungskreislauf zustande. Man spricht dann von einer Steuerung im engeren Sinne. Bild 1.4 zeigt eine automatische F¨ ullstandssteuerung. In der deutschen Norm DIN 19226 wird der Begriff Regelung “ (closed” loop control) f¨ ur den einfachen Fall einer reellwertigen Stellgr¨oße und einer reellwertigen Regelgr¨ oße wie folgt definiert. Definition 1.1 (Regelung). Unter einer Regelung versteht man einen Vorgang, bei dem die Regelgr¨oße, meist die Ausgangsgr¨oße der Strecke, laufend
12
1 Einf¨ uhrung Generator der F¨ uhrungsgr¨ oße w
Zulaufmenge = St¨ orgr¨ oße z Steuerungseinrichtung 111 000 111 000
Steuergr¨ oße x
Stellgr¨ oße y
Wirkungsrichtung Bild 1.4. Aufbau einer automatischen F¨ ullstandssteuerung
gemessen und mit der F¨ uhrungsgr¨oße verglichen wird, um mittels der so gebildeten Differenz die Regelgr¨oße dem gew¨ unschten Sollverlauf des Streckenausgangs anzugleichen. Charakteristisch f¨ ur eine Regelung ist der geschlossene Wirkungskreislauf, durch den sich die Regelgr¨oße fortlaufend selbst beeinflusst. Das Bild 1.5 zeigt den Wirkungsplan eines geregelten Systems mit den genormten deutschsprachigen Bezeichnungen und Abk¨ urzungen. Den Signalbezeichnungen wurden ihre englischen Entsprechungen hinzugef¨ ugt. Bei allen regelungstechnischen Wirkungsplan-Darstellungen wird davon ausgegangen, dass die einzelnen, durch K¨ astchen gekennzeichneten Regelkreisglieder nur in der Richtung des Wirkungskreislaufes, die durch Signalpfeilorientierungen sichtbar gemacht wird, wirken. Die damit prinzipiell vorausgesetzte R¨ uckwirkungsfreiheit scheint elementaren physikalischen Gesetzm¨aßigkeiten zu widersprechen; denn nach Newton‘s lex tertia gilt: actio = reactio, d. h., jede Wirkung ist mit einer gleich großen Gegenwirkung gekoppelt. Daher bedarf die Annahme der r¨ uckwirkungsfreien, gerichteten Regelkreisglieder stets einer sorgf¨ altigen Pr¨ ufung und Rechtfertigung bei der Modellbildung. Im Beispielfalle einer F¨ ullstandsregelung gem¨aß Bild 1.3c haben wir stillschweigend vorausgesetzt, dass man das Gest¨ange im hier untersuchten Zusammenhang wie ein starres und masseloses Konstrukt, dessen Teile sich reibungsfrei gegeneinander bewegen, beschreiben darf.
1.4 Vorbetrachtungen zur quantitativen Behandlung gesteuerter Prozesse
13
z Regler w
e
Stelleinrichtung Regelglied
yR
y Steller
Stellglied
Strecke
x
Vergleichsglied r
Meßeinrichtung
Regelungseinrichtung x r w e = w−r yR y z Bild 1.5.
Regelgr¨ oße R¨ uckf¨ uhrgr¨ oße F¨ uhrungsgr¨ oße Regeldifferenz Reglerausgangsgr¨ oße Stellgr¨ oße St¨ orgr¨ oße
closed-loop control variable feedback variable reference variable closed-loop error closed-loop control output manipulated variable disturbance variable
Genormter Wirkungsplan eines geregelten Systems (lt. DIN 19226, Teil 5)
1.4 Vorbetrachtungen zur quantitativen Behandlung gesteuerter Prozesse Im Abschnitt 1.3 wurde das regelungstechnische Wirkungsplan-Konzept anhand einer F¨ ullstandsregelung erl¨ autert. Die folgenden Betrachtungen werden an einem Beispiel aus dem gleichen Anwendungsfeld durchgef¨ uhrt, weil die Wasserstands- und Abflussregelungen zu den ¨ altesten Einsatzgebieten regelungstechnischer Prinzipien geh¨ oren. 1.4.1 Auswirkungen von Signalbegrenzungen Bild 1.6 zeigt den technologischen Aufbau des geregelten Prozesses. Ein aufrecht stehender zylindrischer Tank der Grundfl¨ache A hat am Boden ein offenes Abflussrohr (mit der Querschnittsfl¨ ache a), durch das das Wasser mit einem Volumenstrom qa (t) abfließt. Der dem Tank zufließende Volumenstrom qe (t) h¨ angt von einem (mehr oder minder schwankendem) Leitungsdruck p(t) ab und kann durch ein Ventil gedrosselt und in technologisch bedingten Grenzen reguliert werden. Im Erdschwerefeld ergibt sich der Volumenstrom qa (t) unmittelbar aus der F¨ ullstandsh¨ ohe h(t), qa (t) = a 2gh(t). (1.1) Dies ist die Aussage des Theorems von E. Torricelli (1608 – 1647). Der Zufluss qe (t) ist n¨ aherungsweise proportional zur Quadratwurzel aus dem
14
1 Einf¨ uhrung Ventil
Druck p
qe
ω; ϕ
Fl¨ ache A
Getriebe
g ωM
H h
Motor
M
Querschnitt a
uA uP
Verst¨ arker uS
qa Drucksensor
uD Bild 1.6. Hydraulische Anlage mit Regelungseinrichtung
Leitungsdruck p(t) sowie proportional zum Ventil¨offnungsquerschnitt oder, anders ausgedr¨ uckt, zum Ventilspindelwinkel ϕ. Also wird qe (t) = kQ ϕ(t) p(t) f¨ ur 0 ≤ ϕ(t) ≤ ϕmax (1.2) angesetzt. O. B. d. A. kann der Proportionalit¨ atsfaktor kQ so gew¨ahlt werden, dass ϕmax = 1 wird. Zur vollst¨ andigen Charakterisierung des hydraulischen Prozesses geh¨ort noch die Volumen-Bilanz, ˙ Ah(t) = qe (t) − qa (t) = qe (t) − a 2gh(t). (1.3) Die geometrischen Abmessungen der hydraulischen Anlage f¨ uhren zu offensichtlichen Beschr¨ ankungen einiger Systemgr¨oßen, 0 ≤ ϕ(t) ≤ 1,
0 ≤ h(t) ≤ H,
und daraus abgeleitet 0 ≤ qe (t) ≤ kQ
p(t),
0 ≤ qa (t) ≤ a
2gH.
Wenn die Tankh¨ ohe H als m¨ oglicher Wertebereich von h(t) voll ausgesch¨opft werden soll, muss ein Leitungsdruck 2 a p ≥ 2gH kQ gefordert werden. Eine weitere Beschr¨ ankung ergibt sich aus
1.4 Vorbetrachtungen zur quantitativen Behandlung gesteuerter Prozesse
15
1 1 ˙ ϕ(t) = √ qe (t) = √ Ah(t) + a 2gh(t) kQ p kQ p und 0 ≤ ϕ(t) ≤ 1 zu
k p(t) a a Q ˙ . 2gh(t) ≤ h(t) ≤− 2gh(t) + − A A A
Unter der Annahme eines konstanten Leitungsdruckes 2 a 0 p(t) = p ≥ 2gH kQ lassen sich die Vorg¨ ange im ungeregelten hydraulischen Prozess in einem ˙ (h, h)-Diagramm veranschaulichen (Bild 1.7 und Tab. 1.1 ). 0.04
ϕ=
a kQ
2gH p0
0.03
ϕ=1
0.02
h˙
0.01
0
−0.01
ϕ=0
−0.02
0
1
2
3
h
4
5
6
H
7
˙ Bild 1.7. (h, h)-Diagramm
F¨ ur Stellungen des Zuflussventils mit den Ventilspindelwinkelwerten ϕ im Bereich a 2gH <ϕ≤1 kQ p0 wird der ungeregelte Tank nach einer gewissen Zeit u ¨ berlaufen, und zwar unabh¨ angig vom Anfangsf¨ ullstand h(0). F¨ ur Winkelwerte
16
1 Einf¨ uhrung Tabelle 1.1. In Abschnitt 1.4 verwendete Parameterwerte V m
kP
1
kM
0.5
kG
2 · 10−4
kQ 0.16 g
9.81
u0S
4V
A
1 m2
1 Vs
m kg
p0 51 kPa H
m2
6.5 m
a 20.3 cm2
m s2
a 0<ϕ< kQ
2gH p0
strebt die F¨ ullstandsh¨ ohe zu einem station¨ aren Wert h0 mit 0 < h0 < H, genauer: 2 0 kQ p 0 · ϕ2 , · h = a 2g wiederum unabh¨ angig vom Anfangswert h(0). Die hydraulische Anlage wurde mit einer elektrischen Regelungseinrichtung ausgestattet, deren prinzipieller Aufbau aus Bild 1.6 hervorgeht. Die Regelungseinrichtung hat die Aufgabe, einen gew¨ unschten Zeitverlauf der F¨ ullstandsh¨ ohe h(t) und damit zugleich auch des abfließenden Wasserstromes qa (t) durch Einspeisung einer geeigneten elektrischen Steuerspannung uS (t) zu erzeugen. Die Wirkungsweise der technischen Bestandteile wollen wir im folgenden durch einfache lineare Beziehungen beschreiben, bei denen das dynamische Verhalten des Motors ignoriert wird: Drucksensor: Vergleichsglied:
uP (t) = kP h(t) uD (t) = uS (t) − uP (t)
Verst¨ arker: Motor:
uA (t) = kV uD (t) ωM (t) = kM uA (t)
Getriebe: Hinzu kommt die Beziehung
ω(t) = kG ωM (t) . ϕ(t) ˙ = ω(t) .
Nun kann man versuchen, durch Ineinandereinsetzen der Modellgleichungen einen Zusammenhang zwischen der Regelgr¨oße x – hier h(t) – und ¨ der F¨ uhrungsgr¨ oße w – hier uS (t) – herzustellen. Ublicherweise wird die F¨ uhrungsgr¨ oße w als unabh¨ angige Eingangsgr¨oße interpretiert und gefragt, wie sich die Regelgr¨ oße x verh¨ alt, wenn f¨ ur die F¨ uhrungsgr¨oße w genormte Testsignalverl¨ aufe (z. B. Einheitssprung) angenommen werden. Praktisch bedeutsamer ist die umgekehrte Frage: L¨ asst sich zu einem a priori gew¨ unschten Regelgr¨ oßenverlauf xd (t) ein idealer F¨ uhrungsgr¨oßenverlauf wd (t) im voraus
1.4 Vorbetrachtungen zur quantitativen Behandlung gesteuerter Prozesse
17
berechnen, der im Einsatzfall dann xd (t) erzeugen w¨ urde?7 Dieser Frage wollen wir uns nun zuwenden. F¨ ur das Beispielsystem kommt man unter der vereinfachenden Voraussetzung eines konstanten Leitungsdruckes, d. h. p(t) = p0 = const, zur folgenden Problembeschreibung: 1 1 q˙e ϕ˙ = kP h + kV kM kG kV kM kG kQ p0 1 ¨ + q˙a Ah = kP h + kV kM kG kQ p0 1 g ˙ ¨ h . Ah + a = kP h + 2h kV kM kG kQ p0
uS = uP + uD = kP h +
(1.4)
Eine gew¨ unschte Zeitfunktion hd (t) sei vorgegeben. Einsetzen dieses hd (t)Verlaufs in die rechte Seite der Differentialgleichung (1.4) liefert einen idealen F¨ uhrungsgr¨ oßenverlauf udS (t). Unsere Betrachtung der Differentialgleichung (1.4) unterscheidet sich von dem aus Mathematik und Mechanik vertrauten Vorgehen. Dort werden in der Regel die Erregungen (z. B. in Gestalt eingepr¨agter Kr¨afte und Verschiebungen) vorgegeben und die unbekannten Systemgr¨oßen (z. B. innere mechanische Spannungen, Form¨ anderungen, Geschwindigkeiten) durch L¨osen von Differentialgleichungen berechnet. Im Beispiel h¨atte man dann bei vorgegebener Zeitfunktion uS (t) die Differentialgleichung (1.4) zu l¨osen, um die Systemgr¨ oße h(t) zu gewinnen. Im Gegensatz dazu begn¨ ugen wir uns mit der prinzipiell einfacheren Aufgabe, die man im mathematischen Kontext als Einsetzprobe“ einstufen kann, ” nur mit dem Unterschied, dass die Erregung hier nicht als von vornherein bekannt angenommen, sondern auf diese Weise u ¨ berhaupt erst erzeugt wird, und zwar so, dass ein gew¨ unschter Regelgr¨ oßenverlauf xd (t) gew¨ahrleistet wird. Im Beispiel gebietet der gesunde Menschenverstand, f¨ ur hd (t) keine sprungf¨ ormigen Verl¨ aufe anzusetzen. Gleichung (1.4) lehrt mehr: hd (t) muss zweimal stetig differenzierbar sein, wenn man eine stetige Steuerspannung udS (t) als F¨ uhrungsgr¨ oße generieren m¨ ochte. Grunds¨ atzlich d¨ urfen keine prozessbedingten Signalbeschr¨ ankungen bei der Festlegung des gew¨ unschten Regelgr¨ oßenverlaufes xd (t) verletzt werden. Im Beispielfalle muss trivialerweise gelten 0 < hd (t) < H.
(1.5)
Gibt man einen zweimal stetig differenzierbaren Wunschverlauf hd (t) vor, der die Trivialbedingung (1.5) erf¨ ullt, so l¨ asst sich daraus mit (1.4) ein F¨ uhrungsgr¨ oßenverlauf udS (t) ohne weiteres bestimmen. 7
Der obere Index d“ steht f¨ ur das lateinische Wort desiderabilis“, d. h. ” ” verlangens-, w¨ unschenswert“. ”
18
1 Einf¨ uhrung
Auf eine in diesem Zusammenhang sinnvolle Problemstellung wollen wir n¨ aher eingehen: Der h−Pegelstand soll im Rahmen der Bedingung (1.5) um einen Betrag ∆h erh¨ oht und nach l¨ angerer Zeit wieder auf den urspr¨ unglichen Stand abgesenkt werden, und zwar jeweils in einem relativ kur¨ zen Uberf¨ uhrungszeitintervall vorgegebener L¨ange l. ¨ Als Uberf¨ uhrungsfunktion eignet sich der polynomiale Ansatz k x i f (x) = ∆h 1 − 1 − l
f¨ ur
0 < x < l.
(1.6)
Durch passende Wahl der Potenzen i und k lassen sich bei x = 0 und x = l ¨ Uberg¨ ange gew¨ unschter Glattheit erzielen; denn f¨ ur kleine > 0 gilt: f () = ∆h · ik ·
k l
und
f (l − ) = ∆h − ∆h · k
i l
.
Im Beispielfalle m¨ oge gefordert sein, den Pegelstand von 4m auf 6m anzuheben, und zwar zum einen innerhalb von 300 sec und zum anderen innerhalb von 150 sec, und ihn nach l¨ angerer Verweilzeit auf dem hohen Niveau wieder ¨ auf das niedere Niveau zu bringen, gleichfalls in Uberf¨ uhrungszeitintervallen von 300 sec bzw. von 150 sec. Um die zweimalige stetige Differenzierbarkeit des Verlaufs h(t) zu gew¨ahrleisten, d¨ urfen die Potenzen i und k in der Funktion (1.6) nicht kleiner als 2 sein. Hier wurde i = 3 und k = 4 gesetzt. Bild 1.8 zeigt zwei geforderte Wunschverl¨aufe hd (t) und die daraus mit (1.4) berechneten F¨ uhrungsverl¨ aufe udS (t). Die Konsequenzen aus der Spindelwinkelbeschr¨ankung 0 ≤ ϕ(t) ≤ 1 auf zul¨ assige Vorgabeverl¨ aufe hd (t) sind nicht ganz so einfach erkennbar. Aus der Herleitung von (1.4) entnehmen wir 1 g ˙ ¨ ϕ(t) ˙ = h(t) , (1.7) Ah(t) + a 2h(t) kQ p0 und daraus durch Integration, 1 ˙ ˙ Ah(t) + a 2g h(t) − Ah(0) − a 2g h(0) . ϕ(t) = ϕ(0) + kQ p0
(1.8)
Bei der Auswertung der Formel (1.4) wird nicht unbedingt bemerkt, dass die rechte Seite von (1.8) ggf. Werte < 0 oder Werte > 1 annimmt. Damit w¨ urden Drehwinkelwerte ϕ(t) < 0 bzw. ϕ(t) > 1 gefordert. Beides ist technisch nicht realisierbar. Vielmehr w¨ urde der Motor bei einer Ventilstellung ϕ = 0 bzw. ϕ = 1 festgebremst verharren, und die Regelungseinrichtung w¨are de facto abgeschaltet, wenn auch nur vor¨ ubergehend. Die auf der rechten Seite des Bildes 1.8 dargestellten Signalverl¨ aufe haben von dem Zeitpunkt ab, an dem der Motor erstmalig festgebremst wird, mit der Wirklichkeit nichts mehr gemein.
1.4 Vorbetrachtungen zur quantitativen Behandlung gesteuerter Prozesse l = 300 sec
6
5.5
5.5
uS
hd
6
5
4.5
4
4 0
500
1000
1500
3.5
2000
25
25
20
20
15
15
10
10
5
0
−5
−5 0
500
1000
1500
−10
2000
500
1000
1500
2000
0
500
1000
1500
2000
500
1000
1500
2000
1
ϕd
1
ϕd
0
5
0
−10
0.5
0
0.5
0
0
500
1000
t [sec]
1500
2000
0
0.03
0.02
ϕ=1
0 −0.01
0 −0.01
−0.02
Bild 1.8.
ϕ=1
0.01
h˙ d
0.01
−0.03
t [sec]
0.03
0.02
h˙ d
5
4.5
3.5
l = 150 sec
H
uS
hd
H
19
4
5
ϕ=0 H 6
−0.02 7
−0.03
4
5
ϕ=0 H 6
7
hd hd d oße, daraus berechnete Gew¨ unschte Sollverl¨ aufe h (t) der Regelgr¨ oße ϕd (t) sowie DarVerl¨ aufe der Steuergr¨ oße udS (t) und der Systemgr¨ ˙ stellung des Bewegungsablaufs in der (h, h)−Ebene
20
1 Einf¨ uhrung
Die hydraulische Anlage w¨ urde bei vollst¨ andig ge¨offnetem Ventil autonom weiterarbeiten, wie es im Bild 1.9 veranschaulicht wurde. Statt der Wunschtrajektorie hd (t) zu folgen, stellt sich nun ein Trajektorienst¨ uck h(t) gem¨aß (1.3) und ϕ(t) = 1 ein. Entlang dieses Trajektorienst¨ uckes verschwindet die rechte Seite von (1.7). Das Regelungssystem bleibt so lange wirkungslos, bis erstmalig udS (t) − kP h(t) < 0 wird. Erst dann wird das geregelte System prinzipiell wieder man¨ovrierf¨ahig. Auf Grund des im voraus berechneten F¨ uhrungsgr¨oßenverlaufes udS (t) agiert der Regelkreis zwar in der vorbestimmten Weise, kann den gew¨ unschten Regelgr¨ oßenverlauf hd (t) aber nicht mehr erzeugen. F¨ ur den Beispielfall, der auf der rechten Seite des Bildes 1.8 zu sehen ist, wurden die tats¨achlichen Signalverl¨ aufe durch eine Simulationsrechnung bestimmt und im Bild 1.9 aufgezeichnet. Bis zum Zeitpunkt t1 arbeitet das geregelte hydraulische System wie gew¨ unscht gem¨ aß Differentialgleichung (1.4). In der relativ kurzen Zeitspanne (t1 , t2 ) ist die Regelungseinrichtung de facto abgeschaltet und der hydraulische Prozess durchl¨ auft ein Teilst¨ uck der Bahn ϕ = 1, die aus Bild 1.7 bekannt ist. Bei t = t2 wird die Differenz udS (t) − kP h(t) negativ, und die Regelungseinrichtung beginnt wieder zu wirken. Das geregelte System verh¨alt sich f¨ ur t > t2 entsprechend der Differentialgleichung (1.4) mit der im voraus berechneten Erregung udS (t). Infolge der Anfangsbedingungen bei t = t2 ergibt sich aber ein von hd (t) stark abweichender Verlauf h(t). Zum Zeitpunkt t = t3 wird die Differenz udS (t) − kP h(t) positiv, und ϕ(t) ˙ wechselt sein Vorzeichen. Bei t = t4 beginnt der Tank u ¨ berzulaufen. Die Differentialgleichungen (1.3) ˙ und (1.4) treten außer Kraft, zugunsten der Beziehungen h(t) = 0, h(t) = H, uP (t) = kP H. Weil die Steuerspannung udS (t) f¨ ur t ≥ t4 auf einen konstanten Wert kleiner kP H fixiert ist, wird ϕ(t) ˙ = const < 0. Die damit verbundene laufende Reduzierung des Zustromes qe (t) f¨ uhrt zur Zeit t = t5 zu √ qe (t5 ) = a 2gH, und die Differentialgleichungen (1.3) und (1.4) treten f¨ ur t > t5 wieder in Kraft, bis zum Zeitpunkt t = t6 das Zulaufventil vollst¨andig geschlossen ist und die Regelungseinrichtung de facto wieder abgeschaltet wird. Der hydraulische Prozess durchl¨ auft ein Teilst¨ uck der Bahn ϕ = 0 des Bildes 1.7 so lange, bis die Differenz udS (t) − kP h(t) positiv wird, und die Regelungseinrichtung bei t = t7 erneut eingreifen kann. Das Beispiel veranschaulicht, welch verheerende und nachhaltige Auswirkungen eine Verletzung von physikalisch oder technologisch begr¨ undeten Systemgr¨ oßenbeschr¨ ankungen ausl¨ osen kann. Das gilt selbst dann, wenn die Verletzung nur kurzzeitig eintritt und mit keiner unmittelbaren Konsequenz verbunden zu sein scheint. (Ein kurzzeitiges Festfahren“ werden im Beispiel” falle sowohl der Stellmotor als auch das Ventil aushalten“.) ” Stellgr¨ oßenbegrenzungen, wie sie beispielhaft erl¨autert wurden, sind ein generelles Merkmal von Stellgliedern aller Art. Diese lassen sich, mechanisch gesprochen, nicht weiter als bis zum Anschlag“ auf- oder zudrehen. Der am ”
1.4 Vorbetrachtungen zur quantitativen Behandlung gesteuerter Prozesse
21
25 20 15
uS
10 5 0 −5 −10
0
t1t2 t3
500
t4
1000
t5
0
t1t2 t3
500
t4
1000
t5
0
t1t2 t3
500
t4
1000
t5
t [sec]
1500
t6t7
2000
1500
t6t7
2000
1500
t6t7
2000
7
H
h
6
5
4
3
t [sec]
ϕ
1
0.5
0
ϕ=1
t1
0.02
t [sec]
t2
h˙
0.01
t4 t4 , t 5
0
−0.01
t3 ϕ=0
−0.02 3
Bild 1.9.
3.5
t7 4
4.5
t6 5
h
5.5
6
H
7
Tats¨ achliche Signalverl¨ aufe bei kurzzeitigem Wirksamwerden der Stellbegrenzung (Wunschverl¨ aufe gestrichelt)
22
1 Einf¨ uhrung
Beispiel geschilderte Aufdreh-Effekt“ – in der Fachsprache sagt man es gern ” englisch und spricht vom Wind-up“–Effekt – ist eine typische Erscheinung, ” die den nichtlinearen Regelungsproblemen zuzurechnen ist und die in zahlreichen Forschungs- und Lehrwerken systematisch behandelt wird. Genannt sei die unl¨ angst erschienene Monographie [GS03] und die dort zitierte Literatur. In diesem Buch wird darauf nicht weiter eingegangen. Vielmehr wird grunds¨ atzlich vorausgesetzt, dass die jeweils gew¨ahlten Modellgleichungen und die darin vorkommenden Signalgr¨ oßen den betrachteten realen Prozess brauchbar beschreiben. Diese Voraussetzung erf¨ ullt das Beispielsystem auf der rechten Seite des Bildes 1.8 nicht. H 25 6
20 15
udS
hd
5.5 5
10 5
4.5
0 4 0
200
400
t [sec]
−10
600
2
0.06
1.5
0.04
h˙ d
ϕd
3.5
−5
1
0
200
400
600
t [sec]
ϕ=2
0.02 0
0.5 −0.02 0
0
200
400
t [sec]
600
ϕ=0 4
5
hd
6
H
7
Bild 1.10. Berechnete Signalverl¨ aufe, die nach Installation eines zweiten Zulaufrohres realisierbar werden
Wenn die tats¨ achlich vorhandenen Stellgr¨ oßenbegrenzungen bei der Problembearbeitung keine Rolle spielen sollen, muss man zuvor daf¨ ur sorgen, dass diese Grenzen im realen Prozessablauf niemals erreicht werden k¨onnen. Wunschvorstellungen u ahigkeit des geregelten Systems sind ¨ber die Leistungsf¨ kategorisch zur¨ uckzuweisen, wenn aus einer wissenschaftlich fundierten Modellbildung hervorgeht, dass sie sich nicht in Einklang mit den physikalischen Grundgesetzen bringen lassen. Bei der oben diskutierten Anwendung ¨ kann man eine Mindestzeitspanne f¨ ur den Ubergang zwischen dem hohen und dem niedrigen F¨ ullstand bestimmen, die aus physikalisch-technologischen ¨ Gr¨ unden nicht unterschritten werden darf. Will man k¨ urzere Ubergangszeiten
1.4 Vorbetrachtungen zur quantitativen Behandlung gesteuerter Prozesse
23
erreichen, so m¨ ußten die physikalisch-technologischen Gegebenheiten zielge¨ richtet ver¨ andert werden. Um im Beispielfalle den Ubergang vom niedrigen zum hohen Regelstand in nur 150 sec zu erm¨ oglichen, k¨onnte man beispielsweise ein zweites Zulaufrohr installieren und dessen Stellventil synchron mit dem des ersten Zulaufrohres betreiben. Damit w¨ urde der Stellbereich des ¨ Winkels ϕ erweitert auf 0 ≤ ϕ ≤ 2 und die gew¨ unschte kurze Ubergangszeit von nur 150 sec ließe sich verwirklichen, vgl. Bild 1.10. 1.4.2 Linearisierung um Gleichgewichtslagen und Kleinsignal“–Modelle ” Bei bekanntem technischen Aufbau eines geregelten Systems l¨asst sich die regelungstechnische Wirkungsplan-Darstellung gem¨aß DIN 19226, die im Abschnitt 1.3 vorgestellt wurde, unter Ber¨ ucksichtigung der tats¨achlich verwendeten Signal¨ ubertragungseinrichtungen in detaillierterer Form nutzen. F¨ ur das geregelte Beispielsystem, dessen physikalisch-technologischer Aufbau im Bild 1.6 aufgezeigt wurde, erh¨ alt man einen Wirkungsplan gem¨aß Bild 1.11. Dabei wurde die u ¨bliche Symbolik verwendet. An die in Wirp kQ
kV uS
kM uA
ω1
kG ϕ(0) ϕ
1 A
qe
h(0) h
qa
uP kP
Bild 1.11. Wirkungsplan zur hydraulischen Anlage mit Steuerungs- und Regelungseinrichtung gem¨ aß Bild 1.6
kungsrichtung orientierten Signalverbindungen werden die Symbole der jeweiligen Signale geschrieben. Die einfach gerahmten K¨astchen symbolisie¨ ¨ ren lineare Ubertragungsglieder. Die Ubergangsfunktion des betreffenden ¨ Ubertragungsgliedes – d. h. der Verlauf des Ausgangssignals bei einem Einheitssprung als Eingangssignal – wird schematisch wiedergegeben. Bei einem Proportionalglied erscheint daher eine horizontale Gerade, bei einem Integrierglied eine lineare Anstiegsfunktion. Am oberen Rand der K¨astchen werden Proportionalit¨ atsfaktoren und Anfangswerte notiert. Die doppelt gerahmten K¨ astchen stehen f¨ ur eine nichtlineare Signaltransformation. Im Beispiel begegnet uns zweimal die Wurzelfunktion und einmal ein Produkt. Alle
24
1 Einf¨ uhrung
¨ Ubertragungsglieder erf¨ ullen die Bedingung der r¨ uckwirkungsfreien Signalverarbeitung. Das Zusammenspiel zwischen der Bilanzgleichung Ah˙ = qe − qa und dem Torricellischen Gesetz, qa = a
2gh,
wird in Gestalt eines eingebetteten internen Regelkreises erfasst. Wenn die Eingangssignale aller Integratoren verschwinden, nehmen alle Signale einen Gleich(gewichts)-Wert“ an, den wir durch einen oberen Index ” 0“ auszeichnen wollen. Das System kann sich nur dann in einer Gleichge” ” wichtslage“ befinden, wenn die von außen einwirkenden Erregungen konstant sind. Im Beispiel stellt sich unter der Voraussetzung uS (t) = u0S
und p(t) = p0 ,
0
2
u kP · kQ wobei
S0
≤ gelten muss, eine Gleichgewichtslage ein, und zwar mit p 2g · a2 den Gleichgewichtswerten 1 0 u kP S qa0 = a 2gh0
h0 =
0 ωM =0
u0D = 0
qe0 = qa0 1 0 1 q ϕ0 = kQ a p0
u0A = 0 u0P = u0S .
Bei gegebenem konstanten Leitungsdruck p0 lassen sich alle F¨ ullstandsh¨ohen 2 0 p k Q als station¨ are Werte erreichen, wenn man h0 mit 0 ≤ h0 < a 2g u0S = kP h0 a 2 ) , kann f¨ ur h0 die volle Tankh¨ohe ausgesch¨opft kQ werden, vgl. Bild 1.6 im Abschnitt 1.4.1. Viele regelungstechnische Aufgabenstellungen lassen sich zufriedenstellend bearbeiten, indem man anstelle des nichtlinearen geregelten Systems nur dessen Verhalten in der N¨ ahe von Gleichgewichtslagen studiert. Dazu wird das nichtlineare Systemmodell mit dem Signalvektor x(t) an der Gleichgewichtsstelle x0 lokal durch ein lineares Systemmodell approximiert, das in der N¨ ahe“ der Stelle x0 , also f¨ ur Signalvektoren x(t) = x0 + x ˜(t) mit klei” ” nen“ Signalen x ˜(t), anstatt des nichtlinearen Systemmodells benutzt werden 0 darf. An die Gleichgewichtsstelle x in den urspr¨ unglichen x-Koordinaten setzt. Falls p0 ≥ 2gH(
1.4 Vorbetrachtungen zur quantitativen Behandlung gesteuerter Prozesse
25
tritt der Nullpunkt in den Kleinsignal“-Koordinaten x ˜. Mathematisch han” delt es sich um die Linearisierung einer nichtlinearen Funktion mit Hilfe einer Taylor-Reihenentwicklung, die nach den linearen Gliedern abgebrochen wird. T Bei einem zweikomponentigen Signalvektor x(t) = (x1 (t), x2 (t)) stellt sich der Sachverhalt so dar: Eine nichtlineare Funktion y(t) = f (x1 (t), x2 (t)) m¨ oge an einer Stelle (x01 , x02 ) einen Wert y 0 = f (x01 , x02 ) annehmen und an dieser Stelle differenzierbar sein. Dann l¨ asst sich der Beginn der Taylor-Reihenentwicklung der nichtlinearen Funktion notieren, y(t) = f (x1 (t), x2 (t))
∂f (x1 , x2 )
x1 (t) − x01 + T.h.O. · x2 (t) − x02 ∂(x1 , x2 ) x1 =x01 0 x2 =x2
, x ) ∂f (x 1 2
= y0 + · x1 (t) − x01
0 x =x 1 ∂x1 1 x2 =x0 2
∂f (x1 , x2 )
+ · x2 (t) − x02 + T.h.O.
0 x1 =x1 ∂x2
= f (x01 , x02 ) +
x2 =x0 2
Mit den Abk¨ urzungen y(t) − y 0 =: y˜(t),
x1 (t) − x01 =: x˜1 (t),
∂f (x1 , x2 )
x1 =x01 =: c1 , ∂x1 x2 =x0 2
x2 (t) − x02 =: x ˜2 (t),
∂f (x1 , x2 )
x1 =x01 =: c2 ∂x2 x2 =x0 2
und Vernachl¨ assigung der Terme h¨ oherer Ordnung (T.h.O.) erh¨alt man die lineare Funktion y˜(t) = c1 x ˜1 (t) + c2 x ˜2 (t). Im Beispielfalle der geregelten hydraulischen F¨ ullstandseinrichtung weist das nichtlineare Systemmodell im wesentlichen zwei nichtlineare Zusammenh¨ ange auf, qe (t) = kQ ϕ(t) p(t) und qa (t) = a 2gh(t) . Der Zufluss qe l¨ asst sich als krumme Fl¨ ache u ¨ berder (ϕ, p)-Ebene geometrisch veranschaulichen. Im Arbeitspunkt qe0 = kQ ϕ0 p0 wird die krumme Fl¨ache durch ihre Tangentialebene approximiert, vgl. Bild 1.12. Aus der abgebrochenen Taylor-Reihe qe (t) = qe0 + kQ
1 ϕ0 p(t) − p0 + T.h.O. p0 ϕ(t) − ϕ0 + kQ 0 2 p
26
1 Einf¨ uhrung
qe
qe0
p p0 ϕ0
ϕ
√ Bild 1.12. Veranschaulichung der nichtlinearen Funktion qe = kQ ϕ p und ihrer 0 0 Tangentialebene im Arbeitspunkt (ϕ , p )
ergibt sich die Ebenen-Gleichung 1 ϕ0 p0 ϕ(t) ˜ + kQ p˜(t) 2 p0 1 1 = qe0 ϕ(t) ˜ + p ˜ (t) . ϕ0 2p0
q˜e (t) = kQ
Die nichtlineare Teilstruktur im Wirkungsplan ist durch eine entsprechende lineare Teilstruktur zu ersetzen. Eine M¨ oglichkeit zeigt Bild 1.13. Der Ausfluss qa (t) h¨ angt u ullstandsh¨ohe ¨ ber eine Wurzelfunktion von der F¨ ab, vgl. Bild 1.14. Im Arbeitspunkt (h0 , qa0 ) wird die Parabel durch eine Gerade g ˜ q˜a (t) = a h(t) 2h0 ¨ approximiert. Bild 1.14 zeigt das nichtlineare Ubertragungsglied und das zu¨ geh¨ orende lineare Ubertragungsglied f¨ ur den Wirkungsplan des Kleinsignal“” Verhaltens.
1.4 Vorbetrachtungen zur quantitativen Behandlung gesteuerter Prozesse
27
p 1 2p0
p˜
qe0 q˜e
1 ϕ0
qe
ϕ
ϕ ˜
Bild 1.13. Approximation einer nichtlinearen Signal¨ ubertragung mit zwei Eingangssignalen durch eine lineare Signal¨ ubertragung in der N¨ ahe eines Arbeitspunktes qa
h
q˜a
qa0
qa
˜ h a
g 2h0
˜ h(t) 0
h
q˜a (t)
h
Bild 1.14. Approximation der Wurzelfunktion durch eine Gerade in der N¨ ahe ei¨ nes Arbeitspunktes und die zugeh¨ orenden Ubertragungsglieder im Wirkungsplan
Tr¨ agt man die abgeleiteten linearen Ersatzstrukturen an die Stellen der urspr¨ unglich nichtlinearen Teilstrukturen in den Wirkungsplan der geregelten hydraulischen Anlage, siehe Bild 1.11, ein, so gewinnt man einen Wirkungsplan f¨ ur das linearisierte System, der die Kleinsignal“-Zusammenh¨ange, die ” in der N¨ ahe des gew¨ ahlten Arbeitspunktes (u0S , p0 , ϕ0 ) gelten, dargestellt, vgl. Bild 1.15. p˜ 1 2p0
kV kM u ˜S
ω ˜M
kG ϕ(0) ϕ˜
1 ϕ0
1 A
qe0 q˜e
h(0)
a
˜ h
u ˜P kP
Bild 1.15. Wirkungsplan des linearisierten geregelten Systems
g 2h0
q˜a
28
1 Einf¨ uhrung kV kM u ˜S
u ˜D
2p0 ϕ0
kG ω ˜M
p˜
1, q˜e
ϕ ˜
u ˜P
0 qe 2p0
kP a
A a
2h0 g
q˜a
2h0 g
Bild 1.16. Modifizierter Wirkungsplan des linearisierten geregelten Systems
Aus Zweckm¨aßigkeitsgr¨ unden kann der gewonnene Wirkungsplan modifi¨ ziert werden. Will man beispielsweise das Ubertragungsglied vom Eingangssignal q˜e (t) zum Ausgangssignal q˜a (t) durch einen Kasten beschreiben, so ist das m¨ oglich. Aus g ˙q˜a = a (˜ qe − q˜a ) A 2h0 folgt
A 1+ a
2h0 d · g dt
q˜a (t) = q˜e (t).
Es handelt sich also um ein Verz¨ ogerungsglied erster Ordnung (oder P-T1 Glied) mit der Zeitkonstanten 2u0S A 2h0 A T := = . a g a g · kP Bild 1.16 zeigt eine entsprechend modifizierte Wirkungsplan-Darstellung des linearisierten Systems. Schließlich kann man die hintereinander geschalteten ¨ Ubertragungsglieder zusammenfassen und gewinnt dadurch einen Wirkungsplan in kompakterer Form (Bild 1.17). Die Wirkungen der beiden ¨ außeren Erregungen – des F¨ uhrungssignals w und des St¨ orsignals z – d¨ urfen bei linearen geregelten Systemen unabh¨angig voneinander studiert werden; denn die Reaktionen der Regelgr¨oße x gen¨ ugen dem Gesetz der linearen Superposition. Im linearen geregelten System gem¨ aß Bild 1.17 wird das F¨ uhrungsverhalten durch den Zusammenhang zwischen der F¨ uhrungsgr¨oße u ˜S (t) und der Regelgr¨ oße q˜a (t) bestimmt. Die im Wirkungsplan des Bildes 1.17 notierten Beziehungen lassen sich gleichwertig in einer Differentialgleichung zusammenfassen d2 d T 2+ + k1 k2 k3 q˜a (t) = k1 k2 u ˜S (t). dt dt
1.4 Vorbetrachtungen zur quantitativen Behandlung gesteuerter Prozesse
29
p˜ k1 u ˜S
k2 , T q˜a
u ˜D u ˜P k3
Abk¨ urzungen:
k 1 = kV kM kG kP k3 = a
2p0 ϕ0
2h0 g
k2 =
qe0 2p0
A T = a
2h0 g
Bild 1.17. Kompakter gezeichneter Wirkungsplan des linearisierten Systems
˜ h¨ atte man statt des Abflussstromes q˜a (t) auch die Wegen q˜a (t) = kkP3 h(t) ˜ F¨ ullstandsh¨ ohe h(t) als Regelgr¨ oße w¨ ahlen k¨ onnen. Sie gen¨ ugt der Differentialgleichung kP ¨ ˜˙ ˜ =u T˜ h(t) + h(t) + kP h(t) ˜S (t), k1 k2 k3 oder, nach Umrechnung auf die urspr¨ unglich verwendeten, ger¨atetebezogenen Parameter,
1 gk P ¨ ˙ ˜ +a ˜ =u ˜ A h(t) ˜S (t), (1.9) h(t) + kP h(t) 2u0S kV kM kG kQ p0 vgl. Gleichung (1.4) im Abschnitt 1.4. Dieser Typ einer linearen Differentialgleichung ist aus der Newtonschen Mechanik und den Grundlagen der Elektrotechnik wohlbekannt. Das Signal ˜ verh¨ h(t) alt sich wie das eines linearen harmonischen Oszillators mit viskoser D¨ ampfung, der von der Zeitfunktion u˜S (t) angetrieben wird. Befindet sich ˜ das System zu einem Anfangszeitpunkt t = 0 in Ruhe“, d. h. h(0) = 0 und ” ˙˜ h(0) = 0, und wird die Erregung u˜S (t) zur Zeit t = 0 eingeschaltet“, dann ” ˜ f¨ wird der Verlauf h(t) ur t > 0 durch die Differentialgleichung (1.9) eindeutig bestimmt. Testet man das F¨ uhrungsverhalten durch Erregung mit einem Einheitssprung, d. h. 1 f¨ ur t ≥ 0 u ˜S (t) = 1(t) = , 0 f¨ ur t < 0
30
1 Einf¨ uhrung
˜ f¨ so l¨ asst sich der Verlauf von h(t) ur sehr kleine positive Zeiten und f¨ ur t → ∞ unmittelbar aus (1.9) ablesen: kV kM kG kQ p0 2 ˜ h() = f¨ ur 0 ≤ 1, 2A ˜ = 1 . lim h(t) t→∞ kP Im Bild 1.18 wurde eine andere Erregung u˜S (t) gew¨ahlt und der zugeh¨orende ˜ berechnet. Man macht sich rasch klar, dass im Bild h(t ˜ 0 + ) ∼ 3 Verlauf h(t) F¨ uhrungsverhalten
˜ h [m] ; u ˜s [V]
1 0.8 0.6 0.4
˜ h(t) u ˜S (t)
0.2 0
0 t0
500
1000
1500
2000
2500
t [sec]
3000
3500
4000
4500
5000
St¨ orverhalten 10
0
0
−0.1
˜ h(t) p˜(t)
−0.2 0 t0
500
1000
1500
2000
2500
t [sec]
3000
3500
4000
4500
−10
p˜ [kPa]
˜ [m] h
0.1
−20
5000
Bild 1.18. Beispiele f¨ ur das F¨ uhrungs- und das St¨ orverhalten bei Modellierung des Regelkreises als lineares System mit den Parametern der geregelten hydraulischen Anlage gem¨ aß Abschnitt 1.4.1, Tabelle 1.1
sein muss. (Wegen h(t) ≡ 0 f¨ ur t < t0 erzwingt die Differentialgleichung (1.9) ¨ (t0 + ).) unmittelbar nach dem Einschalten der Erregung h(t0 + ) ∼ u Generell gilt: Strebt u ˜S (t) f¨ ur t 1 gegen einen konstanten Wert u ˜∞ S , 1 ∞ ∞ ˜ ˜ ˜S ein. Die Gleichung so pegelt sich h(t) auf den konstanten Wert hS = kP u ˜ d (t) mit (1.9) l¨ asst sich nat¨ urlich auch nutzen, um zu einem Wunschverlauf h ˙ d d ˜ (0) = 0 im voraus einen Steuerspannungsverlauf u ˜ (0) = 0 und h ˜dS (t) zu h ˜ d (t) erzeugt werden kann. berechnen, mit dem dann in praxi der Verlauf h
1.4 Vorbetrachtungen zur quantitativen Behandlung gesteuerter Prozesse
31
Das St¨ orverhalten wird durch den Zusammenhang zwischen der St¨orgr¨oße p˜(t) und der Regelgr¨ oße q˜a (t) bestimmt. Dem Bild 1.17 kann man die Differentialgleichung d2 d d T 2+ + k1 k2 k3 q˜a (t) = k2 p˜(t) dt dt dt entnehmen. Diese Gleichung l¨ asst sich in Analogie zu (1.9) umschreiben in eine Differentialgleichung f¨ ur die F¨ ullstandsh¨ ohe ˜h(t):
1 gk ϕ0 P ¨ ˙ ˜ +a ˜ = ˜ Ah(t) p˜˙(t). h(t) + kP h(t) 0 2uS 2kV kM kG p0 kV kM kG kQ p0 (1.10) Im Bild 1.18 werden ein angenommener Verlauf p˜(t) eines gest¨orten Leitungs˜ drucks und der zugeh¨ orende Verlauf der F¨ ullstandsh¨ohe h(t) gezeigt. Auf Grund der wohlbekannten Eigenschaften der viskos ged¨ampften harmonischen Oszillatoren f¨ allt es nicht schwer, das St¨orverhalten des geregelten Systems zu diskutieren, ohne die Differentialgleichung (1.10) exakt zu l¨osen. Insbesondere hat jeder St¨ orgr¨ oßenverlauf p˜(t), der f¨ ur t → ∞ gegen einen festen Wert p˜∞ = 0 strebt, keine bleibende Auswirkung auf die F¨ ullstandsh¨ohe. ˜ Weil die rechte Seite von (1.10) gegen Null konvergiert, pegelt sich h(t) f¨ ur t → ∞ auf den Wert Null ein. 1.4.3 Zur Modellgenauigkeit Das Kernst¨ uck des systematischen Entwurfs von geregelten Systemen ist die Analyse des Verhaltens der realen Regelstrecke. Dazu sind Modellbildungen erforderlich. Um den realen Prozess beschreiben und ggf. steuern und regeln zu k¨ onnen, schafft man sich (oder benutzt) mathematische Modelle, die in Abh¨ angigkeit von der konkreten Zielstellung m¨oglicherweise ganz verschieden aussehen. W¨ ahlen wir beispielsweise als reales Objekt ein mechatronisches Ger¨ at und interessiert uns die Wirkungsweise des elektronischen Teils, so wird oft ein elektrisches Netzwerk als angemessenes Modellsystem verwendet werden k¨ onnen. Der Bearbeiter idealisiert die Zusammenschaltung elektronischer Bauelemente zum elektrischen Netzwerk mit konzentrierten Parametern, indem er u. a. die endliche Ausbreitungsgeschwindigkeit der elektrischen Signale vernachl¨ assigt und alle Verbindungsleitungen als ideale Verbindungen, u ¨ ber denen keine elektrische Spannung abf¨allt, ansieht. Die Wirkungen der einzelnen Bauelemente werden in Netzwerkelementen ¨ortlich konzentriert gedacht. Interessiert man sich hingegen f¨ ur die Beanspruchbarkeit des Ger¨ates gegen¨ uber mechanischen Schwingungen und St¨oßen, so werden das Gesamtger¨ at, seine Baugruppen und einzelnen Bauelemente unter dem Aspekt ihrer mechanisch-dynamischen Eigenschaften gesehen. Als Modellsystem kann nun ggf. ein Feder-Masse-System dienen.
32
1 Einf¨ uhrung
Das Denken und Sprechen des Ingenieurs erfolgt weitestgehend auf dem Abstraktionsniveau der Modellsysteme. Die Begriffswelt der einzelnen traditionsreichen Ingenieurdisziplinen (wie Maschinenbau, Elektrotechnik, Bauwesen) wird durch die fachspezifischen Modellsysteme (wie Feder-MasseSysteme, elektrische Netzwerke, Fach- und Stabwerke) gepr¨agt. Wir wollen die fachspezifischen Modelle als objektnahe Modelle bezeichnen. Zur quantitativen und damit mathematischen Erfassung des Modells beschreibt man das Modellsystem z. B. durch eine Schar von Gleichungen oder Ungleichungen. Diesen sieht man dann nicht mehr an, um welchen Objektbereich es sich handelt. Den Abstraktionsprozeß, der vom objektnahen Modellsystem zum mathematischen Modell f¨ uhrt, also ein Objektfreimachen“ als wesentli” chen Teil enth¨ alt, wollen wir als mathematische Modellierung bezeichnen. Man kann oft feststellen, dass Modelle aus ganz unterschiedlichen Fachbereichen auf gleichartige mathematische Modelle f¨ uhren. So ergab die Modellierung einer geregelten hydraulischen Anlage im Abschnitt 1.4.2 einen harmonischen Oszillator, der jedem Ingenieurstudenten m¨oglicherweise schon aus den physikalischen Schulversuchen“ (siehe z.B. [SF86]), jedenfalls aber aus den ” Anfangsgr¨ unden der Punktmechanik und als elektrischer Schwingkreis“ aus ” der Schaltungstechnik vertraut ist. Das F¨ uhrungs- und das St¨orverhalten des geregelten hydraulischen Systems konnte infolge der u ¨ bereinstimmenden mathematischen Struktur der Modellgleichungen ohne weiteres diskutiert werden. Mit Hilfe geeigneter Berechnungsvorschriften und entsprechender Hardund Software liefert das mathematische Modell quantitative Ergebnisse, die das Verhalten des realen Objekts – ganz gleich, aus welchem Fachbereich es stammt – mehr oder minder genau wiedergeben und bei Bedarf auch vorherzusagen gestatten. Man wird den Bearbeitungsprozeß zur theoretischen Analyse des realen Objekts (vgl. Bild 1.19) mit der genannten groben Stufeneinteilung - objektnahe Modellbildung, mathematische Modellierung, Simulation - akzeptieren, solange die erhaltenen quantitativen Ergebnisse das Verhalten des realen Systems in den verschiedenen vorkommenden Situationen ausreichend genau angeben. Man wird dann die berechneten Daten auch zur Vorhersage des Verhaltens des realen Systems in bisher praktisch noch nicht erprobten Situationen verwenden. Den Pr¨ ufstein f¨ ur die Brauchbarkeit der verwendeten Modelle liefert der Vergleich mit den Beobachtungsergebnissen am realen System, die wir durch geeignete Meßvorschriften und Einsatz geeigneter Meßger¨ate erhalten. Der Vergleich zwischen den gemessenen und den errechneten Da¨ ten entscheidet. Ist die Ubereinstimmung befriedigend, so sind die verwendeten Analysemethoden praktisch brauchbar. Liefert der Vergleich keine hinrei¨ chende Ubereinstimmung, so werden Korrekturen erforderlich. F¨ ur den vorzugsweise rechnenden Theoretiker“ ist es am angenehmsten, wenn sich die ” Diskrepanz auf einen Fehler in der Meßvorschrift oder in der Durchf¨ uhrung asst. In den meisten F¨allen aber wird die Difder Messung zur¨ uckf¨ uhren l¨ ferenz auf Unzul¨ anglichkeiten bei der Aufstellung des objektnahen Modells,
1.4 Vorbetrachtungen zur quantitativen Behandlung gesteuerter Prozesse Reales technisches Objekt
Meßvorschrift
Modellbildung
Objektnahes Modell
Korrektur
Mathematische Modellierung
33
Mathematisches Modell
Simulation
Nein Meßergebnisse am realen Objekt
Vergleich befriedigend?
Simulationsergebnisse zur Vorhersage des Objektverhaltens
Ja
Verwendete Methoden sind praktisch brauchbar
Bild 1.19. Grunds¨ atzliches Vorgehen bei der Modellierung und Simulation realer Objekte (vgl. [RS76], S.5)
bei der Abstraktion zum mathematischen Modell oder bei der Berechnung beruhen. Nach entsprechender Korrektur sind die genannten Arbeitsstufen ¨ neu zu durchlaufen - bis die Ubereinstimmung zwischen beobachteten und berechneten Daten hinreichend gut (im Hinblick auf den mit der Analyse erstrebten praktischen Zweck!) ausf¨ allt. Unter dem Gesichtspunkt der Modellgenauigkeit wollen wir uns nochmals der geregelten hydraulischen Anlage zuwenden, die in den Abschnitten 1.4.1 und 1.4.2 betrachtet wurde. Bei der Modellierung der hydraulischen Regelstrecke wurden das Toricellische Gesetz (1.1), die Volumenbilanzgl. (1.3) und der Zusammenhang (1.2) zwischen Leitungsdruck und Zuflussstrom herangezogen. Unter den u ¨blichen Betriebsbedingungen einer solchen Anlage erscheinen die erstgenannten beiden Beziehungen in keiner Weise als fragw¨ urdig. Problematischer ist der Zusammenhang (1.2). Eine genauere Modellierung w¨ urde gr¨ undlichere Kenntnisse der Rohrhydraulik erfordern, siehe z.B. Abschnitt B.6.2. im Dubbel“ [Bei95] und dort zitierte Literatur. ” Darauf kann hier nicht n¨ aher eingegangen werden. Daher wollen wir annehmen, dass die Quadratwurzelbeziehung f¨ ur unsere Zwecke gen¨ ugt, und die Systemgr¨ oßen w¨ahrend des Betriebs der Anlage so wenig von ihren Gleichgewichtswerten abweichen, dass mit den linearisierten N¨aherungen der hydraulischen Gesetze gearbeitet werden darf. Als fragw¨ urdiger erweist sich die Modellierung der Steuer- und Regelungseinrichtung. Insbesondere wird sich die bisherige Beschreibung des Stellmotors als Proportionalglied, n¨amlich ω M (t) = kM u A (t) ,
34
1 Einf¨ uhrung
oft als unbrauchbar herausstellen. Ber¨ ucksichtigt man die stets vorhandene rotatorische Tr¨ agheit der belasteten Welle, so ergibt sich ein verfeinertes neues Modell des Motors in der Gestalt d 1 + TM dt A (t) ω M (t) = kM u mit einer entsprechend dem mechanischen Aufbau zu w¨ahlenden MotorZeitkonstante TM . Das linearisierte geregelte System besitzt nun einen Wirkungsplan der ¨ im Bild 1.20 angegebenen Struktur. Ahnlich wie im Abschnitt 1.4.2 lasp˜ k1 u ˜S
1, TM
k2 , T q˜a
u ˜D u ˜P k3
Bild 1.20. Regelstruktur mit Motordynamik
sen sich dem Wirkungsplan die zusammenfassenden Differentialgln. entnehmen, die das F¨ uhrungs- und das St¨ orverhalten der Regelgr¨oße beschreiben. Gl¨ ucklicherweise kann man die Ergebnisse des Abschnitts 1.4.2 sogar unmittelbar ausnutzen. Man braucht lediglich den Faktor k1M in den Gleichungen (1.9) und (1.10) formal durch 1 d 1 + TM dt kM zu ersetzen. Das F¨ uhrungsverhalten gen¨ ugt der Differentialgleichung d2 d d · A dt2 + a k2uP 0g dt 1 + TM dt S u S (t) = h(t) + kP h(t) kV kM kG kQ p0 2 kP g d d d3 ATM dt A + aTM k2uP 0g dt 3 + 2 + a 2u0S dt S = h(t) + kP h(t), kV kM kG kQ p0 und das St¨ orverhalten der Differentialgleichung
1.4 Vorbetrachtungen zur quantitativen Behandlung gesteuerter Prozesse
35
ϕ0 d d2 TM dt p(t) 2 + dt kG kM 2 kP g d d d3 ATM dt A + a · TM k2uP 0g dt 3 + 2 + a 2u0S dt S = h(t) + kP h(t). kV kM kG kQ p0
2p0 kV
Die auf den bekannten Eigenschaften des harmonischen Oszillators basierende Diskussion des F¨ uhrungs- und St¨ orverhaltens im Abschnitt 1.4.2 verliert f¨ ur das genauere Modell des geregelten Systems ihren Wert. Simulationsrechnungen kann man nat¨ urlich auch f¨ ur das genauere Modell rechnergest¨ utzt durchf¨ uhren. Die Ergebnisse eines Simulationslaufes sind im Bild 1.21 festgehalten worden. Alle Parameterwerte wurden ebenso gew¨ahlt wie in der TaF¨ uhrungsverhalten
˜ h [m] / u ˜s [V]
1 0.8 0.6 0.4
˜ h(t) u ˜S (t)
0.2 0
0 t0
500
1000
1500
2000
2500
t [sec]
3000
3500
4000
4500
5000
St¨ orverhalten 10
0
0
−0.1
˜ h(t) p˜(t)
−0.2 0 t0
500
1000
1500
2000
2500
t [sec]
3000
3500
4000
4500
−10
p˜ [kPa]
˜ [m] h
0.1
−20
5000
Bild 1.21. F¨ uhrungs- und St¨ orverhalten bei Ber¨ ucksichtigung der Motordynamik, vgl. Bild 1.18
belle 1.1 angegeben, lediglich erg¨ anzt um eine nicht verschwindende Motor– Zeitkonstante TM . Das Bild 1.21 zeigt ein st¨ arkeres Schwingen des Pegels h(t), obwohl am Verlauf des F¨ uhrungssignals u S (t) und des St¨orsignals p(t) gegen¨ uber Bild 1.18 nichts ge¨ andert wurde. Eine genauere Betrachtung zeigt, dass sich das verfeinerte Systemmodell sogar qualitativ ganz anders verhalten kann als das urspr¨ ungliche. Beim Modell des harmonischen Oszillator mit viskoser D¨ ampfung ist die Stabilit¨ at des geregelten Systems stets gew¨ahrleistet,
36
1 Einf¨ uhrung
unabh¨ angig von den Parameterwerten. Beim verfeinerten Modell wird es bei ung¨ unstgiger Wahl der technologischen Parameter m¨oglich, dass der Pegel h(t) aufschwingt und u ¨ ber alle Grenzen wachsende Werte annmimmt, selbst dann, wenn beide Erregungssignale beschr¨ ankt bleiben und nach einer kurzen Einschwingzeit auf Null gesetzt werden. Mit anderen Worten: Das verfeinerte Modell wird f¨ ur bestimmte Parameterkombinationen instabil. Schließlich ist bei der hydraulischen Anlage zu bedenken, dass der am Stellventil eingestellte Zulaufstrom qe (t) nicht zeitgleich im Beh¨alter wirksam wird, sondern erst nach einer Laufzeit TL , die der Wasserstrom ben¨otigt, um vom Stellventil in den Beh¨ alter zu gelangen. Dieses Ph¨anomen der Nacheilung wird nicht durch eine Differentialgleichung, sondern durch eine ArgumentVerschiebung mathematisch erfassbar. Genau genommen muss daher in der Volumenbilanz ˙ Ah(t) = qe (t) − qa (t) f¨ ur den Zufluss nicht qe (t) = kQ ϕ(t) p(t), sondern qe (t) = kQ ϕ(t − TL ) p(t − TL ) gesetzt werden. Durch die Linearisierung der physikalischen Gesetzm¨aßigkeiten wird der Effekt der Nacheilung nicht ber¨ uhrt. F¨ ur die Kleinsignal-Gr¨oßen gilt hier qe (t) = kQ
ϕ0 kQ p0 ϕ(t − TL ) + p(t − TL ). 2 p0
Im genormten Wirkungsplan gem¨ aß DIN 19226 wird die Nacheilung des Arguments durch ein sog. Totzeitglied beschrieben und die Laufzeit (oder Nacheilungszeit oder Verzugszeit) als sog. Totzeit bezeichnet. Das Bild 1.22 p˜ k1 u ˜S
1, TM
1, TL
k2 , T q˜a
u ˜D u ˜P k3
Bild 1.22. Regelstruktur mit Motordynamik und Totzeitglied
bringt einen Wirkungsplan der geregelten hydraulischen Anlage, der die Laufzeit TL des Zustromes f¨ ur den Weg zwischen Stellventil und Beh¨alter ber¨ ucksichtigt. Simulationsergebnisse zeigen, siehe Bild 1.23, dass sich die Nacheilung in noch st¨ arker ausgepr¨ agtem Schwingverhalten der Regelgr¨oße auswirkt.
1.4 Vorbetrachtungen zur quantitativen Behandlung gesteuerter Prozesse
37
F¨ uhrungsverhalten
˜ h [m] / u ˜s [V]
1 0.8
mit TL , TM
0.6
vgl. S. 30
0.4
mit TM
0.2
u ˜S (t)
0
0 t0
500
1000
1500
2000
2500
t [sec]
3000
3500
4000
4500
5000
St¨ orverhalten 10
0
0
−0.1
−10
−0.2
−20 0 t0
500
1000
1500
2000
2500
t [sec]
3000
3500
4000
4500
p˜ [kPa]
˜ [m] h
0.1
5000
Bild 1.23. F¨ uhrungs- und St¨ orverhalten bei Ber¨ ucksichtigung von Laufzeit und Motordynamik, vgl. Bild 1.18 und Bild 1.21
2 Mathematische Beschreibung von Signalen ¨ und Ubertragungssystemen
2.1 Einfu ¨hrung Lehrwerke u ¨ber die lineare Regelungs- und Steuerungstheorie beginnen in der Regel mit einem Abschnitt Signale und Systeme“, weil dem Leser erl¨autert ” ¨ werden muss, auf welche Weise Signale und Ubertragungssysteme mathematisch beschrieben werden. Die Signaldarstellung in diesem Kapitel ist kurz gehalten. Studierende der Elektrotechnik, der Mechatronik und der Informationssystemtechnik werden den Abschnitt 2.2 u urfen, weil diese sich die notwendigen Kennt¨ berspringen d¨ nisse w¨ ahrend des Grundstudiums angeeignet haben und bereits gewohnt sind, mit der Fourier - und der Laplace-Transformation zu arbeiten. F¨ ur Studierende anderer Ingenieurdisziplinen, naturwissenschaftlicher Fachrichtungen und der Mathematik k¨ onnte die hier angebotene knappe Spektraldarstellung reellwertiger Signale aber von Nutzen sein. Vorausgesetzt wird lediglich, dass der lernende Leser aus seinem Grundstudium eine ausreichende mathematische Vorbildung, insbesondere in Analysis und Funktionentheorie, mitbringt. Dann wird er den Ausf¨ uhrungen des Abschnitts 2.2 gut folgen k¨onnen. Bei der Behandlung von periodischen zeitkontinuierlichen Signalen und ihren Fourier -Reihen wird das Konzept des (diskreten) Frequenzspektrums eingef¨ uhrt. Nichtperiodische zeitkontinuierliche Signale lassen sich als Grenzf¨ alle der periodischen Signale auffassen, wenn deren Periodendauer u achst. Das Frequenzspektrum stellt sich dann als ¨ber alle Grenzen w¨ Frequenzdichtespektrum dar, das auch als Spektralfunktion oder als Fourier -Transformierte des zeitkontinuierlichen Signals bezeichnet wird. Typische Merkmale der zeitbegrenzten und der bandbegrenzten Signale werden erl¨ autert. Das Konzept der Faltungen im Zeit- und im Frequenzbereich wird zur Herleitung der Parseval schen Formel herangezogen. Schließlich wird f¨ ur Signale, die zu einem bestimmten Zeitpunkt eingeschaltet wer-
40
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
¨ den, der Ubergang von der Fourier -Transformation zur einseitigen LaplaceTransformation vollzogen.1 ¨ Aus systemtheoretischer Sicht besteht die Aufgabe von Ubertragungssystemen darin, die (m¨ oglicherweise vektorwertigen) Eingangssignale in (ggf. auch vektorwertige) Ausgangssignale zu transformieren. Um zu einer eindeu¨ tigen Zuordnung zu kommen, ist es geboten, zwischen dem Ubertragungs¨ system und dem zugeh¨ orenden Ubertragungsoperator zu unterscheiden. Im Kontext der linearen Regelungs- und Steuerungstheorie begn¨ ugt man sich mit sog. LTI-Systemmodellen, die dadurch definiert sind, dass sie linea¨ re und zeitinvariante Ubertragungsoperatoren besitzen, siehe Abschnitt 2.3. In diesem Buch wird grunds¨ atzlich zwischen skalarwertigen zeitabh¨angigen Signalen, beispielsweise x(t), und zeitabh¨ angigen vektorwertigen Signalen, beispielsweise x(t), unterschieden, w¨ ahrend die zugeh¨orenden, in den Bildbereich transformierten Gr¨ oßen X(s) = L{x(t)} oder X(s) = L{x(t)} durch große Buchstaben symbolisiert werden. ¨ Die LTI-Ubertragungsoperatoren lassen sich im Bildbereich zweckm¨aßig ¨ als Ubertragungsmatrizen darstellen. Ohne wesentliche Beschr¨ankung der ¨ Allgemeinheit darf man annehmen, das betrachtete Ubertragungssystem sei durch ein regul¨ ares Deskriptormodell beschrieben, ˙ + A0 z(t) + B0 u(t) = 0 . A1 z(t) Die interessierenden Ausgangssignale sind oft Komponenten des Deskriptorvektors z(t). Im Allgemeinen ergibt sich der Ausgangsvektor y(t) als Linearkombination von Deskriptor- und von Eingangssignalen, y(t) = C0 z(t) + D0 u(t) . Durch Laplace-Transformation entstehen im Bildbereich die Gleichungen (sA1 + A0 ) Z(s) + B0 U(s) = A1 z(−0) Y(s) = C0 Z(s) + D0 U(s) . ¨ Daraus folgt die Ubertragungsmatrix zu G(s) = −C0 (sA1 + A0 )−1 B0 + D0 . ¨ ¨ Die Eintr¨ age der Ubertragungsmatrizen sind Ubertragungsfunktionen, die ¨ jede f¨ ur sich ein Ubertragungssystem von einem skalaren Eingangssignal zu einem skalaren Ausgangssignal repr¨ asentieren. In der Arbeitspraxis der Regelungstechniker erweisen sich verschiedene ¨ weitere Begriffe, die sich unmittelbar aus der Ubertragungsfunktion herleiten 1
Von einer weitergehenden Abstraktionsm¨ oglichkeit, die Signalmengen im Zeitund im Frequenzbereich als Hilbertr¨ aume zu verstehen, die durch einen isometrischen Isomorphismus miteinander verkn¨ upft sind, wird kein Gebrauch gemacht, weil die daf¨ ur erforderliche mathematische Vorbildung jenseits der bisher an den meisten deutschen Universit¨ aten gelehrten Mathematik f¨ ur Ingenieure liegt.
2.2 Spektraldarstellung reellwertiger Signale
41
lassen, als n¨ utzlich. Als Schlagworte seien genannt: Frequenzgang, Ortskurve, Nyquist-Diagramm, Bode-Diagramm, Gewichts¨ funktion, Ubergangsfunktion. ¨ Die Abstraktion von einem real existierenden Objekt zu einem Ubertragungssystem im Sinne der Regelungstheorie nennt man Modellbildung. Tats¨ achlich bestehen ca. 70 Prozent der t¨ aglichen Arbeit von Regelungstechnikern in Aktivit¨aten, die man der Modellbildung zurechnen kann. Es w¨are vermessen, darauf in umfassender Weise eingehen zu wollen. Doch gibt es einige Grundprinzipien, die immer wieder Anwendung finden. Dazu geh¨oren Extremalprinzipien und Konzepte, die seit langem in der Variationsrechnung und der analytischen Mechanik genutzt werden. Diesem Problemkreis ist der Abschnitt 2.4 gewidmet. Kenner der Variationsrechnung und der analytischen Mechanik k¨ onnen diesen Abschnitt u ¨ bergehen. Wir benutzen ihn, um die Bewegungsgleichungen f¨ ur eine große Klasse von mechanischen Systemen, die in dem Buch immer wieder als Beispielsysteme herangezogen werden, im Detail zu begr¨ unden. Außerdem ist der Abschnitt 2.4 eine unentbehrliche Grundlage f¨ ur das Verst¨ andnis der optimalen Regelungs- und Steuerungstheorie, die um 1960 geschaffen wurde, und der Ausgangspunkt f¨ ur neuere Entwicklungen in der Regelungstheorie, die w¨ahrend der letzten Jahrzehnte des 20. Jahrhunderts begannen.
2.2 Spektraldarstellung reellwertiger Signale Reellwertige Signale x sind reellwertige Funktionen der Zeit t, genauer: Abbildungen aus einer Zeitmenge, dem Definitionsbereich (engl.: domain) von x , in die Menge der reellen Zahlen als m¨ oglichem Wertebereich, kurz x : dom(x) ⊆ R → R. Bildet der Definitionsbereich dom(x) ein Kontinuum, z. B. die nichtnegative alfte der Zeitachse, d. h. dom(x) = {t : t ≥ 0} = R+ , so spricht man von H¨ zeitkontinuierlichen Signalen. Bildet der Definitionsbereich dom(x) eine diskrete Teilmenge der Zeitachse, so spricht man von zeitdiskreten Signalen. Technisch relevante zeitkontinuierliche Signale k¨onnen in der Regel als st¨ uckweise glatte Zeitfunktionen modelliert werden. Das wollen auch wir grunds¨ atzlich voraussetzen. 2.2.1 Periodische Signale und ihre Fourier -Reihen Ein Signal x heißt periodisches Signal mit der Periodendauer ∆, wenn f¨ ur beliebige t ∈ R gilt x(t) = x(t ± k∆) mit
k ∈ N.
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
42
Beispielsweise ist das harmonische Signal x(t) = A sin(ωt + ϕ) periodisch mit der Periodendauer ∆ = 2π ω . Aus der Analysis ist bekannt, daß zu jedem st¨ uckweise stetigen periodischen Signal x mit der Periodendauer ∆ eine Fourier -Reihe ∞ 2π 2π r(t) = c0 + ak cos k t + bk sin k t ∆ ∆ k=1 ∞ 2π = ck exp jk t ∆ k=−∞
mit
∆/2
1 ck = ∆
2π x(t) exp −jk t dt ∆
−∆/2
gebildet werden kann. Den angegebenen Ausdruck f¨ ur die Koeffizienten ck gewinnt man durch L¨ osen einer Optimierungsaufgabe: Das G¨ utefunktional ∆/2
Q({ck }) =
2 x(t) − r(t) dt → min
−∆/2
wird in Abh¨ angigkeit von den Parameterwerten {ck } minimiert. Die Reihe r(t) konvergiert f¨ ur alle t, und zwar gegen x(t) an Stetigkeitsstellen von x und gegen 12 x(t+0)+x(t−0) an Unstetigkeitsstellen von x. In der N¨ ahe der Unstetigkeitsstellen von x hat die Reihe einen eigent¨ umlichen Konvergenz-Charakter. Das Bild der Partialsummen der unendlichen Reihe r(t) zeigt H¨ ocker“, die unter dem Namen Gibbssche Erscheinung bekannt ” sind und in der Spezialliteratur genauer studiert wurden, siehe z. B. [Wag47], insbes. S. 33-41, sowie [Zur63]. Hier mag das Bild 2.1 zur Illustration der Gibbsschen Erscheinung gen¨ ugen: x
−∆
−∆
r5
0
∆
t
r15
0
∆
t
−∆
−∆
0
∆
t
0
∆
t
r25
Bild 2.1. Gibbssche Erscheinung
Dargestellt wurden ein Abschnitt eines periodischen Rechtecksignals x und die Partialsummen
2.2 Spektraldarstellung reellwertiger Signale
rK (t) =
K k=−K
2π ck exp jk t ∆
f¨ ur
43
K = 5, 15, 25
der zugeh¨ orenden Fourier -Reihe r(t). Die Folge {ck }k∈Z bildet das (Frequenz-) Spektrum des periodischen Signals x. Das Spektrum liefert eine eineindeutige Charakterisierung des Signals. Wegen c−k = ck gilt f¨ ur die Folgenglieder des Amplitudenspektrums |ck | = |c−k | und f¨ ur die Folgenglieder des Phasenspektrums arc ck = −arc c−k . Hervorgehoben sei noch die fundamentale Beziehung ∆/2
1 ∆
x2 (t)dt =
∞
|ck |2 ,
(2.1)
k=−∞
−∆/2
die sich rasch verifizieren l¨ aßt: ∞ k=−∞
ck c−k =
∞ k=−∞
1 = ∆
x(t)
∆/2
2π x(t) exp jk t dt ∆
−∆/2
∆/2
−∆/2
1 = ∆
∆/2
1 ck ∆
∞ k=−∞
2π dt ck exp jk t ∆
1 x(t) · r(t) · dt = ∆
−∆/2
∆/2
x2 (t)dt. −∆/2
2.2.2 Nichtperiodische Signale und ihre Spektralfunktionen Um eine Spektraldarstellung auch f¨ ur nicht-periodische Signale x zu finden, lassen wir in Gedanken die Periodendauer ∆ unbegrenzt wachsen. Unter der Voraussetzung, daß das Signal absolut integrierbar ist, d. h. ∞ |x(t)|dt < ∞, −∞
(2.2)
44
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
¨ kann der Ubergang von der Fourier-Reihe zur Fourier-Transformation plausibel erkl¨ art werden (Einzelheiten siehe z. B. [WS93a], [Hof98]). An die Stelle des diskreten (Frequenz-)Spektrums {ck }k∈Z tritt die Spektralfunktion oder das (Frequenzdichte-)Spektrum ∞ X(jω) =
x(t)e−jωt dt = F x(t) ,
(2.3)
−∞
das kurz als Fourier -Transformierte des zeitkontinuierlichen Signals x bezeichnet wird. Im Sprachgebrauch der Regelungstechniker wird X(jω) auch Frequenzgang des Signals x genannt. Das Signal x kann man aus seiner Fourier -Transformierten u ucktransformation ¨ ber die R¨ F
−1
1 X(jω) = 2π
∞ X(jω)ejωt dω = x(t)
(2.4)
−∞
reproduzieren, wobei aber an den Sprungstellen von x stets das arithmetische Mittel des links- und rechtsseitigen Grenzwertes berechnet wird. Beispiel 2.1 F¨ur das zeitbegrenzte Signal h 0
x1 (t) =
t ∈ [−tg , tg ] t∈ / [−tg , tg ]
f¨ ur
erh¨ alt man die Fourier -Transformierte
∞ X1 (jω) =
s
x (t)e
−jωt
t
g
dt = h
−∞
e−jωt dt = 2h
−tg
sin ωtg , ω
w¨ ahrend mit der bandbegrenzten reellen Spektraldichte X2 (jω) =
H 0
f¨ ur
ω ∈ [−ωg , ωg ] ω∈ / [−ωg , ωg ]
ein Zeitsignal 1 x2 (t) = 2π
∞ X2 (jω)e −∞
jωt
H dω = 2π
ω
g
−ωg
ejωt dω = H
sin ωg t πt
korrespondiert.
Das Beispiel mag zur Illustration allgemeiner Gesetzm¨aßigkeiten, auf deren Herleitung hier verzichtet wird, dienen: Jedes zeitbegrenzte Signal, d. h. x(t) = 0 f¨ ur |t| > tg , hat eine unendlich ausgedehnte Spektraldichte.
2.2 Spektraldarstellung reellwertiger Signale
45
Jedes bandbegrenzte Signal, d. h. X(jω) = 0 f¨ ur |ω| > ωg , ist u ¨ ber der Zeitachse unendlich ausgedehnt. F¨ ur Impuls-Signale und Impuls-Spektralfunktionen ergeben sich durch formales Einsetzen in die Transformationsgleichungen (2.3) und (2.4) die Beziehungen F δ(t − t0 ) = e−jωt0 , insbes. F δ(t) = 1 1 jω0 t e , F−1 δ(j(ω − ω0 )) = 2π mithin ∞ 2πδ(j(ω − ω0 )) = −∞ ∞
insbes. 2πδ(jω) =
e−j(ω−ω0 )t dt e−jωt dt = F 1
(2.5)
−∞
Die hier auftretenden Zeitsignale x(t) = 1 und x(t) = ejω0 t verletzen die hinreichende Bedingung (2.2) der absoluten Integrierbarkeit. In solchen F¨allen verlangt die spektrale Signalbeschreibung, sofern sie u ¨ berhaupt m¨oglich ist, große Sorgfalt, vgl. z.B. [F¨ ol82]. In diesem Buch wird die extensive Nutzung von Impulssignalen vermieden, auch bei der Behandlung von Abtastsystemen. Faltung im Zeit- und im Frequenzbereich Die Faltung zweier Signale x1 und x2 , erkl¨ art durch ∞ (x1 ∗ x2 )(t) =
x1 (τ )x2 (t − τ )dτ, −∞
widerspiegelt sich im Frequenzbereich als Produkt der Fourier transformierten X1 (jω) und X2 (jω): F (x1 ∗ x2 )(t) = X1 (jω)X2 (jω); denn
46
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
∞ X1 (jω)X2 (jω) =
x1 (t)e −∞ ∞
−jωt
∞
= t=−∞ u=−∞ ∞ ∞
=
∞ dt ·
x2 (u)e−jωu du
−∞
x1 (t)x2 (u)e−jω(t+u) dtdu
x1 (τ − u)x2 (u)e−jωτ dudτ
u=−∞ τ =−∞
⎛
∞
∞
⎝
= τ =−∞ ∞
=
und mit t+u = τ
⎞ x1 (τ − u)x2 (u)du⎠ e−jωτ dτ
u=−∞
(x1 ∗ x2 )(τ )e−jωτ dτ = F (x1 ∗ x2 )(t)
τ =−∞
¨ Mit einer ¨ ahnlichen Uberlegung zeigt man 1 F x1 (t) · x2 (t) = (X1 ∗ X2 ) (jω). 2π F¨ ur ω = 0 liefert dies ∞ −∞
1 x1 (t)x2 (t)dt = 2π
∞
X1 (jω )X2 (−jω )dω .
−∞
Wegen X2 (−jω) = X2 (jω) erhalten wir daraus die Parseval sche Gleichung ∞ −∞
1 x1 (t)x2 (t)dt = 2π
∞ X1 (jω)X2 (jω)dω.
(2.6)
−∞
Im Falle x1 = x2 = x folgt (vgl. (2.1)) ∞
1 x (t)dt = 2π
∞ |X(jω)|2 dω.
2
−∞
−∞
Der Leser methodisch anspruchsvoller B¨ ucher und Aufs¨atze u ¨ber Regelungstheorie trifft in j¨ ungster Zeit h¨ aufig auf das mathematische Denk- und Handwerkszeug der Funktionalanalysis. Dieser mathematische Apparat wird seit etwa drei Jahrzehnten in zunehmendem Maße f¨ ur regelungstheoretische Zwecke eingesetzt und hat es erm¨ oglicht, bemerkenswerte Einsichten zu gewinnen und neue Anwendungsfelder zu kultivieren. Das zeigt ein Blick
2.2 Spektraldarstellung reellwertiger Signale
47
in die B¨ ucher [CZ95], [EJP88], [FOT96], [Fra87], [MG90], [Vid85], [ZDG96] und viele andere. In der funktionalanalytischen Betrachtungsweise werden die quadratisch integrierbaren reellwertigen Signale x(t) 2 zu Elementen eines Hilbert-Raumes3 , n¨ amlich des Signalraumes der quadratisch integrierbaren Signale ⎧ ⎫ ∞ ⎨ ⎬ |x(t)|2 dt < ∞ , L2 (R) = x : R → R mit ⎩ ⎭ −∞
in dem ein Skalarprodukt ∞ x, y =
x(t)y(t)dt −∞
erkl¨ art ist. Die korrespondierenden Fourier-Transformierten X(jω) erscheinen dann als Elemente eines weiteren Hilbert-Raumes, und zwar des Raumes ⎧ ⎫ ∞ ⎨ ⎬ L2 (jR) = X : jR → C mit |X(jω)|2 dω < ∞ ⎩ ⎭ −∞
mit dem Skalarprodukt 1 X, Y = 2π
∞ X(−jω)Y (jω)dω . −∞
Die Parsevalsche Gleichung (2.6) kann nun elegant geschrieben werden, x, y = X, Y . Dies bedeutet, daß die Fourier-Transformation F : L2 (R) → L2 (jR) die beiden Hilbert-R¨ aume bijektiv aufeinander abbildet und dabei das Skalarprodukt invariant l¨ aßt. In der Sprache der Funktionalanalysis formuliert: die Fourier-Transformation vermittelt eine isometrische Isomorphie zwischen der Zeit- und der Frequenzbeschreibung quadratisch integrierbarer Signale. 2
3
Man nennt sie auch energiebeschr¨ ankte“ Signale, um eine physikalische Rea” lit¨ atsn¨ ahe zu suggerieren. Zu Ehren des deutschen Mathematikers David Hilbert (1862-1943).
48
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
Trotz der unbestreitbaren Sch¨ onheit und Eleganz der funktionalanalytischen Signalbeschreibungen, sollen sie in diesem Band nicht extensiv genutzt werden, weil die funktionalanalytische Denkweise einer ausreichenden Ein¨ ubung bedarf, die angesichts der heute in Deutschland u ¨blichen Mathematikausbildung f¨ ur Ingenieure bei den Hauptadressaten dieses Buches nicht stillschweigend vorausgesetzt werden kann. 2.2.3 Von der Fourier - zur einseitigen Laplace-Transformation Zur mathematischen Beschreibung von Signalen, die zu einem bestimmten Zeitpunkt eingeschaltet“ werden, erweist sich der Einheitssprung ” 1 t≥0 1(t) = f¨ ur 0 t<0 als n¨ utzlich. Generell kann man die meisten technisch interessanten Signale durch Multiplikation mit einem Konvergenzfaktor e−σt 1(t) (σ > 0) in absolut integrierbare Signale verwandeln. Dann l¨ aßt sich das Fourier -Integral des modifizierten Signals berechnen: F e−σt 1(t)x(t) =
∞
x(t)e−(σ+jω)t dt =: XL (σ + jω) = XL (s).
0
Zu jedem Signal x, das f¨ ur t < 0 verschwindet und f¨ ur t ≥ 0 einer Betragsbeschr¨ ankung |x(t)| < Keγt (K > 0, γ ∈ R) gen¨ ugt, kann ∞ XL (s) :=
x(t)e
−st
∞ dt =
e−σt 1(t)x(t) e−jωt dt
−∞
0
f¨ ur alle s = σ + jω mit σ > γ berechnet werden. Die Fourier -R¨ ucktransformation liefert e
−σt
1 1(t)x(t) = 2π
x(t) = 1(t) · x(t) = 1 = 2πj
1 2π
∞ XL (σ + jω)ejωt dω, −∞
∞ XL (σ + jω)e(σ+jω)t dω −∞
j∞ XL (σ + jω)e −j∞
mithin
(σ+jω)t
1 d(jω) = 2πj
σ+j∞
XL (s)est ds . σ−j∞
Damit haben wir die Grundbeziehungen der einseitigen Laplace-Transformation zusammengetragen:
2.2 Spektraldarstellung reellwertiger Signale
L x(t) =
∞
49
x(t)e−st dt = XL (s),
0 −1
L
1 XL (s) = 2πj
σ+j∞
XL (s)est ds = x(t),
wobei t ≥ 0.
σ−j∞
Der Integrationsweg des Umkehrintegrals verl¨auft parallel zur imagin¨aren Achse in der Konvergenz-Halbebene {s : Re s > γ}. In der komplement¨aren linken Halbebene kann XL (s) singul¨ are Stellen aufweisen. Handelt es sich dabei lediglich um Polstellen, so l¨ aßt sich das Umkehrintegral einfach mit Hilfe der Residuen von XL (s)est berechnen: In Gedanken ersetzen wir den IntegrajIm s tionsweg entlang der Geraden σ + jω mit −∞ < ω < ∞ durch einen hinreichend großen Halbkreis (vgl. Bild 2.2), der alle Polstellen si umschliesst und wenden den Residuensatz der Funktionentheorie an: Re s σ σ+j∞ 1 L−1 XL (s) = XL (s)est ds 2πj σ−j∞ 1 XL (s)est ds = 2πj !
Res XL (s)est s=si = γ (i)
Bild 2.2. Ver¨ anderter Integrationsweg
Um die (einseiten) Laplace-Tansformierten in Signalr¨aume (im Sinne der Funktionalanalysis) einordnen zu k¨ onnen, haben wir von der Menge der Funktionen auszugehen, die auf einer rechten Halbebene von C holomorph sind. Man spricht in diesem Zusammenhang von Hardy-R¨aumen.4 Der Hardy -Raum H∞ ist so definiert: H∞ = {X : C+ → C,
X(s) ist holomorph f¨ ur Re s ≥ 0,
||X||∞ < ∞},
wobei ||X||∞ := sup |X(s)|. Re s>0
Im Rahmen der linearen Regelungstheorie ergeben sich die Signale im Frequenzbereich meistens als reell-rationale Funktionen in s. Der dadurch definierte Hardy-Raum RH∞ l¨ aßt sich recht einfach charakterisieren: RH∞ umfaßt die Menge aller properen reell-rationalen Funktionen, die keine Pole in der abgeschlossenen rechten Halbebene haben. 4
Zu Ehren des britischen Mathematikers G.H. Hardy (1877-1947).
50
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
In der Sprechweise der Regelungstechnik sagt man es k¨ urzer: Die Elemente ¨ des Hardy-Raumes RH∞ sind nichts anderes als die stabilen Ubertragungsfunktionen. Die wichtigsten Rechenregeln f¨ ur den praktischen Gebrauch der (einseitigen) Laplace-Transformation findet man in allen einschl¨agigen Lehrb¨ uchern f¨ ur das Grundstudium der Elektro- und Informationssystemtechnik. In Anbetracht ihrer regelungstechnischen Bedeutung sollen hier nur die beiden Endwerts¨ atze, lim x(t) = lim s · XL (s) , t→∞ s→0 lim x(t) = lim s · XL (s) , t→0
s→∞
und die Laplace-Transformierten von abgeleiteten Signalen notiert werden: L x(t) ˙ = sXL (s) − x(−0) L x ¨(t) = s2 XL (s) − sx(−0) − x(−0) ˙ .. . n−1 (n) sn−k−1 x(k) (−0) . (2.7) L x (t) = sn XL (s) − k=0
Die Fourier -Transformierte X ist das “Bild” eines auf der ganzen Zeitachse definierten Signals x und die Laplace-Transformierte XL das “Bild” eines zur Zeit t = 0 eingeschalteten Signals x. Es sind komplexwertige Funktionen mit verschiedenen Definitionsbereichen, R ← R : x ◦−−−• X : Gerade jR → C R ← R+ : x ◦−−−• XL : Halbebene {s : Res > γ ∈ R} → C. Daher entsteht beim sachkundigen Umgang mit diesen beiden Transformierten auf Grund des jeweiligen Kontextes kaum eine Verwechselungsgefahr. Deshalb wird im weiteren dem in der Regelungstechnik u ¨ blichen Gebrauch gefolgt und der schreibtechnischen Einfachheit halber das Funktionssymbol XL auf X verk¨ urzt.
¨ 2.3 Eigenschaften von Ubertragungssystemen ¨ Wir wenden uns nun Ubertragungssystemen zu, deren Ein- und Ausgangssignale endlich-dimensionale Vektoren sind. Die Komponenten dieser Vektoren sind reellwertige Signale, von deren Darstellungsm¨oglichkeiten der Abschnitt ¨ 2.2 handelte. Man spricht dann kurz von MIMO-Ubertragungssystemen (multiple-input multiple-output systems).
¨ 2.3 Eigenschaften von Ubertragungssystemen
51
Um den Unterschied zu skalarwertigen Signalen sichtbar zu machen, werden mehrkomponentige Signale in diesem Buch durch Fettdruck-Buchstaben hervorgehoben. Generell wollen wir u(t) ∈ Rm y(t) ∈ Rr
f¨ ur die Eingangssignale und f¨ ur die Ausgangssignale
vereinbaren. ¨ Ubertragungssysteme mit einem skalarwertigen Eingang u(t) und ei¨ nem skalarwertigen Ausgang y(t) werden als SISO-Ubertragungssysteme (single-input single-output systems) bezeichnet. Sie lassen sich als Spezialfall ¨ der MIMO-Ubertragungssysteme mit r = m = 1 auffassen. ¨ Ubertragungsoperator ¨ Ein Ubertragungssystem transformiert ein Eingangssignal u(t), das zum Anfangszeitpunkt t = 0 eingeschaltet wird, in ein Ausgangssignal y(t). Das Ergebnis muß nicht eindeutig ausfallen, weil sich die Anfangssituation m¨oglicherweise vorhandener interner Speicherelemente ebenfalls auf den Signalverlauf y(t) f¨ ur t > 0 auswirkt. ¨ F¨ ur (dynamische) Ubertragungssysteme gilt die allgemeine Transformationsvorschrift y(t) = Φt0 [u(τ ) f¨ ur 0 ≤ τ < t; z(−0)]
f¨ ur t > 0.
(2.8)
Dabei charakterisiert der Deskriptorvektor“ z(−0) die interne Situation des ” Systems unmittelbar vor dem Einschaltzeitpunkt t = 0 des Signals u. Der Operator Φt0 symbolisiert eine Abbildungsvorschrift, gem¨aß der sich Anfangswerte und Eingangssignal im Zeitintervall [0, t] in das Ausgangssignal y(t) transformieren. Im Bild 2.3 wird unterstellt, daß der Einfluß der Anfangssituation z(−0) ¨ separiert und das Ubertragungssystem durch einen (Eingangs-Ausgangs)¨ Ubertragungsoperator T charakterisiert werden kann, der einen eindeutigen mathematischen Zusammenhang zwischen dem eingepr¨agten“ Eingangs” signal u(t) und dem Ausgangssignal y(t), der zugeh¨orenden Antwort“ des ” ¨ Ubertragungssystems, herstellt.
y(t) ∈ Rr
Bild 2.3.
T
u(t) ∈ Rm
¨ Ubertragungsoperator T , der ein m−komponentiges Eingangssignal in ein r−komponentiges Ausgangssignal transformiert
52
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
¨ Die Wirkungsweise des Ubertragungsoperators l¨aßt sich abstrakt durch die Gleichung y=T ◦u symbolisieren, wobei das Symbol ◦” als K¨ urzel f¨ ur angewandt auf“ steht. ” ” ¨ Wir wollen nun wichtige Eigenschaften von (Eingangs-Ausgangs-)Uber¨ tragungsoperatoren behandeln und uns dabei auf SISO-Ubertragungssysteme beschr¨ anken. 5 2.3.1 Linearit¨ at ¨ ¨ Es bezeichne y i die Antwort eines SISO-Ubertragungssystems mit dem Ubertragungsoperator T auf das Eingangssignal ui . ¨ ¨ Definition 2.1. Der Ubertragungsoperator T eines SISO-Ubertragungssystems heißt linear, wenn er jede Linearkombination von Eingangssignalen ui auf dieselbe Linearkombination der zugeh¨orenden Ausgangssignale y i abbildet. Mathematische Formulierung: ⎛ ⎞ αi ui ⎠ = αi T ◦ ui , T ◦⎝ (i)
wobei αi ∈ R.
(2.9)
(i)
Bei der Deutung der Beziehung (2.9) d¨ urfen die Signale ui nicht mit Signali werten u (t) f¨ ur feste Zeitpunkte t verwechselt werden. Sowohl ui als auch i T ◦ u sind als Funktionen der Zeit t u ¨ ber einem gewissen Definitionsbereich erkl¨ art. Als regelungstechnisch bedeutsamen Spezialfall betrachten wir ein SISO¨ Ubertragungssystem (Bild 2.4), welches sein Eingangssignal nach einer bestimmten Laufzeit TL > 0 unver¨ andert wieder ausgibt. (In der DIN 19226 wird die Laufzeit“ als Totzeit“ bezeichnet und vom Totzeitglied gespro” ” chen.) Die das Totzeitglied definierende Gleichung y(t) = u(t − TL )
f¨ ur eine Laufzeit TL > 0
(2.10)
l¨ aßt sich in Operatorschreibweise mit einem Zeitverschiebeoperator STL anstelle des allgemeinen Symbols T notieren: y = STL ◦ u 5
¨ Ein MIMO-Ubertragungssystem mit einem m−komponentigen Eingangssignal in einem r−komponentigen Ausgangssignal darf man – so wird sp¨ ater gezeigt – ¨ als eine Gesamtheit von r · m einzelnen SISO-Ubertragungssystemen auffassen.
¨ 2.3 Eigenschaften von Ubertragungssystemen
53
u
TL
t
TL
t
y
Bild 2.4. Eingangs- und Ausgangssignal eines Totzeitgliedes
Die Laplace-Transformation von (2.10) f¨ uhrt auf Y (s) = e−sTL U (s). Folglich erscheint der Verschiebeoperator STL im Bildbereich als Multiplikator e−sTL . Wegen −sTL i e−sTL αi U i (s) = αi e U (s) (i)
(i)
¨ ist das Totzeitglied als ein lineares Ubertragungssystem einzuordnen. 2.3.2 Zeitinvarianz ¨ Definition 2.2. Ein SISO-Ubertragungssystem heißt zeitinvariant, wenn eine beliebige zeitliche Verschiebung τ des Eingangssignals die gleiche zeitliche Verschiebung des Ausgangssignals bewirkt, m. a. W., falls dann
y(t) y(t − τ )
als die Antwort auf als die Antwort auf
u(t) erscheint, u(t − τ ).
Diese Aussage l¨ aßt sich in Operatorschreibweise notieren: F¨ ur beliebige Werte τ > 0 und beliebige (zul¨ assige) Eingangssignale u gilt T ◦ (Sτ ◦ u) = Sτ ◦ (T ◦ u) = Sτ ◦ y, in Kurzschreibweise: T ◦ Sτ = Sτ ◦ T
f¨ ur alle τ ∈ R.
¨ ¨ Bei zeitinvarianten Ubertragungssystemen sind der Ubertragungsoperator T und jeder Zeitverschiebeoperator Sτ vertauschbar.
54
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
2.3.3 Kausalit¨ at ¨ Definition 2.3. Ein SISO-Ubertragungssystem heißt kausal 6 , wenn f¨ ur beliebige Zeitpunkte τ > 0 der Verlauf des Ausgangssignals y bis zur Zeit τ nur vom Verlauf des Eingangssignals u bis zur Zeit τ beeinflußt wird. Zur mathematischen Formulierung des Kausalit¨atsbegriffs verwenden wir einen Projektionsoperator Pτ , der den Signalverlauf f¨ ur t > τ ausblendet, vgl. Bild 2.5: Pτ ◦ u(t) =
u(t) 0
f¨ ur
t≤τ . t>τ
τ
t
τ
t
u
Pτ ◦ u
Bild 2.5. Projektionsoperator Pτ
Die Forderung der Kausalit¨ at besagt, daß f¨ ur beliebige (zul¨assige) Eingangssignale u gilt P τ ◦ T ◦ u = P τ ◦ T ◦ Pτ ◦ u , in Kurzschreibweise: P τ ◦ T = P τ ◦ T ◦ Pτ
f¨ ur alle τ > 0.
¨ Auf regelungtechnisch relevante Beispiele f¨ ur akausale Ubertragungssysteme werden wir im Abschnitt 7.5.1 bei der Behandlung von Haltegliedern erster Ordnung treffen. 6
Abgeleitet vom lateinischen Wort causa“ = Ursache. ”
2.4 Darstellungsformen von LTI-Systemen
55
¨ 2.3.4 LTI-Ubertragungssysteme ¨ F¨ ur (dynamische) Ubertragungssysteme, die im Zusammenhang mit der allgemeinen Transformationsvorschrift (2.8) diskutiert wurden, k¨onnen die Eigenschaften der Zeitinvarianz und der Linearit¨at nun so formuliert werden: Zeitinvarianz: F¨ ur beliebige t0 > 0 gilt 0 ur 0 ≤ τ < t; z(−0)] = Φt+t ur t0 ≤ τ < t + t0 ; z(t0 − 0)] Φt0 [u(τ ) f¨ t0 [u(τ ) f¨
Linearit¨ at: F¨ ur beliebige reelle Zahlen α1 , α2 , β1 , β2 gilt Φt0 [α1 u1 (τ ) + α2 u2 (τ ); β1 z1 (−0) + β2 z2 (−0)] = α1 Φt0 [u1 (τ ); 0] + α2 Φt0 [u2 (τ ); 0] + β1 Φt0 [0; z1 (−0)] + β2 Φt0 [0; z2 (−0)] (2.11) ¨ Ubertragungssysteme mit einer linearen und zeitinvarianten Transformationsvorschrift (2.8) werden kurz LTI-Systeme genannt. Das Akronym LTI geht aus den Anfangsbuchstaben der W¨ orter linear“, tempus“ (lat.) oder time“ ” ” ” (engl.) und invariant“ hervor. ” Jeder der beiden Operatoren Φt0 [u(τ ) f¨ ur 0 ≤ τ < t; 0] und Φt0 [0; z(−0)] ¨ ist ein LTI-MIMO-Ubertragungsoperator.
2.4 Darstellungsformen von LTI-Systemen ¨ ¨ 2.4.1 Ubertragungsfunktionen und Ubertragungsmatrizen Bei der Behandlung der hydraulischen Anlage im Einf¨ uhrungskapitel waren auf Seite 34 das F¨ uhrungsverhalten des (linearisierten) geregelten Systems durch eine Differentialgleichung der Struktur d3 d2 d u S (t) = a3 dt h(t), 3 + a2 dt2 + a1 dt + a0 und das St¨ orverhalten durch eine Differentialgleichung der Struktur d2 d d3 d2 d b2 dt p(t) = a3 dt h(t) 2 + b1 dt 3 + a2 dt2 + a1 dt + a0 beschrieben worden. Die L¨ osungen dieser Differentialgleichungen h¨angen vom Verlauf der exogenen Signale u S und p, aber auch von den Anfangswerten ˙ ¨ h(−0), h(−0) und h(−0) sowie p(−0) und p˙ (−0) ab. Die Differential-Gleichungen gehen durch Laplace-Transformation unter Nutzung der Beziehung (2.7) in algebraische Gleichungen im Bildbereich u ¨ ber. Bei verschwindenden Anfangswerten erhalten wir
56
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
S (s) = a3 s3 + a2 s2 + a1 s + a0 H(s) U und
b2 s2 + b1 s P(s) = a3 s3 + a2 s2 + a1 s + a0 H(s) .
S (s), P(s))T des zwei¨ Der Ubertragungsoperator vom Bildvektor U(s) := (U komponentigen Eingangssignals zur Bildgr¨ oße H(s) =: Y (s) des skalaren Ausgangssignals ergibt sich aus der Gleichung S (s) 1 b 2 s2 + b 1 s U Y (s) = · a 3 s 3 + a 2 s 2 + a 1 s + a0 a 3 s 3 + a 2 s 2 + a 1 s + a0 P (s) ¨ als eine (1 × 2)−Ubertragungsmatrix, und zwar b 2 s2 + b 1 s 1 =: G(s) . a 3 s 3 + a 2 s 2 + a 1 s + a0 a 3 s 3 + a 2 s 2 + a 1 s + a0 Generell, bei zeitabh¨ angigen Signalvektoren u : R+ → Rm , y : R+ → Rr ¨ und einem LTI-MIMO-Ubertragungssystem – wie im Bild 2.3 auf Seite 51 ¨ festgehalten – stellt sich der Ubertragungsoperator T im Bildbereich als eine ¨ Ubertragungsmatrix G(s) ∈ C r×m dar. Der Bildvektor der Ausgangsgr¨ oßen Y(s) ∈ Cr entsteht aus dem Vektor der Eingangsgr¨oßen U(s) ∈ Cm ¨ durch Multiplikation mit der Ubertragungsmatrix, Y(s) = G(s) · U(s). ¨ Mit der Ubertragungsmatrix wurde eine sehr n¨ utzliche Darstellungsm¨oglich¨ keit des Ubertragungsoperators f¨ ur LTI-Systeme gewonnen. Man darf die ¨ Ubertragungsmatrizen mit Fug und Recht als das R¨ uckgrat der linearen Regelungstheorie bezeichnen. In Komponentenschreibweise erh¨alt man Y (s) =
m
G µ (s) · Uµ (s)
f¨ ur
= 1, . . . , r,
µ=1
¨ von der µ-ten Komponente wobei G µ (s) die skalare Ubertragungsfunktion des Eingangs zur -ten Komponente des Ausgangs darstellt. Jeder einzel¨ ¨ ne Eintrag der Ubertragungsmatrix verk¨ orpert demnach eine SISO-Ubertragungsfunktion. Wenn die Zusammenh¨ ange zwischen Eingangs- und Ausgangssignalen eines LTI-Systems im Zeitbereich durch gew¨ ohnliche Differentialgleichungen (mit konstanten reellen Koeffizienten) beschrieben werden, so erh¨alt man daraus im Bildbereich lineare algebraische Gleichungssysteme. Die Eintr¨age der (durch die Laplace-Transformation entstandenen) Koeffizientenmatrizen sind Polynome in der komplexen Variablen s. Der allgemeine Fall einer solchen polynomialen Systembeschreibung“ wird in diesem Buch erst im Kapitel 6 ”
2.4 Darstellungsformen von LTI-Systemen
57
systematisch studiert. Das vorliegende Kapitel konzentriert sich auf Regelstreckenmodelle, die mit Polynomen ersten Grades (Abschnitt 2.4.2) oder mit Polynomen zweiten Grades (Abschnitte 2.5.3 und 2.5.5) auskommen. Bei ¨ polynomialen Systembeschreibungen ergeben sich die Eintr¨age der Ubertragungsmatrix stets in der Gestalt von gebrochen rationalen Funktionen mit reellen Koeffizienten, k¨ urzer formuliert, als reell-rationale Funktionen in s. In der Sprache der Algebra sagt man: Die Eintr¨ age Gj i (s) sind Elemente des ¨ K¨ orpers R(s), und f¨ ur die Ubertragungsmatrix schreibt man r×m G(s) ∈ R(s) . ¨ 2.4.2 Berechnung von Ubertragungsmatrizen f¨ ur Systeme in Deskriptor-Darstellung ¨ Bei der praktischen Ermittlung von Ubertragungsfunktionen bedient man sich zweckm¨ aßigerweise der Arbeitstechniken, die sich auf dem Fachgebiet, aus dem die Regelstrecke stammt, bew¨ ahrt haben. Beispiel 2.2 Bild 2.6 zeigt zwei gekoppelte W¨armeb¨ader. Die beiden W¨armeb¨ader
kalt
ϑe (t) Rw1
Rw2
heiß R¨ ucklauf ϑ1 , Cw1
ϑ2 , Cw2
Bild 2.6. Zwei gekoppelte W¨ armeb¨ ader, von denen eines beheizt wird uhrwerke sorgen daf¨ ur, daß sich haben die W¨ armekapazit¨ aten Cw1 und Cw2 . R¨ ortlich innerhalb der beiden W¨ armeb¨ ader jeweils keine Temperaturdifferenz bil¨ den kann. Zwischen den beiden B¨ adern kann W¨ arme u armewiderstand ¨ ber den W¨ Rw1 und zwischen dem rechten W¨ armebad und dem umgebenden Medium u ¨ ber den W¨ armewiderstand Rw2 ausgetauscht werden. Die Temperaturen ϑ1 und ϑ2 – sie geben die Temperaturdifferenzen zwischen dem jeweiligen W¨ armebad und der konstanten Bezugstemperatur des umgebenden Mediums an – werden durch einen von links einfließenden W¨ armestrom q beeinflußt. Die Zulauftemperatur ϑe kann in einer Mischbatterie zeitabh¨ angig eingestellt werden. Der im linken Bad zufließende W¨ armestrom q ist mit der Temperaturdifferenz (ϑe − ϑ1 ) u armewiderstand Rw0 verkn¨ upft, ¨ ber einen W¨
ϑe (t) − ϑ1 (t) = Rw0 · q(t). Die W¨ armestrombilanzen f¨ ur die beiden W¨ armeb¨ ader lassen sich wie folgt notieren:
58
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen q(t) =
1 1 ϑe (t) − ϑ1 (t) = Cw1 ϑ˙ 1 (t) + ϑ1 (t) − ϑ2 (t) Rw0 Rw1 1 1 − ϑ2 (t) = Cw2 ϑ˙ 2 (t) + ϑ2 (t) − ϑ1 (t) Rw2 Rw1
(2.12) (2.13)
Zur eindeutigen L¨ osung werden die Anfangswerte ϑ1 (−0) und ϑ2 (−0) gebraucht. Das gefundene mathematische Modell kann als thermisches Netzwerk interpretiert werden (siehe Bild 2.7). Die beiden Gleichungen (2.12) und (2.13) geben die W¨ armestrombilanzen f¨ ur die Knoten“ 1 und 2 wieder. Das Netzwerkmodell legt ” q
Rw0
ϑe
•
Cw1
1
Rw1
ϑ1
2
•
Cw2
•
•
Rw2
•
ϑ2
•
Bild 2.7. Thermisches Netzwerkmodell f¨ ur zwei gekoppelte W¨ armeb¨ ader
es nahe, das thermische System sofort im Bildbereich (nach den Regeln der Kno” ten(spannungs)analyse“ der Elektrotechnik) anzuschreiben,
1 1 + + s · Cw1 Rw0 R w1
−
1 Rw1
−
1 Rw1
1 1 + + s · Cw2 Rw1 Rw2
Θ1 (s)
Θ2 (s)
Θe (s)
R w0 = .
0 (2.14)
H¨ atte man (2.12) und (2.13) einer Laplace-Transformation unterzogen und die Anfangswerte ϑ1 (−0) = 0 und ϑ2 (−0) = 0 gesetzt, so w¨ are man ebenfalls zu (2.14) gelangt.
Beispiel 2.3 Eine Gruppe elektrischer Beispielsysteme zeigt Bild 2.8. Es handelt sich um RC-Schaltungen mit einem Operationsverst¨ arker. Die Regelstrecke wird wiederum im Bildbereich durch ein algebraisches lineares Gleichungssystem dargestellt. Die gew¨ ahlte Systembeschreibung umfaßt eine Steuergr¨ oße, n¨ amlich U e , und k + 3 weitere Systemgr¨ oßen. Die Systemgr¨ oße I(s) kennzeichnet den Strom i(t), der durch den Knoten (k + 2) in Richtung Operationsverst¨ arker fließt, die Systemgr¨ oßen Uφκ (s) die Spannungsabf¨ alle uφκ (t) zwischen dem jeweiligen Knoten κ (f¨ ur κ = 1, 2, . . . , k + 2) und dem Bezugsknoten. Die Netzwerkgleichungen ergeben sich im Bildbereich unmittelbar aus dem skizzierten Stromlaufplan. Mit der Abk¨ urzung Gi = 1/Ri ; i = 0, 1, . . . , k+1; lauten die modifizierten Knotenspannungs-Gleichungen, vgl. [RS76], S.141 ff.
2.4 Darstellungsformen von LTI-Systemen
59
Bild 2.8. RC-Schaltung mit Operationsverst¨ arker
0 1 0 −G1 0 G0 +G1 0 −G1 G1 +G2 +sC1 0 0 −G2 .. .. .. . . . 0 0 0 1 0 0
··· 0 0 ··· 0 0 ··· 0 0 ··· 0 0 .. .. .. . . . · · · Gk +Gk+1 +sCk −Gk+1 ··· −Gk+1 −Gk+1
I(s) 0 (s) U U −G (s) U 0 . = .. .. . 0 U (s) φ1
0
φ2
φk+1
Uφk+2 (s)
e
(s)
0
Die bei den Beispielen gewonnenen Systembeschreibungen geh¨oren zur Familie von Algebro-Differentialgleichungssystemen der Gestalt ˙ + A0 z(t) + B0 u(t) = 0 . A1 z(t)
(2.15)
Man spricht gern von einer Deskriptor-Darstellung, weil sich im De” skriptorvektor“ z(t) ∈ Rp alle Systemsignale, die neben den Eingangssignalen eine Rolle spielen, auf ganz nat¨ urliche Weise beschreiben“ lassen. Die interes” sierenden Ausgangssignale sind oft Komponenten des Deskriptorvektors. Im allgemeinen ergibt sich der Ausgangsvektor y(t) ∈ Rr als Linearkombination von Deskriptor- und von Eingangssignalen, y(t) = C0 z(t) + D0 u(t) .
(2.16)
Die Laplace-Transformation von (2.15) und (2.16) liefert eine DeskriptorDarstellung im Bildbereich, (sA1 + A0 ) Z(s) + B0 U(s) = A1 z(−0) Y(s) = C0 Z(s) + D0 U(s) .
(2.17) (2.18)
Wenn das Polynom det(sA1 + A0 ) vom Nullpolynom verschieden ist, spricht man von einem regul¨ aren Deskriptorsystem. Die Regularit¨atsbedingung det(sA1 + A0 ) ≡ 0 ist im Falle A1 = I, wenn also die Matrix A1 gleich der Einheitsmatrix wird, gewiß erf¨ ullt. Dieser Spezialfall einer Deskriptorbeschreibung (2.17),
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
60
(2.18) erlangte in der Regelungstechnik seit den 1960er Jahren unter dem Schlagwort Zustandsbeschreibung“ große Popularit¨at. Anhand des Beispiels ” 2.3 l¨ aßt sich erkennen, daß es regul¨ are Deskriptorsysteme mit det A1 = 0 gibt, f¨ ur die die u ¨ bliche Zustandsbeschreibung daher nicht brauchbar ist. F¨ ur regul¨ are Deskriptorsysteme (2.17), (2.18) kann man einen geschlosse¨ nen Ausdruck f¨ ur die Ubertragungsmatrix herleiten: ¨ Uber den Zwischenschritt Z(s) = (sA1 + A0 )−1 (−B0 U(s) + A1 z(−0)) folgt −1
Y(s) = C0 (sA1 + A0 ) (−B0 U(s) + A1 z(−0)) + D0 U(s) −1 = −C0 (sA1 + A0 )−1 B0 + D0 U(s) + C0 (sA1 + A0 ) A1 z(−0) . ¨ Das Ubertragungsverhalten bei einer “energielosen” Anfangssituation, d. h. ¨ f¨ ur z(−0) = 0, wird durch die Ubertragungsmatrix G(s) := −C0 (sA1 + A0 )−1 B0 + D0
(2.19)
bestimmt. ¨ Die Elemente der Ubertragungsmatrix G(s) ∈ (R(s))(r×m) sind reell¨ rationale Ubertragungsfunktionen, die man wie folgt berechnen kann:7 Gµ (s) = eT G(s)eµ = eT −C0 (sA1 + A0 )−1 B0 + D0 eµ = − eT C0 (sA1 + A0 )−1 B0 eµ + dµ " #$ % " #$ % =: b•µ
=: c•
&
'−1 = det(sA1 + A0 ) · det
sA1 + A0 c•
b•µ 0
+ dµ .
¨ 2.4.3 Gewichtsfunktion, Ubergangsfunktion und Frequenzgangdarstellungen Nun soll noch an einige Begriffsbildungen, die in direktem Zusammenhang mit ¨ skalaren Ubertragungsfunktionen stehen und aus dem regelungstechnischen Alltag nicht wegzudenken sind, erinnert werden. Es gen¨ ugt, von einer SISO¨ Ubertragungsfunktion, die als Quotient G(s) =
Y (s) U (s)
geschrieben werden darf, auszugehen. 7
Hier bezeichnet e den Einheitsvektor, dessen -te Komponente Eins ist, w¨ ahrend alle u ¨ brigen Komponenten Nullen sind.
2.4 Darstellungsformen von LTI-Systemen
61
Beispiel 2.4 Die Strukturen der F¨uhrungs¨ubertragungsfunktion und der St¨or¨ubertragungsfunktion, auf die wir bei der Behandlung des geregelten hydraulischen Systems im Einf¨ uhrungskapitel auf Seite 34 gestoßen waren, m¨ ogen der Veranschau¨ lichung dienen. Gew¨ ahlt werden die beiden Ubertragungsfunktionen G1 (s) =
4 2s3
+
5s2
G2 (s) =
und
+ 4s + 4
2s3
2s2 + s . + 5s2 + 4s + 4
¨ Die beiden Gewichts- und die beiden Ubergangsfunktionen sind in den Bildern 2.9 und 2.10 zu sehen. Die Ortskurven der Frequenzg¨ ange G1 (jω) und G2 (jω) zeigt das ange G1 (jω) und G2 (jω) Bild 2.11, w¨ ahrend die Bode-Diagramme8 der Frequenzg¨ sich in Bild 2.12 und ihre Nichols-Diagramme9 in Bild 2.13 finden.
g1 (t)
g2 (t) 1
0.6
0.8 0.4
0.6 0.4
0.2
0.2 0 0 −0.2
−0.2 0
5
10
t
15
20
25
0
5
10
t
15
20
25
15
20
25
Bild 2.9. Gewichtsfunktionen zu Beispiel 2.4
h1 (t)
h2 (t)
1.4 0.3
1.2 1
0.2
0.8
0.1
0.6
0
0.4 −0.1 0.2 0
−0.2 0
5
10
t
15
20
25
0
5
10
t
¨ Bild 2.10. Ubergangsfunktionen zu Beispiel 2.4
Wird U (s) = 1 gesetzt, so heißt das im Zeitbereich, an den Eingang des ¨ (energielosen) Ubertragungssystems wird ein Signal u(t) = L−1 {1} = δ(t), 8 9
Zu Ehren des US-amerikanischen Ingenieurs Nathaniel B. Nichols (geb. 1914) Zu Ehren des US-amerikanischen Ingenieurs Hendrik W. Bode (1905–1982)
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
62
das man als Dirac-Impuls“ bezeichnet, angelegt. Am Ausgang erscheint als ” Impulsantwort die sog. Gewichtsfunktion g(t). ¨ Der Zusammenhang zwischen der Ubertragungsfunktion und der Gewichtsfunktion ist durch G(s) = L{g(t)} bzw. g(t) = L−1 {G(s)} festgelegt. Wird ein Zeitsignal u(t) = L−1 { 1s } = 1(t) 10 angelegt, so reagiert ¨ das System mit einer Sprungantwort, der sog. Ubergangsfunktion h(t), die durch G(s) = L{h(t)} s
bzw. h(t) = L−1 {
G(s) } s
bestimmt ist. G2 (jω)
0
0.6
−0.5
0.4
Im G(jω)
Im G(jω)
G1 (jω)
−1
−1.5
ω w¨ achst
0.2 0
ω w¨ achst −0.2 −1
−0.5
0
0.5
Re G(jω)
1 0
0.2
0.4
0.6
0.8
1
Re G(jω) Bild 2.11. Ortskurven zu Beispiel 2.4
Wird nicht die Abbildung der gesamten s-Ebene in die G(s)-Ebene betrachtet, sondern nur das Bild der imagin¨ aren Achse, dann erh¨alt man den Frequenzgang G(jω) mit ω ∈ R. Die Darstellung des Frequenzganges G(jω) =Re G(jω) + jIm G(jω) in Abh¨ angigkeit vom Parameter ω in der komplexen Ebene nennt man • Ortskurve f¨ ur 0 < ω < ∞ (im deutschsprachigen Raum u ¨ blich) • Nyquist-Diagramm f¨ ur −∞ < ω < ∞. Im Bode-Diagramm werden Amplitude und Phase des Frequenzganges separat u ¨ ber der Frequenz ω dargestellt. Ausgehend von G(jω) = |G(jω)| · ejarc G(jω) 10
Symbol f¨ ur den Einheitssprung“, definiert auf Seite 48. ”
2.4 Darstellungsformen von LTI-Systemen
63
20 log |G(jω)| [dB] 0
|G2 (jω)|
−20 −40
|G1 (jω)|
−60 −80 −1
0
10
1
10
10
ω ϕ [◦ ]
90
arc G2 (jω) 0
arc G1 (jω) −90 −180 −270 −1
0
10
1
10
10
ω
Bild 2.12. Bode-Diagramme zu Beispiel 2.4(0.1 ≤ ω ≤ 32) G2 (jω)
0 −20
20 log |G(jω)| [dB]
20 log |G(jω)| [dB]
G1 (jω)
ω w¨ achst
−40
ω w¨ achst
0
−20
−60 −80
−100
−40 −270 −225 −180 −135 ◦
ϕ[ ]
−90
−45
0
−90
−60 −30
0
ϕ [◦ ]
30
60
90
Bild 2.13. Nichols-Diagramme zu Beispiel 2.4
als Amplitudenfrequenzgang und • |G(jω)|dB = 20 lg |G(jω)| in • arc G(jω) = ϕ(ω) als Phasenfrequenzgang Abh¨ angigkeit von ω im logarithmischen Maßstab (lg ω) aufgetragen. Im Nichols-Diagramm werden das Amplitudenmaß |G(jω)|dB als Ordinate und das Phasenmaß arc G(jω) als Abszisse gew¨ ahlt, um den Frequenzgang darzustellen. werden
64
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
2.5 Extremalprinzipien und Bewegungsgleichungen 2.5.1 Vorbemerkungen Das Verhalten eines realen Systems wird oft durch ein Optimalit¨atsprinzip bestimmt, das sich naturwissenschaftlich begr¨ unden l¨aßt. Die Funktionsweise mechanischer Systeme, die seit dem Altertum als technische Konstruktionen und Vorrichtungen genutzt werden, l¨ aßt sich weitgehend mit den Prinzipien der analytischen Mechanik erkl¨ aren. Je nach der Art der Modellbildung wird dort zwischen Massenpunktsystemen, starren Mehrk¨orpersystemen, FiniteElemente-Systemen, flexiblen Mehrk¨ orpersystemen, Fl¨ ussigkeiten und Gasen unterschieden. Diese Modelle werden in den verschiedensten technischen Disziplinen wie Baudynamik, Biomechanik, Fahrzeugdynamik, Robotertechnik, Hydrodynamik und Akustik als gemeinsame Konzepte verwendet. Alle diese Disziplinen haben Aufgaben der Steuerung und Regelung zu l¨osen und sind daher potentielle Arbeitsfelder f¨ ur einen Regelungstechniker. Dieser sollte daher wissen, daß sich die Bewegungsgleichungen der unterschied¨ lichsten Ubertragungssysteme, die als Regelstreckenmodelle vorgelegt werden, aus einheitlichen Extremalprinzipien herleiten lassen. Hinzu kommt, daß solche Optimalit¨ atsprinzipien auch die Kinetik in Objektbereichen jenseits der Mechanik bestimmen und die methodische Grundlage f¨ ur den optimalen Entwurf von Reglern bilden. Im folgenden werden die elementaren Zusammenh¨ ange zwischen einem u ¨ bergeordneten Optimalit¨atsprinzip, den Bewegungsgleichungen und physikalischen Erhaltungss¨atzen erl¨autert. Eine von jedermann und jederzeit nachvollziehbare Erfahrung lehrt, daß die stabile Gleichgewichtslage eines sich selbst u ¨ berlassenen mechanischen Systems im Erdschwerefeld dadurch gekennzeichnet ist, daß die potentielle Energie des Systems ein Minimum annimmt. Es gelingt nicht, durch eine (gedachte kleine) Verschiebung der Positionen von Teilen des Systems die potentielle Energie des Gesamtsystems zu reduzieren. Als Beispiel stellen wir uns eine Kette vor, die an zwei in die Zimmerwand geschlagenen N¨ ageln 1 und 2 aufgeh¨angt wird, vgl. Bild 2.14. Es stellt sich unter der Wirkung des Erdschwerefeldes stets eine sog. Kettenlinie“ ein, deren Gestalt nicht davon abh¨angt, ob es sich um ” eine Kette aus Perlen oder Eisengliedern oder um ein schweres flexibles Seil handelt. Lediglich die Kettenl¨ ange spielt eine Rolle. Um das Beispiel rechnerisch zu behandeln, werden Kenntnisse der Variationsrechnung ben¨otigt (siehe Abschnitte 2.5.2 und2.5.6). Hier m¨ ochten wir nur noch auf eine Beobachtung hinweisen: Werden ein oder mehrere innere Punkte der (nach dem Aufh¨ angen zur Ruhe gekommenen) Kette nachtr¨aglich an der Wand fixiert im Bild 2.14 wurden beispielsweise die Punkte 3 und 4 gew¨ahlt -, so ¨andert sich dadurch der Verlauf der Kettenlinie nicht. Unser Beispiel veranschaulicht eine tieferliegende allgemeine Gesetzm¨ aßigkeit aus der Theorie der optimalen Steuerung: Jedes Teilst¨ uck einer optimalen Bahn ist f¨ ur sich genommen ebenfalls optimal.
2.5 Extremalprinzipien und Bewegungsgleichungen
65
2 g
1
y
4
3
x Bild 2.14. Zwei im Erdschwerefeld h¨ angende Ketten unterschiedlicher L¨ ange
2.5.2 Variationsproblem und Euler sche Differentialgleichungen Das Verhalten eines dynamischen Systems im Zeitintervall t0 ≤ t ≤ t1 m¨oge sich im (t, x)-Raum durch eine Trajektorie C = {t, x : x = x(t) f¨ ur t ∈ [t0 , t1 ]} beschreiben lassen. Die Realisierung der Trajektorie sei mit einem Wirkungsoder Kostenwert t1 ˙ L(x(t), x(t), t)dt
W (C) =
(2.20)
t0
verbunden. Dabei symbolisiert L eine bez¨ uglich t und aller Komponenten von x und x˙ differenzierbare Funktion. Neben der Trajektorie C betrachten wir benachbarte“ Vergleichstrajektorien ” C = C + γ = {t, x : x = x(t) + ξ(t) f¨ ur t ∈ [t0 , t1 ]} und die zugeh¨ orenden Werte
t1 ˙ ˙ L(x(t) + ξ(t), x(t) + ξ(t), t)dt
W (C ) = t0
des Wirkungsfunktionals. Welche Trajektorie erteilt dem Wirkungsfunktional einen optimalen Wert (Minimum oder Maximum)? Das ist die klassiche Fragestellung der Variationsrechnung. Die optimale Trajektorie wird traditionsgem¨ aß als Extremale bezeichnet. , Beim Vergleich der Werte des Wirkungsfunktionals f¨ ur benachbarte Trajektorien muß sich f¨ ur die Extremale
66
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
ein station¨ arer Wert einstellen:
11
t1 ˙ ˙ ˙ L x(t) + ξ(t), x(t) + ξ(t), t − L (x(t), x(t), t) dt W (C + γ) − W (C) = t0
t1 ( =
) ∂L ˙ ∂L ξ+ ξ + T.h.O. dt ∂x ∂ x˙
t0
t1 = t0
t t1 ∂L d ∂L ∂L
1 ξdt + ξ − · ξ(t)dt + T.h.O. ∂x ∂ x˙ t0 dt ∂ x˙ t0
t1 ( = t0
t d ∂L ∂L
1 ∂L − ξ(t)dt + ξ + T.h.O. ∂x dt ∂ x˙ ∂ x˙ t0 )
Bei kleinen“ Variationen um die Extremale, wobei alle Komponenten ” ˙ im Intervall t0 ≤ t ≤ t1 hinreichend klein bleiben der Vektoren ξ(t) und ξ(t) sollen, d¨ urfen die Terme h¨ oherer Ordnung (T.h.O.) vernachl¨assigt werden, und die Stationarit¨ atsbedingung lautet t1 ( t0
t1 )
d ∂L ∂L ∂L − ξ(t)dt + ξ(t)
= 0. ∂x dt ∂ x˙ ∂ x˙ t0
Unter der h¨ aufig zutreffenden Annahme, daß bei der Variation der Trajektorien die Anfangs- und Endwerte fixiert bleiben, gilt ξ(t0 ) = 0, ξ(t1 ) = 0. Dann vereinfacht sich die Stationarit¨ atsbedingung zu t1 (
) d ∂L ∂L − ξ(t)dt = 0. ∂x dt ∂ x˙
(2.21)
t0
Da ξ(t) f¨ ur eine willk¨ urlich w¨ ahlbare vektorwertige Funktion steht, l¨aßt sich die Forderung (2.21) nur erf¨ ullen, wenn die eckige Klammer f¨ ur alle t ∈ [t0 , t1 ] verschwindet: 11
Bei den folgenden Umformungen sei an die aus der Analysis bekannte Rechenvor∂L ξ = (ν) ∂x ξν erinnert. In der Sprache der Geometrie handelt es sich schrift ∂L ∂x ν um eine Linearform: Stammen die Vektoren ξ aus dem reellen linearen Raum Rn , so geh¨ oren die Vektoren ∂L zum n-dimensionalen dualen“ Raum (Rn )∗ . ∂x ” Im weiteren Text werden Linearformen h¨ aufig als Skalarprodukt geschrieben,
∂L ξ = ∂L , ξ . n
ν=1
∂xν
ν
∂x
2.5 Extremalprinzipien und Bewegungsgleichungen
d ∂L ∂L − = 0. dt ∂ x˙ ∂x
67
(2.22)
Damit haben wir die Eulersche Differentialgleichung des in Rede stehenden Variationsproblems gewonnen. Die Extremale muß notwendigerweise dieser Differentialgleichung zweiter Ordnung gen¨ ugen. ˙ t) nicht explizit von der Zeit t abh¨angt, kann Falls die Funktion L(x, x, man die Euler sche Differentialgleichung (2.22) auf eine Differentialgleichung erster Ordnung reduzieren; denn aus der Rechnung d ∂L ∂L ∂L d ∂L ∂L ¨− ¨ L− x˙ = x˙ + x x˙ − x dt ∂ x˙ ∂x ∂ x˙ dt ∂ x˙ ∂ x˙ ∂L d ∂L = − x˙ = 0 ∂x dt ∂ x˙ ergibt sich als Folgerung: Falls
∂L ∂t
= 0, so gilt ˙ − L(x, x)
∂L x˙ = const. ∂ x˙
(2.23)
Beispiel 2.5 Zwischen zwei Punkten A und B des dreidimensionalen Anschauungsraumes, die nicht vertikal u ¨bereinander liegen, soll eine Bahn derart konstruiert werden, daß sich ein Massenpunkt aus der Ruhelage unter dem Einfluß der Schwerkraft bei vernachl¨ assigter Reibung in k¨ urzester Zeit vom h¨ oher gelegenen Punkt zum tiefer gelegenen Punkt bewegt. (Zur L¨ osung dieses Problems der Brachistochrone [brachist = k¨ urzest, chronos = Zeit] hatte Johann Bernoulli (1667-1748) in den Leipziger gelehrten Bl¨ attern“ im Jahre 1696 die scharfsinnigsten Mathematiker ” ” des ganzen Erdkreises“, Zitat aus [Sza58], S. 99, eingeladen [Ber96].) Zun¨ achst ist klar, daß die gesuchte Bahn in der Ebene liegt, die durch die beiden Raumpunkte A und B und den Richtungsvektor der Schwerkraft bestimmt wird. Das verbleibende ebene Problem kann man sich in einem kartesischen (x, y)Koordinatensystem mit dem Punkt A als Koordinatenursprung veranschaulichen (Bild 2.15). Unter den genannten Annahmen gilt w¨ ahrend der Bewegung des A
xB x
yB
B
g y Bild 2.15. Verschiedene ebenen Bahnkurven zwischen den Punkten A und B K¨ orpers mit der Masse m der Energieerhaltungssatz, der in der Form m 2 v = mgy, 2
d.h.
v=
2gy
notiert werden kann. Minimiert werden soll die Fallzeit T .
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
68
Mit Hilfe des Bogenelements
ds = (dx)
2
+ (dy)2 =
1+
dy dx
2
1 + (y (x))2 dx
dx =
l¨ aßt sich die Fallzeit T als Funktional der Bahn y(x) darstellen:
T dt =
T = 0
B ds B (dx)2 + (dy)2 v
√
=
A
2gy
x 1 + (y (x))2 B
1 = √ 2g
y(x)
dx.
0
A
Das Variationsproblem wurde damit auf die Standardform (2.20) gebracht, 1 T = √ 2g
x
B
1 + (y (x))2 y(x)
x
1 2
dx =
0
B
L(y(x), y (x))dx → Min.
0
Weil L nicht explizit von x abh¨ angt, ergibt sich aus der Stationarit¨ atsforderung an T = T (y(x)) mit der o.a. Folgerung (2.23) eine Differentialgleichung erster Ordnung, n¨ amlich 1 + y 2 y
1 2
− y
y = y(1 + y 2 )
1 = const, y(1 + y 2 )
also y(1 + y 2 ) = c. Vermittels der Substitution y = cot α2 erh¨ alt man aus dieser Differentialgleichung eine Parameterdarstellung der Extremalen y=
c (1 − cos α), 2
x=
c (α − sin α). 2
Das ist die Parameterdarstellung einer gew¨ ohnlichen Zykloide (oder Rollkurve“ ” oder Radlinie“ ), die durch ein auf der x-Achse rollendes Rad mit dem Radius ” c erzeugt werden kann (vgl. Bild 2.16). Zu jedem Punkt B = (xB , yB ) mit xB > 2 0, yB > 0 gibt es genau eine Radlinie“, die in A = (0.0) beginnt. Das von Johann ” Bernoulli gestellte Problem der Brachistochrone besitzt also eine eindeutige L¨ osung.
xB
A c 2
g yB
x
α B
y Bild 2.16. L¨ osung des Problems der Brachistochrone
2.5 Extremalprinzipien und Bewegungsgleichungen
69
Beispiel 2.6 Die leichtere Aufgabe, die k¨urzeste Verbindungsbahn zwischen zwei Punkten A und B zu finden, l¨ ost man mit dem Werkzeug der Variationsrechnung so: Nach Wahl einer (x, y)-Koordinatenebene, die die Punkte A = (0, 0) und B = (xB , yB ) enth¨ alt, notiert man das zu minimierende Funktional; B
W =
B
A
xB
1 + (y (x))2 dx,
(dx)2 + (dy)2 =
ds =
0
A
und die daraus resultierende Differentialgleichung f¨ ur die Extremale;
y 2 1 1 + y 2 − = = const. 2 1+y 1 + y 2
Die Extremale ist eine Kurve in der (x, y)-Ebene mit der Eigenschaft y (x) = c. Damit werden Geraden in der gew¨ ahlten (x, y)-Ebene fixiert. Entspricht die Platzierung der beiden Punkte dem Bild 2.15, so gen¨ ugt die gesuchte Extremale der Geradengleichung y=
yB x. xB
2.5.3 Bewegungsgleichungen mechanischer Systeme 2.5.3.1 Massenpunkte-System als Modell Wir beschr¨ anken uns hier auf mechanische Systeme, die durch eine endliche Anzahl von Massenpunkten beschrieben werden. Die Erweiterung auf starre und flexible Mehrk¨ orpersysteme, auf Finite-Elemente-Systeme und auf Fluide kann vielen Mechanik-Lehrb¨ uchern entnommen werden. Einige der geeigneten deutschsprachigen Darstellungen seien genannt: [Ham49] , [Mac62], [Sza58], [Arn88] und [SE04]. Anhand eines Beispiels, das in diesem Buch wiederholt herangezogen wird, soll verst¨andlich gemacht werden, daß ein Massenpunkte-Modell einen viel weiterreichenden Brauchbarkeitsbereich erfaßt, als es die naiven Vorstellungen von der simplen Idealisierung von K¨orpern mit kleinen geometrischen Abmessungen zu Massenpunkten erahnen lassen. Wir widmen uns nun der Massenpunkte-Modellbildung f¨ ur ein verschiebliches N -fach-Pendel, vgl. Bild 2.17. Ein Wagen kann auf einer horizontalen Geraden, die uns als x-Achse dienen wird, verschoben werden. Am Wagen sind N physische Pendel montiert, deren Drehachsen fest mit dem Wagen verbunden sind. F¨ ur N = 1 stoßen wir auf die beliebten Lehrbuchbeispiele der Verladebr¨ ucke und des inversen Pendels. Bild 2.17 illustriert den Fall N = 2.
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
70
y
D2
D1 x
z
F g Bild 2.17. Verschiebliches Zweifachpendel
Die Bewegung des Systems wird angeregt durch die Erdbeschleunigung, die senkrecht zur Bewegungsrichtung des Wagens entgegen der y-Richtung wirkt, durch eine eingepr¨ agte Kraft F in x-Richtung und durch die Drehkr¨ afte D1 , D2 , . . . , DN , die um die Drehachsen (senkrecht zur x-y-Ebene) auf die physischen Pendel wirken. Um zu einem mathematischen Modell des skizzierten (N + 1)-K¨ orper-Systems zu gelangen, setzen wir voraus, daß sich alle Bewegungen nur in der (oder parallel zur) x-y-Ebene abspielen und daß sowohl der Wagen als auch die Pendel als Starrk¨orper beschrieben werden d¨ urfen, also Deformationen der K¨ orper vernachl¨assigbar sind und daher die geometrische Gestalt der K¨ orper belanglos ist. Unter diesen Voraussetzungen wird das mechanische Verhalten des Wagens allein durch die x-Koordinate seines Massenmittelpunktes (M P0 ) – wir wollen sie x0 nennen – und seine translatorische Tr¨ agheit, also seine Masse M0 , bestimmt. Das mechanische Verhalten des i-ten Pendels wird durch die (x, y)-Koordinaten seines Drehpunktes (DPi ) und seines Massenmittelpunktes (MPi ), seine translatorische Tr¨ agheit, d. h. seine Masse Mi , und seine rotatorische Tr¨agheit, d. h. sein Tr¨ agheitsmoment JDPi um die tats¨ achliche Drehachse durch den Drehpunkt DPi , vollst¨ andig festgelegt. Bei einer Parallelverschiebung der Drehachse andert sich das Tr¨ agheitsmoment (gem¨ aß dem aus der Mechanik bekannten ¨ Satz von Jacob Steiner ) um das Produkt aus der Masse und dem Quadrat des Abstandes zwischen den Drehachsen. Ginge die Drehachse beispielsweise durch den Massenmittelpunkt MPi , so erg¨ abe sich das Tr¨agheitsmoment zu JMPi = JDPi − Mi · L2i , wobei Li den Abstand zwischen dem Massenmittelpunkt und dem tats¨achlichen Drehpunkt bezeichnet. Jedes so beschreibbare physische Pendel kann, unbeschadet seiner tats¨achlichen geometrischen Abmessungen und Gestalt, durch ein ideales Hantel-Modell ¨ (vgl. Bild 2.18) ersetzt werden. Die mechanische Aquivalenz zwischen dem noch ungebunden gedachten physischen Pendel und der Hantel erfordert die ¨ Ubereinstimmung von Massenmittelpunkt s, Masse M und Tr¨agheitsmoment
2.5 Extremalprinzipien und Bewegungsgleichungen
71
m l
M, JDP L
DP
MP l
s s y
m
y
x
x
¨ Bild 2.18. Hantel als mechanisches Aquivalent des Starrk¨ orpers ebenes Pendel“ ”
JMP . Dazu m¨ ussen die im Bild eingezeichneten L¨angen l , l und Punktmas sen m , m drei Bedingungen erf¨ ullen, n¨ amlich M = m + m ,
m l = m l ,
JMP = m (l )2 + m (l )2 .
Zu beliebig gew¨ ahltem l > 0 ergibt sich dann JMP M l M 2 (l )2 m = . JMP + M (l )2 l =
Gem¨ aß dem Aufbau des (N + 1)−K¨ orper-Systems kommt die Bindung zwischen Pendel und Wagen durch die jeweilige Drehachse zustande. Wir legen fest, daß die Drehachse die (x, y)−Ebene in der Position von m durchst¨oßt und setzen damit l = L, also gleich dem Abstand zwischen dem Massenmittelpunkt MP und dem Drehpunkt DP. Aus der getroffenen Festlegung folgt l =
JDP JDP − M L2 = − L, ML ML
m =
M 2 L2 . JDP
F¨ ur die mathematische Beschreibung des verschieblichen N -fach-Pendels kann demnach ein (N + 1)-Massenpunkte-Modell benutzt werden, das sich wie folgt ergibt: Zur Wagenmasse M0 sind die Ersatzmassen mi der physischen Pendel hinzuzuf¨ ugen. Im u ¨ brigen kann jedes physische Pendel durch ein mathematisches Pendel ersetzt werden, und zwar mit einer Ersatzmasse m i an der Spitze einer masselosen starren Stange der Ersatzl¨ange li = Li + l i .
72
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
Das Modell besteht aus einem als Punktmasse beschriebenen Wagen und N mathematischen Pendeln. Der Wagen hat die Ersatzmasse N (Mi Li )2 Mi − m0 = M 0 + JDPi i=1 und das i-te (i = 1, 2, . . . , N ) mathematische Pendel JDPi Mi Li (Mi Li )2 und die (Ersatz-) Masse mi = . JDPi die (Ersatz-) L¨ ange li =
Die Lage“ des Systems wird durch den Vektor ” q = (x0 , ϕ1 , ϕ2 , . . . , ϕN )T eindeutig bestimmt, vgl. Bild 2.19.
m1 ϕ1 l1
g
m2 l2
ϕ2
y
x
m0
Bild 2.19. (N + 1)-Massenpunkte-Modell des N −fach-Pendels f¨ ur den Fall N = 2
2.5.3.2 Gleichgewichtsbedingungen der Statik Die Statik eines mechanischen Systems wird vom Konzept des Gleichgewichts bestimmt. Ein System aus Massenpunkten ist im Gleichgewicht, wenn jeder Punkt ruht. Ein herausgeschnitten gedachter Punkt kann nach ¨ dem Newtonschen Grundgesetz * – die zeitliche Anderung der Bewegungsgr¨oße mx˙ ist gleich der Summe (k) fk der durch die gedachte Schnittfl¨ache ein-
2.5 Extremalprinzipien und Bewegungsgleichungen
73
*
und austretenden Kr¨ afte – nur in der Ruhelage verharren, wenn (k) fk = 0 gilt. Bei einem an eine Fl¨ ache F (x) = 0 gebundenen Punkt kommen nicht nur * die eingepr¨ agten“ oder physikalisch verursachten“ K¨afte (k) fke zur Gel” ” tung, sondern auch die Reaktionskraft f r , die aus der geometrischen Zwangsbedingung F (x) = 0 hervorgeht. Stellt man sich vor, daß die Bindung et” was gelockert“ w¨ urde, so m¨ ußte man, wenn die Gleichgewichtslage erhalten bleiben soll, die Reaktionskraft durch eine eingepr¨agte Kraft ersetzen (Lagrangesches Befreiungsprinzip, siehe [Ham49]). Die Reaktionskraft wirkt in Richtung der Fl¨ achennormalen, d.h. f r = λ grad F (x). Der Wert der von Lagrange eingef¨ uhrten Unbestimmten λ bleibt vorerst offen, und er kann erst aus dem gr¨ oßeren Zusammenhang des Gesamtsystems berechnet werden. Die Kr¨ aftegleichgewichtsbedingung des an eine Fl¨ache F (x) = 0 gebundenen Punktes lautet fke + f r = fke + λ grad F (x) = 0. (k)
(k)
Jede virtuelle Verschiebung δx – das ist eine nur gedachte, kleine, aber mit der geometrischen Zwangsbedingung vertr¨ agliche Verr¨ uckung in eine be” nachbarte“ Lage – muß in der Tangentialebene der Fl¨ache liegen. Sollte der Punkt an eine Bahnkurve gebunden sein, die sich als Schnitt zweier Fl¨achen F1 (x) = 0 und F2 (x) = 0 darstellen l¨ aßt, so sind virtuelle Verschiebungen δx des Punktes nur in Richtung der Tangente der Bahnkurve zul¨assig. Die Kr¨ aftegleichgewichtsbedingung des an die Kurve gebundenen Punktes ergibt sich zu
fke +
2
fjr =
j=1
(k)
fke + λ1 grad F1 (x) + λ2 grad F2 (x) = 0
(k)
mit zwei Lagrangeschen Unbestimmten λ1 und λ2 . Bei virtuellen Verschiebungen wird virtuelle Arbeit * * geleistet. In der Statik folgt aus dem Gleichgewicht der Kr¨ afte (k) fke + (j) fjr = 0 das Prinzip der virtuellen Arbeit (Johann Bernoulli, 1717) 12 + , fke , δx =: δAe = 0; (2.24) (k)
denn
+
(k)
12
fke
+
(j)
, fjr , δx
+ = 0 und
, fjr , δx
=0
(j)
In modernerer geometrischer Sprache (vgl. Fußnote auf S. 66) sagt man: Die Kr¨ afte sind Linearformen auf dem Vektorraum der Verschiebungen. Die von der wirkenden Kraft bei einer tats¨ achlich realisierten Verschiebung geleistete Arbeit erscheint als Wert der Linearform.
74
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
ergeben (2.24). In Worten: Ein Massenpunkt ist genau dann im Gleichgewicht, wenn die virtuelle Arbeit der eingepr¨ agten Kr¨afte verschwindet. Bisher war stillschweigend angenommen worden, daß mit δx auch −δx eine zul¨ assige virtuelle Verschiebung sei. Bei einseitigen Bindungen trifft dies nicht zu. In den im Bild 2.20 skizzierten Beispielen befinden sich die K¨orper
111111 000000 000000 111111 1 0 0 1 000000 111111 0 1 000000 111111
111111 000000 000000 111111 000000 111111 000000 111111 000000 111111 000000 111111 000000 111111 000000 111111 000000 111111
g
Bild 2.20. Anschauungsbeispiele f¨ ur einseitige Bindungen
in stabiler Ruhelage. Die potentielle Energie nimmt einen Minimalwert an, der jedoch kein station¨ arer Wert im Sinne der Variationsrechnung ist. Bei einseitigen Bindungen gilt ersichtlich + , r fj , δx ≥ 0, (j)
und damit
+ e
δA =
, fke , δx
≤ 0.
(2.25)
(k)
Die gewonnene Erweiterung des Prinzips der virtuellen Arbeit wird J. B. F. Fourier (1798) zugeschrieben [Ham49]: Bei einseitigen Bindungen d¨ urfen die eingepr¨ agten Kr¨ afte keine positive virtuelle Arbeit leisten, wenn Gleichgewicht herrschen soll. 2.5.3.3 D’Alembertsches Prinzip und Bewegungsgleichungen der Kinetik ¨ Beim Ubergang von den statischen, also den in Ruhe befindlichen Systemen, zu bewegten Systemen muß beachtet werden, daß virtuelle Verschiebungen als zeitlos erfolgend zu denken sind. Andernfalls st¨oßt man auf un¨ uberwindbare Schwierigkeiten bei zeitvarianten (oder rheonomen) Systemmodellen. Es muß sorgf¨ altig unterschieden werden zwischen Punkten x und x + δx zur selben Zeit t auf benachbarten Bahnen und den Punkten x und x + dx auf derselben Bahn zu benachbarten Zeiten t und t + dt.
2.5 Extremalprinzipien und Bewegungsgleichungen
75
Einen K¨ onigsweg“ in die Kinetik, das ist die Lehre von den Bewegungen ” unter Ber¨ ucksichtigung ihrer Ursachen, liefert das d’Alembertsche Prinzip (genannt nach Jean-Baptist le Rond d’Alembert (1717-1783) [D’A43], [Ham49]):13 Man f¨ uge den eingepr¨ agten Kr¨ aften die Tr¨ agheitskr¨afte (= negative Mas” senbeschleunigungen“) hinzu und behandle dann das System wie ein statisches. Die einfachste mathematische Fassung des d’Alembertschen Prinzips ergibt sich f¨ ur einen Massenpunkt (mit der negativen Massenbeschleunigung −m¨ x ) zu fke − m¨ x=− fjr . (k)
(j)
In Verbindung mit (2.24) gelangt man zum d’Alembertschen Prinzip in der Lagrangeschen Fassung + , e fk − m¨ x, δx ≤ 0. (k)
Normalerweise gilt das Gleichheitszeichen. Das Ungleichheitszeichen dient der ¨ Vorzeichenkontrolle. Bei einseitiger Bindung soll ein stetiger Ubergang beim Verlassen des Wirkungsbereichs der Bindung stattfinden ([Ham49]). Bisher haben wir das mechanische System durch einen Massenpunkt modelliert, die Tr¨ agheit des Systems durch die Masse m. Die Brauchbarkeit dieses sehr einfachen Modells ist ¨ außerst begrenzt. Weiter reichen Modelle, die der r¨ aumlichen Ausdehnung des mechanischen Systems besser Rechnung tragen. Im folgenden wird vorausgesetzt, daß das untersuchte reale Objekt durch endlich viele Massenpunkte brauchbar modelliert werden kann. Die Position des i−ten Massenpunktes zum Zeitpunkt t wird in kartesischen Koordinaten mit xi (t), die auf den i−ten Massenpunkt wirkende resultierende eingepr¨ agte Kraft mit fie (t) bezeichnet. Die Lage des Gesamtsystems l¨ aßt sich bestimmen, indem man f¨ ur jeden Massenpunkt zwei Koordinatenwerte bei einer Modellierung des Bewegungsablaufs in einer Ebene oder drei Koordinatenwerte bei einer Modellierung des Bewegungsablaufs im dreidimensionalen anschaulichen Raum angibt. Bei M Massenpunkten wird so die mathematische Beschreibung des Bewegungsablaufs des Systems eingebettet in einen 2M − bzw. 3M − dimensionalen x−Raum mit kartesischen Koordinaten. Zwischen den 2M bzw. 3M Koordinatenwerten bestehen Zwangsbe13
Einer der großen Mechanik-Gelehrten des 20. Jahrhunderts, Clifford Truesdell (1919-2001) von der Johns-Hopkins-University in Baltimore, USA, hat in seinen historischen Essays [Tru68] darauf aufmerksam gemacht, daß es gerechtfertigter w¨ are, das Prinzip mit den Namen von Jakob Bernoulli [Ber03] und Leonhard Euler (1707-1783) zu verkn¨ upfen. Nichtsdestoweniger wollen auch wir die traditionelle Bezeichnung beibehalten, um Verwechslungen zu vermeiden.
76
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
dingungen, die aus dem realen Aufbau des modellierten Objekts hervorgehen. Wir wollen nun annehmen, daß sich die Lage des betrachteten mechanischen Systems als Ganzes durch eine endliche Anzahl – diese sei n – voneinander unabh¨ angiger Lageparameter q1 , q2 , . . . , qn beschreiben l¨aßt. Jede konkrete Position des Systems ist dann durch einen einzigen Punkt im ndimensionalen q-Raum bestimmt. Es ist u ¨blich, von n mechanischen Freiheitsgraden zu sprechen, den q-Raum als Konfigurationsraum und die qν als generalisierte oder Lagrangesche Lagekoordinaten zu bezeichnen. Die virtuelle Arbeit der eingepr¨ agten Kr¨afte l¨aßt sich dann f¨ ur ein Massenpunkte-System wie folgt darstellen: δAe = fie , δxi (i)
, n ∂xi δqν = ∂qν ν=1 (i) ⎛ ⎞ . n n ∂x i ⎠ ⎝ fie , = Qν δqν . δqν =: ∂qν ν=1 ν=1
+
fie ,
(2.26)
(i)
Die neu eingef¨ uhrten Gr¨ oßen Qν werden generalisierte oder Lagrangesche Kraftkomponenten genannt. F¨ ur die Lagen und Geschwindigkeiten der Massenpunkte gilt ∂xi d xi = q˙ν , dt ∂qν ν=1 n
xi = xi (q1 , . . . , qn )
und x˙ i =
und f¨ ur ihre Beschleunigungen wegen x˙i = x˙ i (q1 , . . . , qn ; q˙1 , . . . , q˙n ) einerseits n ∂ x˙ i d ∂ x˙ i ¨ i = x˙ i = x q˙ν + q¨ν , dt ∂qν ∂ q˙ν ν=1 und andererseits d ¨i = x dt
n ∂xi q˙ν ∂qν ν=1
=
Der Vergleich liefert d ∂xi ∂ x˙ i = dt ∂qν ∂qν
( ) n d ∂xi ∂xi q˙ν + q¨ν . dt ∂qν ∂qν ν=1
und
∂ x˙ i ∂xi = . ∂ q˙ν ∂qν
(2.27)
Die virtuelle Arbeit der Tr¨ agheitskr¨ afte (oder negativen Massenbeschleunigungen)
2.5 Extremalprinzipien und Bewegungsgleichungen
δAm =
mi ¨ xi , δxi
(i)
=
(i)
=
n ν=1
77
+ mi ⎛ ⎝
¨i, x
n ∂xi ν=1
(i)
∂qν
, δqν
⎞ . ∂xi ⎠ ¨i, mi x δqν ∂qν
* kann in Zusammenhang mit der kinetischen Energie T = 12 i mi x˙ i , x˙ i des Massenpunktesystems gebracht werden. Die partiellen Ableitungen von T nach qν und q˙ν berechnet man zu . ∂T ∂ x˙ i = mi x˙ i , ∂qν ∂qν (i) . . ∂ x˙ i ∂xi ∂T = . = mi x˙ i , mi x˙ i , ∂ q˙ν ∂ q˙ν ∂qν (i)
(i)
Bei der letzten Umformung wurde (2.27) ausgenutzt. Daraus ergibt sich wiederum mit (2.27) (. . .) d ∂T ∂T ∂xi d ∂xi ∂ x˙ i ¨i, − + x˙ i , − x˙ i , = mi x dt ∂ q˙ν ∂qν ∂qν dt ∂qν ∂qν (i) . ∂xi ¨i, . mi x = ∂qν (i)
Das d’Alembertsche Prinzip in Lagrangescher Fassung – die virtuelle Arbeit der Tr¨ agheitskr¨ afte δAm ist gleich der virtuellen Arbeit der eingepr¨agten e Kr¨ afte δA – wurde damit neu formuliert: n n ∂T d ∂T m δA = δqν = − Qν δqν = δAe . dt ∂ q ˙ ∂q ν ν ν=1 ν=1 Weil die n Variationen δqν unabh¨ angig voneinander gew¨ahlt werden d¨ urfen, haben wir so n Differentialgleichungen zweiter Ordnung gewonnen, d ∂T ∂T − = Qν dt ∂ q˙ν ∂qν
f¨ ur
ν = 1, 2, . . . , n.
(2.28)
Beispiel 2.7 Wir betrachten das im Abschnitt 2.5.3.1 abgeleitete (N +1)−Massenpunkte-Modell zum verschieblichen N −fach-Pendel und entnehmen von dort den Vektor der Lagrangeschen Lagekoordinaten, q = (x0 , ϕ1 , ϕ2 , . . . , ϕN )T .
78
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
Analytische Ausdr¨ ucke f¨ ur die potentielle und die kinetische Energie des Systems lassen sich ohne weiteres finden. Die potentielle Energie ergibt sich zu N
Epot =
gmi li (1 + cos ϕi ), i=1
angender Pendel wenn man als Bezugswert Epot = 0 den Fall ausschließlich herabh¨ nimmt, vgl. Bild 2.21 f¨ ur N = 2.
Epot
−π ϕ1
π
ϕ2
π
Bild 2.21. Potentielle Energie des Systems f¨ ur N = 2 u ¨ ber der ϕ1 -ϕ2 -Ebene, wobei l1 = 0.63 m, m1 = 0.18 kg, l2 = 0.19 m, m2 = 0.12 kg gew¨ ahlt wurden
˙ ergibt sich aus einer kurzen Rechnung: Die kinetische Energie Ekin = T (q, q) m0 2 ˙ = T (q, q) x˙ 0 + 2 =
m0 2 x˙ 0 + 2
N
i=1 N
i=1
mi 2
d (x0 − li sin ϕi ) dt
2
+
d (li cos ϕi ) dt
2
mi 2 x˙ 0 − 2li ϕ˙ i x˙ 0 cos ϕi + li2 ϕ˙ 2i . 2
Um die Bewegungsgleichungen des Systems aus der allgemeinen Beziehung (2.28) zu gewinnen, werden noch die Lagrangeschen Kr¨ afte Qν , die in Richtung“ der ” otigt. Offenbar handelt jeweils korrespondierenden Lagekoordinaten qν wirken, ben¨ es sich im Beispielfalle bei Q1 um eine translatorische Kraft (meßbar mit der physikalischen Maßeinheit Newton), w¨ ahrend Q2 , Q3 , . . . , QN+1 Drehkr¨ afte (= Drehmomente, meßbar mit der physikalischen Maßeinheit Newtonmeter) sind. Die Lagrangeschen Kr¨ afte lassen sich systematisch aus (2.26) herleiten. Die beim verschieblichen N −fach-Pendel auftretenden Reibungskr¨ afte wollen wir hier als viskose D¨ ampfungen ber¨ ucksichtigen, also sowohl die translatorische Reibung des Wagens als auch die Drehreibungen in den Pendellagern
2.5 Extremalprinzipien und Bewegungsgleichungen
79
geschwindigkeits- bzw. winkelgeschwindigkeitsproportional ansetzen. Die weiteren wirksamen eingepr¨ agten Kr¨ afte sind die Gewichtskr¨ afte m1 g, m2 g, . . . , mN g, die an den Pendelersatzmassen angreifen und senkrecht zur Bewegungsrichtung des Wagens entgegen der y-Richtung wirken, die am Wagen angreifende Kraft F in x-Richtung und die Drehkr¨ afte D1 , D2 , . . . , DN , die die physischen Pendel in ihrer Drehbewegung um die Drehachsen (senkrecht zur x-y-Ebene) antreiben. Nach diesen Vor¨ uberlegungen k¨ onnen wir den allgemeinen Ausdruck (2.26) f¨ ur die virtuelle Arbeit der eingepr¨ agten Kr¨ afte konkret aufschreiben: N
δAe =
fie , δxi i=0 N
(−mi g)δyi + (Di − di ϕ˙i )δϕi
= (F − d0 x˙0 )δx0 + i=1 N
= (F − d0 x˙0 )δx0 +
(−mi g)δ(li cos ϕi ) + (Di − di ϕ˙i )δϕi
i=1 N
= (F − d0 x˙0 )δx0 +
mi gli sin ϕi + Di − di ϕ˙i δϕi
i=1 n=N+1
=: Q1 δq1 +
Qν δqν . ν=2
Damit wurden die Lagrangeschen Kr¨ afte f¨ ur das Beispiel als eine translatorische afte Qi+1 = mi gli sin ϕi + Di − Kraft Q1 = F − d0 x˙ 0 in Richtung x0 und N Drehkr¨ ur i = 1, 2, . . . , N ermittelt. Die Bewegungsgleichungen di ϕ˙ i in Drehrichtung ϕi f¨ (2.28) ergeben sich zun¨ achst in der Gestalt d dt d dt
N
∂T ∂ x˙ 0
−
∂T = m0 x ¨0 + mi x ¨ 0 − li ( ϕ ¨i cos ϕi − ϕ˙ 2i sin ϕi ) = Q1 ∂x0 i=1
∂T ∂ ϕ˙ i
−
∂T = mi li (−¨ x0 cos ϕi + li ϕ ¨i ) = Qi+1 ∂ϕi
f¨ ur
i = 1, 2, . . . , N.
Multipliziert man die letztgenannten Gleichungen jeweils mit l1i cos ϕi und addiert sie zur ersten Gleichung, so heben sich die Summanden mit ϕ ¨ i auf:
N
m0 +
mi sin2 ϕi
x ¨0
i=1
N
mi sin ϕi g cos ϕi − li ϕ˙ 2i +
= i=1
1 (Di − di ϕ˙ i ) cos ϕi li
und f¨ ur die zweiten Ableitungen der Winkel ϕi gilt ϕ ¨i =
1 li
x ¨0 cos ϕi + g sin ϕi +
+ F − d0 x˙ 0 ,
1 (Di − di ϕ˙ i ) . m i li
(2.29)
(2.30)
Als Gleichgewichtslagen des Systems bezeichnet man jene Stellen des Lagrangeschen Konfigurationsraumes, an denen die zeitlichen Ableitungen der Lagekoordinaten verschwinden. F¨ ur das vorliegende Problem bedeutet dies:
80
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen x˙ 0 = 0, x ¨0 = 0
und
ϕ˙ i = 0, ϕ¨i = 0 (i = 1, 2, . . . , N )
. Unter der Voraussetzung, daß die Stellkraft F = 0 und die Stelldrehkr¨ afte Di = 0 (i = 1, 2, . . . , N ) sind, kann man aus den nichtlinearen Gleichungen (2.29) und (2.30) die Gleichgewichtslagen ohne weiteres ablesen: sin ϕi = 0
f¨ ur
i = 1, 2, . . . , N,
also mit k = 0, ±1, ±2, . . . f¨ ur ϕi = 2kπ, d. h. i-tes Pendel in aufrechter Stellung, angender Stellung. Dabei kann oder f¨ ur ϕi = (2k + 1)π, d. h. i-tes Pendel in herabh¨ x0 einen beliebigen festen Wert annehmen. Betrachtet man die Wagenposition als unwesentlich, so haben wir in den Winkelbereichen 0 ≤ ϕi < 2π, i = 1, 2, . . . , N insgesamt 2N voneinander verschiedene Gleichgewichtslagen zu unterscheiden. Die potentielle Energie nimmt in diesen Punkten station¨ are Werte an (vgl. Bild 2.21). Wir linearisieren die nichtlinearen Bewegungsgleichungen um die Gleichgeur i = 1, 2, . . . , N , d. h., es befinden sich alle N Pendel in wichtslage ϕi = 0 f¨ aufrechter Stellung. F¨ ur kleine Winkel ϕi wird cos ϕi ≈ 1 und sin ϕi ≈ ϕi , und wir erhalten die linearisierten Bewegungsgleichungen in der Gestalt
m (l ϕ¨ − x¨ ) + F − d x˙ , N
m0 x ¨0 =
i
i
i
i=1
li ϕ ¨i = x ¨0 + gϕi +
0
0 0
1 (Di mi li
− di ϕ˙ i )
(2.31) f¨ ur
i = 1, 2, . . . , N
Die linearisierten Bewegungsgleichungen um andere Gleichgewichtslagen ergeben sich einfach daraus, daß man f¨ ur herunterh¨ angende Pendel die betreffende Pendell¨ ange li formal durch −li ersetzt.
Die virtuelle Arbeit der Tr¨ agheitskr¨ afte δAm kann auch im x-Raum ¨ unmittelbar mit der virtuellen Anderung der kinetischen Energie δT = * * mi ˙ ˙ δ x , x = (i) mi x˙ i , δ x˙ i in Zusammenhang gebracht werden: i i (i) 2 δAm =
. d d mi x˙ i , δxi − mi x˙ i , δxi dt dt i (i) ⎞ ⎛ d ⎝ = mi x˙ i , δxi ⎠ − mi x˙ i , δ x˙ i dt (i) (i) ⎞ ⎛ d ⎝ = mi x˙ i , δxi ⎠ − δT. dt
¨ i , δxi = mi x
(i)
(i)
Dabei wurde die Beziehung d δxi = δ x˙ i dt benutzt, die sich so begr¨ unden l¨ aßt:
2.5 Extremalprinzipien und Bewegungsgleichungen
81
) n ( d ∂xi ∂xi d δqν δqν + ∂qν dt ∂qν ∂qν dt ν=1 ν=1 n ∂ x˙i ∂ x˙i vgl. (2.27) δqν + δ q˙ν = ∂q ∂ q˙ν ν ν=1
d d δxi = dt dt
n ∂xi
=
δqν
= δ x˙i . Mit dem Lagrangeschen Prinzip δAe = δAm gewinnt man daraus ⎞ ⎛ d ⎝ mi x˙ i , δxi ⎠ . δAe (t) + δT (t) = dt (i)
Die zeitliche Integration im Intervall t0 ≤ t ≤ t1 u uhrt diese in jedem ¨berf¨ Zeitpunkt geltende Aussage in ein Variationsprinzip, dem der Bewegungsablauf insgesamt gen¨ ugt: t1 (δT (t) + δAe (t)) dt =
t
mi x˙ i , δxi |t10 .
(i)
t0
Es wird als Hamiltonsches Prinzip bezeichnet, zu Ehren von W. R. Hamilton (1805–1865, Professor der Astronomie in Dublin). Wenn die eingepr¨agten Kr¨ afte ein Potential V = V (x1 , x2 , . . .) besitzen, also . - ∂V e e δA (t) = − (2.32) fi , δxi = , δxi = −δV (t) ∂xi (i)
(i)
gilt, so erscheint das Hamiltonsche Prinzip in der Form t1
t1 (δT (t) − δV (t)) dt = δ
t0
(T (t) − V (t)) dt =
t
mi x˙ i , δxi |t10 .
(i)
t0
Nach Einf¨ uhrung der Lagrangeschen Funktion L = T − V wird t1 L(t)dt =
δ
mi x˙ i , δxi |tt10 .
(i)
t0
Falls die Variation δxi am Anfangs- und am Endzeitpunkt verschwindet, bleibt die Stationarit¨ atsforderung t1 L(xi , x˙ i , t)dt = 0.
δW = δ t0
(2.33)
82
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
¨ Die formale Ubereinstimmung mit der Aufgabe der Variationsrechnung darf den grunds¨ atzlichen Unterschied nicht vergessen lassen. Im Abschnitt 2.5.2 wurden alle denkbaren Nachbarbahnen zur Variation herangezogen, w¨ahrend hier nur die mit den Zwangsbedingungen vertr¨aglichen Variationen δxi in Betracht kommen. Dr¨ uckt man alle xi durch die oben eingef¨ uhrten verallgemeinerten Koordinaten q1 , . . . , qn aus, wobei n f¨ ur die Anzahl der mechanischen Freiheitsgrade steht, so kann im n-dimensionalen Konfigurationsraum frei variiert werden, und die zur Extremalbedingung (2.33) geh¨ orenden Euler schen Differentialgleichungen ergeben sich (wie im Abschnitt 2.5.2 vorgerechnet) zu d ∂L ∂L − = 0 f¨ ur ν = 1, 2, . . . , n. dt ∂ q˙ν ∂qν
(2.34)
Diese n Differentialgleichungen zweiter Ordnung werden in Lehrb¨ uchern der Physik und Mechanik als Lagrangesche Gleichungen zweiter Art oder auch als Euler-Lagrangesche Gleichungen bezeichnet. Der praktische Einsatzbereich der Euler-Lagrangeschen Gleichungen ist kleiner als der der Glei¨ chungen (2.28), weil mit dem Ubergang zu (2.32) vorausgesetzt wurde, daß nur Potentialkr¨ afte vorkommen. Insbesondere wurden damit Reibkr¨afte aus der Betrachtung ausgeschlosen. Enth¨ alt die Lagrangesche Funktion L(q1 , . . . , qn , q˙1 , . . . , q˙n , t) eine der Koordinaten nicht, zum Beispiel qµ , so reduziert sich die µ-te Gleichung in (2.34) auf ∂L = const. ∂ q˙µ Dies liefert einen Erhaltungssatz f¨ ur eine physikalische Gr¨oße. 2.5.4 Lagrangescher und Hamiltonscher Formalismus, Erhaltungss¨ atze und Phasenraum Seit der 2. H¨ alfte des 19. Jahrhunderts wird das Variationsprinzip (2.33) u aufe hinausreichend auch in anderen ¨ ber die mechanischen Bewegungsabl¨ Gebieten der physikalisch begr¨ undeten Wissenschaften verwendet. Heute gehen Physiker oft so vor: Zum betrachteten physikalischen System wird eine ˙ t) dergestalt gesucht, daß die Trajektorie q(t) Lagrangesche Funktion L(q, q, /t ˙ t)dt = 0 u als Extremale des Variationsproblems δW = δ t01 L(q, q, ¨ ber dessen Euler sche Differentialgleichung berechnet werden kann. Im allgemeinen ist es dann nicht mehr m¨ oglich, die Lagrangefunktion L in einen Anteil der kinetischen Energie T und einen der potentiellen Energie V zu zerlegen. Die Suche nach einer geeigneten Lagrangeschen Funktion wird zu einer schwierigen Aufgabe, die sich nur mit tieferen Einsichten in die jeweiligen physikalischen Problemzusammenh¨ ange erfolgreich bearbeiten l¨aßt. Hier kann darauf nicht n¨ aher eingegangen werden.
2.5 Extremalprinzipien und Bewegungsgleichungen
83
Beispiel 2.8 Zeitver¨anderliche elektrische und magnetische Felder E (x, t) und B(x, t) lassen sich aus einem skalaren Potentialfeld U (x, t) und einem Vektorpotentialfeld A(x, t) berechnen (z.B. [Mac60]) E(x, t) = −
∂ ∂ U (x, t) − A(x, t), ∂x ∂t
B(x, t) = rot A(x, t) =
∂ × A(x, t). ∂x
Um die Bewegungsgleichung eines Teilchens mit der Masse m und mit der Ladung q unter dem Einfluß der beiden Felder E und B aus dem Variationsprinzip t1
˙ t)dt = 0 L(x, x,
δ t0
zu finden, erweist sich die Lagrangesche Funktion ˙ t) = L(x, x,
m ˙ ˙ 2 − q U (x, t) + q A(x, t), x |x| 2
˙ kann nicht als Potential einer Kraft gedeutet als geeignet. Der letzte Term q A, x werden. Beweis: Die Euler sche Gleichung des Variationsproblems ergibt sich u ¨ber ∂L = mx˙ + qA(x, t), ∂ x˙ und
∂L ∂U (x, t) ∂ ˙ = −q +q A(x, t), x ∂x ∂x ∂x
∂ d ∂L ˙ = m¨ x + q x, dt ∂ x˙ ∂x
A(x, t) + q
∂ A(x, t) ∂t
zu d ∂L ∂L − dt ∂ x˙ ∂x ∂ ∂ ∂U (x, t) ∂ ˙ ˙ − x, = m¨ x+q A(x, t) + q A(x, t) − q A(x, t), x ∂x ∂t ∂x ∂x ∂ = m¨ x − q grad U (x, t) − q A(x, t) − q (x˙ × rot A(x, t)) ∂t = m¨ x − q E (x, t) − q (x˙ × B(x, t) ).
0=
Das Ergebnis ist aus der Elektrodynamik bekannt: Auf das tr¨ age, geladene Teilchen wirkt die sogenannte Lorentz -Kraft q(E + x˙ × B).
Die Euler schen Gleichungen (2.34) bilden ein System von n Differentialgleichungen zweiter Ordnung f¨ ur die n Unbekannten q1 , . . . , qn . Im Blick auf praktikable L¨ osungsverfahren erscheint es als vorteilversprechend, das System (2.34) umzuformulieren in ein System von 2n Differentialgleichungen erster Ordnung f¨ ur 2n Unbekannte. Eine M¨ oglichkeit liegt auf der Hand: F¨ uge den Unbekannten q1 , . . . , qn die neuen Variablen q˙1 =: ζ1 , . . . , q˙n =: ζn hinzu. Auf diese Weise erh¨ alt man aus (2.34) ein System von 2n Gleichungen erster Ordnung f¨ ur die 2n Unbekannten q1 , . . . , qn ; ζ1 , . . . , ζn :
84
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
d ∂ ∂ − dt ∂ζν ∂qν
ζν = q˙ν
L(q, ζ, t) = 0
f¨ ur f¨ ur
ν = 1, . . . , n, ν = 1, . . . , n.
(2.35)
In der Regelungstechnik wird von dieser M¨oglichkeit recht oft Gebrauch gemacht, um die (in nat¨ urlicher Weise als Differentialgleichungen zweiter Ordnung vorliegenden) Bewegungsgleichungen in sogenannte Zustandsform“ zu ” bringen. Beispiel 2.9 Abschnitt 2.5.3.1 und Beispiel 2.7 waren der Modellbildung f¨ur das verschiebliche N -fach-Pendel gewidmet. Das Massenpunkte-Modell besitzt n = N +1 Freiheitsgrade. Die Konfiguration wird durch den n-dimensionalen Vektor q = (q1 , q2 , . . . , qn )T = (x0 , ϕ1 , . . . , ϕN )T beschrieben. Wird angenommen, daß die bisher ber¨ ucksichtigten Reibkr¨ afte keine Rolle spielen, so lassen sich die Bewegungsgleichungen aus (2.35) herleiten. Die Lagrange-Funktion ergibt sich zu ˙ t) = T (q, q) ˙ − V (q) L(q, q, =
m0 2 x˙ + 2 0
N
N
mi 2 x˙ 0 + li2 ϕ˙ 2i − 2li x˙ 0 ϕ˙ i cos ϕi − mi li g(1 + cos ϕi ). 2 i=1
i=1
Die n definitorischen Differentialgleichungen q˙ν =: ζν
f¨ ur
ν = 1, . . . , n
lauten hier x˙ 0 =: ζ1 ,
ϕ˙ i =: ζi+1
f¨ ur
i = 1, . . . , N ,
und die Lagrange-Funktion erscheint in der Gestalt L(q, ζ, t) = T (q, ζ) − V (q) m0 2 = ζ + 2 1
N
mi i=1
∂ d ∂ − dt ∂ζν ∂qν
L(q, ζ, t) = 0
f¨ ur
ν = 1, . . . , n
N
m0 ζ˙1 +
2 mi ζ˙1 − li ζ˙i+1 cos ϕi + li ζi+1 sin ϕi = 0 , i=1
1 2 2 ζ − 2li ζi+1 ζ1 cos ϕi + li2 ζi+1 − li g(1 + cos ϕi ) . 2 1
Die Berechnungsvorschrift
liefert f¨ ur ν = 1
(2.36)
und f¨ ur ν = i + 1 = 2, . . . , N + 1
mi li −ζ˙1 cos ϕi + li ζ˙i+1 − g sin ϕi = 0 .
(2.37)
(2.38)
Multipliziert man die Gleichungen (2.38) jeweils mit l1i cos ϕi und addiert sie oße, zu Gleichung (2.37), so bleibt in (2.37) nur noch ζ˙1 als zeitliche Ableitungsgr¨ nach der aufgel¨ ost werden kann:
2.5 Extremalprinzipien und Bewegungsgleichungen
m sin ϕ N
i
ζ˙1 =
2 g cos ϕi − li ζi+1
i
i=1
m0 +
N
85
.
(2.39)
mi sin2 ϕi
i=1
Eingesetzt in (2.38) gewinnt man einen expliziten Ausdruck f¨ ur ζ˙ν = ζ˙i+1 , wobei ν = 2, . . . , N + 1: 1 ˙ ζ1 cos ϕi + g sin ϕi ζ˙ν = ζ˙i+1 = li
cos ϕν−1 =
N
(2.40)
2 mi sin ϕi g cos ϕi − li ζi+1
i=1
lν−1 m0 +
N
2
mi sin ϕi
+
g sin ϕν−1 . lν−1
i=1
Die Gleichungen (2.36), (2.39), (2.40) bilden ein System von 2(N + 1) Differentialgleichungen erster Ordnung f¨ ur 2(N + 1) Unbekannte in expliziter Form, d. h., die Gleichungen wurden aufgel¨ ost nach den zeitlichen Ableitungen der 2(N + 1) Unbekannten, die auf der linken Seite stehen, w¨ ahrend auf den rechten Seiten keine Ableitungen vorkommen.
¨ Die Uberf¨ uhrung der Euler schen Differentialgleichungen zweiter Ordnung in ein Differentialgleichungssystem erster Ordnung in expliziter – d. h. in einer nach den Ableitungsgr¨ oßen aufgel¨ osten – Form kann auf vielf¨altige Weise geschehen und das Resultat beispielgebunden mehr oder minder zweckm¨aßig erscheinen. In der Sprechweise der Regelungsingenieure handelt es sich dann stets um eine Zustandsdarstellung des Systems. Anders gesagt: Das System wird durch einen Satz von Zustandsgleichungen beschrieben. Die Sch¨ opfer der analytischen Mechanik haben in der 1. H¨alfte des 19. ¨ Jahrhunderts einen physikalisch motivierten Weg der Uberf¨ uhrung gebahnt, der sich als außerordentlich sch¨ on und fruchtbar erwies – u. a. f¨ ur die Theorie der optimalen Steuerung, die in der 2. H¨ alfte des 20. Jahrhunderts entstand. Wir wollen diesem Weg folgen. Die ¨ außere Form der Euler-Lagrangeschen Gleichungen (2.34) legt es nahe, durch pν :=
∂L ∂ q˙ν
f¨ ur
ν = 1, . . . , n
(2.41)
n neue Unbekannte zu definieren. Sie gen¨ ugen einem Differentialgleichungssystem erster Ordnung in expliziter Form: p˙ ν =
∂L ∂qν
f¨ ur
ν = 1, . . . , n.
(2.42)
Man nennt pν die konjugierte Koordinate zur generalisierten Lagekoordinate qν und bezeichnet pν auch als kanonischen Impuls. ˙ t ab, so daß auf Leider h¨ angt die Lagrange-Funktion L bisher von q, q, ˙ der rechten Seite von (2.42) auch q-Terme auftreten k¨onnen. Ben¨otigt wird
86
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
ein Ausdruck auf der rechten Seite, der nur von den qν und pν sowie ggf. von t als unabh¨ angiger Variablen abh¨ angen darf, aber nicht von abgeleiteten Gr¨ oßen. Ein solcher Ausdruck kann aus L durch einen Kunstgriff gewonnen werden: Wegen . . ∂L ∂L ∂L dL = , dq + , dq˙ + dt ∂q ∂ q˙ ∂t . . - . ∂L ∂L ∂L ∂L , dq + d , q˙ − d , q˙ + dt = ∂q ∂ q˙ ∂ q˙ ∂t folgt mit (2.41) die Beziehung . . ∂L ∂L ∂L ˙ − d , q˙ − L = − , dq + dp, q dt ∂ q˙ ∂q ∂t . ∂L ∂L ˙ dp − , dq + q, dt. (2.43) =− ∂q ∂t 0 1 ˙ − L wird demnach von den Variablen Das Differential von H := ∂L ˙ ,q ∂q qν , pν und t bestimmt. F¨ ur die neu eingef¨ uhrte Funktion H = H(q, p, t) gilt einerseits
dH =
. . ∂H ∂H ∂H , dq + , dp + dt ∂q ∂p ∂t
und andererseits (2.43). Der Vergleich f¨ uhrt unter Ber¨ ucksichtigung von (2.42) auf ∂H ∂H p˙ν = − , q˙ν = (2.44) ∂qν ∂pν f¨ ur ν = 1, . . . , n und ∂H ∂L =− . ∂t ∂t Man bezeichnet H als Hamiltonfunktion und die 2n Differentialgleichungen erster Ordnung (2.44) als Hamiltonsche kanonische Form der EulerLagrangeschen Bewegungsgleichungen (2.34) oder kurz als kanonische Bewegungsgleichungen. ˙ t) berechnet man die zuAus einer gegebenen Lagrange-Funktion L(q, q, geh¨ orende Hamiltonfunktion H(q, p, t), indem man von der Beziehung . ∂L ˙ t) = p, q ˙ − L(q, q, ˙ t) H= , q˙ − L(q, q, (2.45) ∂ q˙ ausgeht und anschließend mit Hilfe der Gleichungen pν = ∂∂L q˙ν die auf ˙ der rechten Seite vorkommenden q-Komponenten eliminiert und durch pKomponenten ersetzt.
2.5 Extremalprinzipien und Bewegungsgleichungen
87
Beispiel 2.10 Beim verschieblichen N -fach-Pendel gilt bei Vernachl¨assigung der Reibkr¨ afte (vgl. Beispiel 2.9):
N
˙ t) = L(q, q,
q = (q1 , q2 , . . . , qn )T = (x0 , ϕ1 , . . . , ϕN )T ,
n = N + 1,
mi 2 m0 2 x˙ 0 + li2 ϕ˙ 2i − 2li x˙ 0 ϕ˙ i cos ϕi − 2li g(1 + cos ϕi ) . x˙ + 2 0 i=1 2
Die zu den Lagekoordinaten qν geh¨ orenden kanonischen Impulse pν ergeben sich zu aus pν = ∂∂L q˙ν N
mi (x˙ 0 − li ϕ˙ i cos ϕi )
p1 = m0 x˙ 0 + i=1
und pν+1 = mν lν (lν ϕ˙ ν − x˙ 0 cos ϕν )
f¨ ur
ν = 1, 2, . . . , N.
Eine mechanische Interpretation der kanonischen Impulse f¨ allt hier nicht schwer: p1 ist der (translatorische) Impuls des Gesamtsystems in Bewegungsrichtung des Wagens, w¨ ahrend pν+1 den Drehimpuls des ν-ten Pendels darstellt. Der Ansatz ˙ − L (q, q, ˙ t) f¨ H = p, q ur die Hamilton-Funktion liefert zun¨ achst N
H = p1 x˙ 0 +
pi+1 ϕ˙ i i=1
−
m0 2 x˙ − 2 0
N
i=1
(2.46)
mi 2 x˙ 0 + li2 ϕ˙ 2i − 2li x˙ 0 ϕ˙ i cos ϕi − 2li g(1 + cos ϕi ) . 2
˙ Die q-Komponenten auf der rechten Seite sind jetzt zu eliminieren und durch pKomponenten zu ersetzen, und zwar mit Hilfe der Definitionsgleichungen der kanonischen Impulse
p1 p2 .. . pN+1
N
i=0
=
−l1 m1 cos ϕ1 . . . −lN mN cos ϕN
mi
−l1 m1 cos ϕ1 .. . −lN mN cos ϕN
m1 l12 .. . 0
... .. . ...
0 .. .
x˙ 0 ϕ˙ 1
·
2 m N lN
.. . ϕ˙ N
.
Aus diesem linearen algebraischen Gleichungssystem gewinnen wir die Beziehungen N
li−1
p1 +
cos ϕi · pi+1 =
N
x˙ 0 = q˙1 =
i=1
−1
N
mi sin2 ϕi
m0 + i=1
und
mi [1 − cos ϕi ] x˙ 0 ,
m0 +
i=1
also
2
N
li−1 cos ϕi · pi+1
p1 + i=1
,
88
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen −2 ϕ˙ i = m−1 ˙ 0) i li (pi+1 + li mi cos ϕi · x
f¨ ur
i = 1, . . . , N.
Durch Einsetzen in (2.46) erhalten wir die Hamilton-Funktion in der gew¨ unschten Abh¨ angigkeit von q und p. Um Schreibaufwand einzusparen, begn¨ ugen wir uns bei der weiteren Beispieldiskussion mit dem Fall N = 1, d. h. q = (x0 , ϕ1 )T . Daraus folgt p = (p1 , p2 )T zu p1 = m0 x˙ 0 + m1 (x˙ 0 − l1 ϕ˙ 1 cos ϕ1 ), p2 = m1 l1 (l1 ϕ˙ 1 − x˙ 0 cos ϕ1 ). Die Aufl¨ osung dieser beiden Beziehungen nach x˙ 0 und ϕ˙ 1 liefert x˙ 0 = m0 + m1 sin2 ϕ1
−1
p1 + l1−1 cos ϕ1 · p2
−2 ϕ˙ 1 = m−1 ˙ 0) 1 l1 (p2 + l1 m1 cos ϕ1 · x
=
l1 m1 cos ϕ1 · p1 + (m0 + m1 ) · p2 . m1 l12 (m0 + m1 sin2 ϕ1 )
Die Hamilton-Funktion als Funktion von q und p gewinnt man so: H = p1 x˙ 0 + p2 ϕ˙ 1
1 2 m0 2 x˙ 0 − m1 x˙ 0 + l12 ϕ˙ 21 − l1 g(1 + cos ϕ1 ) − l1 cos ϕ1 · x˙ 0 ϕ˙ 1 2 2 1 1 = p1 x˙ 0 + p2 ϕ˙ 1 − p1 x˙ 0 − p2 ϕ˙ 1 + m1 l1 g(1 + cos ϕ1 ) 2 2 1 = (p1 x˙ 0 + p2 ϕ˙ 1 ) + m1 l1 g(1 + cos ϕ1 ) 2 (m0 + m1 )p22 + m1 l12 p21 + 2l1 m1 cos ϕ1 · p1 p2 + m1 l1 g(1 + cos ϕ1 ). = 2m1 l12 (m0 + m1 sin2 ϕ1 )
−
Daraus folgen die kanonischen Bewegungsgleichungen ∂H ∂p1 ∂H ϕ˙ 1 = ∂p2 ∂H p˙ 1 = − ∂x0 ∂H p˙ 2 = − ∂ϕ1 x˙ 0 =
p1 + l1−1 cos ϕ1 · p2 m0 + m1 sin2 ϕ1 l1 m1 cos ϕ1 · p1 + (m0 + m1 ) · p2 = m1 l12 (m0 + m1 sin2 ϕ1 ) =
=0 =
m1 sin ϕ1 cos ϕ1 2 sin ϕ1 (m0 + m1 (1 + cos2 ϕ1 )) p1 + p1 p2 (m0 + m1 sin2 ϕ1 )2 l1 (m0 + m1 sin2 ϕ1 )2 (m0 + m1 ) sin ϕ1 cos ϕ1 2 + 2 p2 + m1 l1 g sin ϕ1 . l1 (m0 + m1 sin2 ϕ1 )2
Die kanonischen Bewegungsgleichungen beschreiben den Zeitablauf in 2n Koordinaten, n¨ amlich den n Komponenten des Lagevektors q im Lagrangeschen Konfigurationsraum und den n Komponenten des kanonischen Impulsvektors p. Der 2n-dimensionale q-p-Raum wird nach einem Vorschlag des USamerikanischen Physikers J. W. Gibbs (1839–1903) oft als Phasenraum bezeichnet. Der Bewegungsablauf des Gesamtsystems wird durch eine Kurve im
2.5 Extremalprinzipien und Bewegungsgleichungen
89
Phasenraum beschrieben, die durch den Anfangswerte-Vektor (q(t0 ), p(t0 )) zu einem beliebigen Zeitpunkt t = t0 und die Differentialgleichungen eindeutig festgelegt ist. Im Phasenraum sind Kreuzungen“ zwischen Trajektorien ” grunds¨ atzlich ausgeschlossen. Die einparametrige Gruppe von Transformationen des Phasenraumes gt : (q(0), p(0)) → (q(t), p(t)) wird als Phasenfluß bezeichnet. Bei einem Hamiltonschen System l¨ aßt der Phasenfluß das 2n-dimensionale Volumen eines beliebig herausgeschnittenen endlichen Bereiches des Phasenraumes unver¨ andert (Satz von Liouville, vgl. z.B. [Arn88]). Tritt in der Hamilton-Funktion H(q, p, t) eine der kanonischen Koordinaten nicht explizit auf, so kann man aus den kanonischen Gleichungen ohne weiteres auf eine Erhaltungsgr¨ oße, das ist eine im Zeitverlauf un∂H ver¨ anderliche physikalische Gr¨ oße, schließen. Gilt ∂p = 0, so folgt q˙ν = 0 ν und damit qν (t) = const, d. h., die zum kanonischen Impuls pν konjugierte ∂H Lagekoordinate ist eine Erhaltungsgr¨ oße. Analog folgt aus ∂q = 0, daß der ν zur Lagekoordinate qν konjugierte kanonische Impuls eine Erhaltungsgr¨oße ist. F¨ ur die Zeitableitung der Hamilton-Funktion berechnet man . . dH ∂H ∂H ∂H ∂H ˙ q ˙ + q, ˙ p ˙ + = , q˙ + , p˙ + = −p, dt ∂q ∂p ∂t ∂t ∂H . = ∂t Wenn demnach die Zeit nicht explizit in der Hamilton-Funktion vorkommt, also ∂H oße eine Erhal∂t = 0 gilt, so ist die H zuordenbare physikalische Gr¨ tungsgr¨ oße. Diese ist in aller Regel als die Gesamtenergie des betrachteten Systems interpretierbar; denn ∂L ∂T q˙ − L = q˙ − L ∂ q˙ ∂ q˙ = 2T − L = 2T − (T − V ) = T + V = Eges .
˙ −L= H(q, p, t) = p, q
Bei der ersten Umformung wurde die Vorschrift (2.45) f¨ ur die Berechnung der Hamilton-Funktion, bei der zweiten Umformung die Definition (2.41) der ˙ t) = kanonischen Impulse, bei der dritten Umformung die Beziehung L(q, q, ˙ − V (q) und bei der vierten Umformung die Tatsache, daß die kinetiT (q, q) sche Energie eine homogene quadratische Funktion der Geschwindigkeit ist, ausgenutzt. Beispiel 2.11 Aus den Rechnungen des Beispiels 2.10 geht hervor, daß die Hamilton-Funktion H(q, p, t) beim reibungsfrei modellierten verschieblichen N fach Pendel weder vom Zeitparameter t noch von der Lagekoordinate q1 = x0 explizit abh¨ angt. Dies impliziert 1. Die mechanische Gesamtenergie ¨ andert sich nicht mit der Zeit. Mit anderen Worten: Das mechanische Systemmodell erf¨ ullt den Energie(erhaltungs)satz.
90
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
2. Der kanonische Impuls N
mi (x˙ 0 − li ϕ˙ i cos ϕi ),
p1 = m0 x˙ 0 + i=1
der mit der Lagevariablen x0 korrespondiert, ist eine weitere Erhaltungsgr¨ oße des mechanischen Systems.
Generell kann es vorteilhaft sein, die Bewegung eines komplizierten Systems mit n Freiheitsgraden im 2n-dimensionalen Phasenraum zu betrachten. Die 2n kanonischen Koordinaten (q1 , . . . , qn , p1 , . . . , pn ) k¨onnen formal in ei q zusammengestellt werden. Jeden Punkt x des Phasennem Vektor x = p raumes darf man sich als Ortsvektor in einem 2n−dimensionalen Vektorraum mit einer orthonormierten Basis vorstellen, x=
n
(qν eν + pν en+ν ),
ν=1
wobei die orthonormierten Einheitsvektoren ei eine 1 als i-te Komponente und jeweils 0 f¨ ur die u ¨ brigen (2n − 1) Komponenten haben. Der Zeitablauf des Systems wird durch eine Kurve x(t) =
n
(qν (t)eν + pν (t)en+ν )
ν=1
beschrieben. Dabei ergeben sich die skalaren Zeitfunktionen aus den kanonischen Bewegungsgleichungen q˙ν =
∂H ∂pν
und
p˙ν = −
∂H ∂qν
f¨ ur
ν = 1, 2, . . . , n.
Im Phasenraum kann man ein (ggf. zeitabh¨angiges) Geschwindigkeitsfeld definieren, T n ∂H ∂H ∂H ∂H ,− v(x, t) = eν − en+ν = . ∂pν ∂qν ∂p ∂q ν=1 Daraus folgt eine Differentialgleichung f¨ ur die Bewegung des Punktes x(t) im Phasenraum, T ∂H ∂H ˙ x(t) = v(x, t) = ,− . ∂p ∂q Zu einem festen Zeitpunkt t = t0 liegen die Phasenraumpunkte x(t0 ) gleicher Energie E auf der (2n − 1)-dimensionalen Hyperfl¨ache
2.5 Extremalprinzipien und Bewegungsgleichungen
91
H(x, t0 ) = E. H¨ angt die Hamilton-Funktion H nicht explizit von der Zeit ab, so bewegt sich der Phasenraumpunkt x(t) stets auf dieser Hyperfl¨ache. Zwischen dem Geschwindigkeitsfeld v und dem Gradienten der Hyperfl¨ ache konstanter Energie gilt eine Orthogonalit¨atsrelation -
∂H ,v ∂x
. =
2n ∂H i=1
∂xi
· vi =
n n ∂H ∂H ∂H ∂H = 0. · + · − ∂qν ∂pν ν=1 ∂pν ∂qν ν=1
Der Betrag der Geschwindigkeit stimmt mit dem Betrag des Energiegradienten u ¨ berein; denn |v| = 2
2n i=1
vi2
=
2 n ∂H ν=1
∂pν
+
2 n ∂H ν=1
∂qν
=
2 2n ∂H i=1
∂xi
∂H 2
=
∂x
Eine beliebige physikalische Gr¨ oße G, die sich in der Gestalt G = G(x) darstellen lassen m¨ oge, besitzt die zeitliche Ableitung . . d ∂G ∂G G˙ = G(x(t)) = , x˙ = ,v . dt ∂x ∂x ur3 Erhaltungsgr¨ oßen gilt per definitionem G˙ = 0. Dies impliziert 2 ∂GF¨ ∂x , v = 0. Mithin ist die Bewegung des Systems an eine (2n−1)-dimensionale Hyperfl¨ ache gebunden, und das Geschwindigkeitsfeld steht senkrecht auf dem Gradienten dieser Hyperfl¨ ache. 2.5.5 Bewegungsgleichungen unter Nebenbedingungen In den Abschnitten 2.5.3 und 2.5.4 waren kinetische Bewegungsgleichungen unter der Voraussetzung diskutiert worden, daß die Bewegung im ndimensionalen Konfigurationsraum beschrieben wird, in dem die Variationen δqν f¨ ur ν = 1, 2, . . . , n unabh¨ angig voneinander gew¨ahlt werden d¨ urfen. Dar¨ uber hinaus wurde angenommen, die eingepr¨agten Kr¨afte w¨aren Potentialkr¨ afte. Beide Voraussetzungen treffen in der regelungstechnischen Praxis meist nicht zu. Die zweite Annahme kann z. B. grunds¨atzlich nicht gemacht werden, wenn Reibungskr¨ afte im Spiel sind. Die Beschreibung eines Systems liegt oft in Koordinaten vor, deren Anzahl gr¨oßer ist als die Zahl der Freiheitsgrade des Systems. Dann m¨ ussen geometrische und/oder kinematische Bindungen eingehalten werden, die einerseits den zul¨assigen Koordinatenvariationen Zwangsbedingungen auferlegen und andererseits Zwangskr¨afte hervorrufen. ¨ F¨ ur die folgenden Uberlegungen sei wiederum an mechanische Massenpunkte-Systeme gedacht, deren Lage zum Zeitpunkt t durch einen Vektor x(t) beschrieben wird. Die Anzahl der Koordinaten x1 , x2 , . . . ist jetzt generell
92
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
gr¨oßer als die Anzahl n der mechanischen Freiheitsgrade des Systems. Die Bindungen m¨ ogen in Form homogener Gleichungen vorliegen. Dabei wollen wir • geometrische Bindungen, darstellbar in der Form fκ (x, t) = 0
f¨ ur
κ = 1, 2, . . . , k,
(2.47)
und • kinematische Bindungen, darstellbar in der Form ur gµ0 dt + gµ , dx = 0 f¨
µ = 1, 2, . . . , m,
(2.48)
unterscheiden. Beispiel 2.12 Wir betrachten wieder das verschiebliche N -fach-Pendel. Es wurde im Abschnitt 2.5.3.1 als ebenes (N + 1)-Massenpunkte-Modell vorgestellt. Dieses Modell besitzt n = N + 1 Freiheitsgrade. Mit den im Abschnitt 2.5.3.1 eingef¨ uhrten Bezeichnungen gilt f¨ ur den Lagevektor x = (x0 , y0 , x1 , y1 , x2 , y2 , . . . , xN , yN )T ∈ amlich R2(N+1) . Einzuhalten sind k = N + 1 geometrische Bindungen, n¨ f0 (x) = y0 = 0,
(2.49) 2
2
fi (x) = (xi − x0 ) + (yi − y0 ) −
li2
=0
f¨ ur
i = 1, . . . , N.
(2.50)
Zus¨ atzliche kinematische Bindungen existieren beim verschieblichen N -fach-Pendel nicht.
Um beim Bewegungsablauf des Systems der κ-ten geometrischen Bindung zu gen¨ ugen, m¨ ussen benachbarte x-Vektoren die Bedingung . ∂fκ ∂fκ dt + , dx = 0 ∂t ∂x erf¨ ullen. Da bei den virtuellen Verschiebungen die Zeit nicht variiert wird, haben die virtuellen Verschiebungen δx der Zwangsbedingung . ∂fκ , δx = 0 f¨ ur κ = 1, . . . , k (2.51) ∂x zu gen¨ ugen. Bei kinematischen Bedingungen der Gestalt (2.48) ergeben sich die Zwangsbedingungen zu gµ , δx = 0
f¨ ur
µ = 1, . . . , m.
(2.52)
Wenn sich die Ausdr¨ ucke gµ0 und gµ nicht (wie im Falle der geometrischen ∂g ∂g Bindungen) als partielle Ableitungen ∂tµ und ∂xµ einer Funktion gµ (x, t) darstellen lassen, so spricht man von anholonomen Bindungen“ (zu deutsch: ” nicht ganz gesetzlichen Bindungen), w¨ ahrend Bindungen der Gestalt (2.47)
2.5 Extremalprinzipien und Bewegungsgleichungen
93
als holonom bezeichnet werden. Ein Beispiel f¨ ur eine anholonome Bindung liefert das auf der (x, y)−Ebene rollende Rad. Wenn das Rad zu irgendeinem Zeitpunkt die Ebene in eiem bestimmten Punkt ber¨ uhrt und sich unter einem Winkel α zur x-Achse bewegt, so muß bei einer virtuellen Verschiebung des Ber¨ uhrungspunktes die Zwangsbedingunng −δy + tan α · δx = 0 eingehalten werden. H¨ angt die Funktion fκ nicht explizit von t ab bzw. gilt gµ0 = 0, so handelt es sich um zeitinvariante (oder skleronome, d. h. starre“) Bindungen, ” andernfalls um zeitvariante (oder rheonome, d. h. fließende“) Bindungen. ” Im Abschnitt 2.5.3.3 wurde das d’Alembertsche Prinzip f¨ ur MassenpunkteSysteme besprochen und auf die mathematische Form δAm = mi ¨ xi , δxi = fie , δxi = f e , δx = δAe (2.53) (i)
(i)
gebracht. Die virtuellen Verschiebungen δx = (δxT1 , δxT2 , . . .)T des Systems m¨ ussen nun den Zwangsbedingungen (2.51) und (2.52) gehorchen. Nach dem Lagrangeschen Befreiungsprinzip l¨ aßt sich eine gedachte Lockerung dieser Bindungen durch zus¨ atzliche eingepr¨ agte Kr¨ afte λκ
∂fκ ∂x
bzw.
λµ gµ
kompensieren. Die Lagrangeschen Multiplikatoren λκ und λµ bleiben zun¨achst unbestimmt und k¨ onnen erst aus dem Zusammenspiel aller relevanten Systemgleichungen ermittelt werden. Die zus¨ atzlichen Kr¨ afte wirken ebenso wie die eingepr¨agten Kr¨afte f e und leisten bei einer virtuellen Verschiebung δx zus¨atzliche virtuelle Arbeit . - ∂fκ δAz = , δx + λκ λµ gµ , δx . ∂x (κ)
(µ)
Die kinetischen Gleichgewichtsbedingungen (2.53) sind zu modifizieren auf δAm = δAe + δAz , ausgeschrieben + , ∂fκ e + mi ¨ xi , δxi = f + λκ λ(µ) gµ , δx . (2.54) ∂x µ (i)
(κ)
Auf Grund der vorgestellten Lockerung der Bindungen d¨ urfen in dieser skalaren Gleichung die Komponenten des Verschiebungsvektors δx unabh¨ angig voneinander gew¨ ahlt werden. Folglich m¨ ussen die in den Skalarprodukten auf der rechten und der linken Seite der Gleichung jeweils links stehenden Vektoren komponentenweise u ¨ bereinstimmen. Dieses Resultat kann man massenpunktbezogen notieren:14 14
¨ Um in Ubereinstimmung mit der Arbeits-Bilanzgleichung (2.54) zu bleiben, schreiben wir im folgenden die Vektoren in Kr¨ afte-Bilanzgleichungen als Zeilenvektoren.
94
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
mi x¨i = fie +
λκ
(κ)
∂fκ + λµ gµi . ∂xi
(2.55)
(µ)
Die zu l¨ osende Aufgabe besteht aus zwei Teilen: Berechnung der Bahnen xi (t) und Berechnung der Lagrangeschen Unbestimmten λκ und λµ . Wir fragen, ob die Anzahl der Unbekannten mit der Anzahl der zur Verf¨ ugung stehenden Bestimmungsgleichungen u bereinstimmt. ¨ Wenn das mechanische Modellsystem aus M Massenpunkten, die sich im dreidimensionalen Anschauungsraum R3 bewegen, besteht, so gilt xi ∈ R3 f¨ ur i = 1, 2, . . . , M . Folglich sind im Vektor x = (xT1 , . . . , xTM )T insgesamt 3M Unbekannte zusammengefaßt. Bei k geometrischen Bindungen (2.47) und m kinematischen Bindungen (2.48) kommen k + m Lagrangesche Unbestimmte hinzu. Insgesamt sind demnach 3M + k + m Unbekannte gesucht. Als Bestimmungsgleichungen stehen die k Bedingungen (2.47), die m Bedingungen (2.48) und die 3M Differentialgleichungen (2.55) zur Verf¨ ugung. ¨ Die notwendige Ubereinstimmung zwischen der Anzahl der Unbekannten und der der Bestimmungsgleichungen ist demnach gegeben. Um eindeutige Bahnkurven xi (t) zu berechnen, m¨ ussen nat¨ urlich die Anfangspositionen xi (0) und die Anfangsgeschwindigkeiten x˙ i (0) bekannt sein. Beispiel 2.13 Beim verschieblichen N-fach-Pendel m¨ussen die eingepr¨agten Kr¨afte (einschließlich der im Abschnitt 2.5.3.2 angesetzten Reibungskr¨ afte) den einzelnen Massenpunkten zugeordnet werden. Die in den Pendellagern eingepr¨ agten Drehkr¨ afte Di sind durch ¨ aquivalent wirkende Kr¨ aftepaare zu ersetzen, die an den Punkten (xi , yi ) und (x0 , y0 ) angreifen, vgl. Bild 2.22. y yi
mi
y ϕi
yi
fi
mi
|fi | = | Dlii |
mit
li Di y0
y0
m0 xi
x0
−fi
x
xi
m0 x0
x
aquivalentes Kr¨ aftepaar, das in der Bild 2.22. Ersatz der Drehkraft Di durch ein ¨ Ebene senkrecht zur Pendelstange wirkt. Wir ersetzen die eingepr¨ agte Drehkraft Di durch eine Kraft fi , wobei (fi )T =
Di li2
−yi + y0 , xi − x0
die in (xi , yi ) angreift, und durch eine Kraft −fi , die in (x0 , y0 ) angreift. Die resultierende eingepr¨ agte Kraft fie im Punkt (xi , yi ) ergibt sich aus
2.5 Extremalprinzipien und Bewegungsgleichungen
(fie )T =
0 −mi g
+
Di − di ϕ˙i li2
−yi + y0 xi − x0
f¨ ur
i = 1, . . . , N,
und die resultierende eingepr¨ agte Kraft f0e im Punkt (x0 , y0 ) aus (f0e )T =
F −m0 g
− d0
x˙ 0 y˙ 0
N Di − di ϕ˙i −
li2
i=1
95 (2.56)
−yi + y0 . xi − x0
(2.57)
Schließlich muß noch ϕ˙ i in kartesische Koordinaten umgeschrieben werden. Aus −xi ϕi = arctan( xy0i −y ) folgt 0 ϕ˙ i =
(y˙ i − y˙ 0 )(xi − x0 ) − (x˙ i − x˙ 0 )(yi − y0 ) . (xi − x0 )2 + (yi − y0 )2
Das Differentialgleichungssystem (2.55) stellt sich f¨ ur das Beispiel so dar: m0 mi
x ¨0 y¨0 x ¨i y¨i
= (f0e )T + λ0
−2(xi − x0 ) 0 + λi 1 −2(yi − y0 ) N
i=1
=
(fie )T
+ λ 0 · 0 + λi
2(xi − x0 ) 2(yi − y0 )
(2.58)
f¨ ur
i = 1, . . . , N.
(2.59)
Insgesamt liegen hier (N + 1) algebraische Gleichungen (infolge der geometrischen Bindungen) und 2(N +1) Differentialgleichungen zweiter Ordnung zur Berechnung der 2(N +1) Lagekoordinaten und der N +1 Lagrangeschen Unbestimmten vor. Zus¨ atzliche kinematische Bindungen existieren nicht. Die mechanische Bedeutung der Lagrangeschen Unbestimmten erschließt sich aus den angegebenen Differentialgleichungen: λ0 (t) ist die vertikale Wechselwirkungskraft, die die Laufschiene des Wagens zum Zeitpunkt t verkraften“ muß, w¨ ahrend λi (t) die Zug- bzw. Druck” spannung, die zur Zeit t in der i-ten Pendelstange herrscht, bestimmt.
Zur Beschreibung des Kleinsignal-Verhaltens in der N¨ahe von Gleichgewichtslagen des Untersuchungsobjekts gen¨ ugt in aller Regel ein lineares Systemmodell. Die grunds¨ atzlichen Aussagen des Abschnitts 1.4.2 zur Herleitung eines linearisierten Modells lassen sich ohne weiteres auf Systeme mit Nebenbedingungen u ¨bertragen. Dabei wird auch bei den Systemgr¨oßen, die als Lagrangesche Unbestimmte eingef¨ uhrt wurden, zwischen Gleichgewichtswerten und Kleinsignal-Werten zu unterscheiden sein. ¯ der unbekannten Vektoren x(t) und ¯ und λ Um die Gleichgewichtslagen x λ(t) bei k holonomen Nebenbedingungen fκ (x) = 0
f¨ ur
κ = 1, 2, . . . , k
zu ermitteln, hat man die aus (2.55) hervorgehenden algebraischen Gleichungen 0 = f¯ie +
¯ κ ∂fκ
λ ∂xi x=¯x κ=1 k
f¨ ur
i = 1, 2, . . . , M
(2.60)
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
96
und 0 = fκ (¯ x)
f¨ ur
κ = 1, 2, . . . , k
(2.61)
¯ darf ¯, λ zu l¨ osen. In der Umgebung einer gefundenen Gleichgewichtslage x man mit linearisierten Systemgleichungen, denen die Kleinsignal-Gr¨oßen = λ(t) − λ ¯ gen¨ (t) = x(t) − x ¯ und λ(t) x ugen, arbeiten:15
. ∂fκ
f¨ ur κ = 1, 2, . . . , k 0= , x i ∂xi x=¯x
k
∂ 2 fκ
¨ κ ∂fκ
¯κ x i = fie + mi x λ f¨ ur i = 1, 2, . . . , M. + λ i ∂xi x=¯x ∂x2i x=¯x κ=1 Im Falle xi ∈ R3 entsteht so ein lineares Gleichungssystem, das aus k + 3M skalaren Gleichungen besteht, f¨ ur insgesamt 3M + k skalare Unbekannte. Beispiel 2.14 Bei verschwindenden ¨außeren Erregungen (F (t) ≡ 0, Di (t) ≡ 0 f¨ur
i = 1, . . . , N ) sind die 2N Gleichgewichtslagen des verschieblichen N -fach-Pendels wie folgt zu charakterisieren. Aus (2.56) und (2.57) lassen sich zun¨ achst die eingepr¨ agten Gleichgewichtskr¨ afte entnehmen, (¯ fie )T =
0 −mi g
f¨ ur
i = 0, 1, . . . , N.
Die 2N Gleichgewichtslagen k¨ onnen aus den allgemeinen Beziehungen (2.60), (2.61) durch Anwendung auf die beispielbezogenen Gleichungen (2.49), (2.50), (2.58), (2.59) gewonnen werden: y¯0 = 0
(2.62) 2
2
0 = (¯ xi − x ¯0 ) + (¯ yi − y¯0 ) − 0 0 0 0
=
=
0 −m0 g 0 −mi g
¯0 +λ
li2
¯ x¯i − x¯0 0 −2 λi y¯i − y¯0 1 N
f¨ ur
i = 1, 2, . . . , N (2.63) (2.64)
i=1
¯i + 2λ
x ¯i − x ¯0 y¯i − y¯0
f¨ ur
i = 1, 2, . . . , N. (2.65)
Das sind (3N + 3) skalare Gleichungen f¨ ur ebenso viele skalare Unbekannte. L¨ osungen lassen sich hier leicht finden: (2.62) liefert y¯0 = 0, und aus (2.65) folgt 15
2
Das Symbol ∂∂xf2κ steht hier f¨ ur eine quadratische Matrix, deren Zeilen- und i Spaltenl¨ ange durch die Anzahl der Komponenten von xi definiert wird.
2.5 Extremalprinzipien und Bewegungsgleichungen x ¯i = x ¯0
f¨ ur
97
i = 1, 2, . . . , N.
Dieses Zwischenergebnis impliziert mit (2.63) y¯i2 = li2
f¨ ur
i = 1, 2, . . . , N,
d. h. y¯i = ±li . Daher gibt es insgesamt 2N m¨ ogliche Gleichgewichtslagen. Wir betrachten die ausgezeichnete Gleichgewichtslage, bei der alle Pendel aufrecht stehen, d. h. y¯i = li
f¨ ur
i = 1, 2, . . . , N.
Nun folgt aus (2.65) ¯ i = mi g λ 2li
f¨ ur
und mit (2.64) schließt man auf N
¯i = li λ
¯ 0 = m0 g + 2 λ
i = 1, . . . , N,
N
m0 +
i=1
mi
g.
i=1
Die physikalische Deutung der Lagrangeschen Unbestimmten in der gew¨ ahlten ¯ 0 hat das GesamtGleichgewichtslage bereitet keine M¨ uhe: Die Reaktionskraft λ ¯ i l¨ gewicht des Systems zu kompensieren, w¨ ahrend die λ angenbezogene Druckkr¨ afte ¯ i li = mi g). in den i-ten Pendelstangen sind (2λ Mit den Ans¨ atzen
xi (t) = xi (t) − x ¯i , yi (t) = yi (t) − y¯i ,
¯i, λi (t) = λi (t) − λ fie (t) = fie (t) − ¯ fie
erhalten wir durch Einsetzen in die urspr¨ unglichen nichtlinearen Gleichungen (2.49), (2.50), (2.58), (2.59), indem Produkte von ∼ “-Gr¨ oßen konsequent weggelassen ” werden, weil sie von h¨ oherer Ordnung klein“ sind, die linearisierten Gleichungen ” f¨ ur die ∼“-Gr¨ oßen. Die Nebenbedingungen ” (xi − x0 )2 + (yi − y0 )2 − li2 = 0
(i = 1, 2, . . . , N )
¯0 und y¯i = li = 0 zun¨ achst in der Gestalt erscheinen wegen x ¯i = x
(xi − x0 )2 + (li + yi − y0 )2 − li2 = 0,
ausgeschrieben,
x2i − 2xi x0 + x20 + li2 + 2li (yi − y0 ) + yi2 − 2yi y0 + y02 − li2 = 0. Unter Vernachl¨ assigung der Terme h¨ oherer Ordnung folgt daraus yi − y0 = 0.
Da die Nebenbedingung y0 = 0 auch y0 = 0 impliziert, wird
98
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen yi = 0
f¨ ur
i = 0, 1, . . . , N.
(2.66)
Produkte λκ xi , die in den nichtlinearen Differentialgleichungen vorkommen, gehen ¯ κ x i + λκ x ¯ i . Die eingepr¨ agten Kr¨ afte fie , die auf den bei der Linearisierung u ¨ ber in λ i-ten Massenpunkt (i = 1, 2, . . . , N ) wirken, ergeben sich daher so:
Di − di ϕ˙ i −yi + y0 xi − x0 li2 −1 ˙ Di + di li (xi − x˙ 0 ) −yi + y0 − li = xi − x0 li2 di (x˙ i − x˙ 0 ) 1 Di −li = 2 − . 0 li x i − x 0 li2
(fie )T =
(2.67)
Bei der letzten Umformung wurde (2.66) benutzt. Auf den 0-ten Massenpunkt wirkt die Kraft f0e , wobei
F 0
(f0e )T =
− d0
˙ x0 y˙ 0
−
N
(fie )T .
(2.68)
i=1
Das Gesamtsystem der linearisierten Bewegungsgleichungen kann nun wie folgt notiert werden:
¨ m0
x0 y¨0
mi
xi y¨i
N
i=1
= (f0e )T + λ0
¨
= (fie )T + λi
0 0 + λi 1 −2li
= (f0e )T + λ0
0 0 + λi 1 −2li
0 2li
N
i=1
+
mi g li
−
mi g li
−
mi g li
xi − x0 0
xi − x0 yi xi − x0 0
f¨ ur
i = 1, 2 . . . , N.
Mit den Ausdr¨ ucken (2.68) und (2.67) f¨ ur die eingepr¨ agten Kr¨ afte lauten die linearisierten Bewegungsgleichungen f¨ ur die x-Komponenten ¨ 0 = F − d0 x˙ 0 − m0 x
N i=1
g
Di mi di (xi − x0 ) − 2 (x˙ i − x˙ 0 ) − li li li
¨ i = g mi (xi − x0 ) − di (x˙ i − x˙ 0 ) − Di mi x li li2 li
f¨ ur
i = 1, 2 . . . , N.
Vergleicht man diese Gleichungen mit den linearisierten Bewegungsgleichungen in Lagrangeschen Lagekoordinaten (x0 , ϕ1 , . . . , ϕN ), die in (2.31) auf S. 80 angegeben wurden, so lassen sie sich ineinander u uhren, wenn man die Beziehung ¨berf¨ li ϕi = −xi + x0 (i = 1, . . . , N ) benutzt. Die mit den Lagrangeschen Unbestimmten λ0 (t), λ1 (t), . . . , λN (t) verbundenen Informationen u afte, die f¨ ur einen experimentellen Auf¨ ber auftretende Reaktionskr¨ bau des technischen Systems außerordentlich bedeutsam werden k¨ onnen, bleiben bei einer Beschreibung mit Lagrangeschen Lagekoordinaten im Verborgenen. Hier gewinnen wir sie aus den Bewegungsgleichungen f¨ ur die y-Komponenten
2.5 Extremalprinzipien und Bewegungsgleichungen m0 y¨0 = −d0 y˙ 0 −
N Di i=1
li2
(x i − x 0 ) + λ 0 −
2li λi
i=1
Di (xi − x0 ) + 2li λi li2
mi y¨i =
N
99
f¨ ur
i = 1, 2, . . . , N ).
Unter Ber¨ ucksichtigung von (2.66) vereinfachen sich diese Beziehungen zu linearen algebraischen Gleichungen, die unmittelbar aufgel¨ ost werden k¨ onnen: λi = −
Di (x i − x 0 ) 2li3
f¨ ur
i = 1, 2, . . . , N );
λ0 = 0.
2.5.6 Variationsaufgaben unter Nebenbedingungen Die geniale Idee der Lagrangeschen Unbestimmten erweist sich auch bei der Bearbeitung von Variationsaufgaben, bei denen Nebenbedingungen einzuhalten sind, als zielf¨ uhrend. Eine klassische Problemstellung lautet: Bestimme eine Bahn x(t) derart, daß t1 ˙ L(x(t), x(t), t)dt → Extremum t0
unter der Bedingung t1 ˙ F (x(t), x(t), t) = K = const.
(2.69)
t0
Man spricht in diesem Zusammenhang seit Jakob Bernoulli vom isoperimetrischen Problem, weil sich die Konstante K in der Nebenbedingung (2.69) oft geometrisch als Umfang oder Oberfl¨ ache deuten l¨aßt. Als L¨osungen werden nur isoperimetrische Bahnen, d. h. Bahnen mit dem gleichen Um” fangsmaß“, zugelassen. Mit Hilfe einer Lagrangeschen Unbestimmten λ kann das Problem als gew¨ ohnliche Variationsaufgabe t1 ˙ t) + λF (x, x, ˙ t)) dt → Extremum (L(x, x,
(2.70)
t0
behandelt werden. Ein Beispiel wurde bereits im Einf¨ uhrungsabschnitt 2.5.1 diskutiert: Die Gestalt einer Kette gegebener L¨ ange K unter der Wirkung des Erdschwerefeldes. Mit der rechnerischen Behandlung des Einf¨ uhrungsbeispiels soll der Abschnitt 2.5 enden.
¨ 2 Mathematische Beschreibung von Signalen und Ubertragungssystemen
100
Beispiel 2.15 Die stabile Gleichgewichtslage einer gegebenen Kette der L¨ange K stellt sich so ein, daß die potentielle Energie zum Minimum wird. Wenn die Masse der Kette u ange gleichm¨ aßig verteilt ist, so wiegen gleich ¨ber ihre gesamte L¨ lange Kettenst¨ ucke gleich viel. Im (x, y)-Koordinatensystem des Bildes 2.14 ist die potentielle Energie eines Kettenst¨ uckchens der L¨ ange ds an der Stelle (x, y) bis auf eine additive Konstante gleich y · g ds, wobei die Massendichte pro L¨ angeneinheit ist. angende Kette habe die L¨ ange Die zwischen den Punkten (x1 , y1 ) und (x2 , y2 ) h¨ K > (x2 − x1 )2 + (y2 − y1 )2 . Die Bedingung (2.69) lautet hier
(x2 ,y2 )
K=
(x2 ,y2 )
(x1 ,y1 )
x2
x2
x1
(x1 ,y1 )
F (y )dx.
1 + (y (x))2 dx =
(dx)2 + (dy)2 =
ds =
x1
Die potentielle Energie l¨ aßt sich berechnen: (x2 ,y2 )
Epot =
(x2 ,y2 )
yg ds = g (x1 ,y1 )
y
x2
(dx)2
+
(dy)2
= g
y
1 + y 2 dx
x1
(x1 ,y1 )
x2
L(y, y )dx.
= x1
Die Variationsaufgabe ergibt sich aus (2.70) in der Gestalt x2
x2
L(y, y ) + λF (y ) dx = δ
δ x1
( gy + λ)
1 + y 2 dx = 0,
x1
oder, gleichwertig x2
λ
g
y+
δ
1 + y 2 dx = 0.
x1
Eine Substitution y+
λ =: z
g
(2.71)
f¨ uhrt zur einfacheren Form x2
δ
z
x2
1 + z 2 dx = δ
x1
z )dx = 0. L(z,
x1
d ∂L Die zugeh¨ orende Euler sche Differentialgleichung dx − ∂∂zL = 0 ist von zweiter ∂z Ordnung. Weil L nicht explizit von x abh¨ angt, d¨ urfen wir stattdessen die Differentialgleichung erster Ordnung
z) − L(z,
∂L z = const =: C. ∂z
2.5 Extremalprinzipien und Bewegungsgleichungen
101
benutzen. Sie ergibt z
1 + z
2
1
1
− z(1 + z 2 )− 2 · z 2 = z(1 + z 2 )− 2 = C.
Die Variablen x und z lassen sich trennen: dx = √
C · dz . z2 − C 2
Durch unbestimmte Integration folgt x + D = C Arcosh
z , C
daraus z = C cosh
x+D , C
und mit der Substitutionsbeziehung (2.71) schließlich y(x) = −
x+D λ + C cosh .
g C
Die Form der Kettenlinie wird demnach durch die Cosinus-Hyperbolicus-Funktion bestimmt. Die drei noch offenen Werte f¨ ur λ, C und D kann man erforderlichenfalls numerisch aus den drei Bedingungen y(x1 ) = y1 , y(x2 ) = y2 , x2
x1
ermitteln.
1 + (y (x))2 dx = K
3 ¨ Stabilit¨ at rationaler Ubertragungsfunktionen
3.1 Einfu ¨hrung ¨ Kapitel 3 handelt von der Stabilit¨ at linearer zeitinvarianten Ubertragungsglieder mit einem skalarwertigen Eingang u und einem skalarwertigen Aus¨ gang y. Wenn ein solches SISO-Ubertragungssystem auf jedes u ¨ ber der Zeitachse definierte und dort u ¨berall betragsbeschr¨ankte Eingangssignal mit einem zu jedem Zeitpunkt definierten und betragsbeschr¨ankten Ausgangssi¨ gnal antwortet, so nennt man das Ubertragungsglied stabil . Im Fachjargon ¨ bezeichnet man diese Eigenschaft oft als BIBO-Verhalten, weil das Ubertragungsglied auf jedes beschr¨ ankte Eingangssignal (bounded input, BI) mit einem beschr¨ ankten Ausgangssignal (bounded output, BO) reagiert. Beispiel 3.1 Betrachtet wird ein Proportionalglied mit dem Verst¨arkungsfaktor KP , so gilt y(t) = KP u(t) f¨ ur alle Zeitpunkte t. Aus der Beschr¨ anktheit des Eingangssignals, mathematisch ausdr¨ uckbar durch |u(t)| ≤ M , ergibt sich die Beschr¨ anktheit des Ausgangssignals, genauer |y(t)| ≤ KP M . Folglich sind Proportionalglieder stabil.
Beispiel 3.2 Nun untersuchen wir einen unged¨ ampften harmonischen Os¨ wird definiert durch zillator mit der Eigenfrequenz ω0 . Dieses Ubertragungsglied die Differentialgleichung y¨ + ω02 y = u . Erregt man den (bis z.Zt. t = 0 energielosen) Oszillator f¨ ur t ≥ 0 mit dem Eingangssignal
104
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen u(t) = sin(ω0 t) ,
so erh¨ alt man als Ausgangssignal y(t) = −
1 t cos(ω0 t) + ω0−1 sin(ω0 t) . 2ω0
Obwohl |u(t)| ≤ 1 f¨ ur alle t ≥ 0, verletzt das Ausgangssignal f¨ ur t → ∞ jede vorgegebene Beschr¨ ankung. Folglich geh¨ oren die unged¨ ampften harmonischen Os¨ zillatoren zu den instabilen Ubertragungsgliedern.
Beispiel 3.3 Ein Integrierglied l¨asst sich durch die Gleichungen t
u(τ )dτ
y(t) = y(0) + KI
oder, gleichwertig,
y(t) ˙ = KI u(t)
0
definieren. Es antwortet auf den Einheitssprung u(t) = 1
f¨ ur
t≥0
mit dem unbeschr¨ ankten Ausgangssignal y(t) = y(0) + tKI . ¨ Also ist jedes Integrierglied ein instabiles Ubertragungsglied.
Beispiel 3.4 Gibt man auf ein Differenzierglied, beschreibbar durch die Gleichung y(t) = KD u(t) ˙ , ein beschr¨ anktes Eingangssignal mit Spr¨ ungen, z. B. eine betragsbeschr¨ ankte rechtsseitig stetige Treppenfunktion, so ist das Ausgangssignal an den Sprungstellen nicht ¨ definiert. Mithin sind alle Differenzierglieder instabile Ubertragungsglieder.
Bei den drei letzten Beispielen gelang es, ein (in jedem Falle anderes) beschr¨ anktes Eingangssignal zu finden, mit dem die Instabilit¨at des gerade be¨ trachteten Ubertragungsgliedes nachgewiesen werden konnte. Nat¨ urlich ist es im allgemeinen Fall nicht praktikabel, alle denkbaren beschr¨ankten Ein¨ gangssignale zum Test heranzuziehen und f¨ ur jedes Ubertragungsglied erneut auszuprobieren, ob das Ausgangssignal f¨ ur jeden Zeitpunkt einen wohldefinierten beschr¨ ankten Wert annimmt oder nicht. ¨ Die im Kapitel 3 betrachteten linearen zeitinvarianten SISO-Ubertragungssystheme gen¨ ugen gew¨ ohnlichen Differentialgleichungen der Form d d N y(t) = Z u(t) (3.1) dt dt d d d wobei N dt und Z dt reelle Polynome im Differentiationsoperator dt ¨ symbolisieren. Bei Ubertragungsgliedern dieser Art kann man allein aus der
3.1 Einf¨ uhrung
105
¨ ¨ Sprungantwort (= Ubergangsfunktion) entscheiden, ob das betreffende Ubertragungsglied stabil ist oder nicht. Dies wird im Abschnitt 3.2 in einer formalen Definition festgehalten: ¨ Ein lineares zeitinvariantes SISO-Ubertragungsglied heißt stabil, wenn die ¨ Ubergangsfunktion f¨ ur alle t beschr¨ankt ist und f¨ ur t → ∞ gegen einen endlichen Grenzwert strebt. ¨ Im Abschnitt 3.2 wird gezeigt, dass ein Ubertragungsglied genau dann stabil Z(s) ¨ ist, wenn seine rationale Ubertragungsfunktion G(s) = N (s) keine Polstelle außerhalb der offenen linken Halbebene der komplexen Zahlenebene (OLHE) besitzt. 1 Beispiel 3.5 F¨ur die oben im Zeitbereich durchdachten Beispiele vereinfacht sich ¨ die Stabilit¨ atspr¨ ufung durch den Ubergang in den s-Bereich erheblich: P-Glied: G(s) = KP , keine Polstelle, also auch keine außerhalb OLHE, mithin stabil. Unged¨ ampfter Oszillator: G(s) =
1 , s2 + ω02
Polstellen bei s = ±jω0 außerhalb OLHE, mithin instabil. Integrierglied: G(s) =
KI , s
Polstelle bei s = 0 außerhalb OLHE, mithin instabil. Differenzierglied: G(s) = KD · s , Polstelle bei s = ∞ außerhalb OLHE, mithin instabil.
Durch Laplace-Transformation entsteht aus (3.1) die algebraische Beziehung N (s)Y (s) = Z(s)U (s) + P (s; y(−0), y(−0), ˙ ...; u(−0), u(−0), ˙ ...),
(3.2)
wobei die Anfangswerte y(−0), y(−0), ˙ ...; u(−0), u(0), ˙ ... in gesetzm¨aßiger Weise in die Koeffizienten des Polynoms P (s) eingehen. Wird das Eingangssignal zu einem bestimmten Zeitpunkt abgeschaltet – o.B.d.A. k¨ onnen wir diesen Zeitpunkt zu t = 0 festsetzen –, so gen¨ ugt die 1
In ¨ alteren Lehrb¨ uchern wurde oft zwischen Stabilit¨ at, Instabilit¨ at und Grenz¨ stabilit¨ at unterschieden. Man sagte dann, ein lineares Ubertragungssystem sei grenzstabil“ (im Englischen auch neutrally stable“), wenn wenigstens ein Pol ” ” auf der imagin¨ aren Achse und die u ¨ brigen im Inneren der OLHE liegen. Im Sinne dieser Sprechweise w¨ aren der unged¨ ampfte Oszillator und das Integrierglied ¨ grenzstabile Ubertragungsglieder.
106
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
Laplace-Transformierte des Ausgangssignals wegen U (s) ≡ 0 in (3.2) der Gleichung P s; y(−0), y(−0), ˙ ...; u(−0), u(−0), ˙ ... . Y (s) = N (s) ¨ Bei stabilen Ubertragungsgliedern liegen die Pole von Y (s) offensichtlich im Inneren der OLHE. Folglich konvergiert das zugeh¨orende Zeitsignal y(t) asymptotisch gegen Null. Genauer: In dem (nach Abschalten des Eingangs¨ signals) autonom gewordenen linearen Ubertragungsglied klingt die Ausgangsgr¨ oße y(t) exponentiell auf Null ab, wobei sich die maßgebende Exponentialfunktion aus der Polstelle mit dem gr¨ oßten (aber infolge der vorausgesetzten Stabilit¨ at garantiert negativen) Realteil ergibt. 2 Unter der Voraussetzung, dass das Z¨ ahlerpolynom Z(s) und das Nennerpolynom N (s) keine gemeinsamen Nullstellen besitzen, also zueinander ¨ teilerfremde Polynome sind, fallen die Polstellen der Ubertragungsfunktion G(s) mit den Nullstellen des Nennerpolynoms N (s) zusammen. Die Stabi¨ lit¨atsanalyse des Ubertragungsgliedes kann dann auf die Nullstellenanalyse von N (s) reduziert werden. Weil die Teilerfremdheit von Z und N nicht stillschweigend vorausgesetzt werden kann, wird dieser Problemkreis in den Abschnitten 3.3.1 bis 3.3.3 in der gebotenen K¨ urze angesprochen. Abschnitt 3.3.1 beschreibt, wie man den gr¨ oßten gemeinsamen Teiler zweier gegebener Polynome, hier also Z und N , mit Hilfe des Euklidischen Algorithmus bestimmen kann. Die gegebenen Polynome Z und N sind genau dann teilerfremd, wenn sich zwei weitere Polynome P1 und P2 so finden lassen, dass die B´ ezoutsche Identit¨ at Z(s)P1 (s) + N (s)P2 (s) = 1
f¨ ur alle s ∈ C
erf¨ ullt wird. Die Frage nach gemeinsamen Nullstellen zweier gegebener Polynome N und Z wird im Abschnitt 3.3.2 alternativ mit Hilfe der sogen. Resultan2
Dieser Sachverhalt scheint manche modernen Autoren zu veranlassen, von asymptotischer Stabilit¨ at“ anstelle schlicht von Stabilit¨ at“ eines linearen ”¨ ” Ubertragungsgliedes zu sprechen. Daraus ergeben sich m.E. aber leicht Konfusionen zur Begriffswelt der Ljapunovschen Theorie der Stabilit¨ at von Trajektorien in nichtlinearen Systemen. Dort wird zwischen Stabilit¨ at einer Trajektorie, ihrer asymptotischen Stabilit¨ at, ihrer exponentiellen Stabilit¨ at, ihrer globalen asymptotischen Stabilit¨ at etc. unterschieden, und es w¨ are abwegig, die Stabilit¨ at eines nichtlinearen Systems schlechthin definieren zu wollen. ¨ Beim (autonom betriebenen) stabilen linearen Ubertragungsglied ist die Tra” jektorie“ y(t) ≡ 0 global exponentiell (und damit auch asymptotisch) stabil im Sinne der Ljapunovschen Stabilit¨ atsterminologie. Im Rahmen der linearen Systemtheorie halte ich es f¨ ur u ussig, bei der Beschreibung linearer zeit¨ berfl¨ ¨ invarianter Ubertragungsglieder dem Terminus Stabilit¨ at“ noch ein Attribut ” hinzuzuf¨ ugen.
3.1 Einf¨ uhrung
107
te R(N, Z) beantwortet. Das ist die Determinante einer quadratischen Matrix, deren Elemente sich in sehr u ¨ bersichtlicher Weise aus den Koeffizienten der beiden Polynome ablesen lassen. Der Rangabfall dieser Matrix ist gleich der Anzahl der gemeinsamen Nullstellen der Polynome N und Z. Schließlich wird im Abschnitt 3.3.3 noch auf einen (auch f¨ ur den sp¨ateren Beweis des Routhschen Stabilit¨ atskriteriums wichtigen) Spezialfall des Euklid ischen Algorithmus eingegangen. Es wird gezeigt, wie sich durch Konstruktion einer Sturmschen Kette die Anzahl der reellen Nullstellen eines Polynoms, die innerhalb eines Intervalls (σ1 , σ2 ) ⊂ R liegen, bestimmen l¨asst. Nach den vorbereitenden Abschnitten 3.3.1 bis 3.3.3 geht es in dem zentralen Abschnitt 3.4 um die Nullstellenanalyse eines Polynoms. Wir folgen dabei den Gedankeng¨ angen von E.J. Routh und bringen einen vollst¨andigen Beweis des von ihm 1877 angegebenen Verfahrens. Das praktische Vorgehen beim Routhschen Algorithmus ist bewundernsw¨ urdig einfach und wurde bisher durch Ver¨ offentlichungen anderer Autoren nicht u ¨ bertroffen: Zu einem gegebenen reellen Polynom n-ten Grades N (s) = an sn + an−1 sn−1 + ... + a1 s + a0 berechne man sukzessive zeilenweise das folgende Tableau: an an−2 an−4 an−6 · · · n an−1 an−3 an−5 · · · A = − aan−1 ; an−1 bn−2 bn−4 bn−6 · · · B = − bn−2 ;
bn−k := an−k + A · an−(k+1) cn−k := an−k + B · bn−(k+1)
cn−3 cn−5 · · · dn−4 dn−6 · · ·
dn−k := bn−k + C · cn−(k+1) en−k := cn−k + D · dn−(k+1)
en−5 · · · .. . a0
C = − bcn−2 ; n−3 cn−3 D = − dn−4 ; n−4 E = − den−5
Die ersten beiden Zeilen lassen sich unmittelbar aus den Koeffizienten des gegebenen Polynoms ablesen. Von der dritten Zeile an werden die TableauEintr¨ age nach der rechts notierten Rechenregel bestimmt. Wenn sich die Rechnung ohne Abbruch bis zum Schluß ausf¨ uhren l¨asst, so gilt: Haben alle Elemente in der ersten Spalte das gleiche Vorzeichen, dann liegen alle n Nullstellen von N (s) in der OLHE. Treten in der ersten Spalte k Vorzeichenwechsel auf, so liegen k der n Nullstellen in der offenen rechten Halbebene (ORHE). Auch die irregul¨ aren F¨ alle, bei denen die Rechnung im ersten Anlauf an einer bestimmten Zeile abbricht, lassen sich durch mathematisch streng begr¨ undete, aber ganz einfach zu handhabende Modifikationen, die im Abschnitt 3.4 diskutiert werden, nach dem Routhschen Konzept behandeln. Im Abschnitt 3.5.2 werden Folgerungen aus den Routhschen Stabilit¨atsuntersuchungen diskutiert. Zun¨ achst wird die 1895 von Adolph Hurwitz in Unkenntnis der Routhschen Ergebnisse ver¨ offentlichte Stabilit¨atsaussage ein-
108
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
geordnet: Sie entspricht inhaltlich einem Teilresultat von Routh, n¨amlich dem Fall, dass das Routhsche Rechenschema problemlos zu Ende gef¨ uhrt werden kann und in der ersten Spalte kein Vorzeichenwechsel eintritt. Der Routhsche Algorithmus ist aber auch f¨ ur diesen einfachsten Fall numerisch einfacher zu handhaben als das von Hurwitz empfohlene Verfahren der sukzessiven Berechnung von Hauptabschnittsdeterminanten. Die zu Beginn des 20. Jahrhunderts ver¨offentlichten Erkenntnisse von Li´enard-Chipart und die Formel von Orlando, die die Routhschen Ergebnisse in n¨ utzlicher Weise komplettieren, werden auch im Abschnitt 3.5.2 behandelt. Die in den 1930er und 1940er Jahren von dem Russen A. Michailov und den Deutschen A. Leonhard und L. Cremer unabh¨angig voneinander ver¨ offentlichten Ergebnisse, die oft als Ortskurven- und als L¨ uckenkriterien f¨ ur charakteristische Polynome zitiert werden, kann man als naheliegende geometrische Deutungen einer Nebenbemerkung, die Routh im Zuge seines Beweises gemacht hatte, auffassen, Einzelheiten siehe Abschnitt 3.5.3 . Einen wesentlichen Fortschritt aus der Sicht des Regelungstechnikers, dessen Hauptsorge der Beherrschung von Regelstrecken mit ihren Unbestimmtheiten gilt, brachte das 1978 von dem Russen V.L. Charitonov ver¨offentlichte Stabilit¨ atskriterium f¨ ur Intervallpolynome. Im Abschnitt 3.6.1 wird ein einfacher Beweis dieses Kriteriums angegeben, der mit dem Startgedanken ¨ der Routhschen Uberlegungen auskommt. Das Kapitel schließt mit dem umfangreichen Abschnitt 3.6.2, der der Stabilit¨ at von Polynomen mit parameterabh¨ angigen Koeffizienten gewidmet ist. In den einfachsten Fall, bei dem die Koeffizienten affine Funktionen ein und desselben skalaren Parameters sind, wurde die Theorie der Wurzelortskurven (WOK) eingegliedert.
3.2 Definition der Stabilit¨ at fu ¨ r lineare zeitinvariante ¨ SISO-Ubertragungsglieder mit rationaler ¨ Ubertragungsfunktion ¨ Definition 3.1. Ein lineares zeitinvariantes SISO-Ubertragungsglied heißt ¨ stabil, wenn die Ubergangsfunktion h(t) f¨ ur alle t beschr¨ankt ist und h(t) −−−−→ M t−→∞
¨ gilt, wobei M ein endlicher Grenzwert ist. Sonst heißt das Ubertragungsglied instabil. Bekanntlich bezeichnet man die Antwort auf den Einheitssprung 1(t) als ¨ Ubergangsfunktion h(t), d. h. −1
h(t) = L
4 5 G(s) · U (s) |U (s)= 1s = L−1
G(s) s
6 .
¨ Definition der Stabilit¨ at rationaler Ubertragungsfunktionen
109
3
M
2
h(t)
2.5
1.5
1
0.5
0
0
5
10
15
t
20
25
¨ ¨ Ubergangsfunktion h(t) f¨ ur ein Ubertragungsglied 2 ¨ Ubertragungsfunktion G(s) = s2 +0.5s+1
Bild 3.1.
mit
der
¨ Bild 3.1 zeigt die Ubergangsfunktion eines P T2 −Gliedes. ¨ G(s) sei eine reell-rationale Ubertragungsfunktion G(s) =
Z(s) b m sm + · · · + b 1 s + b 0 = N (s) a n s n + · · · + a 1 s + a0
;
m ≤ n;
a0 , an = 0 .
¨ Dann ergibt sich die Ubergangsfunktion aus −1
h(t) = L
7 6 b m sm + · · · + b 1 s + b 0 b m sm + · · · + b 1 s + b 0 1 −1 =L . · a n s n + · · · + a 1 s + a0 s an s(sn + · · · + aan1 s + aan0 )
Die Zerlegung des Nennerpolynoms in Produktterme, 7 1 m an (bm s + · · · + b1 s + b0 ) −1 8 8 h(t) = L , s (s + sν ) (s2 + 2dµ ωµ s + ωµ2 ) ν
µ
f¨ uhrt zum Beispiel im Falle einfacher Pole auf die Summendarstellung b 7 0 Aν Aµ + Bµ s a0 −1 h(t) = L + . + s s + sν s2 + 2dµ ωµ s + ωµ2 ν µ Daraus folgt
110
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
h(t) =
b0 1(t) + Aν e−sν t + Cµ e−dµ ωµ t sin 1 − d2µ ωµ t + βµ . a0 ν µ
Falls alle sν > 0 und alle dµ ωµ > 0, so gilt ersichtlich h(t) −−−−→ t−→∞
b0 =: M . a0
Damit wurde ein Beweis skizziert f¨ ur die folgende, aus dem Grundstudium bekannte Aussage: ¨ Satz 3.1 Ein lineares zeitinvariantes SISO-Ubertragungsglied mit rationaler Z(s) ¨ Ubertragungsfunktion G(s) = N (s) ist genau dann stabil, wenn alle Pole der ¨ Ubertragungsfunktion in der offenen linken Halbebene der komplexen Zahlenebene C liegen. ¨ ¨ Rationale Ubertragungsfunktionen mit m > n, wie z. B. das PD-Ubertragungsglied, sind instabil, weil mindestens ein Pol bei s = ∞, also in der abgeschlossenen rechten Halbebene liegt. ¨ Die Stabilit¨ atsanalyse rationaler Ubertragungsglieder wird mit Satz 3.1 auf die Berechnung der Nullstellen des Nennerpolynoms N (s) zur¨ uckgef¨ uhrt. Dabei wurde stillschweigend vorausgesetzt, dass das Z¨ahler- und das Nennerpolynom zueinander teilerfremd sind. Deshalb muß vor Anwendung des Satzes 3.1 gekl¨ art werden, ob gegebene Z¨ ahler- und Nennerpolynome die Voraussetzung der Teilerfremdheit erf¨ ullen.
3.3 Ermittlung des gr¨ oßten gemeinsamen Teilers zweier Polynome 3.3.1 Euklidischer Algorithmus und B´ ezoutsche Identit¨ at Gegeben seien zwei Polynome P0 und P1 . Unter ihrem gr¨ oßten gemeinsamen Teiler, abgek¨ urzt ggT(P0 , P1 ), wird das normierte Polynom3 h¨ ochsten Grades verstanden, das sowohl P0 als auch P1 teilt. P0 und P1 heißen teilerfremd, wenn ggT(P0 , P1 ) = 1 ist. Der ggT(P0 , P1 ) l¨ asst sich mit Hilfe des Euklid ischen Algorithmus berechnen. Wir wollen den ggT(P0 , P1 ) unter der Annahme grad P0 ≥ grad P1 > 0 ermitteln. Euklidischer Algorithmus:4 Zu P0 und P1 findet man eindeutig zwei weitere Polynome Q1 (= ganzer Teil) und R1 (= Rest) so, dass 3
4
Ein Polynom wird normiert genannt, wenn dessen Koeffizient zur h¨ ochsten s−Potenz gleich Eins ist. Dieser Algorithmus war schon den Gelehrten der Antike bekannt. Seine klassische Fassung – zu zwei gegebenen Zahlen, die nicht prim gegeneinander sind, ihr ” gr¨ oßtes gemeinsames Maß zu finden“ – findet man im VII. Buch der Elemente“ ” des hellenistischen Mathematikers Euklid von Alexandria (365? bis 300? v.Chr.).
3.3 Ermittlung des gr¨ oßten gemeinsamen Teilers zweier Polynome
P0 = Q1 · P1 + R1
111
mit grad R1 < grad P1 .
Falls grad R1 > 0, l¨ asst sich die Division mit Rest in einer Kette aufeinander folgender Gleichungen fortsetzen: P1 = Q2 · R1 + R2 , R1 = Q3 · R2 + R3 , .. . R = Q+2 · R+1 + 0 . Das zu R+1 geh¨ orende normierte Polynom ist der gr¨oßte gemeinsame Teiler ggT(P0 , P1 ).
Beispiel 3.6
Gegeben seien die beiden Polynome P0 = s3 + s2 + 4s + 30,
P1 = s2 + 5s + 6.
Der Euklid ische Algorithmus liefert die Gleichungen der Polynomkette P0 = s3 + s2 + 4s + 30 = (s − 4) · (s2 + 5s + 6) + 18s + 54 = Q1 · P1 + R1 , P1 = s2 + 5s + 6 =
1 1 s+ 18 9
(18s + 54) + 0 = Q2 · R1 + 0 ,
und als Ergebnis ggT(P0 , P1 ) =
R1 = s + 3. 18
Setzt man die Gleichungen der Kette in der umgekehrten Reihenfolge ihres Entstehens ineinander ein, so wird man auf die folgende Erkenntnis gef¨ uhrt. Satz 3.2 Zu den gegebenen zwei Polynomen P0 und P1 existieren teilerfremde Polynome F und H mit der Eigenschaft F · P0 + H · P1 = ggT(P0 , P1 ) . Sind P0 und P1 teilerfremd, so existieren folglich teilerfremde Polynome F und H, die die B´ ezoutsche Identit¨ at F · P0 + H · P1 = 1
(3.3)
erf¨ ullen.5 5
´ Bezeichnung zu Ehren des franz¨ osischen Mathematikers Etienne B´ezout (17301783). Weil die Beziehung (3.3) von fundamentaler Bedeutung f¨ ur den Regler-
112
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
3.3.2 Anzahl der gemeinsamen Nullstellen zweier Polynome Gegeben seien die beiden reellen Polynome Z(s) = bm sm + · · · + b1 s + b0
und
N (s) = an sn + · · · + a1 s + a0 ,
wobei m ≤ n, bm = 0, an = 0, a0 = 0. Sie k¨ onnen im regelungstechnischen ¨ Kontext als Z¨ ahler- und Nennerpolynom einer rationalen Ubertragungsfunktion G(s) aufgefasst werden. Der Grad des gr¨ oßten gemeinsamen Teilers ggT(N, Z) gibt die Anzahl der gemeinsamen Nullstellen des Polynoms Z(s) und des Polynoms N (s) an. Interessiert man sich nicht f¨ ur die Lage der gemeinsamen Nullstellen, sondern fragt man lediglich, wieviele gemeinsame Nullstellen vorhanden sind, so kann man sich den mit der Abarbeitung des Euklid ischen Algorithmus verbundenen Aufwand sparen. Ist s = s0 eine gemeinsame Nullstelle der gegebenen Polynome Z und N , so wird jedes Gleichungssystem der Gestalt sν N (s) = 0 f¨ ur ν = 0, 1, 2, ... µ ur µ = 0, 1, 2, ... s Z(s) = 0 f¨ erf¨ ullt f¨ ur s = s0 . Besonders aufschlußreich ist jenes Gleichungssystem, das entsteht, wenn man der Reihe nach ν = 0, 1, 2,...,m − 1 und µ = 0, 1, 2,...,n−1 setzt. Dieses System aus m + n Gleichungen lautet in ausgeschriebener Form entwurf geworden ist, darf nicht verschwiegen werden, dass an der Berechtigung der Namensgebung Zweifel bestehen. Manche renommierte Fachkollegen, u.a. V. Kuvcera [Kuˇc79], sprechen von Diophantischen Gleichungen“ und beziehen sich ” damit auf Diophantos, der um 250 n.Chr. in Alexandria lebte. Historiker widersprechen [Smi58], denn Diophantos habe Gleichungen mit mehreren L¨ osungen niemals betrachtet. Schließlich verweist einer der großen europ¨ aischen Gelehrten des 20. Jahrhunderts, B.L. van der Waerden (1903–1996), der sich in seinem Sp¨ atwerk auch mit der Wissenschaftseschichte in anderen Kulturen besch¨ aftigte [Wae84], auf einen Hindu namens Aryabhatta, geb. 476 n.Chr. Folgerichtig regte M. Vidyasagar an [Vid85], doch besser von Aryabhatta’s Identit¨ at“ zu sprechen. ”
3.3 Ermittlung des gr¨ oßten gemeinsamen Teilers zweier Polynome (n+1)
$ ⎧⎛ ⎪ ⎪ a ⎪ ⎜ n ⎪ ⎪ ⎜ ⎪ ⎪ ⎨⎜ 0 ⎜ m ⎜ .. ⎜ . ⎪ ⎪ ⎜ ⎪ ⎪ ⎜ 0 ⎪ ⎪ ⎪ ⎩⎜ ⎜ ⎜ ⎧⎜ 0 ⎜ ⎪ ⎪ ⎜ bm ⎪ ⎪ ⎜ ⎪ ⎪ ⎜ ⎪ ⎨⎜ 0 ⎜ n ⎜ .. ⎪ ⎜ . ⎪ ⎪ ⎜ ⎪ ⎪ ⎝ 0 ⎪ ⎪ ⎩ 0
%"
an−1 an−2 . . . an an−1 . . . .. .. . . ... 0
0
...
0
0
...
#$ .. . .. . .. . .. . .. .
.. . .. . .. . .. . .. .
bm−1 bm−2 . . . b0 0 bm bm−1 . . . .. .. . . ... 0
0
0
0
"
b1 .. . . . . . .. . . . . ..
#$
(m−1)
%"
. . . a0
0
... 0
. . . a1 . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . ..
a0 .. . .. . .. . .. . .. . .. .
... 0 . . . . ..
b0 .. . .. . . . . bm bm−1 .. . . . . 0 bm %"
(n−1)
. . . a0 . . . a1 ... 0 ... 0 . . . . .. . . . b0 . . . b1 #$
113
# ⎞ ⎛
⎞ ⎛ ⎞ n+m−1 0 s 0 ⎟ ⎜sn+m−2 ⎟ ⎜0⎟ ⎟ ⎜ ⎟ ⎜ ⎟ 0 ⎟ ⎜sn+m−3 ⎟ ⎜0⎟ ⎜ ⎟ ⎟ ⎜ ⎟ .. ⎟ ⎜ ⎟ ⎜ .. ⎟ .. . ⎟ ⎜ ⎟ ⎜.⎟ . ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎜ ⎟ ⎟ 0 ⎟ ⎜ m+1 ⎟ ⎟ ⎜0⎟ ⎟ ⎜ s ⎟ ⎜ ⎟ m ⎜ ⎟ ⎜0⎟ a0 ⎟ ⎟· ⎜ s ⎟=⎜ ⎟ ⎟ ⎜ m−1 ⎟ ⎜0⎟ 0⎟ ⎜ s ⎟ ⎜ ⎟ ⎟ ⎜ m−2 ⎟ ⎜0⎟ ⎟ ⎜ s ⎟ ⎜ ⎟ 0⎟ ⎜ ⎟ ⎜.⎟ ⎜ ⎟ ⎟ ⎜.⎟ .. .. ⎟ ⎜ ⎟ ⎜.⎟ . . ⎟ ⎜ ⎟ ⎜ ⎟ ⎟ ⎜ s2 ⎟ ⎜0⎟ ⎝ ⎠ ⎠ ⎝ ⎠ 0 0 s 0 1 b0 %
(m+1)
Die Determinante der Koeffizientenmatrix S bezeichnet man als die Resultante der Polynome N (s) und Z(s), det S =: R (N, Z), die Matrix S als Resultantenmatrix, vgl. [Ros70],p.16. Satz 3.3 Die Resultante R (N, Z) verschwindet genau dann, wenn die Polynome N (s) und Z(s) mindestens eine gemeinsame Nullstelle haben. Beweis: 1. Hinreichender Teil: Wenn N (s) und Z(s) eine gemeinsame Nullstelle bei s = s0 besitzen, dann ergibt das Produkt aus der Koeffizientenmatrix S und dem Spaltenvektor (sn+m−1 , sn+m−2 , . . . , s20 , s0 , 1)T den Null-Spaltenvektor. 0 0 Folglich muß Rg S < n + m gelten, also det S = 0. 2. Notwendiger Teil: Wenn die Resultante R (N, Z) = 0 ist, dann m¨ ussen die Zeilenvektoren der Koeffizientenmatrix linear abh¨angig sein, d. h. die Polynome sm−1 N, sm−2 N, . . . , sN, N, sn−1 Z, sn−2 Z, . . . , sZ, Z. sind linear abh¨ angig. Folglich existiert eine Linearkombination: (α0 sm−1+α1 sm−2+...+αm−1)N (s)+(β0 sn−1+β1 sn−2+...+βn−1)Z(s) = 0 " #$ % " #$ % (li)
(re)
Das links stehende Polynom (li) ist daher durch alle m Linearfaktoren des Polynoms Z(s) teilbar. Da die runde Klammer vor N (s) nur m − 1 dieser
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
114
Linearfaktoren enthalten kann, ist wenigstens ein Linearfaktor von Z(s) in N (s) enthalten. Mithin haben N (s) und Z(s) mindestens eine gemeinsame Nullstelle. qed. Als unmittelbare Folgerung des Satzes 3.3 gewinnt man eine Existenzaussage u ¨ ber die mehrfachen Nullstellen eines gegebenen Polynoms P (s). d Satz 3.4 Bezeichnet P die Ableitung ds P (s) des gegebenen Polynoms P (s), so verschwindet die Resultante R (P, P ) genau dann, wenn P (s) eine mehrfache Nullstelle besitzt.
Der Wert der Resultante R(N, Z) kann als explizite Funktion der Nullstellen der Polynome N (s) und Z(s) bestimmt werden. Satz 3.5 Die Resultante der Polynome n <
N (s) = an sn + an−1 sn−1 + . . . + a1 s + a0 = an
(s − sν,N ),
ν=1 m <
Z(s) = bm sm + bm−1 sm−1 + . . . + b1 s + b0 = bm
(s − sµ,Z )
µ=1
ergibt sich zu m
n
R(N, Z) =(an ) (bm )
m n < <
(sν,N − sµ,Z )
ν=1 µ=1
=(an )m
n <
Z(sν,N ) = (−1)n (bm )n
ν=1
m <
N (sµ,Z ).
µ=1
Beweis: Die Determinante det S = R(N, Z) = (an )m (b0 )n + . . . ist per definitionem ein Polynom in den Koeffizienten aν (ν = 0, 1, . . . , n) und bµ (µ = 0, 1, . . . , m). Es ist homogen vom Grade m in den aν und homogen vom Grade n in den bµ . Nach Ausklammern eines Faktors (an )m (bm )n bleibt ein Polynom P in den Quotienten aanν (ν = 0, 1, . . . , n − 1) und bµ bm
(µ = 0, 1, . . . , m − 1): R(N, Z) = (an )m (bm )n · P (
Wegen
a0 an−1 b0 bm−1 ,..., ; ,..., ). an an b m bm
3.3 Ermittlung des gr¨ oßten gemeinsamen Teilers zweier Polynome
sn + sm +
115
n < an−1 n−1 a1 a0 s + ...+ s+ = (s − sν,N ), an an an ν=1 m < bm−1 m−1 b1 b0 s + ... + s+ = (s − sµ,Z ) bm bm bm µ=1 b
µ lassen sich die Quotienten aanν und bm als Polynome in den s1,N , . . . , sn,N bzw. in den s1,Z , . . . , sm,Z ausdr¨ ucken. Damit stellt sich P als Polynom in den Nullstellen s1,N , . . . , sn,N ; s1,Z , . . . , sm,Z dar. Gilt sν,N = sµ,Z f¨ ur irgendein Indexpaar ν, µ, so nimmt das Polynom P den Wert Null an. Folglich muß das Polynom P durch m n < < (sν,N − sµ,Z )
ν=1 µ=1
teilbar sein, mithin die Resultante R(N, Z) durch den Ausdruck A =(an )m (bm )n
m n < <
(sν,N − sµ,Z )
ν=1 µ=1
=(an )m
n <
Z(sν,N ) = (−1)n (bm )n
ν=1
m <
N (sµ,Z ).
µ=1
Der Ausdruck A ist homogen vom Grade m in den aν und homogen vom Grade n in den bµ , wie aus der Darstellung von A als Produkt der N (sµ,Z ) bzw. als Produkt der Z(sν,N ) erkennbar ist. Deshalb k¨onnen sich der Ausdruck A und die Resultante R(N, Z) nur um einen konstanten Faktor unterscheiden. Aus dem Vergleich des Terms (an )m (b0 )n als eines Summanden der Determinante sieht man wegen (an )m
n < ν=1
Z(sν,N ) =(an )m
n <
m−1 (bm sm ν,N + bm−1 sν,N + . . . + b1 sν,N + b0 )
ν=1
=(an )m (b0 )n + sν,N [. . .], dass dieser Faktor gleich Eins ist.
qed.
Abschließend wird noch der allgemeine Zusammenhang zwischen der Anzahl der gemeinsamen Nullstellen zweier Polynome und dem Rang ihrer Resultantenmatrix formuliert. Satz 3.6 Es gilt Rg S = n+m−d genau dann, wenn die Polynome N (s) und Z(s) einen gemeinsamen Teiler vom Grad d haben, also genau d gemeinsame Nullstellen besitzen.
116
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
3.3.3 Anzahl und Lage der reellen Nullstellen eines Polynoms Gegeben sei ein Polynom n-ten Grades P0 (s) mit n einfachen Nullstellen. Gesucht wird die Anzahl der reellen Nullstellen im Intervall (σ1 , σ2 ), d. h. die Anzahl der reellen Argumentwerte σ mit σ1 < σ < σ2 und P0 (σ) = 0. Diese Anzahl l¨ asst sich nach einem Verfahren, das 1829 von J.Ch.F. Sturm (1803-1855) ver¨ offentlicht wurde, ermitteln. Konstruktion einer Sturmschen Kette“ ” Mittels des Euklid ischen Algorithmus entsteht eine Kette reeller Polynome P0 , P1 , P2 , . . . , Pn mit fallendem Grad, wobei P0 vorgegeben ist und P1 = P0 durch Ableitung entsteht. Die weiteren Polynome P2 , . . . , Pn entstehen als Divisionsreste“ aus den Gleichungen der nachstehenden Polynomkette: ” P0 = Q1 · P1 − P2 , P1 = Q2 · P2 − P3 , .. . Pµ−1 = Qµ · Pµ − Pµ+1 , Pµ = Qµ+1 · Pµ+1 − Pµ+2 , Pµ+1 = Qµ+2 · Pµ+2 − Pµ+3 , .. . Pn = const = 0 . Der Grad der Polynome Pµ erniedrigt sich mit wachsendem Index stets um Eins. Als letztes Polynom erh¨ alt man Pn (s) = const. Definition 3.2. V ( σ ) bezeichne die Anzahl der Vorzeichenwechsel in der Wertefolge P0 ( σ ), P1 ( σ ), . . . , Pµ ( σ ), . . . , Pn ( σ ) f¨ ur einen festen reellen Argumentwert σ . An keiner Stelle σ kann zugleich P0 ( σ ) = 0 und P1 ( σ ) = 0 sein, weil P0 voraussetzungsgem¨ aß nur einfache Nullstellen besitzt. Gilt f¨ ur ein Polynom Pµ ( σ ) = 0, wobei 0 < µ < n, so wird Pµ−1 ( σ )·Pµ+1 ( σ ) < 0, vgl. µ-te Zeile der Polynomkette. Betrachtet man die Wertefolgen P0 (σ), P1 (σ), ..., Pn (σ) an drei benachbarten Argumentwerten σ = σ − h, σ = σ , σ = σ + h, wobei sowohl P0 ( σ ) = 0 und Pµ ( σ ) = 0 gelten soll, dann kann in der Polynomkette die folgende Vorzeichenverteilung auftreten: σ σ −h σ σ +h
P0 – 0 +
P1 + + +
. . . Pµ−1 ... + ... + ... +
Pµ Pµ+1 + – 0 – – –
... ... ... ...
Pn V (σ) + 3 + + 2
Hier wurde angenommen, dass die Funktion P0 (σ) in der Umgebung der Nullstelle σ w¨ achst. Eine Diskussion auch der weiteren m¨oglichen Vorzeichenverteilungen f¨ uhrt zu der
3.3 Ermittlung des gr¨ oßten gemeinsamen Teilers zweier Polynome
117
Erkenntnis: Nur bei Nulldurchg¨ angen des gegebenen Polynoms P0 (σ) kann sich V (σ) a ¨ndern, und zwar handelt es sich stets um eine Verminderung von V (σ) um 1. Nulldurchg¨ ange der Zwischenpolynome Pµ (σ) f¨ ur 1 ≤ µ ≤ n − 1 beeinflussen V (σ) nicht. Daraus schließen wir auf den Satz 3.7 (Sturmscher Satz) P0 sei ein reelles Polynom mit nur einfachen Nullstellen. Die Anzahl der reellen Nullstellen im Intervall (σ1 , σ2 ) ist gleich der Differenz V (σ1 ) − V (σ2 ). (Ohne wesentliche Beeintr¨ achtigung der Allgemeinheit wird im Satz 3.7 stillschweigend P0 (σ1 ) = 0 und P0 (σ2 ) = 0 angenommen.) Beispiel 3.7 Aus den Polynomen P0 = s3 + s − 2 und P1 = P0 (s) = 3s2 + 1 erh¨alt man die Sturmsche Polynomkette
P0 = s3 + s − 2 =
P1 = 3s2 + 1 = 2 P2 = − s + 2 = 3
1 2 s · 3s2 + 1 − − s + 2 3 3
27 9 − s− 2 2
1 1 s− 42 14
= Q1 · P1 − P2 ,
2 · − s + 2 − (−28) = Q2 · P2 − P3 , 3
(−28) − 0 = Q3 · P3 − P4 ,
P3 = −28 . Die Auswertung der Polynomkette f¨ ur beispielhaft ausgew¨ ahlte reelle Argumentwerte wurde in einer Tabelle notiert. P0 (σ) = σ 3 + σ − 2 P1 (σ) = 3σ 2 + 1 P2 (σ) = − 23 σ + 2 P3 (σ) = −28 V (σ)
σ → −∞ σ = 0 σ = 0.5 σ = 2 σ → ∞ – – – + + + + + + + + + + + – – – – – – 2 2 2 1 1
Der Tabelle entnimmt man als Ergebnis: Das Beispielpolynom P0 hat nur eine reelle Nullstelle. Sie liegt zwischen 0.5 und 2.
Erweiterung des Sturmschen Verfahrens auf Polynome mit mehrfachen Nullstellen: Auch Polynome P0 mit mehrfachen Nullstellen lassen sich mit dem Sturmschen Verfahren untersuchen. Bricht die Sturmsche Kette vorzeitig ab, weil sich ein Zwischenpolynom Pi = const = 0 ergibt, dann teilt das zuvor ermittelte Polynom Pi−1 jedes der Vorg¨angerpolynome Pi−2 , . . . , P1 , P0 . Das Polynom Pi−1 ist vom Grad n − i + 1. Die Vorg¨ angerpolynome lassen sich in der Form =ν · Pi−1 Pν = P
f¨ ur
ν = 0, 1, . . . , i − 1
118
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
=ν = i − 1 − ν. faktorisieren. Dabei gilt grad P Weil Pi−1 sowohl P0 als auch P1 = P0 teilt, sind die Nullstellen von Pi−1 =0 hat nur einfache gerade die mehrfachen Nullstellen von P0 . Das Polynom P Nullstellen. Die Anzahl der Vorzeichenwechsel in der (mit der abgebrochenen Sturmschen Polynom-Kette bekannten) Wertefolge P0 ( σ ), P1 ( σ ), . . . , Pi−1 ( σ ) stimmt f¨ ur jeden festen reellen Argumentwert σ u ¨ berein mit der Anzahl der Vorzeichenwechsel in der (nicht bekannten) Wertefolge P0 ( σ ), P1 ( σ ), . . . , Pi−1 ( σ ), weil die Multiplikation mit einem konstanten Faktor Pi−1 ( σ ) die Anzahl der Vorzeichenwechsel nicht beeinflußt. Folglich kann man durch Auswertung der abgebrochenen Sturmschen Kette an den reellen Argumentwerten σ1 und σ2 auf die Anzahl der einfachen reellen Nullstellen von P0 (s) im Intervall (σ1 , σ2 ) schließen. Die reellen Nullstellen von Pi−1 k¨ onnen nun mit einer zweiten Sturmschen Kette untersucht werden, die mit den Startpolynomen Pi−1 und Pi−1 beginnt. Sollte Pi−1 ebenfalls mehrfache Nullstellen haben, so zeigt sich das erneut im vorzeitigen Abbruch der zweiten Sturmschen Kette. F¨ ur den dann vor handenen gemeinsamen Teiler von Pi−1 und Pi−1 kann eine dritte Sturmsche Kette entwickelt werden, usw.
3.4 Stabilit¨ atsuntersuchungen nach E. J. Routh James Clerk Maxwell (1831-1879) betrachtete in seiner ber¨ uhmten Arbeit On Governors“, erschienen im Phil. Magazine 35 (1868), p. 385, die Kombi” nation engine plus governor“, also das geregelte System, als Einheit. Max” well kannte bereits seinerzeit die Stabilit¨ atsproblematik bei r¨ uckgef¨ uhrten Systemen und deren L¨ osung f¨ ur lineare r¨ uckgef¨ uhrte Systeme mit einem charakteristischen Polynom bis zum 3. Grade. Er regte ein Preisausschreiben f¨ ur die allgemeine L¨osung an. 1875 wird die Aufgabenstellung in London ver¨ offentlicht, mit einem Hinweis auf das Lagrange-Dirichlet-Theorem. Es besagt, dass sich die stabilen Gleichgewichtslagen bei mechanischen Systemen als (lokale) Minima der potentiellen Energie auszeichnen, und es sollte sp¨ ater zum Ausgangspunkt der Ljapunov schen Stabilit¨ atstheorie werden. 1877 gewinnt Edward John Routh (18311907), ein fr¨ uherer Cambridger Mitstudent von Maxwell, das Preisausschreiben mit seinem Aufsatz A treatise on the stability of a given state of moti” on“. Diesen Aufsatz hat Routh sp¨ ater u ¨ berarbeitet und in seinem MechanikLehrbuch The dynamics of a system of rigid bodies“, das viele Auflagen er” ¨ lebte, ver¨ offentlicht. Eine deutsche Ubersetzung erschien unter dem Titel Die ” Dynamik der Systeme starrer K¨ orper“ [Rou98]. Die Stabilit¨atsbetrachtung, der wir nun folgen wollen, findet sich dort im Band II, auf den Seiten 222-234. E. J. Routh ignorierte den Hinweis auf das Lagrange-Dirichlet-Theorem und l¨ oste das gestellte Problem mit Werkzeugen aus der Theorie der Polyno-
3.4 Stabilit¨ atsuntersuchungen nach E. J. Routh
119
me in einer komplexen Variablen. Diese Werkzeuge waren in der ersten H¨alfte des 19. Jh. von Gauß, Cauchy, Sturm, Hermite u. a. entwickelt worden. 3.4.1 Herleitung des Routhschen Algorithmus Routh besch¨ aftigte sich mit der Frage: Wie groß ist die Anzahl k der Nullstellen mit positivem Realteil f¨ ur ein reelles Polynom n-ten Grades? Es gelang ihm, die Antwort aus den Koeffizienten des Polynoms zu ermitteln, ohne dessen Nullstellen numerisch zu bestimmen. Ein gegebenes Polynom n-ten Grades mit reellen Koeffizienten, n
f (s) = an s +an−1 s
n−1
+...+a1s+a0 = an
n <
arc(s−s ) n
(s−si ) = |f (s)| e
j
i
i=1
,
i=1
wobei o.B.d.A. an > 0, a0 = 0 angenommen wird, m¨oge k Nullstellen in der offenen rechten Halbebene und keine Nullstellen auf der imagin¨aren Achse besitzen. jω jω0
s1 s3 arc(jω0 − s2 )
s4
σ
s2 Bild 3.2.
Winkel arc(jω0 − si ), in der komplexen Ebene (s = σ + jω) f¨ ur ein Beispielpolynom mit n = 4 und k = 1.
Ersichtlich gilt f¨ ur den Zuwachs des Winkels von f (s) bei Integration entlang der imagin¨aren Achse (vgl. Bild 3.2) j∞ ∞ ∞ n d arcf (s) = d arcf (jω) = d arc(jω − si ) s=−j∞
ω=−∞
i=1 ω=−∞
= π (n − k) − k = π(n − 2k) .
F¨ ur s = jω kann man das gegebene Polynom f (s) wie folgt zerlegen:
(3.4)
120
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
f (jω) = an (jω)n + an−1 (jω)n−1 + · · · + a1 (jω) + a0 = j n an ω n − an−2 ω n−2 + an−4 ω n−4 − + . . . #$ % " −j =j
n
n+1
=:f1 (ω)
"
an−1 ω
n−1
− an−3 ω n−3 + an−5 ω n−5 − + . . . #$ % =:f2 (ω)
f1 (ω) − jf2 (ω) .
(3.5)
Mit dieser Zerlegung in Real- und Imagin¨ arteil ist das Integral (3.4) durch ∞ ∞ d arc f (jω) = d arc f1 (ω) − jf2 (ω) π(n − 2k) = ω=−∞ ∞
=
ω=−∞
−f2 (ω) =− d arctan f1 (ω)
ω=−∞
∞ d arctan
f2 (ω) +∞ f2 =: πI−∞ . f1 (ω) f1
ω=−∞
bestimmt. +∞ f2 I−∞ f1 bezeichnet den sogenanntec Cauchy − Index, der allein aus der Be-
f2 f1 an den reellen Nullstellen von f1 +∞ f2 I−∞ f1 ergibt sich aus der Anzahl der
trachtung der Spr¨ unge des Quotienten
ermittelt werden kann: Der Wert von Spr¨ unge von −∞“ auf +∞“ abz¨ uglich der Anzahl der Spr¨ unge von +∞“ ” ” ” auf −∞“, die an den reellen Nulldurchg¨ angen von f1 auftreten, wenn ω die ” ganze Frequenzachse von ω = −∞ bis ω = +∞ durchl¨auft. Das macht man sich rasch anhand eines Beispiels klar. Beispiel 3.8 Das zu untersuchende Polynom sei f (s) = s5 + s4 + 20s3 + 26s2 + 64s + 25 . Die Zerlegung von f (jω) in Real- und Imagin¨ arteil ergibt: f1 (ω) = ω 5 −20ω 3 +64ω mit den Wurzeln ω1 = −4, ω2 = −2, ω3 = 0, ω4 = 2, ω5 = 4 und f2 (ω) = ω 4 − 26ω 2 + 25 mit den Wurzeln ω1 = −5, ω2 = −1, ω3 = 1, ω4 = 5. Die Verl¨ aufe der Funktionen f2 , f1 , ff21 , arctan ff21 sowie die interessierenden Vorzeichenwechsel von sgn ff21 in Abh¨ angigkeit der Kreisfrequenz ω zeigt Bild 3.3. Die f2 Funktion arctan f1 ist nicht eindeutig. Im Bild wurde eine stetige Funktion von ω aufgetragen und so eine eindeutig von ω abh¨ angige Funktion gewonnen. zeigt an den Nullstellen von f1 (ω) dreimal einen VorzeiDer Verlauf von ff21 (ω) (ω) chenwechsel von −“ nach +“ und zweimal einen Vorzeichenwechsel von +“ nach ” ” ” −“. Ersichtlich gilt f¨ ur das gew¨ ahlte Beispiel: ” ∞
∞
d arc f (jω) = − ω=−∞
d arctan
f2 (ω) = π(3 − 2) = π. f1 (ω)
ω=−∞
Unter Ber¨ ucksichtigung des Zwischenergebnisses (3.4) k¨ onnen wir schließen: Wegen π = π(n − 2 · k) = π(5 − 2 · 2) liegen k = 2 Nullstellen von f (s) in
3.4 Stabilit¨ atsuntersuchungen nach E. J. Routh
121
f1 (ω), f2 (ω)
der rechten Halbebene. (Die tats¨ achlichen Nullstellen des Beispielpolynoms sind s1,2 = +0.2806 ± j4.1234, s3,4 = −0.5588 ± j1.7283 und s5 = −0.4436.)
200
f2
100
f1 0
−100
−200 −6
f1 (ω) : f2 (ω) :
−4
−2
− 0 + − − −
V (ω)-Zuwachs
0
2
4
+ 0 − − − −
− 0 + + + +
+ 0 − − − −
− 0 + − − −
−1
−1
−1
1
1
ω
6
3
f2 (ω) f1 (ω)
2 1 0
−1 −2 −4
−2
−4
−2
0
2
4
6
0
2
4
6
ω
arctan
f2 (ω) f1 (ω)
−3 −6
2 0
−2 −4 −6 −6
Bild 3.3.
ω
Funktionsverl¨ aufe von f2 , f1 , ff21 und arctan ff21 f¨ ur das Beispielpolynom f (s) = s5 + s4 + 20s3 + 26s2 + 64s + 25
Zur echt-gebrochen rationalen Funktion ff21 (ω) (ω) , wobei f1 und f2 teilerfremd seien, l¨ asst sich eine (verallgemeinerte) Sturmsche Kette entwickeln:
122
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
f1 (ω) = q1 (ω)f2 (ω) − f3 (ω) f2 (ω) = q2 (ω)f3 (ω) − f4 (ω) f3 (ω) = q3 (ω)f4 (ω) − f5 (ω) .. . fn+1 (ω) = const. = 0 . Wie im Abschnitt 3.3.3 bezeichne V ( ω ) die Anzahl der Vorzeichenwechsel in der Kette f1 (ω), f2 (ω), ..., fn+1 (ω) f¨ ur ein festes ω . Verschwindet ein Mittelglied, d. h. fi ( ω ) = 0 (f¨ ur 1 < i ≤ n), so wird fi−1 ( ω )fi+1 ( ω ) < 0. Daher kann sich V (ω) bei Nulldurchg¨ angen der Polynome f2 (ω), f3 (ω),..., fn (ω) nicht ¨ andern, sondern nur bei Nulldurchg¨angen von f1 (ω). An den Argumentwerten ω = ω mit f1 ( ω ) = 0 vermindert bzw. vermehrt sich V (ω) um 1, je nachdem, ob bei ω = ω das Vorzeichen sgn ff12 (ω) (ω) von ”−“ auf ”+“ oder umgekehrt wechselt. F¨ ur das Beispiel wurden die Zuw¨achse von V (ω) an den Nullstellen von f1 (ω) in Bild 3.3 eingetragen. Die vorstehende Diskussion f¨ uhrt uns auf die Erkenntnis: +∞ V (−∞) − V (+∞) = n − 2k = I−∞
f2 (ω) . f1 (ω)
(3.6)
Diskussion und Auswertung der verallgemeinerten Sturmschen Kette f¨ ur den regul¨ aren Fall (Sturmsche Kette bricht nicht ab): Mit den oben definierten Startfunktionen f1 und f2 erh¨alt man die folgende Kette von Polynomen: f1 (ω) = an ω n − an−2 ω n−2 + an−4 ω n−4 − + · · · f2 (ω) = an−1 ω n−1 − an−3 ω n−3 + an−5 ω n−5 − + · · · − f1 (ω) an an an−3 ω n−2 − an−4 − an−1 an−5 ω n−4 + − · · · = an−2 − an−1 " " #$ % #$ %
f3 (ω) =
an an−1 ωf2 (ω)
bn−2
bn−4
= bn−2 ω n−2 − bn−4 ω n−4 + − · · · n−1 ωf3 (ω) − f2 (ω) f4 (ω) = abn−2 n−1 n−1 bn−4 ω n−3 − an−5 − abn−2 bn−6 ω n−5 + − · · · = an−3 − abn−2 " " #$ % #$ % cn−3
= cn−3 ω .. . fn+1 (ω) = a0 .
n−3
− cn−5 ω
cn−5 n−5
+ −···
Wenn man die Polynome f1 , f2 , f3 , f4 , ..., fn+1 mit Papier und Bleistift berechnen m¨ ochte, so verwendet man zweckm¨ aßig das von Routh angegebene
3.4 Stabilit¨ atsuntersuchungen nach E. J. Routh
123
Rechenschema, bei dem f¨ ur jedes weitere Polynom eine weitere Zeile ben¨otigt wird. Routhsches Rechen-Schema (Routhscher Algorithmus) f¨ ur die Kettenbildung: ω n : an an−2 an−4 an−6 · · · an ω n−1 : an−1 an−3 an−5 · · · A = −an−1 ; a n−1 n−2 ω : bn−2 bn−4 bn−6 · · · B = −bn−2 ;
bn−k := an−k +A·an−(k+1) cn−k := an−k +B ·bn−(k+1)
ω n−3 : cn−3 cn−5 · · · ω n−4 : dn−4 dn−6 · · ·
dn−k := bn−k +C ·cn−(k+1) en−k := cn−k +D·dn−(k+1)
C = −bcn−2 ; n−3 cn−3 D = −dn−4 ; n−4 E = −den−5
ω n−5 : en−5 · · · .. .. . . ω 0 : a0
Die beiden ersten Zeilen des Schemas, sie geh¨ oren zu den Polynomen f1 und f2 , kann man unmittelbar von den Koeffizienten des gegebenen Polynoms f (s) abschreiben. Die weiteren Zeilen erh¨ alt man aus der rechts notierten Rechenvorschrift. Das Skelett des Routhschen Schemas hat eine charakteristische Gestalt: f¨ ur gerade n: • • (hier n = 10) • • •• •• •• •• •• •• •• • •
•••• ••• ••• •• •• • •
f¨ ur ungerade n: (hier n = 9)
◦ ◦ ◦ ◦ ◦ ◦ ◦
•• •• •• •• •• •• •• •• • •
••• •••◦ •• ◦ •• ◦ • ◦ • ◦ ◦ ◦
An den jeweils unterstrichenen Stellen steht der Koeffizient ao , der w¨ahrend des Rechenablaufs nicht ver¨ andert wird. Beispiel 3.9 f (s) = s5 + 3s4 + 3s3 + 2s2 + 2s + 1 Routhsches Schema und die zum Rechenschema geh¨ orende Sturmsche Kette der Hilfsfunktionen: ω5 ω4 ω3 ω2 ω1 ω0
: 1 : 3 : 73 : − 17 : 18 : 1
3 2 5 3
1
2 1
− 13 − 97 49 3
f1 (ω) f2 (ω) f3 (ω) f4 (ω) f5 (ω) f6 (ω)
= ω 5 − 3ω 3 + 2ω = 3ω 4 − 2ω 2 + 1 = 73 ω 3 − 53 ω = − 71 ω 2 − 1 = 18ω =1
124
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
Offenbar gilt f¨ ur die Anzahl der Vorzeichenwechsel in der Kette (mit VZW als Abk¨ urzung f¨ ur Vorzeichenwechsel in der anschließenden Zahlenfolge in runden Klammern): V (+∞) = VZW(an , an−1 , bn−2 , cn−3 , . . . , a0 ), VZW(an , −an−1 , bn−2 , −cn−3 , . . . , a0 ) V (−∞) = VZW(−an , an−1 , −bn−2 , cn−3 , . . . , a0 )
bei geradem n bei ungeradem n
Oben wurde bereits gezeigt: +∞ V (−∞) − V (+∞) = I−∞
f2 = n − 2k . f1
(3.7)
Eine elementare Diskussion der Vorzeichenwechsel in endlichen reellen Zahlenfolgen ergibt die Beziehung V (−∞) + V (+∞) = n .
(3.8)
Aus (3.7) und (3.8) folgt durch Subtraktion: V (+∞) = VZW(an , an−1 , bn−2 , cn−3 , . . . , a0 ) = k
(3.9)
Mithin ergibt sich die gesuchte Anzahl k aus der Anzahl der Vorzeichenwechsel in der ersten Spalte des Routhschen Rechenschemas. Das gewonnene Ergebnis formulieren wir als das Routhsche Kriterium f¨ ur den regul¨ aren Fall: Satz 3.8 Die Anzahl k der Wurzeln eines reellen Polynoms, die in der Halbebene Re s > 0 liegen, ist gleich der Zahl der Vorzeichenwechsel in der ersten Spalte des Routhschen Schemas, in der Spalte der sogenannten Probefunktionen. Beispiel 3.10 f (s) = s5 + s4 + 20s3 + 26s2 + 64s + 25 ω5: 1 ω4: 1 ω 3 : −6 ω 2 : 65 2 ω 1 : 567 13 ω 0 : 25
20 26 39 25
64 25
−1 1 6 12 65
f1 (ω) = ω 5 − 20ω 3 + 64ω f2 (ω) = ω 4 − 26ω 2 + 25 f3 (ω) = −6ω 3 − 39ω f4 (ω) = 65 ω 2 − 25 2 567 f5 (ω) = 13 ω f6 (ω) = 25
Man erkennt zwei Vorzeichenwechsel in der ersten Spalte und schließt daraus: k = 2 Wurzeln des Beispielpolynoms liegen in der rechten Halbebene.
Bemerkung 1: G¨ abe es rein imagin¨ are Wurzeln, so w¨ urde mit f (j ω ) = 0 zugleich f1 ( ω ) = 0 und f2 ( ω ) = 0 gelten. Also w¨aren f1 (ω) und f2 (ω) nicht teilerfremd. Der Routhsche Algorithmus br¨ ache vorzeitig mit einer Nullzeile ab. Wenn also der Algorithmus bis zu Ende ausgef¨ uhrt werden kann, dann besitzt das Polynom f (s) gewiß keine rein-imagin¨aren Nullstellen.
3.4 Stabilit¨ atsuntersuchungen nach E. J. Routh
125
Aus der Struktur der Kette von Polynomen, die den einzelnen Zeilen des Routhschen Rechenschemas entsprechen, k¨ onnen wir eine weitere Schlußfolgerung ziehen: Sind ±j ω die einzigen rein-imagin¨aren Nullstellen von f (s), so muß das Verfahren mit der vorletzten Zeile abbrechen; denn es gilt fn (ω) = 0, und fn−1 (ω) ist ein Polynom zweiten Grades, das alle vorausgehenden Polynome der Kette teilt, d.h. fn−1 (ω) = const · (ω − ω ) · (ω + ω ). Im Falle k = 0 ergibt sich aus Satz 3.8 und Bemerkung 1 das Routhsche Stabilit¨ atskriterium: Satz 3.9 Wenn sich der Routhsche Algorithmus f¨ ur ein gegebenes Polynom f (s) ohne Abbruch ausf¨ uhren l¨asst und alle Probefunktionen das gleiche Vorzeichen haben, so ist f (s) stabil; denn die Realteile aller Wurzeln des untersuchten Polynoms f (s) sind negativ. Beispiel 3.11 f (s) = s6 + 7s5 + 25s4 + 55s3 + 74s2 + 58s + 20 ω6: ω5: ω4: ω3: ω2: ω1: ω0:
1 7 17.143 28.17 35.38 33.91 20
25 74 55 58 65.714 20 49.84 20
20 − 71
−0.408 −0.608 −0.796
f1 (ω) = ω 6 − 25ω 4 + 74ω 2 − 20 f2 (ω) = 7ω 5 − 55ω 3 + 58ω f3 (ω) = 17.143ω 4 −65.714ω 2 +20 f4 (ω) = 28.17ω 3 − 49.84ω f5 (ω) = 35.38ω 2 − 20 f6 (ω) = 33.91ω f7 (ω) = 20
Da kein Vorzeichenwechsel in der ersten Spalte auftritt, liegen alle Wurzeln in der linken Halbebene.
Bemerkung 2: Ein reelles Polynom f (s) ohne rein imagin¨are Nullstellen ist genau dann stabil, wenn k = 0 gilt, d. h., wenn V (−∞) − V (+∞) = f2 (ω) +∞ f2 I−∞ ange f1 = n. Der Quotient f1 (ω) springt dann an jedem der n Nulldurchg¨ von f1 (ω) von −∞“ auf +∞“. Folglich muß zwischen je zwei benachbar” ” ten Nulldurchg¨ angen von f1 (ω) eine Nulldurchgang von f2 (ω) liegen. (vgl. L¨ uckenkriterium, Michailov-Kriterium)
3.4.2 Erweiterung des Routhschen Algorithmus auf nichtregul¨ are F¨ alle Wenn der Routhsche Algorithmus vorzeitig abbricht, so wollen wir von einem nichtregul¨ aren Fall sprechen. Alle diese Ausnahmef¨alle offenbaren sich erfreulicherweise von selbst bei der Durchf¨ uhrung des Routhschen Algorithmus. Fall A: Eine Probefunktion verschwinde, z. B. das erste Element in der (i + 1)-ten Zeile sei hn−i = 0, doch verschwinde nicht die ganze (i + 1)-te Zeile, d. h. es gelte fi+1 (ω) ≡ 0.
126
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
Beispiel 3.12
f (s) = s6 + s5 + 6s4 + 5s3 + 11s2 + 6s + 16 ω6: ω5: ω4: ω3:
1 6 1 5 1 5 0 −10
11 6 16
16 −1 -1
Die Einzel-Null in der 4. Zeile des Rechenschemas w¨ are nicht entstanden, wenn die Koeffizienten 11 bzw. 5 des gegebenen Polynoms ein wenig anders gew¨ ahlt worden w¨ aren.
Ausweg 1: Man kann die 0 “ durch eine betragskleine reelle Zahl ε “ er” ” setzen und den Algorithmus fortsetzen. Beispiel 3.12 (Fortsetzung) ω6: ω5: ω4: ω3: ω2:
1 6 1 5 1 5 ε −10 5 + 10 16 ε
ω 1 : −10 − ω0:
11 6 16
16 −1 −1 − 1ε
2
ε − 5+ε10 = − 10+5ε ε
16 2 ε 10
16
Anzahl der Vorzeichenwechsel f¨ ur ε > 0: k=2 , Anzahl der Vorzeichenwechsel f¨ ur ε < 0: k=2 . Ergebnis: Das gegebene Beispiel-Polynom besitzt k = 2 Nullstellen in der rechten Halbebene.
Ausweg 2: Um die numerische Kompensation auf Null zu u ¨berwinden, multipliziert man f (s) mit einem bekannten Linearterm (s + a). Anschließend wird das Polynom f(s) = f (s)(s + a) mit dem Routhschen Algorithmus untersucht. Beispiel 3.12 (Fortsetzung):
Versuch 1: Mit a = −2 folgt f (s) = s6 + s5 + 6s4 + 5s3 + 11s2 + 6s + 16 (s − 2) = s7 − s6 + 4s5 − 7s4 + s3 − 16s2 + 4s − 32 1 ω7: ω6: −1 −3 ω5: ω4: −2 ω3: −5 ω2: − 44 3 ω 1 : 20 + 120 11 ω0: −32
4 1 4 −7 −16 −32 −15 −28 − 20 −32 3 20 −32
1 − 13 − 32 − 25 15 − 44
Anzahl der Vorzeichenwechsel in der Probespalte: k = 3. Ergebnis: Das modifizierte Beispiel-Polynom f (s) hat k = 3 Nullstellen in der
3.4 Stabilit¨ atsuntersuchungen nach E. J. Routh
127
rechten Halbebene, davon liegt eine bei s0 = 2. Folglich hat das gegebene BeispielPolynom f (s) zwei Nullstellen in der rechten Halbebene.
Versuch 2: Mit a = −1 folgt f (s) = s6 + s5 + 6s4 + 5s3 + 11s2 + 6s + 16 (s − 1) = s7 + 5s5 − s4 + 6s3 − 5s2 + 10s − 16 ω 7 : 1 5 6 10 ω 6 : 0 −1 −5 −16 Das gew¨ unschte Ergebnis, n¨ amlich das Verschwinden einer Probefunktion via Ausweg 2 zu vermeiden, wurde nicht erreicht. Offenbar war der Wert a = −1 ung¨ unstig gew¨ ahlt. Die Bearbeitung der Aufgabe k¨ onnte u ¨ber Ausweg 1 fortgesetzt werden.
Versuch 3: Mit a = 1 folgt f (s) = s6 + s5 + 6s4 + 5s3 + 11s2 + 6s + 16 (s + 1) = s7 + 2s6 + 7s5 + 11s4 + 16s3 + 17s2 + 22s + 16 1 ω7: ω6: 2 3 ω5: 2 4 ω : 1 ω 3 : 10 ω 2 : − 23 ω 1 : 230 ω 0 : 16
7 11 15 2 − 53
−10 16
16 17 14 16
22 16
− 12 − 43 − 32 1 − 10 15
Anzahl der Vorzeichenwechsel in der Probespalte: k = 2. Ergebnis: Das modifizierte Beispiel-Polynom f (s) hat k = 2 Nullstellen in der rechten Halbebene. Da die zus¨ atzlich eingef¨ uhrte Nullstelle bei s0 = −1 in der linken Halbebene liegt, hat das gegebene Beispiel-Polynom f (s) zwei Nullstellen in der rechten Halbebene.
Fall B: Eine Zeile des Routhschen Rechenschemas ergibt sich als Nullzeile, d. h., es existiert ein Index i > 1 mit der Eigenschaft fi+1 (ω) = qi−1 (ω)fi (ω) − fi−1 (ω) ≡ 0 Folglich teilt fi alle vorangehenden Polynome fi−1 , fi−2 , . . . , f2 , f1 ; denn fi−1 = qi−1 fi , fi−2 = qi−2 fi−1 − fi = (qi−2 qi−1 − 1)fi , .. . Insbesondere gilt f1 (ω) = an ω n − an−2 ω n−2 + an−4 ω n−4 − + · · · = fi (ω)ϕ1 (ω) , f2 (ω) = an−1 ω n−1 − an−3 ω n−3 + an−5 ω n−5 − + · · · = fi (ω)ϕ2 (ω) .
128
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
Dabei sind ϕ1 und ϕ2 teilerfremde Polynome mit den Graden grad ϕ1 = i − 1, grad ϕ2 = i − 2. Das Polynom fi vom Grad n − i + 1 =: d besitzt ein nicht verschwindendes Absolutglied, weil a0 = 0 vorausgesetzt wurde. Folglich verschwinden im Polynom fi (ω) alle Glieder mit ungerader Potenz von ω, und der Grad gradfi = d ist eine gerade Zahl. Wegen f (jω) = j n (f1 (ω) − jf2 (ω)) = j n (fi (ω)ϕ1 (ω) − jfi (ω)ϕ2 (ω)) = j d fi (ω) ·j n−d (ϕ1 (ω) − jϕ2 (ω)) " #$ % " #$ % =:ϕ(jω)
=:f (jω)
= f(jω) · ϕ(jω) zerf¨ allt das gegebene Polynom f (s) in das Produkt f (s) = f(s) · ϕ(s) , wobei der Realteil und der Imagin¨ arteil von ϕ(s) teilerfremd sind. Auf das Polynom ϕ(s) mit dem Grade gradϕ = n−d kann daher das regul¨are Routh-Schema angewendet werden: +∞ I−∞
f2 +∞ ϕ2 = I−∞ = Vϕ (−∞) − Vϕ (+∞) = (n − d) − 2kϕ , f1 ϕ1
wobei kϕ die Anzahl der Nullstellen von ϕ(s) in der rechten Halbebene bezeichnet. Das Multiplizieren mit einem Faktor fi (ω) ¨ andert die Anzahl kϕ der Vorzeichenwechsel in den Probefunktionen (erste Spalte im Routhschen Schema, Zeilen 1 bis i) nicht. Fall B.1: Alle Nullstellen von fi (ω) seien einfach. Man kann eine Sturmsche d Kette, beginnend mit den Polynomen fi (ω) und fi (ω) = dω fi (ω) (vgl. Ab schn. 3.3), bilden. Sie ist gewiss regul¨ ar, weil fi und fi teilerfremd sind: +∞ I−∞
fi = V (−∞) − V (+∞) = di = Anzahl der reellen Nullstellen von fi (ω) fi = Anzahl der rein imagin¨ aren Nullstellen von f(s) = Anzahl der rein imagin¨ aren Nullstellen von f (s) .
Weil fi (ω) ein reelles Polynom in ω 2 ist , darf man setzen: f(jω) = j d fi (ω) =: ψ(ω 2 ) . Daher gilt f(s) = ψ(−s2 ) und gradf = d ist eine gerade Zahl. Offenbar ist mit s0 auch −s0 eine Nullstelle von ψ(−s2 ); außerdem ist die zu
3.4 Stabilit¨ atsuntersuchungen nach E. J. Routh
129
s0 konjugiert-komplexe Zahl ebenfalls eine Nullstelle, weil die Polynomkoeffizienten reell sind. Die Bilder 3.4 und 3.5 veranschaulichen die m¨ oglichen Nullstellenverteilungen f¨ von ψ(−s2 ) = f(s) ur die Grade d = 2 und d = 4.
j Im s
j Im s
oder Re s
Re s
Bild 3.4. M¨ ogliche Nullstellenverteilungen von f (s) = ψ(−s2 ) f¨ ur grad f = d = 2
jIm s
jIm s Re s
oder
jIm s Re s
oder
jIm s Re s
oder
Re s
Bild 3.5. M¨ ogliche Nullstellenverteilungen von f (s) = ψ(−s2 ) f¨ ur gradf = d = 4
Bezeichnet kf die Anzahl der Nullstellen des Polynoms f im Inneren der = d = di + 2k . rechten Halbebene, so gilt ersichtlich grad f(s) f Die bisher im Fall B erhaltenen Aussagen lassen sich wie folgt zusammenfassen: +∞ I−∞
ϕ2 +∞ fi + I−∞ = Vϕ (−∞) − Vϕ (+∞) + V (−∞) − V (+∞) ϕ1 fi = (n − d) − 2kϕ + di
= (n − d) − 2kϕ + d − 2kf = n − 2k Außerdem wird Vϕ (−∞) + Vϕ (+∞) + V (−∞) + V (+∞) = (n − d) + d = n . Also ergeben die Vorzeichenwechsel in der ersten Spalte des Routhschen Rechenschemas im Fall B.1 die Anzahl der Nullstellen von f (s) mit positivem Realteil, denn V (+∞) = Vϕ (+∞) + V (+∞) = kϕ + kf = k .
130
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
Die Anzahl di der rein-imagin¨ aren Nullstellen von f (s) kann aus der ersten Spalte (ab Zeile i, wenn fi+1 (ω) ≡ 0) entnommen werden: di = gradf(s) − 2kf . Fall B.2: Das Polynom fi (ω) besitze auch mehrfache Nullstellen. Die Existenz mehrfacher Nullstellen von fi (ω) wird bei Anwendung des Routhschen Algorithmus gem¨ aß Fall B.1 automatisch angezeigt: das neu angesetzte Verfahren bricht wiederum vorzeitig mit einer Nullzeile ab. Diese ist wie im Falle B.1 durch die Ableitung des voranstehenden Polynoms zu ersetzen, und das Rechenverfahren ist fortzusetzen. Damit haben wir die Komplettierung des Routhschen Kriteriums (Satz 3.8) f¨ ur die nichtregul¨ aren F¨ alle abgeleitet. Satz 3.10 (Originaltext aus [Rou98]): Sobald man bei der Bildung der sukzessiven Hilfsfunktionen auf eine trifft, die vollst¨andig verschwindet, setze man statt ihrer den Differentialquotienten der vorangehenden nichtverschwindenden Hilfsfunktion ein und fahre dann fort, die folgenden Funktionen auf dieselbe Art wie bisher zu bilden. Jeder Vorzeichenwechsel in der ersten Vertikalreihe zeigt dann eine Wurzel an, deren reeller Teil positiv ist. Beispiel 3.13
f (s) = s7 + s6 + s5 − s4 − s3 − 5s2 − s − 3
Routhsches Schema: ω7: 1 ω6: 1 ω5: 2 ω 4 : –3 ω3: 0 –12 ω 2 : –3 ω1: 0 –6 ω 0 : –3
1 −1 4 –6 0 –12 –3
–1 –1 − 5 − 3 −1 2 − 21 2 –3 3 − 41 −4
=⇒ f4 (ω) = −3(ω 4 − 2ω 2 + 1) =⇒ f6 (ω) = −3(ω 2 − 1)
− 21
Ergebnis: Eine Nullstelle des gegebenen Polynoms f (s) liegt in der rechten Halbebene. Das gegebene Beispiel-Polynom zerf¨ allt wie folgt: f (s) = f (s) · ϕ(s) = −3(s4 + 2s2 + 1) · = −3(s2 + 1)2 ·
1 (−s3 − s2 + s + 3) 3
1 (−s3 − s2 + s + 3) 3
Die Nullstelle von f (s) in der rechten Halbebene ist eine Nullstelle von ϕ(s). Die Anzahl der rein-imagin¨ aren Nullstellen von f (s) ergibt sich zu d4 = V (−∞) − V (+∞) = V ZW (−3, 12, −3, 6, −3) − V ZW (−3, −12, −3, −6, −3) = 4 − 0 = 4
3.4 Stabilit¨ atsuntersuchungen nach E. J. Routh
131
oder d4 = gradf(s) − 2kf = 4 − 2 · V ZW (−3, −12, −3, −6, −3) = 4 − 0 = 4. Die Nullstellen von f (s) liegen bei +j und −j (jeweils zweifach).
Beispiel 3.14 (entnommen aus [Rou98], Band II, Seite 233): f (s) = s10 + s9 − s8 − 2s7 + s6 + 3s5 + s4 − 2s3 − s2 + s + 1 Routhsches Rechen-Schema: ω 10 : ω9: ω8: ω7:
1 1 1 0
−1 –2 −2 0
8 2
–12 12 -4 –3 3 –1 3 − 23 1 2 3 –3 2 –3 3 –1 1 -2 2 –1 1 0 –2 –1 1 2
ω 6 : − 12 –1 3 ω5: 1 2 ω4: 1 ω3: 0 4 2 ω 2 : − 12 –1 3 ω1: ω0: 2
1 1 3 –2 3 −2 0 0
−1 1 1
1 –1 –1
⇒ f3 (ω) = ω 8 −(−2)ω 6 +3ω 4 −(−2)ω 2 +1 f3 (ω) = 8ω 7 +12ω 5 +12ω 3 +4ω = 8ω 7 −(−12)ω 5 +12ω 3 −(−4)ω dividiere durch 4 - 21 multipliziere mit 2 2 dividiere durch 3 1 dividiere durch 2 –1 ⇒ f7 (ω) = ω 4 − (−1)ω 2 + 1 f7 (ω) = 4ω 3 − (−2)ω dividiere durch 2 − 12 multipliziere mit 2 2
Die erste Spalte enth¨ alt vier Vorzeichenwechsel. Folglich liegen k = 4 Nullstellen von f (s) in der rechten Halbebene. Die Anzahl der rein-imagin¨ aren Nullstellen von f (s) entnehmen wir ebenfalls aus der ersten Spalte (ab Zeile 3): d3 = V (−∞) − V (+∞) = −V ZW (1, 2, −1, 1, 1, 2, −1, 3, 2) + V ZW (1, −2, −1, −1, 1, −2, −1, −3, 2) = −4 + 4 = 0
oder
d3 = grad f (s) − 2kf = 8 − 2 · 4 = 0. Die Zerlegung von f (s) ergibt sich hier aus dem Rechenschema wie folgt:
f (s) = f (s)ϕ(s) = s8 − 2s6 + 3s4 − 2s2 + 1 (s2 + s + 1) ,
ψ(−s2 )
wobei
ϕ(s)
ψ(−s2 ) = s4 − s2 + 1 (s4 − s2 + 1) .
Aus der Faktorisierung lassen sich die Wurzel-Lagen leicht ermitteln. Das Polynom s2 + s + 1 hat die Wurzeln
132
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen s1,2 = −
1 ± 2
1 1 −1=− ± 4 2
und f¨ ur die Polynome s4 − s2 + 1 erh¨ alt man u ¨ ber s2 =
= ± exp − j .
√ 1 π 1 1 ± 3j = exp ± j −1= 4 2 3
1 ± 2
die Wurzeln s3,4 = ± exp
3 2 j = exp ± πj 4 3
j, s π 6
5,6
;
π 6
Ergebnis: Die 10 Nullstellen des Beispiel-Polynoms sind so verteilt: jeweils Doppelwurzeln bei ± exp π6 j und ± exp − π6 j sowie Einfachwurzeln bei exp ± 23 πj .
3.5 Folgerungen aus den Routhschen Stabilit¨ atsuntersuchungen 3.5.1 Erg¨ anzungshinweise zur praktischen Anwendung Im Routhschen Rechenschema kann die Reihenfolge der Koeffizienten umgekehrt werden. Man notiert dann die beiden oberen Zeilen des Rechenschemas z. B. f¨ ur n = 6 folgendermaßen: a0 a2 a4 a6 a1 a3 a5 .. . Begr¨ undung: j Im s
s-Ebene
Re s
Bild 3.6. Spiegelung am Einheitskreis
Das Polynom
f ( 1s ) = an ( 1s )n + an−1 ( 1s )n−1 + · · · + a0 = s−n a0 ( 1s )n + a1 ( 1s )n−1 + · · · + an
3.5 Folgerungen aus den Routhschen Stabilit¨ atsuntersuchungen
133
hat ebensoviele (endliche nichtverschwindende) Nullstellen in der rechten Halbebene wie das Polynom f (s). Der Austausch 1s ⇐⇒ s bedeutet eine Spiegelung am Einheitskreis, vgl. Bild 3.6. Das Vorzeichen des Realteils ¨ andert sich dabei nicht. Mit Hilfe der Routhschen Stabilit¨ atss¨ atze lassen sich auch Rechenvorschriften zur Ermittlung der Anzahl der Nullstellen eines reellen Polynoms, die in einer Halbebene Re (s) > k1 oder in einem Streifenbereich k1 < Re (s) ≤ k2 liegen, angeben: F¨ ur ein reelles Polynom f (s) = an sn + an−1 sn−1 + · · · + a1 s + a0 ,
an > 0,
sei die Anzahl z der Nullstellen im Streifenbereich gesucht. Dann gilt z = {Anzahl der Nullst. mit Re s > k1 } − {Anzahl der Nullst. mit Re s > k2 } =: z1 − z2 . Wir entwickeln das gegebene Polynom f (s) im ersten Schritt um k1 und erhalten f (s) = an (s − k1 )n + an−1 (s − k1 )n−1 + · · · + a2 (s − k1 )2 + a1 (s − k1 ) + a0 . Die Berechnung der Koeffizienten ai erfolgt zweckm¨aßig gem¨aß dem Horner schen Rechenschema ([Hor19], siehe z.B. [Wil57], [Zur63], [Hei63]). F¨ ur das Polynom mit den Koeffizienten an , an−1 , · · · , a2 , a1 , a0 wird das Routhsche Rechentableau gebildet. Die Anzahl der Vorzeichenwechsel in der ersten Spalte ist gleich der Anzahl z1 . Im zweiten Schritt erhalten wir nach Entwicklung des gegebenen Polynoms f (s) um k2 die Darstellung f (s) = an (s − k2 )n + an−1 (s − k2 )n−1 + · · · + a2 (s − k2 )2 + a1 (s − k2 ) + a0 und daraus die Anzahl z2 . ¨ Bei zeitdiskreten Ubertragungsgliedern, die im Kapitel 7 gr¨ undlich ¨ studiert werden, tritt an die Stelle der rationalen Ubertragungsfunktion Z(s) ZZ (z) ¨ G(s) = N (s) eine rationale Ubertragungsfunktion GZ (z) = NZ (z) . Sie ist genau dann stabil, wenn alle ihre Polstellen im Inneren des Einheitskreises der komplexen z-Ebene liegen. Die Stabilit¨ atspr¨ ufung kann wieder mit Hilfe des Routhschen Verfahrens erfolgen. Zu diesem Zwecke schreibt man die ¨ gegebene Ubertragungsfunktion GZ (z) mittels Substitution z = 1+w 1−w um in #
Z (w) eine rationale Funktion G# (w) = N # (w) in w ∈ C. (Durch die Substitution wird das Innere des Einheitskreises der z−Ebene umkehrbar eindeutig auf die ¨ offene linke w−Halbebene abgebildet.) Das zeitdiskrete Ubertragungsglied ist genau dann stabil, wenn alle Nullstellen des Polynoms N # (w) in der offenen linken w-Halbebene liegen. In der regelungstechnischen Praxis h¨ angen die Koeffizienten des zu untersuchenden Polynoms h¨ aufig in bekannter Weise von physikalischen oder
134
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
technologischen Parametern ab. Die Stabilit¨ atsuntersuchung bei parameterabh¨ angigen Koeffizienten kann grunds¨atzlich ebenfalls nach dem Routhschen Verfahren erfolgen. Beispiel 3.15 Das charakteristische Polynom eines Regelkreises h¨ange wie folgt von der Reglerverst¨ arkung V und zwei Zeitkonstanten T1 und T2 der Regelstrecke ab: f (s) = T1 T2 s3 + (T1 + T2 )s2 + s + V . F¨ ur welche Werte von V ist dieses Polynom und damit der Regelkreis stabil? Das Routhsche Rechenschema liefert ω3 :
T1 T2
1
ω2 :
T1 + T 2
V
ω1 : 1 − ω0 :
T1 T2 V T1 +T2
V
¬ ¬ ¬ ¬ ¬ ¬ ¬ ¬ ¬ ¬ ¬
T2 − TT11+T 2
Da die Zeitkonstanten a priori positiv sind, ist der Regelkreis genau dann stabil, T2 V > 0 gilt. Damit ergibt sich der zul¨ assige wenn sowohl V > 0 als auch 1 − TT11+T 2 T1 +T2 Bereich f¨ ur die gesuchte Reglerverst¨ arkung aus der Ungleichung 0 < V < T1 T2 .
Alle Rechenoperationen des Routhschen Algorithmus lassen sich in symbolischer Form ausf¨ uhren. Bei bekannter Parameterabh¨angigkeit der Koeffizienten des betrachteten Polynoms entstehen die Elemente der ersten Spalte des Routhschen Schemas als analytische Funktionen der Parameter. Aus den Vorzeichenbedingungen, die die Elemente der ersten Spalte zu erf¨ ullen haben, ergeben sich Ungleichungen, denen die Parameterwerte gen¨ ugen m¨ ussen. Insbesondere k¨ onnen die Parameterbereiche, f¨ ur die das betrachtete Polynom stabil wird, aus der ersten Spalte des Routhschen Schemas berechnet werden, indem man jedes Element der ersten Spalte als positiv ansetzt. Diese prinzipiell richtige Aussage st¨ oßt jedoch bei Polynomen h¨oheren Grades bald an die Grenzen der praktischen Verwertbarkeit. Die Elemente der ersten Spalte ergeben sich als komplizierte nichtlineare algebraische Ausdr¨ ucke der Parameter, die sich nur selten einfach, bei h¨ ohergradigen Polynomen aber meist nur numerisch auswerten lassen. Dies ist letztlich auf die Bildung der verallgemeinerten Sturmschen Kette zur¨ uckzuf¨ uhren, deren Abarbeitung mit reellen Zahlen problemlos m¨ oglich ist, w¨ ahrend man bei einer symbolischen Abarbeitung rasch auf un¨ uberschaubar große algebraische Ausdr¨ ucke st¨oßt. Bei erneutem Nachdenken u ¨ ber die Routhsche Methodik, die im Abschnitt 3.4 behandelt wurde, bemerkt man jedoch, dass die entscheidende Erkenntnis bereits mit Gleichung (3.6), siehe Seite 122, vorlag, also vor der Entwicklung der verallgemeinerten Sturmschen Kette. Es erweist sich als lohnend, dieser Anmerkung auf den Grund zu gehen.
3.5 Folgerungen aus den Routhschen Stabilit¨ atsuntersuchungen
135
Zu Beginn des Abschnitts 3.4 war vorausgesetzt worden, f (s) sei ein Polynom n-ten Grades ohne rein-imagin¨ are Nullstellen. Wir betrachten jetzt den allgemeinen Fall, d. h. f (s) habe n+ Nullstellen in der offenen rechten Halbebene, n− Nullstellen in der offenen linken Halbebene und n0 Nullstellen auf der imagin¨ aren Achse (n− + n0 + n+ = n). F¨ ur s = jω kann die Routhsche Zerlegung (3.5) unver¨andert u ¨ bernommen werden: f (jω) = j n f1 (ω) − jf2 (ω) (3.10) Die rein-imagin¨ aren Nullstellen s = jωλ von f (s) liefern Nullstellen ω = ωλ sowohl von f1 (ω) als auch von f2 (ω), f¨ ur λ = 1, . . . , n0 . Die Punktmenge Ω0 := {ω1 , ω2 , . . . , ωn0 }, die aus den rein-imagin¨aren Nullstellen von f (s) /∞ d arcf (jω) unhervorgeht, lassen wir bei der Auswertung des Integrals −∞
ber¨ ucksichtigt: ∞
∞ d arc f (jω) =
−∞ ω ∈Ω / 0
d arc f1 (ω) − jf2 (ω) = −
−∞ ω ∈Ω / 0
∞ d arctan
−∞
f2 (ω) f1 (ω) (3.11)
An die Stelle der Beziehung (3.4) tritt die Gleichung ∞ π(n− (f ) − n+ (f )) =
∞ d arc f (jω) = −
−∞ ω ∈Ω / 0
d arctan
−∞
Ersetzt man das uneigentliche Integral
/∞
f2 (ω) f1 (ω)
(3.12)
. . . durch ein bestimmtes Integral
−∞
ω /A
. . . , so kann man eine bemerkenswerte Vertauschbarkeitseigenschaft der
−ωA
Funktionen f1 und f2 feststellen: ωA −ωA
f2 (ω) =− d arctan f1 (ω) ωA
=− −ωA ω ∈Ω / 0
ωA
d arc f1 (ω) − jf2 (ω)
−ωA ω ∈Ω / 0
& ' d arc − j(f2 (ω) + jf1 (ω)) = −
ωA
d arc f2 (ω) + jf1 (ω)
−ωA ω ∈Ω / 0
ωA
=− −ωA
d arctan
f1 (ω) f2 (ω)
136
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
Dies gilt f¨ ur alle endlichen Werte ωA > 0. F¨ ur ωA → ∞ verhalten sich die Integranden unterschiedlich. Weil in der Routhschen Zerlegung (3.10) stets grad f1 > grad f2 und der Quotient ff21 eine ungerade Funktion ist, gilt lim
|ω|→∞
f2 (ω) =0, f1 (ω)
f2 (−ω) f2 (ω) =− . f1 (−ω) f1 (ω)
Im Abschnitt 3.4 wurde gezeigt, dass der Wert des Integrals (3.11) durch das Verhalten des Quotienten ff21 (ω) (ω) an seinen Polstellen ωµ bestimmt wird. Alle Polstellen liegen im Endlichen. Wir wollen sie der Gr¨oße nach durchnumerieren und wie folgt notieren: −ωm < −ωm−1 < . . . < −ω1 < ω0 = 0 < ω1 < . . . < ωm−1 < ωm im Falle einer ungeradzahligen Anzahl bzw. −ωm < −ωm−1 < . . . < −ω1 < ω1 < . . . < ωm−1 < ωm im Falle einer geradzahligen Anzahl von Polstellen. Satz 3.11 Die Differenz n− (f ) − n+ (f ) kann man aus den nichtnegativen Polstellen des Quotienten ff21 (ω) (ω) berechnen. Bei einer einer ungeradzahligen Anzahl von Polstellen gilt 1 n− (f ) − n+ (f ) = − π
∞ d arctan −∞
f2 (ω) f1 (ω)
m f2 (+0) f2 (−0) f2 (ωµ − 0) 1 f2 (ωµ + 0) sign − sign + − sign , = sign 2 f1 (+0) f1 (−0) f1 (ωµ + 0) f1 (ωµ − 0) µ=1 (3.13) und bei einer geradzahligen Anzahl von Polstellen n− (f ) − n+ (f ) =
m f2 (ωµ − 0) f2 (ωµ + 0) − sign . sign f1 (ωµ + 0) f1 (ωµ − 0) µ=1
(3.14)
Die runden Klammern nehmen entweder den Wert 2 oder den Wert -2 oder den Wert 0 an. Beispiel 3.16 Ankn¨upfend an Beispiel 3.8 auf S. 120 wird das Polynom f (s) = (s2 + 1) · s · (s5 + s4 + 20s3 + 26s2 + 64s + 25) = s8 + s7 + 21s6 + 27s5 + 84s4 + 51s3 + 64s2 + 25s gew¨ ahlt. Die Nullstellen des Beispiels 3.8 wurden beibehalten und um drei reinimagin¨ are Nullstellen (bei s = 0, s = ±j) erg¨ anzt. Demnach gilt
3.5 Folgerungen aus den Routhschen Stabilit¨ atsuntersuchungen n− (f ) = 3,
n0 (f ) = 3,
137
n+ (f ) = 2.
Die Routhsche Zerlegung (3.5) des gew¨ ahlten Polynoms f (s) erzeugt die Funktionen f1 (ω) = ω 8 − 21ω 6 + 84ω 4 − 64ω 2 , f2 (ω) = ω 7 − 27ω 5 + 51ω 3 − 25ω . Die Funktionsverl¨ aufe f1 (ω) und f2 (ω) im Intervall −6 ≤ ω ≤ 6 sind Bild 3.7 zu entnehmen. Ein Vergleich mit Bild 3.3, oberer Teil, zeigt Unterschiede, die sich
5
x 10
80 60 40 20 0 −20
Ausschnitt
4
f1 (ω), f2 (ω)
3 2 1 0 −6
f1 f1 f2
f2
−5
−4
−3
−2
−1
0
1
2
3
4
5
6
−5
−4
−3
−2
−1
0
1
2
3
4
5
6
−5
−4
−3
−2
−1
0
1
2
3
4
5
6
4 f2 (ω) f1 (ω)
2 0
−2
arctan
f2 (ω) f1 (ω)
−4 −6 2 0
−2 −4 −6 −6
ω Bild 3.7.
Funktionsverl¨ aufe von f1 (ω), f2 (ω), ff21 (ω) und arctan (ω)
f2 (ω) f1 (ω) 3
f¨ ur das
Beispielpolynom f (s) = s8 + s7 + 21s6 + 27s5 + 84s4 + 51s + 64s2 + 25s jedoch auf den Quotienten ff21 (ω) nicht auswirken. Die Funktion ff21 (ω) , vgl. Bild 3.7, (ω) (ω) hat nichtnegative Polstellen bei ω0 = 0, ω1 = 2 und ω2 = 4. Eine Auswertung der Formel (3.13) ergibt n− (f ) − n+ (f ) =
1 2
1 − (−1) + 1 − (−1) + − 1 − (+1) = 1 + 2 − 2 = 1.
138
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
Beispiel 3.17 Das Polynom f (s) = s6 + s5 + 6s4 + 8s3 + 9s2 + 15s + 4 , soll mit dem Satz 3.11 untersucht werden: f1 (ω) = ω 6 − 6ω 4 + 9ω 2 − 4 f2 (ω) = ω 5 − 8ω 3 + 15ω Die nichtnegativen Polstellen des Quotienten Die Formel (3.14) ergibt: n− (f ) − n+ (f ) =
sign
f2 (ω) f1 (ω)
liegen bei ω1 = 1 und ω2 = 2.
f2 (1 + 0) f2 (1 − 0) − sign f1 (1 + 0) f1 (1 − 0)
+ sign
f2 (2 − 0) f2 (2 + 0) − sign f1 (2 + 0) f1 (2 − 0)
= (−1 − (−1)) + (−1 − (+1)) = 0 − 2 = −2 . Da f1 (ω) und f2 (ω) keine gemeinsamen Nullstellen besitzen – die Wurzeln von √ √ f2 (ω) liegen bei 0, ± 3, ± 5 – , gibt es keine rein imagin¨ aren Nullstellen von f (s). Folglich hat das Beispielpolynom f (s) vier Nullstellen mit positivem Realteil und zwei Nullstellen mit negativem Realteil.
Mitunter erweist es sich als w¨ unschenswert (siehe insbes. Abschnitt 4.5), f2 (ω) f1 (ω) anstelle von f1 (ω) mit f2 (ω) zu operieren. Dann m¨ ussen die Polstellen dieses Quotienten bei ω → +∞ ber¨ ucksichtigt werden. Auf Grund der Symmetrie bez¨ uglich ω = 0 lassen sich die Polstellen des Quotienten ff12 (ω) (ω) wie folgt durchnumerieren: −∞ < −ωl < −ωl−1 < . . . < −ω1 < ω0 = 0 < ω1 < . . . < ωl−1 < ωl < +∞ im Falle einer ungeradzahligen Anzahl bzw. −∞ < −ωl < −ωl−1 < . . . < −ω1 < ω1 < . . . < ωl−1 < ωl < +∞ im Falle einer geradzahligen Anzahl von Polstellen. Satz 3.12 Die Differenz n− (f ) − n+ (f ) kann man auch aus den Polstellen des Quotienten ff12 (ω) (ω) berechnen. Bei einer einer ungeradzahligen Anzahl von nichtnegativen endlichen Polstellen gilt f1 (+0) 1 f1 (−0) n− (f ) − n+ (f ) = − sign − sign 2 f2 (+0) f2 (−0) l f1 (ωλ − 0) f1 (ωλ + 0) − sign − sign f2 (ωλ + 0) f2 (ωλ − 0) λ=1 f1 (−∞) f1 (+∞) 1 sign − sign , − 2 f2 (−∞) f2 (+∞)
3.5 Folgerungen aus den Routhschen Stabilit¨ atsuntersuchungen
139
und bei einer geradzahligen Anzahl l f1 (ωλ − 0) f1 (ωλ + 0) − sign sign f2 (ωλ + 0) f2 (ωλ − 0) λ=1 f1 (−∞) f1 (+∞) 1 sign − sign . − 2 f2 (−∞) f2 (+∞)
n− (f ) − n+ (f ) = −
Beispiel 3.18 Betrachtet wird wiederum das Polynom aus Beispiel 3.16, f (s) = s8 + s7 + 21s6 + 27s5 + 84s4 + 51s3 + 64s2 + 25s.
f1 (ω) f2 (ω)
10 0
−10 −15
−5 −4
−2 −1 0 1 2
4 5
10
15
−10
−5 −4
−2 −1 0 1 2
4 5
10
15
4
f1 (ω) f2 (ω)
arctan
−10
2 0
−2 −4 −15
ω Bild 3.8.
Funktionsverl¨ aufe von
f1 (ω) f2 (ω) 6
und arctan
f1 (ω) f2 (ω)
f¨ ur das Beispielpoly-
nom f (s) = s8 + s7 + 21s + 27s5 + 84s4 + 51s3 + 64s2 + 25s
dargestellt. Die Polstellen Im Bild 3.8 wurde der Verlauf des Quotienten ff12 (ω) (ω) liegen ersichtlich bei −∞, −ω2 = −5, −ω1 = −1, ω1 = 1, ω2 = 5, +∞. Der Satz 3.12 ergibt hier
n− (f ) − n+ (f ) = − sign
f1 (1 + 0) f1 (1 − 0) − sign f2 (1 + 0) f2 (1 − 0)
− sign
f1 (5 + 0) f1 (5 − 0) − sign f2 (5 + 0) f2 (5 − 0)
−
1 2
sign
f1 (+∞) f1 (−∞) − sign f2 (−∞) f2 (+∞)
= − (−1 − 1) − (1 − (−1)) − 12 (−1 − 1) = 2 − 2 + 1 = 1 .
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
140
Aus den S¨ atzen 3.11 und 3.12 kann man eine leicht handhabbare notwendige Stabilit¨ atsbedingung ableiten: Satz 3.13 Ein gegebenes reelles Polynom f (s) n-ten Grades kann nur dann stabil sein, wenn, ausgehend von der Routhschen Zerlegung (3.10), das Polynom f1 (ω) mindestens n positiv reelle Nullstellen bei geradem n oder 2 m = n−1 positiv reelle Nullstellen bei ungeradem n 2 besitzt und das Polynom f2 (ω) mindestens n−1 positiv reelle Nullstellen bei ungeradem n l = n2 2 − 1 positiv reelle Nullstellen bei geradem n
oder
besitzt. Beweis: Ein Polynom f (s) n-ten Grades ist genau dann stabil, wenn n− (f ) = n gilt. Dies impliziert n+ (f ) = 0 und n0 (f ) = 0 und damit auch n− (f )− n+ (f ) = n. Die positiv reellen Polstellen ωµ (µ = 1, . . . , m) des Quotienten ff21 (ω) (ω) sind notwendigerweise Nullstellen von f1 (ω). Aus Satz 3.11 entnimmt man dann n ≤ 2m + 1 bei ungeradem n bzw. n ≤ 2m bei geradem n. Damit ist die erstgenannte Behauptung nachgewiesen. ¨ Die zweite Behauptung folgt mit derselben Uberlegung aus Satz 3.12. qed.
3.5.2 Das Determinantenkriterium von A. Hurwitz, die Erkenntnisse von Li` enard-Chipart und die Formel von Orlando Die Routhschen Erkenntnisse haben sich auf dem europ¨aischen Kontinent nicht sogleich verbreitet. Der slowakische Maschinenbauingenieur Aurel Stodola (1859 - 1942, 1892-1929 Professor in Z¨ urich) stieß bei praktischen Regelungsproblemen, insbesondere bei Wasserturbinenanlagen in Davos, auf das Stabilit¨ atsproblem und wendete sich 1894 an einen Mathematikerkollegen an der ETH Z¨ urich, Adolph Hurwitz (1859-1919, geboren in Hildesheim, 1894 1919 Professor in Z¨ urich). Hurwitz kannte den Routhschen Algorithmus ebenfalls nicht, wohl aber die Arbeiten von Sturm, Cauchy und Ch. Hermite. Hurwitz ver¨ offentlichte sein Forschungsergebnis im Jahre 1895 in den Mathematischen Annalen [Hur95]. Dort leitete Hurwitz ein Stabilit¨atskriterium ab, das inhaltlich einem Teilresultat von Routh entspricht, n¨amlich dem Satz 3.9 (regul¨ arer Fall und k = 0). Aus den Koeffizienten des gegebenen Polynoms f (s) = an sn + an−1 sn−1 + · · · + a2 s2 + a1 s + a0 ,
an > 0
(3.15)
3.5 Folgerungen aus den Routhschen Stabilit¨ atsuntersuchungen
141
bildete Hurwitz ein quadratisches Koeffizientenschema in Form der (n, n)Matrix ⎛ ⎞ an−1 an−3 an−5 . . . . . . . . . 0 ⎜ an an−2 an−4 an−6 . . . . . . 0 ⎟ ⎜ ⎟ ⎜ 0 an−1 an−3 an−5 . . . . . . 0 ⎟ ⎜ ⎟ ⎜ .. .. ⎟ = H . .. .. .. (3.16) ⎜ . n . ... ... . ⎟ . . ⎜ ⎟ ⎜ 0 ⎟ 0 . . . . . . a2 a0 0 ⎟ ⎜ ⎝ 0 0 . . . . . . a3 a1 0 ⎠ 0 0 . . . . . . a4 a2 a0 Ihre Hauptabschnittsdeterminanten, die man heute als Hurwitz-Determinanten bezeichnet, sind ∆1 =
an−1 , an−1 an−3 , ∆2 = det an an−2 .. . ⎛ an−1 an−3 an−5 ⎜ an an−2 an−4 ⎜ ⎜ ∆λ = det ⎜ 0 an−1 an−3 ⎜ .. .. .. ⎝ . . .
⎞ . . . an−2λ+1 . . . an−2λ+2 ⎟ ⎟ . . . an−2λ+3 ⎟ ⎟, ⎟ .. .. ⎠ . .
0
an−λ
...
... ...
(3.17)
.. . ∆n =
a0 ∆n−1 (3.18)
Nun k¨ onnen wir das Stabilit¨ atskriterium von Hurwitz w¨ortlich aus [Hur95] u ¨ bernehmen. Satz 3.14 Notwendig und hinreichend daf¨ ur, dass die Gleichung an sn + an−1 sn−1 + · · · + a1 s + a0 = 0,
an > 0
nur Wurzeln mit negativen Realteilen besitzt, ist, dass die Determinanten ∆1 , ∆2 , ∆3 , . . . , ∆n s¨amtlich positiv sind. Beweis: Das Kriterium von Hurwitz kann man beweisen, indem man die Hurwitz sche Koeffizientenmatrix Hn durch Zeilenkombinationen, die die Hauptabschnittsdeterminanten invariant lassen, u uhrt in die obere Dreiecksmatrix ¨berf¨
142
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
⎛
an−1 an−3 an−5 ⎜ 0 bn−2 bn−4 ⎜ ⎜ 0 0 cn−3 ⎜ ⎜ 0 0 0 ⎜ ⎜ .. .. .. ⎝ . . . 0 0 0
⎛ ⎞ rn−1 an−3 an−5 ... ⎜ 0 rn−2 bn−4 ...⎟ ⎜ ⎟ ⎜ 0 0 rn−3 ...⎟ ⎜ ⎟ =: ⎜ 0 ⎟ 0 0 ...⎟ ⎜ ⎜ .. ⎟ .. .. ⎝ . . . ...⎠ . . . a0 0 0 0
an−7 bn−6 cn−5 dn−4 .. .
⎞ ... ...⎟ ⎟ ...⎟ ⎟ . ...⎟ ⎟ ⎟ ...⎠ . . . r0
an−7 bn−6 cn−5 rn−4 .. .
¨ Die Details der elementaren Zeilenumformungen werden dem Leser als Ubungsaufgabe u onnen aber auch in [Gan66], S. 484, nachgeschlagen ¨ berlassen, k¨ werden. Die in der linken Matrix auftretenden Symbole wurden unver¨andert von S. 122 u ¨ bernommen. In der rechten Matrix wurden die Elemente aus der Probespalte im Routhschen Rechenschema neu bezeichnet, um den Zusammenhang mit den Hurwitz -Determinanten besonders einpr¨agsam darstellen zu k¨ onnen: ∆1 = rn−1 ,
∆λ = rn−λ · ∆λ−1 =
λ <
rn−i
f¨ ur
λ = 2, . . . , n.
(3.19)
i=1
Gem¨ aß Satz 3.9 ist das Polynom (3.15) genau dann stabil, wenn in der Routhschen Probespalte die Elemente rn−i f¨ ur alle i = 1, . . . , n positiv sind. Dies ist wegen (3.19) dann und nur dann der Fall, wenn ∆λ > 0 f¨ ur alle λ = 1, . . . , n. qed. Anmerkung 1: Im deutschen Sprachraum ist das Hurwitz -Kriterium popul¨arer als der Routhsche Zugang, obwohl der Routhsche Algorithmus fr¨ uher ver¨offentlicht wurde, eine umfassendere Aussage macht und numerisch einfacher zu handhaben ist. Anmerkung 2: Wie im Routhschen Algorithmus d¨ urfen auch im Hurwitz schen KoeffizientenSchema (3.16) die Polynom-Koeffizienten in umgekehrter Reihenfolge benutzt werden. Anmerkung 3: Ein Polynom f (s) = an sn + an−1 sn−1 + · · · + a1 s + a0 mit an > 0, dessen s¨ amtliche Wurzeln einen negativen Realteil haben, wird Hurwitz-P olynom genannt. Jedes Hurwitz -Polynom erf¨ ullt eine Vorzeichen-Bedingung, die oft als Stodola-Bedingung bezeichnet wird: Die Koeffizienten eines Hurwitz -Polynoms haben u ¨bereinstimmende (positive) Vorzeichen, also aν > 0
f¨ ur ν = 0, 1, . . . , n .
(3.20)
Konsequenz: Reelle Polynome mit Koeffizienten unterschiedlichen Vorzeichens oder einem verschwindenden Koeffizienten sind stets instabil. Anmerkung 4: Bei Polynomgraden n ≤ 2 ist die Stodola-Bedingung bereits hinreichend f¨ ur ¨ die Stabilit¨ at des Polynoms (Ubungsaufgabe).
3.5 Folgerungen aus den Routhschen Stabilit¨ atsuntersuchungen
143
Anmerkung 5: Auf Grund des Zusammenhangs (3.19) zwischen den Elementen der Routhschen Probespalte und den Hurwitz -Determinanten lassen sich alle Aussagen, die mit Elementen der Routhschen Probespalte gemacht werden, auch mit Hurwitz -Determinanten ausdr¨ ucken und umgekehrt. Erinnert sei an die mit (3.9) auf Seite 124 gewonnene Erkenntnis u ¨ber den Zusammenhang zwischen den Vorzeichenwechseln in der Routhschen Probespalte und den Nullstellen mit positivem Realteil. Diese Erkenntnis l¨asst sich auch so formulieren: Satz 3.15 Die Anzahl k der Wurzeln des reellen Polynoms (3.15), die in der offenen rechten Halbebene liegen, kann mit Hilfe der Hurwitz-Determinanten bestimmt werden, ∆2 ∆3 ∆n , ,..., ) ∆1 ∆2 ∆n−1 = VZW(an , ∆1 , ∆3 , . . .) + VZW(1, ∆2 , ∆4 , . . .).
k = VZW(an , ∆1 ,
(3.21)
Beispiel 3.19 Betrachtet werde das Polynom f (s) = s5 +s4 +20s3 +26s2 +64s+25. Aus der Hurwitz -Matrix
H5
a4 a2 5 a3 a4 a5 0 0
a0 = 0
a0 a1 a2 a3 a4
0 0 a0 a1 a2
0 0 0 0 a0
1 26 25 0 64 0 10 201 26 25 = 0 1 20 64
0 0 0 0 0 0 1 26 25
erh¨ alt man die Hurwitz -Determinanten
∆1 = 1,
∆4
∆2 = det
1 26 1 20
= −6,
1 26 25 0 1 20 64 0 = det 0 1 26 25 = −8505,
∆3 = det
1 26 25 1 20 64 0 1 26
= −195,
∆5 = ∆4 · 25 = −212625.
0 1 20 64 Weil die Hurwitz -Determinanten im Vorzeichen nicht u ¨ bereinstimmen, kann das Beispielpolynom kein Hurwitz -Polynom sein. Die Formel (3.21) liefert die Anzahl k der Wurzeln mit positivem Realteil: k = VZW(a5 , ∆1 , ∆3 , ∆5 ) + VZW(1, ∆2 , ∆4 ) = VZW(1; 1; −195; −212675) + VZW(1; −6; −8505) = 1 + 1 = 2.
Wenn das gegebene Polynom (3.15) nur positive Koeffizienten hat, stellen sich zwischen den Hurwitz -Determinanten Abh¨ angigkeiten ein, so dass nicht alle Hurwitz -Determinanten unabh¨ angig voneinander auf ihr Vorzeichen gepr¨ uft
144
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
werden m¨ ussen. Betrachtet man beispielsweise die Hurwitz -Determinanten f¨ ur n = 4, ∆1 = a3 ,
∆2 = a2 a3 − a1 a4 ,
∆3 = a1 ∆2 − a0 a23 ,
∆4 = ∆3 · a0 ,
so erkennt man, dass es gen¨ ugt zu pr¨ ufen, ob ∆3 > 0 wird. Dann sind auch die anderen Determinanten gewiss positiv. Die franz¨ osischen Mathematiker A. Li´enard und M.H. Chipart haben als erste den allgemeinen Fall studiert und Stabilit¨atskriterien ver¨offentlicht [LC14], die statt der Berechnung von n Hurwitz -Determinanten mit nur – grob gesprochen – etwa der H¨ alfte davon auskommen. Von den einschl¨agigen moderneren Forschungsergebnissen soll hier nur eine besonders sch¨one und einpr¨ agsame Aussage aus einem Standardwerk der Matrizentheorie ohne Beweis zitiert werden. Satz 3.16 ([Gan66], S.512) Wenn das reelle Polynom (3.15) nur positive Koeffizienten besitzt und ∆n = a0 ∆n−1 = 0 gilt, so bestimmt sich die Anzahl k der Wurzeln mit positivem Realteil aus der Formel k = 2 · VZW(1, ∆1 , ∆3 , . . .) = 2 · VZW(1, ∆2 , ∆4 , . . .).
(3.22)
Folgerung: Um die Stabilit¨at eines Polynoms (3.15) bei erf¨ ullter StodolaBedingung (3.20) zu pr¨ ufen, gen¨ ugt es festzustellen, ob die Hurwitz-Determinanten mit ungeradem Index ∆1 , ∆3 , . . . oder die Hurwitz-Determinanten mit geradem Index ∆2 , ∆4 , . . . positiv sind. Beispiel 3.20 Da das Polynom aus Beispiel 3.19 nur positive Koeffizienten besitzt, gen¨ ugt es, die Hurwitz -Determinanten ∆2 und ∆4 zu berechnen, um mit (3.22) die Anzahl k der Nullstellen mit positivem Realteil zu bestimmen: k = 2 · VZW(1, ∆2 , ∆4 ) = 2 · VZW(1; −6; −8505) = 2.
Die Zeilen der Hurwitz -Matrix Hn lassen sich nach einer Empfehlung von E.I. Jury so umzustellen, dass die Folge jeder zweiten Hurwitz -Determinante durch die Berechnung von inneren“ Minoren systematisch gebildet werden ” kann [Jur74]. Es mag gen¨ ugen, den Gedanken f¨ ur n = 6 und n = 7 zu exemplifizieren. In der durch Zeilentausch aus H6 hervorgehenden Matrix ⎛ ⎞ a5 a 3 a 1 0 0 0 ⎜ 0 a5 a3 a1 0 0 ⎟ ⎜ ⎟ ⎜ ⎟ =6 = ⎜ 0 0 a5 a3 a1 0 ⎟ , (3.23) H ⎜ 0 0 a6 a4 a2 a0 ⎟ ⎜ ⎟ ⎝ 0 a6 a4 a2 a0 0 ⎠ a6 a4 a2 a0 0 0 wurden die inneren Minoren
3.5 Folgerungen aus den Routhschen Stabilit¨ atsuntersuchungen
∆2 = det
a5 a3 a6 a4
⎛
a5 a 3 ⎜ 0 a5 und ∆4 = det ⎜ ⎝ 0 a6 a6 a4
a1 a3 a4 a2
145
⎞
0 a1 ⎟ ⎟ a2 ⎠ a0
durch Rahmung markiert. Die durch Zeilentausch aus H7 hervorgehende Matrix ⎞ ⎛ a7 a5 a3 a1 0 0 0 ⎜ 0 a7 a5 a3 a1 0 0 ⎟ ⎟ ⎜ ⎜ 0 0 a7 a5 a3 a1 0 ⎟ ⎟ ⎜ =7 = ⎜ 0 0 0 a6 a4 a2 a0 ⎟ H ⎟ ⎜ ⎜ 0 0 a6 a4 a2 a0 0 ⎟ ⎟ ⎜ ⎝ 0 a6 a4 a2 a0 0 0 ⎠ a6 a4 a2 a0 0 0 0
(3.24)
enth¨ alt die inneren Minoren ⎛
∆1 = a6 ,
⎞
a7 a 5 a 3 ∆3 = det ⎝ 0 a6 a4 ⎠ a6 a4 a2
⎛
a7 ⎜0 ⎜ und ∆5 = det ⎜ ⎜0 ⎝0 a6
a5 a7 0 a6 a4
a3 a5 a6 a4 a2
a1 a3 a4 a2 a0
⎞ 0 a1 ⎟ ⎟ a2 ⎟ ⎟. a0 ⎠ 0
Ein stabiles reelles Polynom besitzt notwendigerweise Koeffizienten mit u ¨ bereinstimmendem (positiven) Vorzeichen, vgl. Anmerkung 3 auf Seite 142. Sollte trotz erf¨ ullter Stodola-Bedingung die Hurwitz -Determinante ∆n−1 des Polynoms verschwinden, so ist das fragliche Polynom gewiss instabil. Das folgt aus dem Routhschen Stabilit¨ atskriterium in Verbindung mit (3.19). Es erscheint daher lohnend, die Struktur der Hurwitz -Determinante ∆n−1 genauer zu betrachten. Die Gestalt der Matrizen (3.23) und (3.24) verdeutlicht eine allgemeine Tatsache: Die Hurwitz -Determinante ∆n−1 kann stets mittels Zeilenumstellungen auf die aus Abschnitt 3.3.2 vertraute Gestalt einer Resultante zweier Polynome gebracht werden. Jedes Polynom (3.15) l¨ asst sich in der Form f (s) = h(s2 ) + s · g(s2 ) schreiben. Die Hurwitz -Determinante ∆n−1 von f (s) stimmt dann – abgesehen vom Vorzeichen – mit der Resultante der beiden Polynome h(s2 ) und g(s2 ) u ¨ berein, |∆n−1 | = |R(h, g)|. Beispiel 3.21 F¨ur den Polynomgrad n = 5 erh¨alt man
(3.25)
146
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen f (s) = a5 s5 + a4 s4 + a3 s3 + a2 s2 + a1 s + a0 = [a4 (s2 )2 + a2 (s2 ) + a0 ] + s · [a5 (s2 )2 + a3 (s2 ) + a1 ] h(s2 )
=
s · g(s2 ).
+
Gem¨ aß Abschnitt 3.3.2 ermittelt man die Resultante der Polynome h(s2 ) und g(s2 ) aus a4 a2 a0 0 0 a4 a2 a0 . R(h, g) = det a5 a3 a1 0 0 a5 a3 a1
Andererseits entnimmt man der Definition der Hurwitz -Determinanten f¨ ur Polynome f (s) vom Grade n = 5:
∆4 = det
a4 a5 0 0
a2 a3 a4 a5
a0 a1 a2 a3
0 0 a0 a1
.
Die Behauptung (3.25) wird offensichtlich erf¨ ullt.
Die Resultante zweier Polynome verschwindet genau dann, wenn beide Polynome eine gemeinsame Nullstelle besitzen. Dieser Sachverhalt wurde im Abschnitt 3.3.2 en detail besprochen. Weil hier h und g Polynome in s2 sind, muss mit jeder Nullstelle s von h(s2 ) und g(s2 ) zugleich auch − s Nullstelle von h(s2 ) und g(s2 ) sein. Die gemeinsamen Nullstellen von h(s2 ) und g(s2 ) sind diejenigen Nullstellen s von f (s) = h(s2 ) + s · g(s2 ), f¨ ur die sowohl f ( s) = 0 als auch f (− s) = 0 gilt. Anders gesagt: Die Hurwitz -Determinante ∆n−1 zum Polynom f (s) verschwindet genau dann, wenn das Polynom f (s) zwei Nullstellen s1 und s2 mit der Eigenschaft s1 + s2 = 0 besitzt. Bezeichnet man die Wurzeln des Polynoms f (s) mit s1 , s2 , . . . , sn , so kann weiter gefolgert werden, dass die Hurwitz -Determinante ∆n−1 durch das Produkt n ν−1 < < (sν + sµ ) ν=2 µ=1
teilbar ist. Der hier skizzierte Zusammenhang hat schon 1911 mit der ber¨ uhmten Formel von L. Orlando seine endg¨ ultige mathematische Fassung gefunden. Satz 3.17 [Orl11] F¨ ur die Hurwitz-Determinante ∆n−1 zum Polynom n
f (s) = an s + an−1 s
n−1
+ · · · + a 2 s + a 1 s + a0 = a n 2
n <
(s − sλ ),
an > 0
λ=1
gilt ∆n−1 = (−1)
n(n−1) 2
an−1 n
n ν−1 < <
(sν + sµ ).
ν=2 µ=1
(3.26)
3.5 Folgerungen aus den Routhschen Stabilit¨ atsuntersuchungen
147
Beweis: Die Formel (3.26) von Orlando kann mit dem mathematischen Werkzeug der vollst¨ andigen Induktion verifiziert werden. F¨ ur n = 2 wird f (s) = a2 s2 + a1 s + a0 = a2 (s − s1 )(s − s2 ) und wegen ∆n−1 = ∆1 = a1 = (−1)1 a2 (s2 + s1 ) der Gleichung (3.26) Gen¨ uge getan. Es wird nun angenommen, die Formel (3.26) trifft f¨ ur eine beliebige Gradzahl n ∈ N zu, und es bleibt zu zeigen, dass unter dieser Annahme die fragliche Beziehung (3.26) auch f¨ ur die Nachfolgerzahl n + 1 erf¨ ullt wird. F¨ ur das Polynom (n + 1)−ten Grades machen wir den Ansatz f(s) = (s + s0 ) · f (s) = (s + s0 ) · (an sn + an−1 sn−1 + · · · + a2 s2 + a1 s + a0 ) = an sn+1 +(an−1 +s0 an )sn +. . .+(a1 +s0 a2 )s2 +(a0 +s0 a1 )s+s0 a0 Die Nullstellen von f(s) sind die Nullstellen s1 , . . . , sn von f (s), vermehrt um die zus¨ atzliche Nullstelle sn+1 := −s0 . Zwischen den Hurwitz -Determinanten von f(s) und f (s) besteht der einpr¨ agsame Zusammenhang (n+1)−1 = ∆n−1 · f (s0 ), ∆
(3.27)
dessen Beweis zun¨ achst noch zur¨ uckgestellt wird. Unter Verwendung der Induktionsannahme (3.26) kann man aus (3.27) folgern: n < (n+1)−1 = ∆n−1 · an ∆ (s0 − sλ ) λ=1
= (−1)
n(n−1) 2
an−1 n
n ν−1 < <
(sν + sµ ) · an
ν=2 µ=1
= (−1)
n(n−1) +n 2
· an−1+1 n
(n+1)n 2
an(n+1)−1
n ν−1 < <
n+1 < ν−1 <
(s0 − sλ )
λ=1
(sν + sµ )
ν=2 µ=1
= (−1)
n <
n <
(sn+1 + sλ )
λ=1
(sν + sµ ).
ν=2 µ=1
Damit ist der gew¨ unschte Induktionschluss gegl¨ uckt. Der rechnerische Nachweis der Beziehung (3.27) gelingt mit ein wenig aufwendigen, aber doch elementaren Determinantenumformungen, die hier im Kleindruck nachgetragen werden. Wir starten mit einer Hilfsdeterminante D der Ordnung n + 1, die aus der Huranderung mit einer witz -Determinante ∆n des Polynoms f (s) durch R¨ (n + 1)−ten Spalte und einer (n + 1)−ten Zeile hervorgeht:
148
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
D = det
an−1 an 0 0 .. . 0 0 0 0
an−3 an−2 an−1 an .. . 0 0 0 0
an−5 an−4 an−3 an−2 .. . ... ... ... ...
an−7 an−6 an−5 an−4 .. . ... ... ... ...
... ... ... ...
... ... ... ...
... a4 a5 a6 a7
... a2 a3 a4 a5
0 0 0 0 .. . a0 a1 a2 a3
0 sn 0 0 −sn−1 0 0 sn−2 0 0 −sn−3 0 .. .. . . n−3 3 0 (−1) s0 0 (−1)n−2 s20 a0 (−1)n−1 s0 a1 (−1)n
.
Durch Multiplikation der ersten Zeile mit an wird auch D mit dem Faktor an multipliziert. Nun f¨ ugen wir zur ersten Zeile Linearkombinationen der zweiten, dritten,..., (n + 1)−ten Zeile hinzu. Dadurch wird der Wert der Determinante nicht ber¨ uhrt. Wenn als Linearfaktoren −an−1 f¨ ur die zweite Zeile, an−2 f¨ ur die dritte ur die (ν + 1)−te Zeile (ν = 3, . . . , n) gew¨ ahlt werden, so werden Zeile, (−1)ν an−ν f¨ alle Elemente der ersten Zeile zum Verschwinden gebracht, mit Ausnahme des letzten Elements, das f (s0 ) ergibt: 0 0 0 ... ... ... 0 0 f (s0 ) an an−2 an−4 an−6 . . . . . . 0 0 −sn−1 0 0 an−1 an−3 an−5 . . . . . . 0 0 sn−2 0 0 an an−2 an−4 . . . . . . 0 0 −sn−3 0 . .. . . . . . .. .. .. . . . . . . . . .. .. an · D = det . 0 0 . . . . . . a4 a2 a0 0 (−1)n−3 s30 0 0 . . . . . . a5 a3 a1 0 (−1)n−2 s20 0 0 . . . . . . a6 a4 a2 a0 (−1)n−1 s0 0 0 . . . . . . a7 a5 a3 a1 (−1)n
=(−1)n f (s0 ) · an
· det
an−1 an .. . 0 0 0
an−3 an−2 .. . ... ... ...
an−5 an−4 .. . ... ... ...
... ... 0 0 ... ... 0 0 . . . . . . . . .. .. a 5 a3 a1 0 a 6 a4 a2 a0 a 7 a5 a3 a1
=(−1)n f (s0 ) · an · ∆n−1 . Wenn man andererseits zu jeder Zeile (außer der letzten) von D die mit s0 multiplizierte folgende Zeile addiert, so erh¨ alt man an−1 + s0 an an−3 + s0 an−2 . . . 0 0 0 an an−2 + s0 an−1 . . . 0 0 0 0 0 0 0 an−1 + s0 an . . . .. .. .. . . .. .. D = det . . . s0 a 0 0 0 0 . . . a 1 + s0 a 2 0 0 0 . . . a 2 + s0 a 3 a 0 + s0 a 1 0 0 ... a3 a1 (−1)n
= (−1)n ∆(n+1)−1 . Der Vergleich liefert die zu verifizierende Beziehung (3.27).
qed.
3.5 Folgerungen aus den Routhschen Stabilit¨ atsuntersuchungen
149
3.5.3 Die Stabilit¨ atskriterien von Michailov, Leonhard-Cremer und Hermite-Biehler In diesem Abschnitt geht es um zwei Interpretationsm¨oglichkeiten der an das Routhsche Stabilit¨ atskriterium angeschlossenen Bemerkung 2 (auf S. 125). In Unkenntnis der Routhschen Originalarbeit wurden sie sp¨ater erneut entdeckt, von dem Russen A. Michailov (1938) und den Deutschen A. Leonhard (1944) und L. Cremer (1947), siehe [Mic38], [Leo44], [Cre47]. Wegen ihrer großen Anschaulichkeit wollen wir hier eine einfache direkte Herleitung des Ortskurvenkriteriums und des L¨ uckenkriteriums f¨ ur Polynome notieren. Das gegebene Polynom laute f (s) = an sn + an−1 sn−1 + · · · + a2 s2 + a1 s + a0 = an
n < (s − si ). i=1
Der zugeh¨ orende Frequenzgang ergibt sich zu f (jω) = (a0 − a2 ω 2 + a4 ω 4 − + . . . ) + j(a1 ω − a3 ω 3 + a5 ω 5 − + . . . ) n n < (jω − si ) = |f (jω)| exp j arc(jω − si ) = an i=1
= |f (jω)| exp j
n
i=1
ϕi (ω) = |f (jω)| exp jΦ(ω)
i=1
= |f (jω)| cos Φ(ω) + j sin Φ(ω) =: X(ω) + jY (ω) . jω j ω0
ϕ2 (ω0 ) s2
ϕ3 (ω0 ) s3 ϕ1 (ω0 )
s1 Bild 3.9. Winkel Φ(ω0 ) =
ϕ (ω ), −∞ < ω n i
0
σ
0
< ∞, in der komplexen Ebene
i
Aus Bild 3.9 ist zu erkennen, dass jede Nullstelle si in der linken Halbebene bei Durchlaufen der Frequenz ω von −∞ nach +∞ eine Winkel¨anderung von π bewirkt. Aus Symmetriegr¨ unden gen¨ ugt bei der Auswertung die Betrachtung des Frequenzganges im Bereich 0 ≤ ω < ∞. Der Startpunkt der
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
150
Ortskurve ist stets bekannt; denn f¨ ur ω = 0 wird f (j0) = a0 = 0. Der Verlauf von f (jω) f¨ ur ω > 0 l¨ asst sich qualitativ ohne jede Schwierigkeit diskutieren. Satz 3.18 (Kriterium von Michailov, Leonhard, Cremer) Das Polynom f (s) hat genau dann nur Nullstellen mit negativem Realteil, wenn die Ortskurve f (jω) in der f (s)-Ebene f¨ ur 0 ≤ ω < ∞ den Nullpunkt derart umschlingt, dass der Winkel Φ(ω) = arcf (jω) den Bereich 0 . . . n π2 monoton im mathematisch positiven Drehsinn u ¨berstreicht.
6
Im f (jω) = Y (ω)
4
ω
2
f (jω ∗ )
0
−2
−4
−2
−1.5
−1
−0.5
0 0.5 Re f (jω) = X(ω)
1
1.5
2
Bild 3.10. Beispiel zum Michailov-Leonhard-Cremer-Kriterium. F¨ ur ω ∗ = 0.2 ∗ wurde der Ortsvektor f (jω ) ins Bild eingetragen
Bezogen auf die reellen Funktionen X(ω) und Y (ω) l¨asst sich der gleiche Sachverhalt als L¨ uckenkriterium formulieren: Satz 3.19 (L¨ uckenkriterium) Das Polynom f (s) hat genau dann nur Nullstellen mit negativem Realteil, wenn die Gleichungen X(ω) = 0 und Y (ω) = 0 f¨ ur 0 ≤ ω < ∞ zusammen n reelle Nullstellen haben und sich die Nulldurchg¨ange von X(ω) und die Nulldurchg¨ange von Y (ω) gegenseitig trennen.
3.5 Folgerungen aus den Routhschen Stabilit¨ atsuntersuchungen
151
Beispiel 3.22 Gegebenes Polynom: f (s) = s6 + 3s5 + 5s4 + 12s3 + 6s2 + 9s + 1.
Die zugeh¨ orende Ortskurve f (jω) = 1 − 6ω 2 + 5ω 4 − ω 6 + j 9ω − 12ω 3 + 3ω 5 besitzt einen Realteil X(ω) = 1 − 6ω 2 + 5ω 4 − ω 6 und einen Imagin¨ arteil Y (ω) = ω 9 − 12ω 2 + 3ω 4 = 3ω · ω 2 − 1 · ω 2 − 3 . Die Bilder 3.10 und 3.11 veranschaulichen die Funktionsverl¨ aufe f¨ ur dieses Beispiel.
10
8
6
Y (ω)
X(ω), Y (ω)
4
2
0
X(ω)
−2
−4
−6
−8
−10
0
0.5
1
1.5
2
2.5
ω
Bild 3.11. Beispielhafte Erl¨ auterung zum L¨ uckenkriterium
Mitunter trifft man auf vereinfachte Formulierungen des L¨ uckenkriteriums folgender Art: Das Polynom f (s) hat genau dann nur Nullstellen mit negativem Realteil, wenn sich die reellen Nullstellen von X(ω) und Y (ω) gegenseitig trennen (sog. interlacing property“). Diese Aussage ist so nicht richtig. ” Beispiel 3.23 Das Polynom f (s) = s6 + s5 + 6s4 + 8s3 + 9s2 + 15s + 4 besitzt einen Realteil X(ω) = 4 − 9ω 2 + 6ω 4 − ω 6 mit den nichtnegativen reellen Nullstellen ω1X = 1 und ω2X = 2 und einen Imagin¨ arteil Y (ω) = ω 15 − 8ω 2 + ω 4 √ √ mit den nichtnegativen reellen Nullstellen ω1Y = 0, ω2Y = 3 und ω2Y = 5.
152
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
Das Beispielpolynom ist jedoch instabil; vier Nullstellen liegen in der offenen rechten Halbebene und zwei in der offenen linken Halbebene.
In der neueren Forschungsliteratur u ¨ ber robuste Regelungstheorie, siehe [Ack02] und [DHB00], wird das L¨ uckenkriterium oft als Theorem von Hermite-Biehler bezeichnet. Eine Rechtfertigung dieser Namensgebung findet sich in der mathematischen Spezialliteratur der 1930er Jahre ([KN81]). Dort wird bereits von einem Hermite-Biehler -Theorem gesprochen, unter Bezugnahme auf einen Aufsatz von Hermite [Her79] und einen Aufsatz von Biehler [Bie79], die beide 1879 ver¨ offentlicht worden sind. Wissenschaftshistorischer Kommentar An dieser Stelle gebietet die wissenschaftliche Redlichkeit zu gestehen, dass die Behandlung des Stabilit¨ atsproblems, bei der wir der von Edward J. Routh gelegten F¨ ahrte gefolgt sind, mit gutem Recht auch mit Charles Hermite als Bahnbrecher h¨ atte beginnen k¨ onnen. Schon ein Vierteljahrhundert vor Routh hatte n¨ amlich Hermite die Frage gestellt und gel¨ost, unter welchen notwendigen und hinreichenden Bedingungen die Wurzeln eines Polynoms aus C[s], also sogar mit komplexen Koeffizienten!, in einer komplexen Halbebene liegen [Her56]. Diese schwer lesbare Arbeit von Hermite geriet keineswegs in Ver¨ gessenheit. Hermites Uberlegungen wurden sp¨ater in verst¨andlicherer Form ver¨ offentlicht [Fuj26] und boten die Basis f¨ ur neue mathematische Forschungen in einem umfassenderen Rahmen [KN81]. Einfachere Versionen wurden auch f¨ ur Ingenieure aufbereitet. Zum Beispiel entstand Schmeidler s Monographie [Sch49] aus Fortbildungsveranstaltungen, die der Verein Deutscher Elektroingenieure 1942 in Berlin anbot. In den Transactions on Automatic Control wird immer wieder einmal Bezug auf das Hermitesche Kriterium genommen, z.B. [And72]. Der Autor dieses Buches hat eine Zeitlang den Hermiteschen Zugang favorisiert und daf¨ ur auch bei den Fachkollegen geworben [Rei94]. Dann hat er sich jedoch in der Lehre f¨ ur den Routhschen Weg entschieden. Routh betrachtete zwar das mathematisch engere Problem der Polynome in R[s], und nicht in C[s] wie Hermite und die ihm nachfolgenden Mathematiker, doch das regelungstechnische Stabilit¨ atsproblem entsteht nun einmal nur f¨ ur Polynome in R[s]. Außerdem haben sich die Routhschen Beweisgedanken auch bei der Beantwortung weiter reichender Fragen, insbesondere bei der Ber¨ ucksichtigung von Parameterunbestimmtheiten der Koeffizienten, als tragf¨ ahig erwiesen.
3.6 Stabilit¨ at von Polynomen mit unbestimmten Koeffizienten
153
3.6 Stabilit¨ at von Polynomen mit unbestimmten Koeffizienten 3.6.1 Stabilit¨ at von Intervallpolynomen: Kriterium von Charitonov Die Koeffizienten des zu untersuchenden Polynoms sind oft nicht als exakte Zahlenwerte bekannt. Herstellungstoleranzen der verwendeten Bauelemente, Alterungseffekte und Abh¨ angigkeiten von ¨ außeren Einflussgr¨oßen (Temperatur, Druck, Feuchtigkeit u. a.) im praktischen Einsatz lassen es oft realit¨ atsn¨ aher erscheinen, die Koeffizienten des Polynoms als Zahlenintervalle anzusetzen. F¨ ur das Intervallpolynom f (s) =: P (s) gelte folgender Ansatz: P (s) =
n
ak sk , wobei 0 < ak ≤ ak ≤ ak
f¨ ur k = 0, 1, 2, . . . , n.
(3.28)
k=0
urfen beliebige Werte aus den angegebenen Intervallen Die Koeffizienten ak d¨ annehmen. Eine notwendige Bedingung f¨ ur Stabilit¨at ist, dass alle Koeffizienten gleiches Vorzeichen besitzen (hier positiv angenommen). Daher darf man ohne weiteres voraussetzen, dass die Koeffizienten-Intervalle den Wert Null nicht enthalten. Entsprechend dem Grundgedanken von Routh werden der gerade und der ungerade Teil des Polynoms separiert: P (s) = a0 + a2 s2 + a4 s4 + . . . + a1 s + a3 s3 + a5 s5 + . . . " #$ % " #$ % gerade (even)
ungerade (odd)
P (jω) = a0 − a2 ω 2 + a4 ω 4 ∓ . . . + j a1 ω − a3 ω 3 + a5 s5 ∓ . . . " #$ % " #$ % =:P E (ω)
=:jP O (ω)
Wie wirken sich die Schwankungen der Koeffizienten auf P E und P O aus? Realteil: obere Absch¨ atzung:
E
P E (ω) ≤ a0 − a2 ω 2 + a4 ω 4 − a6 ω 6 ± · · · =: P (ω)
untere Absch¨ atzung: P E (ω) ≥ a0 − a2 ω 2 + a4 ω 4 − a6 ω 6 ± · · · =: P E (ω) Imagin¨ arteil: obere Absch¨ atzung:
O
P O (ω) ≤ a1 ω − a3 ω 3 + a5 ω 5 − a7 ω 7 ± · · · =: P (ω)
untere Absch¨ atzung: P O (ω) ≥ a1 ω − a3 ω 3 + a5 ω 5 − a7 ω 7 ± · · · =: P O (ω)
154
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
F¨ ur einen festgehaltenen Wert ω = ω > 0 gelten die Ungleichungen E
P E ( ω ) ≤ P E ( ω) ≤ P ( ω ), O
P O ( ω ) ≤ P O ( ω ) ≤ P ( ω) . Diese Ungleichungen lassen sich geometrisch in der komplexen Zahlenebene interpretieren. Bei festgehaltenem ω = ω bildet die Gesamtheit aller Werte der Intervallpolynome ein achsenparalleles Rechteck in der komplexen Zahlenebene. Dessen vier Eckpunkte ergeben sich zu E
O
O
E
P ( ω ) + jP ( ω ), P E ( ω ) + jP ( ω ), P E ( ω ) + jP O ( ω ), P ( ω ) + jP O ( ω ). Wenn ω den Wertebereich 0 ≤ ω < +∞ durchl¨auft, so k¨onnen sich Ort, L¨ ange und Breite des Rechtecks in Abh¨ angigkeit von der jeweiligen Frequenz ω ¨ andern, jeder Eckpunkt bleibt jedoch Eckpunkt. Mit Hilfe des Stabilit¨ atskriteriums von Michailov-Leonhard-Cremer kann man nun unmittelbar auf ein Stabilit¨ atskriterium f¨ ur das Intervallpolynom schließen: Wenn ω von Null bis Unendlich l¨ auft, muss jeder der vier Eckpunkt-Ortsvektoren des frequenzabh¨ angigen achsenparallelen Rechtecks den Nullpunkt der P (s)-Ebene derart umfahren, dass sein Argument monoton von Null auf π achst. 2 n anw¨ Satz 3.20 (Stabilit¨ atskriterium f¨ ur Intervallpolynome) Alle m¨oglichen Realisierungen des Intervallpolynoms (3.28) sind genau dann stabil, wenn die vier “Eck-Polynome” P 1 (s) = P E (s) + P O (s), O
P 2 (s) = P E (s) + P (s), E
P 3 (s) = P (s) + P O (s), E
O
P 4 (s) = P (s) + P (s) stabil sind [Kha78]. Anmerkung: Bei der Anwendung des Satzes 3.20 spielt es keine Rolle, welches Verfahren zur Stabilit¨ atspr¨ ufung der vier Eckpolynome herangezogen wird. Beispiel 3.24 Gefragt wird, ob alle denkbaren Realisierungen des Intervallpolynoms P (s) = [1; 2] + [6; 8]s + [5; 7]s2 + [2; 3]s3 + s4 stabil sind. Die vier auf Stabilit¨ at zu pr¨ ufenden Eckpolynome lauten
3.6 Stabilit¨ at von Polynomen mit unbestimmten Koeffizienten
155
10
P4
P2
Im P (jω)
5
0
P3 −5
−10
P1 −15
−20 −20
−15
−10
−5
0
5
Re P (jω) Bild 3.12. Beispiel zum Stabilit¨ atstest nach Charitonov P 1 (s) = 1 + 6s + 7s2 + 3s3 + s4 , P 2 (s) = 1 + 8s + 7s2 + 2s3 + s4 , P 3 (s) = 2 + 6s + 5s2 + 3s3 + s4 , P 4 (s) = 2 + 8s + 5s2 + 2s3 + s4 . Die zugeh¨ orenden vier Ortskurven sind im Bild 3.12 dargestellt worden, weil wir der Anschaulichkeit halber hier das Ortskurvenkriterium von Michailov-LeonhardCremer benutzen wollen. F¨ ur zwei Frequenzpunkte wurden die Rechtecke mit den Eckpunkten P 1 (jω), P 2 (jω), P 3 (jω), P 4 (jω) eingetragen. Ersichtlich sind alle denkbaren Realisierungen des Intervallpolynoms stabil, da jedes der vier Eckpolynome das Stabilit¨ atskriterium von Michailov-Leonhard-Cremer erf¨ ullt.
3.6.2 Stabilit¨ at von Polynomen mit parameterabh¨ angigen Koeffizienten Die Annahme des vorangehenden Abschnitts 3.6.1– die Polynomkoeffizienten nehmen unabh¨ angig voneinander Werte aus vorgegebenen Intervallen an – d¨ urfte aus der Sicht der regelungstechnischen Praxis nur selten als gerechtfertigt erscheinen. Vielmehr handelt es sich bei Polynomen mit unbestimmten
156
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
Koeffizienten meist um Familien von Polynomen n-ter Ordnung, deren Koeffizienten von l reellen Parametern p1 , p2 , ..., pl abh¨angen. Im Folgenden gehen wir davon aus, dass der Parametervektor p = (p1 , p2 , ..., pl )T in einem konvexen Gebiet P ⊂ Rl liegt. Stammen die einzelnen Parameter beispielsweise jeweils aus einem Intervall endlicher L¨ange, so stellt P einen l-dimensionalen achsenparallelen (Hyper)-Quader dar. Jedes Polynom f (s, p) = an (p)sn + an−1 (p)sn−1 + ... + a1 (p)s + a0 (p) aus der Familie F (s, P) = {f (s, p) : p ∈ P ⊂ Rl }
(3.29)
hat n Nullstellen. Liegen diese n Nullstellen ausnahmslos in der offenen linken Halbebene, so handelt es sich um ein stabiles Polynom. Die Gesamtheit der Nullstellen aller Polynome der Familie bildet eine Nullstellen-Menge N S[F (s, P)] = {sz ∈ C : f (sz , p) = 0 f¨ ur ein f (s, p) ∈ F (s, P)}
(3.30)
Die Polynom-Familie F (s, P) heißt robust stabil (vgl. [Ack93]), falls die Nullstellen-Menge N S[F (s, P)] in der offenen linken Halbebene enthalten ist. ∈ P geh¨orende NominalpolyDas zu einem nominalen Parametersatz p nom n n ν ) = f (s) = f (s, p aν ( p) · s = a ν · sν ν=0
ν=0
sei stabil. Dann haben die Koeffizienten aν notwendigerweise u ¨ bereinstimmende Vorzeichen (Stodola-Bedingung, vgl. S.142). O.B.d.A darf man aν > 0 f¨ ur ν = 0, 1, ..., n annehmen. Daraus ergibt sich sogleich eine notwendige Bedingung f¨ ur die robuste Stabilit¨ at der Polynom-Familie: aν (p) > 0
f¨ ur alle
p ∈ P und ν = 0, 1, ..., n.
(3.31)
Falls sich ein p ∈ P derart finden l¨ aßt, dass einer der Koeffizienten aν (p) ≤ 0 wird, so kann die Polynom-Familie nicht robust stabil sein. Aus den n + 1 Ungleichungen (3.31) lassen sich ¨ außere Einschließungsbereiche eines Parametervariationsbereichs Pstabil , f¨ ur den die Polynom-Familie F (s, Pstabil ) robust stabil ist, ermitteln. Bei einer affinen Parameterabh¨angigkeit aν (p) = aν +
l
+ aνλ pλ mit aνλ ≥ 0, pλ ∈ (p− λ ; pλ )
λ=1
erh¨ alt man aus (3.31) n + 1 Ungleichungsbedingungen, die die unteren Intervallgrenzen p− ur λ = 1, ..., l zu erf¨ ullen haben: λ f¨ l λ=1
aνλ p− aν f¨ ur ν = 0, 1, ..., n. λ > −
3.6 Stabilit¨ at von Polynomen mit unbestimmten Koeffizienten
157
3.6.2.1 Die Wurzelorte von Polynomen, die affin von einem reellen Parameter abh¨ angen Um eine genauere Vorstellung von der Abh¨ angigkeit der Nullstellenlagen von Parametervariationen zu bekommen, betrachten wir den wichtigen Spezialfall, bei dem die Polynomkoeffizienten affin von nur einem einzigen skalaren Parameter abh¨ angen: aν (p) = a1ν + pa2ν
f¨ ur
ν = 0, 1, ..., n,
oder, anders ausgedr¨ uckt, f (s, p) = f 1 (s) + pf 2 (s)
f¨ ur
p ∈ R1
Mit p → −∞ n¨ ahern sich Nullstellen von f (s, p) den Nullstellen des Polynoms f 2 (s); bei p = 0 stimmen die Nullstellen von f (s, p) mit den Nullstellen des Polynoms f 1 (s) u ¨berein; mit p → ∞ erfolgt wieder eine Ann¨aherung an die Nullstellen von f 2 (s). Das Studium der Abh¨ angigkeiten der Nullstellen vom Parameter p geh¨ort seit den 1950er Jahren zu den Ausbildungsstandards in Regelungstheorie. Seinerzeit hat sich in diesem Zusammenhang die Bezeichnung Wurzelorts” ¨ kurven“ (WOK) eingeb¨ urgert, als direkte Ubersetzung des englischen Terminus root locus“ = Wurzelort. Urspr¨ unglich wurde nach der Stabilit¨at des ” Standardregelkreises gem¨ aß Bild 3.13 in Abh¨ angigkeit von einer konstanten Reglerverst¨ arkung k > 0 gefragt. z r
e
v
k
u
P (s)
y
Bild 3.13. Standardregelkreis mit konstanter Reglerverst¨ arkung
Bei einer Strecken¨ ubertragungsfunktion m 8
P (s) =
bm µ=1 Z(s) = · n N (s) an 8
s − s0µ
;
(s − s∞ ν )
m ≤ n,
bm >0, an
ν=1
wird der Regelkreis genau dann stabil, wenn alle Nullstellen (= Wurzeln) des charakteristischen Polynoms N (s) + k · Z(s) negative Realteile haben.
158
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
Definition 3.3. Die Wurzelortskurve ist der geometrische Ort aller Wurzeln der charakteristischen Gleichung N (s) + k · Z(s) = 0,
(3.32)
die in Abh¨angigkeit vom Parameter k (k > 0) in der s-Ebene aufgezeichnet werden k¨onnen. Der Verlauf der Wurzelorte in Abh¨ angigkeit von der Verst¨arkung k l¨aßt sich qualitativ auch ohne Rechner ermitteln. Diese Aufgabe wurde erstmalig 1948 von W. R. Evans bearbeitet [Eva48]. Heute kann man die Wurzelortskurven rechnergest¨ utzt zeichnen, z.B. mit Hilfe der MATLAB-Control-SystemToolbox. Trotzdem bleibt es f¨ ur den angehenden Regelungsingenieur lohnenswert, die folgenden Konstruktionsregeln f¨ ur Wurzelortskurven zu durchdenken. Die Wurzelorte gen¨ ugen (3.32) oder, gleichwertig, −1 = k · P (s) = k · |P (s)| exp [jarc (P (s))] (3.33) > m 7? n 0 ∞ = k · |P (s)| · exp j arc(s − sµ ) − arc(s − sν ) . µ=1
ν=1
Daraus folgen die Gleichungen (Phasengleichheit in (3.33)) m µ=1
arc(s − s0µ ) −
n
arc(s − s∞ ν ) = (2 λ + 1) · π
f¨ ur
λ = 0, ±1, ∓2, . . .
ν=1
(3.34) und, wenn man k > 0 voraussetzt, die Bezifferungsgleichung“ (Betragsgleichheit in (3.33)) ” k=
|N (s)| 1 = . |Z(s)| |P (s)|
Konstruktionsregeln f¨ ur Wurzelortskurven (WOK) unter den Annahmen k ≥ 0 und grad Z(s) ≤ grad N (s) 1. Die Wurzelorte liegen symmetrisch zur reellen Achse. 2. Auf der reellen Achse geh¨ oren alle Punkte links von einer ungeraden Anzahl an reellen Polen und Nullstellen zu einem WOK-Abschnitt. 3. Die Wurzelorte beginnen f¨ ur k = 0 in den Polen von P (s). 4. Die Wurzelorte enden f¨ ur k → ∞ in den Nullstellen von P (s); hat die ¨ Ubertragungsfunktion P (s) n Pole und m Nullstellen im Endlichen, so enden n − m Abschnitte der WOK im Unendlichen. 5. Aus einem l-fachen Pol s∞ ucke aus, und zwar unter den i treten l WOK-St¨ Austrittswinkeln
3.6 Stabilit¨ at von Polynomen mit unbestimmten Koeffizienten
ϕiλ =
159
⎤
⎡
m 1⎢ ⎥ ∞ 0 arc (s∞ arc s∞ ⎣− i − sν ) + i − sµ + (2λ + 1)π ⎦ l ν µ=1 ∞ s∞ ν =si
f¨ ur λ = 0, 1, · · · , l − 1. 6. In einer l-fachen Nullstelle s0i m¨ unden l WOK-St¨ ucke, und zwar unter den Eintrittswinkeln ⎤ ⎡ n 1⎢ ⎥ ϕiλ = ⎣− + (2λ + 1)π ⎦ arc s0i − s0µ + arc s0i − s∞ ν l µ ν=1 0 s0 µ =si
f¨ ur λ = 0, 1, · · · , l − 1. 7. Die Asymptoten der n − m ins Unendliche strebenden WOK-Abschnitte sind Geraden, die sich im Punkte > n ? m 1 ∞ 0 σ0 = Re sν − Re sµ unter den Winkeln n − m ν=1 µ=1 2λ + 1 ·π (λ = 0, 1, · · · , n − m − 1) n−m auf der reellen Achse schneiden. 8. Die (von Polen und Nullstellen verschiedenen) Verzweigungspunkte der WOK erh¨ alt man u ¨ber ϕλ =
d P (s) = 0 ds
aus
n
1 1 − =0 . s − s∞ s − s0µ ν ν=1 µ=1 m
9. Inzidieren in einem Wurzelort insgesamt q WOK-St¨ ucke, so schneiden sich benachbarte Kurvenst¨ ucke jeweils unter dem Winkel 2π q . Diese Regeln lassen sich wie folgt begr¨ unden: 0 zu 1.) Sowohl s∞ ν als auch sµ sind Wurzeln von Polynomen mit reellen Koeffizienten. Daher sind sie entweder reell oder sie treten in konjugiertkomplexen Paaren auf. Mit jeder L¨ osung s der (3.32) muß daher auch die zu s konjugiert-komplexe Zahl s die (3.32) erf¨ ullen. zu 2.) L¨ aßt man s die reelle Achse von rechts nach links durchlaufen, so ∞ 0 0 liefern die konjugiert-komplexen Paare s∞ ν und sν sowie sµ und sµ keinen Beitrag zur linken Seite von Gl.(3.34). Hat man soeben eine ungerade Anzahl reeller Pole und Nullstellen durchlaufen, so liefert die linke Seite von Gl.(3.34) ein ungeradzahliges Vielfaches von π, so wie es f¨ ur Wurzelorte sein muß zu 3.) Diese Aussage folgt unmittelbar aus (3.32)
160
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
zu 4.) Man teile Gl.(3.32) durch k und lasse anschließend k gegen Unendlich gehen. Die WOK-St¨ ucke enden entweder in den m Nullstellen von Z(s) = 0, die alle im Endlichen liegen, oder in den u ¨ brigen (n − m) Nullstellen des charakteristischen Polynoms (3.32), die f¨ ur k → ∞ ebenfalls nach s = ∞ wandern. Die WOK muß sich damit insge¨ samt aus n Abschnitten (sogenannten Asten“ in der deutschen bzw. ” sections“ in der englischen Fachliteratur) zusammensetzen. ” zu 5.) Man betrachte einen (sehr kleinen) Kreis mit dem l-fachen Pol s∞ i als Mittelpunkt und lasse die Variable s in (3.34) diesen Kreis durchlaufen. Die Punkte auf dem Kreis sind genau dann Wurzelorte, wenn gilt m
n ∞ 0 ∞ ∞ − arc s − s∞ + s − s arc (s − s∞ i i µ i + si − sν ) = (2 λ+1)·π .
µ=1
ν=1
Wurde der Kreis hinreichend klein gew¨ahlt, so gilt f¨ ur alle s0µ und alle ∞ ∞ sν = si ∞ ∞ 0 0 arc s − s∞ i + si − sµ ≈ arc si − sµ ∞ ∞ ∞ ∞ arc (s − s∞ i + si − sν ) ≈ arc (si − sν ) mit beliebig gew¨ unschter Genauigkeit. Folglich darf man schreiben m
0 ∞ ∞ arc s∞ arc (s∞ i − sµ − i − sν ) − l ·arc (s − si ) = (2 λ+ 1)π ν ∞ s∞ ν =si
µ=1
oder ⎤ m 1⎢ ⎥ ∞ 0 arc (s∞ arc s∞ arc (s − s∞ i ) = ⎣− i − sν ) + i − sµ − (2λ+1)π ⎦ l ν µ=1 ⎡
∞ s∞ ν =si
oder, wegen ejπ = e−jπ , ⎤ ⎡ m 1⎢ ⎥ ∞ 0 arc (s∞ arc s∞ arc (s − s∞ i ) = ⎣− i −sν ) + i −sµ + (2λ+1)π ⎦. l ν µ=1 ∞ s∞ ν =si
F¨ ur λ = 0, 1, · · · , l − 1 erh¨ alt man ersichtlich l verschiedene L¨osungen ϕi λ = arc (sλ − s∞ ). i zu 6.) Der Beweis kann in Analogie zu 5.) gef¨ uhrt werden. zu 7.) Die n − m ins Unendliche f¨ uhrenden WOK-Abschnitte lassen sich folgendermaßen gewinnen. Aus
3.6 Stabilit¨ at von Polynomen mit unbestimmten Koeffizienten
161
n n 8 8 s∞ ν 1 − (s − s∞ ) ν s N (s) an ν=1 an n−m ν=1 1
= = −k = · 8 · m = bm · s P (s) Z(s) bm m s0µ 8 s − s0µ 1− µ=1 s µ=1 folgt f¨ ur beliebiges s ∈ WOK mit |s| → ∞ durch Reihenentwicklung der Produkte im Z¨ ahler und Nenner *n 1 − s−1 ν=1 s∞ bm ν + ··· −k = sn−m m * an 1 − s−1 s0µ + · · · µ=1
=s
n−m
>
1−s
−1
n
s∞ ν
ν=1
−
m
? s0µ
+ ···
.
µ=1
Nun ziehen wir die (n − m)−te Wurzel, n−m
6 bm (2λ + 1)π |k | · exp j an n−m 1 > n ? n−m
m −1 ∞ 0 sν − sµ + · · · =s 1−s ν=1
µ=1
>
n m 1 s−1 ≈s 1− s∞ − s0µ ν n−m ν=1 µ=1
?
> n ? m 1 ∞ 0 =s− s − sµ , n − m ν=1 ν µ=1 und erhalten n − m Geradengleichungen f¨ ur die Asymptoten: > n ? 6 m 1 bm (2λ + 1)π n−m ∞ 0 s= s − sµ + |k | · exp j n − m ν=1 ν an n−m µ=1 Diese n − m Geraden schneiden sich im Punkt > n > n ? ? m m 1 1 ∞ 0 ∞ 0 σ0 = s − sµ = Re sν − Re sµ n − m ν=1 ν n − m ν=1 µ=1 µ=1 auf der reellen Koordinatenachse unter den Winkeln ϕλ = 2λ+1 n−m · π mit λ = 0, 1, · · · , n − m − 1. zu 8.) In Verzweigungspunkten schneiden sich verschiedene Abschnitte der WOK. Sei s0 ein solcher Punkt und k0 der zugeh¨orende k-Wert, dann
162
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
kann man, aufbauend auf (3.33), k = k(s) um s = s0 in eine TaylorReihe entwickeln: 1 k(s) = k(s0 ) + k (s0 ) (s − s0 ) + k (s0 ) (s − s0 )2 + · · · 2 1 2 = k(s0 ) + k (s0 ) (s − s0 ) + · · · 2 d k(s) muß f¨ ur s = s0 verschwinden, weil Die erste Ableitung k (s) = ds sonst die ,,Mehrdeutigkeit”, die die Verzweigungsstelle auszeichnet, nicht auftreten k¨ onnte. Wegen k(s0 ) = 0 an der Stelle s = s0 ist d k(s) = ds oder
d ds Z(s)
d · N (s) − ds N (s) · Z(s) =0 Z 2 (s)
⎡ −1 ⎤
m n < d an d ⎣ < ⎦=0 k(s) = − s − s0µ · (s − s∞ ν )· ds bm ds ν=1 µ=1
gleichwertig mit n m 1 1 1 d d ln k(s) = · k(s) = 0= − . ∞ ds k(s) ds s − sν s − s0µ ν=1 µ=1 Alle WOK-Punkte s, die diese Gleichung erf¨ ullen, sind Verzweigungspunkte. zu 9.) Die q WOK-St¨ ucke m¨ ogen im Wurzelort s = s0 zusammenstoßen. Wir k kann die gegebene setzen k0 = − P (s1 0 ) . Mit der Substitution k = k0 + charakteristische Gleichung (3.32) umgeschrieben werden, 0 = N (s) + k · Z(s) · Z(s) = (N (s) + k0 · Z(s)) + = N (s) + (k0 + k) k · Z(s) (s) + =N k · Z(s). Z(s) ¨ F¨ ur die modifizierte Ubertragungsfunktion P (s) := N wird die Stel(s) ¨ le s = s0 zur q-fachen Polstelle, in der q WOK-Aste zusammentreffen. ¨ Gem¨ aß Regel 5.) treffen sich benachbarte WOK-Aste jeweils unter dem 2π Winkel . q
Beispiel 3.25 ¨ Ubertragungsfunktion der Regelstrecke:
P (s) =
s+1 s(s − 1)(s2 + 4s + 20)
Das zu untersuchende Polynom lautet: N (s) + k · Z(s) = s(s − 1)(s2 + 4s + 20) + k · (s + 1) = s4 + 3s3 + 16s2 + (k − 20)s + k.
3.6 Stabilit¨ at von Polynomen mit unbestimmten Koeffizienten
163
Mit dem Routhschen Algorithmus kann man unschwer berechnen, dass dieses Polynom im k-Intervall (k1 = 25, 35 ≤ k ≤ k2 = 53, 65) stabil ist. Die MATLAB-Control-System-Toolbox gestattet eine rasche numerische Ermittlung und Auswertung der WOK. F¨ ur das Beispielsystem wurde die WOK in Bild 3.14 dargestellt. Die o. a. allgemeinen Konstruktionsregeln f¨ uhren zu folgenden
5
k2 = 53.65 k1 = 25.35
4 3 2
Im s
1 0
s0
−1 −2 −3 −4 −5 −4
−3
−2
−1
0
1
2
Re s Bild 3.14. Wurzelortskurve f¨ ur P (s) = s(s−1)(ss+1 ur die Parameterwerte 2 +4s+20) . F¨ k = k1 und k = k2 wurden jeweils die vier Nullstellen des Polynoms markiert. Einsichten u ¨ber die Wurzelorte des Beispielsystems: Die Regelstrecke hat vier einfache Pole bei s = 1, s = 0, s = −2 + 4j, s = −2 − 4j und eine einfache Nullstelle bei s = −1. Regel 2: Die reellen Achsenabschnitte [0; 1] und (−∞; −1] sind Wurzelorte. Regel 5: Austrittswinkel im Pol s = −2 + 4j:
ϕ = − arctan − 43 − arctan − 24 − arctan(∞) + arctan − 41 + π = −(126, 9◦ + 116, 6◦ + 90◦ ) + 104, 0◦ + 180◦ = −49, 5◦
Regel 7: Die drei Asymptoten schneiden sich in σ0 = 13 (−3 + 1) = − 23 unter den Winkeln ϕ0 = 60◦ , ϕ1 = 180◦ , ϕ2 = 300◦ . Regel 8: Die Verzweigungspunkte gen¨ ugen der Bestimmungsgleichung 3s4 + 10s3 + 25s2 + 32s − 20 = 0 . Sie hat zwei reelle L¨ osungen: s0,1 = −2, 29 und s0,2 = 0, 44.
164
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen
Regel 9: Die WOK-St¨ ucke schneiden sich in s0,1 und s0,2 unter 90◦ . Die zugeh¨ orenden k−Werte ergeben sich zu k0,1 = −
1 = 93.9 P (s0,1 )
und
k0,2 = −
1 = 3.77 . P (s0,2 )
Abschließend sei darauf hingewiesen, dass die bisher gemachten Annah men grad Z(s) ≤ grad N (s) und k ≥ 0 , die auch der MATLAB-Software zugrunde liegen, nicht wesentlich sind. Der Fall k < 0, grad Z(s) ≤ grad N (s) l¨ asst sich auf die hier angenommene Ausgangssituation zur¨ uckf¨ uhren, indem man das Polynom Z(s) durch −Z(s) ersetzt. Im Fall grad Z(s) > grad N (s) hat man N und Z zu vertauschen und k durch k1 zu ersetzen, wenn man die angegebenen Konstruktionsregeln bzw. die u ¨ bliche WOK-Software nutzen will. Generell gilt: Falls die Koeffizienten eines Polynoms f (s) affin von einem Parameter k abh¨ angen, d.h. f (s; k) = f1 (s) + k · f2 (s) , so kann man das WOK-Konzept und die dazu verf¨ ugbare Software einsetzen, um die k-Abh¨ angigkeit der Nullstellen des Polynoms f (s; k) zu analysieren. Regelung mit großer Kreisverst¨ arkung (high gain control) Als Anwendung des WOK-Konzepts wird noch ein Zugang zum Reglerentwurf, die Regelung mit großer Kreisverst¨ arkung“ (high gain control) vor” ¨ gestellt. Die Ubertragungsfunktion des offenen SISO-Standard-Regelkreises sei G0 (s) = k
Z(s) , N (s)
grad Z = m ,
grad N = n.
Es wird gefragt, ob der geschlossene Regelkreis bei sehr großen Verst¨arkungswerten k stabil ist. Die Antwort auf diese Frage l¨asst sich aus den WOK der charakteristischen Gleichung k · Z(s) + N (s) = 0 ablesen: F¨ ur jedes k ∈ (0, ∞) gibt es n∗ = max(n, m) Wurzeln. Wenn diese n∗ Wurzeln f¨ ur hinreichend große Werte k in die linke Halbebene gelangen und diese bei weiter anwachsendem k nicht mehr verlassen, so wird der Regelkreis durch große R¨ uckf¨ uhrverst¨ arkungen k stabilisiert. Dabei spielt es keine Rolle, ob G0 (s) instabile Pole besitzt oder nicht.
3.6 Stabilit¨ at von Polynomen mit unbestimmten Koeffizienten
165
¨ Die Gradzahl m korrespondiert mit n WOK-Asten, die f¨ ur k → ∞ im Endlichen enden, n¨ amlich in den Nullstellen von Z(s). (Folglich kommt die Re¨ gelung mit großer Kreisverst¨ arkung bei nichtminimalphasiger Ubertragungsfunktion G0 (s), d. h. das Z¨ ahlerpolynom Z(s) hat Nullstellen mit positivem Realteil, nicht in Betracht.) Die restlichen n∗ − m Wurzeln m¨ ussen f¨ ur hinreichend große k-Werte ebenfalls in der linken Halbebene liegen. Diese n∗ − m Wurzeln n¨ ahern sich Asymptoten, die nach Regel 7. ermittelt werden. ¨ Beispiel 3.26 Betrachtet wird die Ubertragungsfunktion des offenen Kreises s+b s(a2 s2 + a1 s − a0 )
mit positiven Parameterwerten
b, a2 , a1 , a0 .
Im s
G0 (s) = k
0
s∞ 3
s∞ 2
σ0
−b
0
Re s
Bild 3.15. Bild der WOK zu Beispiel 3.26
Sie hat n = 3 Pole, von denen zwei instabil sind, s∞ 1
= 0,
s∞ 2,3
a1 = 2a2
−1 ±
4a2 a0 1+ a21
,
und m = 1 stabile Nullstelle im Endlichen, s01 = −b . Es soll festgestellt werden, f¨ ur welche Parameterwerte der geschlossene Regelkreis bei sehr großen Verst¨ arkungswerten k stabil ist. ¨ Nach Regel 7 gibt es n − m = 2 ins Unendliche strebende WOK-Aste. Die beiden Asymptoten schneiden sich unter den Winkeln ϕ0 = π2 und ϕ1 = 32 π im Wurzelschwerpunkt σ0 ,
166
¨ 3 Stabilit¨ at rationaler Ubertragungsfunktionen 1 σ0 = n−m
3
Re
s∞ ν
− Re
s01
=
ν=1
1 a1 − +b . 2 a2
¨ Die beiden Aste enden genau dann in der linken Halbebene, wenn
1 a1 − +b <0 2 a2 ausf¨ allt. Das Bild 3.15 zeigt die WOK. ¨ Ergebnis: Die betrachtete Familie von instabilen Ubertragungsfunktionen kann durch R¨ uckf¨ uhrung mit großen Verst¨ arkungsfaktoren k stabilisiert werden, wenn die positiven Parameter der zus¨ atzlichen Bedingung b < aa12 gen¨ ugen.
3.6.2.2 Stabilit¨ at von Polynomen, deren Koeffizienten von mehreren Parametern abh¨ angen Das Beispiel 3.25 veranschaulicht, wie die Nullstellenlagen eines Polynoms f (s, p) =
n
aν (p)sν
ν=0
bei stetigen Abh¨ angigkeiten der Koeffizienten von p auf stetigen Kurvenz¨ ugen (ggf. mit Verzweigungsstellen) wandern, wenn ein einzelner Parameter pλ ein Variationsintervall durchl¨ auft. Aufgrund dieser stetigen Abh¨angigkeit der Nullstellenlagen von den Parametern hat man bei Kenntnis eines stabilen Nominalpolynoms ) = f (s, p
n
aν ( p)sν
ν=0
lediglich festzustellen, ob im Zuge der zul¨ assigen Parametervariationen p ∈ P die Nullstellenlagen den Stabilit¨ atsrand, hier die imagin¨are Achse, u ¨ berschreiten k¨ onnen oder nicht. Wenn dies nicht m¨ oglich ist, handelt es sich um eine robust stabile Polynomfamilie F (s, P). Rand¨ uberschreitung bei ω = ω ! = 0 bedeutet: eine reelle Nullstelle wechselt von der negativen auf die positive reelle Halbachse. Es exi! ∈ P mit f (0, p ! ) = a0 (! stiert ein p p) = 0. Diese Art der Rand¨ uberschreitung wurde bereits auf Seite 156 mit der Stodola-Bedingung (3.31) ber¨ ucksichtigt. Interessanter sind die Rand¨ uberschreitungen bei Frequenzen ω ! = 0, d. h. !) = 0 f (j ω !, p
f¨ ur ein
! ∈ P, ω p ! = 0.
Das ist genau dann der Fall, wenn in der Routhschen Zerlegung des Polynoms f (jω) = j n (f1 (ω) − jf2 (ω)
(vgl. Abschnitt 3.4)
ω) = 0 als auch f2 (! ω ) = 0 gilt. Folglich muß in der Sturmschen sowohl f1 (! Kette, die sich hinter dem Routhschen Rechenschema verbirgt, das Polynom
3.6 Stabilit¨ at von Polynomen mit unbestimmten Koeffizienten
167
fn−1 (ω) = r2 (ω 2 − ω ! 2 ) Teiler von f1 (ω) und von f2 (ω) sein. Mithin wird fn (ω) = 0. (Vergleiche auch Seite 142.) Tritt keine Rand¨ uberschreitung f¨ ur irgendein p ∈ P ein, so ist die Polynomfamilie F (s, P) robust stabil. Das hergeleitete Ergebnis l¨asst sich wie folgt zusammenfassen: Satz 3.21 Die Polynomfamilie F (s, P) ist robust stabil genau dann, wenn ), p ∈ P, gefunden werden kann 1. ein stabiles Nominalpolynom f (s, p 2. die Stodola-Bedingungen (3.31) erf¨ ullt sind und 3. das vorletzte Element r1 der ersten Vertikalspalte im Routhschen Rechenschema f¨ ur alle p ∈ P positiv bleibt. Die Bedingung 3 des Satzes kann man auch durch die Pr¨ ufung einer parameterabh¨ angigen Hurwitz-Determinante oder einer Resultante ersetzen. Das geht aus den im Abschnitt 3.5.2 diskutierten Zusammenh¨angen hervor. Korollar 3.22 Statt der Bedingung 3 im vorstehenden Satz darf man wahlweise eine der folgenden Bedingungen verwenden: a) Hurwitz-Determinante ∆n−1 > 0 f¨ ur alle p ∈ P b) Resultante R(h, g) = 0 f¨ ur alle p ∈ P.
4 Grundkonzepte der linearen Regelungstheorie
4.1 Einfu ¨hrung Dieses Kapitel behandelt Grundkonzepte der linearen Regelungs- und Steuerungstheorie f¨ ur geregelte Systeme mit der Struktur des sog. Standardregelkreises. Bild 4.1 zeigt den Standardregelkreis, bei dem K den Regler (controller), P den Prozess (plant, Regelstrecke), r das Referenzsignal (reference, F¨ uhrungsgr¨ oße), z das St¨ orsignal (disturbance), y das Ausgangssignal (output, Regelgr¨ oße), e die Regeldifferenz (error), u das Streckeneingangssignal (input) symbolisieren.
z r
e
K
v
u
P
y
Bild 4.1. Standardregelkreis
¨ Wird der Prozeß als SISO-Ubertragungssystem (single-input single-output system) beschrieben, so entsteht ein SISO-Regelkreis. Alle genannten Signale sind dann skalarwertig. Regler und Prozeß werden in der Regel durch ratio¨ nale Ubertragungsfunktionen charakterisiert. ¨ Handelt es sich bei dem Prozeß jedoch um ein MIMO-Ubertragungssystem (multiple-input multiple-output system) mit einem Eingangssignal(vektor) u(t) ∈ Rm und einem Ausgangssignal(vektor) y(t) ∈ Rr , so muß auch ein
170
4 Grundkonzepte der linearen Regelungstheorie
MIMO-Regler entworfen werden, und zwar mit e(t) ∈ Rr und v(t) ∈ Rm . ¨ Strecke und Regler werden als rationale Ubertragungsmatrizen beschrieben, P ∈ (R(s))r×m , K ∈ (R(s))m×r . Die Grundideen der linearen Regelungs- und Steuerungstheorie sollen im vorliegenden Kapitel 4 in ihrer einfachsten Form vorgestellt und deshalb nur f¨ ur den SISO-Standardregelkreis er¨ ortert werden. Die systematische Behandlung von MIMO-Regelkreisen beginnt erst mit Kapitel 6. Der Regelkreis heißt wohldefiniert, wenn sich bei unabh¨angiger Vorgabe der exogenen (d. h. der außerhalb [des Regelkreises] erzeugten) Signale r(t) und z(t) s¨ amtliche inneren (oder endogenen, d. h. innerhalb [des Regelkreises] erzeugten) Signale, die in Bild 4.1 eingetragen wurden, bestimmen lassen. Einen wohldefinierten Regelkreis nennen wir stabil , wenn sich im Bildbe¨ reich alle Ubertragungsfunktionen von den exogenen Signalen zu den inneren ¨ Signalen als stabile Ubertragungsfunktionen (im Sinne des Kapitels 3) erweisen.1 Im Abschnitt 4.3 wird das sog. charakteristische Polynom des SISOStandardregelkreises definiert und der Bequemlichkeit halber mit CLCP – ein Akronym, entstanden aus closed-loop characteristic polynomial – bezeichnet. Erfreulicherweise gen¨ ugt es, die Stabilit¨at dieses einen Polynoms zu ¨ pr¨ ufen, um u at des Regelkreises mit all seinen Ubertragungs¨ ber die Stabilit¨ funktionen von exogenen zu inneren Signalgr¨ oßen entscheiden zu k¨onnen. Abschnitt 4.4 behandelt das Strecker-Nyquist-Kriterium f¨ ur den SISOStandardregelkreis. Mit diesem Kriterium kann man aus dem Frequenzgang des offenen Kreises Go (jω) = P (jω) · K(jω) auf die Stabilit¨at des geschlossenen Kreises schließen. Das Kriterium wird relativ ausf¨ uhrlich in seinen verschiedenen Modifikationen, die sich in der regelungstechnischen Praxis bew¨ ahrt haben, diskutiert. In Anbetracht der Tatsache, dass mehr als 90 % aller industriell eingesetzten Regler vom PID-Typ (d. h. ein Proportional-, ein Integrier- und ein Differenzierglied in Parallelschaltung) sind, wird diesen Reglern ein eigener Abschnitt gewidmet. Mit Hilfe des mathematischen Werkzeugs, das im Abschnitt 3.4.2 im Zusammenhang mit dem Beweis des Routhschen Algorithmus bereitgestellt wurde, l¨ asst sich die Gesamtheit aller PID-Regler, die den Regelkreis stabilisieren, berechnen. Neben der unabdingbaren Stabilit¨ at des geregelten Systems sollen durch den Regler weitere Eigenschaften der Regelstrecke in gew¨ unschter Weise beeinflusst und modifiziert werden. Abschnitt 4.6 behandelt das Problem der Regelg¨ ute, in die Forderungen an die station¨are Genauigkeit, Forderungen 1
In der Literatur wird oft von interner“ Stabilit¨ at oder innerer“ Stabilit¨ at des ” ” Regelkreises gesprochen. Bei der hier gegebenen Erkl¨ arung der Stabilit¨ at eines Regelkreises sind die Attribute interne“ oder innere“ u ussig. Sie sind so¨ berfl¨ ” ” gar irref¨ uhrend, denn im Innern“ eines stabilen Regelkreis d¨ urfen sowohl die ” Strecken¨ ubertragungsfunktion als auch die Regler¨ ubertragungsfunktion oder beide instabil sein, wie im Abschnitt 5.4.3 begr¨ undet wird.
4.1 Einf¨ uhrung
171
an das Einschwingverhalten und Forderungen im Spektralbereich subsummiert werden. Die Darstellung wurde relativ kurz gehalten, weil viele neuere Einf¨ uhrungen in die Regelungstechnik und vor allem die ¨alteren Standardwerke diesem Fragenkreis viel Raum widmen. Das Grundproblem der Regelungstechnik, mit den unvermeidlichen Unbestimmtheiten der Regelstrecke fertig zu werden, wird im Abschnitt 4.7 systematisch angegriffen. Beginnend mit der Bodeschen Empfindlichkeitsfunktion gegen¨ uber Parameterunbestimmtheiten der Regelstrecke wird die mathematische Erfassung strukturierter Unbestimmtheiten und unstrukturierter Unbestimmtheiten der Regelstrecke diskutiert. Ein Regler, der f¨ ur ein fixiertes Nominalmodell der Regelstrecke entworfen wurde, ist nur dann einsatztauglich, wenn er die an den Regelkreis gestellten Stabilit¨ ats- und G¨ uteforderungen auch dann gew¨ahrleistet, falls statt des Nominalstreckenmodells eine gegen¨ uber dem Nominalmodell durch Unbestimmtheiten gest¨ orte Regelstrecke vorliegt. Man spricht in diesem Zusammenhang von robuster Stabilit¨ at und robuster Regelg¨ ute, die jeder praxistaugliche Regler garantieren muss. Wenn neben den Forderungen nach robuster Stabilit¨at und robuster G¨ ute zus¨ atzlich gew¨ unscht wird, dass die Werte einzelner Signale einer vorbestimmten Zeitfunktion folgen, so kann der Standardregelkreis eine solche zus¨atzliche Trajektoriensteuerung grunds¨ atzlich nicht mehr leisten. F¨ ur die Trajektoriensteuerung wird ein zus¨ atzlicher Steuerungsapparat“ ben¨otigt, ” der von Horowitz vor mehr als 4 Jahrzehnten als zweiter Entwurfsfreiheits” grad“ apostrophiert wurde. Auf dieser strukturell erweiterten Eingriffsbasis wird eine Trajektoriensteuerung mit Folgeregelungen prinzipiell m¨oglich. Zu jeder LTI-Regelstrecke mit einem skalaren Steuereingang l¨asst sich ein Basissignal , dessen Zeitverlauf beliebig (aber hinreichend glatt) vorgegeben werden kann, mathematisch durch eine Differentialgleichung definieren. Aus dem vorbestimmten Verlauf des Basissignals folgen sowohl die Verl¨aufe des Steuersignals als auch alle Verl¨ aufe der f¨ ur die Streckenbeschreibung verwendeten weiteren Signale allein durch Differentiationen. Dabei ergeben sich oft in¨ stabile Ubertragungsfunktionen von der Steuergr¨oße zu den Systemgr¨oßen. Deshalb muss man die Trajektoriensteuerung durch eine Folgeregelung komplettieren. Das gelingt mit den vertrauten Stabilisierungskonzepten f¨ ur den Standardregelkreis. Die Trajektoriensteuerung mit Folgeregelung wird f¨ ur Streckenbeschreibungen in Deskriptorform, vgl. (2.15), A1 z(t) ˙ + A0 z(t) + b0 u(t) = 0 im Abschnitt 4.8 gr¨ undlich behandelt und durch nichttriviale Beispiele illustriert. Die Basisgr¨ oße Ξ wird bei dieser Streckenbeschreibung im Bildbereich definiert durch Ξ = (det(sA1 + A0 ))−1 · U
172
4 Grundkonzepte der linearen Regelungstheorie
Die physikalische Interpretierbarkeit des Basissignals spielt keine wesentliche Rolle. Die Aufmerksamkeit des Lesers wird daf¨ ur erst im Abschnitt 6.2.6 in Anspruch genommen.
4.2 Wohldefiniertheit und Stabilit¨ at des geregelten Systems F¨ ur die (Laplace-transformierten) inneren Gr¨oßen U und E lassen sich aus Bild 4.1 die folgenden Beziehungen ablesen U 0 K Z U . + = E −P 0 R E Umstellung nach den exogenen Eingangsgr¨ oßen Z und R ergibt Im −K Z U , = R E P Ir
(4.1)
wobei Im und Ir eine (m × m)- bzw. (r × r)-Einheitsmatrix symbolisieren. Definition 4.1 (Wohldefiniertheit). Ein geregeltes System heißt wohldefiniert, wenn sich bei unabh¨angiger Festlegung der exogenen Eingangssignale stets alle inneren Signale ermitteln lassen. Generell kann die Wohldefiniertheit beim Standardregelkreis durch die mathematische Bedingung Im −K det
= 0 P Ir charakterisiert werden. F¨ ur wohldefinierte Regelkreise ergeben sich die inneren Signale eindeutig aus den exogenen Eingangssignalen: −1 I −K U Z = m . (4.2) E P Ir R Beispiel 4.1 In einem SISO-Standardregelkreis gem¨aß Bild 4.1 werden K und P als Proportionalglieder angesetzt, und zwar P = −1, K = 1. Aus dem Signalflussplan kann man erkennen, dass in diesem Falle Z = −R gelten m¨ usste. Aus regelungstechnischer Sicht eine unsinnige Forderung! Das Beispielsystem ist nicht wohldefiniert; denn 1 −K det P 1
= 1 + KP = 1 − 1 = 0 .
Definition 4.2. Ein geregeltes System heißt stabil, wenn alle m¨oglichen ¨ Ubertragungsfunktionen von exogenen Eingangssignalen zu inneren Signalen stabil sind, d.h., keine Pole mit Re s ≥ 0 haben.
4.3 Charakteristisches Polynom des Standardregelkreises
173
¨ Ein SISO-Standardregelkreis ist demnach stabil, wenn die vier Ubertragungs1 K −P 1 U E funktionen GU = , G = , G = und GE Z R Z R = 1+KP 1+KP 1+KP 1+KP ohne Ausnahme stabil sind. Beispiel 4.2 Beim SISO-Standardregelkreis mit P =
1 , s−1
K =1−
1 s+1 1 wird = = und damit 1 1 + KP s +2 1 + s+1 U E
s+1 = s+2
1
s−1 s+1
−1 s−1
1
Z
R
=
s+1 s+2 s+1 − (s−1)(s+2)
s−1 s+2 s+1 s+2
Z
2 s+1
=
s−1 s+1
R
.
+s+1 ¨ Obwohl sich nur die Ubertragungsfunktion GE Z (s) = (s+2)(1−s) als instabil herausstellt, ist dennoch der betrachtete Beispiel-Regelkreis instabil.
¨ Erfreulicherweise muss man im allgemeinen nicht s¨amtliche (m+r)2 Ubertragungsfunktionen, die im MIMO-Standardregelkreis vorkommen, getrennt auf Stabilit¨ at pr¨ ufen. Vielmehr gen¨ ugt es, nur ein Polynom, das sog. charakteristische Polynom, zu testen.
4.3 Charakteristisches Polynom des Standardregelkreises Der Einfachheit halber wollen wir hier nur den SISO-Regelkreis behandeln und uns dem MIMO-Regelkreis erst im Abschnitt 6.3 zuwenden. F¨ ur die ¨ Ubertragungsfunktionen von Strecke und Regler eines SISO-Regelkreises gelte P (s) =
ZP (s) NP (s)
und
K(s) =
ZK (s) , NK (s)
wobei ZP und NP bzw. ZK und NK jeweils teilerfremde Polynome sind. ¨ Damit ergibt sich die Ubertragungsfunktion des offenen Kreises zu Go (s) = K(s) · P (s) =
Zo (s) ZK (s) · ZP (s) =: . NK (s) · NP (s) No (s)
¨ Ankn¨ upfend an (4.2) notieren wir die 2 × 2-Ubertragungsmatrix von den exogenen Gr¨ oßen Z und R zu den inneren Gr¨ oßen U und E in der Form −1 1 1 −K U Z 1 K Z = = P 1 E R −P 1 R 1 + KP NP NK Z 1 ZK /NK = R −Z /N 1 NP NK (1 + Go ) P P 1 NP NK ZK NP Z = . (4.3) R −Z N N N NP NK (1 + Go ) P K P K
174
4 Grundkonzepte der linearen Regelungstheorie
Wegen der vorausgesetzten Teilerfremdheit von ZP und NP einerseits sowie von ZK und NK andererseits kann das gemeinsame Nennerpolynom NP NK (1 + Go ) = NP NK + ZP ZK nicht zugleich mit den drei Z¨ ahlerpolynomen NP NK , NP ZK und ZP NK ver¨ schwinden. M. a. W., die vier Z¨ ahlerpolynome der 2 × 2-Ubertragungsmatrix k¨ onnen keinen gemeinsamen Teiler mit dem Nennerpolynom haben. Daher ist allein das eine Polynom NP NK + ZP ZK f¨ ur die Stabilit¨at des Regelkreises maßgebend. Man nennt es das charakteristische Polynom des geschlossenen SISO-Regelkreises (CLCP, closed-loop characteristic polynomial). Die gewonnene Erkenntnis formulieren wir als Satz 4.1 Der SISO-Standardregelkreis ist genau dann stabil, wenn sein charakteristisches Polynom CLCP (s) = NP (s)NK (s) + ZP (s)ZK (s) = No (s) + Zo (s) = No (s)(1 + Go (s)) keine Nullstellen in der abgeschlossenen rechten Halbebene besitzt. 1 Beispiel 4.3 F¨ur das o. a. Beispiel mit P (s) = s−1 und K(s) = in der Tat ein instabiles charakteristisches Polynom,
s−1 s+1
erhalten wir
CLCP (s) = 1 · (s − 1) + (s − 1)(s + 1) = s2 + s − 2 , und wir haben damit die Instabilit¨ at des SISO-Regelkreises nachgewiesen.
4.4 Stabilit¨ atskriterium von Strecker-Nyquist Das Strecker-Nyquist-Kriterium gestattet es, u ¨ber die Stabilit¨at des Standardregelkreises zu entscheiden, indem man – grob gesprochen – den Frequenzgang der skalaren Funktion G(s) = det(Ir + Go (s)) betrachtet. Als Quelle wird in der internationalen regelungstechnischen Literatur u ¨ blicherweise der 1932 erschienene Aufsatz [Nyq32], der sich mit der Stabilit¨ at von positiv r¨ uckgekoppelten R¨ ohren-Verst¨arker-Schaltungen befasst, genannt. Unabh¨ angig von dem US-Amerikaner Harry Nyquist (1889 in Schweden geboren, 1907 in die USA ausgewandert, 1917 promoviert worden, 19171954 in verschiedenen Positionen bei den Bell Telephone Laboratories t¨atig gewesen, 1976 gestorben) hat der Deutsche Felix Strecker (1892 - 1951) ein vergleichbares Resultat gefunden und dar¨ uber bereits 1930 im Hause SIEMENS AG berichtet. Details k¨ onnen in der Monographie [Str50] und der dort zitierten Literatur nachgelesen werden.
4.4 Stabilit¨ atskriterium von Strecker-Nyquist
175
4.4.1 Erinnerung an die Funktionentheorie Das Strecker-Nyquistsche Stabilit¨ atskriterium l¨asst sich aus elementaren Tatsachen der Theorie der komplexen Funktionen von einer komplexwertigen Variablen herleiten. Als Ausgangspunkt nehmen wir den Satz 4.2 Die Funktion F (s) sei gebrochen rational. Ein im Uhrzeigersinn zu durchlaufender und in sich geschlossener Weg C, auf dem weder Nullnoch Polstellen von F (s) liegen, umschließe ein Gebiet G in der komplexen Zahlenebene (siehe Bild 4.2). Dann gilt f¨ ur das Umlaufintegral 1 d arc F (s) = PG − ZG , 2π ! C
wobei ZG die Anzahl der Nullstellen und PG die Anzahl der Polstellen von F (s) im Gebiet G – jede so oft gez¨ahlt, wie es ihre Vielfachheit angibt – sind.
s - Ebene
jω
G C
σ
Bild 4.2. Gebiet G und Integrationsweg C in der s-Ebene
Beweis: Eine gegebene gebrochen rationale Funktion F (s) ist der Quotient eines Z¨ ahlerpolynoms Z(s) und eines Nennerpolynoms N (s). Sie kann in der Form m 8
F (s) =
(s − sµ,Z ) Z(s) µ=1 = |F (s)|ejarc F (s) = K 8 n N (s) (s − sν,N ) ν=1
dargestellt werden. Dann gilt
mit
K>0
176
4 Grundkonzepte der linearen Regelungstheorie
arc F (s) =
m µ=1
arc(s − sµ,Z ) −
n
arc(s − sν,N ).
ν=1
Daraus folgt unmittelbar m n ! darc(s − sµ,Z ) − ! darc(s − sν,N ) ! darc F (s) = C
µ=1 C
ν=1 C
= −2π(ZG − PG ) = 2π(PG − ZG ). Interpretation: Da Drehungen im Uhrzeigersinn als mathematisch nega” tiv“ gelten, ergibt jeder Umlauf von F (s) im Uhrzeigersinn um den Ursprung der F (s)-Ebene einen Drehwinkelzuwachs von (−2π). Durchl¨auft das Argument s in der s-Ebene einmal den Weg C im Uhrzeigersinn, so dreht sich der Ortsvektor F (s) in der komplexen F (s)-Ebene gerade (ZG − PG )-mal im Uhrzeigersinn um den Ursprung der F (s)-Ebene. Beispiel 4.4 (siehe Bild 4.3) F¨ur den ¨außeren Umlauf gilt ZG = 1, PG = 3. Der zugeh¨ orende Bildvektor uml¨ auft den Ursprung der F (s)-Ebene zweimal im Gegenuhrzeigersinn. F¨ ur den inneren Umlauf gilt ZG = 1, PG = 1. Der zugeh¨ orende Bildvektor uml¨ auft den Ursprung der F (s)-Ebene nullmal im Gegenuhrzeigersinn.
4.4.2 Anwendung f¨ ur den SISO-Standardregelkreis Wir wollen zeigen, wie sich die Stabilit¨ at des SISO-Regelkreises aus dem Zo (s) ablesen l¨asst. Verlauf der Funktion F (s) = 1 + Go (s) = 1 + N o (s) Mit Satz 4.1 wurde konstatiert, dass der SISO-Regelkreis genau dann stabil ist, wenn das charakteristische Polynom CLCP (s) = No (s)·(1+Go (s)) keine Nullstellen mit Re s ≥ 0 hat. Das Nennerpolynom No (s) des offenen Kreises kann jedoch gegebenenfalls Nullstellen mit Res ≥ 0 besitzen: No habe n+ Nullstellen mit Re s > 0 und n0 Nullstellen mit Re s = 0. Als Kontur C in der s-Ebene wird der (vor allem in der englischen Fachliteratur so genannte) Nyquist-Pfad gew¨ ahlt (siehe Bild 4.4). Er durchl¨auft in der s-Ebene die imagin¨ are Achse von −jωA bis +jωA , wobei ωA 1, und l¨ asst, wenn er sich dabei rein imagin¨ aren Nullstellen von No (s) n¨ahern sollte, diese rechts“ liegen, indem er jeweils auf einem kleinen Bogen in die linke ” s-Halbebene ausweicht. Die Kontur C wird durch einen großen Halbkreis so geschlossen, dass praktisch das Innere der ganzen rechten s-Halbebene an die Stelle des obigen Gebietes G tritt, unbedingt aber alle Nullstellen mit σ = Re s ≥ 0 des Nennerpolynoms No (s) eingeschlossen werden. Weil das charakteristische Polynom CLCP (s) = No (s) · (1 + Go (s)) keine Pole und bei Stabilit¨ at auch keine Nullstellen im Inneren und auf dem Rande des vom Nyquist-Pfad C umfahrenen Gebietes G besitzt, folgt aus den S¨ atzen 4.1 und 4.2: Der Regelkreis ist genau dann stabil,wenn
4.4 Stabilit¨ atskriterium von Strecker-Nyquist F (s)-Ebene
2.5
2.5
2
2
1.5
1.5
1
1
0.5
0.5
Im F (s)
Im s
s-Ebene
0
0
−0.5
−0.5
−1
−1
−1.5
−1.5
−2
−2
−2.5 −1
−0.5
0
0.5
1
−2.5 −1
1.5
−0.5
0
0.5
1
1.5
Re F (s)
Re s Bild 4.3.
177
Zwei Beispiele f¨ ur Uml¨ aufe in der s-Ebene und die Bilder der Uml¨ aufe s−0,5 in der F (s)-Ebene f¨ ur F (s) = (s2 +1)(s 2 −1) : Nullstelle bei 0.5; Polstellen bei ±1 und ±j
! d arc CLCP(s) = 0 C
gilt. Andererseits wird d arc CLCP(s) = d arcN (s) + o ! ! ! d arc(1 + Go (s)) C
C
C
= −(n+ + no )2π + ! d arc(1 + Go (s)). C
Zusammengenommen ergibt sich daraus 0 = −(n+ + no )2π + ! d arc(1 + Go (s)). C
als eine notwendige und hinreichende Bedingung f¨ ur die Stabilit¨at des Regelkreises. Damit wurde das Strecker-Nyquist-Kriterium f¨ ur SISO-Regelkreise hergeleitet.
178
4 Grundkonzepte der linearen Regelungstheorie jω +jωA
G
σ
C −jωA
Bild 4.4. Standard-Nyquist-Pfad
Satz 4.3 (Strecker-Nyquist-Kriterium) Besitzt der offene Regelkreis mit ¨ der rationalen Ubertragungsfunktion Go (s) genau n+ Polstellen in der offenen rechten s-Halbebene und no Polstellen auf der imagin¨aren Achse, so ist der geschlossene Regelkreis genau dann stabil, wenn die Bildkurve der Funktion F (s) = 1 + Go (s) – falls das Argument s den Nyquist-Pfad C einmal im Uhrzeigersinn durchl¨auft – den Punkt (0, j0) nicht enth¨alt und genau (n+ + no )-mal im Gegenuhrzeigersinn umkreist. Die wortreiche Formulierung die Bildkurve von F (s), falls das Argument s ” den Nyquist-Pfad C einmal im Uhrzeigersinn durchl¨auft“ wollen wir von nun an verk¨ urzen auf die Nyquist-Bildkurve von F (s)“. ” Statt der Nyquist-Bildkurve von F (s) = 1 + Go (s) kann man nat¨ urlich auch die Nyquist-Bildkurve von Go (s) = F (s) − 1 zur Stabilit¨atspr¨ ufung heranziehen. Die Rolle des Punktes (0, j0) in der F (s)-Ebene u ¨bernimmt dann der Punkt (−1, j0) in der Go (s)-Ebene, und die Formulierung des StreckerNyquist-Kriteriums modifiziert sich wie folgt: ¨ Satz 4.4 Besitzt der offene Regelkreis mit der rationalen Ubertragungsfunktion Go (s) genau (n+ + no ) Polstellen mit Re s ≥ 0, so ist der geschlossene Regelkreis genau dann stabil, wenn die Nyquist-Bildkurve von Go (s) den Punkt (−1, j0) nicht enth¨alt und genau (n+ + no )-mal im Gegenuhrzeigersinn umkreist.
4.4 Stabilit¨ atskriterium von Strecker-Nyquist Nyquist-Pfad
179
Bild des Nyquist-Pfades 5
3
4 2
Im Go (s)
3
Im s
1 0
2 1 0
−1
−1 −1
−2 −3
−2
−4 −3 0
1
2
−5 −6
3
Re s
−2
0
Re Go (s) Im Go (s)
0.2 0.1
Im s
−4
0
0.05
0
−0.1 −0.2 −0.2
−0.05 −0.1
0
0.1
0.2
−0.25 −0.2 −0.15 −0.1 −0.05
Re s
0
0.05
Re Go (s)
Bild 4.5. Nyquist-Pfad und sein Go (s)-Bild f¨ ur Beispiel 4.5
Beispiel 4.5
Sei
Go (s) =
Zo (s) 1 = . No (s) s(s + 1)(s + 2)
Der offene Regelkreis ist instabil, weil n+ +n0 = 0+1 = 1 ist. Die Nyquist-Bildkurve von Go (s) in Bild 4.5 umkreist den kritischen Punkt (−1, j0) genau einmal im Gegenuhrzeigersinn. Folglich ist der geschlossene Regelkreis stabil.
Beispiel 4.6
Sei
Go (s) =
Zo (s) 3s5 + 9s4 + 12s3 + 7s2 + 9s − 3 = . No (s) s6 − 4s4 − s2 + 4
Der offene Regelkreis ist offensichtlich instabil. Wegen No (s) = (s − 1)(s − 2)(s + 1)(s + 2)(s2 + 1) gilt n+ + n0 = 2 + 2 = 4. Das Bild des Nyquist-Pfades (siehe Bild 4.6) umkreist den kritischen Punkt (−1, j0) genau viermal im Gegenuhrzeigersinn. Folglich ist der geschlossene Regelkreis stabil.
In vielen Anwendungen ergibt sich Go (s) als Produkt aus einer Strecken¨ Ubertragungsfunktion P (s) und einer Reglerverst¨arkung k, d. h. Go (s) = k · P (s) .
180
4 Grundkonzepte der linearen Regelungstheorie Nyquist-Pfad
Bild des Nyquist-Pfades 2
10 1.5
8 6
1
0.02
±1
4
0.02
Im s
−0.02
Im Go (s)
0.5 2
0
0
0
−2 −0.5 −4 −1
−6 −8
−1.5
−10 0
5
−2 −4
10
−2
Re s
−1
0
2
Re Go (s)
Bild 4.6. Nyquist-Pfad und sein Go (s)-Bild f¨ ur Beispiel 4.6. z r
k
P (s)
y
Bild 4.7. Standard-Regelkreis mit konstanter Regler-Verst¨ arkung
Dann m¨ ochte man aus dem Bild von P (s) schließen, f¨ ur welchen k-Wertebereich der Standard-Regelkreis gem¨ aß Bild 4.7 stabil ist. Das allgemeine StreckerNyquist-Kriterium (Satz 4.3) kann nun wie folgt umformuliert werden: Satz 4.5 Besitzt P (s) genau (n+ + no ) Polstellen auf der abgeschlossenen rechten Halbebene, so ist der Standard-Regelkreis aus Bild 4.7 genau dann stabil, wenn die Nyquist-Bildkurve von P (s) den Punkt (− k1 , j0) nicht durchl¨auft und genau (n+ + no )-mal im Gegenuhrzeigersinn umkreist.
4.4 Stabilit¨ atskriterium von Strecker-Nyquist
181
0.04
ω 0.03
Im P (s)
0.02
0.01
Asymptote ω
0
=
±
∞
Stabilit¨ atsbereich f¨ ur − k1
−0.01
−0.02
−0.03
−0.04 −0.1
−0.09
−0.08
−0.07
−0.06
−0.05
−0.04
−0.03
−0.02
−0.01
0
0.01
Re P (s) Bild 4.8. Nyquist-Bildkurve von P (s) f¨ ur |ω| > 0.68 zu Beispiel 4.7
Beispiel 4.7
Sei
P (s) =
s+1 . s(s − 1)(s2 + 4s + 20)
Offenbar gilt n+ = 1 und n0 = 1. Bild 4.8 zeigt P (s), wobei der Teil des NyquistPfades in der N¨ ahe von s = 0 ausgespart wurde, weil |P (s)| → ∞ mit |s| → 0. Die ins Unendliche gehenden bzw. aus dem Unendlichen kommenden Abschnitte haben die Gerade Re P (s) = −0.09 als Asymptote, was man mit einer kleinen Nebenrechnung nachweisen kann. Das Bild des kleinen Bogens, auf dem der Nyquist-Pfad an der Polstelle bei s = 0 in die linke s-Halbebene ausweicht, erscheint in der Bildebene als großer Halbkreis, der das Gebiet rechts der Asymptote im Gegenuhrzeigersinn uml¨ auft. (Aus Maßstabsgr¨ unden wurde dieser große Halbkreis in Bild 4.8 nicht sichtbar gemacht.) Das hervorgehobene Intervall auf der reellen Achse wird zweimal im Gegenuhrzeigersinn vom Bild des Nyquist-Pfades umschlungen. Folglich ist das geregelte System stabil f¨ ur Reglerverst¨ arkungswerte k mit − 0.03944 ≤ −
1 ≤ −0.01864, k
d. h.
25.35 ≤ k ≤ 53.65.
182
4 Grundkonzepte der linearen Regelungstheorie
4.4.3 Nutzung des Strecker-Nyquist-Kriteriums in der regelungstechnischen Praxis ¨ Wenn eine rationale Ubertragungsfunktion Go (s) des offenen Regelkreises keine Polstellen mit Re s ≥ 0 besitzt, oder wenn der einzige instabile Pol bei s = 0 liegt, so ist es nicht erforderlich, das vollst¨andige Bild des oben definierten Nyquist-Pfades zu betrachten. Vielmehr gen¨ ugt es, nur einen Teil des Nyquist-Pfades zu durchlaufen, um aus dessen Bild auf das Stabilit¨ atsverhalten des geschlossenen Regelkreises schließen zu k¨onnen.
0
−0.5
Im Go (jω)
−1
−1.5
−2
−2.5
−3
−3.5
ω −4
−1
0
1
2
3
Re Go (jω)
4
5
Bild 4.9. Ortkurve Go (jω) f¨ ur 0.01 ≤ ω ≤ 10 zu Beispiel 4.9
¨ Satz 4.6 (Vereinfachtes Strecker-Nyquist-Kriterium) Ist die Ubertragungsfunktion Go (s) des offenen Regelkreises stabil oder besitzt sie nur einen instabilen Pol, und zwar bei s = 0, so ist der geschlossene Regelkreis genau dann stabil, wenn beim Durchlaufen der Ortskurve des Frequenzganges Go (jω) mit wachsendem ω (f¨ ur 0 < ω < ∞) der kritische Punkt (−1, j0) links“ von der Ortskurve liegt. ” 1 reicht das vereinBeispiel 4.8 F¨ur das o. a. Beispiel 4.5 mit Go (s) = s(s+1)(s+2) fachte Strecker-Nyquist-Kriterium zur Stabilit¨ atspr¨ ufung aus, vgl. Bild 4.5. Zo (s) No (s)
5 = (s+1) 3 ist der offene Regelkreis stabil. Die Ortskurve zu Go (jω) l¨ asst den kritischen Punkt (−1, j0) links“ liegen (siehe Bild ” 4.9). Folglich ist der geschlossene Regelkreis stabil.
Beispiel 4.9 F¨ur Go (s) =
4.4 Stabilit¨ atskriterium von Strecker-Nyquist
183
Aus dem vereinfachten Strecker-Nyquist-Kriterium l¨asst sich eine einfache Schlussfolgerung ziehen, der sog. Satz von der kleinen Kreisverst¨ arkung (small gain theorem): Bei ¨ einer stabilen Ubertragungsfunktion Go (s) des offenen Regelkreises ist der geschlossene Regelkreis gewiss stabil, wenn |Go (jω)| < 1 f¨ ur 0 ≤ ω < ∞ gilt. Ohne Beweis sei angemerkt, dass das vereinfachte Strecker-Nyquist-Kriterium oft auch auf Systeme mit einer Nacheilung (oder Lauf- oder Totzeit) angewendet werden kann.
0.6 0.4
Im Go (jω)
0.2 0 −0.2 −0.4 −0.6 −0.8 −1 −1.2
ω
−1.4
−1
−0.5
0
0.5
Re Go (jω)
1
1.5
Bild 4.10. Ortskurve Go (jω) f¨ ur 0.01 ≤ ω ≤ 10 zu Beispiel 4.10
¨ Beispiel 4.10 Betrachtet wird die Ubertragungsfunktion Go (s) = 1.5
e−sTL ; (s + 1)2
TL = 2.
Die Ortskurve Go (jω) in Bild 4.10 l¨ asst den kritischen Punkt (−1, j0) links“ liegen. ” Der geschlossene Regelkreis ist stabil.
4.4.4 Maße f¨ ur Stabilit¨ atsreserven im SISO-Standardregelkreis In der regelungstechnischen Praxis kann man sich bei Stabilit¨atsuntersuchungen nicht auf die Alternative stabil“ oder nicht stabil“ beschr¨anken. ” ” Aufgrund der unvermeidlichen Unbestimmtheiten bei der Aufstellung des Streckenmodells m¨ ochte man auch voraussehen, ob geringf¨ ugige Parameter¨ anderungen zur Uberschreitung der Stabilit¨ atsgrenze f¨ uhren oder ob gr¨oßere ¨
184
4 Grundkonzepte der linearen Regelungstheorie
Stabilit¨ atsreserven vorliegen.
1.5
1
Im Go (jω)
0.5
∆
−1
0
ω=0 A
−0.5
ϕr
arc Go (jωD ) Go (jωD )
−1
−1.5
Go (jω)
−2
ω w¨ achst −2.5 −1.5
−1
−0.5
0
0.5
1
1.5
Re Go (jω)
2
2.5
3
3.5
Bild 4.11. Maße f¨ ur die Stabilit¨ atsreserve, dargestellt am Beispiel Go (s) =
3 (s+1)3
Im Falle der Anwendbarkeit des vereinfachten Strecker-Nyquist-Kriteriums liefert der Abstand“ der Ortskurve Go (jω) vom kritischen Punkt (−1, j0) ” ein Maß f¨ ur die vorhandene Stabilit¨ atsreserve. Der Abstand“ kann unter ” verschiedenen Aspekten gesehen werden (vgl. Bild 4.11). In der regelungstechnischen Praxis sind die folgenden drei Abstandsmaße gebr¨auchlich: 1. Die Phasenreserve (phase margin) ϕr = 180◦ +arcGo (jωD ) an der Durchtrittsfrequenz ωD (gain cross-over frequency, definiert durch die Bedingung |Go (jωD )| = 1), 1 1 2. die Betragsreserve (gain margin) = an der Frequenz ωπ |Go (jωπ | ∆ (phase cross-over frequency, definiert durch die Bedingung arc Go (jωπ ) = −π), 3. der minimale (euklidische) Abstand A mit
A = min |1 + Go (jω)| = max
ω
ω
−1 F F −1
F F 1 1
F F = F . 1 + Go (jω)
1 + Go (s) F∞
Das zuletzt eingef¨ uhrte Symbol · ∞ bezeichnet die sog. ∞−Norm der ¨ Ubertragungsfunktion zwischen den Doppelstrichen (vgl. Abschnitt 5.2).
4.5 SISO-Standardregelkreis mit PID-Reglern
185
4.5 SISO-Standardregelkreis mit PID-Reglern Bei den industriellen Anwendungen der Regelungstechnik spielen PID-Regler eine u ¨ berragende Rolle. Etwa 95 Prozent aller industriell eingesetzten Regler sind vom PID-Typ [AH95]. Obwohl schon u ¨ber 60 Jahre im Einsatz, erw¨ ahnt sei die Pionierarbeit von Ziegler und Nichols [ZN42], geht das praktische Interesse an diesem Reglertyp nicht zur¨ uck. Nach wie vor werden im¨ mer wieder neue Einstellregeln f¨ ur PID-Regler publiziert. Einen Uberblick u ¨ ber den Stand der Technik gibt das Handbuch [O’D03]. Hier kann und soll darauf nicht n¨ aher eingegangen werden. Jedoch wollen wir dem SISOStandardregelkreis mit einer PID-Regler-Struktur unter dem Gesichtspunkt der Stabilit¨ at des Regelkreises bei variierbaren Reglerparametern behandeln. Das ist eine moderne Forschungsthematik, zu der die Monographie [DHB00] einen wesentlichen Beitrag leistete. ¨ Der PID-Regler besitzt die Ubertragungsfunktion K(s) = kP + kI · s−1 + kD · s =
kI + kP s + kD s2 s
Z(s) Bei einem Streckenmodell P (s) = N (s) mit grad N (s) = n, grad Z(s) = m ergibt sich das charakteristische Polynom des Regelkreises zu
CLCP(s) = s · N (s) + (kI + kP s + kD s2 ) · Z(s)
(4.4)
Im folgenden wird die Stabilit¨ at dieses Polynoms in Abh¨angigkeit von den drei Einstellparametern kI , kP und kD untersucht. 4.5.1 Berechnung aller stabilisierenden P-Regler Zuerst diskutieren wir den Spezialfall des P-Reglers. Das charakteristische Polynom (4.4) vereinfacht sich dabei auf CLCP(s) = N (s) + kP · Z(s) ,
grad CLCP(s) = n∗ = max{n, m} . (4.5)
Gefragt wird nach der Stabilit¨ at des charakteristischen Polynoms in Abh¨ angigkeit von dem reellen Parameter kP . Zwei Zug¨ange zur Behandlung dieses Stabilit¨ atsproblems wurden schon behandelt, einerseits die Wurzelortskurven (WOK) und andererseits die Strecker-Nyquist-Stabilit¨atss¨atze f¨ ur SISO-Systeme. Nun soll noch ein dritter Weg beschritten werden, weil er eine Erweiterung auf den allgemeinen PID-Regler erm¨oglicht. Einem Vorschlag von [DHB00] folgend, multiplizieren wir das charakteristische Polynom (4.5) mit Z(−s) und untersuchen das dadurch entstehende Polynom f (s) = CLCP(s) · Z(−s) = N (s) · Z(−s) + kP Z(s)Z(−s) auf Stabilit¨ at.
(4.6)
186
4 Grundkonzepte der linearen Regelungstheorie
Unter Benutzung der im Abschnitt 3.5.1 auf Seite 136 eingef¨ uhrten Bezeichnungen gilt f¨ ur die Nullstellenlagen des Polynoms (4.6): n− (f ) − n+ (f ) = n− (CLCP) − n+ (CLCP) + n− (Z(−s)) − n+ (Z(−s)) = n− (CLCP) − n+ (CLCP) + n+ (Z(s)) − n− (Z(s)) . Da die Nullstellen von Z(s) bekannt sind und damit die Zahlen n+ (Z), n− (Z) vorliegen, bereitet der R¨ uckschluss von f (s) auf CLCP(s) keine M¨ uhe. Insbesondere weiß man, dass das charakteristische Polynom (4.5) genau dann stabil ist, wenn grad CLCP(s) = n− (CLCP) wird, also n− (f ) − n+ (f ) = n∗ + n+ (Z) − n− (Z)
(4.7)
gilt. Bei der Routhschen Zerlegung des Polynoms f (s) erhalten wir ∗ f (jω) = j n +m f1 (ω) − jf2 (ω) = N (jω) · Z(−jω) + kP Z(jω) · Z(−jω) = N (jω) · Z(−jω) + kP |Z(jω|2 (4.8) und erkennen: Der Parameter kP kommt entweder in f1 (ω) oder in f2 (ω) vor, niemals aber in beiden Funktionen zugleich. ¨ Nun lassen sich die Uberlegungen des Abschnittes 3.5.1 gewinnbringend nutzen. Falls kP in f2 (ω) vorkommt, so wird mit Satz 3.11 gearbeitet, andernfalls mit Satz 3.12. Beispiel 4.11 Zu kl¨aren sei, ob und ggf. wie sich die instabile und nichtminimal¨ phasige Strecke mit der Ubertragungsfunktion P (s) =
Z(s) s−1 = s3 + 2s2 + s + 4 N (s)
durch einen P-Regler stabilisieren l¨ asst. Ersichtlich gilt n∗ = n = 3, m = 1, n+ (Z) = 1, n− (Z) = 0 und f (s) = CLCP(s) · Z(−s) = (s3 + 2s2 + s + 4)(−s − 1) + kP (s − 1)(−s − 1) = −(s4 + 3s3 + 3s2 + 5s + 4 + kP s2 − kP ) ,
f (jω) = −j 4 ω 4 − (3 + kP )ω 2 + 4 − kP − j[3ω 3 − 5ω] Die Stabilit¨ atsbedingung (4.7) ergibt sich f¨ ur das Beispiel zu n− (f ) − n+ (f ) = 3 + 1 − 0 = 4.
Wegen f1 (ω) = −(ω 4 − (3 + kP )ω 2 + 4 − kP ), f2 (ω) = −3ω 3 + 5ω wird der Satz 3.12 herangezogen. Die Funktion f2 (ω) hat nichtnegative endliche Nullstellen bei ω0 = 0
atsbedingung f¨ ur und ω1 = 53 . Der im Satz 3.13 formulierten notwendigen Stabilit¨ uge getan. Der Satz 3.12 ergibt f2 (ω) ist damit Gen¨
4.5 SISO-Standardregelkreis mit PID-Reglern n− (f ) − n+ (f ) = −
1 2
sign
− sign −
1 2
f1 (+0) f1 (−0) − sign f2 (+0) f2 (−0)
f1 (ω1 + 0) f1 (ω1 − 0) − sign f2 (ω1 + 0) f2 (ω1 − 0)
sign
f1 (−∞) f1 (∞) − sign f2 (−∞) f2 (∞)
187
Um die rechte Seite auf den geforderten Wert 4 zu bringen, m¨ ussen die runden Klammern ausnahmslos die Werte (−2) beitragen. Dies wird erreicht, wenn f1 (0) < 0, f1 (ω1 ) > 0, f1 (∞) < 0 und f1 (−∞) < 0 wird. Die dritte und die vierte Ungleichung sind offensichtlich erf¨ ullt. Die erste Ungleichung gilt f¨ ur kP < 4, und die zweite Ungleichung f¨ ur f1 (ω1 ) = −ω14 + 3ω12 − 4 + kP (ω12 + 1) > 0 , also ω14 − 3ω12 + 4 = ω12 + 1
kP >
25 9
−5+4 2 = 3 +1
5 3
Ergebnis: Der P-Regler stabilisiert die gegebene Strecke, wenn der Reglerparameter kP im Bereich 23 < kP < 4 eingestellt wird.
Die Beziehung (4.8) erlaubt hilfreiche Schlussfolgerungen f¨ ur die praktische Ausf¨ uhrung des Rechenverfahrens: 1. Falls n∗ + m eine gerade Zahl ist, geh¨ ort kP stets zur Funktion f1 (ω), und der kP -Parameterbereich muss mit Satz 3.12 ermittelt werden. An den f2 -Nullstellen ωλ gilt & ' ∗ f1 (ωλ ) = j −(n +m) N (jωλ ) · Z(−jωλ ) + kP |Z(jωλ )|2 . uckDie Ungleichungen f1 (ωλ ) < > 0 sind daher (bis auf das noch zu ber¨ 2 sichtigende Vorzeichen ) direkt in der Form N (jωλ ) · Z(−jωλ ) N (jωλ ) 1 kP < > Z(−jω ) · Z(jω ) = Z(jω ) = P (jω ) λ λ λ λ auswertbar (vgl. Strecker-Nyquist-Kriterium, Satz 4.5). 2. Falls n∗ + m eine ungerade Zahl ist, geh¨ ort kP stets zur Funktion f2 (ω), und es ist mit Satz 3.11 zu arbeiten. An den f1 -Nullstellen ωµ gilt ∗
f2 (ωµ ) = j −(n
+m−1)
& ' N (jωµ ) · Z(−jωµ ) + kP |Z(jωµ )|2 .
und die kP -Parameterbereichsgrenzwerte ergeben sich aus (P (jωµ ))−1 . 2
∗
Hier gilt j −(n +m) = 1, falls (n∗ + m) durch 4 teilbar ist; andernfalls wird ∗ j −(n +m) = −1.
188
4 Grundkonzepte der linearen Regelungstheorie
4.5.2 Berechnung aller stabilisierenden PI-Regler und PD-Regler Werden PI-Regler K(s) = kP + kI · s−1 eingesetzt, so lautet das charakteristische Polynom des geschlossenen Regelkreises CLCP(s) = s·N (s) + (kI + kP s)·Z(s) ,
grad CLCP = n∗ =: 1 + max(n, m)
Multiplikation mit Z(−s) f¨ uhrt auf das Polynom f (s) = CLCP(s) · Z(−s) = s · N (s)Z(−s) + (kI + kP s)Z(s)Z(−s) , (4.9) das der Stabilit¨ atsuntersuchung zugrunde gelegt wird. F¨ ur seine Nullstellen gilt allgemein n− (f ) − n+ (f ) = n− (CLCP) − n+ (CLCP) + n+ (Z(s)) − n− (Z(s)) Der Regelkreis ist genau dann stabil, wenn sich n− (f ) − n+ (f ) = n∗ + n+ (Z) − n− (Z)
(4.10)
ergibt. Aus der Routhschen Zerlegung ∗ f (jω) = j (n +m) f1 (ω) − jf2 (ω) = jωN (jω)Z(−jω) + (kI + kP jω)|Z(jω)|2 ist ablesbar, dass einer der beiden Parameter kI , kP nur in f1 und der andere nur in f2 vorkommt, und zwar jeweils in affiner Abh¨angigkeit, vgl. Abschnitt 3.6.2.1. Fixiert man einen der beiden Parameter auf einen festen Wert, so l¨asst sich der zul¨ assige Parameterbereich des zweiten Parameters nach der Methode, die im Abschnitt 4.5.1 behandelt wurde, ermitteln. Wenn nun der erste Parameter der Reihe nach verschiedene Werte aus einem nicht zu weiten Raster annimmt und jeweils der zul¨ assige Wertebereich des zweiten Parameters berechnet wird, erh¨ alt man eine Vorstellung u ¨ ber den zul¨assigen zweidimensionalen Parameterbereich in der (kI , kP )-Ebene. Beispiele zeigen, dass der zul¨ assige zweidimensionale Parameterbereich nicht unbedingt konvex ist, ja nicht einmal zusammenh¨ angend sein muss. Mit Hilfe des Satzes 3.13 und der Wurzelortskurven-Technik (vgl. Abschnitt 3.6.2.1) lassen sich bestimmte Intervalle auf der Parameterachse des ersten Parameters mit Sicherheit als unzul¨ assig ausweisen. Dadurch wird der Rechenaufwand erheblich reduziert. Beispiel 4.12 Betrachtet wird das aus Beispiel 4.11 bekannte Streckenmodell P (s) =
Z(s) s−1 = s3 + 2s2 + s + 4 N (s)
Mit dem PI-Regler-Ansatz K(s) = kP + kI · s−1 ergibt sich das charakteristische Polynom des Regelkreises zu
4.5 SISO-Standardregelkreis mit PID-Reglern
189
CLCP(s) = s · N (s) + (kI + kP · s) · Z(s) = s4 + 2s3 + (1 + kP )s2 + (4 + kI − kP )s − kI . Eine erste offensichtliche Einschr¨ ankung des (kP , kI )-Parameterbereichs liefert die Stodola-Bedingung f¨ ur stabile Polynome: kP > −1 ,
kI < 0.
Der Ansatz (4.9) liefert f (s) = CLCP(s) · (−s − 1) = −s5 − 3s4 − (3 + kP )s3 − (5 + kI )s2 − (4 − kP )s + kI Wegen (4.10) ist der Regelkreis genau dann stabil, wenn n− (f ) − n+ (f ) = 4 + n+ (Z) − n− (Z) = 4 + 1 − 0 = 5.
(4.11)
Die Routhsche Zerlegung f (jω) = j f1 (ω) − jf2 (ω) f¨ uhrt auf 5
f1 (ω) = −ω 5 + (3 + kP )ω 3 − (4 − kP )ω , f2 (ω) = −3ω 4 + (5 + kI )ω 2 + kI . Um der Bedingung (4.11) gen¨ ugen zu k¨ onnen, ist es nach Satz 3.13 notwendig, dass sowohl f1 (ω) als auch f2 (ω) zwei positive Nullstellen besitzen. Mit Hilfe der Wurzelortskurven-Software, die insbesondere die Control System Toolbox von MATLAB zur Verf¨ ugung stellt, f¨ allt es nicht schwer, die kP - und kI Wertebereiche rechnergest¨ utzt zu gewinnen, f¨ ur die f1 (ω) bzw. f2 (ω) zwei positive reelle Nullstellen haben. Im vorliegenden Beispielfalle kommt man aber auch noch ohne diese spezielle Software zum Ziel: Diejenigen kP − bzw. kI −Werte, an denen sich die Anzahl der reellen Nullstellen a ¨ndert, entsprechen Verzweigungspunkten der Wurzelortskurve (WOK). Folglich kann man die fraglichen Werte mit der Konstruktionsregel 8., die im Abschnitt 3.6.2.1 bewiesen wurde, berechnen. An den Nullstellen von f1 (ω) gilt kP (ω) =
ω 5 − 3ω 3 + 4ω ω 4 − 3ω 2 + 4 = 3 ω +ω ω2 + 1
f¨ ur
ω = 0 ,
an den Verzweigungspunkten der WOK kommt die zus¨ atzliche Bedingung d k (ω) = 0 hinzu. Sie f¨ uhrt auf die Gleichung dω P d d (ω 4 − 3ω 2 + 4) − (ω 4 − 3ω 2 + 4) dω (ω 2 + 1) (ω 2 + 1) dω
= (2ω 4 + 4ω 2 − 14)ω = 0 √ orenden Paramit der positiven reellen osung ω 1 = −1 + 2 2 und dem zugeh¨ √ L¨ meterwert kP (ω 1 ) = 4 2 − 5. Die triviale L¨ osung ω 0 = 0 ergibt kP (ω 0 ) = 4. Der zul¨ assige kP -Wertebereich, von atzt dem bisher nur kP > −1 bekannt war, kann nun wesentlich genauer abgesch¨ werden: √ 4 2 − 5 < kP < 4.
190
4 Grundkonzepte der linearen Regelungstheorie
W¨ ahlt man zur Probe den Wert kP = 2, so hat das zugeh¨ orende Polynom ¬
f1 (ω)¬k
= −ω 5 + 5ω 3 − 2ω
P =2
tats¨ achlich zwei positive reelle Wurzeln, n¨ amlich ω1
=
5−
√
√
17
2
und
ω2 = 5+ 2 17 . In analoger Weise l¨ asst sich der kI -Wertebereich durch Betrachtung der Funkatzen. Aus der Nullstellenbedingung tion f2 (ω) absch¨ kI (ω) = und der WOK-Verzweigungsbedingung
3ω 4 − 5ω 2 ω2 + 1 d k (ω) dω I
= 0 folgt die Gleichung
d d (ω 2 + 1) dω (3ω 4 − 5ω 2 ) − (3ω 4 − 5ω 2 ) dω (ω 2 + 1) = 6ω 5 + 12ω 3 − 10ω = 0
orenden Paramit der positiven reellen L¨ osung ω1 = −1 + 2 23 und dem zugeh¨ √ meterwert kI (ω1 ) = −11 + 4 6. Die triviale L¨ osung ω0 = 0 ergibt kI (ω0 ) < 0. azisiert zu Der bisher bekannte Sachverhalt kI < 0 wurde damit pr¨ √ −11 + 4 6 < kI < 0.
Generell erm¨ oglicht es der Satz 3.13 in Verbindung mit der Konstruktionsregel 8. f¨ ur Wurzelortskurven, den zul¨ assigen Parameterbereich in einen oder mehrere Rechteckbereiche der (kP , kI )-Ebene einzuschließen. Die tats¨achliche, geometrisch meist nicht einfach beschreibbare Gestalt l¨asst sich mit der gew¨ unschten Genauigkeit ermitteln, indem man einen der Parameter auf einen zul¨ assigen Wert fixiert und den zugeh¨ orenden Bereich des zweiten Parameters mit Hilfe der S¨ atze 3.11 oder 3.12 exakt berechnet. Wenn man die fixierten Werte systematisch mit einer angemessenen Schrittweite ¨andert und jedesmal den zugeh¨ orenden zul¨ assigen Wertebereich des zweiten Parameters exakt berechnet, gewinnt man sukzessive ein brauchbares Bild des zul¨assigen zweidimensionalen Parameterbereiches in der (kP , kI )-Ebene. Beispiel 4.13 F¨ur die Regelstrecke P (s) =
s−1 , s3 + 2s2 + s + 4
werden soll, liegt der die mit einem PI-Regler K(s) = kP + kI · s−1 stabilisiert √ zul¨ assige kP < 4, √ (kP , kI )-Parameterbereich im Rechteck 4 2 − 5 < √ −11+4 6 < kI < 0, vgl. Beispiel 4.12. Bei festgehaltenem kI ∈ (−11+4 6, 0) wird atsforderung der zugeh¨ orende kP -Wertebereich unter Zugrundelegung der Stabilit¨ (4.11) mit Satz 3.12 berechnet. F¨ ur kI = −1.2 besitzt das Polynom f2 (ω)
kI =−1.2
= −3ω 4 + 3.8ω 2 − 1.2
4.5 SISO-Standardregelkreis mit PID-Reglern
191
die positiven reellen Nullstellen ω1 = 0.774597, ω2 = 0.816497, wobei f2 (ω1 − 0) < 0, f2 (ω1 + 0) > 0, f2 (ω2 − 0) > 0, f2 (ω2 + 0) < 0. Die Stabilit¨ atsbedingung 5=
sign
f1 (ω1 + 0) f1 (ω1 − 0) − sign f2 (ω1 − 0) f2 (ω1 + 0)
+ sign
f1 (ω2 − 0) f1 (ω2 + 0) − sign f2 (ω2 − 0) f2 (ω2 + 0)
+
1 2
sign
f1 (+∞) f1 (−∞) − sign f2 (+∞) f2 (−∞)
wird erf¨ ullt, falls f1 (ω1 ) < 0 und f1 (ω2 ) > 0 ausf¨ allt. Damit gleichwertig sind die kP -Bedingungen kP <
ω14 − 3ω12 + 4 = 1.600000 , ω12 + 1
kP >
ω24 − 3ω22 + 4 = 1.466667 . ω22 + 1
Setzt man kI = −0.5 fest, so hat das Polynom f2 (ω)|kI =−0.5 = −3ω 4 + 4.5ω 2 − 0.5 die positiven reellen Nullstellen ω1 = 0.347631, ω2 = 1.174373, wobei wiederum gilt f2 (ω1 − 0) < 0, f2 (ω1 + 0) > 0, f2 (ω2 − 0) > 0, f2 (ω2 + 0) < 0. Die Stabilit¨ atsbedingung wird erf¨ ullt f¨ ur kP <
ω14 − 3ω12 + 4 = 3.258306 , ω12 + 1
ω24 − 3ω22 + 4 = 0.741694 . ω22 + 1 √ Fixiert man andererseits kP ∈ (4 2 − 5, 4) , setzt also beispielsweise kP = 1, so muss der zugeh¨ orende kI -Wertebereich mit Hilfe des Satzes 3.11 bestimmt werden: Das Polynom f (ω)|kP =1 = −ω 5 +4ω 3 −3ω hat die positiven reellen Wurzeln ω1 = 1 1 √ und ω2 = 3, wobei f1 (ω1 − 0) < 0, f1 (ω1 + 0) > 0, f1 (ω2 − 0) > 0, f1 (ω2 + 0) < 0. Um der Stabilit¨ atsbedingung kP >
5=
1 2
sign
f2 (+0) f2 (−0) − sign f1 (+0) f1 (−0)
2 +
sign
µ=1
f2 (ωµ + 0) f2 (ωµ − 0) − sign f1 (ωµ + 0) f1 (ωµ − 0)
zu gen¨ ugen, muss f2 (0) < 0, f2 (ω1 ) > 0, f2 (ω2 ) < 0 sein, mithin kI <
3ω24 − 5ω22 =3, ω22 + 1
kI >
3ω12 − 5ω12 = −1 , ω12 + 1
kI <
0 = 0; 1
zusammengefasst, −1 < kI < 0 . Das Bild 4.12 veranschaulicht die f¨ ur das Beispiel gewonnenen Ergebnisse. Der aus Satz 3.13 ermittelte rechteckige Einschließungsbereich wurde gestrichelt eingetragen, die drei Parameterintervalle bei den fixierten Werten kP = 1, kI = −0.5 und kI = −1.2 als durchgezogene starke Linien. Der numerisch bestimmte komplette ont. zul¨ assige Parameterbereich in der (kP , kI )-Ebene erscheint im Bild grau get¨
192
4 Grundkonzepte der linearen Regelungstheorie
kI
0
−0.5
−1
0
0.5
1
1.5
2
2.5
3
3.5
4
kP Bild 4.12. Veranschaulichung der Ergebnisse zu Beispiel 4.13 Z(s) Nicht alle Regelstrecken P (s) = N (s) , denen man in der regelungstechnischen Praxis begegnet, lassen sich mit PI-Reglern stabilisieren. Mit den hier diskutierten Methoden kann man definitiv entscheiden, in welchen F¨allen dies nicht m¨ oglich ist. Trifft dies zu, so kann gegebenenfalls die Hinzunahme eines Regler-D-Anteils weiterhelfen. Beim PD-Regler K(s) = kP + kD s lautet das auf Stabilit¨ at zu pr¨ ufende Polynom
CLCP(s) = N (s) + (kP +kD s)·Z(s) ,
grad CLCP(s) = n∗ =: max(n, m+1).
Um den Einfluss von kP und kD zu trennen, multiplizieren wir das charakteristische Polynom CLCP(s) mit Z(−s) und untersuchen das Polynom f (s) = CLCP(s) · Z(−s), denn in dessen Routhscher Zerlegung ∗ f (jω) = j n +m f1 (ω) − jf2 (ω) kommt einer der beiden Parameter nur in f1 und der andere nur in f2 vor. Der Regelkreis ist genau dann stabil, wenn n− (f ) − n+ (f ) = n− (CLCP) − n+ (CLCP) + n+ (Z(s)) − n− (Z(s)) = n∗ + n+ (Z) − n− (Z) gilt. Auf der Basis der S¨ atze 3.11, 3.12, 3.13 kann die Ermittlung der stabilisierenden Parameterbereiche auf die gleiche Weise erfolgen, wie es f¨ ur PI-Regler im Detail vorgef¨ uhrt wurde. Beispiel 4.14 Die Regelstrecke P (s) =
Z(s) 1 = (s2 − 1)(s + 4) N (s)
kann mit einem PI-Regler nicht stabilisiert werden; denn das charakteristische Polynom des Regelkreises CLCP(s) = s(s2 − 1)(s + 4) + (kI + kP · s) = s4 + 4s3 − s2 + (kP − 4)s + kI gen¨ ugt nicht der Stodola-Bedingung und ist deshalb f¨ ur alle Wertepaare (kP , kI ) ∈ R2 instabil.
4.5 SISO-Standardregelkreis mit PID-Reglern
193
Der Versuch, die Stabilisierung mit einem PD-Regler zu erreichen, f¨ uhrt auf das charakteristische Polynom CLCP = (s2 − 1)(s + 4) + (kP + kD s) = s3 + 4s2 + (kD − 1)s + kP − 4 . Auf Grund der Stodola-Bedingung kann f¨ ur Parameterwerte kD > 1 und kP > 4 die Stabilisierungsm¨ oglichkeit nicht von vornherein ausgeschlossen werden. Der Regelkreis ist genau dann stabil, wenn f¨ ur das Polynom f (s) = CLCP(s) · Z(−s) = CLCP(s) die Beziehung n− (f ) − n+ (f ) = n∗ + n+ (Z) − n− (Z) = 3 + 0 − 0 = 3. gilt. Die Routhsche Zerlegung lautet f (jω) = j 3 (f1 (ω) − jf2 (ω)) , f1 (ω) = ω 3 − (kD − 1)ω ,
wobei
f2 (ω) = 4ω 2 + (4 − kP ) .
In Anbetracht der Kleinheit des Beispiels lohnt es nicht, die weitere Untersuchung auf der Basis der S¨ atze 3.11, 3.12, 3.13 fortzuf¨ uhren. Vielmehr kann das Routhsche Rechenschema ohne weiteres zur Stabilit¨ atspr¨ ufung des CLCP benutzt werden: 1 kD − 1 4 kP − 4 − 41 1 kD − 4 kP kP − 4 Aus der ersten Spalte gewinnt man den zul¨ assigen Parameterbereich zu kP > 4, kD > 14 kP , vgl. Bild 4.13. 4 3.5 3
kD
2.5 2 1.5 1 0.5 0
0
1
2
3
4
kP
5
6
7
8
Bild 4.13. Veranschaulichung des Ergebnisses zu Beispiel 4.14
194
4 Grundkonzepte der linearen Regelungstheorie
4.5.3 Berechnung aller stabilisierenden PID-Regler Werden PID-Regler K(s) = kP + kI · s−1 + kD · s zur Regelung von RegelZ(s) strecken P (s) = N (s) eingesetzt, so muss das charakteristische Polynom des Regelkreises CLCP(s) = s · N (s) + (kI + kP s + kD s2 )Z(s) mit
(4.12)
∗
grad CLCP(s) = n =: max(n + 1, m + 2)
stabil sein. Wie in den beiden vorangehenden Abschnitten multiplizieren wir (4.12) mit Z(−s) und untersuchen das Polynom f (s) = CLCP(s) · Z(−s) = s · N (s) · Z(−s) + (kI + kP s + kD s2 )Z(s)Z(−s) Der Regelkreis ist genau dann stabil, wenn n− (f ) − n+ (f ) = n∗ + n+ (Z(s)) − n− (Z(s))
(4.13)
gilt. Aus der Routhschen Zerlegung ∗
f (jω) = j n
+m
(f1 (ω) − jf2 (ω)
= jωN (jω)Z(−jω) + (kI + kP jω − kD ω 2 )|Z(jω)|2 geht hervor, dass kP nur in einer der beiden Funktionen f1 , f2 vorkommt, und zwar in affiner Abh¨ angigkeit, w¨ ahrend die andere Funktion affin von kI − kD ω 2 abh¨ angt. Die S¨ atze 3.11, 3.12, 3.13 werden nun so eingesetzt, dass diejenige der Funktionen f1 und f2 , in der kP als Parameter vorkommt, bei den Quotienten f2 (ω) f1 (ω f1 (ω bzw. f2 (ω) jeweils im Nenner erscheint. angt affin von kP ab. Zuerst wird mit Blick auf Satz Angenommen, f2 h¨ 3.13 gepr¨ uft, ob f2 (ω) ausreichend viele positive reelle Nullstellen besitzen kann, die zur Erf¨ ullung der Stabilit¨ atsbedingung (4.13) notwendigerweise vorhanden sein m¨ ussen. Dann wird mit der Wurzelortskurven-Technik der kP -Bereich ermittelt, f¨ ur den f2 (ω) die erforderliche Anzahl von Nullstellen tats¨ achlich hat. Zu jedem festgehaltenen zul¨ assigen kP -Wert werden anschließend die nichtnegativen reellen Wurzeln von f2 (ω; kP ) exakt berechnet und mit ωλ (λ = 0, 1, 2, . . .) bezeichnet. Abschließend wird mit Satz 3.12 festgestellt, welches Vorzeichen die Funktion f1 (ω) an den Stellen ω = ωλ haben muss, um der Stabilit¨ atsbedingung (4.13) zu gen¨ ugen. Dabei ergeben sich Ungleichungen der Gestalt f1 (ωλ ) = f11 (ωλ ) + (kI − kD ωλ2 )f12 (ωλ ) < >0
(4.14)
mit reellen Zahlen f11 (ωλ ) und f12 (ωλ ), die nicht von den Parametern kI und kD abh¨ angen. Die Ungleichungen (4.14) definieren Halbebenen in der
4.5 SISO-Standardregelkreis mit PID-Reglern
195
(kI , kD )-Parameterebene. Da die Ungleichungen f¨ ur alle berechneten Werte ωλ (λ = 0, 1, 2, . . .) zugleich erf¨ ullt sein m¨ ussen, ergeben sich als zul¨assige Parameterbereiche eine oder mehrere konvexe Teilmengen der (kI , kD )-Ebene, die durch Geraden begrenzt sind. Wenn der Parameter kP affin in die Funktion f1 eingeht, so ¨andern sich ¨ die vorgetragenen Uberlegungen nicht wesentlich. Die Funktionen f1 und f2 vertauschen lediglich ihre Rolle. Beispiel 4.15 Erneut werde das Streckenmodell P (s) =
Z(s) s−1 = 3 N (s) s + 2s2 + s + 4
zugrundegelegt. Mit dem Regler K(s) =
kI + kP s + k D s 2 s
erhalten wir das charakteristische Polynom des Regelkreises zu CLCP(s) = s · N (s) + (kI + kP s + kD s2 )Z(s) = s4 + (2 + kD )s3 + (1 + kP − kD )s2 + (4 + kI − kP )s − kI Durch die Stodola-Bedingung werden den drei Entwurfsparametern offensichtliche Beschr¨ ankungen auferlegt, die man in einer Ungleichungskette zusammenschreiben kann: −2 < kD < kP + 1 < kI + 5 < 5. Die Multiplikation des CLCP(s) mit Z(−s) ergibt das Polynom f (s) = CLCP(s) · Z(−s) = −CLCP(s) · (s + 1) = −s5 − (3 + kD )s4 − (3 + kP )s3 − (5 + kI − kD )s2 − (4 − kP )s + kI . Der Regelkreis ist genau dann stabil, wenn n− (f ) − n+ (f ) = 4 + n+ (Z) − n− (Z) = 4 + 1 − 0 = 5 .
(4.15)
Die Routhsche Zerlegung von f (jω) liefert f (jω) = j 5 (f1 (ω) − jf2 (ω)) , 5
wobei
3
f1 (ω) = −ω + (3 + kP )ω − (4 − kP )ω f2 (ω) = −(3 + kD )ω 4 + (5 + kI − kD )ω 2 + kI = −3ω 4 + 5ω 2 + (kI − kD ω 2 )(1 + ω 2 ) Um der Stabilit¨ atsbedingung zu gen¨ ugen, m¨ ussen nach Satz 3.13 sowohl f1 (ω) als auch f2 (ω) notwendigerweise zwei reelle Nullstellen im offenen Intervall (0, ∞) besitzen. urfen wir auf Beispiel 4.12 zur¨ uckgreifen. Dort Bez¨ uglich der Nullstellen von f1 d¨ wurde gezeigt, dass f1 (ω) zwei positive reelle Wurzeln im Intervall
196
4 Grundkonzepte der linearen Regelungstheorie kP = 0.7
1
1
0
0
−1
−2
−3
−3 −2
0
2
kD
−4
4
kP = 2
2 1
1
0
0
−1
−2
−3
−3 −2
0
kD
2
kD
2
4
2
4
kP = 3
−4
4
0
−1
−2
−4
−2
2
kI
kI
−1
−2
−4
kP = 1
2
kI
kI
2
−2
0
kD
ur kP = 0.7, kP = 1, kP = 2 und kP = 3 Bild 4.14. Zul¨ assige (kD , kI )−Bereiche f¨ zu Beispiel 4.15 √ 4 2 − 5 < kP < 4 hat. Setzt man beispielsweise kP = 1, so findet man f¨ ur das Polynom ¬
f1 (ω)¬k
P =1
= −ω 5 + 4ω 3 − 3ω
√ die positiven Wurzeln ω1 = 1 und ω2 = 3 . . ., wobei f1 (ω1 −0) < 0, f1 (ω1 +0) > 0, atsbedingung (4.15) nimmt mit Satz f1 (ω2 − 0) > 0, f1 (ω2 + 0) < 0. Die Stabilit¨ 3.11 die Gestalt 5=
1 2
sign
f2 (−0) f2 (+0) − sign f1 (+0) f1 (−0)
2 +
sign
λ=1
f2 (ωλ − 0) f2 (ωλ + 0) − sign f1 (ωλ + 0) f1 (ωλ − 0)
an. Sie ist erf¨ ullt, wenn die drei Ungleichungen f2 (0) < 0 ,
f2 (1) > 0 ,
√ f2 ( 3) < 0
gelten. Eingesetzt in den o. a. Ausdruck f¨ ur f2 (ω) erhalten wir die folgenden Ungleichungen, denen die Parameter kD und kI gen¨ ugen m¨ ussen.
4.6 Regelg¨ ute eines SISO-Standardregelkreises
197
4 3.5
kP
3 2.5 2 1.5 1 0 −0.5
5
−1
4
−1.5
3 2
−2
1
−2.5
0 −3
kI
−1 −2
kD
Bild 4.15. Veranschaulichung des dreidimensionalen zul¨ assigen Parameterbereichs f¨ ur Beispiel 4.15
kI < 0, −3 + 5 + (kI − kD ) · 2 > 0 , −27 + 15 + (kI − 3kD ) · 4 < 0 ,
also also
kI − kD > −1, kI − 3kD < 3 .
Bild 4.14 zeigt die zul¨ assigen (kD , kI )−Bereiche f¨ ur mehrere kP −Werte. Indem man man den Parameterwert k assigen Bereich P systematisch im zul¨ √ kP ∈ (4 2 − 5; 4) variiert, gewinnt man eine Vorstellung von der Gesamtheit aller zul¨ assigen Parametertripel im dreidimensionalen (kI , kP , kD )−Parameterraum, vgl. Bild 4.15.
4.6 Regelgu ¨ te eines SISO-Standardregelkreises Unter der G¨ ute“ eines geregelten Systems versteht man dessen Eigenschaft, ” den quantitativ formulierten Wunschvorstellungen des Betreibers zu entsprechen. G¨ uteforderungen werden unter verschiedenen Aspekten und auf unterschiedliche Weise spezifiziert. Im Englischen hat sich die Bezeichnung per” formance specifications“ eingeb¨ urgert, die gelegentlich auch im deutschen Kontext auftaucht. Hier wird der damit gemeinte begriffliche Inhalt als Re” gelg¨ ute“ bezeichnet. Grunds¨ atzlich geht es um die Beantwortung der Frage,
198
4 Grundkonzepte der linearen Regelungstheorie
ob und wie sich zu einem gegebenen Modell der Regelstrecke ein Regler so entwerfen l¨ aßt, dass die an das geregelte System gestellten Forderungen erf¨ ullt werden. 4.6.1 Forderungen an die station¨ are Genauigkeit Auf Grund der prinzipiell vorausgesetzten Linearit¨at der betrachteten Regelkreise darf die Wirkungsweise der beiden externen Systemeing¨ange, n¨amlich der F¨ uhrungsgr¨ oße und der St¨ orgr¨ oße, separat untersucht werden. Das Zusammenspiel ergibt sich ohne weiteres aus dem linearen Superpositionsprinzip. Forderungen an das F¨ uhrungsverhalten (bei z(t) ≡ 0) Das Ausgangssignal y(t) soll dem F¨ uhrungssignal r(t) folgen“, die Regeldif” ferenz e(t) also im Laufe der Zeit verschwinden, d. h. e(t) → 0 f¨ ur t → ∞. Anders ausgedr¨ uckt: Man w¨ unscht keine bleibende Regeldifferenz“. ” Im Bildbereich berechnet man die Regeldifferenz E(s) zu E(s) = R(s) − Y (s) = GE R (s) · R(s) =
1 R(s) . 1 + P (s)K(s)
Falls die Funktion (s · E(s)) keine Pole f¨ ur Re s ≥ 0 besitzt, also stabil ist, liefert der Endwertsatz der Laplacetransformation den Endwert der Regeldifferenz, e(∞) = lim e(t) = lim (s · E(s)) = lim t→∞
s→0
s→0
s · R(s) . 1 + P (s)K(s)
¨ Ersichtlich kann lim e(t) = 0 nur dann eintreten, wenn die Ubertragungst→∞
funktion des offenen Regelkreises G0 (s) = P (s)K(s) die instabilen Pole von R(s) kompensieren kann, mithin gewissermaßen ein inneres Modell“ der in” stabilen Pole von R(s) enth¨ alt. Legt man insbesondere als F¨ uhrungsgr¨ oße ein Testsignal der Gestalt r0 m! m r(t) = r0 t 1(t), d.h. R(s) = m+1 , an, so muß G0 (s) mindestens s (m + 1)−fach integrierend sein, um die bleibende Regeldifferenz e(∞) zum Verschwinden zu bringen. Beispiel 4.16 Das F¨uhrungssignal sei eine Anstiegs-Erregung r(t) = r0 t · 1(t). Folglich hat das Bildsignal R(s) = r0 · s−2 einen zweifachen Pol bei s = 0. Um e(∞) = 0 zu gew¨ ahrleisten, muß P (s)K(s) ∼ s−2 gelten, das offene System also zweifach integrierend wirken.
4.6 Regelg¨ ute eines SISO-Standardregelkreises
199
Forderungen an das St¨ orverhalten (bei r(t) ≡ 0) Das St¨ orsignal z(t) soll unterdr¨ uckt“ werden in dem Sinne, dass es nach ” l¨angerer Zeit am Ausgang des Regelkreises keine Rolle mehr spielt, d. h. y(t) → 0 f¨ ur t → ∞. Das St¨ orverhalten wird von der St¨ or¨ ubertragungsfunktion GYZ (s) =
Y (s) E(s) P (s) = =− = −GE Z (s) 1 + K(s)P (s) Z(s) Z(s)
bestimmt. Falls die Funktion s·Y (s) keine Pole f¨ ur Re s ≥ 0 besitzt, also stabil ist, liefert der Endwertsatz der Laplacetransformation den Endwert der Ausgangsgr¨oße, y(∞) = lim y(t) = lim (s · Y (s)) = lim GYZ (s) · s · Z(s) . t→∞
s→0
s→0
Das Ziel y(∞)=0, und damit wegen r(t) ≡ 0 auch e(∞) = 0, wird erreicht, wenn die instabilen Nullstellen von Z(s) durch die Pole der St¨or¨ ubertragungsfunktion GYZ (s) kompensiert werden. Falls eine solche vollst¨ andige St¨ orgr¨ oßenunterdr¨ uckung“ nicht m¨oglich ist, so ” hat man bei der Reglerauslegung daf¨ ur Sorge zu tragen, dass die St¨orsignale ausreichend stark ged¨ ampft“ werden. ” Beispiel 4.17 Angenommen werde ein harmonisches St¨orsignal z(t) = sin ω0 t·1(t), also Z(s) = GYZ
=
P 1+KP
ω0 2. s2 +ω0
Bei einem stabilen Regelkreis ist die St¨ or¨ ubertragungsfunktion
stabil. Der Wunsch y(∞) = lim
s→0
s · P (s) · ω0 =0 (1 + K(s) · P (s))(s2 + ω02 )
wird erf¨ ullt, wenn die Strecke P(s) Nullstellen bei s = ±jω0 oder wenn der Regler K(s) Polstellen bei s = ±jω0 besitzt. Andernfalls stellen sich im geregelten System station¨ are Verh¨ altnisse ein. Die Ausgangsgr¨ oße y(t) besitzt bei der angenommenen ¨ außeren Erregung den Frequenzgang Y (jω) = GYZ (jω) · Z(jω) = GYZ (jω)
ω0 . ω02 − ω 2
Im Zeitbereich wird folglich nach dem Abklingen der Einschwingvorg¨ ange ein station¨ ares Ausgangsignal y(t) = |GYZ (jω0 )| · sin(ω0 t + ϕ) mit einem bestimmten Phasenwinkel ϕ erscheinen. Die Reglerauslegung muß ¬ ¬
|GYZ (jω0 )| = ¬
¬ P (jω0 ) ¬ ¬ 1 1 + K(jω0 )P (jω0 )
gew¨ ahrleisten, um eine wirkungsvolle Amplitudend¨ ampfung zu erreichen.
200
4 Grundkonzepte der linearen Regelungstheorie
4.6.2 Forderungen an das Einschwingverhalten Vermeidung technisch unzul¨ assiger Unstetigkeiten der Stellsignale Vor der praktischen Verwirklichung von Einschalt- oder Abschaltvorg¨angen und bei der Festlegung von Testsignalen ist zu bedenken, dass Spr¨ unge in den Stellgr¨ oßenverl¨ aufen h¨ aufig aus physikalisch-technologischen Gr¨ unden vermieden werden m¨ ussen, weil damit das Risiko einer Havarie oder sonstigen schweren Schadens verbunden sein kann. Deshalb wollen wir fragen, wie sich ein Eingangssignal r(t) mit dem Bild R(s) = c · s−m auf das Steuersignal u(t) zum Einschaltzeitpunkt auswirkt. Die Anwort gewinnt man mit dem zweiten Endwertsatz der Laplacetransformation: lim u(t) = lim (s · U (s)) = lim s · GU R (s) · R(s) s→∞ s→∞ t→0 GY (s) (s) · c · s−m+1 . = lim s · R · R(s) = lim GU R s→∞ s→∞ P (s) Der Wunsch u(+0) = lim (s · U (s))=0 s→∞
wird erf¨ ullt, wenn der relative Grad“ oder der Polstellen¨ uberschuß“ - das ist ” ” ¨ die Differenz von Nennergrad minus Z¨ ahlergrad - der Ubertragungsfunktion GU agt. Mit anderen Worten: Der PolstellenR (s) mindestens 2 − m betr¨ u uhrungs¨ ubertragungsfunktion GYR (s) = GU ¨ berschuß der F¨ R (s) · P (s) muß mindestens um 2 − m gr¨ oßer sein als der Polstellen¨ uberschuß der Streckenu ¨ bertragungsfunktion P (s). Beispiel 4.18 Als F¨uhrungssignal sei ein Einheitssprung r(t) = 1(t) vorgesehen,
¨ also R(s) = s−1 und m = 1. Folglich muß der Nennergrad der Ubertragungsfunktion U ¨ GR (s) gr¨ oßer sein als der Z¨ ahlergrad. Mit anderen Worten: Die Ubertragungsfunktion (s) muß streng proper sein. Wollte man als F¨ u hrungstestsignal einen DiracGU R Impuls einsetzen, so m¨ ußte der relative Grad von GU (s) mindestens 2 sein, um R Stellgr¨ oßenspr¨ unge auszuschließen.
Orientierung am Verz¨ ogerungsglied zweiter Ordnung In der regelungstechnischen Praxis wird h¨ aufig eine F¨ uhrungs¨ ubertragungsfunktion der Gestalt GYR (s) =
ω02 , s2 + 2dω0 s + ω02
angestrebt. Die Pole s1,2 = −dω0 ± jω0
0
1 − d2 = ω0 e±jϕ
(4.16)
4.6 Regelg¨ ute eines SISO-Standardregelkreises
201
¨ dieser Ubertragungsfunktion bewegen sich in Abh¨angigkeit von den d-Werten auf einer Wurzelortskurve, die im Parameterbereich 0 ≤ d ≤ 1 einen Halb¨ kreis mit dem Radius ω0 bildet, vgl. Bild 4.16. Die Ubergangsfunktion be-
jω0
√
jω0 1−d2
1
d w¨ achst
y(t)
ϕ
d=1
0
d w¨ achst
d=
1 2
−jω0
d=1 0
√
1−d2
−jω0 −ω0
t
−dω0
0
¨ Bild 4.16. Darstellung von Ubergangsfunktionen und Pollagen
rechnet sich zu y(t) = L−1
1
Y s GR (s)
e−dω0 t =1+ √ sin ω0 1 − d2 t − ϕ , 1 − d2
√ ¨ wobei sin ϕ = 1 − d2 , cos ϕ = −d. Den Startverlauf der Ubergangsfunktion erh¨ alt man aus Grenzwerts¨ atzen, y(+0) = lim (sY (s)) = lim GYR (s) = 0 , s→∞
s→∞
y(+0) ˙ = lim (sL{y(t)}) ˙ = lim s[sY (s) − y(+0)] = lim s · GYR (s) = 0 , s→∞
s→∞
s→∞
y (t)}) = lim s[s Y (s) − sy(+0) − y(+0)] ˙ y¨(+0) = lim (sL{¨ s→∞ s→∞ 2 = lim s · GYR (s) = ω02 . 2
s→∞
¨ Aus der Ableitung der Ubergangsfunktion y(t) ˙ = ω0 e−dω0 t cos(ω0 1 − d2 t − ϕ) −
√ d 1−d2
gewinnt man das erste Maximum, das bei tmax =
π √ ω0 1 − d2
sin(ω0
1 − d2 t − ϕ)
202
4 Grundkonzepte der linearen Regelungstheorie
eintritt und den Wert
ymax = y(tmax ) = 1 + exp
−dπ √ 1 − d2
annimmt. ¨ Daraus folgt die (maximale) Uberschwingweite −dπ ∆ymax = ymax − 1 = exp √ = exp (π cot ϕ) 1 − d2 F¨ ur t 1 interessiert vor allem der Zeitpunkt, von dem ab die Werte y(t) nur noch um einige wenige Prozent vom Endwert y(∞) = 1 abweichen k¨onnen, so ¨ dass man den Ubergangsvorgang im wesentlichen als abgeschlossen betrachten darf. Als Beruhigungszeit“ tp bezeichnet man den Zeitpunkt, zu dem ” ¨ die Ubergangsfunktion y(t) endg¨ ultig in einen Werteschlauch 1 ± p (mit einer Prozentangabe z. B. p = 5% oder p = 2%) eintritt. ¨ Zur Ermittlung von tp betrachtet man statt der tats¨achlichen Ubergangs1 −dω0 t funktion y(t) ihre H¨ ullkurven 1 ± √1−d e . Der Ansatz 2 √
1 e−dω0 tp = p 1 − d2
liefert die Beruhigungszeit 1 ln p 1 − d2 . dω0 Beispielsweise ergibt sich so f¨ ur d = 12 , d. h. ϕ = 135◦ , und p = 5% der Wert √ 2 4.727 0.05 t5% = − = ln √ . ω0 ω0 2 tp = −
Die durchgef¨ uhrten Rechnungen zeigen, dass beim Verz¨ogerungsglied zweiter Ordnung alle wesentlichen Merkmale des zeitlichen Verlaufs der ¨ Ubergangsfunktion durch die Lage des Polpaares s1,2 festgelegt sind. ¨ Bei der Diskussion von Ubertragungsgliedern mit n > 2 Polen trifft man h¨ aufig auf ein dominierendes“ konjugiert komplexes Polpaar und weitere ” n−2 Pole mit einem Realteil, der kleiner als −ω0 gemacht werden kann. Dann kann man sich durch Simulationsrechnungen davon u ¨ berzeugen, dass der ¨ Verlauf der Ubergangsfunktion entscheidend vom dominierenden Polpaar be¨ stimmt wird. Deshalb lassen sich die Forderungen an das Ubergangsverhalten ¨ ¨ ¨ des Ubertragungsgliedes n-ter Ordnung (wie Uberschwingzeit, Uberschwingweite, Beruhigungszeit) n¨ aherungsweise erf¨ ullen, indem man die Lage des dominierenden Polpaares entsprechend den diskutierten Zusammenh¨angen gezielt festlegt.
4.6 Regelg¨ ute eines SISO-Standardregelkreises
203
Integrale G¨ utemaße Neben den bisher besprochenen lokalen Wertungsm¨oglichkeiten, die einzel¨ ne Punkte der Ubergangsfunktion vergleichen, ist es seit den Anf¨angen der Regelungstechnik auch u ute ¨ blich, vgl. z. B. [OS44], globale Maße der Regelg¨ zu betrachten. An erster Stelle steht dabei das Integral u ¨ ber die quadrierte Regeldifferenz (Integral of Squared Error, ISE) ∞ ISE =
2 e(t) − e(∞) dt ,
(4.17)
0
dessen Wert durch geeignete Wahl des Reglers m¨oglichst klein bleiben soll. Beispiel 4.19 Im Falle einer F¨uhrungs¨ubertragungsfunktion (4.16) kann das Integral (4.17) in symbolischer Form berechnet werden: Zur Regeldifferenz e(t) = r(t) − y(t) = −
exp(−dω0 t) √ sin ω0 1 − d2 t − ϕ , 2 1−d
wobei
sin ϕ =
1 − d2 , cos ϕ = −d
l¨ aßt sich das integrale G¨ utemaß ISE analytisch bestimmen, ISE =
∞
2
e(t) dt =
1 ω0
d+
1 4d
.
(4.18)
0
Beweis: √ Mit den Abk¨ urzungen α = ω0 d, β = ω0 1 − d2 kann die Regeldifferenz in die Gestalt e(t) =
ω0 exp(−αt) [exp(j(βt − ϕ) − exp(−j(βt − ϕ)] 2jβ
gebracht werden; daher
e(t)
2
=
−ω02 exp(−2αt) −2 + exp j2(βt − ϕ) + exp − j2(βt − ϕ) . 4β 2
Durch wiederholte Nutzung der Beziehung
∞ exp(−γt) dt =
1 γ
f¨ ur beliebige
γ∈C
0
erh¨ alt man
∞ 0
2
e(t) dt =
ω02 4β 2
1 α cos(2ϕ) + β sin(2ϕ) − α α2 + β 2
204
4 Grundkonzepte der linearen Regelungstheorie
Wegen cos(2ϕ) = 1 − 2 sin2 ϕ = 1 − 2(1 − d2 ) = 2d2 − 1 , √ sin(2ϕ) = 2 sin ϕ cos ϕ = −2d 1 − d2 , √ α = ω0 d, β = ω0 1 − d2 f¨ uhren einige wenige Umrechnungsschritte auf das gew¨ unschte Resultat (4.18). qed. Die Forderung nach einem minimalen quadratischen Fehler ISE wird bei festgehaltenem ω0 erf¨ ullt f¨ ur d = dopt = 12 .
Seit der Etablierung der Regelungstechnik als Fachdisziplin werden weitere integrale G¨ utemaße benutzt, die die Regeldifferenz zeitgewichtet bewerten. Genannt seien das G¨ utemaß ITSE (Integral of Time multiplied by Squared Error), ∞ ITSE =
2 t e(t) dt
0
und das G¨ utemaß ITAE (Integral of Time multiplied by the Absolute value of Error), ∞ ITAE =
t e(t) dt .
0
Hier soll darauf nicht weiter eingegangen, sondern auf die umfangreiche einschl¨ agige Literatur verwiesen werden, [OS44], [JNP47], [Fel48], [NGK57], [Kes58], [Rei79] u.a. 4.6.3 Forderungen im Frequenzbereich Seit den Anf¨ angen der wissenschaftlich fundierten Regelungstechnik spielt die Darstellung linearer zeitinvarianter Systeme im Frequenzbereich“ eine ” herausragende Rolle. Damit ist die Besch¨ aftigung mit den Frequenzg¨angen ¨ aller wesentlichen Ubertragungsfunktionen gemeint. Legt man die hier verwendete Symbolik des SISO-Standardregelkreises zugrunde, vgl. Bild 4.1 auf S. 169, so werden nicht nur der Frequenzgang des Regelstreckenmodells P (s) ¨ betrachtet, sondern die Frequenzg¨ ange der Ubertragungsfunktion des offenen Kreises G0 (s) = K(s) · P (s), der sog. Empfindlichkeitsfunktion 3 S(s) =
1 U = GE R (s) = −GZ (s) , 1 + G0 (s)
und der komplement¨aren Empfindlichkeitsfunktion T (s) =
G0 = 1 − S(s) = GYR (s) 1 + G0 (s)
studiert. Der Anschaulichkeit halber wurden die Frequenzg¨ange der drei ge¨ nannten Ubertragungsfunktionen im Bild 4.17 beispielhaft zusammengestellt.
4.6 Regelg¨ ute eines SISO-Standardregelkreises G0
Betrag [dB]
10
0 −3
205
T Betragsreserve
−10
S −20 1
10− 2
90
ωBS
ωD ωr ω
1
100
ωBT
10 2
100
ωBT
10 2
arc S
Phase [◦ ]
45 0 −45
arc T
−90 −135
arc G0 Phasenreserve
−180 −1 2
10
ωBS
ωD ωr ω
1
Bild 4.17. Bode-Diagramm der Frequenzg¨ ange G0 (jω), S(jω), T (jω) zur 5 ¨ Ubertragungsfunktion des offenen Kreises G0 (s) = s(s2 + 6s + 5)
In manchen Lehrb¨ uchern, vgl. [Rei79], [Wei94], [Lun97] und [Lit05], wird der Amplitudengang der Empfindlichkeitsfunktion als (dynamischer) Regelfaktor bezeichnet, weil
E(jω)
1
|S(jω)| = =
|1 + G0 (jω)| R(jω)
den frequenzabh¨ angigen Faktor angibt, um den sich der Amplitudengang der Regelabweichung vom Amplitudengang der F¨ uhrungsgr¨oße unterscheidet. Viele Kenngr¨ oßen von Frequenzg¨ angen, wie z. B. Resonanzfrequenz, Resonanz¨ uberh¨ohung oder Bandbreite, die von den Pionieren der linearen Regelungstheorie eingef¨ uhrt wurden, erinnern daran, dass die Methoden der linearen Regelungstheorie urspr¨ unglich im Zusammenhang mit r¨ uckgekoppelten elektrischen Verst¨ arkerschaltungen und der elektrischen Netzwerk- sowie Filtertheorie entstanden sind. Die Titel der fr¨ uhen grundlegenden Ver¨offentlichungen zur Regelungstheorie bezeugen dies nachdr¨ ucklich, siehe insbes. die Monographie [Bod45] von H.W. Bode. 3
Diese Namensgebung wird im Abschnitt 4.7.1 erkl¨ art.
206
4 Grundkonzepte der linearen Regelungstheorie
Den Wert der Kreisfrequenz ω, an dem der Frequenzgang T (jω) sein Betragsmaximum annimmt, bezeichnet man mit Resonanzfrequenz ωr , den zugeh¨ orenden Betrag |T (jωr )| als¬ Resonanzverst¨ arkung. ¬ d ¬ An der Stelle ω = ωr muß dω T (jω)¬ = 0 gelten. Um die Resonanzfrequenz ωr zu bestimmen, hat man also die nichtlineare Gleichung
¬ ¬ d ¬ T (jω)¬ dω
=0
(4.19) ¬ ¬ ¬T (jω)¬−2
ist eine Funktion zu l¨ osen. Der meist einfacher zu handhabende Ausdruck von ω 2 und nimmt an der Stelle ωr2 ein Minimum an. Folglich empfiehlt es sich, die notwendige Bedingung (4.19) durch d (|T (jω)|−2 = 0 d(ω 2 ) zu ersetzen.
Unter der Bandbreite eines geregelten Systems versteht man – vergleichbar dem Sprachgebrauch in der Nachrichten- und Filtertechnik – die Breite eines Frequenzbandes ω < ω < ω, in dem die Regelungsmaßnahmen maßgeblich wirksam werden.
Da man bleibende Regeldifferenzen e(t) vermeiden will und deshalb
S(jω) << 1 f¨ ur ω = 0 fordert, (vgl. Abschn. 4.6.1), wird ω = 0 gesetzt. Also bleibt nur noch die obere Grenzfrequenz ω festzulegen: Unter dem genannten Aspekt erscheint als Grenzfrequenz ω die √
es sinnvoll,
Frequenz ωBS zu definieren, bei der S(jω) das Betragsniveau 22 = 0.707 (= ! 3 dB) erstmals u ¨berschreitet. Andererseits soll das Ausgangssignal y(t) dem F¨ uhrungssignal r(t) m¨oglichst gut folgen, mithin soll |T (jω)| f¨ ur kleine ω m¨oglichst groß bleiben. Das motiviert eine andere sinnvolle Festlegung der Grenzfrequenz√ω; n¨amlich die Frequenz ωBT , bei der |T (jω)| erstmals das Betragsniveau 22 = 0.707 (= ! 3 dB) unterschreitet. Die so definierten Grenzfrequenzen ωBS und ωBT stehen im Zusammen
hang mit der Durchtrittsfrequenz ωD , die definiert wird durch G0 (jωD ) = 1. ¨ Satz 4.7 F¨ ur SISO-Regelkreise mit einer stabilen Ubertragungsfunktion G0 (s) und einer Phasenreserve ϕr = π + arcG0 (jωD ) < gilt
ωBS < ωD < ωBT .
π 2
(4.20) (4.21)
Diese Aussage l¨ aßt sich leicht verifizieren,
wenn man
sich einen bemerkenswerten Zusammenhang zwischen S(jωD ) , T (jωD ) und der Phasenreserve ϕr vergegenw¨ artigt, der aus Bild 4.18 hervorgeht. Beweis: Im Falle ϕr = π2 berechnet man √
2
1 1
=√ = = T (jωD ) ; G0 (jωD ) = −j , S(jωD ) = |1 − j| 2 2
4.6 Regelg¨ ute eines SISO-Standardregelkreises
1+G0 (jωD )
Einerseits gilt
0
1 ϕr 1 + G0 /jωD ) , sin = = 2 2 2 S(jωD )
ϕr
andererseits G0 (jωD )
ϕr 1 + G0 (jωD ) = 1 , sin = 2 2 G0 (jωD ) 2 T (jωD ) mithin
−j −1
207
S(jωD ) = T (jωD ).
0 ¨ Bild 4.18. Zur Ubereinstimmung von S(jωD ) und T (jωD )
daher stimmen die Grenzfrequenzen ωBS und ωBT mit ωD u ¨ berein, d. h. ωBS = ωD = ωBT , wenn ϕr = π2 ist. √
F¨ ur 0 < ϕr < π2 gilt jedoch S(jωD ) = T (jωD ) > 22 , vgl. Bild 4.18. Gem¨ aß Definition von ωBS muß aber ωBS < ωD , und gem¨aß Definition von ωBT muß ωBT > ωD sein. Zusammengenommen folgt (4.21). qed. Aus Abschn. 4.4.4 ist bereits bekannt, wie zwei f¨ ur das Stabilit¨atsverhalten des Regelkreises wesentliche Kenngr¨ oßen, n¨ amlich die Phasenreserve und die Betragsreserve, dem Frequenzgang G0 (jω) entnommen werden k¨onnen. Alle genannten Frequenzcharakteristiken wurden beispielhaft im Bild 4.17 eingetragen. Die klassischen Methoden des Reglerentwurfs, die bis gegen Ende der 1950er Jahre bekannt wurden, basieren auf einer Gestaltung des Frequenzganges G0 (jω) = K(jω) · P (jω)
(4.22)
durch zweckm¨ aßige Wahl des Frequenzganges K(jω) des Reglers, der in diesem Kontext oft als Kompensator“ bezeichnet wurde. Die komplexwertige ” Gleichung (4.22) kann aufgespalten werden in eine Betragsgleichung |G0 | = |K| · |P |
bzw.
|G0 |dB = |K|dB + |P |dB
und eine Phasengleichung arc G0 = arc K + arc P . Bei der Spezifikation des Wunschverhaltens von G0 (jω) werden traditionsgem¨ aß drei Frequenzbereiche unterschieden.
208
4 Grundkonzepte der linearen Regelungstheorie
Bereich I, der das station¨ are Verhalten bestimmt, und mit 0 < ω < ωND , wobei N zwischen 10 und 20 gew¨ ahlt wird. ¨ Bereich II, der f¨ ur das Ubergangsverhalten maßgeblich ist und angesetzt wird mit ωND < ω < N · ωD . Bereich III mit ω > N · ωD als Auslaufbereich, in dem der Abfall des Amplitudenfrequenzganges |G0 (jω)| durch die Graddifferenz zwischen Z¨ahler und Nenner von G0 (s) bestimmt wird. Als traditionelle Anwendung des klassischen Konzepts der G0 -Frequenzganggestaltung (im Englischen wird von loop-shaping“ gesprochen) seien ” phasenvoreilende Korrekturglieder (LEAD compensator) und phasennacheilende Korrekturglieder (LAG compensator) erw¨ahnt (siehe Bild 4.19): Betrag [dB] 20
LEAD 10 0 −10
LAG −20 −2
−1
10
0
10
1
10
10
ω Phase [◦ ] 60
LEAD
40 20 0 −20 −40
LAG
−60 −2
−1
10
0
10
1
10
10
ω Bild 4.19. Bode-Diagramm von einem LEAD- und LAG-Kompensator mit T = 10 1 . und a = 10
LEAD-Kompensator:
K(s) = kp
1 + Ts 1 + aT s
mit 0 < a < 1 ,
LAG-Kompensator:
K(s) = kp
1 + aT s 1 + Ts
mit 0 < a < 1 .
4.6 Regelg¨ ute eines SISO-Standardregelkreises
209
Hier soll auf die traditionellen und bew¨ ahrten Verfahren der systematischen Gestaltung des Frequenzganges G0 (jω) nicht weiter eingegangen werden, da die meisten deutschsprachigen Lehrb¨ ucher dar¨ uber berichten. Dem interessierten Leser seien vor allem das Lehrbuch [Rei79] von Karl Reinisch (geb. 1921) und das umfangreiche Lehrwerk [Lun97] seines Sch¨ ulers Jan Lunze (geb. 1952), das auch in u ¨berarbeiteten Neuauflagen vorliegt, zum eingehenderen Studium empfohlen. Im weiteren wird davon ausgegangen, dass die G¨ uteforderung im Frequenzbereich f¨ ur die Empfindlichkeitsfunktion S(s) =
1 U = GE R (s) = GZ (s) 1 + P (s)K(s)
fixiert wird, und zwar durch eine Spezifikation 0 ≤ |S(jω)| < f (ω)
f¨ ur alle
ω
mit einer geeigneten Schrankenfunktion f (ω). Diese G¨ uteforderung sei so formuliert, dass sie sich mittels einer stabilen −1 Wichtungsfunktion WS (s), wobei |WS (jω)| := f (ω) gelten soll, umschreiben l¨ aßt in die Form |WS (jω)S(jω)| < 1
f¨ ur alle
ω.
(4.23)
2jω + 0.01
gesetzt. Zu dieser SchrankenfunkIm Bild 4.20 wurde f (ω) =
jω + 0.5
0
10
¬ ¬W
−1
S (jω)
10
¬−1 ¬
¬ ¬ ¬S(jω)¬
−2
10
−3
10
−2
10
−1
10
0
ω
10
1
10
2
10
Bild 4.20. Illustration der Ungleichung (4.23) im Bode-Diagramm f¨ ur den Amplitudenfrequenzgang
tion geh¨ ort die Wichtungsfunktion WS (s) =
s + 0.5 . 2s + 0.01
Die Bedingung (4.23) kann gleichwertig umgeschrieben werden in
210
4 Grundkonzepte der linearen Regelungstheorie
|WS (jω)| < |1 + G0 (jω)|
f¨ ur alle
ω
und l¨ aßt sich in der komplexen Ebene veranschaulichen (Bild 4.21). Die Punkte der Ortskurve G0 (jω) m¨ ussen f¨ ur jeden ω-Wert außerhalb des Kreises um (−1; j0) mit dem frequenzabh¨ angigen Radius |WS (jω)| liegen. j Im G0
|WS (jω)|
−1
Re G0 G0 (jω)
1 + G0 (jω)
Bild 4.21. Veranschaulichung der Ungleichung |WS (jω)| < |1 + G0 (jω)| in der komplexen Ebene
4.7 Stabilit¨ at und Regelgu ¨ te bei Unbestimmtheiten der Regelstrecke Jeder Regelungsingenieur wird immer wieder mit Problemen konfrontiert, die mit M¨ angeln und Unzul¨ anglichkeiten bei der Modellbildung der Regelstrecke zusammenh¨ angen. So kann sehr fragw¨ urdig sein, ob bei der Modellierung eines mechanischen Systems ein Starrk¨ orpermodell als brauchbar angesehen werden darf oder ob Elastizit¨ atseigenschaften ber¨ ucksichtigt werden m¨ ussen. Bei elektrischen Schaltungen geht es um den Einfluß der sog. parasit¨aren“ ” Schaltelemente. Grunds¨ atzlich sind bei Modellen im Frequenzbereich nicht zu vernachl¨ assigende Unbestimmtheiten vorhanden, die sich vor allem bei hohen Frequenzen st¨ orend bemerkbar machen. Dies l¨aßt eine kontinuierliche Menge P von Modellen als angemessenere Beschreibung der betrachteten Regelstrecke erscheinen als lediglich eine einzige Nominalrealisierung P. Unbestimmtheiten (uncertainties) im Modell der Regelstrecke sind unvermeidlich; denn a) physikalische Parameter ¨ andern sich in Abh¨angigkeit vom Einsatzfall (z. B. Temperaturabh¨ angigkeit von Widerst¨anden, Kapazit¨aten usw.)
4.7 Stabilit¨ at und Regelg¨ ute bei Unbestimmtheiten der Regelstrecke
211
b) Fertigungstoleranzen ergeben Schwankungsbereiche f¨ ur die geometrischen Abmessungen und werkstoffkundlichen Kennzahlen c) jedes Modell entsteht durch eine mathematische Abstraktion (Approximation, Vereinfachung) d) Meßfehler beeinflussen die Ergebnisse der experimentellen Parameteridentifikation 4.7.1 Strukturierte Unbestimmtheiten und Empfindlichkeitsfunktionen Strukturierte Unbestimmtheiten sind Unbestimmtheiten in Parametern. Dazu geh¨ oren a) Unbestimmtheiten in Werten von Koeffizienten einer gebrochen rationalen ¨ Ubertragungsfunktion (vgl. das Stabilit¨ atskriterium von Charitonov im Abschnitt 3.6.1). b) Unbestimmtheiten in geometrischen, physikalischen, technologischen Parametern und Einflußgr¨ oßen (z. B. L¨ ange, Druck, Temperatur, Reibungsbeiwert, Induktivit¨ at,. . . ). Die Strecken¨ ubertragungsfunktion h¨ angt im allgemeinen von mehreren Parametern, die jeweils mit Unbestimmtheiten behaftet sind, ab. Wir fassen diese Parameter in einem Parametervektor p = (p1 , p2 , . . . , pl )T zusammen und stellen uns die Strecken¨ ubertragungsfunktion mathematisch als eine Funktion von s und den reellen Ver¨ anderlichen p1 , p2 , . . . , pl vor, kurz P = P (s; p) . Die Parameterabh¨ angigkeit des Regelstreckenmodells zieht eine Para¨ meterabh¨ angigkeit aller Ubertragungsfunktionen des geschlossenen Regelkreises nach sich, insbesondere der F¨ uhrungs¨ ubertragungsfunktion GYR (s) = GYR (s, p). F¨ ur die Auswirkungen kleiner Parameterabweichungen ∆pλ von ihren Nominalwerten pλ gelten die aus dem physikalischen Grundpraktikum und der Einf¨ uhrung in die Meßtechnik gel¨ aufigen Fehlerabsch¨atzungen“ ” l ∂ Y ∆GYR ≈ ( G )∆pλ (4.24) ∂pλ R λ=1
f¨ ur die absoluten Fehler“ und ” l l pλ ∂GYR ∆pλ ∆GYR ∂ ln GYR ∆pλ ≈ = . pλ ∂ ln pλ pλ GYR GYR ∂pλ λ=1
(4.25)
λ=1
f¨ ur die relativen Fehler“.4 ” 4
Die Formeln (4.24) und (4.25) entstehen aus einer Taylor-Entwicklung der ¨ Ubertragungsfunktion an der Stelle der Parameter-Nominalwerte durch Abbruch der Reihe nach den linearen Gliedern.
212
4 Grundkonzepte der linearen Regelungstheorie
∂GYR ∂ ln GYR bzw. bezeich∂pλ ∂ ln pλ net man als Empfindlichkeit (sensitivity) bzw. als relative oder loga¨ rithmische Empfindlichkeit der Ubertragungsfunktion GYR bez¨ uglich des Parameters pλ ; λ = 1, 2, . . . , l. Eine der Hauptaufgaben aller Regelungsstrategien besteht darin, der naturgegebenen und unvermeidlichen Unbestimmtheiten der Regelstrecke Herr zu werden. Das Konzept der R¨ uckf¨ uhrung ist grunds¨atzlich geeignet, die unerw¨ unschten Auswirkungen dieser Unbestimmtheiten zu mindern. Diese fundamentale Einsicht verdankt die internationale Gemeinschaft der Ingenieure dem US-Amerikaner Hendrik W. Bode (1905-1982), der seine Erkenntnis ¨ 1945 mit dem Erscheinen seines Buches [Bod45] einer breiten Offentlichkeit zug¨ anglich machte. In diesem Kontext entscheidend ist der Zusammenhang zwischen der relativen Parameterempfindlichkeit der Regelstrecke und der rela¨ tiven Parameterempfindlichkeiten der Ubertragungsfunktionen des geregelten Systems: Mit der abk¨ urzenden Schreibweise ∂p∂λ P =: P kann die relative ParameterKP so umgeempfindlichkeit der F¨ uhrungs¨ ubertragungsfunktion GYR = 1 + KP formt werden: Die in den Summen auftretenden Gewichte
∂ ln GYR KP pλ ∂GYR pλ KP (1 + KP ) − KP KP pλ = Y = Y = ∂ ln pλ (1 + KP )2 GR ∂pλ GR GYR (1 + KP )2 =
pλ ∂ ln P 1 1 ∂ ln GYR ∂ ln P P = · = . 1 + KP P 1 + KP ∂ ln pλ ∂ ln P ∂ ln pλ
Als vermittelnder Faktor zwischen der naturgegebenen Parameterempfindlichkeit der Regelstrecke und der tats¨ achlich wirksam werdenden Parameterempfindlichkeiten der F¨ uhrungs¨ ubertragungsfunktion des geregelten Systems ¨ tritt die Ubertragungsfunktion S(s) :=
∂ ln GYR (s) 1 U = = GE R (s) = GZ (s) ∂ ln P (s) 1 + K(s)P (s)
auf. Zu Ehren von H.W. Bode bezeichnet man sie als die Bodesche Empfindlichkeitsfunktion des Regelkreises oder auch nur kurz als Empfindlichkeitsfunktion. Sie ist ein Maß f¨ ur die frequenzabh¨angige Verst¨arkung respektive D¨ ampfung der relativen Parameterempfindlichkeit der F¨ uhrungsu uber der relativen Parameterempfindlichkeit der ¨ bertragungsfunktion gegen¨ Strecken¨ ubertragungsfunktion. F¨ ur die St¨ or¨ ubertragungsfunktion GYZ (s) =
P (s) 1 + K(s)P (s)
4.7 Stabilit¨ at und Regelg¨ ute bei Unbestimmtheiten der Regelstrecke
213
liefert eine ¨ ahnliche Herleitung ∂ ln GYZ (s) = S(s). ∂ ln P (s) ¨ F¨ ur die Ubertragungsfunktion GU Z (s) =
1 1 + K(s)P (s)
fokgt wegen pλ ∂ ln GU Z = U ∂ ln pλ GZ =−
∂GU Z ∂pλ
=
pλ pλ −KP −KP · ·P = 2 (1 + KP ) 1 + KP P GU Z
∂ ln P KP ∂ ln GU Z ∂ ln P · = 1 + KP ∂ ln pλ ∂ ln P ∂ ln pλ
¨ als vermittelnder Faktor die Ubertragungsfunktion T (s) := −
K(s)P (s) ∂ ln GU Z (s) = = GYR (s) = −GVZ (s). ∂ ln P (s) 1 + K(s)P (s)
Man bezeichnet sie als komplement¨ are Empfindlichkeitsfunktion des Regelkreises. Die Summe aus Empfindlichkeitsfunktion S(s) und komplement¨arer Empfindlichkeitsfunktion T (s) ergibt f¨ ur alle s den Wert Eins; denn S(s) + T (s) =
1 K(s)P (s) + = 1. 1 + K(s)P (s) 1 + K(s)P (s)
4.7.2 Mathematische Erfassung unstrukturierter Unbestimmtheiten der Regelstrecke Um den Grundgedanken der Modellierung unstrukturierter Unbestimmtheiten zu erkl¨ aren, wollen wir zun¨ achst an einen physikalischen Parameter, der nach der Normierung als eine reelle Zahl x erscheint, denken. Statt eines Nominalwertes x ∈ R ist es realit¨ atsn¨ aher, mit einem Unbestimmtheitsintervall X = {x ∈ R : x −w < x < x + w bei fixiertem w > 0} zu rechnen. Um den aufwendigen Umgang mit Ungleichungen zu vermeiden, kann man den fraglichen Parameter auch auf die Gleichheitsdarstellung x=x + w · δ mit einer Unbestimmheitsgr¨ oße δ bringen, von der nur bekannt ist, einen nicht spezifizierbaren Wert aus dem normierten Einheitsdintervall [−1; 1] anzunehmen. Der Grundgedanke wird nun von den reellen Zahlen ¨ auf rationale Funktionen verallgemeinert. F¨ ur die Ubergtragungsfunktion der Regelstrecke machen wir in Verallgemeinerung des absoluten Fehlers“ einen ”
214
4 Grundkonzepte der linearen Regelungstheorie
Additiven St¨ oransatz, vgl. Bild 4.22: P (s) = P(s) + W (s) · ∆A (s)
∈ P(s),
¨ wobei W(s) eine bestimmte stabile Ubertragungsfunktion (Wichtung) und ∆A (s) irgendeine stabile Funktion mit supRe s>0 |∆A (s)| ≤ 1 bezeichnen.5 Die Unbestimmtheit des Frequenzganges P (jω) = P (jω) + W (jω)∆A (jω)
W (s)
∆A (s)
+
u
y
P˜ (s)
Bild 4.22. Additiver St¨ oransatz f¨ ur unstrukturierte Unbestimmtheit
wird auf diese Weise f¨ ur jede Frequenz ω als Kreisfl¨ache mit frequenzabh¨ angigem Radius |W (jω)| in der komplexen P (jω)-Ebene angesetzt (siehe Bild 4.24). In Verallgemeinerung des relativen Fehlers“ machen wir einen ” Multiplikativen St¨ oransatz, vgl. Bild 4.23: P (s) = P(s) (1 + W (s) · ∆M (s))
W (s)
∈ P(s)
∆M (s) y
u P˜ (s)
Bild 4.23. Multiplikativer St¨ oransatz f¨ ur unstrukturierte Unbestimmtheit
5
F¨ ur jede stabile reell-rationale Funktion G(s) gilt G(s)∞ = supRe s>0 |G(s)| = supω∈R |G(jω)| < ∞. Diese Eigenschaft wird im Folgenden stillschweigend ausgenutzt, obwohl der Beweis erst im Abschnitt 5.2 auf Seite 241 gebracht wird.
4.7 Stabilit¨ at und Regelg¨ ute bei Unbestimmtheiten der Regelstrecke
215
0
|W (jω2 )| −0.2
P (jω2 ) Im P (jω)
−0.4
−0.6
|W (jω1 )| −0.8
P (jω1 )
−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
Re P (jω)
0
nominaler Amplitudengang von P (jω)
|P (jω)|dB
−10 −20 −30
H¨ ullkurve f¨ ur Gesamtheit aller Amplitudeng¨ ange
−40 0.1
0.5
1
ω
5
Bild 4.24. Veranschaulichung einer additiven Unbestimmtheit. Ortskurvendarstellung wurden die Frequenzpunkte ω1 und ω2 = 1.036 hervorgehoben.
Beispiel 4.20 Zur Nominalstrecke
P (s) =
Bei der = 0.435
1 s3 + 2.5s2 + 1.8s + 1
0.3 bes2 + 2s + 1 trachtet, siehe Bild 4.24. Die Unbestimmtheitskreisscheiben haben hier den fre0.3 . quenzabh¨ angigen Radius |W (jω)| = 2 ω +1 wird ein additiver St¨ oransatz mit der Wichtungsfunktion W (s) =
Beispiel 4.21 Es soll gezeigt werden, wie sich eine (relativ kleine) Totzeit mit unbekannter L¨ ange τ , die aber nach oben abgesch¨ atzt werden kann, z. B. 0 ≤ τ ≤ 0.1, als multiplikative Unbestimmtheit modellieren und dadurch ihre Wirkung im Regelkreis erfassen l¨ aßt. Der Ansatz P (s) = P (s)e−τ s = P (s) 1 + W (s) · ∆M (s)
mit
∆M ∞ ≤ 1
216
4 Grundkonzepte der linearen Regelungstheorie
liefert W (s) · ∆M (s) = e−τ s − 1 . F¨ ur sehr kleine τ d¨ urfen wir statt der nichtrationalen Funktion e−τ s deren rationale 1 − 12 τ s Pad´e -Approximation 1. Ordnung verwenden, d. h. e−τ s ≈ . Daraus ergibt 1 + 12 τ s
10
τ = 0.1 ¬ ¬ ¬ 0.1jω ¬ ¬ 1+0.05jω ¬ ¬ ¬ ¬e−0.1jω−1¬
0
| · |dB
−10 −20 −30 −40 −50 −1 10 10
τ = 0.05 ¬ ¬ ¬ 0.1jω ¬ ¬ 1+0.05jω ¬ ¬ ¬ −0.05jω
0
e
−10
| · |dB
0
10
1
10
ω
2
10
3
10
¬
−1¬
−20 −30 −40 −50 −1 10 10
τ = 0.01
0 −10
| · |dB
0
10
1
10
ω
2
10
3
10
¬ ¬ ¬ 0.1jω ¬ ¬ 1+0.05jω ¬ ¬ ¬ ¬e−0.01jω−1¬
−20 −30 −40 −50 −1 10
0
10
1
10
ω
2
10
3
10
Bild 4.25. Erfassung einer unbekannten Totzeit τ als multiplikative Unbestimmtheit, dargestellt am Amplitudenfrequenzgang f¨ ur Totzeitwerte τ = 0.1, 0.05 und 0.01
sich: e−τ s − 1 ≈
1 − 12 τ s −τ s −1= . 1 + 12 τ s 1 + 12 τ s
4.7 Stabilit¨ at und Regelg¨ ute bei Unbestimmtheiten der Regelstrecke Mit der Festlegung
alt man |∆M (s)| ≤ 1 erh¨ W (s) =
0.1s 1 + 0.05s
τs 1 + 12 τ s
W (s) · ∆M (s) =
und
¬ ¬
|W (jω)| = ¬¬
f¨ ur 0 ≤ τ ≤ 0.1
217 und
¬
− 1 0.1jω ¬¬ = 0.1ω 1 + (0.05ω)2 2 1 + 0.05jω ¬
Das Bild 4.25 zeigt, daß praktisch alle denkbaren Streckenrealisierungen P (s) = P(s)e−τ s durch den multiplikativen St¨ oransatz erfaßt werden, solange die Totzeitbegrenzung τ ≤ 0.1 nicht verletzt wird.
Unstrukturierte Unbestimmtheiten der Regelstrecke lassen sich auch durch einen R¨ uckf¨ uhrungs-St¨oransatz oder einen Multiplikativen R¨ uckf¨ uhrungsSt¨oransatz erfassen. R¨ uckf¨ uhrungs-St¨ oransatz, vgl. Bild 4.26: −1 P (s) = P (s) 1 ± W (s) · ∆R (s) · P (s) ∈ P(s) .
y
u
P˜ (s)
∓
W (s)
∆R (s)
Bild 4.26. R¨ uckf¨ uhrungs-St¨ oransatz f¨ ur unstrukturierte Unbestimmtheit
Multiplikativer R¨ uckf¨ uhrungs-St¨ oransatz, vgl. Bild 4.27: −1 P (s) = P (s) 1 ± W (s) · ∆F (s) ∈ P(s) .
W (s) u P˜ (s)
∓
∆F (s) y
Bild 4.27. Multiplikativer R¨ uckf¨ uhrungs-St¨ oransatz f¨ ur unstrukturierte Unbestimmtheit
218
4 Grundkonzepte der linearen Regelungstheorie
4.7.3 Robuste Stabilit¨ at Es bezeichne P die Gesamtheit aller Streckenmodelle, die im Rahmen angenommener Unbestimmtheiten m¨ oglich sind. Statt eines Nominalmodells P ergibt sich auf Grund der Unbestimmtheiten eine Menge P von Streckenmodellen. Ein f¨ ur die nominale Strecke P entworfener Regler K liefert robuste Stabilit¨ at, wenn alle Regelkreise mit demselben K und beliebigem P ∈ P wohldefiniert und stabil sind. Wir nehmen zun¨ achst an, die Unbestimmtheiten der Strecke seien durch einen multiplikativen St¨ oransatz modelliert. Satz 4.8 (Robuste Stabilit¨ at) Sei P ∈ P(1 + W · ∆) : W, ∆ stabil, ∆∞ < 1 und K ein stabilisierender Regler f¨ ur P . Dann ist der Regelkreis wohldefiniert und robust stabil genau dann, wenn W · T∞ ≤ 1. Bild 4.28 erl¨ autert den Inhalt des Satzes 4.8. Beide Regelkreise haben die glei2 ¨ che Ubertragungsfunktion GX at der Ersatzstruktur X1 (s). Die robuste Stabilit¨ ergibt sich unmittelbar aus dem Satz von den kleinen Kreisverst¨arkungen (siehe Abschnitt 4.4.3).
x2 W (s)
z r
e
x1
P (s)
∆(s) y
K(s)
P (s)
x2
∆(s)
x1
W(s)T(s) Bild 4.28. Urspr¨ unglicher Regelkreis und Ersatzstruktur haben die gleiche 2 ¨ Ubertragungsfunktion GX X (s) 1
Beweis: ¨ Der Regelkreis ist per definitionem stabil, wenn die vier Elemente der Ubertragungsmatrix
4.7 Stabilit¨ at und Regelg¨ ute bei Unbestimmtheiten der Regelstrecke
1 −K P 1
−1
⎛ =⎝
K 1 1+KP 1+KP
219
⎞ ⎠
−P 1 1+KP 1+KP
stabil sind. Den Ausdruck (1 + KP ) kann man umschreiben, 1 + KP =1 + K P(1 + W · ∆) = 1 + K P + K P · W · ∆
K P =(1 + K P) 1 + · W · ∆ = S−1 · (1 + TW · ∆), 1 + K P und wegen P = P (1 + W · ∆) erh¨ alt man
−1 + TW · ∆)−1 + TW · ∆)−1 K S(1 1 −K S(1 . = + TW · ∆)−1 S(1 + TW · ∆)−1 P 1 −P(1 + W · ∆)S(1 ¨ Angenommen, es gelte W T∞ ≤ 1. Nach Voraussetzung sind die Uber K S, P S stabil. Weil ∆, W , T stabil sind und tragungsfunktionen S, (1 + W T∆) wegen W T∞ ≤ 1 weder Pole noch Nullstellen mit Re s ≥ 0 + W T∆)−1 sowie + TW · ∆)−1 , K S(1 haben kann, sind auch S(1 −1 P (1 + W · ∆)S(1 + W T ∆) stabil. ur die robuste StaDamit wurde gezeigt, dass die Bedingung W T∞ ≤ 1 f¨ bilit¨ at des Regelkreises hinreicht. Um die Notwendigkeit der Bedingung W T∞ ≤ 1 nachzuweisen, nehmen wir an, es gelte W T∞ > 1 und konstruieren unter dieser Annahme ein ∆ mit ∆∞ < 1 , das den Regelkreis destabilisiert: Die Annahme impliziert, dass ein ω0 mit |(W T)(jω0 )| > 1 existiert. Der Wert sei (W T)(jω0 ) = (1 + ε)ejϕ , wobei ε > 0. Nun wird eine stabile Funktion ∆(s) mit ∆∞ < 1 und ∆(jω0 ) = −(1 + ε/2)−1 · e−jϕ aufgesucht. Die ¨ Ubertragungsfunktion G0 (s) = W (s)T(s)∆(s) des offenen Ersatzregelkreises 1+ε im Bild 4.28 ist stabil. Wegen G0 (jω0 ) = − 1+ε/2 wird der geschlossene Regelkreis jedoch instabil; denn das Strecker-Nyquist-Kriterium wird verletzt. qed. Die Bedingung W T∞ ≤ 1 ist gleichwertig der Bedingung 0 (jω)| 0 (jω)| ≤ |1 + G |W (jω)G
f¨ ur alle
ω
und kann in der komplexen Ebene veranschaulicht werden: Die im Bild 4.29 skizzierten Kreisscheiben d¨ urfen den Punkt (−1; j0) nicht u ¨berdecken. Beispiel 4.22 Mit einer Nominalstrecke P (s) = wird S(s) =
1 s−1 ; = 1 s−1+k 1 + k s−1
1 und einem Regler K(s) = k s−1
T (s) =
1
k s−1 k + s−1
=
k s−1+k
Der nominelle Regelkreis ist stabil f¨ ur k > 1. Betrachtet werden drei Ans¨ atze f¨ ur multiplikative Unbestimmtheiten:
220
4 Grundkonzepte der linearen Regelungstheorie j Im G0
−1
Re Go 1 + G0 (jω1 )
1 + G0 (jω2 )
|W(jω1 )G0 (jω1 )| G0 (jω) |W(jω2 )G0 (jω2 )| Bild 4.29. Frequenzgang mit Unbestimmtheitskreisscheiben
α mit 0 < α < 10, ∆∞ < 1: s + 10 Der Regelkreis ist robust stabil genau dann, wenn
a) W (s) =
¬ ¬
W T ∞ = sup ¬¬ ω
¬
¬ k·α k·α ¬ = ≤1, (jω + 10)(jω + k − 1) ¬ 10 · (k − 1)
10 . 10 − α ∆∞ < 1. Nun muß k ≥
also: α · k ≤ 10(k − 1) oder k ≥
1 sein. b) W (s) = α mit 0 < α < 1, 1−α s + α1 c) W (s) = mit 0 < α1 < α2 , ∆∞ < 1. Die Forderung s + α2 ¬ ¬
W T ∞ = sup ¬¬ ω
¬ ¬
= sup ¬¬ ω
= sup ω
¬
¬ (jω + α1 ) · k ¬ (jω + α2 )(jω + k − 1) ¬
¬
¬ (jω + α1 ) · k ¬ −ω 2 + (k − 1)α2 + jω(α2 + k − 1) ¬
(−ω 2
(ω 2 + α21 ) · k2 ≤ 1 + (k − 1)α2 )2 + ω 2 (α2 + k − 1)2
liefert die zul¨ assigen Wertebereiche f¨ ur k, α1 und α2 .
Wir nehmen nun an, die Unbestimmtheiten der Strecke seien durch einen additiven St¨ oransatz beschrieben. Satz 4.9 (Robuste Stabilit¨ at) Sei P ∈ {P + ∆ · W P : W, ∆ stabil , ∆∞ < 1} und K ein stabilisierender Regler f¨ ur P. Dann ist der Regelkreis wohldefiniert und robust stabil genau dann, wenn SKW ∞ ≤ 1 .
4.7 Stabilit¨ at und Regelg¨ ute bei Unbestimmtheiten der Regelstrecke
221
Beweis: In Analogie zum Beweis des Satzes 4.8 kann man zeigen, daß die vier Elemente der Matrix ⎛ ⎞ 1 K −1 1+K(P +W ·∆) 1+K(P +W ·∆) 1 −K ⎜ ⎟ =⎝ ⎠ P 1 −(P +W ·∆) 1 ⎛ =⎝
1+K(P +W ·∆) 1+K(P +W ·∆)
+ SKW S(1 · ∆)−1
+ SKW K S(1 · ∆)−1
+ SKW + SKW −(P + W · ∆)S(1 · ∆)−1 S(1 · ∆)−1
¨ stabile Ubertragungsfunktionen sind.
⎞ ⎠
qed.
Zusammenfassende Aussage f¨ ur alle Unbestimmtheitsmodelle: Satz 4.10 (Robuste Stabilit¨ at) Sei K ein stabilisierender Regler f¨ ur P . Dann ist der Regelkreis f¨ ur alle ∆ mit ∆∞ < 1 bei Zusammenschaltung mit dem mit Unbestimmtheiten behafteten Streckenmodell ⎧ ⎫ ⎪ ⎪ W T∞ ≤ 1 , P = P(1 ± W ∆) ⎪ ⎪ ⎪ ⎪ ⎨ ⎬ genau dann wohldefiniert P = P ± W ∆ SKW ∞ ≤ 1 , −1 ⎪ und robust stabil, wenn ⎪ P = P (1 ± W ∆P ) ⎪ W P S∞ ≤ 1 , ⎪ ⎪ ⎪ ⎩ ⎭ ∞ ≤ 1. W S P = P(1 ± W ∆)−1 4.7.4 Robuste G¨ ute F¨ ur eine nominale Strecke P sei ein Regler K entworfen worden, der den Regelkreis stabilisiert und eine bestimmte G¨ uteforderung erf¨ ullt. Robuste G¨ ute bedeutet, dass derselbe Regler K f¨ ur alle Strecken P ∈ P den Regelkreis stabilisiert und die G¨ uteforderung erf¨ ullt. Die G¨ uteforderung an das geregelte System sei ||WS S||∞ ≤ 1; die Unbestimmtheit sei als multiplikative St¨ orung modelliert worden, d. h. P = P(1 + WT ∆) . Der G¨ uteforderung m¨ ussen daher alle Strecken mit S=
1 1 + (1 + WT · ∆)P K
=
S 1 + WT T · ∆
gen¨ ugen, d. h. die Bedingung WS S∞
F F F W S F F F S =F F F 1 + WT T∆ F
∞
≤1
222
4 Grundkonzepte der linearen Regelungstheorie
erf¨ ullen. Außerdem wissen wir, robuste Stabilit¨at impliziert ||WT T||∞ ≤ 1. Robuste G¨ ute und robuste Stabilit¨ at erfordern daher f¨ ur alle ω−Werte
WS (jω)S(jω)
≤ 1 + WT (jω)T(jω)∆(jω) und WT (jω)T(jω) ≤ 1 . (4.26) Mit Hilfe der Bilder 4.30 und 4.31 lassen sich die folgenden notwendigen und hinreichenden Bedingungen veranschaulichen und verstehen: |WS (jω)S(jω)| + |WT (jω)T(jω)| ≤ 1
f¨ ur alle
ω
(4.27)
oder, gleichwertig, 0 (jω)| ≤ |1 + G 0 (jω)| |WS (jω)| + |WT (jω)G
f¨ ur alle
ω.
(4.28)
¬ ¬ ¬WS S
j Im 1+WT ∆T
1 Re 1
¬ ¬ ¬ ¬ ¬WS S ¬
1
WT T
WT T
¨ Bild 4.30. Ubergang von der Bedingung (4.26) zur Bedingung(4.27): Die Betr¨ age |WS S|, |WT T| k¨ onnen nur Werte aus dem schraffierten Dreieck annehmen.
|WS (jω1 )|
j Im G o
Re G o
−1 (jω ) 1+G 0 1
(jω )| |WT (jω1 )G 0 1
(jω) G 0
Bild 4.31. Veranschaulichung der Bedingung (4.28): Die beiden Kreisscheiben m¨ ussen disjunkt sein
4.7 Stabilit¨ at und Regelg¨ ute bei Unbestimmtheiten der Regelstrecke
223
4.7.5 Frequenzganggestaltung f¨ ur minimalphasige Regelstrecken mit Unbestimmtheiten Wir betrachten folgende Ausgangssituation: Die Unbestimmtheiten der Regelstrecke seien als unstrukturierte multiplikative Unbestimmtheit modelliert, d. h. P (s) = P (s) 1 + WT (s) · ∆(s) , und die gew¨ unschte Regelg¨ ute als Forderung |WS (jω)S(jω)| ≤ 1
f¨ ur alle
ω
formuliert worden. Die Nominalstrecke P (s) sei minimalphasig (vgl. S. 241) und habe einen relativen Grad r. Der zu entwerfende Regler K(s) soll proper sein. ¨ Zun¨ achst ist klar, der relative Grad der nominellen Ubertragungsfunktion 0 (s) = P(s) · K(s) des offenen Regelkreises ist gr¨oßer oder gleich r. Der reG 0 (jω)| 0 (s) bestimmt den Abfall des Amplitudenganges |G lative Grad von G im Auslaufbereich f¨ ur ω → ∞. Die Aufgabe des Reglerentwurfs besteht nun darin, zur gegebenen Nominalstrecke P (s) einen properen Regler K(s) derart zu finden, dass (4.28), 0 (jω)| ≤ |1 + G 0 (jω)| |WS (jω)| + |WT (jω)G
f¨ ur alle
ω,
gilt. L¨ osungskonzept: ¨ Wenn es gelingt, den nominellen Amplitudenfrequenzgang der Ubertragungs funktion G0 (s) = P (s) · K(s) des offenen Regelkreises so zu gestalten, dass die Ungleichung (4.28) erf¨ ullt wird, dann erh¨ alt man den gesuchten robusten (s) Regler schließlich aus K(s) = GP0(s) . Die definitorische Zwangsbedingung
S(jω) + T(jω) = 1 und die Ungleichung (4.27) implizieren min |WS (jω)|, |WT (jω)| ≤ 1
f¨ ur alle ω ;
denn wenn f¨ ur ein bestimmtes ω0 die Ungleichung |WS (jω0 )| ≤ |WT (jω0 ) zutrifft, so gilt an dieser Stelle + |WS T| ≤ |WS S| + |WT T| ≤ 1 . |WS (jω0 )| = |WS (S + T)| ≤ |WS S| " #$ % " #$ % ≤|WT T |
Ungl. (4.27)
Aus |WT (jω0 )| ≤ |WS (jω0 )| erh¨ alt man ebenso |WT (jω0 )| ≤ 1.
224
4 Grundkonzepte der linearen Regelungstheorie
Die G¨ uteforderungen im Frequenzbereich verlangen im Regelfall große Werte |WS (jω)| f¨ ur kleine ω, siehe Abschnitt 4.6.3, Bild 4.20. Aus (4.28) folgt f¨ ur tiefe Frequenzen unter der Annahme |WT | < 1 < |WS | die Ungleichung 0 | ≥ |WS | − 1 |G 1 − |WT | und f¨ ur hohe Frequenzen unter der Annahme |WS | < 1 < |WT | die Ungleichung 0 | ≤ 1 − |WS | . |G |WT | − 1 Mitunter kommt man mit noch einfacheren N¨aherungsbeziehungen aus. Tiefe Frequenzen:
|WT | < 1 |WS | ⇒
Hohe Frequenzen:
|WS | < 1 |WT | ⇒
|WS | 1 − |WT | 0 | < 1 − |WS | |G |WT |
0 | > |G
Wie auf Seite 208 erl¨ autert, werden u ¨blicherweise drei Frequenzbereiche unterschieden: ein Bereich I der tiefen Frequenzen 0 < ω < ω1 , ein Bereich II der mittleren Frequenzen ω1 < ω < ω2 und ein Bereich III der hohen Frequenzen ω2 < ω < ∞. Nach diesen Vor¨ uberlegungen l¨ aßt sich der Reglerentwurf gem¨aß den folgenden Entwurfsschritten durchf¨ uhren. Entwurfsschritte (siehe Bild 4.32) |WS |−1 1−|WS | 1. Zeichne die Amplitudeng¨ ange 1−|W f¨ ur tiefe Frequenzen und von |W T| T |−1 f¨ ur hohe Frequenzen in ein Bode-Diagramm ein. 0 | > |WS |−1 f¨ 0 |-N¨ aherung so, dass |G 2. Skizziere eine |G 1−|WT | ur tiefe und 1−|WS | |G0 | < f¨ ur hohe Frequenzen erf¨ ullt wird. F¨ ur sehr hohe Frequen|WT |−1
0 | durch den zen wird der (negative) Anstieg des Amplitudenganges |G relativen Grad von P(s) festgelegt, falls K(s) einen relativen Grad Null ¨ haben soll. Der Ubergang f¨ ur mittlere Frequenzen ist glatt zu gestalten, mit m¨ oglichst betragskleinem Anstieg an der Durchtrittsfrequenz ωD , f¨ ur 0 (jωD )| = 1 gilt. (Eine tiefere Begr¨ die |G undung wird auf Seite 249 angegeben.) 0 (s), die den skiz¨ 3. Ermittle eine minimalphasige Ubertragungsfunktion G zierten Amplitudengang ann¨ ahernd besitzt. (s) 4. Den gesuchten robusten Regler berechnet man aus K(s) = GP0(s) .
4.8 Trajektoriensteuerung mit Folgeregelung
225
50 40
|.|dB
30 20
|WS | − 1 1 − |WT |
10
|G0 |
1 − |WS | |WT | − 1
0 −10 −20 0.1
1
ω1
10
ωD
ω2
100
1000
ω Bild 4.32. Ein denkbarer zul¨ assiger Verlauf des Amplitudenganges |G0 |, der außerhalb der grauen Fl¨ achen bleiben muß.
4.8 Trajektoriensteuerung mit Folgeregelung Das Anliegen der Regelungs- und Steuerungstheorie wurde in der Einf¨ uhrung dieses Buches ausf¨ uhrlich er¨ ortert. W¨ are das zu steuernde Objekt von vornherein genau bekannt, so w¨ urde man eine Steuerungseinrichtung im voraus berechnen und in praxi nutzen. Die tats¨ achlich vorhandene Unkenntnis u ¨ ber die inh¨ arenten Eigenschaften des Objekts und u ¨ ber die auf das Objekt einwirkenden ¨ außeren St¨ orungen hat zur Folge, dass das Objekt mit einer vorgeplanten Steuerungseinrichtung allein grunds¨ atzlich nicht beherrscht werden kann. Aus dem Gedanken des st¨ andigen Vergleichs zwischen Eingangs- und Ausgangssignalen und des Einbaus einer vom Vergleichsergebnis abh¨angigen R¨ uckf¨ uhrung erwuchs das Konzept der Regelung. Es ist mit einem Risiko verbunden: Das geregelte Gesamtsystem kann instabil werden, selbst dann, wenn die Regelstrecke f¨ ur sich genommen stabil ist. Die bisher f¨ ur den StandardRegelkreis entwickelten Methoden erlauben es, sowohl mit Unbestimmtheiten der Regelstrecke und ¨ außeren St¨ orungen als auch mit Stabilisierungsproblemen in wissenschaftlich fundierter Weise umzugehen. Das Steuerungsproblem wurde nur am Rande betrachtet, indem etwa gefragt wurde, wie sich ein spezielles Testsignal als F¨ uhrungssignal, z. B. Einheitssprung oder Sinusfunktion, in das Ausgangssignal transformiert und ob Forderungen an die Regelg¨ ute befriedigt werden. Jetzt soll es um die Steuerung entlang einer gew¨ unschten Trajektorie in einem endlichen Zeitintervall gehen, ohne dabei die unvermeidlichen Unbestimmtheiten und das Stabilisierungsproblem aus dem Auge zu verlieren.
226
4 Grundkonzepte der linearen Regelungstheorie
4.8.1 Regelungsstruktur mit zwei Entwurfsfreiheitsgraden Das Konzept des Standard-Regelkreises reicht nicht aus, um die drei Aufgaben, n¨ amlich Robustheit gegen¨ uber Streckenunbestimmtheiten, Stabilit¨at des geregelten Systems und Steuerung der Regelstrecke entlang gew¨ unschter Trajektorien, zugleich befriedigend zu l¨ osen. F¨ ur die Trajektoriensteuerung wird ein zus¨ atzlicher Apparat“ ben¨ otigt. Diese Erkenntnis wurde Ende der ” 1950er Jahre publik [Hor59]. Isaac M. Horowitz (geb. 1920) spricht von einem zweiten Entwurfsfreiheitsgrad“. Er diskutiert in seinem grundlegenden Werk ” [Hor63] mehrere Konfigurationen von Regelungsstrukturen mit zwei Entwurfsfreiheitsgraden und zeigt ihre Gleichwertigkeit in systemtheoretischer Hinsicht. G. Kreißelmeier hat die deutschsprachigen Fachkollegen vor wenigen Jahren auf das Horowitz sche Gedankengut aufmerksam gemacht [Kre99].
z1
z2
1
1
T0 (s) P (s) r
1
αT0 (s)
K(s)
P (s)
y
α Bild 4.33. Wirkungsplan nach Horowitz, [Hor63] FIG. 6.1 - 1.(d)
Das Bild 4.33 stammt aus [Hor63], S. 247, lediglich umgezeichnet in eine Wirkungsplandarstellung gem¨ aß DIN 19226. Die Bezeichnungen wurden an den Kontext des vorliegenden Kapitels angepasst. Die beiden Entwurfsfrei¨ heitsgrade im Sinne von Horowitz bestehen in der Option, die Ubertragungsfunktionen K und T0 voneinander unabh¨ angig festzulegen. Die Symbole P bzw. P stehen f¨ ur das Streckenmodell einschließlich Unbestimmtheiten bzw. f¨ ur das Nominalmodell, und α ist eine reelle Konstante. Die F¨ uhrungs¨ ubertragungsfunktion des Gesamtsystems l¨aßt sich berechnen, GYR =
T0 P P P −1 + αKP KP · αT0 = · T0 . + 1 + αKP P 1 + αKP 1 + αKP
Wenn die Unbestimmtheiten der Streckenbeschreibung unber¨ ucksichtigt bleiben, also P = P gesetzt wird, so stimmt die F¨ uhrungs¨ ubertragungsfunktion
4.8 Trajektoriensteuerung mit Folgeregelung
227
GYR (s) mit der festlegbaren Funktion T0 (s) u ¨ berein, GYR (s) = T0 (s),
falls
P (s) = P (s) .
Der Idealfall Y (s) = R(s) tritt ein, wenn man T0 (s) = 1 w¨ahlt. Diese spezielle Festlegung des einen Entwurfsfreiheitsgrades soll der folgenden Diskussion zugrunde gelegt werden.6 Um den Vergleich zum Standard-Regelkreis zu erleichtern, wird α = 1 gesetzt und angenommen, dass sich die Auswirkungen der St¨ orsignale z1 und z2 als Unbestimmtheiten in der Streckenbeschreibung P (s) erfassen lassen. Mit den getroffenen Annahmen vereinfacht sich der Wirkungsplan des Bildes 4.33 zum Bild 4.34. In dem Block yref -Generator“ wird der gew¨ unschte ” 1 P (s) yd
yref – Generator
e
K(s)
P (s)
y
Bild 4.34. Vereinfachter Wirkungsplan bei der speziellen Wahl T0 (s) = 1 und α=1
Verlauf y d (t) erzeugt. Auf den Regler K(s) trifft das Differenzsignal e(t) = y d (t) − y(t). Infolge der Festlegung T0 (s) = 1 bleibt nur noch ein Entwurfsfreiheitsgrad, n¨ amlich die geeignete Wahl von K(s), also das vom StandardRegelkreis vertraute Entwurfsproblem zur robusten Stabilisierung des RegelZK (s) kreises. Als stabilisierender Regler K(s) = N kommt grunds¨atzlich jede K (s) rationale Funktion in Betracht, f¨ ur die das charakteristische Polynom des geschlossenen Kreises, vgl. Seite 174, CLCP (s) = ZK (s) · ZP (s) + NK (s) · NP (s) ein stabiles Polynom wird. Sieht man von den Unbestimmtheiten der Re¨ gelstrecke ab, so stimmen die Ubertragungsfunktionen P (s) und P(s) im Bild 4.34 u berein. ¨ Beispiel 4.23 Als Zahlenbeispiel wird P (s) = P (s) =
−1 4s4 − 5s2
¨ gew¨ ahlt, vgl. Bild 4.35. Diese instabile Funktion l¨ aßt sich als Ubertragungsfunktion des unged¨ ampften verschieblichen 1-fach-Pendels interpretieren, wenn man eine den Wagen antreibende Kraft als skalares Steuersignal u(t) und die x-Position der Pendelspitze als Ausgangssignal ξ(t) nimmt, vgl. Seite 80. Die (linearisierten) Be6
In j¨ ungster Zeit wird dieser Ansatz mitunter als inversionsbasierte Vorsteue” rung“ bezeichnet, siehe z.B. [ZG04].
228
4 Grundkonzepte der linearen Regelungstheorie −4s4 + 5s2
ξd
ξref –
e
Generator
−1 4s4 − 5s2
u
K(s)
ξ
Bild 4.35. Trajektoriensteuerung einer instabilen Regelstrecke mit Folgeregelung wegungsgleichungen (2.31) f¨ ur das verschiebliche N-fach-Pendel, die im Abschnitt 2.5.3.3 hergeleitet wurden, ergeben f¨ ur den genannten Spezialfall im Bildbereich (m0 + m1 )s2 −s2
−m1 l1 s2 l1 s 2 − g
X0 (s) Φ1 (s)
U (s) . 0
=
Daraus folgt Ξ(s) = X0 (s) − l1 Φ1 (s) = (1
− l1 )
(m0 + m1 )s2 −s2
−m1 l1 s2 l1 s 2 − g
−1
U (s) , 0
und nach kurzer Rechnung Ξ(s) =
g · U (s). (m0 + m1 )gs2 − m0 l1 s4
Bei geeigneter Fixierung der Parameterwerte und Normierung erh¨ alt man die gew¨ ahlte Beispielfunktion P(s). Als stabilisierender Regler K(s) darf z. B. das Polynom K(s) = −(24s3 + 61s2 + 64s + 32) eingesetzt werden; denn damit ergibt sich f¨ ur den geschlossenen Regelkreis ein charakteristisches Polynom CLCP(s) = ZK (s) · ZP (s) + NK (s) · NP (s) = −(24s3 + 61s2 + 64s + 32) · 1 + 1 · (−4s4 + 5s2 ) = −(4s4 + 24s3 + 56s2 + 64s + 32) = −4(s2 + 2s + 2)(s + 2)2 Bevorzugt man einen properen Regler, so kann man nat¨ urlich auch einen solchen w¨ ahlen. F¨ ur die Beispiel-Regelstrecke k¨ ame neben vielen anderen ein Regler mit K(s) = −
1005s3 + 1211s2 + 112s + 16 4s3 + 28s2 + 89s + 175
in Betracht. Man kann nachrechnen, dass das charakteristische Polynom des geschlossenen Kreises sich dann zu CLCP (s) = 16(s + 1)7 erg¨ abe.
4.8 Trajektoriensteuerung mit Folgeregelung
229
4.8.2 Trajektoriensteuerung f¨ ur Deskriptorsysteme F¨ ur die praktische Nutzbarkeit der im Bild 4.34 angegebenen Struktur zum Zwecke der Trajektoriensteuerung ist wesentlich, dass die reell-rationale ¨ Ubertragungsfunktion P (s) nur eine Konstante als Z¨ahlerpolynom hat. Da¨ durch wird die Signalverarbeitung in dem Ubertragungglied mit der inver−1 ¨ sen Ubertragungsfunktion (P (s)) auf ein reines Differenzieren beschr¨ankt. Integrationen entfallen, und die daf¨ ur ben¨ otigten Anfangswerte spielen keine Rolle. Die tieferliegenden systemtheoretischen Zusammenh¨ange werden im Abschnitt 6.2.6 bei der ausf¨ uhrlichen Diskussion des Konzepts der Basisgr¨ oßen zutage treten. Dieser Abschnitt behandelt die Trajektoriensteuerung f¨ ur Regelstrecken, die in einer Deskriptorform gem¨ aß Abschnitt 2.4.2 modelliert wurden und einen skalaren Steuereingang besitzen. Die Streckenbeschreibung (2.15), (2.16) lautet jetzt ˙ + A0 z(t) + b0 u(t) = 0 , A1 z(t)
y(t) = C0 z(t) + d0 u(t) .
(4.29)
Die Laplace-Transformation von (4.29) liefert bei verschwindenden Anfangswerten als Deskriptor-Darstellung im Bildbereich (sA1 + A0 ) Z(s) + b0 U (s) = 0 ,
Y(s) = C0 Z(s) + d0 U (s) .
Die Regularit¨ atsbedingung det(sA1 + A0 ) ≡ 0 garantiert die Existenz eines nichtverschwindenden Polynoms det(sA1 + A0 ) = a0 sm + a1 sm−1 + . . . + am−1 s + am . Die Basisgr¨ oße“ wird im Bildbereich definiert durch ” 1 U (s) , Ξ(s) := det(sA1 + A0 )
(4.30)
das zugeh¨ orende Signal ξ(t) im Zeitbereich durch die Differentialgleichung ˙ + am ξ(t) = u(t) . a0 ξ (m) (t) + a1 ξ (m−1) (t) + . . . + am−1 ξ(t)
(4.31)
Die Bilder der p Deskriptorvariablen erscheinen nun in der Form sA1 +A0 b0 det eTν 0 sA1 + A0 b0 · Ξ(s) · U (s) = det Zν (s) = eTν 0 det(sA1 + A0 ) = Tν (s) · Ξ(s) , wobei
sA1 + A0 b0 Tν (s) := det eTν 0
(4.32)
f¨ ur
ν = 1, . . . , p .
230
4 Grundkonzepte der linearen Regelungstheorie
F¨ ur den Bildvektor Y(s) der Ausgangssignale gilt Y(s) = (C0 · T(s) + d0 · det(sA1 + A0 )) Ξ(s) , wobei
(4.33)
⎞ T1 (s) ⎜ T2 (s) ⎟ ⎟ ⎜ T(s) = ⎜ . ⎟ . ⎝ .. ⎠ ⎛
(4.34)
Tp (s) Transformiert man die algebraischen Gleichungen (4.30), (4.32) und (4.33) in den Zeitbereich, ergeben sich das Steuersignal u(t) und alle Systemsignale als Linearkombinationen des Basissignals ξ(t) und seiner zeitlichen Ableitungen. Zu einem geplanten hinreichend glatten Referenzverlauf des Basissignals ξref (t) kann man den zugeh¨ orenden Steuersignalverlauf uref (t) mit (4.31) im voraus berechnen. Pr¨ agt man dieses Steuersignal der Regelstrecke ein, so w¨ urde in der Regelstrecke – sofern sich weder St¨orungen noch Unbestimmtheiten bemerkbar machten – der geplante Basissignalverlauf reproduziert werden. Die Verl¨ aufe aller anderen Signale w¨ aren damit ebenfalls entsprechend (4.32) und (4.33) vollst¨ andig festgelegt. Die Frage, welcher physikalische Sinn dem Basissignal zukommt, bleibt hier offen und wird im gr¨ oßeren Zusammenhang im Abschnitt 6.2.6 beantwortet. Beispiel 4.24 Das im Abschnitt 2.4.2 behandelte W¨armebad kann als Beispiel f¨ ur ein Deskriptor-Regelstreckenmodell mit einem skalaren Steuereingang dienen. Ausgehend von (2.14) erh¨ alt man bei normierten Parameterwerten Rw0 = Rw1 = ¨ von Θe (s) nach Θ1 (s) Rw2 = 1 und Cw1 = Cw2 = 1 die Ubertragungsfunktionen und Θ2 (s) zu
Θ1 (s) Θ2 (s)
=
s+2 −1
−1
−1 s+2
1 1 Θe (s) = 2 0 s + 4s + 3
s+2 Θe (s) . 1
Ersichtlich f¨ allt das Basissignal ξ(t) bei diesem Beispiel mit der Temperatur ϑ2 (t) des rechten Bades zusammen. Dies bedeutet, dass der Temperaturgang des rechten Bades frei vorgegeben werden kann. Ein gew¨ unschter Temperaturverlauf ϑ2 (t) wird erreicht, wenn man die Zulauftemperatur ϑe (t) entsprechend der Rechenvorschrift
also
Θe (s) = (s2 + 4s + 3)Θ2 (s) , ϑe (t) = ϑ¨2 (t) + 4ϑ˙ 2 (t) + 3ϑ2 (t) ,
andig festgelegt; denn einstellt. Mit ϑ2 (t) ist auch die Badtemperatur ϑ1 (t) vollst¨ ϑ1 (t) = ϑ˙ 2 (t) + 2ϑ2 (t). Ein Versuch, ϑ1 (t) anstelle von ϑ2 (t) vorzugeben und daraus die passende Stelltemperatur ϑe (t) ohne Integration – und damit ohne Anfangswertfestlegung – zu berechnen, ist zum Scheitern verurteilt, weil sich die jetzt maßgebliche Beziehung
4.8 Trajektoriensteuerung mit Folgeregelung
231
ϑ˙ e (t) + 2ϑe (t) = ϑ¨1 (t) + 4ϑ˙ 1 (t) + 3ϑ1 (t) nicht ohne Integration nach ϑe aufl¨ osen l¨ aßt.
ϑ2
ϑ2
10
10
5
5
0 1
ϑ
11 12
24
t
e
0
ϑ
100
3
13
16
24
t
3
13
16
24
t
13
16
24
t
e
30
30 0 1
11 12
24
t 0
ϑ
ϑ ϑ1 ϑ2
20 10 0 1
ϑ1
20
ϑ2
10 11 12
24
t
0
3
Bild 4.36. Temperaturverl¨ aufe f¨ ur Umsteuerintervalle der L¨ angen t1 = 1 (linke Seite) und t1 = 3 (rechte Seite)
Als konkrete Vorgabe f¨ ur die Badtemperatur ϑ2 sei gefordert, dass sie w¨ ahrend einer Arbeitszeit von 10 Zeiteinheiten (Stunden) auf einer Relativtemperatur von 10 (Grad) gehalten werden soll, w¨ ahrend in der u ¨ brigen Tageszeit eine Absenkung auf die Außentemperatur, d. h. ϑ2 = 0, angestrebt wird. F¨ ur das Aufheizintervall der L¨ ange t1 kann man z. B. den zweimal stetig differenzierbaren Zeitverlauf ϑ↑2 (t)
= 100
t t1
3
− 150
t t1
4
+ 60
t t1
5
f¨ ur
t ∈ [0, t1 ]
und entsprechend f¨ ur das gleich lange Intervall der Temperaturabsenkung ϑ↓2 (t) = 10 − ϑ↑2 (t − t1 − 10)
f¨ ur
t ∈ [10 + t1 , 10 + 2t1 ]
w¨ ahlen. Im Bild 4.36 wurden die Signalverl¨ aufe f¨ ur t1 = 1 und t1 = 3 zusammengestellt. aufe Das Bild verdeutlicht, dass zu klein gew¨ ahlte Intervall-L¨ angen t1 auf Signalverl¨ f¨ uhren, die jenseits der Brauchbarkeitsgrenzen der berechneten Steuerung liegen. Zu beachten sind insbesondere die physikalisch gesetzten Grenzen des Stellsignals. Im Beispiel darf die einstellbare Zulaufwassertemperatur ϑe (t) nat¨ urlich niemals um mehr als 100 (Grad) – in der Theorie, realiter um nicht mehr als 60 – 80 (Grad) – variieren.
232
4 Grundkonzepte der linearen Regelungstheorie
Beispiel 4.25 Im Abschnitt 2.5.3.3 auf Seite 80, Gleichung (2.31), wurden die linearisierten Bewegungsgleichungen f¨ ur das verschiebliche N -fach-Pendel hergeleitet. Wir betrachten nun den Fall N = 2 f¨ ur verschwindende Drehkr¨ afte Di = 0 und verschwindende Drehd¨ ampfungen di = 0, i = 1, 2. Das auf Seite 80 notierte Differentialgleichungssystem zweiter Ordnung l¨ aßt sich durch Einf¨ uhrung der Geschwindigkeiten x˙ 0 , ϕ˙ 1 , ϕ˙ 2 ohne besondere M¨ uhe umschreiben in eine DeskriptorDarstellung der allgemeinen Struktur (4.29). Da man in diesem Beispiel die Differentialgleichungen erster Ordnung auch leicht nach den abgeleiteten Signalen aufl¨ osen, also in eine Zustandsform bringen kann, wird hier als Streckenbeschreibung eine Zustandsdarstellung zugrundegelegt, und zwar
d dt
x0 x˙ 0 ϕ1 ϕ˙ 1 ϕ2 ϕ˙ 2
0 1 0 − 0 0 = 0 − 0 0
0 m1 g m0
d0 m0
0
(m0 +m1 )g d0 m0 l1 m0 l1
0
0 − md00l2
m1 g m0 l2
0 0 1 0 0 0
0 m2 g m0
0
m2 g m0 l1
0
(m0 +m2 )g m0 l2
0 0 0 0 1 0
x x ˙ ϕ ϕ˙ ϕ
0 0 1 1 2
+
ϕ˙ 2
0 1 m0
0
1 m0 l1
0
1 m0 l2
f.
(4.35)
Zu jedem (hinreichend glatt) vorgegebenen Zeitverlauf des Basissignals ξ(t) geht der zugeh¨ orende Stellkraftverlauf f (t) aus der Grundbeziehung (4.30), die hier in der Gestalt det(sI6 − A) · Ξ(s) = F (s)
(4.36)
erscheint, hervor. Eine Nebenrechnung zeigt, wie die Bilder der Positionssignale oße zusammenh¨ angen: x0 (t), ϕ1 (t) und ϕ2 (t) mit der Basisgr¨ X0 (s) Φ1 (s) Φ2 (s)
=
1 m 0 l1 l2
· Ξ(s).
(l1 s2 − g)(l2 s2 − g) s2 (l2 s2 − g) s2 (l1 s2 − g)
(4.37)
Wegen det(sI6 − A) =
g − m0
m
s
6
m0 + m2 gd0 + m1 + s4 − l1 l2 m0 g 2 m0 + m1 + m2 2 + s l1 l2 m0 0
d0 5 s m0 1 + s3 l1 l2 g 2 d0 + s l1 l2 m 0
1
+
wird f (t) = g − m0
m
ξ
(6)
(t)
d0
1 + m1 ξ
(5)
(t)
0
+ m1 m0 + m2 gd0 + ξ (4) (t) − + ξ (3) (t) l1 l2 m 0 l1 l2 g 2 d0 ˙ g 2 m0 + m1 + m2 ¨ ξ(t) + ξ(t) . + l1 l2 m0 l1 l2 m 0 0
(4.38)
F¨ ur die numerische Auswertung wurden folgende normierte Parameterwerte genommen: g = 9.81, m0 = 4, m1 = 0.2, m2 = 0.1, l1 = 0.6, l2 = 0.2, d0 = 10. Wird f¨ ur das Basissignal ξ(t) beispielsweise der im Bild 4.37 gezeigte sechsmal stetig differenzierbare Zeitverlauf ξ(t) = ξ d (t) vorgegeben, so berechnet sich daraus
4.8 Trajektoriensteuerung mit Folgeregelung
233
103 · ξ d
4
2
0 0
0.5
1
1.5
2
2.5
3
2
2.5
3
t
fd
20 0 −20 0
0.5
1
1.5
t Bild 4.37. Gegebener Zeitverlauf des Basissignals ξ d (t)und zugeh¨ orendes berechnetes Stellsignal f d (t)
mit (4.38) der zugeh¨ orende Stellsignalverlauf f (t) = f d (t). Mit diesem Stellkraftverlauf wurde das Zustandsgleichungssystem (4.35) bei verschwindenden Anfangswerten des Zustandsvektors numerisch integriert7 . Die wichtigsten Ergebnisse zeigt Bild 4.38. Man erkennt, dass gegen Ende der Integrationszeit unbrauchbare Resul-
1
x0
20
fd
0.5
0 0 −20 0
0.5
1
1.5
2
0
0.5
1
t
1.5
2
1.5
2
t 0
0
ϕ2
ϕ1
−1 −0.5
−2 −3
−1 0
0.5
1
1.5
t
2
0
0.5
1
t
Bild 4.38. Zeitverl¨ aufe des Stellsignals f d (t) sowie der Wagenposition x0 (t) und der Pendelwinkel ϕ1 (t) und ϕ2 (t) (Sollverl¨ aufe gestrichelt)
tate entstehen. Die Ursache liegt in der Instabilit¨ at“ des Systems, u ¨ ber die die ” 7 F¨ ur die numerische Integration wurde das Stellsignal im Takt von 0.025 abgetastet und zwischen aufeinanderfolgenden Abtastwerten linear interpoliert.
234
4 Grundkonzepte der linearen Regelungstheorie
unvermeidlichen Unbestimmtheiten (auch des Rechenprozesses) zur Geltung kommen. Im Beispielfalle wurden die exakt gegebenen linearen Bewegungsgleichungen (4.35) numerisch integriert. Trotz einer großen Rechengenauigkeit von etwa 10 signifikanten Dezimalziffern wirkten sich die Rundungsfehler auf Grund der extremen Instabilit¨ at des Regelstreckenmodells nach einiger Zeit verheerend aus. Das Stabilit¨ atsproblem wird im n¨ achsten Abschnitt mit dem Konzept einer Folgeregelung“ ” gezielt aufgegriffen.
Zusammenfassend sei festgehalten: In jedem regul¨aren Deskriptorsystem mit einem skalarwertigen Eingang gibt es ein skalares Basissignal, dessen Zeitverlauf im Rahmen bestimmter Glattheitsforderungen frei vorgegeben werden kann. Trotz der fundamentalen systemtheoretischen Rolle, die das Basissignal spielt, kommt ihm im allgemeinen keine vordergr¨ undig erkennbare physikalische Bedeutung zu. 4.8.3 Folgeregelung f¨ ur gesteuerte Deskriptorsysteme Bild 4.39 zeigt das komplette Schema einer Trajektoriensteuerung mit Folgeregelung. Der Regelkreis wird durch das Gleichungssystem
A1 z˙ + A0 z + b0 u = 0
u
y
y = C0 z + d0 u z kT d
u
zd
det(sA1 + A0 ) ξref
T(s)
Basissignal– generator
ξref
Bild 4.39. Trajektoriensteuerung mit Folgeregelung f¨ ur Deskriptorsysteme bei skalarem Steuersignal
d 0 z(t) A1 dt + A0 b0 = · ud (t) − kT zd (t) u(t) −kT 1 beschrieben und besitzt das charakteristische Polynom sA1 + A0 b0 CLCP (s) = det −kT 1 = det(sA1 + A0 ) −
p ν=1
kν · Tν (s) .
(4.39)
4.8 Trajektoriensteuerung mit Folgeregelung
235
Das CLCP(s) ist von einem Grade ≤ p. Die Polynome Tν (s) wurden mit (4.32) definiert und haben Grade ≤ p − 1. Bei manchen Deskriptormodellen f¨ allt grad Tν (s) ≥ grad det(sA1 + A0 ) f¨ ur einzelne ν ∈ {1, 2, . . . , p} aus. Dieser Sachverhalt wird im Abschnitt 6.2.6 eingehend behandelt. Hier sollen nur einige unmittelbare Schlußfolgerungen aus der Struktur (4.39) des charakteristischen Polynoms des Folgeregelkreises gezogen werden. 1. Falls eine komplexe Zahl s0 existiert, f¨ ur die Rg(s0 A1 + A0 , b0 ) < p wird, so ist die Stelle s = s0 eine fixe Nullstelle der Regelstrecke, die durch die angesetzte Art der R¨ uckf¨ uhrung kT = (k1 , . . . , kp ) nicht beeeinflußt werden kann. 2. Andernfalls k¨ onnen durch Wahl eines konstanten Vektors k ∈ Rp alle Nullstellen des charakteristischen Polynoms CLCP(s) beinflußt werden. 3. Die Koeffizienten des CLCP(s) h¨ angen affin von den R¨ uckf¨ uhrverst¨arkungen k1 , k2 , ..., kp ab. (Im Abschnitt 6.2.6 wird noch mehr gezeigt: Zu einem vorgegebenen Wunsch-CLCP(s) gibt es im allgemeinen eine lineare Mannigfaltigkeit von R¨ uckf¨ uhrvektoren k.) 4. Im Spezialfall einer Zustandsdarstellung, also f¨ ur (sA1 + A0 , b0 ) = (sIp − A, −b), gibt es unter der Voraussetzung Rg(sIp − A, −b) = p
f¨ ur alle
s∈C
zu jedem vorgegebenen Wunsch-CLCP(s) genau einen reellen R¨ uckf¨ uhrvektor k , der die gew¨ unschte Nullstellenzuweisung leistet. Beispiel 4.26 Nun kann das abgebrochene Beispiel 4.25 wieder aufgegriffen, die Trajektoriensteuerung durch eine Folgeregelung erg¨ anzt und dadurch praktisch nutzbar gemacht werden. Gestellt sei die Aufgabe, das verschiebliche 2-fach-Pendel mit der vorliegenden Regelstrecken-Beschreibung (4.35) von der instabilen Anfangsposition x0 (0) = 0, ϕ1 (0) = 0, ϕ2 (0) = 0 in einer relativ kurzen Zeit von te = 2.5 (sec) in die ebenfalls instabile Zielposition x0 (te ) = 1, ϕ1 (te ) = 0, ϕ2 (te ) = 0 zu bringen und in dieser verweilen zu lassen. Das diskutierte allgemeine L¨ osungskonzept legt das folgende Vorgehen nahe. Das Basissignal, dessen physikalische Bedeutung bisher unbekannt ist und f¨ ur unseren hier verfolgten Zweck nicht ergr¨ undet zu werden braucht, muß als hinreichend glatte Zeitfunktion ξref (t) geplant und generiert werden. Wegen (4.36) sollte ξref (t) mindestens 6-mal stetig differenzierbar sein, damit die Stellkraft f (t) stetig bleibt. Wenn man ξref (t) als ein glattes Polynom konstruiert, das glatt aus dem Anfangswert ξref (0) = 0 startet und glatt in den Zielwert
236
4 Grundkonzepte der linearen Regelungstheorie
ξref (te ) = ξref (2.5) u ¨ bergeht, so muss es mindestens mit dem Grad 13 angesetzt werden. Die (durch St¨ orungen und Unbestimmtheiten unber¨ uhrten) Verl¨ aufe der Positionssignale k¨ onnen wegen (4.37) aus dem Basissignal ξref (t) und seinen Ableitungen bis zur 4. Ordnung berechnet werden. Wir wollen diese idealen Signalverl¨ aufe durch einen oberen Index d“ kennzeichnen, weil es sich um Deside” rate handelt, die bei der tats¨ achlichen Signalverarbeitung in der realen Regelstrecke nicht erzeugt werden. Weiterhin entnimmt man (4.37) die Zielwertbezieg2 hung xd0 (2.5) = ξref (2.5). Bild 4.40 zeigt die gew¨ ahlte Referenztrajektorie m 0 l1 l2
1.2
5
1 0.8
3
0.6
xd0
103 · ξref
4
2
0.4 0.2
1
0 0
−0.2 0
1
2
3
0
1
t
2
3
t 0.5
40 30
ϕd1 , ϕd2
fd
20 10 0
0
ϕd1
−10
ϕd2
−20
−0.5 0
1
2
3
0
1
t
2
3
t
Bild 4.40. Im voraus geplante Trajektorienverl¨ aufe aufe der Stellkraft f d (t) und ξref (t) und die daraus berechneten idealen Signalverl¨ d d d der Positionen x0 (t), ϕ1 (t), ϕ2 (t). Das charakteristische Polynom (4.39) des Folgeregelkreises lautet jetzt
sI6 − A −b CLCP (s) = det 1 −kT = det(sI6 − A) −
6 ν=1
kν · Tν (s) .
(4.40)
4.8 Trajektoriensteuerung mit Folgeregelung
237
Die auf der rechten Seite von (4.40) auftretenden Polynome wurden im wesentlichen schon im Beispiel 4.25 berechnet. Aus (4.37) kann man schlußfolgern: T1 (s) =
(l1 s2 − g)(l2 s2 − g) , m 0 l1 l2
T2 (s) =
s(l1 s2 − g)(l2 s2 − g) , m 0 l1 l2
T3 (s) =
s2 (l2 s2 − g) , m 0 l1 l2
T4 (s) =
s3 (l2 s2 − g) , m 0 l1 l2
T5 (s) =
s2 (l1 s2 − g) , m 0 l1 l2
T6 (s) =
s3 (l1 s2 − g) . m 0 l1 l2
Wird das Wunsch-CLCP(s) vorgeben z. B. durch CLCP (s) = (s + 8)(s + 9)(s + 10)(s + 11)(s + 12)(s + 13) , so liefert der Koeffizientenvergleich bei den auf Seite 232 notierten Parameterwerten nach kurzer Rechnung den R¨ uckf¨ uhrvektor kT = −6162 −3629 20496 5005 −6969 −994.9
(4.41)
Wenn man die Trajektoriensteuerung mit Folgeregelung nach dem im Bild 4.39 gezeichneten Wirkungsplan mit den linearisierten Bewegungsgleichungen (4.35) als Regelstreckenmodell und dem berechneten R¨ uckf¨ uhrvektor (4.41) auf dem Rechner simuliert, so sind die Signalverl¨ aufe x0 (t), ϕ1 (t), ϕ2 (t) im Rahmen der Zeichengenauigkeit von den geplanten Signalverl¨ aufen xd0 (t), ϕd1 (t), ϕd2 (t) nicht zu unterscheiden. Setzt man anstelle der linearisierten Bewegungsgleichungen (4.35) die nichtlinearen Bewegungsgleichungen (2.29) und (2.30), die im Abschnitt 2.5.3.3 hergeleitet wurden, unter den gleichen Festlegungen f¨ ur die Parameterwerte als Regelstreckenmodell ein, so erbringt das entwickelte Trajektoriensteuerungs- und Folgeregelungsschema noch immer sehr zufriedenstellende Resultate. Sie wurden im Bild 4.41 festgehalten. Seit mehreren Jahren wird im regelungstechnischen Praktikum, das die Lehrveranstaltung u ¨ ber lineare Regelungs- und Steuerungstheorie an der TU Dresden komplettiert, die Trajektoriensteuerung mit Folgeregelung von den Studierenden am Beispiel des verschieblichen 2-fach-Pendels experimentell erprobt [RF02]. Zur Illustration der dabei beobachteten Bewegungsabl¨ aufe m¨ ogen die im Bild 4.42 zusammengestellten Momentaufnehmen der berechneten Wagen- und Pendelstellungen dienen.
238
4 Grundkonzepte der linearen Regelungstheorie 1
x0
0.8 0.6 0.4
Simulation Planung
0.2 0 0
0.5
1
1.5
2
2.5
3
2
2.5
3
2
2.5
3
t
ϕ1
0.2
0
−0.2 0
0.5
1
1.5
t 0.4
ϕ2
0.2 0 −0.2 −0.4 0
0.5
1
1.5
t Bild 4.41. Vergleich der geplanten Signalverl¨ aufe mit den Ergebnissen bei Simulation mit nichtlinearem Regelstreckenmodell 0.7
0.6
0.5
0.4
0.3
0.2
0.1
0 0
0.2
0.4
0.6
0.8
1
Bild 4.42. Momentaufnahmen der Wagen- und Pendelstellungen w¨ ahrend des ¨ Uberf¨ uhrungsvorgangs aus der Anfangs- in die Zielposition
5 Regelbarkeit aus mathematischer Sicht
5.1 Einfu ¨hrung Nicht alle W¨ unsche, die der Betreiber einer geregelten Anlage ¨außern mag, sind erf¨ ullbar - selbst dann nicht, wenn die Beschreibung der Anlage durch ein LTI-Regelstreckenmodell vollauf gerechtfertigt sein sollte. Die stabilen ¨ ¨ Ubertragungsfunktionen - nur solche sind als Ubertragungsoperatoren von den exogenen Signalen zu den endogenen (d. h. im Inneren des Regelkreises erzeugten) Signalen von Interesse - haben Eigenschaften, die auf mathematischen Gesetzm¨ aßigkeiten beruhen, welche sich durch keinerlei K¨ unste oder Kniffe außer Kraft setzen lassen. ¨ Bemerkenswerte Ph¨ anomene treten bei stabilen Ubertragungsfunktionen ¨ auf, wenn das Z¨ ahlerpolynom der Ubertragungsfunktion mindestens eine ¨ Nullstelle mit einem positiven Realteil besitzt. Solche Ubertragungsfunktionen ¨ werden als nichtminimalphasige“ oder allpasshaltige“ Ubertragungs” ” ¨ funktionen bezeichnet. Uber die daraus resultierenden Schwierigkeiten beim Reglerentwurf wird im Abschnitt 5.2 berichtet. Im Abschnitt 5.3 werden die algebraischen Eigenschaften der stabilen ¨ Ubertragungsfunktionen studiert und f¨ ur den Reglerentwurf genutzt. Aus ¨ algebraischer Sicht bildet die Menge RH∞ der reell-rationalen stabilen Ubertragungsfunktionen einen Euklid ischen Ring. Die gleiche algebraische Struktur ist auch dem Ring Z der ganzen Zahlen und dem Polynomring R[z] eigen. Folglich lassen sich Teilbarkeitseigenschaften, die Ermittlung gr¨oßter gemeinsamer Teiler und die B´ezout sche Identit¨ at auch im Euklid ischen Ring RH∞ untersuchen. Jede reell-rationale SISO-Strecken¨ ubertragungsfunktion l¨asst sich als Quo¨ tient teilerfremder stabiler Ubertragungsfunktionen darstellen. Davon ausge¨ hend f¨ uhren rein-algebraische Uberlegungen auf eine geschlossenen Formel f¨ ur die Gesamtheit aller reell-rationalen Regler, die den Regelkreis stabilisieren. Diese Gesamtheit aller stabilisierenden Regler kann als lineargebrochene Funktion eines Entwurfsparameters Q ∈ RH∞ notiert werden.
240
5 Regelbarkeit aus mathematischer Sicht
Dieser sog. Youla-Parameter l¨ aßt sich so festlegen, dass zus¨atzliche Forderungen an die Regelg¨ ute des geschlossenen Regelkreises erf¨ ullt werden. Einem Vorschlag von H. Buchta folgend wird ein bequemerer L¨osungsweg beschrieben, um einen stabilisierenden Regler zu gewinnen, der die gestellten G¨ uteforderungen erf¨ ullt. Abschließend wird gezeigt, dass es instabile Regelstreckenmodelle gibt, bei denen auch der Regler zwangsl¨ aufig instabil sein muss.
5.2 Funktionentheoretische Eigenschaften von stabilen ¨ Ubertragungsfunktionen ¨ Reell-rationale stabile Ubertragungsfunktionen G(s) sind in der abgeschlossenen rechten Halbebene, d. h. f¨ ur alle Argumente s mit Re s ≥ 0, holomorph und betragsbeschr¨ ankt. Die Funktionswerte an allen Stellen s mit Re s > 0 werden durch die Funktionswerte u ¨ ber der imagin¨aren Achse eindeutig bestimmt, und zwar nach Maßgabe von ¨ Satz 5.1 Sei G(s) eine stabile Ubertragungsfunktion. F¨ ur den Funktionswert G(s0 ) mit s0 = σ0 + jω0 (σ0 > 0) gilt
1 G(s0 ) = π
+∞ G(jω) −∞
σ02
σ0 dω . + (ω − ω0 )2
(5.1)
Beweis: Die Behauptung l¨ asst sich durch Anwendung der Cauchyschen Integralformel verifizieren. Wenn ein geschlossener Weg C in der s-Ebene die imagin¨are Achse von −jR bis jR durchl¨ auft und dann u ¨ber einen Halbkreis Rejϕ mit π π ≥ ϕ ≥ − im Uhrzeigersinn geschlossen wird, so bestimmt sich der Funk2 2 tionswert G(s0 ) in einem beliebigen inneren Punkt s0 des von der Kurve C umschlossenen Gebietes gem¨ aß der Cauchysche Integralformel zu −1 G(s) G(s0 ) = ds . ! 2πj s − s0 C
Wir ersetzen nun den Punkt s0 durch sein Spiegelbild an der imagin¨aren Achse, also durch −¯ s0 , und erhalten 1 G(s) ds ; 0= ! 2πj s + s¯0 C
denn der Integrand ist im Inneren und auf dem Rande des umfahrenen Gebietes holomorph. Wegen
¨ 5.2 Funktionentheoretische Eigenschaften von stabilen Ubertragungsfunktionen
2σ0 −1 s0 + s¯0 1 = + =− 2 s + s¯0 s − s0 (s − s0 )(s + s¯0 ) −s + 2jω0 s + ω02 + σ02 ergibt die Summe der beiden zuvor notierten Integralausdr¨ ucke G(s) σ0 ds . G(s0 ) = πj ! −s2 + 2jω0 s + ω02 + σ02 C
Wenn der Radius R → ∞ geht, verschwindet jener Anteil des Integranden, den die Integration u ¨ ber dem Halbkreisbogen beisteuert. Daraus folgt σ0 G(s0 ) = πj
j∞ −j∞
G(s) 1 ds = 2 2 2 −s + 2jω0 s + ω0 + σ0 π
+∞ G(jω) −∞
σ02
σ0 dω. + (ω − ω0 )2 qed.
Folgerung: Das Supremum der Betr¨ age |G(s)| genommen u ¨ ber alle Punkte s mit Re s ≥ 0 ist gleich dem Supremum der Betr¨age |G(jω)| genommen u ¨ ber alle Punkte jω mit −∞ < ω < ∞, also sup |G(s)| = sup |G(jω)| =: ||G(s)||∞ .
Re s≥0
ω∈R
Beweis: Aus (5.1) folgt f¨ ur das Supremum u ¨ ber der offenen rechten s−Halbebene +∞
1
σ0
sup |G(s0 )| = sup
G(jω) 2 dω
2 π σ + (ω − ω ) Re s0 >0 Re s0 >0 0 0 −∞
1 ≤ sup Re s0 >0 π
+∞
−∞
sup |G(jω)|
ω∈R
1 = sup |G(jω)| sup π ω∈R Re s0 >0
+∞
−∞
σ0
dω σ02 + (ω − ω0 )2
σ0 dω σ02 + (ω − ω0 )2
1 = sup |G(jω)| · π = sup |G(jω)| . π ω∈R ω∈R Das interessierende Supremum u ¨ber der abgeschlossenen rechten s−Halbebene kann u ¨ber der offenen rechten s−Halbebene oder u ¨ ber der imagin¨aren Achse angenommen werden. Mithin gilt sup |G(s0 )| = max sup |G(jω)| , sup |G(s0 )| = sup |G(jω)| . Re s0 ≥0
ω∈R
Re s0 >0
ω∈R
qed. ¨ In der Gesamtheit aller stabilen Ubertragungsfunktionen spielen die mi¨ ¨” nimalphasigen Ubertragungsfunktionen“ einerseits und die Allpass-Uber” tragungsfunktionen“ andererseits eine besondere Rolle.
241
242
5 Regelbarkeit aus mathematischer Sicht Bode–Diagramm
Ortskurve
0 −0.2
1
10
0
Im G(jω)
Amplitude
Ausschnitt
0.2
0
0
10
−1
10
0.5
1
1.5
−5 −10 −15 −20
0
1
10
10
2
10
−10
−5
0
10
15
Sprungantwort
2
0 −2
Phase
5
Re G(jω)
ω
1.5
−4 1 −6 0.5
−8 −10 0 10
1
10
2
10
0
0
Bild 5.1.
5
10
15
t
ω
Harmonischer Oszillator mit ω0 = 10, d = 0.025 als Beispiel f¨ ur ein ¨ minimalphasiges Ubertragungsystem
¨ Definition 5.1. Eine stabile Ubertragungsfunktion heißt minimalphasig, wenn sie keine Nullstellen mit Re s > 0 hat. Beispiele: 1,
s , s+1
ω02 s2 + 2dω0 s + ω02
(sog. harmonischer Oszillator)
¨ ¨ Definition 5.2. Eine stabile Ubertragungsfunktion heißt Allpass-Ubertragungsfunktion, wenn sie f¨ ur alle Argumente auf der imagin¨aren Achse betragsgleich Eins ist. Beispiele: 1,
s − s0 mit Re s0 > 0, s + s¯0
s2 − s + 2 s2 + s + 2
¨ Satz 5.2 F¨ ur jede stabile Ubertragungsfunktion G(s) gibt es eine (bis auf ¨ das Vorzeichen eindeutige) Zerlegung in eine Allpass-Ubertragungsfunktion ¨ Gap (s) und eine minimalphasige Ubertragungsfunktion Gmp (s), d. h. G(s) = Gap (s) · Gmp (s) .
¨ 5.2 Funktionentheoretische Eigenschaften von stabilen Ubertragungsfunktionen Bode–Diagramm
Ortskurve
0
10
−0.5
Im G(jω)
Amplitude
Ausschnitt
0.5
20
1
243
0
10
−1
10
−1
15
−1
0
1
10 5 0
−2
10
0
−10
2
10
10
−5
0
5
10
15
Re G(jω)
ω
Sprungantwort
1
0
0.5 −2
Phase
0 −4 −0.5 −6
−1
−8
−1.5
−10 −2 10
0
−2
2
10
10
0
Bild 5.2.
5
10
15
t
ω
¨ Stabile Ubertragungsfunktion mit Allpass 1. Ordnung, und zwar s − 0.25 100 · P (s) = 2 s + 0.5s + 100 s + 0.25
Beweis: Die Nullstellen-Menge von G(s) mit Re s > 0 sei {s1 , s2 , . . . sm } , wobei mehrfache Nullstellen entsprechend ihrer Vielfachheit zu z¨ahlen sind. Setzt man m < s − sµ G(s) Gap (s) := , und Gmp (s) := s + s¯µ Gap (s) µ=1 so werden die Behauptungen des Satzes erf¨ ullt.
qed.
s − sµ mit Re sµ > 0 bewirkt im Argumentbereich s + s¯µ ¨ −∞ < ω < ∞ eine Phasendrehung der Ubertragungsfunktion G(s) von −2π; denn Jeder Allpass-Term
∞
ω=−∞
jω − sµ d arc = jω + s¯µ
∞
∞
d arc (jω − sµ ) − −∞
−∞
d arc (jω + s¯µ ) = −π − (+π) = −2π.
244
5 Regelbarkeit aus mathematischer Sicht
¨ Daher r¨ uhrt der einpr¨ agsame Name, stabile Ubertragungsfunktionen ohne Nullstellen in der rechten Halbebene als minimalphasig“ zu bezeichnen. Ein ” sorgf¨ altiger Vergleich der Bilder 5.1, 5.2 und 5.3 ist aufschlussreich.
Bode–Diagramm
Ortskurve 20
1
−0.5
0
0.5
1
1.5
2
15
Im G(jω)
Amplitude
10
Ausschnitt
0.2 0 −0.2 −0.4 −0.6
0
10
−1
10
10 5 0 −5 −10
0
10
1
10
2
−10
10
10
20
Sprungantwort
2
0 −2
Phase
0
Re G(jω)
ω
1.5
−4 1 −6 0.5
−8 −10 0 10
1
10
ω Bild 5.3.
2
10
0
0
5
10
15
t
¨ Stabile Ubertragungsfunktion mit Allpass 2. Ordnung, und zwar 100 s2 − 0.5s + 100 P (s) = 2 · s + 0.5s + 100 s2 + 0.5s + 100
¨ Minimalphasige Ubertragungsfunktionen sind dadurch ausgezeichnet, dass mit der Festlegung des Amplitudenfrequenzganges automatisch auch der Phasenfrequenzgang fixiert ist. ¨ Satz 5.3 Bei minimalphasigen Ubertragungsfunktionen G(s) mit G(jω) = 0 f¨ ur alle ω ∈ R wird der Phasenfrequenzgang arc G(jω) durch den Amplitudenfrequenzgang ln |G(jω)| eindeutig bestimmt:
¨ 5.2 Funktionentheoretische Eigenschaften von stabilen Ubertragungsfunktionen
2ω0 arc G(jω0 ) = π
∞ 0
=
1 π
∞ −∞
ln |G(jω)| − ln |G(jω0 )| dω ω 2 − ω02
d ln |G(jω0 ex )| |x| ln coth dx dx 2
mit
x = ln
ω . ω0 (5.2)
Beweis: Um die Aussagen zu verifizieren, werden zwei Hilfsfunktionen herangezogen. Die erste Funktion F (s) := ln G(s) = ln |G(s)| + j arc G(s)
(5.3)
ist holomorph f¨ ur Re s ≥ 0 und besitzt die Eigenschaften Re F (−jω) = Re F (jω), Im F (−jω) = −Im F (jω),
(5.4)
jϕ
lim
max
π R→∞ − π 2 ≤ϕ≤ 2
F (Re ) = 0. Rejϕ
Die zweite Funktion H(s) :=
F (s) − Re F (jω0 ) F (s) − Re F (jω0 ) F (s) − Re F (jω0 ) − = 2jω0 s − jω0 s + jω0 s2 + ω02
ist holomorph im Inneren und auf dem Rande des von der Kontur C umfahrenen Gebiets (vgl. Bild 5.4). Daher gilt ' 2ω0 & 0 =! H(s)ds = ! 2 − Im F (s) + j Re F (s) − Re F (jω0 ) ds. 2 s + ω0 C
C
Die Beitr¨ age zum Integal auf der rechten Seite lassen sich nach den verschiedenen Teilen der Kontur C berechnen. Der Teilweg entlang der imagin¨aren Achse liefert auf Grund der Symmetrieeigenschaften (5.4) den Beitrag > ω0 −ε R ? ' 2ω0 j & I1 =2 lim lim ( Re F (jω) − Re F (jω0 ) jdω + ) 2 ε→0 R→∞ ω0 − ω 2 0
∞ =4ω0 0
ω0 +ε
Re F (jω) − Re F (jω0 ) dω ω 2 − ω02
Die beiden kleinen Halbkreise ergeben zusammen
245
246
5 Regelbarkeit aus mathematischer Sicht jIm s
s-Ebene
jω0 R Re s −jω0 C
Bild 5.4. Kontur C bei der Berechnung des Integrals H(s)ds C
> π2 I2 =2 lim
ε→0 −π 2 π 2
=2
F (jω0 + εejϕ ) − Re F (jω0 ) jεejϕ dϕ jω0 + εejϕ − jω0
?
lim F (jω0 + εejϕ ) − Re F (jω0 ) jdϕ
ε→0
−π 2 π
2
jIm F (jω0 )jdϕ = −2π Im F (jω0 ) .
=2 −π 2
Der Beitrag des großen Halbkreises ist − 2
π
I3 = 2jω0 lim
R→∞ π 2
F (Rejϕ ) − Re F (jω0 ) Rejϕ jdϕ = 0. (Rejϕ )2 + ω02
Die gewonnenen Teilergebnisse lassen sich zusammenfassen zu ∞ 0 = 4ω0 0
Re F (jω) − Re F (jω0 ) dω − 2πIm F (jω0 ) + 0 . ω 2 − ω02
Aus der Definition (5.3) der Funktion F folgt die behauptete erste Darstellungsform
¨ 5.2 Funktionentheoretische Eigenschaften von stabilen Ubertragungsfunktionen
∞
2ω0 arc G(jω0 ) = π
ω=0
ln |G(jω)| − ln |G(jω0 )| dω . ω 2 − ω02
Um zur zweiten Darstellungsform zu gelangen, wird ω = ω 0 ex ,
mithin
dω = ω0 ex dx = ωdx
substituiert: 1 arc G(jω0 ) = π
∞ −∞
2ω02 ex 2 ω0 (e2x −
1)
(ln |G(jω0 ex )| − ln |G(jω0 )|) dx .
Aus der Nebenrechnung 2ex = e2x − 1
1 x 2 (e
1 d |x| 1 = − ln coth = −x sinh x dx 2 −e )
erh¨ alt man 1 arc G(jω0 ) = π 1 = π
∞ −∞
∞
ln |G(jω0 ex )| − ln |G(jω0 )| 1 dx = sinh x π
∞ −∞
ln |G(jω0 ex )| dx sinh x
|x| d dx ln |G(jω0 e )| − ln coth dx 2 x
−∞
∞ 1 |x|
x = − ln |G(jω0 e )| ln coth π 2 −∞ ∞ 1 |x| d ln |G(jω0 ex )| · ln coth dx + π dx 2 −∞
=
1 π
∞ −∞
d |x| ln |G(jω0 ex )| · ln coth dx . dx 2
qed. Die Formel (5.2) besitzt eine große regelungstechnische Bedeutung. Die im Integranden stehende Funktion ln coth
|x| e|x| + 1 = ln |x| , 2 e −1
die im Bild 5.5 dargestellt wurde, l¨ asst sich als frequenzabh¨angige Wichtungsfunktion interpretieren. In der Umgebung von ω = ω0 nimmt die Wichtungsfunktion große Werte an. Die Fl¨ ache unter der Kurve l¨asst sich exakt berechnen, vgl. z.B. [GR57],No.4.223:
247
248
5 Regelbarkeit aus mathematischer Sicht
3.5
3
ln coth |x| 2
2.5
2
1.5
1
0.5
0 −5
−4
−3
−2
−1
0
1ω
x = ln
2
3
4
5
ω0
Bild 5.5. Wichtungsfunktion ln coth |x| 2
∞ ln coth −∞
∞ ex + 1 dx = 2 ln(1 + e−x ) − ln(1 − e−x ) dx x e −1 0 0 2 2 2 π π π + = =2 12 6 2
|x| dx =2 2
∞
ln
d Der Faktor dx ln |G(jω0 ex )| gibt den Amplitudenfrequenzgang wieder; denn wegen ω = ω0 ex wird
d ln |G(jω)| d lg|G(jω)| d ω d ln |G(jω)| ln |G(jω0 ex )| = = = dx dω d ln ω d lg ω W¨ are der Anstieg des Amplitudenfrequenzganges
d lg|G(jω)| = const = −c, d lg ω
so erhielte man als Phasenmaß −c arc G(jω0 ) = π
∞ ln coth −∞
π |x| dx = −c 2 2
Die praktische Konsequenz dieser Tatsache geht aus dem Bild 5.6 hervor: ¨ Der Anstieg des Amplitudenfrequenzganges der Ubertragungsfunktion G0 (s) d lg |G0 (jω)| des offenen Regelkreises, also = −c, sollte in der N¨ahe der Durchd lg ω trittsfrequenz ω = ωD , f¨ ur die |G0 (jωD )| = 1 gilt, betragskleiner als 2
¨ 5.2 Funktionentheoretische Eigenschaften von stabilen Ubertragungsfunktionen
sein. Dies garantiert bei stabilem G0 (s) die Stabilit¨at des geschlossenen Regelkreises; denn die Ortskurve G0 (jω) l¨ asst den kritischen Punkt (−1; j0) links liegen“ (vgl. vereinfachtes Strecker-Nyquist-Kriterium). Der Anstiegs” wert c = 2 entspricht im Bode-Diagramm einem Abfall von 40 dB/Dekade. 1
0.5
Im G0 (jω)
0 1 arc G10 (jωD )
−0.5
−1
−1.5
G10 (jω); stabiler RK −2
G20 (jω); instabiler RK
−2.5
−3 −2.5
Bild 5.6.
−2
−1.5
−1
−0.5
0
0.5
Re G0 (jω)
1
1.5
2
2.5
1 Frequenzgang G10 (jω) mit der Durchtrittsfrequenz ωD , der auf einen stabilen geschlossenen Regelkreis f¨ uhrt, und Frequenzgang G20 (jω) , der auf einen instabilen geschlossenen Regelkreis f¨ uhrt
¨ Satz 5.4 Die stabile Ubertragungsfunktion G(s) = Gmp (s)·Gap (s) habe keine rein imagin¨aren Nullstellen. Dann gilt f¨ ur jeden Punkt s0 = σ0 + jω0 mit σ0 > 0: ∞ 1 σ0 ln |G(jω)| 2 dω (5.5) ln |Gmp (s0 )| = π σ0 + (ω − ω0 )2 −∞
Beweis: ¨ Die minimalphasige Ubertragungsfunktion Gmp (s) hat weder Pole noch Nullstellen mit Re s ≥ 0. Die Funktion F (s) := ln Gmp (s) = ln |Gmp (s)| + j arc Gmp (s) ist holomorph und betragsbeschr¨ ankt f¨ ur Re s ≥ 0. Wegen |Gmp (jω)| = |G(jω)| darf man aus (5.1) schlussfolgern:
249
250
5 Regelbarkeit aus mathematischer Sicht
1 Re F (s0 ) = ln |Gmp (s0 )| = π =
1 π
∞ ln |G(jω)| −∞
∞ ln |Gmp (jω)| −∞
σ0 dω σ02 + (ω − ω0 )2
σ0 dω . σ02 + (ω − ω0 )2
qed. Der Satz 5.4 gestattet eine n¨ utzliche regelungstechnische Anwendung, wenn ¨ man anstelle der allgemeinen stabilen Ubertragungsfunktion G(s) eine spezielle, n¨ amlich die Empfindlichkeitsfunktion S(s) = (1 + G0 (s))−1 des Standardregelkreises, einsetzt. ¨ Satz 5.5 Die Ubertragungsfunktion G0 (s) des offenen Regelkreises habe eine einfache reelle Nullstelle z = σ0 > 0 oder ein einfaches Nullstellenpaar z1,2 = σ0 ± jω0 mit σ0 > 0 sowie k Pole {p1 , . . . , pk } mit positiven Realteilen. Dann gen¨ ugt die Empfindlichkeitsfunktion S(s) = (1 + G0 (s))−1 der Integralbedingung ∞ 0
ln |S(jω)|
k
< σ0 σ0
pκ + z
dω = π · ln +
σ02 + (ω − ω0 )2 σ02 + (ω + ω0 )2 p¯κ − z κ=1
(5.6) Beweis: Die Pole pκ , κ = 1, . . . , k, mit positiven Realteilen von G0 (s) werden zu Nullstellen von S(s) = (1 + G0 (s))−1 = Sap (s) · Smp (s), wobei Sap (s) = 8k s − pκ . κ=1 s + p¯κ Wegen G0 (z) = 0 wird S(z) = 1. Dies impliziert ln |Smp (z)| = ln |S(z)| − ln |Sap (z)| = − ln |Sap (z)| = ln
k
<
p¯κ + z
.
pκ − z κ=1
Im Falle einer reellen Nullstelle z = σ0 > 0 erscheint nun die allgemeine Gleichung (5.5) in der Gestalt ∞ −∞
σ0 ln |S(jω)| 2 dω = σ0 + ω 2
∞ ln |S(jω)| 0
k
< 2z
p¯κ + z
dω = π · ln
,
z 2 + ω2 pκ − z κ=1
w¨ ahrend im Falle einer komplexen Nullstelle z = σ0 + jω0 oder z = σ0 − jω0 die allgemeine Gleichung (5.5) u qed. ¨ bergeht in (5.6). Bei einer quantitativen Auswertung der Beziehung (5.6) kann man die obere Integrationsgrenze ∞ durch einen endlichen Wert, z.B. ω = 2|z|, ersetzen; denn f¨ ur ω 1 wird ln |S(jω)| ≈ 0, und die Wichtungsfunktion, die mit dem
¨ 5.2 Funktionentheoretische Eigenschaften von stabilen Ubertragungsfunktionen
Re z an der Stelle ω = 0 beginnt, klingt f¨ ur ω 1 wie ω −2 gegen Null |z|2 ab. Die rechte Seite von (5.6) steigt u ¨ ber alle Grenzen, wenn sich ein instabiler Pol von G0 (s) der instabilen Nullstelle z n¨ahert. Dies charakterisiert die besondere Schwierigkeit, ein solches offenes System G0 (s) durch R¨ uckf¨ uhrung stabilisieren zu wollen. Eine weitere Integralbeziehung, die sich ansatzweise schon in der Literatur der 1940er und 1950er Jahre findet ([Bod45],[Wes52]), formulieren wir in dem Wert 2
¨ Satz 5.6 Die Ubertragungsfunktion G0 (s) = K(s)P (s) des offenen Regelkreises sei streng proper, r ≥ 1 bezeichne ihren relativen Grad und {p1 , · · · , pk } die Menge der Pole von G0 (s) mit Re s > 0. Dann gen¨ ugt die stabile Empfindlichkeitsfunktion S(s) = (1 + G0 (s))−1 des geschlossenen Regelkreises der Fl¨achenformel“ ” ∞ k π (5.7) ln |S(jω)| dω = · − lim (s · G0 (s)) + 2 · Re pκ . s→∞ 2 κ=1 0
F¨ ur r ≥ 2 folgt daraus ∞ lg |S(jω)| dω = π(lg e)
k
Re pκ = 1.3644 ·
κ=1
0
k
Re pκ .
(5.8)
κ=1
Beweis: Weil die Empfindlichkeitsfunktion S(s) = (1 + G0 (s))−1 als eine stabile ¨ Ubertragungsfunktion vorausgesetzt wird, darf Satz 5.4 herangezogen und ω0 = 0 gesetzt werden: 1 ln |Smp (σ0 )| = π
∞ ln |S(jω)| −∞
σ02
σ0 dω + ω2
Multiplikation mit σ0 und Ber¨ ucksichtigung von |S(−jω)| = |S(jω)| ergibt ∞ 0
σ02 πσ0 πσ0
S(σ0 )
ln |Smp (σ0 )| = ln
ln |S(jω)| 2 dω = σ0 + ω 2 2 2 Sap (σ0 )
=
πσ0 (ln |S(σ0 )| − ln |Sap (σ0 )|). 2
(5.9)
asst sich auf der linken Seite von (5.9) bilden, Der Grenzwert f¨ ur σ0 → ∞ l¨ ∞ lim
σ0 →∞ 0
σ2 ln |S(jω)| 2 0 2 dω = σ0 + ω
∞ ln |S(jω)| dω. 0
Wenn man den relativen Grad r von G0 (s) explizit darstellt,
251
252
5 Regelbarkeit aus mathematischer Sicht
ˆ G0 (s) = s−r · G(s)
mit
ˆ lim G(s) = lim (sr · G0 (s)) = const =: γ,
s→∞
s→∞
kann man f¨ ur alle Grade r ≥ 1 die Grenzwerte der Ausdr¨ ucke auf der rechten Seite von (5.9) so bestimmen: lim σ0 ln |S(σ0 )| = − lim σ0 ln |1 + G0 (σ0 )| = − lim σ0 ln 1 +
σ0 →∞
σ0 →∞
−γ γ = − lim σ0 r = 0 σ0 →∞ σ0
σ0 →∞
f¨ ur
γ σ0r
r=1 ; r≥2
und
−1
lim σ0 ln Sap (σ0 )
σ0 →∞
= lim σ0 ln σ0 →∞
= lim σ0 σ0 →∞
k σ0 + pκ κ=1
k
(
κ=1
σ0 − p κ
= lim σ0 σ0 →∞ k
k κ=1
ln(1 +
pκ pκ + ) σ0 σ0
pκ pκ + ) =2· Re pκ . σ0 σ0 κ=1
Die gewonnenen Ergebnisse best¨ atigen die Behauptung (5.7). Im Falle r ≥ 2 verschwindet der Summand lims→∞ (sr · G0 (s)). Durch den ¨ Ubergang vom nat¨ urlichen zum dekadischen Logarithmus entsteht dann (5.8). qed. Der Inhalt der S¨ atze 5.5 und 5.6 wird in der Literatur oft unter dem Schlagwort Wasserbett-Effekt“ als Merkhilfe diskutiert: Was an einer Stel” le herabgedr¨ uckt wird, quillt an anderer Stelle wieder nach oben. Die bei tiefen Frequenzen f¨ ur ein gutes F¨ uhrungsverhalten anzustrebenden Werte |S(jω)| 1werden in anderen Frequenzbereichen durch gr¨oßere Werte von |S(jω)| derart kompensiert, dass insgesamt eine unver¨anderte Fl¨achenbilanz entsteht. Jedes Absenken der Amplituden der Empfindlichkeitsfunktion im niederfrequenten Bereich wird zwangsl¨ aufig mit einer Amplitudenerh¨ohung im h¨ oherfrequenten Bereich erkauft. Bei einem relativen Grad r ≥ 2 kann der Wunsch |S(jω)| < 1 f¨ ur alle ω prinzipiell nicht erf¨ ullt werden. Dies l¨ asst sich anschaulicher in der komplexen Zahlenebene sagen: Der Frequenzgang G0 (jω) des offenen Regelkreises kann nicht vollst¨andig außerhalb der Kreisscheibe um den Mittelpunkt −1 + j0 und dem Radius 1 verlaufen. 1 und ei(s−3)(s+4) ¨ nem Proportionalregler mit K(s) = 60 hat die Ubertragungsfunktion des offenen Kreises den relativen Grad r = 2. 2 ist Die Empfindlichkeitsfunktion des geschlossenen Regelkreises S(s) = ss2 +s−12 +s+48 stabil, und die Fl¨ achenformel (5.8) liefert
Beispiel 5.1 Bei einer Strecken¨ubertragungsfunktion P (s) =
∞ 0
vgl. Bild 5.7.
lg |S(jω)| dω = π · lg e · 3 = 4.0931 ,
¨ 5.2 Funktionentheoretische Eigenschaften von stabilen Ubertragungsfunktionen 1
0.8
lg |S(jω)|
0.6
0.4
+
0.2
0
−0.2
−
−0.4
−0.6
−0.8
0
5
10
15
ω
20
25
30
Bild 5.7. Fl¨ achenbilanz f¨ ur lg |S(jω)|, sog. Wasserbett-Effekt“ ”
Beispiel 5.2 Bei einem Streckenmodell P (s) = (s + a)−1 und einem Proportionalregler K(s) = kP kann der Satz 5.6 angewandt werden, wenn die Empfindlichs+a keitsfunktion S(s) = stabil ist, wenn also die beiden reellen Parameter s + a + kP ugen. a, kP der Bedingung a + kP > 0 gen¨ Die Formel (5.7) lehrt dann
∞
ln |S(jω)| dω = 0
π 2 π −(2a + kP ) 2 −kP
f¨ ur
a>0 a<0
.
Aus Abschnitt 4.7.4 ist bekannt, dass die Forderungen an den Regelkreis nach robuster Stabilit¨ at und robuster G¨ ute etwa in der Form (4.27), |WS (jω)S(jω)| + |WT (jω)T(jω)| ≤ 1
f¨ ur alle
ω,
dargestellt werden k¨ onnen. Bei allpasshaltigen Nominalregelstreckenmodellen P(s) ergeben sich besondere Schwierigkeiten beim Reglerentwurf durch die Zwangsbedingungen, die die Wichtungsfunktionen WS (s) und WT (s) zu erf¨ ullen haben. Auf solche Zwangsbedingungen wird nun eingegangen. ¨ Satz 5.7 Hat die Ubertragungsfunktion P(s) der Regelstrecke eine Nullstelle bei s = z mit Re z > 0 bzw. einen Pol bei s = p mit Re p > 0, so m¨ ussen die Wichtungsfunktionen WS (s) und WT (s) die Bedingungen
253
254
5 Regelbarkeit aus mathematischer Sicht
∞ = sup (WS S)(jω)
≥ WS (z)
WS · S ω
WT · T∞ = sup (WT T)(jω) ≥ WT (p)
ω
erf¨ ullen. Beweis: Wegen P(z) = 0 wird S(z) = (1 + K(z)P (z))−1 = 1. Daraus folgt
≤ sup WS (s) · S(s) = WS · S ∞
WS (z) = WS (z) · S(z) Re s≥0
Analog verifiziert man die zweite Aussage: Mit P (p) → ∞ wird T(p) = 1, und
WT (p) = WT (p) · T(p) ≤ sup WT (s) · T(s) = WT · T∞ Re s≥0
qed. ¨ Falls die Ubertragungsfunktion P (s) der Regelstrecke sowohl Nullstellen als auch Pole in der offenen rechten Halbebene besitzt, ergeben sich sch¨arfere Aussagen: Satz 5.8 [SP96] Das Regelstreckenmodell P(s) habe k Pole {p1 , . . . , pk } und l Nullstellen {z1 , . . . , zl } mit positiven Realteilen. Dann ist f¨ ur die Stabilit¨at des (Nominal-)Regelkreises notwendig, dass die gewichtete Empfindlichkeitsfunktion f¨ ur jede der Nullstellen zλ (λ = 1, . . . , l) die Bedingung
∞ ≥ cSλ · WS (zλ )
WS S
, wobei
cSλ
k
<
zλ + pκ
=
z λ − pκ ≥ 1 κ=1
und die gewichtete komplement¨are Empfindlichkeitsfunktion f¨ ur jede der Polstellen pκ (κ = 1, . . . , k) die Bedingung
WT T∞ ≥ cT κ WT (pκ )
, wobei
cT κ =
l
<
z λ + pκ
z λ − pκ ≥ 1
λ=1
erf¨ ullen. Beweis: −1 Die Empfindlichkeitsfunktion S(s) = 1 + K(s) · P (s) hat Nullstellen mit positivem Realteil bei pκ (κ = 1, . . . , k) und darf als stabil vorausgesetzt werden. Daher existiert eine Zerlegung S(s) = Smp (s) · Sap (s)
mit
Sap (s) =
k < s − pκ s + pκ κ=1
¨ 5.2 Funktionentheoretische Eigenschaften von stabilen Ubertragungsfunktionen
λ ) = 1 und man gewinnt die Absch¨atzung F¨ ur s = zλ wird S(z
∞ = sup WS (s) · S(s) = sup WS (jω) · Smp (jω)
WS · S ω
Re s≥0
= sup WS (s)Smp (s) ≥ WS (zλ ) · Smp (zλ )
Re s≥0
k
λ )
z λ + pκ
S(z
<
= WS (zλ ) ·
= WS (zλ ) ·
z λ − pκ
Sap (zλ )
κ=1 K(s) · P (s) hat 1 + K(s) · P (s) Nullstellen mit positivem Realteil bei zλ (λ = 1, . . . , l) und darf als stabil ¨ vorausgesetzt werden. Uber die Zerlegung Die komplement¨ are Empfindlichkeitsfunktion T(s) =
T(s) = Tmp (s) · Tap (s)
, wobei Tap (s) =
l < s − zλ , s + zλ
λ=1
gelingt eine analoge Schlusskette: T(pκ ) = 1,
WT · T∞ = sup WT (s) · T(s) = sup WT (jω) · Tmp (jω)
ω
Re s≥0
= sup WT (s) · Tmp (s) ≥ WT (pκ ) · Tmp (pκ
Re s≥0
l
T(p )
z λ + pκ
<
κ
= WT (pκ )| ·
= WT (pκ ) ·
z λ − pκ
Tap (pκ )
λ=1
qed. Beispiel 5.3 Im Abschnitt 2.5.3.3 auf Seite 80, Gleichung (2.31) wurden die linearisierten Bewegungsgleichungen f¨ ur das verschiebliche N -fach-Pendel hergeleitet. Wir betrachten nun den Fall N = 1 f¨ ur verschwindende Drehkraft D1 = 0 und vernachl¨ assigen die Reibungskr¨ afte. Bei dieser einfachen Version des verschieblichen Einfach-Pendels lauten die Bewegungsgleichungen im Bildbereich (m0 + m1 )s2 −m1 ls2 −s2
ls2 − g
X0
=
Φ
1
0
F,
osen, Man kann sie nach den Systemgr¨ oßen X0 , Φ aufl¨ X0 Φ
ls −g = s lm s −g(m +m ) F . 2
2
0
2
0
1
1 lm0 s2 −g(m0 +m1 )
Ersichtlich besitzt die Strecken¨ ubertragungsfunktion
0 P (s) = GX F (s) =
s2 m
ls2 − g 2 0 · ls − [m0 + m1 ]g
255
256
5 Regelbarkeit aus mathematischer Sicht
einen Pol p1 und eine Nullstelle z1 , m0 + m1 g = m0 l
p1 =
g l
1+
m1 m0
und
g , l
z1 =
die positiv sind. Satz 5.7 fordert von den Wichtungsfunktionen WS (z1 ) = WT (p1 ) = WT
≤ W S
1+ ≤ W T g l
WS
g l
m1 m0
Satz 5.8 stellt st¨ arkere Bedingungen
z W (z ) ≤ z z W (p ) ≤ z S
1
1
T
− p · W +p
1 − p1 · WS S 1 + p1
1
1
1
1
T
S
∞
T
∞
1 − 1 +
= 1 + 1 + 1 − 1 +
= 1 + 1 +
T
m1 m0 m1 m0 m1 m0 m1 m0
∞ ∞
· W S · W T S
T
∞
∞
Diese Bedingungen wirken sich beim Entwurf robuster Regler umso gravierender aus, je kleiner die Ersatzmasse m1 gegen¨ uber der Ersatzmasse m0 ist.
5.3 Algebraische Eigenschaften von stabilen ¨ Ubertragungsfunktionen ¨ Die Menge aller reell-rationalen stabilen Ubertragungsfunktionen wird von nun an durch das Symbol RH∞ 1 bezeichnet. Wir wollen die algebraischen Eigenschaften dieser Funktionenmenge betrachten. Bekanntlich lassen sich ¨ stabile Ubertragungsfunktionen addieren und multiplizieren. Falls F1 , F2 ∈ RH∞ , so ist auch F1 + F2 ∈ RH∞ und F1 · F2 = F2 · F1 ∈ RH∞ . ¨ Auch jede reelle Zahl c kann als stabile Ubertragungsfunktion betrachtet werden, also c ∈ RH∞ . Die Zahlen 0 und 1 sind ausgezeichnete Elemente in RH∞ , n¨ amlich das neutrale Element bez. der Addition bzw. das neutrale Element bez. der Multiplikation; denn f¨ ur jedes Element F ∈ RH∞ gilt offenbar F + 0 = F und F · 1 = F. Die Multiplikation ist kommutativ und nullteilerfrei; denn F1 · F2 = 0 impliziert F1 = 0 oder
F2 = 0.
¨ Diese einfachen Uberlegungen erlauben in der Sprache der Algebra den Schluss: Die Menge RH∞ ist ein nullteilerfreier kommutativer Ring 1
Der Hardy-Funktionenraum RH∞ wurde auf Seite 49 eingef¨ uhrt.
¨ 5.3 Algebraische Eigenschaften von stabilen Ubertragungsfunktionen
257
mit Einselement. Eine genauere Untersuchung bringt jedoch noch mehr zutage: Die Menge RH∞ bildet sogar einen Euklidischen Ring , hat also die gleiche algebraische Struktur wie die Menge der ganzen Zahlen Z und wie die Menge der reellen Polynome R[s] in einer Unbekannten s. Um diese keineswegs offensichtliche Tatsache zu verifizieren, muss man zeigen: In RH∞ l¨ asst sich ein Euklidischer Algorithmus durchf¨ uhren und dadurch ein gr¨ oßter gemeinsamer Teiler zu zwei gegebenen Elementen F1 , F2 ∈ RH∞ berechnen. Wir wollen dieses Problem angreifen, wobei wir zuerst die Teilbarkeitseigenschaften in RH∞ betrachten. Formal kann man jede rellrationale Funktion invertieren, indem man Z¨ ahler- und Nennerpolynom vertauscht. Die Eigenschaft der Stabilit¨ at geht dabei aber in der Regel verloren. In diesem Sinne sind die meisten Funktionen F ∈ RH∞ nicht invertierbar, jedenfalls nicht in RH∞ Nur die Funktionen aus RH∞ , die in der abgeschlossenen rechten Halbebene keine Nullstellen besitzen und bei denen Z¨ahler- und Nennergrad u ¨ bereinstimmen, sind in RH∞ invertierbar. Sie bilden die sog. Einheiten in RH∞ . 2 Die Einheiten in RH∞ lassen sich verbal so charakterisieren: minimalphasige (und daher per definitionem stabile) Funktionen mit dem relativen Grad Null und ohne rein-imagin¨are Nullstellen. Beispiele (s + 2)2 f¨ ur Einheiten in RH∞ : E1 (s) = c > 0, E2 (s) = . (s + 3)(s + 4) F1 heißt Teiler von F2 in RH∞ , falls ein F3 ∈ RH∞ derart existiert, dass F1 · F3 = F2 gilt. Man schreibt dann F1 |F2 und spricht F1 teilt F2“. ” Der gr¨ oßte gemeiname Teiler (ggT) ist im allgemeinen nicht eindeutig bestimmt. Ein ggT von F1 und F2 ist jedes Element D ∈ RH∞ mit D|F1 und D|F2 , falls f¨ ur alle C ∈ RH∞ mit C|F1 und C|F2 folgt C|D. F¨ ur jede Einheit E gilt: Falls D ein ggT von F1 und F2 ist, dann auch D · E. Zwei Funktionen F1 , F2 ∈ RH∞ heißen teilerfremd (oder koprim), falls alle gemeinsamen Faktoren Einheiten in RH∞ sind. Beispielsweise sind die stabilen Funktionen G1 (s) =
(s + 3)(s + 2) s+3 s+2 · = (s + 1)2 s+1 s+1
und G2 (s) =
(s + 4)(s + 5) s + 2 · (s + 1)2 s+1
teilerfremd in RH∞ , obwohl ein gemeinsamer Faktor F (s) = werden kann. Dieser ist jedoch eine Einheit in RH∞ .3 2
3
s+2 s+1
abgelesen
Es sei daran erinnert, dass die Einheiten im Euklid ischen Ring Z die Zahlen +1 und -1 sind, w¨ ahrend im Euklid ischen Ring R[s] alle von Null verschiedenen reellen Zahlen zu Einheiten werden. Eine vergleichbare Situation l¨ age vor, wenn im Ring R[s] die beiden Polynome P1 (s) = 2 · (s + 1) · (s + 3) und P2 (s) = 2 · (s2 + 1) · (s2 + 3) gegen¨ ubergestellt w¨ urden. Obwohl ein gemeinsamer Faktor 2“ abgelesen werden kann, sind P1 ” und P2 teilerfremde Elemente im Ring R[s].
258
5 Regelbarkeit aus mathematischer Sicht
Die Teilerfremdheit in RH∞ l¨ asst sich auch so ausdr¨ ucken: Zwei Funktionen F1 , F2 sind teilerfremd in RH∞ , wenn sie keine gemeinsamen Nullstellen in der abgeschlossenen rechten Halbebene haben. Um den Euklid ischen Algorithmus f¨ ur den Ring RH∞ formulieren zu k¨ onnen, wird eine Niveaustufen-Funktion ν : RH∞ \{0} → N ben¨otigt, die an die Stelle des Betrages im Euklid ischen Ring der ganzen Zahlen oder an die Stelle des Polynomgrades im Ring R[s] tritt. Satz 5.9 Im Ring RH∞ erf¨ ullt die Niveaustufen-Funktion ν(F ) = Anzahl der endlichen Nullstellen mit nichtnegativem Realteil von F + relativer Grad von F die Bedingungen des Euklidischen Algorithmus, n¨amlich 1. falls F |G, so ν(F ) ≤ ν(G) 2. zu gegebenen F, G = 0 existiert ein Q derart, dass F = Q · G + R,
wobei
R=0
oder
ν(R) < ν(G) .
Einen Beweis dieses Satzes findet der Leser in dem epochalen Buch [Vid85] von Mathukumalli Vidyasagar, geb. 1947. Hier wird kein Beweis abgedruckt, weil der Euklid ische Algorithmus im weiteren nicht verwendet wird, um ¨ gr¨ oßte gemeinsame Teiler gegebener stabiler Ubertragungsfunktionen wirklich zu berechnen. Zum Zwecke des Entwurfs aller stabilisierenden Regler wird nur die Tatsache, dass der Ring RH∞ ein Euklid ischer Ring ist, ausgenutzt, um mit der B´ezout schen Identit¨ at zu arbeiten, so wie das bereits im Abschnitt 3.3.1 f¨ ur den Euklid ischen Ring R[s] getan wurde. Satz 5.10 Zwei Funktionen F1 , F2 ∈ RH∞ sind genau dann teilerfremd, wenn sich teilerfremde Funktionen F, H ∈ RH∞ derart finden lassen, dass die B´ezoutsche Identit¨at F (s) · F1 (s) + H(s) · F2 (s) = 1
f¨ ur alle s ∈ C
erf¨ ullt wird. Die Funktionen F, H, die im Satz 5.10 vorkommen, sind nicht eindeutig festgelegt. Man rechnet rasch nach, dass neben den Funktionen F und H auch die Funktionen F! = F + Q · F2
! = H − Q · F1 und H
(f¨ ur beliebig w¨ ahlbare Q ∈ RH∞ ) die B´ezout sche Identit¨at erf¨ ullen. ZG (s) ¨ mit Zu einer gegebenen rationalen Ubertragungsfunktion G(s) = NG (s) teilerfremden Polynomen GZ und GN (in R[s], d. h. GZ und GN haben
¨ 5.3 Algebraische Eigenschaften von stabilen Ubertragungsfunktionen
259
keine gemeinsame Nullstelle in C) kann man eine teilerfremde Darstellung in RH∞ finden: Durch Erweiterung“ mit einem stabilen Zwischenpolynom ” ZP (s) l¨ asst sich G(s) auf die Form ZG (s) Z(s) ZP (s) =: G(s) = NG (s) N (s) ZP (s)
mit
Z(s), N (s) ∈ RH∞
und teilerfremd
bringen. Mit jeder Einheit E(s) ∈ RH∞ erh¨ alt man eine weitere teilerfremde Darstellung ! Z(s) · E(s) Z(s) G(s) = =: , ! (s) N (s) · E(s) N ! = Z · E und N ! = N · E ebenfalls teilerfremd in RH∞ sind. da Z 1 geht (s − 2)(s − 4) 2 bei einer Erweiterung“ mit dem Zwischenpolynom (s + 1) in die Form ” 1 (s + 1)2 Z(s) = G(s) = mit teilerfremden Z(s), N (s) ∈ RH∞ (s − 2)(s − 4) N (s) (s + 1)2 ¨ Beispiel 5.4 Die instabile Ubertragungsfunktion G(s) =
u ezoutsche Identit¨ at ¨ ber. Die B´ F (s) · Z(s) + H(s) · N (s) = 1 wird erf¨ ullt mit F (s) :=
(76s − 88)(s + 1)2 (s + 12)(s + 1)2 , H(s) := , (s + 2)3 (s + 2)3
s+9 49s − 71 , H(s) := . s+1 s+1 1 Statt der Erweiterungsfunktion h¨ atte man auch irgendeine andere Funk(s + 1)2 1 mit beliebigen Koeffizienten a1 > 0, a0 > 0 w¨ ahlen k¨ onnen, tion 2 s + a1 s + a0 und man w¨ are zu einer anderen in RH∞ teilerfremden Zerlegung der gegebenen ¨ Ubertragungsfunktion G(s) gekommen. aber auch mit
F (s) :=
Um die Vielzahl der m¨ oglichen in RH∞ teilerfremden Zerlegungen von ¨ Ubertragungsfunktionen sinnvoll einzuschr¨ anken, wurde in der Theorie der H∞ -Regelungen das Konzept der normalisierten teilerfremden Zerlegungen (englisch: normalized coprime factorization) eingef¨ uhrt. Zwei Funktionen Z(s), N (s) ∈ RH∞ liefern eine normalisierte teilerfrem¨ de Zerlegung einer gegebenen Ubertragungsfunktion G(s), wenn gilt G(s) =
Z(s) , N (s)
wobei
260
5 Regelbarkeit aus mathematischer Sicht
1. Z(s), N (s) teilerfremd in RH∞ und 2. |Z(jω)|2 + |N (jω)|2 = 1 f¨ ur alle ω ∈ R. Man kann zeigen, dass die so definierten normalisierten teilerfremden Zerlegungen bis auf ihr Vorzeichen eindeutig festgelegt sind.
5.4 Reglerentwurf mittels teilerfremder Zerlegung des Regelstreckenmodells 5.4.1 Charakterisierung aller stabilisierenden Regler ZP (s) , NP (s) wobei P (s) eine rationale Funktion und ZP , NP teilerfremde Polynome sind. F¨ ur die weiteren Betrachtungen wird die Regelstrecke in der Form
Gegeben sei ein Standard-Regelkreis mit der Regelstrecke P (s) =
P (s) =
Z(s) N (s)
mit Z, N ∈ RH∞ , teilerfremd
dargestellt. Als Ansatz f¨ ur den Regler verwenden wir K(s) =
F (s) H(s)
mit F, H ∈ RH∞ , teilerfremd.
¨ Zum Nachweis der Stabilit¨ at des Regelkreises m¨ ussen alle Ubertragungsfunktionen von den Eingangssignalen (z(t), r(t)) zu den inneren Signalen (u(t), e(t)) u uft werden, vgl. Abschnitt 4.2. Die vier Eintr¨age der Matrix ¨berpr¨
1 P
−K 1
−1
1 1 K 1 1 + KP −P F HN 1 H = Z 1 HN + F Z − N 1 HN FN . = HN + F Z −HZ HN =
¨ m¨ ussen stabile Ubertragungsfunktionen sein. Weil die vier Z¨ahlerfunktionen per definitionem stabil sind, folgt Satz 5.11 Der Regelkreis ist genau dann stabil, wenn (HN + F Z)−1 ∈ RH∞ . Nun l¨ asst sich die L¨ osung des Reglerentwurfsproblems formulieren. Satz 5.12 Zu einem beliebigen, gegebenen rationalen Regelstreckenmodell P (s) =
Z(s) N (s)
mit Z, N ∈ RH∞ , teilerfremd
(5.10)
5.4 Reglerentwurf mittels teilerfremder Zerlegung des Regelstreckenmodells
261
lassen sich zwei teilerfremde Funktionen F0 , H0 ∈ RH∞ berechnen, die die B´ezoutsche Identit¨at F0 · Z + H0 · N = 1
(5.11)
erf¨ ullen. Dann stabilisiert jeder Regler der Gestalt K∈
F0 + Q · N H0 − Q · Z
6 bei beliebigem Q ∈ RH∞
(5.12)
den Regelkreis. Andererseits ist jeder Regler, der den Regelkreis stabilisiert, von der angegebenen Gestalt. Beweis: F F0 + QN = . H0 − QZ H Dann wird HN + F Z = (H0 − QZ)N + (F0 + QN )Z = H0 · N + F0 · Z = 1, also gilt (HN + F Z)−1 ∈ RH∞ , d. h. der Regelkreis ist wegen Satz 5.11 stabil. F b) Sei K = mit F, H ∈ RH∞ , teilerfremd ein stabilisierender Regler. H Satz 5.11 impliziert dann V := (HN + F Z)−1 ∈ RH∞ , und man darf schreiben a) Es gelte Q ∈ RH∞ und K =
1 = (HN + F Z) · V = N · HV + Z · F V .
(5.13)
Die vorausgesetzte Regelstrecken-Darstellung (5.10) und die zugeh¨orende B´ezout sche Identit¨ at (5.11) ergeben 1 = N · H0 + Z · F0 , = N · H0 + Z · F0 + N ZQ − N ZQ, = N · (H0 − QZ) + Z · (F0 + QN ),
(5.14)
wobei Q zun¨ achst irgendeine reell-rationale Funktion symbolisiert. Durch Vergleich der beiden Gleichungen (5.13) und (5.14) erh¨alt man die zus¨ atzlichen Bedingungen F V = F0 + QN und HV = H0 − QZ. Folglich gilt f¨ ur den Regler K= mit
FV F0 + Q · N F = = H HV H0 − Q · Z
Q = (F0 Z + H0 N ) Q = F0 · (H0 − HV ) + H0 (F V − F0 ) " #$ % =1 = (H0 F − F0 H)V ∈ RH∞ .
Damit wurde der Regler auf die Gestalt (5.12) gebracht.
qed.
262
5 Regelbarkeit aus mathematischer Sicht
In der regelungstechnischen Fachsprache hat sich f¨ ur die bei der algebraischen Reglersynthese gem¨ aß (5.12) frei w¨ ahlbare Funktion Q ∈ RH∞ die Bezeichnung Youla“-Parameter oder auch Youla-Kuˇcera“-Parameter ein” ” geb¨ urgert. Damit wird Bezug genommen auf die Ver¨offentlichungen [YBJ76], [BY77], [Kuˇc79] und andere. Von den fr¨ uhen Publikationen, die noch vor der Monographie [Vid85] erschienen sind, verdient [DLMS80] hervorgehoben zu werden. Eine sehr gelungene erste Lehrdarstellung f¨ ur Studienanf¨anger findet man in dem Buch [DFT92]. Schließlich sei noch auf den Spezialfall stabiler Regelstrecken hingewiesen. In der Streckenbeschreibung P (s) =
ZP (s) Z(s) = NP (s) N (s)
ZP (s) setzen. NP (s) Die B´ezout sche Gleichung (5.11) wird nun erf¨ ullt f¨ ur F0 (s) = 0 und H0 (s) = 1. Die stabilisierenden Regler sind von der Gestalt 6 Q bei beliebigem Q ∈ RH∞ . K∈ 1−Q·P
kann man jetzt N (s) = 1 und Z(s) =
5.4.2 Gangbare Wege des algebraischen Reglerentwurfs Im Satz 5.12 wurde die Menge aller stabilisierenden Regler durch (5.12) mathematisch exakt beschrieben. Der Regelungsingenieur muss sich aber f¨ ur einen einzigen aus dieser unendlichen Menge entscheiden, den er zur Implementierung empfiehlt oder den er selbst zu implementieren beabsichtigt. Der Ingenieur hat also - in der Formulierung des Satzes 5.12 - die Funktionen F0 , H0 ∈ RH∞ zu bestimmen und eine spezielle Funktion Q ∈ RH∞ auszuw¨ ahlen. Nat¨ urlich wird er die Wahl von Q so vorzunehmen suchen, dass neben der Stabilisierung des Regelkreises, die jeder Regler der Gestalt (5.12) gew¨ ahrleistet, weitere Forderungen an die Regelg¨ ute, die der Betreiber der geregelten Anlage stellt, nach M¨ oglichkeit erf¨ ullt werden. Aus algebraischer Sicht bietet sich die Reglersynthese in folgenden Bearbeitungsschritten an: N ∈ RH∞ . 1. Die Streckendarstellung (5.10) liefert zwei Funktionen Z, Durch Anwendung des Euklid ischen Algorithmus im Ring RH∞ best¨atigt oder ermittelt den gr¨oßten geman die Teilerfremdheit von Z und N meinsamen Teiler ggT (Z, N ) ∈ RH∞ . Setzt man dann die gewonnenen Gleichungen der Divisionskette in der umgekehrten Reihenfolge ihres Entstehens ineinander ein, so erh¨ alt man eine Gleichung, vgl. Abschnitt 3.3.1, + H0 · N = ggT (Z, N ), F0 · Z wobei F0 und H0 zwei in RH∞ teilerfremde Funktionen sind.
5.4 Reglerentwurf mittels teilerfremder Zerlegung des Regelstreckenmodells
263
N ) ergibt mit Die Division durch ggT (Z, Z :=
Z N ) ggT (Z,
und
N :=
N N ) ggT ˙ (Z,
schließlich F0 · Z + H0 · N = 1, also die B´ezout sche Identit¨ at (5.11). Der Quotient K(s) =
F0 (s) liefert H0 (s)
einen stabilisierenden Regler. F0 2. Da der im ersten Schritt gewonnene stabilisierende Regler K = H al0 le vom Betreiber gestellten G¨ uteforderungen, die das geregelte System erf¨ ullen soll, vermutlich nicht gew¨ ahrleistet, wird der Entwerfer versuchen, aus der Gesamtheit aller stabilisierenden Regler
K=
F0 + Q · N H0 − Q · Z
mit beliebigem Q ∈ RH∞
durch zweckm¨ aßige Wahl des Youla-Parameters Q einen Regler zu finden, der auch alle G¨ uteforderungen erf¨ ullt. 3. Da es niemals m¨ oglich ist, den ganzen Funktionenraum RH∞ elementweise durchzumustern, wird sich der Entwickler auf einen endlich-dimensionalen Teilraum von RH∞ beschr¨ anken. Die Gesamtheit der Funktionen Q(s) =
l
αλ Qλ (s),
(5.15)
λ=1
mit l unabh¨ angig voneinander fixierten Funktionen Qλ ∈ RH∞ und l freien Koeffizienten αλ ∈ R legt einen l-dimensionalen Teilraum des RH∞ fest. Beispielsweise definiert ein Ansatz Q(s) = α1 +
α3 α2 + s + 2 (s + 2)2
einen dreidimensionalen Teilraum des RH∞ . 4. Wenn es gelingt, alle G¨ uteforderungen im s-Bereich durch l skalare Gleichungen zu erfassen, so wird man den Youla-Parameter Q in der Gestalt (5.15) ansetzen und nach mehr oder minder aufwendigen Umrechnungen auf ein lineares Gleichungssystem mit den freien Koeffizienten αλ als Unbekannten stoßen. Bei geschicktem Vorgehen darf man auf einen eindeutigen L¨ osungsvektor (α1 , α2 , ..., αl ) hoffen und hat damit u ¨ber (5.15) einen die Aufgabenstellung l¨ osenden Youla-Parameter gefunden.
264
5 Regelbarkeit aus mathematischer Sicht
Der geschilderte L¨ osungsweg ist mathematisch nicht anfechtbar, aber f¨ ur den praktischen Reglerentwurf recht m¨ uhsam. Die Schwierigkeiten beginnen schon beim Schritt 1, weil Software zur rechnergest¨ utzten Abarbeitung des Euklid ischen Algorithmus u ¨ ber dem Ring RH∞ im regelungstechnischen Um¨ ¨ feld selten zur Verf¨ ugung stehen wird. Uberschaubare Ubungsbeispiele, bei denen der skizzierte Weg abgeschritten wird, findet man in dem Lehrbuch [DFT92] und in deutscher Sprache in [M¨ ul96]. Bequemere L¨ osungswege hat H. Buchta in [Buc01] diskutiert. Diesen wollen wir nun folgen. Ausgehend von (5.12) l¨ asst sich mit F0 (s) =: F (s), H0 (s) =: H(s) ein ¨ beliebiger fiktiver Regler durch eine Ubertragungsfunktion der Gestalt K(s) =
F (s) + Q(s) · N (s) H(s) − Q(s) · Z(s)
beschreiben, und zwar mit einem fixierten teilerfremden Paar N, Z ∈ RH∞ , einem fixierten teilerfremden Paar F, H ∈ RH∞ und einem beliebigen Element Q ∈ RH∞ . Die B´ezout sche Identit¨ at f¨ ur alle m¨oglichen stabilen Regelkreise kann dann in der Form (F + Q · N ) · Z + (H − Q · Z) · N = 1
(5.16)
notiert werden. ¨ Auf Seite 259 wurde gezeigt, wie man eine Ubertragungsfunktion, die als Quotient zweier Elemente des Polynomrings R[s] vorgelegt wird, mit Hilfe eines geeigneten stabilen Zwischenpolynoms zum Quotienten zweier Elemente des Rings RH∞ umgestalten kann. Umgekehrt l¨asst sich jedes Element aus RH∞ , das auf der linken Seite von (5.16) vorkommt, als Quotient zweier Polynome auffassen, n¨ amlich Z=
ZP , A
N=
NP , A
H=
HP , B
F =
FP B
und
Q=
QP . C
Dabei sind A, B und C frei w¨ ahlbare stabile Polynome mit hinreichend großem Grad, grad A ≥ max{grad ZP , grad NP } , grad B ≥ max{grad FP , grad HP } , grad C ≥ grad QP . Die Identit¨ at (5.16) in RH∞ kann nun als Identit¨at in R[s] aufgefasst werden, (FP ·A·C + QP ·NP ·B)·ZP + (HP ·A·C − QP ·ZP ·B)·NP = A2 ·B ·C (5.17) Da die Grade der Bezugspolynome A, B und C nach oben nicht begrenzt wurden, k¨ onnen die linke und die rechte Seite von (5.17) gemeinsame Teiler
5.4 Reglerentwurf mittels teilerfremder Zerlegung des Regelstreckenmodells
265
(in R[s]) haben. Die Polynom-Gleichung (5.17) ist durch den gr¨oßten gemeinsamen Teiler ggT (A ·C, QP ·B) zu teilen. Nach der Division durch den ggT bleibt eine Gleichung zwischen zwei Polynomen u ¨ brig: Jede s-Potenz liefert eine skalare Gleichung. Weil der Regelungstechniker nur an einem einzigen Regler interessiert ist, der alle G¨ uteforderungen erf¨ ullt, liegt es nahe zu pr¨ ufen, ob es gen¨ ugt, die Polynom-Gleichung (5.17) mit QP = 0 und C = 1 zu betrachten, FP · ZP + HP · NP = A · B ,
(5.18)
und die Polynome FP und HP zweckentsprechend festzulegen. Aus (5.18) identifiziert man das Produkt A · B sofort als das charakteristische Polynom des Regelkreises, vgl. Abschnitt 4.3, Seite 174. Die Anzahl der in (5.18) zusammengestellten skalaren Gleichungen betr¨ agt n := grad A + grad B + 1 . Die gesuchten Reglerpolynome FP und HP k¨ onnen nun mit ebensovielen oder mehr freien Koeffizienten angesetzt werden, FP (s) = f0 + f1 s + ... + fl sl ,
HP (s) = h0 + h1 s + ... + hk sk ,
wobei k + l ≥ n − 2. Mit diesen Ans¨ atzen entsteht aus (5.18) ein lineares algebraisches Gleichungssystem, n¨ amlich n Gleichungen f¨ ur die k + l + 2 Unbekannten (f0 , f1 , ..., fl ; h0 , h1 , ...hk ). Setzt man k + l > n − 2 an, so hat das entstehende lineare Gleichungssystem im allgemeinen keine eindeutige L¨osung, sondern eine (k + l − n + 2)-dimensionale L¨ osungsmannigfaltigkeit. Diese Freiheiten“ las” sen sich nutzen, um zus¨ atzliche W¨ unsche, die der Regler oder der Regelkreis erf¨ ullen sollen, zu befriedigen. Beispiel 5.5 Zur Ubertragungsfunktion der Regelstrecke P (s) =
s2 − 10 − 60)
s2 (4s2
FP (s) ¨ mit minisoll ein Regler mit einer properen Ubertragungsfunktion K(s) = HP (s) malem Grad des Nennerpolynoms HP (s) so berechnet √ werden, dass der geschlossene 3 1 besitzt und die u Regelkreis ein dominantes Polpaar s1,2 = − ± j ¨ brigen Pole 2 2 bei s = −3 liegen. Die allgemeine Beziehung (5.18) lautet jetzt l λ=0
fλ s
λ
2
(s − 10) +
k
hκ s
κ
s2 (4s2 − 60) = (s2 + s + 1)(s + 3)m . (5.19)
κ=0
Aus den gestellten Forderungen und den einzuhaltenden Bedingungen
266
5 Regelbarkeit aus mathematischer Sicht
1. properer Regler: k ≥ l 2. u ¨ bereinstimmende Polynomgrade auf beiden Seiten von (5.19): max{ l + 2, k + 4 } = m + 2 3. Anzahl der Unbekannten ≥ Anzahl der Gleichungen: 4. minimaler Polynomgrad k = grad HP (s)
k+l+2 ≥ m+3
lassen sich die Zahlenwerte l, k und m berechnen. Aus der Forderung 1. und den Bedingungen 2. und 3. folgt k = m − 2 ≥ l ≥ 3.
(5.20)
Mit der Forderung 4. ergeben sich daraus die Werte k = l = 3, Die polynomiale Gleichung 3
fλ s
λ
2
· (s − 10) +
3
m = 5.
hκ s
κ
· s2 (4s2 − 60) = (s2 + s + 1)(s + 3)5 .
κ=0
λ=0
(5.21) kann als Gleichungssystem
4 0 0 0 0 0 0 4 0 0 0 0 −60 0 4 0 1 0 0 −60 0 4 0 1 0 0 −60 0 −10 0 0 0 0 −60 0 −10 0 0
0 0
0 0
0 0
0 0
0 0 0 0 1 0 0 −10 0 0
0 0 0 0 0 1 0 −10
h 1 3 h2 16 h 106 1 375 h 0 . = f3 765 f2 918 f1 f0
geschrieben werden und hat die eindeutige L¨ osung
h 1 3 4 h2 4 − 10199 h1 100 70923 h0 − 200 = 13224 . f 3 25 101673 f2 50 f1 − 3245 f0
− 243 10
Der berechnete Regler K(s) =
528.96 s3 + 2033.46 s2 − 64.8 s − 24.3 0.25 s3 + 4 s2 − 101.99 s − 354.615
ist offensichtlich allpasshaltig und instabil.
648 243
5.4 Reglerentwurf mittels teilerfremder Zerlegung des Regelstreckenmodells
267
Zur Abrundung der Diskussion des Beispiels sei angenommen, man h¨ atte statt der Forderung 4. (nach einem Regler m¨ oglichst niedriger Ordnung) eine Forderung an das Einschwingverhalten des Regelkreises gestellt, vgl. Seite 200, beispielsweise die Forderung 4’: Das an der Regelstrecke anliegende Steuersignal u(t) soll auch bei Spr¨ ungen des F¨ uhrungssignals r(t) einen stetigen Verlauf haben. ¨ Dann muss die Ubertragungsfunktion GU R (s) =
K(s) FP (s) · NP (s) = 1 + K(s) · P (s) HP (s) · NP (s) + FP (s) · ZP (s)
streng proper sein, d. h. grad (FP (s) · NP (s)) + 1 ≤ grad CLCP (s) , also im Beispielfalle l + 4 + 1 ≤ 2 + m,
oder,
m ≥ l + 3.
¨ Begn¨ ugt man sich mit einem relativen Grad 1 der Ubertragungsfunktion GU R (s), so wird m = l + 3, und unter Beachtung von (5.20) erh¨ alt man die Werte k = 4,
l = 3,
Der aus der polynomialen Gleichung 3
fλ s
λ
2
· (s − 10) +
4
hκ s
m = 6.
κ
· s2 (4s2 − 60) = (s2 + s + 1)(s + 3)6 .
κ=0
λ=0
berechnete Regler K(s) =
3620.34 s3 + 11969.98 s2 − 218.7 s − 72.9 0.25 s4 + 4.75 s3 + 42.25 s2 − 660.585 s − 2386.245
ist wiederum allpasshaltig und instabil.
5.4.3 Zur Unvermeidbarkeit von instabilen Reglern In der regelungstechnischen Praxis versucht man, instabile Regler zu vermeiden. Der Regelungsingenieur wird manchmal jedoch mit Regelstreckenmodellen konfrontiert, die aus einer makellosen Modellbildung hervorgegangen sind und daher nicht zur Disposition stehen, f¨ ur die aber jeder Versuch, einen stabilen Regler zu finden, von vornherein zum Scheitern verurteilt ist und daher als eine vermeidbare Vergeudung von Ressourcen eingestuft werden muss. Definition 5.3. [Vid85] Eine Regelstrecke P (s) heißt stark stabilisierbar, wenn der Regelkreis mit Hilfe eines stabilen Reglers K(s) stabilisiert werden kann. F¨ ur das Beispiel 5.5 wurde ein instabiler Regler berechnet. Zu kl¨aren bleibt, ob in der Gesamtheit aller stabilisierenden Regler durch gl¨ ucklichere Wahl des Youla-Parameters Q ein stabiler Regler h¨atte gefunden werden k¨onnen. Dieses Problem l¨ asst sich u ugt, ¨berraschend einfach l¨osen. Es gen¨ die Lage der reellen Pole und Nullstellen von P (s) zu kennen, um u ¨ ber die Eigenschaft der starken Stabilisierbarkeit zu entscheiden.
268
5 Regelbarkeit aus mathematischer Sicht
Satz 5.13 Die Regelstrecke P (s) ist genau dann nicht stark stabilisierbar, wenn P (s) auf der nichtnegativen reellen Halbachse (einschließlich Null und ∞) ein Paar reeller Nullstellen hat, zwischen denen eine ungerade Anzahl reeller Pole liegt. Beweis: Notwendiger Teil: Die Pol-Nullstellen-Lagebedingung f¨ ur P (s) =
ZP (s) sei NP (s)
erf¨ ullt. Es wird gezeigt, dass dann K(s) instabil sein muss. Wir gehen von einer in RH∞ teilerfremden Zerlegung von P (s) aus, Z(s) mit ZP , NP ∈ RH∞ , P (s) = N (s) Dann existieren F, H ∈ RH∞ mit der Eigenschaft F · Z + H · N = 1. Die Gesamtheit aller stabilisierenden Regler ergibt sich aus F +Q·N K= mit Q ∈ RH∞ . H −Q·Z Da P (s) die Pol-Nullstellen-Lagebedingung erf¨ ullt, gibt es ein Paar nichtnegativer reeller Nullstellen von ZP , gelegen bei s = σ1 und bei s = σ2 , zwischen denen eine ungerade Anzahl reeller Nullstellen von NP liegt. Folglich haben NP (σ1 ) und NP (σ2 ) umgekehrtes Vorzeichen. Die B´ezout sche Identit¨ at ergibt H(σi )N (σi ) = 1 f¨ ur i = 1, 2, also sign H(σ1 ) = −sign H(σ2 ). Daraus folgt sign H(σ1 ) − Q(σ1 )Z(σ1 ) = sign H(σ1 ) = −sign H(σ2 ) = − sign H(σ2 ) − Q(σ2 )Z(σ2 ) . Mithin besitzt der Regler-Nenner (H − Q · Z) aus Stetigkeitsgr¨ unden eine reelle Nullstelle bei σ3 ∈ (σ1 , σ2 ). Mit anderen Worten: Der Regler K(s) hat eine Polstelle bei σ3 > 0 und ist folglich instabil. Hinreichender Teil: Nachlesbar in [Vid85]. qed. Beispiel 5.6 Anhand einiger Streckenmodelle soll die einfache Handhabbarkeit des Satzes 5.13 demonstriert werden. 1 1. P (s) = (s − 1)(s − 2) Diese Strecke hat eine doppelte Nullstelle bei s = ∞ und einfache Pole bei s = 1 und s = 2. Sie ist stark stabilisierbar, denn es gibt kein Paar reeller Nullstellen, zwischen denen eine ungerade Anzahl reeller Pole liegt. 2.
P (s) =
(s − 1)(s2 + 1) (s − 3)2 (s2 − 4s + 5)
Diese Strecke hat eine einfache Nullstelle bei s = 1, ein konjugiert komplexes
5.4 Reglerentwurf mittels teilerfremder Zerlegung des Regelstreckenmodells
269
Nullstellenpaar bei s = ±j und eine einfache Nullstelle bei s = ∞ sowie einen zweifachen Pol bei s = 3 und ein konjugiert komplexes Polpaar bei s = 2 ± j. Sie ist stark stabilisierbar. 3.
P (s) =
s−1 s(s − 3)
Diese Strecke hat eine einfache Nullstelle bei s = 1 und s = ∞ sowie einen einfachen Pol bei s = 0 und s = 3. Sie ist nicht stark stabilisierbar. 4.
P (s) =
s2 − 10 − 60)
s2 (4s2
Zu dieser Regelstrecke wurde im Beispiel 5.5 ein Regler entworfen. Die Strecke hat eine bei s = ∞ sowie einfache reelle Nullstellen bei √ √ doppelte Nullstelle a√ hrend eine doppelte Polstelle bei s = 0 und s = − 10 und s = 10, w¨ √ einfache reelle Pole√bei s = − 15 und s = 15 √ liegen. Zwischen dem Paar reeller Nullstellen 10 und ∞ liegt ein Pol bei 15 . Folglich existiert kein stabilisierender Regler, der selbst stabil ist.
6 Beschreibung von LTI-Systemen durch Polynommatrizen
6.1 Einfu ¨hrung MIMO-LTI-Regelstrecken lassen sich im Bildbereich in der nat¨ urlichsten Weise durch Gleichungen beschreiben, deren Koeffizienten aus dem Euklid ischen Ring R[s] der Polynome mit reellen Koeffizienten stammen: AP (s) · X(s) + BP (s) · U(s) = 0 , Y(s) = CP (s) · X(s) + DP (s) · U(s) , wobei AP ∈ (R[s])p×p , BP ∈ (R[s])p×m , CP ∈ (R[s])r×p , DP ∈ (R[s])r×m . ¨ Bei der Uberf¨ uhrung des Matrizenpaares (AP , BP ) durch elementare Spaltenoperationen in Hermitesche Normalform entsteht eine teilerfremde ¨ rechte Matrizenbruchdarstellung der Ubertragungsmatix R R −1 Gyu = (U12 )(U22 ) .
¨ Außerdem wird bei der Uberf¨ uhrung der gr¨ oßte polynomiale Linksteiler L des Paares (AP , BP ) sichtbar. Falls die Determinante det L = const ist, so erweist sich das System als nicht steuerbar, jedenfalls nicht mit den vorliegenden Steuergr¨ oßen U. Dieser Steuervektor ist außerstande, das System in seiner vollen dynamischen Ordnung anzuregen. Er wirkt nur auf ein System, dessen dynamische Ordnung reduziert ist, und zwar um den Grad des Polynoms det L. Die Nullstellen von det L sind durch U nicht beeinflussbar. Sie werden als Eingangs-Entkopplungsnullstellen bezeichnet. Bei mechanischen Systemen mit endlich vielen mechanischen Freiheitsgraden bleiben bei der vorliegenden Art der Steuerung des Systems einzelne Freiheitsgrade quasi eingefroren“. Das Ph¨ anomen der Nichtsteuerbarkeit wird am historischen ” Beispiel der Unl¨ autbarkeit der Kaiserglocke im K¨olner Dom illustriert. Das polynomiale Matrizenpaar (AP , CP ) l¨ asst sich durch elementare Zeilenoperation in eine Hermitesche Normalform u uhren. Wenn dabei ein ¨ berf¨ polynomialer Rechtsteiler R mit einer Determinante det R = const entsteht,
272
6 Beschreibung von LTI-Systemen durch Polynommatrizen
so ist das zugrundeliegende LTI-System nicht beobachtbar, jedenfalls nicht mit den vorliegenden Ausgangsgr¨ oßen Y. Ausgehend von einer teilerfremden rechten Matrizenbruchdarstellung der R R −1 ¨ Ubertragungsmatrix Gyu = (U12 )(U22 ) werden Basisgr¨ oßen im Bildbereich durch R −1 Ξ = (U22 ) U definiert. Auf Grund dieser Definition erscheinen die Bilder der Steuergr¨ oßen und der u oßen als polynomiale Linearkombinationen ¨ brigen Systemgr¨ der Komponeten des Basisgr¨ oßenvektors. Dies bedeutet im Zeitbereich: Alle Komponenten des Steuersignals u(t)und der u ¨ brigen Systemsignale x(t) sowie y(t) sind durch Differentiation aus den Komponenten des Basissignalvektors ξ(t) erzeugbar. Basisgr¨ oßen und Basissignale haben a priori im allgemeinen keine leicht erkennbare physikalische Bedeutung. Man kann jedoch stets einen Zusammenhang zu den verwendeten Systemgr¨oßen X und Steuergr¨oßen R R U herstellen, indem man das Matrizenpaar (U12 , U22 ) durch elementare Zeilenoperationen auf Hermitesche Normalform bringt. Dabei entsteht der Basisgr¨ oßenvektor Ξ als R[s]-Linearkombination aus den Steuergr¨oßen U und den Systemgr¨ oßen X. Diese Basisgr¨ oßendarstellung ist keineswegs eindeutig. ! auch Vielmehr ist mit einem gefundenen Basisgr¨ oßenvektor Ξ ! + Q · (AP X + BP U) Ξ =M ·Ξ ein m¨ oglicher Basisgr¨ oßenvektor. Hierbei stehen M f¨ ur eine beliebige unimodulare m × m-Matrix und Q f¨ ur irgendeine polynomiale m × p-Matrix. Im Abschnitt 6.3 wird die polynomial beschriebene MIMO-LTI-Strecke durch eine polynomiale MIMO-R¨ uckf¨ uhrung U = FP X zum MIMORegelkreis erg¨ anzt. Auf der Basis dieser polynomialen Regelkreisbeschreibung werden die klassischen Probleme der Zuweisung der Nullstellen des charakteristischen Polynoms des Regelkreises, der Rekonstruktion nicht gemessener Signale und der beobachterbasierten R¨ uckf¨ uhrungen neu durchdacht. Der Abschnitt 6.3 endet mit dem Strecker-Nyquist-Kriterium f¨ ur den MIMOStandardregelkreis. Abschnitt 6.4 baut eine Br¨ ucke zur tradierten zustandsraumgepr¨agten Regelungs- und Steuerungstheorie, die hier als Spezialfall AP (s) = sIn − A, BP (s) = −B erscheint. Er¨ ortert werden die Konzepte der Zustandssteuerbarkeit und der Zustandsbeobachtbarkeit. Die M¨ oglichkeit der Dekomposition des Zustandsraumes bez¨ uglich der zustandssteuerbaren und zustandsbeobachtbaren Teilr¨ aume wird konstruktiv bewiesen und in Zusammenhang mit der mini¨ malen Realisierung von Ubertragungsmatrizen gebracht. Schließlich geht es um die Basisgr¨ oßen bei zustandsteuerbaren Regelstreckenmodellen. Im Falle einer skalaren Steuergr¨oße U erh¨alt man eine skalare Basisgr¨ oße ohne weiteres mit der Festlegung
6.2 MIMO-LTI-Systeme in polynomialer Darstellung
Ξ := (det(sIn − A))
−1
273
U.
Im Falle von m ≥ 2 Steuergr¨ oßen liegen ungleich schwierigere Verh¨altnisse vor. Mit Hilfe der Kronecker schen Steuerbarkeitsindizes gelingt es, einen Satz von m Differentialgleichungen h¨ oherer Ordnung herzuleiten, denen m skalare Basissignale ξ1 (t), . . . , ξm (t) gen¨ ugen. Als Besonderheit der zustandsteuerbaren Zustandsmodelle wird herausgestellt, dass und wie man die m Basisgr¨oßen als R-Linearkombinationen der n Zustandsgr¨ oßen darstellen kann.
6.2 MIMO-LTI-Systeme in polynomialer Darstellung 6.2.1 Polynomiale Systembeschreibung und allgemeine ¨ Ubertragungsmatrix In diesem Abschnitt gehen wir von einer sehr allgemeinen Modellbeschreibung f¨ ur lineare zeitinvariante Systeme aus, n¨amlich gew¨ohnlichen linearen Differentialgleichungen bez¨ uglich der Zeit und gegebenenfalls zus¨atzlichen linearen algebraischen Gleichungen. Im Zusammenhang mit der Steuerung und Regelung von Systemen ist es oft zweckm¨ aßig, die als Steuersignale verwendbaren Systemsignale besonders hervorzuheben. Wir wollen die Steuersignale im Vektor u(t) ∈ Rm zusammenfassen, die u ¨brigen Systemsignale im Vektor x(t) ∈ Rp . Die Systemgleichungen k¨ onnen dann in der Form d d · x(t) + B · u(t) = 0 (6.1) A dt dt d notiert werden. Dabei symbolisieren die Koeffizientenmatrizen A dt und d B dt lineare Differentialoperatoren, A
d dt
g
di = Ai i , dt i=0
B
d dt
=
h j=0
Bj
dj . dtj
Die nat¨ urlichen Zahlen g und h bezeichnen hier die h¨ochsten vorkommenden Ableitungsordnungen der Signalvektoren x bzw. u. Bei der LaplaceTransformation des Differentialgleichungssystems (6.1) entstehen aus den Differentialoperatoren Matrizen, deren Elemente Polynome in der komplexen Variablen s sind. Wir bezeichnen sie mit AP und BP , d.h. AP (s) :=
g i=0
Ai si , BP (s) :=
h
Bj sj .
j=0
Unter Ber¨ ucksichtigung der m¨ oglicherweise von Null verschiedenen Anfangs˙ ˙ werte x(−0), x(−0), ..., x(g−1) (−0); u(−0), u(−0), ..., u(h−1) (−0) erhalten wir aus (6.1) das algebraische Gleichungssystem
274
6 Beschreibung von LTI-Systemen durch Polynommatrizen
AP (s) · X(s) + BP (s) · U(s) = α0 (s) = αx0 (s) + αu0 (s),
(6.2)
wobei αx0 (s) =
g g j=1 k=j
Ak sk−j x(j−1) (−0),
αu0 (s) =
h h
Bk sk−j u(j−1) (−0) .
j=1 k=j
(6.3) Mit Blick auf die meßtechnische Erfassung oder eine besondere anwendungsspezifische Bedeutung werden h¨ aufig einige Systemsignale zu einem Ausgangssignalvektor y zusammengestellt. Wir setzen im folgenden voraus, dass sich der interessierende Ausgangsvektor y(t) ∈ Rr zu jedem Zeitpunkt durch eine Linearkombination der Komponenten von x(t) und u(t) sowie deren zeitlicher Ableitungen bestimmen l¨ asst, d.h. d d y(t) = C · x(t) + D · u(t) . (6.4) dt dt Durch Laplace-Transformation erhalten wir aus (6.4) die algebraische Gleichung Y(s) = CP (s) · X(s) + DP (s) · U(s) − β0x (s) − β0u (s) , wobei CP und DP Polynommatrizen in s sind und der Polynomvektor β0 (s) = β0x (s) + β0u (s) sich in Analogie zu (6.3) aus den nichtverschwin˙ ˙ denden Anfangswerten x(−0), x(−0), ...; u(−0), u(−0), ... ergibt. Man kann α0 (s) und β0 (s) gemeinsam mit U(s) als eingepr¨agte Systemerregungsgr¨ oßen und den aus X, Y und U zusammengesetzten Spaltenvektor als Vektor der Systemreaktionsgr¨ oßen auffassen und das Systemverhalten durch ein einziges zusammengesetztes algebraisches Gleichungssystem beschreiben: ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ −Ir CP DP β0 Y ⎝ 0 AP BP ⎠ · ⎝X⎠ = ⎝α0 ⎠ . (6.5) U 0 0 Im U Das Gleichungssystem (6.5) ist genau dann eindeutig l¨osbar, wenn das Polynom det AP vom Nullpolynom verschieden ist. Dies wollen wir grunds¨atzlich voraussetzen. Dann existiert die (gebrochen rationale) Matrix (AP )−1 , und das Gleichungssystem (6.5) kann gel¨ ost werden, ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ −Ir CP · A−1 Y β0 −CP · A−1 P P · BP + DP −1 ⎝X ⎠ = ⎝ 0 ⎠ · ⎝α0 ⎠ . (6.6) A−1 −A · B P P P U U 0 0 Im Die Dreiecksmatrix auf der rechten Seite der Gleichung (6.6) l¨asst sich ¨ als allgemeine Ubertragungsmatrix des polynomialen Systems, das aus den
6.2 MIMO-LTI-Systeme in polynomialer Darstellung
275
Differentialgleichungssystemen (6.1) und (6.4) hervorging, interpretieren. Es handelt sich um eine rationale Matrix, deren Inverse eine polynomiale Matrix ist, n¨ amlich die Koeffizientenmatrix auf der linken Seite von (6.5). Die elegante Herleitung und u ¨bersichtliche Struktur der Gleichung (6.6) – sie findet sich schon 1980 in der inhaltsreichen Monographie [Kai80] von Thomas Kailath – darf jedoch nicht vergessen lassen, dass bei der Bildung ¨ der allgemeinen Ubertragungsmatrix (6.6) wesentliche Systemeigenschaften verdeckt werden k¨ onnen. Sorgf¨ altiger Betrachtung bed¨ urfen die Matrizen” −1 br¨ uche“ A−1 · B und C · A . P P P P Besitzen die Polynommatrizen AP und BP einen gemeinsamen Linksteiler – es existiert dann eine quadratische polynomiale Matrix L derart, dass AP = !P und BP = L·B !P gilt – so geht bei der Produktbildung die in L steckende L·A Information verloren; denn !−1 −1 · L · B !P = A !−1 · B !P . A−1 P · BP = AP · L P Ebenso k¨ urzt sich ein gemeinsamer Rechtsteiler der Matrizen AP und CP P · R, Cp = C P · R folgt fort; denn aus AP = A −1 −1 P · A −1 . · AP = C CP · A−1 P = CP · R · R P
6.2.2 Linksteiler polynomialer Matrizenpaare Die polynomiale Systembeschreibung des vorangehenden Abschnitts liefert ein Matrizenpaar (AP , BP ) ∈ (R[s])p×(p+m) mit Normalrang (AP , BP ) = p. Durch elementare Spaltenoperationen1 l¨ asst sich das Paar (AP , BP ) in die ¨ Hermitesche Normalform (L, 0) der Aquivalenzklasse rechtsassoziierter Polynommatrizen u uhren (vgl. [Mac33], [Ros70], [Kai80], [CD81], [Rai94]). ¨ berf¨
AP
Bild 6.1.
1
BP
elementare Spaltenoperationen
L
0
¨ Uberf¨ uhrung eines Matrizenpaares (AP , BP ) in die Hermitesche Nor¨ malform der Aquivalenzklasse rechtsassoziierter Polynommatrizen
Bei Matrizen, deren Eintr¨ age aus R[s] stammen, versteht man unter den elementaren Spaltenoperationen drei Manipulationsarten: 1. das Vertauschen von Spalten, 2. die Multiplikation einer Spalte mit einer (nicht verschwindenden) reellen Zahl, 3. das Hinzuf¨ ugen einer mit einem beliebigen Polynom (∈ R[s]) multiplizierten Spalte zu einer anderen Spalte.
276
6 Beschreibung von LTI-Systemen durch Polynommatrizen
Die im allgemeinen polynomiale untere Dreiecksmatrix L ist dadurch gekennzeichnet, dass die Hauptdiagonalelemente nicht verschwinden und innerhalb jeder Zeile (im Vergleich mit den links davon stehenden Elementen) den gr¨ oßten Grad haben. Sind alle Hauptdiagonalelemente Polynome vom Grade Null, d.h. reelle Zahlen = 0, so kann L durch weitere elementare Spaltenoperationen in eine p × p -Einheitsmatrix u uhrt werden. ¨ berf¨ ¨ Der Uberf¨ uhrungsprozess aus dem gegebenen Matrizenpaar (AP , BP ) in die Normalform (L, 0) kann auch als Rechtsmultiplikation mit einer unimodularen Matrix U R ∈ (R[s])(p+m)×(p+m) aufgefasst werden,2 (AP , BP ) · U R = (L, 0) . ¨ F¨ ur die weiteren Uberlegungen wird sich die in Gl. (6.7) skizzierte Partitionierung von U R als wesentlich erweisen:
AP
BP
.
R R U12 U11
=
0
L
(6.7)
R U22
R U21
Es sei daran erinnert, dass U R genau dann unimodular (¨ uber dem Euklidischen Ring R[s]) ist, wenn det U R ∈ R\{0}. Dann existiert die Inverse (U R )−1 und ist ebenfalls unimodular. Durchmultiplikation der Gleichung (6.7) von rechts mit (U R )−1 =: V R ergibt
AP
BP
=
L
0
.
R V11
R V12
R V21
R V22
=
R R L V11 LV12
(6.8)
und l¨ asst erkennen, dass die Matrix L gemeinsamer Linksteiler von AP und BP ist. Beispiel 6.1 Verschiebliches 2-fach-Pendel mit skalarer Steuergr¨oße F und vernachl¨ assigten Reibkr¨ aften (In den im Abschnitt 2.5.3.1 hergeleiteten linearisierten Bewegungsgleichungen 2
Eine quadratische Polynommatrix U heißt unimodular, falls ihre Determinante det U eine nicht verschwindende reelle Zahl ist. Folglich ist die Matrix U invertierbar und ihre Inverse U −1 ist ebenfalls eine unimodulare Polynommatrix. Zwei Polynommatrizen A1 , A2 heißen rechtsassoziiert, falls es eine unimodulare Polynommatrix U derart gibt, dass gilt A1 = A2 ·U. (Lesern, die sich eingehender mit Matrizen, deren Elemente aus einem Euklidischen Ring stammen, befassen m¨ ochten, sei neben [Vid85] auch der Klassiker [Mac33] empfohlen.)
6.2 MIMO-LTI-Systeme in polynomialer Darstellung
277
muss N = 2, D1 = 0, D2 = 0 sowie d1 = 0, d2 = 0, d0 = 0 gesetzt werden.) Das Gls.(6.2) sieht f¨ ur dieses Beispiel bei verschwindenden Anfangswerten so aus:
(AP , BP )
m 0 s2 X = −s2 U
−s2
−m1 g l1 s2 −g 0
−m2 g 0 l2 s2 −g
X0 −1 0 Φ 0 Φ1 = 0 . 2 0 0 F
Elementare Spaltenoperationen zur Ermittlung des Linksteilers L:
2 m0 s −s2 −s2
−1 0 0
−1 0
0
−m1 g l1 s2 −g 0
0 −s2 −s2
−m2 g 0 l2 s2 −g
0 l1 s 2 − g 0
0 −1 0 0 0 0 1
0 0 l2 s2 −g
10 0
1 1 m0 s2 −m1 g −m2 g
U1R
U2R
= (AP ,
0 0 0 0 0 0 10 l 1 2 1 0 0 1 (l1 s −g) 0 g 00 1 0 0 1 00 0 1
0 1 1 l1 1 0 l2
0 0 0 g 0 0 − l1 g l1 − − (l1 s2 −g) l2 s2 −g l2 l2
1
(6.9)
U3R
BP ) U1R U2R U3R
Dieses Zwischenergebnis erzwingt eine Fallunterscheidung bei der n¨ achsten elementaren Spaltenoperation.
Fall 1 : l1 = l2 :
1 0 R1 0 U4 =
0
(AP ,
BP ) U1R U2R U3R U4R1 =
0 1 0 0 −1 0 0
(
0 0
0 0
l2 2 ) l1
l2 s2 −g
1
l1 (l1 s2 −g) l2 0 0 g 0 − l1 l2 g ( − 1)g − l2 l1
0 0 0
L1 Die Matrix L1 ist offensichtlich unimodular und ließe sich durch weitere elementare Spaltenoperationen m¨ uhelos in eine 3 × 3-Einheitsmatrix u uhren. ¨ berf¨
278
6 Beschreibung von LTI-Systemen durch Polynommatrizen
U4R2 =
Fall 2 : l1 = l2 = l :
(AP , BP )
U1R U2R U3R U4R2
=
−1
0 0 0 l 0− 0 0 g 0 0 1 1 0 0 0 1 1 0 0 0 0 1 0 0 0 1 g−ls2 0
L2
Im Falle l1 = l2 = l ist die gewonnene Matrix L2 =
1 0 0
0 0 1 0 1 g−ls2
offensichtlich nicht unimodular. Die unimodulare Spaltentransformationsmatrix
0 = 0 −1 0
U R = U1R U2R U3R U4R2
−l g −1 g −1 g
,
l 2 l (ls − g) (ls2 −g) g g l 2 l 2 s s g g l 2 l 2 (ls − g) s g g
m1 +m2 −
lm0 2 s g
u43
u44
wobei u43 := ls2 (
m0 2 ls − m0 − m1 − m2 ) + m2 g, g
u44 := ls2 (
m0 2 ls − m0 − m1 − m2 ), g
l¨ asst sich invertieren:
V R = (U R )−1 = (U4R2 )−1 (U3R )−1 (U2R )−1 (U1R )−1 =
m0 s2 −m1 g −m2 g 0 −s2 ls2 −g 0 1 −1 1 0 1 − l
−1 0 0 0
.
Man kann leicht nachrechnen, dass L2 tats¨ achlich Linksteiler des Paares (AP , BP ) R R , BP = L2 · V12 . ist; denn AP = L2 · V11 Das vorliegende Beispiel-System
(AP , BP ) X U
R R = L2 · (V11 , V12 ) X U
=0
hat die dynamische Ordnung 6. Nach der K¨ urzung“ durch die nicht-unimodulare ” Matrix L2 wird daraus ein neues Beispiel-System
R R , V12 ) X (V11 U
=0
mit der dynamischen Ordnung 4. Dessen Bewegungsgleichungen ergeben sich aus den berechneten Polynommatrizen V11 und V12 zu
6.2 MIMO-LTI-Systeme in polynomialer Darstellung
m−ss 0
2
2
0
−m1 g ls2 −g 1
X 1 −m g 0 Φ = 0 F.
279
0
2
1
−1
Φ2
0
Mechanische Deutung: Die beiden gleich langen (Ersatz-)Pendel wurden zusammengeschweißt. Mit Φ1 = Φ2 =: Φ lassen sich die neuen Bewegungsgleichungen vereinfachen zu
m 0 s2 −s2
−(m1 + m2 )g ls2 −g
X 1 0
Φ
=
0
F.
Fazit: Wenn der ermittelte Linksteiler L = L2 nicht unimodular ist, reduziert sich wegen R R AP · X + BP · U = L2 · (V11 · X + V12 · U) = 0
die dynamische Ordnung des vom Steuervektor U beeinflussten Systems um grad det L2 . Das urspr¨ ungliche Streckenmodell AP · X + BP · U = 0 muss als nicht steuerbar“ klassifiziert werden, jedenfalls nicht mit dem vorgesehenen ” R R · X + V12 · U = 0 hat Steuervektor U. Das neu entstandene Systemmodell V11 eine niedrigere dynamische Ordnung und bedarf einer neuen physikalischen Interpretation. 6.2.3 Linksteiler und Nichtsteuerbarkeit Exkurs zum Konzept der Nichtsteuerbarkeit Wir wollen versuchen, den Ausnahmefall l1 = l2 der Nichtsteuerbarkeit des reibungsrei modellierten verschieblichen Zweifachpendels physikalisch verst¨ andlich zu machen. Auf den ersten Blick erscheint es sehr verwunderlich, dass die (Ersatz-)Pendelmassen m1 und m2 u ¨berhaupt keine Rolle spielen. Der scheinbare Widerspruch zur Alltagserfahrung l¨ost sich auf, wenn man sich bewusst macht, dass die Bedingung l1 = l2 keineswegs auf geometrisch gleich lange Pendel hinausl¨ auft. Vielmehr stimmen lediglich die ¨aquivalenten L¨ angen zweier k¨ orperlich nicht sichtbarer (fiktiver) mathematischer Pendel u aß den auf S. 70 vorgenommenen Definitionen bedeutet l1 = l2 : ¨ berein. Gem¨ Die mechanischen Parameter der beiden Starrk¨orper, die in der (x, y)-Ebene schwingen k¨ onnen, sind durch die Beziehung J1 J2 = M 1 s1 M 2 s2
oder, gleichwertig,
J1 M 1 s1 = J2 M 2 s2
verkn¨ upft, wobei Ji das Tr¨ agheitsmoment um die Drehachse, Mi die Masse und si den Abstand des Massenmittelpunktes von der Drehachse des i−ten Starrk¨ orpers bezeichnen, i = 1, 2. Die linearisierten Bewegungsgleichungen,
280
6 Beschreibung von LTI-Systemen durch Polynommatrizen
die im Bildbereich als Gleichung (6.9) erscheinen, besitzen unter dieser physikalisch recht plausiblen Voraussetzung L¨ osungen mit ϕ1 (t) = ϕ2 (t), d. h. die beiden Starrk¨ orper schwingen so, als seien sie fest miteinander verbunden, quasi zusammengeklebt oder zusammengeschweißt. In der deutschen Kultur- und Technikgeschichte wird von einem Ereignis mit großer Nachwirkung berichtet [MS02], [NN75], [B¨ ur90], das auf einem verwandten Ph¨ anomen beruht. Als der K¨ olner Dom nach dem Deutsch-Franz¨osischen Krieg 1870/71 baulich vollendet wurde, entschieden die h¨ ochsten Instanzen des neu gegr¨ undeten deutschen Kaiserreiches, einen Teil der 7400 erbeuteten franz¨osischen Kanonen einzuschmelzen und eine Kaiserglocke f¨ ur den K¨olner Dom zu gießen. Es sollte mit u oßte freischwingende Glocke der ¨ ber 27 Tonnen Gewicht die gr¨ Welt werden! Die Ausschreibung des Gusses gewann gegen große Konkurrenz ein Glockengießermeister aus Frankenthal in der Pfalz. Im Fr¨ uhjahr 1875 wurde die Kaiserglocke auf dem Rhein nach K¨ oln verschifft und im S¨ udturm des Domes provisorisch aufgeh¨ angt. Das erste ¨ offentliche Probel¨auten am 20. August geriet zur Sensation: Die Glocke blieb stumm. Neben dem großen wirtschaftlichen Verlust bedeutete das ein politisches Fiasko. Die Zeitung Neuer ” Sozialdemokrat“ spottete am 8. September 1875 3 Zu K¨ oln, da h¨ angt seit Wochen schon In des Domes unterstem Stocke ¨ Zum stillen Arger der Denkernation Die eigensinnigste Glocke. Wohl goß sie der Meister mit kundiger Hand Aus hundert w¨ alschen Gesch¨ utzen; An ihrer Wiege ein Kaiser stand: Doch kann dies Alles nichts n¨ utzen. ...... Du willst nicht? Gut, so brauch’ ich Gewalt, ” Gieb Acht, wie ich Klang dir entlocke!“ Es zogen wohl dreißig - doch blieb sie ganz kalt und stumm, die gewaltige Glocke. ¨ Erst 1909, nach u ahrigem Schweigen und mehreren Anderungs¨ber dreißigj¨ versuchen, gelang es, die Glocke zum L¨ auten zu bringen. Die Glocke kann als 2-fach-Kettenpendel modelliert werden. Sie schwingt um eine Drehachse (im Bild 6.2 mit P1 bezeichnet), die im Glockenturm montiert ist. Der im Inneren der Glocke aufgeh¨angte Kl¨oppel kann um die Drehachse P2 frei schwingen. Wenn nun die Glocke mit Hilfe eines mechanischen Hebelwerkes in (große) Schwingungen versetzt wird, beginnt 3
Auszug aus dem sechsstrophigen Gedicht Die Kaiserglocke“ in der Rechtschrei” bung des Originals.
6.2 MIMO-LTI-Systeme in polynomialer Darstellung P1 (Drehachse 1)
281
y
Joch
111 000 P1 d ϕ1 P2
g s1
P2
Schlagring
x s2 l2
ϕ2
l1
Kl¨ oppel m1 m2 Bild 6.2. Schwingende Glocke und Modell eines 2-fach-Kettenpendels
sie zu l¨ auten“, weil der Kl¨ oppelballen immer wieder an den Schlagring ” der Glocke st¨ oßt. Die bei der K¨ olner Kaiserglocke unerwartet aufgetretene Unl¨ autbarkeit l¨ asst sich als eine f¨ ur das System Glocke spezifische Form der Nicht-Steuerbarkeit regelungstechnisch deuten. Eine Linearisierung des Systems Glocke mit Kl¨ oppel“ um die stabile Ruhelage ϕ1 = 0, ϕ2 = 0 f¨ uhrt zu ” keiner brauchbaren Problembeschreibung. Vielmehr weiß jedermann aus der praktischen Beobachtung des Glockengel¨ auts im heimatlichen Kirchturm, die beim L¨ auten aus der Ferne erkennbaren Winkel ϕ1 erreichen Betr¨age zwischen π/2 und π. Betrachtungen an den (um die stabile Ruhelage) linearisierten Bewegungsgleichungen sind daher nicht problemad¨aquat. Doch reichen die im Modellbildungsabschnitt 2.5 gesammelten Mechanik-Kenntnisse aus, um die Unl¨ autbarkeitsbedingung herzuleiten. Im Anschluss an die Einf¨ uhrung des Hantel-Modells auf S. 70 wird die Glocke mit Kl¨ oppel als 2-fach-Kettenpendel modelliert, vgl. Bild 6.2. Der Kl¨ oppel wird zum Pendel 2, charakterisiert durch das Tr¨agheitsmoment Jd,2 um die Drehachse P2 , die Kl¨ oppelmasse M2 und den Abstand s2 zwischen dem Massenmittelpunkt(MMP) des Kl¨oppels und der Drehachse P2 . Wie auf Seite 70 ff. gewinnen wir ein (mathematisches) Ersatzpendel 2 mit J M2 s2 der L¨ ange l2 = M2d,2 ·s2 und Masse m2 = l2 . Die Masse m2 = M2 − m2 am anderen Ende der Hantel 2 wird der Glocke im Drehpunkt P2 zugeschlagen. Die Glocke wird so zum Pendel 1 =1 = M1 + m2 einem mo(vgl. Bild 6.2) mit einer modifizierten Masse M difizierten Tr¨ agheitsmoment Jd,1 = Jd,1 + m2 · d2 und einem modifizierten MMP-Abstand s1 = 1 (M1 s1 + m2 d). Daraus gewinnen wir ein (mathema-
tisches) Ersatzpendel 1 mit der L¨ ange l1 = d,1 und Masse m1 = Ml11·s1 . M1 · s1 Die Masse m1 = M1 + m2 − m1 = M1 − m1 + M2 − m2 am anderen Ende der M1
J
282
6 Beschreibung von LTI-Systemen durch Polynommatrizen
Hantel 1 wird dem Kirchturm im Drehpunkt P1 zugeschlagen. Vom Kirchturm wird angenommen, ausreichend standfest zu sein, so dass er nicht als drittes Pendel modelliert und in die Berechnung einbezogen werden muss. Die Positionen der (fiktiven) Massen m1 und m2 k¨onnen dem Bild 6.2 entnommen werden, x1 = l1 sin ϕ1 ,
x2 = d sin ϕ1 + l2 sin ϕ2 ,
y1 = −l1 cos ϕ1 ,
y2 = −d cos ϕ1 − l2 cos ϕ2 .
W¨ ahlt man die stabile Gleichgewichtslage als Nullniveau, so darf man f¨ ur die potentielle Energie schreiben & ' U = l1 (1 − cos ϕ1 )m1 g + d(1 − cos ϕ1 ) + l2 (1 − cos ϕ2 ) m2 g . Die kinetische Energie berechnet sich zu T = m21 x˙ 21 + y˙ 12 + m22 x˙ 22 + y˙ 22 = m21 l12 ϕ˙ 21 + m22 d2 ϕ˙ 21 + l22 ϕ˙ 22 + 2dl2 ϕ˙ 1 ϕ˙ 2 cos(ϕ1 − ϕ2 ) . Die Bewegungsgleichungen k¨ onnen nun im Anschluss an (2.28) auf S. 77 notiert werden, d ∂T ∂T ∂U i − + =Q f¨ ur i = 1, 2. (6.10) dt ∂ ϕ˙ i ∂ϕi ∂ϕi i eine Drehkraft um den Drehpunkt Pi , die nicht aus dem Dabei bezeichnet Q Potential U herleitbar ist. Die Formel (6.10) f¨ uhrt auf & ' m2 d l2 cos(ϕ1 − ϕ2 ) · ϕ¨2 + sin(ϕ1 − ϕ2 ) · ϕ˙ 22 1 , (6.11a) + m2 d2 + m1 l12 ϕ¨1 + (m1 l1 + dm2 )g sin ϕ1 = Q und m2 d l2 cos(ϕ1 − ϕ2 ) · ϕ¨1 & ' 2 . (6.11b) + m2 l2 l2 ϕ¨2 − d sin(ϕ1 − ϕ2 ) · ϕ˙ 21 + g sin ϕ2 = Q Die praktischen Gegebenheiten des wirklichen Glockenl¨autens lassen erkennen, dass die Anregungskr¨ afte f¨ ur das Aufschwingen der Glocke und die Reibungskr¨ afte in den Lagern nur mit geeigneten Ans¨atzen f¨ ur die rechten Sei 1 und Q 2 beschrieben werden k¨ ten Q onnen. F¨ ur unsere Zwecke reicht es jedoch aus, im Gedankenexperiment anzunehmen, dass die angeregte Glocke mit großen Amplituden ϕ1 unged¨ ampft schwingt. Falls die Glocke dabei stumm“ bleibt, wird man sie als unl¨ autbar“ einstufen m¨ ussen. Wir be” ” 1 = 0 trachten daher das Gleichungssystem (6.11) mit den rechten Seiten Q
6.2 MIMO-LTI-Systeme in polynomialer Darstellung
283
2 = 0 und fragen, ob es nicht-triviale L¨osungen ϕ1 (t) = ϕ2 (t) gibt. und Q Dieser L¨ osungsansatz f¨ uhrt auf das vereinfachte Gleichungssystem f¨ ur den Winkel ϕ(t) := ϕ1 (t) = ϕ2 (t): (m2 d2 + m1 l12 + m2 dl2 )ϕ¨ + (m1 l1 + dm2 )g sin ϕ = 0 , (m2 dl2 + m2 l22 )ϕ¨ + l2 m2 g sin ϕ = 0 . Beide Gleichungen unterscheiden sich nur um einen konstanten Faktor, falls die Bedingung l1 = d + l2
(6.12)
erf¨ ullt sind. Glockenk¨ orper und Kl¨ oppel schwingen dann in Phase, gem¨aß der Bewegungsgleichung eines mathematischen Pendels, lϕ¨ + g sin ϕ = 0
mit
l = d + l2 .
Nach dem spektakul¨ aren Vorfall mit der stummen K¨olner Kaiserglocke wurde die Unl¨ autbarkeitsbedingung (6.12) bereits 1876 von dem D¨ urener Realschullehrer Veltmann gefunden, vgl. [B¨ ur90]. Damit wollen wir den Ausflug zum K¨ olner Dom beenden, zumal die ungeliebte Kaiserglocke 1918, gegen Ende des Ersten Weltkrieges, wieder eingeschmolzen wurde, um daraus erneut Kanonen zu produzieren [MS02] Auswertung der Transformation in die Hermitesche Normalform Die hergeleitete allgemeing¨ ultige Beziehung (6.7),
AP
BP
.
R R U11 U12
=
L
0
R R U22 U21
wird nun nach den beiden Hyperspalten getrennt ausgewertet. Die erste Spalte liefert R R + BP · U21 =L. AP · U11
(6.13)
Falls L unimodular ist, so m¨ ussen auf Grund der Dreiecksstruktur alle Hauptdiagonalelemente nicht verschwindende reelle Zahlen sein. Dann kann L durch weitere elementare Spaltenoperationen in eine p×p -Einheitsmatrix u uhrt ¨berf¨ werden (oder man multipliziert (6.13) von rechts mit L−1 ). Bei unimodularem L darf man also ohne Beschr¨ ankung der Allgemeinheit L = I annehmen, und die Gleichung (6.13) geht u ber in eine B´ezoutsche Identit¨at , vgl. S. 111, ¨
284
6 Beschreibung von LTI-Systemen durch Polynommatrizen R R AP · U11 + BP · U21 = I.
(6.14)
R R ∈ (R[s])p×p und U21 ∈ (R[s])m×p , mit In Worten: Es gibt zwei Matrizen U11 denen die gegebenen Matrizen AP und BP eine B´ezout sche Identit¨at (6.14) erf¨ ullen. Damit haben wir die folgende Aussage gewonnen.
Satz 6.1 Das gegebene Paar von Polynommatrizen (AP , BP ) ist genau dann linksteilerfremd, wenn die Dreiecksmatrix L in der Hermiteschen Normalform (6.7) unimodular ist, oder, anders ausgedr¨ uckt, wenn das Paar (AP , BP ) einer B´ezoutschen Identit¨at (6.14) gen¨ ugt. Falls der ermittelte Linksteiler nicht unimodular ist, so wird der Grad der Determinante det L = det
p <
lii (s)
i=1
gr¨ oßer als Null. Wegen R R AP X + BP U = L · (V11 X + V12 U) = 0
(6.15)
R R X+V12 U = 0, beeinflusst der Steuervektor U nur ein dynamisches System V11 dessen dynamische Ordnung um den Grad des Polynoms det L erniedrigt ist, wie aus Gleichung (6.15) ersichtlich. Es erscheint naheliegend, ein gegebenes Streckenmodell (6.1), f¨ ur das sich das Polynommatrizenpaar (AP , BP ) als nicht linksteilerfremd herausstellt, im regelungstechnischen Kontext als nicht steuerbar zu bezeichnen.
Definition 6.1. Ein gegebenes Paar von Polynommatrizen (AP , BP ) heißt nicht steuerbar, wenn das Paar nicht linksteilerfremd ist. ¨ In der Ubertragungsmatrix Gxu kann durch den Linksteiler L gek¨ urzt“ wer” den, R −1 R Gxu = −A−1 V12 . P BP = −(V11 )
(6.16)
¨ Die dynamische Ordnung des Ubertragungssystems von U nach X wird nicht durch den Grad der Determinante det AP bestimmt - wie eine erste Betrachtung des urspr¨ unglich gegebenen Gleichungssystems (6.2) vermuR ten l¨ asst -, sondern durch den niedrigeren Grad der Determinante det V11 . ¨ Ber¨ ucksichtigt man die Anfangswerte des gegebenen Ubertragungssystems (6.2), so ergibt sich der Vektor X der Systemgr¨oßen aus der Beziehung −1 X = A−1 P α0 − AP BP · U.
¨ Daraus erhellt, dass die dynamische Ordnung der Eigenbewegung des Ubertragungssystems durch den Grad von det AP festgelegt wird, w¨ahrend die
6.2 MIMO-LTI-Systeme in polynomialer Darstellung
285
dynamische Ordnung der von U gesteuerten Bewegung durch einen gegebenenfalls niedrigeren Grad, n¨ amlich R grad (det AP ) − grad (det L) = grad (det V11 )
bestimmt wird. Es ist sinnf¨ allig, die Nullstellen des Polynoms det L als ¨ Eingangs-Entkopplungs-Nullstellen des Ubertragungssystems (6.2) zu bezeichnen. Bei nicht unimodularen Hermiteschen Normalform-Matrizen L lassen sich aus der Detailstruktur von L weitere Schl¨ usse ziehen: Wenn in der i−ten Zeile von L lediglich das Hauptdiagonalelement lii von Null verschieden ist, so impliziert dies eine separate Steuerbarkeitsaussage f¨ ur die i−te Zeile des Gls.(6.2): Bei polynomialem lii h¨atte man dieses Polynom in der i−ten Zeile von (6.2) von vornherein ausklammern k¨onnen, und die i−te Zeile w¨ are per se nicht steuerbar. Sind mehrere Zeilen von L in einem Dreiecksblock verbunden, der sich durch elementare Spaltenoperationen weder verkleinern noch aufspalten l¨asst, so bestehen zwischen den zugeh¨ orenden Zeilen des Gls. (6.2) dynamische Abh¨ angigkeiten, die von den Steuergr¨ oßen U nicht beeinflusst werden k¨onnen. Die betreffenden Zeilen von (6.2) bilden ein nicht steuerbares Teilsystem. Auf der rechten Seite von (6.16) steht eine teilerfremde linke Matrizen¨ bruchdarstellung der Ubertragungsmatrix Gxu . Die Linksteilerfremdheit kann so aus (6.8) gefolgert werden: Die unimodulare Matrix V R (s) hat eine Determinante det V R (s) = const f¨ ur alle s. Folglich ist die p × (p + m)-Teilmatrix R R von V R (s), die durch Nebeneinandersetzen von V11 und V12 entsteht, f¨ ur ! ! alle s zeilenregul¨ ar. Daher kann es keinen Linksteiler L mit det L = const geben; denn sonst k¨ ame es zu einem Rangabfall der p × (p + m)-Teilmatrix R R ! (V11 (s), V12 (s)) an den Nullstellen von det L(s). Die vorstehende Diskussion hat uns als Nebenprodukt ein n¨ utzliches Kriterium f¨ ur die Nichtsteuerbarkeit beschert. Satz 6.2 Das Paar (AP , BP ) ist genau dann nicht steuerbar, wenn sich eine komplexe Zahl s0 derart finden l¨asst, dass Rg (AP (s0 ), BP (s0 )) < p.
(6.17)
Als Kandidaten f¨ ur s0 kommen nur die Wurzeln des Polynoms det AP (s) in Betracht; denn f¨ ur alle anderen s-Werte gilt Rg AP (s) = p, was mit der Ungleichung (6.17) nicht vereinbar ist. R R Die zweite Spalte der Beziehung (6.7) ergibt AP · U12 + BP · U22 = 0. −1 Multiplikation von links mit AP liefert R R A−1 P · BP · U22 = −U12 .
(6.18)
Mit der folgenden Nebenrechnung beweisen wir die Existenz der Inversen R −1 (U22 ) :
286
6 Beschreibung von LTI-Systemen durch Polynommatrizen
R R Wegen det AP = det L · det V11
= 0 muss det V11
= 0 gelten. Aus den elementaren Umformungen
R R R R R R −1 R U11 I 0 U12 + U12 V21 (V11 ) U12 U11 · = R R R R −1 R R R R −1 R V21 U21 U22 (V11 ) I U21 + U22 V21 (V11 ) U22
=
R R R R R −1 (U11 V11 + U12 V21 )(V11 )
R U12
R R R R R −1 (U21 V11 + U22 V21 )(V11 )
R U22
=
R −1 (V11 )
R U12
0
R U22
folgt die Determinantenbeziehung R −1 R det U R = det(V11 ) · det U22 .
(6.19)
R R
= 0 ist, muss auch det U22
= 0 sein. Dies zieht Weil det U R = 0 und det V11 R −1 die Existenz der Inversen (U22 ) nach sich. R Nun multiplizieren wir (6.18) von rechts mit der Inversen von U22 und erhalten R R −1 −A−1 . P · BP = +U12 · (U22 )
(6.20)
Die rechte Seite von (6.20) l¨ asst sich als rechte Matrizenbruchdarstellung ¨ der Ubertragungsmatrix von U nach X, vgl. Gleichung (6.6) auf S. 274, interpretieren. Sie ist gewiss teilerfremd. Das folgt aus der Definition des R R Matrizenpaares (U12 , U22 ). Dieses Paar bildet eine (p + m) × m −Teilmatrix der unimodularen (p + m) × (p + m) −Matrix U R . Wegen det U R ∈ R\{0} muss die Teilmatrix f¨ ur alle s spaltenregul¨ ar sein, also f¨ ur alle s den Rang m haben. G¨ abe es einen nicht unimodularen Rechtsteiler R(s) ∈ (R[s])m×m , so h¨ atte das Polynom det R(s) mindestens eine Nullstelle s0 . An dieser Stelle R R w¨ are der Rang der von U12 und U22 gebildeten (p+ m)× m-Teilmatrix kleiner als m – im Widerspruch zur Voraussetzung. Die Auswertung von (6.7) hat zu Ergebnissen gef¨ uhrt, die so zusammengefasst werden k¨onnen: Satz 6.3 Unabh¨angig davon, ob das gegebene Paar (AP , BP ) linksteilerfremd R −1 R ist oder nicht, wurde mit −(V11 ) V12 eine teilerfremde linke MatrizenbruchR R −1 darstellung und mit U12 (U22 ) eine teilerfremde rechte Matrizenbruchdar¨ stellung der Ubertragungsmatrix von U nach X gefunden. Die DeterminanR R tenpolynome det V11 (s) und det U22 (s) stimmen (bis auf einen skalaren Faktor) u berein. ¨ 6.2.4 Rechtsteiler polynomialer Matrizenpaare Wir wenden uns nun dem rechten Matrizenbruch CP · A−1 zu, der bei P der Aufl¨ osung des zusammengesetzten algebraischen Gleichungssystems (6.5) entsteht. Bei verschwindenden eingepr¨ agten Systemerregungsgr¨oßen αu0 , β0u und U vereinfacht sich das Gleichungssystem (6.5) zu
6.2 MIMO-LTI-Systeme in polynomialer Darstellung
AP αx0 X= CP Y + β0x
287
(6.21)
Durch elementare Zeilenoperationen gewinen wir die Hermitesche Normalform der Polynommatrix, vgl. Bild 6.3. Die Hauptdiagonalelemente der po-
AP
elementare Zeilenoperationen
R
CP Bild 6.3.
0
¨ Uberf¨ uhrung eines Matrizenpaares in die Hermitesche Normalform der ¨ Aquivalenzklasse linksassoziierter Polynommatrizen
lynomialen Dreiecksmatrix R haben den gr¨ oßten Grad im Vergleich mit allen dar¨ uber stehenden Elementen der betreffenden Spalte. Sind alle Hauptdiagonalelemente Polynome vom Grade Null, d. h. reelle Zahlen = 0, so kann R (erforderlichenfalls durch weitere elementare Zeilenoperationen) in eine p × pEinheitsmatrix u uhrt werden. ¨ berf¨ ¨ Die Uberf¨ uhrung des gegebenen Matrizenpaares (AP , CP ) in die Hermitesche Normalform (R, 0) kann als Linksmultiplikation mit einer unimodularen Matrix U L ∈ (R[s])(p+r)×(p+r) beschrieben werden:
L U11
L U12
AP
L U21
L U22
CP
R = (6.22) 0
Wegen det U L ∈ R \ {0} wird auch die Inverse (U L )−1 =: V L eine Polynommatrix, und wir d¨ urfen die Gleichung (6.22) von links mit V L multiplizieren.
AP CP
=
L V11
L V12
R
L V21
L V22
0
=
L V11 ·R
L V21 ·R
(6.23)
Gleichung (6.23) offenbart, dass die polynomiale Dreiecksmatrix R gemeinsamer Rechtsteiler der Polynommatrizen AP und CP ist. Aus den zweiten Zeilen von (6.22) und (6.23) folgen zwei weitere Matrizenbruchdarstellungen zum gegebenen Matrizenbruch CP A−1 P ,
288
6 Beschreibung von LTI-Systemen durch Polynommatrizen L L −1 L −1 L CP A−1 = −(U22 ) U21 . P = V21 (V11 )
¨ Die im Abschnitt 6.2.2 niedergeschriebenen Uberlegungen lassen sich analog wiederholen, um zu beweisen, dass sowohl die linke Matrizenbruchdarstellung L −1 L L L −1 (U22 ) U21 als auch die rechte Matrizenbruchdarstellung V21 (V11 ) teilerfremd sind. F¨ ur den Matrizenbruch CP A−1 P ist wesentlich, ob das Polynom det R(s) vom Grade Null, also eine reelle Konstante ungleich Null, oder von h¨oherem Grade ist. Durch Linksmultiplikation des Gleichungssystems (6.21) mit U L erh¨alt man aus den ersten p Gleichungen L L L R · X = U12 · Y + U11 · αx0 + U12 · β0x
(6.24)
und aus den letzten r Gleichungen L L L · Y = −U21 · αx0 − U22 · β0x . U22
(6.25)
Durch R¨ ucktransformation von (6.25) in den Zeitbereich gewinnt man ein Differentialgleichungssystem, dem der gew¨ ahlte Ausgangssignalvektor y(t) ∈ Rr gen¨ ugt. L L L L !11 !12 Im Falle det R ∈ R \ {0} werden R−1 U11 =: U und R−1 U12 =: U wiederum Polynommatrizen, und die Systemgr¨oßen L L L !11 !12 !12 ·Y+U · αx0 + U · β0x X=U
ergeben sich im Bildbereich als polynomiale Linearkombinationen der Ausgangsgr¨ oßen und der Anfangswerte, im Zeitbereich also integrallos“ allein ” durch Kombinieren und Differenzieren der r Komponenten des Ausgangsvektors y(t). Anders bei nicht-unimodularem R. Dann entspricht der algebraischen Gleichung (6.24) im Bildbereich ein Differentialgleichungssystem im Zeitbereich. Ein Beobachten und Registrieren der Ausgangssignalverl¨aufe y(t) reicht nicht aus, um die Systemsignalverl¨ aufe x(t) eindeutig festzulegen. Vielmehr muss man zus¨ atzlich Anfangswerte vorgeben, um das mit Gleichung (6.24) korrespondierende Differentialgleichungssystem zu l¨osen. Es erscheint naheliegend, eine Systembeschreibung (6.5) mit einem Paar (AP , CP ), das nicht rechtsteilerfremd ist, im regelungstechnischen Kontext als nicht beobachtbar zu bezeichnen. 6.2.5 Rechtsteiler und Nichtbeobachtbarkeit Definition 6.2. Ein gegebenes Paar von Polynommatrizen (AP , CP ) heißt nicht beobachtbar, wenn das Paar nicht rechtsteilerfremd ist. Beispiel 6.2 Unged¨ampftes verschiebliches 1-fach-Pendel mit dem Ausgangssignal y1 = ϕ. Aus den Bewegungsgleichungen (2.31), wobei N = 1, D1 = 0,
6.2 MIMO-LTI-Systeme in polynomialer Darstellung
289
d0 = 0, d1 = 0 zu setzen ist (siehe S. 80), folgern wir mit Hilfe der LaplaceTransformationsgesetze (2.7), dass das Gleichungssystem (6.21) im Beispielfalle so aussieht:
m0 s2 −m1 g −s2 ls2 − g 0 1
m (sx (−0) + x˙ (−0)) X Φ = −(sx (−0) + x˙ (−0)) + l(sϕ(−0) + ϕ(−0)) . ˙ 0
0
0
0
0
0
Y1
Durch Multiplikation von links mit der unimodularen Matrix U ergibt sich
XΦ =
m 0 s2 0 0 1 0 0
L
0
=
1 0 m1 g 0 0 1 1 m0 (m0 + m1 )g − m0 ls2
.
m1 gY1 + m0 (sx0 (−0) + x˙ 0 (−0)) Y1 ((m0 + m1 )g − m0 ls2 )Y1 + m0 l(sϕ(−0) + ϕ(−0)) ˙
(6.26) Die Matrix R lautet hier R=
m s 0 0
2
0
1
.
Sie ist offensichtlich nicht unimodular, und das Paar (AP , CP ) im Beispielfalle mithin nicht rechtsteilerfremd, folglich per definitionem nicht beobachtbar. Die R¨ ucktransformation des polynomialen Gleichungssystems (6.26) in den Zeitbereich f¨ uhrt unter Beachtung von (2.7) auf m0 x ¨0 (t) = m1 g y1 (t) ϕ(t) = y1 (t) , m0 l y¨1 (t) = (m0 + m1 ) g y1 (t). Aus der exakten Kenntnis des Zeitverlaufs des Ausgangssignals y1 (t) = ϕ(t) kann nicht integrallos“ auf den Verlauf des Systemsignalvektors (x0 (t), ϕ(t))T ge” ur t ≥ 0 werden vielmehr schlossen werden. Zur eindeutigen Berechnung von x0 (t) f¨ atzliche Information ben¨ otigt. Bei der die Anfangswerte x0 (−0) und x˙ 0 (−0) als zus¨ R¨ ucktransformation der dritten Zeile von (6.26) wurde der Zusammenhang sϕ(−0) + ϕ(−0)) ˙ = sy1 (−0) + y˙1 (−0)) ausgenutzt. Als Ergebnis haben wir die Differentialgleichung, der das gew¨ ahlte Ausugt, gewonnen. gangssignal y1 gen¨
Beispiel 6.3 Unged¨ampftes verschiebliches 1-fach-Pendel mit dem Ausgangssignal y2 = x0 . Das Gleichungssystem (6.21) lautet nun m0 s2 −m1 g −s2 ls2 −g 1 0
m (sx (−0) + x˙ (−0)) X Φ = −(sx (−0) + x˙ (−0)) + l(sϕ(−0) + ϕ(−0)) . ˙ 0
0
0
0
0
0
Y2
(6.27)
290
6 Beschreibung von LTI-Systemen durch Polynommatrizen
Durch Multiplikation von links mit der unimodularen Matrix U
L
=
0
0 1 m0 0 s2 m 1g 2 2 g − ls −m1 g s (m0 ls −g[m0 + m1 ]) − m11 g 2
erhalten wir f¨ ur die beiden oberen Zeilen
1 0X 0
01
Φ
=
m0 [s2 Y2 m1 g
Y2 − sx0 (−0) − x˙ 0 (−0)]
(6.28)
Die Matrix R wird hier zur 2 × 2-Einheitsmatrix. Folglich ist das Paar (AP , CP ) rechtsteilerfremd. Die Transformation des polynomialen Gleichungssystems (6.28) in den Zeitbereich f¨ uhrt unter Beachtung von sx0 (−0) + x˙0 (−0)) = sy2 (−0) + y˙2 (−0)) auf x0 (t) = y2 (t) m0 y¨2 (t) ϕ(t) = m1 g
(6.29a) (6.29b)
Aus der exakten Kenntnis des Zeitverlaufs des Ausgangssignals y2 (t) = x0 (t) kann in der Tat integrallos“ auf den Verlauf des Systemsignalvektors (x0 (t), ϕ(t))T ge” schlossen werden. Bei der Linksmultiplikation von (6.27) mit U L entsteht als dritte Zeile
˙ = 0. (m0 ls2 − gm0 − gm1 ) s2 Y2 − sx0 (−0) − x˙ 0 (−0) − m1 gl sϕ(−0) + ϕ(−0) Unter Nutzung von (6.29) l¨ asst sich diese Gleichung umschreiben in
(3))
y2 (−0) − y2 m0 l s4 Y2 − s3 y2 (−0) − s2 y˙ 2 (−0) − s¨
(−0)
−g(m0 + m1 ) s2 Y2 − sy2 (−0) − y˙ 2 (−0) = 0. Die R¨ ucktransformation in den Zeitbereich f¨ uhrt also auch hier auf die Diffenugt: tialgleichung, der das gew¨ ahlte Ausgangssignal y2 gen¨ (4)
y2 (t) = 0. m0 ly2 (t) − g(m1 + m0 )¨
Als Pendant zum Kriterium der Nicht-Steuerbarkeit (Satz 6.2 auf Seite 285) formulieren wir ein Kriterium der Nicht-Beobachtbarkeit. f¨ ur Systemmodelle (6.5), siehe Seite 274. Satz 6.4 Das Paar (AP , CP ) ist genau dann nicht beobachtbar, wenn sich unter den Wurzeln des Polynoms det AP (s) eine Zahl s0 befindet, so dass AP (s0 )
6.2 MIMO-LTI-Systeme in polynomialer Darstellung
291
6.2.6 Basisgr¨ oßen f¨ ur LTI-Regelstrecken Im Falle verschwindender Anfangswertvektoren, d.h. f¨ ur α0 = 0 und β0 = 0 R R −1 in Gleichung (6.6), gilt X = −A−1 ·U. Wir definieren P ·BP ·U = (U12 )·(U22 ) nun R −1 Ξ := (U22 ) ·U
(6.31)
als m-komponentigen Vektor neuer Systemgr¨ oßen. Offenbar gilt dann f¨ ur die Steuergr¨ oßen R U = U22 ·Ξ
(6.32a)
und f¨ ur die u oßen ¨brigen Systemgr¨ R X = U12 ·Ξ
Y = (CP ·
R U12
(6.32b) + DP ·
R U22 )
·Ξ .
(6.32c)
Ersichtlich ergeben sich alle Systemgr¨ oßen im Bildbereich durch polynomiale Linearkombination der m Komponenten von Ξ. Diese spielen die Rolle von Basisgr¨ oßen. 4 Zur Rechtfertigung der Bezeichnung Basisgr¨oßen“ bleibt zu ” zeigen, dass die Ξ-Komponenten R[s]-linear unabh¨angig sind. W¨ aren die Gr¨ oßen Ξ1 , . . . , Ξm nicht R[s]-linear unabh¨angig, so g¨abe es einen Multiplikatorensatz (p1 , . . . , pm ) = (0, . . . , 0) in R[s] derart, dass m * pµ Ξµ = 0. Dies w¨ urde eine Differentialgleichung zwischen den Kompoµ=1
nenten des Steuervektors u(t) implizieren; denn 0=
m
m
pµ Ξ µ =
µ=1
µ=1
1 R det U22
= 4
m m 1 R p ((U22 )adj )µν Uν µ R det U22 µ=1 ν=1
m m m 1 R pµ · ((U22 )adj )µν Uν =: pˆν Uν . R det U22 ν=1 µ=1 ν=1
R −1 pµ (U22 ) U µ=
In der Sprache der Algebra (siehe z.B. das seit 70 Jahren immer wieder neu aufgelegte Algebra-Lehrbuch [Wae50], Bd.1, S.147) bildet die Gesamtheit aller durch polynomiale Linearkombinationen aus den Komponenten von X und U erzeugbaren skalaren Gr¨ oßen im Bildbereich einen (Links-)Modul in bezug auf den Polynomring R[s] als Multiplikatorenbereich, kurz, einen R[s]-Modul M. In Anlehnung an den von den linearen Vektorr¨ aumen her vertrauten Sprachgebrauch sagt man: Eine endliche Menge {Λ1 , . . . , Λk } von Elementen des R[s]Moduls M heißt linear unabh¨ angig, falls mit Multiplikatoren pκ ∈ R[s] gilt:
p Λ k
Wenn
κ
κ=1
κ
= 0, so pκ = 0 f¨ ur κ = 1, . . . , k. Eine endliche Familie von
R[s]-linear unabh¨ angigen Elementen, aus denen sich jedes Element in M durch Linearkombination erzeugen l¨ asst, bildet eine Basis in M.
292
6 Beschreibung von LTI-Systemen durch Polynommatrizen
Damit w¨ are die Grundvoraussetzung der unabh¨angigen Vorgabem¨oglichkeit der m Steuergr¨ oßen verletzt. Mithin muss (p1 , . . . , pm ) = (0, . . . , 0) gelten. Im Zeitbereich lassen die Beziehungen (6.32) die folgende Deutung zu. Die Trajektorien der m Komponenten des Basis-Signalvektors ξ(t) ∈ Rm sind unabh¨ angig voneinander frei vorgebbar. Die zeitlichen Verl¨aufe aller u ¨brigen Systemsignale, einschließlich der Steuersignale u(t), sind damit festgelegt. Sie ergeben sich als Linearkombinationen der ξ-Komponenten und deren zeitlicher Ableitungen. Die regelungstechnische Nutzung dieses Tatbestandes f¨ ur Regelstrecken mit einer skalaren Steuergr¨ oße, also f¨ ur m = 1, wurde im Abschnitt 4.8 u uhrlich behandelt. Zu¨ ber Trajektoriensteuerung und Folgeregelung ausf¨ sammenh¨ ange zwischen den Basisgr¨ oßen und den physikalisch interpretierbaren Systemgr¨ oßen, die der Systembeschreibung zugrunde liegen, wurden dort nicht aufgedeckt. Nun wollen wir zeigen, wie sich die Laplace-transformierten Basisgr¨oßen Ξ1 , . . . , Ξm als polynomiale Linearkombinationen der urspr¨ unglich verwendeten Systemgr¨ oßen X1 , . . . , Xp und U1 , . . . , Um darstellen lassen. Es wird eine Konstruktionsvorschrift zur Aufdeckung dieser Abh¨angigkeiten angegeben: R R Das Matrizenpaar (U12 , U22 ), das eine teilerfremde rechte Matrizenbruch¨ darstellung (Mbd) der Ubertragungsmatrix Gxu von U nach X bildet, l¨asst sich durch elementare Zeilenoperationen in die Hermitesche Normalform der ¨ betreffenden Aquivalenzklasse linksassoziierter Polynommatrizen u uhren. ¨ berf¨ ¨ Der Uberf¨ uhrungsprozess entspricht der Linksmultiplikation mit einer unimodularen Polynommatrix U L ∈ (R[s])(p+m)×(p+m) , genauer L L R U11 U12 U12 I (6.33) · = m L L R 0 U21 U22 U22 Die erste Zeile ergibt die B´ezout sche Identit¨ at L R L R U11 · U12 + U12 · U22 = Im .
Multiplikation mit Ξ von rechts liefert unter Ber¨ ucksichtigung der Beziehungen (6.32a) und (6.32b) die Gleichung L L Ξ = U11 · X + U12 ·U .
(6.34)
Das ist die gesuchte Darstellung des Basisvektors Ξ als polynomiale Linearkombination von X und U. Hinter der zweiten Zeile des Gleichungssystems (6.33) steckt ein weiterer bemerkenswerter Zusammenhang. Aus L R L R U21 · U12 + U22 · U22 =0
¨ folgt f¨ ur die Ubertragungsmatrix Gxu die Beziehung R R −1 L −1 L Gxu = U12 · (U22 ) = −(U21 ) · U22 .
Die erhaltenen Ergebnisse fassen wir abschließend zusammen:
6.2 MIMO-LTI-Systeme in polynomialer Darstellung
293
R R −1 Satz 6.5 Ausgehend von einer teilerfremden rechten Mbd X = U12 (U22 ) ·U x ¨ f¨ ur die Ubertragungsmatrix Gu , vgl. Satz 6.3 auf Seite 286, und der DeR −1 finition eines Basisgr¨oßenvektors Ξ = (U22 ) · U ergeben sich alle Systemgr¨oßen als polynomiale Linearkombinationen der Komponenten des Ba¨ sisvektors, siehe (6.32). Durch die Uberf¨ uhrung (6.33) des MatrizenpaaR R res (U12 , U22 ) mittels elementarer Zeilenoperationen in Hermitesche Normalform erh¨alt man die Basisgr¨oßen Ξ als polynomiale Linearkombination (6.34) der urspr¨ unglichen Systemgr¨oßen U und X. Zugleich gewinnt man ¨ eine weitere teilerfremde linke Mbd der Ubertragungsmatrix Gxu , n¨amlich L −1 L R R X = −(U21 ) U22 · U. Das Matrizenpaar (V11 , V12 ) aus Satz 6.3 und das L L Matrizenpaar (U21 , U22 ) stimmen bis auf einen unimodularen Linksfaktor uberein. ¨
Beispiel 6.4 Verschiebliches 2-fach-Pendel mit skalarer Steuergr¨oße F, Fall 1: l1 = l2 (vergl. Abschnitt 6.2.2) ¨ Der Ubergang von R R −1 R · (U22 ) U = U12 ·Ξ X = U12
nach
L L Ξ = U11 · X + U12 ·U
stellt sich hier wie folgt dar: Im Beispiel 6.1, Seite 277, wurde hergeleitet, dass
(AP , BP ) U1R U2R U3R U4R1 =
−1 0
0 g − l1 g − l2
0
(
0 0
0 0
l2 − 1)g l1
0
mit U R = U1R ·U2R ·U3R ·U4R1
0 = 0 0
1
1 l1 1 l2 m1 m2 1 m0 s2 −( + )g l1 l2
wobei uR 43 = uR 44 =
1 l1
m
0
g
l22 (l1 s2 −g) l1 g l22 2 s l1 g
l1 (l1 s2 −g)(l2 s2 −g) g l1 (l2 s2 −g) s2 g , l2 l1 2 2 2 (l1 s −g) s (l1 s −g) + 1 l1 g g uR 43
uR 44
s2 (l1 s2 −g)l22 −m1 l22 s2 −m2 (l1 l2 s2 +g(l1 −l2 ) ,
l1 m0 s2 (l1 s2 −g)(l2 s2 −g)−l1 s2 m1 (l2 s2 −g)+m2 (l1 s2 −g) . g
Die letzte Spalte von U R muss nun durch elementare Zeilenoperationen auf Hermitesche Normalform gebracht werden. Dies leistet die unimodulare 4 × 4-Polynommatrix U L , die aufgrund der Linksteilerfremdheit des Paares (AP , BP ) wie folgt notiert werden kann,
294
UL
6 Beschreibung von LTI-Systemen durch Polynommatrizen
1 l g = 1
−l1 g(l1 − l2 )
1 0 −l ) l g = U
l22 l1 g(l1
L U21
2
−l1 g(l1 − l2 )
1
L 22
·
UL
R U12 R U22
= UL
l1 g(l1
AP
Einsetzen ergibt tats¨ achlich
0 −l ) . B
l22
2
P
l1 (l1 s2 −g)(l2 s2 −g) 1 g l1 0 (l2 s2 −g)s2 g = l1 0 (l1 s2 −g)s2 g 0 uR 44
L R L R Die 1. Zeile lautet ausgeschrieben U11 · U12 + U12 · U22 = 1. Multiplikation von rechts mit Ξ liefert unter Ber¨ ucksichtigung von (6.32a) und (6.32b) endlich
L U11
·X+
L U12
·U =
L U11
·
X 0
Φ1 Φ2
L + U12 ·F
1 l12 l22 X0 − Φ1 + Φ2 + 0 · F = Ξ l1 g l1 − l 2 l1 − l 2
=
Damit wurde die gew¨ unschte Darstellung f¨ ur das Basissignal gewonnen: ξ(t) =
1 l1 g
x0 (t) −
l12 l22 φ1 (t) + φ2 (t) l1 − l 2 l1 − l 2
.
Eine sinnvolle physikalische Deutung dieses Basissignals liegt nicht auf der Hand.
Beispiel 6.5 Verschiebliches 2-fach-Pendel mit skalarer Steuergr¨oße F, Fall 2: l1 = l2 (vergl. Abschnitt 6.2.2) Im Beispiel 6.1 wurde hergeleitet, dass (AP , BP ) U
R
=
1 0 0
0 0 1 0 1 g − ls2
0 0 0
= (L, 0) ,
wobei
0 = 0 −1 0
UR
−l g −1 g −1 g m1 +m2 −
l 2 l (ls − g) (ls2 −g) g g l 2 l 2 s s g g l 2 l 2 (ls − g) s g g lm0 2 s g
u43
u44
6.2 MIMO-LTI-Systeme in polynomialer Darstellung
295
mit u43 = ls2 (
m0 2 ls − m0 − m1 − m2 ) + m2 g, g
u44 = ls2 (
m0 2 ls − m0 − m1 − m2 ). g
¨ ¨ W¨ ahrend der Uberf¨ uhrung der Ubertragungsmatrix GX U aus der linken Mbd R R −1 in die teilerfremde rechte Mbd U12 · (U22 ) fand die K¨ urzung“ mit ” dem Linksteiler L quasi automatisch statt. In diesem Beispiel hat sich dabei die dynamische Ordnung des gesteuerten Systems von 6 auf 4 reduziert. Die Steuergr¨ oße U = F wirkt nur noch im reduzierten System, in welchem die Systemgr¨ oßen Φ1 und Φ2 u ¨ bereinstimmen und damit auch die Anzahl der mechanischen Freiheitsgrade von 3 auf 2 verkleinert worden ist. Dessen eingedenk kann nun die Extraktion der ¨ Basisgr¨ oße durch den Ubergang von −A−1 P BP
R R −1 R X = U12 · (U22 ) U = U12 ·Ξ
L L Ξ = U11 · X + U12 ·U
nach
formal ebenso erfolgen wie es bereits f¨ ur den Fall unterschiedlicher Ersatzpendell¨ angen vorgef¨ uhrt wurde. Die letzte Spalte von U R muss durch elementare Zeilenoperationen auf Hermitesche Normalform gebracht werden. Dies leistet die unimodulare 4 × 4-Polynommatrix
UL
=
−1 l
1
0
−1 l = m s −s 0
0
0
2
2
R V11
R V12
1
UL
R U12 R U22
= UL
l · g
0
−m1 g −m2 g ls2 −g 0 1 −1
denn
−1 ; 0
0
0
1 0 = . 0
ls2 −g s2 s2
m0 ls4 −gs2 (m0 +m1 +m2 )
0
L R L R Die 1. Zeile lautet U11 · U12 + U12 · U22 = 1. Multiplikation von rechts mit Ξ liefert unter Ber¨ ucksichtigung von (6.32a) und (6.32b) endlich
L L L Ξ = U11 · X + U12 · F = U11 ·X=(
−1 l
X 0
1
0)
Φ1 Φ2
=
−1 X0 + Φ1 . l
L L = ( 1l 1 0) auch U11 = ( 1l q (1 − q)) f¨ ur irgendein q ∈ R Man h¨ atte statt U11 w¨ ahlen k¨ onnen, und w¨ are, da im gek¨ urzten“ System Φ1 = Φ2 =: Φ gelten muss, ” stets zum gleichen Ergebnis gelangt. Im Zeitbereich lautet die gesuchte Darstellung des Basissignals −1 ξ(t) = x0 (t) − ϕ(t). l
296
6 Beschreibung von LTI-Systemen durch Polynommatrizen
Das Beispiel 6.5 illustriert, dass die Definition (6.31) der Basisgr¨oßen ¨ Ξ von einer gewiss teilerfremden rechten Mbd der Ubertragungsmatrix R R −1 GX = U (U ) ausgeht. Daher l¨ a sst sich die Beziehung (6.34) nur in 12 22 U unglich gegebenen gek¨ urzten“ Systemen (V11 , V12 ), nicht aber in den urspr¨ ” Systemen (AP , BP ), falls diese nicht linksteilerfremd sind, nutzen. Nun soll ein Erl¨ auterungsbeispiel f¨ ur einen zweikomponentigen Steuereingang folgen. Beispiel 6.6 Verschiebliches 2-fach-Pendel mit Steuergr¨ oßen F und D1 : Die Be wegungsgleichungen (AP , BP ) X = 0 k¨ onnen aus (2.31) auf S. 80 u ¨ bernommen U werden, f¨ ur N = 2 mit D2 = 0 und d0 = d1 = d2 = 0. Sie lauten
(m0 +m1 +m2 )s2 −m1 l1 s2 −m2 l2 s2 −1 0 2 2 m1 l1 (l1 s −g) 0 0 −1 −m1 l1 s −s2
0
l2 s2 −g
0
X0 0 Φ Φ12 = 0 . F D1
0
0
Mit Hilfe elementarer Spaltenoperationen pr¨ ufen wir das Matrizenpaar (AP , BP ) auf Linksteilerfremdheit und generieren zugleich aus der linken Mbd (AP )−1 BP R R −1 ¨ eine teilerfremde rechte Mbd U12 (U22 ) der Ubertragungsmatrix GX U . Die Transformation
1 0 0 0 0 (AP , BP ) · U = 0 1 0 0 0 = (L, 0) R
0 0 1 0 0 wird geleistet von der unimodularen Matrix
0 0 0 UR = −1 0
0 0 0 0 −1
l2 g 0 1 − g
−
l2 s2 −g
0 1
0
0
s2
−l2 −m1 l1 s2 (m0 +m1 )s2 g l1 l2 m 1 s 2 m1 l1 (l1 s2 −g) g
uR 45 −m1 l1 s2 (l2 s2 −g)
mit 2 2 4 uR 45 = (m0 +m1 +m2 )s (l2 s −g)−m2 l2 s
Das Paar (AP , BP ) ist damit als linksteilerfremd nachgewiesen. Aus der geR R −1 (U22 ) l¨ asst sich nun ein zweikomponentiger Basiswonnenen rechten Mbd U12 gr¨ oßenvektor Ξ bestimmen. R Die Beziehung U22 · Ξ = U, vgl. (6.31) und (6.32a), lautet hier
−m1 l1 s2 m1 l1 (l1 s2 −g)
(m0 +m1 )l2 s4 −g(m0 +m1 +m2 )s2 −m1 l1 (l2 s2 −g)s2 )
Ξ1 Ξ2
R und die Beziehung X = U12 · Ξ, vgl. (6.32b), erscheint in der Gestalt
=
F D1
,
6.2 MIMO-LTI-Systeme in polynomialer Darstellung
X Φ =
0 1 0
0
1
Φ2
l2 s2 −g 0 s2
Ξ .
297
1
Ξ2
Um die Basisgr¨ oßen in Abh¨ angigkeit von den urspr¨ unglich verwendeten Systemgr¨ oßen gem¨ aß der allgemeinen Beziehung (6.34) darzustellen, bringen wir die (5 × 2)−Polynommatrix, die den rechten Teil der Matrix U R bildet, durch elementare Zeilenoperationen auf Hermitesche Normalform. Die Transformation
U
L
U = U R 12 R 22
1
0
0
1
0
0
0
0
0
0
kommt mit der unimodularen Polynommatrix 0 −1 g
U
L
= (m +m +m )s −m l s 0
1
2
1 1
−s
1
0 l2 g
0
0
0
0
−m2 l2 s2 −1
0
0 2
2
−m1 l1 s2 2
m1 l1 (l1 s −g)
0
0
−1
0
2
0
0
2
l2 s −g
zustande. Daraus folgt
Ξ1 Ξ2
X Φ + U DF = 0
L = U11
1
Φ2
L 12
1
0 −1 g
1 0
0 l2 g
X . Φ 0
1
Φ2
Es sei ausdr¨ ucklich darauf aufmerksam gemacht, dass es bei der Steuerung des verschieblichen Zweifachpendels mit den zwei skalaren Steuergr¨ oßen F und D1 belanglos ist, ob die beiden (Ersatz-)Pendell¨ angen l1 und l2 u ¨ bereinstimmen oder nicht.
Den vorangegangenen drei Beispielen ist gemeinsam, dass in der Darstellung L (6.34) die m × m-Matrix U12 zur Nullmatrix wird. Wir bringen daher ein weiteres Beispiel, bei dem dies nicht zutrifft. Beispiel 6.7 Betrachtet wird die im Abschnitt 2.4.2 angegebene RC-Schaltung mit einem Operationsverst¨ arker f¨ ur k = 2 und normierte Schaltelemente-Werte ur alle i. Gi = 1, Ci = 1 f¨ Die Bewegungsgleichungen“ (AP , BP ) X = 0 lauten jetzt U ”
298
6 Beschreibung von LTI-Systemen durch Polynommatrizen
AP
BP
·
X U
0
1
1
0
0 2 = 0 −1 0 0
0 0 0 −1 0 0 s + 2 −1 0 −1 s + 2 −1 0 −1 1
0 1 0 0 0
I UØ1 UØ2 · UØ 3 UØ4
= 0.
Ue
Die Polynommatrix l¨ asst sich durch elementare Spaltenoperationen – das entspricht der Multiplikation mit einer unimodularen Matrix von rechts – auf Hermitesche Normalform bringen. Die Umformung AP
BP
·
R U11
R U12
R U21
R U22
=
I
0
gelingt mit
UR
s+1 1 0 = −1 −s−2 −2
0 0 0 0 0 1
s+1 1 0 0 0 0 −1 0 −s−2 −1 0 0
1 −s2 − 3s − 1 0 0 0 1 0 s+2 0 s2 + 4s + 3 0 1
.
¨ Aus U R l¨ asst sich eine teilerfremde rechte Mbd der Ubertragungsmatrix entnehmen:
I UØ1 U Ø2 UØ3 UØ4
−1 e R R −1 e = −AP · BP · U = U12 · (U22 ) · U =
Ξ
−s2 − 3s − 1 0 · (−1)−1 · U e . 1 s+2 2 s + 4s + 3
Die Prozedur zur Aufdeckung der expliziten Darstellung (6.34) braucht hier nicht R = 1 vereinfacht sich (6.34) zu ausgef¨ uhrt zu werden. Wegen U22 Ξ = U e.
Vollst¨ andig direkt gesteuerte Systeme Systeme, bei denen zu jedem mechanischen Freiheitsgrad ein separates Steuersignal wirksam werden kann, verdienen ausdr¨ uckliche Erw¨ahnung. Sie spielen in der Robotertechnik eine herausragende Rolle. Diese Klasse von Systemen kann so charakterisiert werden: m = p, BP ist invertierbar und BP−1 AP ist eine Polynommatrix. Wegen
6.2 MIMO-LTI-Systeme in polynomialer Darstellung
299
−1 −1 X = −A−1 ·U P BP · U = (Im )(−BP AP )
steht mit dem Matrizenpaar (Im , −BP−1 AP ) sogleich eine teilerfremde rechte ¨ Mbd der Ubertragungsmatrix Gxu zur Verf¨ ugung. Die unimodulare 2m × 2mL Polynommatrix U kann ebenfalls aus den Bewegungsgleichungen (6.1) unmittelbar entnommen werden:
L L Im 0 U11 U12 = . L L U21 U22 BP−1 AP Im Die Beziehung (6.33) erscheint in der Form
L L R Im Im 0 U11 U12 Im U12 · = · = −1 −1 L L R U21 U22 U22 0 BP AP Im −BP AP Als Basisvektor Ξ kann der Systemgr¨ oßenvektor X gew¨ahlt werden, L L Ξ = U11 · X + U12 · U = Im · X + 0 = X .
Auf Grund der besonderen Steuerbarkeitseigenschaften – zu gew¨ unschten Zeitverl¨ aufen von x(t) kann der zugeh¨ orende Steuervektor u(t) direkt berechnet werden, ohne Differentialgleichungen l¨ osen zu m¨ ussen5 – wollen wir dieser Klasse von Systemen den Namen vollst¨andig direkt gesteuerte Syste” me“ geben. In der anglo-amerikanischen Fachliteratur hat sich die Bezeichnung fully actuated systems“ eingeb¨ urgert. ” Beispiel 6.8 Das verschiebliche N-fach-Pendel mit den Steuergr¨oßen F und D1 , . . . , DN ist ein vollst¨ andig direkt gesteuertes System.
Gesamtheit der Basisgr¨ oßen Abschließend bleibt die Frage, inwieweit die Basisgr¨oßen durch die Beziehungen (6.31) und (6.34) eindeutig bestimmt werden, zu beantworten. ¨ Satz 6.6 Zu einem Ubertragungssystem, das durch ein polynomiales Matri! der der zenpaar (AP , BP ) beschrieben wird, sei ein Basisgr¨oßenvektor Ξ, Bestimmungsgleichung (6.31) gen¨ ugt und in der Form (6.34) dargestellt werden kann, gefunden worden, d.h. R −1 ! := (U !22 Ξ ) ·U,
L L !=U !11 !12 Ξ ·X+U ·U.
Die Menge aller Basisgr¨oßenvektoren zum System (AP , BP ) bestimmt sich so: Jeder Vektor Ξ, der einer Bestimmungsgleichung 5
Mit Blick auf die mechanischen Anwendungen, bei denen f¨ ur jedes Drehgelenk die einzupr¨ agende Drehkraft berechnet werden kann, wird diese Vorgehensm¨ oglichkeit in englischsprachigen Arbeiten oft als computed torque me” thod“ bezeichnet.
300
6 Beschreibung von LTI-Systemen durch Polynommatrizen
! R )−1 · U Ξ := M · (U 22 gen¨ ugt und sich in der Gestalt & L ' ! + Q1 · AP )X + (U ! L + Q1 · BP )U Ξ = M · (U 11 12
(6.35)
! in der Gestalt oder, unter Bezug auf den fixierten Basisgr¨oßenvektor Ξ, ! + Q2 · (AP X + BP U) Ξ =M ·Ξ darstellen l¨asst, ist ein Basisgr¨oßenvektor. Hierbei stehen M f¨ ur eine beliebige unimodulare m × m-Matrix und Q1 sowie Q2 f¨ ur beliebige polynomiale m × pMatrizen. Beweis: !R , U ! R ) der Ubertragungs¨ Zu einer gefundenen teilerfremden rechten Mbd (U 12 22 x matrix Gu gewinnt man mit jeder beliebigen unimodularen m × m-Polynommatrix M eine weitere teilerfremde rechte Mbd R R ! R · M −1 , U ! R · M −1 ) . (U12 , U22 ) = (U 12 22 R R !R ) !R , U zum Tupel (U12 , U22 ) Mit dem Wechsel vom Tupel (U 12 22 R −1 ! := (U ! ) ·U andert sich die Definitionsgleichung der Basisgr¨oßen von Ξ ¨ 22 auf R −1 R −1 !22 Ξ := (U22 ) · U = M · (U ) ·U .
! und Ξ gilt offenbar die Relation Zwischen den Vektoren Ξ !. Ξ =M ·Ξ In der Gleichung (6.33),
R L U11 U 12 = UL · R L U22 U21
L U12 L U22
·
R U12 R U22
I = m , 0
kann man an die Stelle der unimodularen Matrix U L auch die Matrix
L L L L 11 U11 + Q · AP U12 + Q · BP U U12 L = U = L L L U L U21 U22 U 21
22
unimodular; denn mit der Schur sche Determinansetzen. Mit U ist auch U tenformel gelingen die Umformungen:
6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen
L = det det U
L U L U 11 12 L L 21 U U22
p·m
= (−1)
· det
= det
L L U11 + Q · AP U12 + Q · BP L U21
L L + Q · BP U11 + Q · AP U12
301
L U22
L L U22 U21 L L L L −1 L · det U12 + Q · BP − (U11 + Q · AP )(U21 ) U22 = (−1)p·m · det U21 L L L L −1 L · det U12 − U11 (U21 ) U22 + Q · (BP + AP · Gyu ) = (−1)p·m · det U21 L L L L −1 L · det U12 − U11 (U21 ) U22 = (−1)p·m · det U21 L L L L −1 L · det U12 − U11 (U21 ) U22 = (−1)p·m · det U21
L L L L U11 U12 U12 U11 p·m 2·p·m = (−1) = det U L . = (−1) · det · det L L L L U22 U21 U21 U22
Wegen
R R + BP · U22 = 0 folgt AP · U12 R R I U12 U12 L L =U · = m . U · R R U22 U22 0
Aus der ersten Zeile schließt man mit (6.32a) und (6.32b) auf L L L L (U11 + Q · AP )X + (U12 + Q · BP )U = U11 X + U12 U.
Um den Basisvektor Ξ gem¨ aß (6.34) durch X und U auszudr¨ ucken, kann L mit beliebig gew¨ahltem Parameter jede der unimodularen Matrizen U Q ∈ R[s]m×p benutzt werden. Damit wurde die behauptete Aussage (6.35) verifiziert. qed.
6.3 Polynomiale MIMO-LTI-Systeme mit Ru ¨ ckfu ¨ hrungen 6.3.1 Charakteristisches Polynom des r¨ uckgef¨ uhrten Systems und Nullstellenzuweisung ¨ Das gegebene LTI-Ubertragungssystem AP · X + BP · U = α0
(6.36)
werde durch eine (reellwertige oder dynamische) R¨ uckf¨ uhrung U = FP · X
(6.37)
302
6 Beschreibung von LTI-Systemen durch Polynommatrizen u(t) ∈ Rm
x(t) ∈ Rp
LTI-System
−FP Bild 6.4. R¨ uckgef¨ uhrtes System
erg¨ anzt. Beide Gleichungen bilden zusammen das r¨ uckgef¨ uhrte System, vgl. Bild 6.4, α0 X AP BP = . (6.38) U −FP I 0 Wir fragen, ob die Nullstellen des charakteristischen Polynoms CLCP des r¨ uckgef¨ uhrten Systems (6.38), AP BP CLCP := det , (6.39) −FP I durch geeignete Wahl von FP beliebig platziert werden k¨onnen. Eine notwendige Bedingung l¨ aßt sich ohne weiteres angeben: Satz 6.7 F¨ ur die beliebige Nullstellenplatzierbarkeit ist notwendig, dass das Paar (AP , BP ) ∈ (R[s])p×(p+m) linksteilerfremd ist, oder, gleichwertig ausgedr¨ uckt, Rg(AP (s), BP (s)) = p
f¨ ur alle s ∈ C.
(6.40)
Beweis: Besitzt das Paar (AP , BP ) einen nichttrivialen Linksteiler L, so gilt R R (AP , BP ) = L(V11 , V12 ) mit grad (det L) ≥ 1 .
Dann wird
AP BP CLCP = det −FP Im
( = det
L 0 0 Im
R R V12 V11 −FP Im
)
R R V11 V12 = det L · det −FP Im
.
Offensichtlich sind die Nullstellen des Polynoms det L zugleich Nullstellen des Polynoms CLCP. Sie k¨ onnen durch die Wahl von FP nicht ver¨andert werden. qed.
6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen
303
Der Beweis zeigt, dass die im Abschnitt 6.2.2 eingef¨ uhrte Bezeichnung Eingangs-Entkopplungs-Nullstellen“ f¨ ur die Wurzeln des Linksteilers L auch ” im Lichte der Nullstellenplatzierung mit Hilfe von R¨ uckf¨ uhrungen aller u oßen auf die Eingangsgr¨ oßen gerechtfertigt ist. ¨ brigen Systemgr¨ Im weiteren gehen wir davon aus, dass das Paar (AP , BP ) des betrachteten ¨ Ubertragungssystems (6.36) linksteilerfremd u ¨ ber R[s] ist. Den maximalen Grad der (p×p)–Minoren, die sich in der Matrix (AP , BP ) ∈ R[s]p×(p+m) bil¨ den lassen, bezeichnen wir als die dynamische Ordnung n des Ubertragungssystems (6.36). Wir setzen die R¨ uckf¨ uhrmatrix FP (s) = F (0) + F (1) s + . . . + F g sg
(6.41)
mit einem Grad g derart an, dass sich das charakteristische Polynom CLCP des r¨ uckgef¨ uhrten Systems AP (s) BP (s) CLCP (s) = det (6.42) −FP (s) Im ebenfalls als ein reelles Polynom n-ten Grades ergibt. Die Determinante berechnet man hier zweckm¨aßig mit Hilfe des Laplaceschen Entwicklungssatzes, vgl. z.B. [Sch49], [Gan66], [RF04], der die (p × p)–Minoren pν des Paares (AP , BP ) mit den komplement¨aren (m × m)– Minoren zν des Paares (−FP , Im ) verkn¨ upft, CLCP(s) =
N ν=1
±pν (s) · zν (s)
mit
p+m m
= N.
(6.43)
Die Skizze erl¨ autert die Bildung eines Summanden f¨ ur p = 4 und m = 2: ⎞ ⎛ ⎛ ⎞ ∗∗∗∗ ∗∗ ∗ ∗ ⎜∗ ∗ ∗ ∗ ⎟ ⎜∗ ∗ ∗ ∗⎟ ⎟ pν (s) = det ⎜ ⎜ ⎟ ⎝∗ ∗ ∗ ∗ ⎠ ⎜∗ ∗ ∗ ∗⎟ ⎜ ⎟ ∗∗∗∗ ⎜∗ ∗ ∗ ∗⎟ −→ ⎜ ⎟ ⎝ ⎠ • • •• z (s) = det ν • • •• " #$ % p+m
Jede denkbare Verteilung der Nullstellen des CLCP besteht aus reellen Zahlen und konjugiert-komplexen Zahlenpaaren. Eine gew¨ unschte Nullstellenverteilungsvorgabe ist – bis auf einen gemeinsamen konstanten Zahlenfaktor a0 , also bis auf eine Einheit im Polynomring R[s] – gleichwertig einer Festlegung der Polynom-Koeffizienten (a0 , a1 , . . . , an−1 , an )T ∈ Rn+1 mit a0 = 0. Geometrisch l¨ asst sich ein festgelegtes CLCP im Vektorraum Rn+1 als eine Gerade durch den Ursprung deuten; denn im Ortsvektor a = a0 (1, aa10 , aa20 , . . . , aan0 )T
304
6 Beschreibung von LTI-Systemen durch Polynommatrizen
sind die Quotienten aa0i feste reelle Zahlen, w¨ahrend a0 als eine beliebige nichtverschwindende reelle Konstante gew¨ahlt werden darf. Anders ausgedr¨ uckt, der Vektor a wird als Punkt im n–dimensionalen projektiven Raum PRn interpretiert.6 Eine fixierte Nullstellenplatzierung des Polynoms (6.42) entspricht der Festlegung eines Punktes im PRn . Gut u ¨ berschaubare Verh¨ altnisse liegen f¨ ur m = 1 und g = 1, also f¨ ur ein skalares Steuersignal und f¨ ur eine konstante R¨ uckf¨ uhrung, vor. Wir wollen darauf ausf¨ uhrlicher eingehen. 6.3.1.1 Nullstellenplatzierung mittels reellwertiger R¨ uckf¨ uhrungen bei einem skalaren Steuereingang Die R¨ uckf¨ uhrmatrix FP wird zum p–dimensionalen Zeilenvektor f T mit reellwertigen Komponenten. In der Laplaceschen Determinantendarstellung (6.43) erstreckt sich die Summe u ¨ ber N = p + 1 Summanden, und wir haben die Entwicklung der Determinante nach der letzten Zeile auszuf¨ uhren: CLCP = det
AP bP −f T 1
=
N −1=p
fν · pν (s) + 1 · det AP .
(6.44)
ν=1
Die Polynome pν (s) = det
AP bP −eTν 0
=
n
mζν sn−ζ
(6.45)
ζ=0
bezeichnen die (p × p)–Minoren, die durch Fortlassen der ν-ten Spalte aus der Matrix (AP , bP ) hervorgehen. Mit den Abk¨ urzungen fν =: zν
f¨ ur
ν = 1, . . . , p ;
1 =: zp+1 ,
det AP =: pp+1 (s)
vereinfacht sich die Schreibweise des Polynoms CLCP(s) =
p+1
pν (s) · zν .
(6.46)
ν=1
Durch Vergleich der Koeffizienten mit u ¨bereinstimmender s-Potenz l¨asst sich diese polynomiale Gleichung umschreiben in ein System von n + 1 skalaren Gleichungen ⎛ ⎞ z1 ⎛ ⎞ ⎛ ⎞⎜ ⎟ 1 m01 . . . m0ν . . . m0,p+1 ⎜ ... ⎟ ⎜ ⎟ ⎜ .. ⎟ ⎜ .. . . ⎟ .. . .. ⎜ ⎟ (6.47) a := a0 · ⎝ . ⎠ = ⎝ . . . .. . ⎠ ⎜ zν ⎟ =: M z ⎜ . ⎟ an . mn1 . . . mnν . . . mn,p+1 ⎝ . ⎠ a0 zp+1 6
Als weiterf¨ uhrendes Lehrbuch sei [Kun97] empfohlen.
6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen
305
Weil der Zahlenwert von a0 nicht fixiert ist, befriedigt neben einem Vektor z ∈ Rp+1 auch jeder Vektor λ·z mit λ ∈ R\{0} das Gleichungssystem (6.47). Geometrische Deutung: Die Matrix M ∈ R(n+1)×(p+1) vermittelt eine Abbildung zwischen projektiven R¨ aumen, n¨ amlich der Punkte z ∈ PRp in den pron jektiven Raum PR , dessen Punkte wir mit a = a0 (1, . . . , aan0 )T bezeichnet haben. Das regelungstechnische Problem der beliebigen Nullstellenplatzierbarkeit wurde somit eingebettet in das umfassendere mathematische Problem der L¨ osbarkeit des Gleichungssystems (6.47) bei beliebig vorgegebener linker Seite a ∈ PRn mit a0 = 0. Es bleibt zu beachten, dass das Gleichungssystem (6.47) gegebenenfalls auch von Vektoren z mit zp+1 = 0 erf¨ ullt wird, die sich nicht auf die regelungstechnisch gew¨ unschte Form z = λ · (−f T , 1)T bringen lassen. Eine notwendige L¨ osbarkeitsbedingung des mathematischen Problems ist ohne weiteres aus (6.47) erkennbar: RgM = n + 1 .
(6.48)
Diese Bedingung impliziert p ≥ n und erlaubt eine erste Schlussfolgerung: Im Falle m = 1 lassen sich die CLCP-Nullstellen gewiss nicht beliebig platzieren, wenn die Anzahl p der zur R¨ uckf¨ uhrung verwendbaren Systemgr¨oßen kleiner als die dynamische Ordnung n des Systems sein sollte. Im u ¨brigen ist die Bedingung (6.48) nicht spezifisch f¨ ur den Fall m = 1, sondern steckt bereits in dem oben bewiesenen allgemeing¨ ultigen Satz 6.7. W¨are n¨amlich die dort genannte Bedingung (6.40) verletzt, das Paar (AP , bP ) also nicht linksteilerfremd, so bes¨ aßen die p + 1 Minoren pν (s) ein Polynom (mindestens vom Grade Eins) als gemeinsamen Faktor. Folglich g¨abe es eine komplexe Zahl s0 derart, dass pν (s0 ) = 0 f¨ ur alle ν. Nun k¨onnten wir den Zeilenvektor (sn0 , sn−1 , . . . , s , 1) von links an die Matrix M multiplizieren und erhielten 0 0 so eine Nullzeile als Linearkombination der Zeilen von M . Daher m¨ usste Rg M < n + 1 sein. Beispiel 6.9 Wie im Beispiel 6.7 wird die dort angegebene RC-Schaltung mit einem Operationsverst¨ arker f¨ ur k = 2 und normierte Schaltelementewerte Gi = 1, Ci = 1 betrachtet. Die normierten Anfangswerte UØ2 (−0) = x3 (−0) und UØ3 (−0) = x4 (−0) sind reelle Zahlen, deren tats¨ achlicher Wert f¨ ur die Nullstellenplatzierung ohne Belang ist. Die Systemmodell (6.36) lautet im Beispielfall
(AP , bP ) ·
0 1 0 0 2 −1 X 0 −1 s + 2 = U 0 1
0 0
X1 0 00 0 X 2 0 0 1 0 X3 −1 0 0 x · = (−0) . 3 X4 (−0) −1 s + 2 −1 0 x 4 X5 0 −1 1 0 0 U
Offenbar gilt p = 5 und m = 1. Obwohl det AP = −1, handelt es sich um ein ¨ dynamisches Ubertragungssystem mit der dynamischen Ordnung n = 2; denn es haben zwei (5 × 5)–Minoren der Polynommatrix (AP , bP ) den Grad 2 – einerseits
306
6 Beschreibung von LTI-Systemen durch Polynommatrizen
der aus den Spalten 2, 3, 4, 5 und 6 und andererseits der aus den Spalten 1, 2, 3, 4 und 6 resultierende Minor. Zu beantworten ist die Frage, ob man durch reellwertige R¨ uckf¨ uhrungen die beiden Nullstellen des charakteristischen Polynoms des r¨ uckgef¨ uhrten Systems wie gew¨ unscht platzieren kann. Wenn ja, so soll die L¨ osungsmannigfaltigkeit f¨ ur eine gew¨ unschte Nullstellenlage, z.B. f¨ ur s1 = −1 und s2 = −2, ermittelt werden. Wegen
CLCP(s) = det
0 1 0 0 0 0 2 −1 0 0 0 −1 s + 2 −1 0 0 0 −1 s + 2 −1 1 0 0 −1 1 −f1 −f2 −f3 −f4 −f5
0 1 0 0 0 1
lauten die Gleichungen (6.46) und (6.47) f¨ ur das Beispiel so, CLCP(s) = (s2 + 3s + 1)z1 + 0 · z2 + (−1) · z3 + (−s − 2)z4 + (−s2 − 4s − 3)z5 + (−1)z6 und
10 · = 3 0
a = a0
z = M · z.
0 0 −1 0 0 −1 −4 0 1 0 −1 −2 −3 −1
1
a1 a0 a2 a0
(6.49)
uckgef¨ uhrten Systems Zu den gew¨ unschten Nullstellenlagen s1 = −1, s2 = −2 des r¨ geh¨ oren die Polynome CLCP (s) = a0 (s + 1)(s + 2) = a0 (s2 + 3s + 2)
a0 ∈ R \ {0} .
mit
Damit ist der projektive Punkt a ∈ PR2 festgelegt:
a = a0 1 3 2
T
.
Er l¨ asst sich als Linearkombination der 6., 5. und 4. Spalte der Matrix M darstellen; denn der Vektor T zpart = a0 0 0 0 1 −1 −1 ∈ PR5 ,
erf¨ ullt (6.7), und es gilt M zpart = a. Wegen z6part = −a0 berechnet sich ein erster Wertesatz von R¨ uckf¨ uhrverst¨ arkungen zu
f part = − −
1 a0
z1part , z2part , z3part , z4part , z5part
T
= 0 0 0 1 −1
T
.
Die zu den Zeilenvektoren der Matrix M orthogonalen Vektoren bilden den Kern von M . Im Beispiel wird der Kern von M , ein dreidimensionaler Raum, aufgespannt von den Vektoren
, = 010000 , = 1 0 0 −1 1 0 .
z1 = 0 0 −1 0 0 1 z2 z3
T
T
T
6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen
307
Neben dem partikul¨ aren“ L¨ osungsvektor zpart erf¨ ullen auch alle Vektoren aus der ” Menge
Z=
3 6
part
z∈R :z=z
+
γi zi
mit
γ1 , γ2 , γ3 ∈ R und z6 = −a0 + γ1 = 0
i=1
die Bedingung (6.49). Aus der Menge Z gewinnt man ohne weiteres die Gesamtheit der R¨ uckf¨ uhrverst¨ arkungsvektoren, die die gew¨ unschte Nullstellenplatzierung bewirken, n¨ amlich
F=
f ∈ R5 : f =
0 0 0 1 −1
+ γ1
0 0 1 −1 1
+ γ2
0 −1 0 0 0
+ γ3
−1 0 0 1 −1
, γ1 = 1
.
Zur Best¨ atigung des Ergebnisses machen wir ein paar Einsetzproben:
1. F¨ ur γ1 = γ2 = γ3 = 0 erh¨ alt man f1 = f part = 0 0 0 1 −1 T
−1 −3 −2 . 2. F¨ ur γ1 = γ2 = γ3 = 10 ergibt sich f2 = −10 −10 10 1 −1
T
a2 = 9 27 18 . 3. F¨ ur γ1 = −10, γ2 = −1, γ3 = 15 wird f3 =
a3 = −11 −33 −22
T
T
T
und a1 = und daraus
−15 1 −10 26 −26
T
und
.
Die Proberechnungen zeigen, dass sich die im Vektor a zusammengefassten Koeffizienten des CLCP um konstante Faktoren unterscheiden. Man kann es hier sogar genauer sagen: Das CLCP erscheint in der Form CLCP =a0 (s2 + 3s + 2) mit dem nicht verschwindenden Vorfaktor a0 = γ1 − 1. W¨ aren im Beispiel s1 = −3 und s2 = −1 als Nullstellen des CLCP vorgeT mit beliebigem schrieben worden, so h¨ atte sich daraus zwingend a = a0 1 4 3 a0 ∈ R \ {0} ergeben. Die f¨ unfte M -Spalte ist proportional zu a, und es erscheint T auch L¨ osungen mit zpart
= 0 gezweifelhaft, ob neben zpart = −a0 0 0 0 0 1 0 6 funden worden w¨ aren.
Die Diskusssion des Beispiels hat gezeigt, dass a nicht als Punkt des (n + 1)–dimensionalen Vektorraumes Rn+1 (hier R3 ), sondern als Punkt des n–dimensionalen projektiven Raumes PRn (hier PR2 ), also als eine Gerade durch den Ursprung im Rn+1 , geometrisch zu deuten ist. Eine Vorgabe des CLCP in der monischen Darstellung CLCP = sn + b1 sn−1 + . . . + bn−1 s + bn h¨ atte zu keiner ad¨ aquaten mathematischen Problembeschreibung gef¨ uhrt. Außerdem wurde deutlich, dass der Problemkreis der Nullstellenplatzierung durch konstante R¨ uckf¨ uhrungen einer vertieften Behandlung bedarf. Nullstellenplatzierung im Falle p = n Wir untersuchen zun¨ achst den Spezialfall p = n. Die Matrix M wird zu einer (n + 1) × (n + 1)-Matrix mit nichtverschwindender Determinante. Die Grundgleichung (6.47) erscheint in der Gestalt
308
6 Beschreibung von LTI-Systemen durch Polynommatrizen
⎛
1 a1 /a0 .. .
⎛
⎞
z1 z2 .. .
⎞
⎜ ⎜ ⎟ ⎟ ⎜ ⎜ ⎟ ⎟ ⎜ ⎜ ⎟ ⎟ a = a0 ⎜ ⎟ = Mz = M ⎜ ⎟ ⎜ ⎜ ⎟ ⎟ ⎝ zn ⎠ ⎝an−1 /a0 ⎠ an /a0 zn+1
bzw.
z = M −1 a.
Es handelt sich um ein eindeutig l¨ osbares lineares Gleichungssystem. Im regelungstechnischen Kontext sind aber nur a-Vektoren mit a0 = 0 und zVektoren mit zn+1 = 0 sinnvoll. Zu einem beliebig vorgegebenen Vektor a mit a0 = 0 findet man einen eindeutig bestimmten Vektor z = M −1 a .
= 0, so gibt es einen einzigen reellwertigen R¨ uckf¨ uhrvektor f , der Falls zn+1 das CLCP-Nullstellenplatzierungsproblem l¨ ost, n¨amlich
f = −
1 zn+1
z1 , z2 , ..., zn
Andernfalls, wenn die Rechnung zn+1 = 0 liefert, existiert der gesuchte R¨ uckf¨ uhrvektor nicht. Da die Matrix M aus dem offenen System“ AP , bP hervorgeht und ” durch die R¨ uckf¨ uhrung nicht beeinflusst werden kann, muss der Entwerfer der R¨ uckf¨ uhrung gewisse Einschr¨ ankungen bei der Wahl des Wunsch-CLCP hinnehmen. Er darf keinen Vektor a w¨ ahlen, der senkrecht auf der (n + 1)-ten Zeile von M −1 steht. Setzt man yT = eTn+1 M −1 , so sind demnach CLCPW¨ unsche mit yT a = 0 durch reellwertige R¨ uckf¨ uhrungen prinzipiell nicht erf¨ ullbar. Es lassen sich M -Strukturen benennen, f¨ ur die die Orthogonalit¨atsrelation yT a = eTn+1 M −1 a = 0 nie zutrifft, und der Vektor a ∈ Rn+1 (mit a0 = 0) frei festgelegt werden darf: Wenn grad det AP = n und die Grade aller anderen p × p-Minoren kleiner als n ausfallen, dann verschwinden in der ersten M -Zeile alle Eintr¨age m0,ν T T bis auf den letzten, also nur m 0,n+1 = 0. Nun folgt aus y M = en+1 der 1 a Vektor yT = m0,n+1 0 0 . . . 0 und daraus yT a = m 0 = 0. Ein wichtigen 0,n+1
Spezialfall dieser Art bilden die Zustandsbeschreibungen von Prozessen, f¨ ur die AP (s) = sIn − A, bP = −b einzusetzen ist. Nullstellenplatzierung im Falle p > n Wir wenden uns nun dem Fall p > n zu und wollen zeigen: 1. Die Bedingung RgM = n + 1 ist nicht nur notwendig, sondern bei reellwertiger R¨ uckf¨ uhrung und m = 1 auch hinreichend f¨ ur beliebige CLCPNullstellenplatzierbarkeit.
6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen
309
2. Zu jedem gew¨ unschten CLCP kann man eine (p − n)-dimensionale L¨osungsmannigfaltigkeit von R¨ uckf¨ uhrungen f ∈ Rp finden. ¨ Satz 6.8 Dem gegebenen Ubertragungssystem (AP , bP ) ∈ (R[s])p×(p+1) mit der dynamischen Ordnung n < p wird vermittels der p × p-Minoren pν (s) = det
AP bP −eTν 0
=
n
mζν sn−ζ ,
ζ=0
vgl. (6.45) auf Seite 304, eine Matrix M ∈ R(n+1)×(p+1) zugeordnet. Gilt Rg M = n + 1 ,
(6.50)
so lassen sich durch geeignete Wahl reellwertiger R¨ uckf¨ uhrungen f ∈ Rp die Nullstellen des charakteristischen Polynoms n-ten Grades, AP bP , (6.51) CLCP = det −f T 1 in gew¨ unschter Weise platzieren. Die Mannigfaltigkeit der L¨osungen f hat die Dimension (p − n). Beweis: Der Kern von M , kerM = {z ∈ PRp : M z = 0 ∈ Rn+1 } ist ein projektiver Raum der Dimension p − n − 1 (anders ausgedr¨ uckt, ein Vektorraum der Dimension p − n). Der projektive Raum PRp l¨asst sich in zwei disjunkte projektive Teilr¨ aume zerlegen, PRp = kerM ⊕ (kerM )⊥ . F¨ ur ihre Dimension gilt (siehe z.B. [Kun97], S. 45) dim(PRp ) = dim(kerM ) + dim(kerM )⊥ + 1 = p, mithin dim(kerM )⊥ = p − dim(kerM ) − 1 = p − (p − n − 1) − 1 = n. W¨ ahlt man n + 1 (projektive) Punkte z0 , z1 , . . . , zn ∈ (kerM )⊥ derart, dass span {z0 , z1 , . . . , zn } = (kerM )⊥ , so spannen die Bildpunkte a0 = M z0 , a1 = M z1 , . . . , an = M zn wegen RgM = n + 1 den PRn auf. Da die Zeilenvektoren m0• , m1• , . . . , mn• der Matrix M von vornherein bekannt sind, bietet sich die folgende Wahl der Vektoren z0 , z1 , . . . , zn an: z0 = mT0• ,
zν = γν mT0• + mTν•
mit fixierten Beiwerten γν ∈ R f¨ ur ν = 1, . . . , n. Bei der Multiplikation mit M wird der so konstruierte n-dimensionale projektive Raum (kerM )⊥ auf
310
6 Beschreibung von LTI-Systemen durch Polynommatrizen
PRn abgebildet – und zwar umkehrbar eindeutig; denn zu einem gegebenen Punkt a ∈ PRn kann man einen korrespondierenden Punkt za ∈ (kerM )⊥ n * bestimmen, indem man den Ansatz za = αν zν in die Gleichung a = M za ν=0
einsetzt und daraus die Beiwerte α0 , α1 , . . . , αn berechnet: a = M · za = M ·
n
αν zν = M
ν=0
=M
α0 +
n ν=1
αν mTν•
ν=0
αν γν
n
mT0• +
n
+
n ν=1
αν γν mT0• ⎛
⎜α0 + α=1 αν γν ⎟ ⎜ ⎟ ⎜ ⎟ α1 = MMT ⎜ ⎟ ⎜ ⎟ .. ⎝ ⎠ . αn ⎞⎛ ⎞ ⎛ ⎞ α0 α0 . . . γn ⎜ α1 ⎟ ⎜ α1 ⎟ ... 0 ⎟ ⎟⎜ ⎟ ⎜ ⎟ ⎜ . ⎟ =: K ⎜ .. ⎟ . . .. ⎟ ⎝ . ⎠ . . ⎠ ⎝ .. ⎠
αν mTν•
ν=1
⎛ 1 ⎜0 ⎜ = MMT ⎜. ⎝ ..
γ1 1 .. .
⎞
n *
0 0 ... 1
αn
αn
Weil die Koeffizientenmatrix K quadratisch, regul¨ar und bekannt ist, lassen sich die Beiwerte α0 , α1 , . . . , αn eindeutig berechnen. Haben wir irgendein korrespondierendes Punktepaar za ∈ PRp und a = M za ∈ PRn gefunden, so wird bei der Abbildung M : PRp → PRn die (p − n)-dimensionale Teilmannigfaltigkeit Ua := span {za , kerM } \ (kerM ) ⊂ PRp auf den Punkt a ∈ PRn abgebildet. Als brauchbare L¨osungen des Nullstellenplatzierungsproblems (6.51) kommen nur solche z ∈ Ua in Betracht, die sich in der Form zT = δ −f T , 1 mit f ∈ Rp , δ ∈ R \ {0} darstellen lassen. Die Gesamtmenge V := z ∈ Rp+1 : zT = δ −f T , 1
mit f ∈ Rp , δ ∈ R \ {0}
bildet einen (p−1)-dimensionalen projektiven Teilraum des PRp . Die Summe der Dimensionen von Ua und V ist gr¨ oßer oder gleich p; denn dim Ua + dim V = p − n + p − 1 = 2p − n − 1 ≥ p. Gem¨ aß der bekannten Dimensionsformel f¨ ur projektive Unterr¨aume (siehe z. B. [Kun97], S. 45) kann demnach die Schnittmenge von Ua und V nicht leer sein,
6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen
311
Ua ∩ V = Ø. Wir wollen aus dieser Schnittmenge die Gesamtheit aller R¨ uckf¨ uhrvektoren fa ∈ Rp , die die Nullstellenplatzierungsaufgabe AP bP = Wunsch − CLCP det −faT 1 K l¨ osen, bestimmen. Mit Hilfe von (p − n) Vektoren zK 1 , . . . , zp−n , die den Kern von M aufspannen, und des auf Seite 310 eingef¨ uhrten Vektors za k¨onnen wir die (p − n)-dimensionale Mannigfaltigkeit Ua wie folgt darstellen:
7 p−n p K γi zi , λ = 0, γa = 0 Ua = z ∈ PR : z = λ γa za + i=1
Fixiert man die (p + 1)-te Komponente der Ua -Elemente auf 1, setzt also
p−n K (6.52) γi zi,p+1 = 1, λ γa za,p+1 + i=1
dann erh¨ alt man diejenigen Vektoren z ∈ Rp+1 , die sich in der Gestalt zT = −faT , 1 notieren lassen. Wegen (6.52) h¨ angt der Vektor faT ∈ Rp von (p − n) unabh¨ angig w¨ ahlbaren Parametern ab. Damit wurde die im Satz 6.8 versprochene (p − n)-dimensionale Mannigfaltigkeit von R¨ uckf¨ uhrverst¨ arkungen fa ∈ Rp gefunden, die durch die T R¨ uckf¨ uhrung u = fa x das gew¨ unschte CLCP mit dem Koeffizientenvektor a ∈ PRn erzielen. qed. ¨ aus Beispiel 6.9 sei die Aufgabe Beispiel 6.10 F¨ur das LTI-Ubertragungssystem gestellt, alle reellwertigen R¨ uckf¨ uhrvektoren f ∈ R5 anzugeben, die die Nullstellen des CLCP bei s1 = −3 und s2 = −1 platzieren. Damit sind das charakteristische T Polynom CLCP = a0 (s + 3)(s + 1) = a0 (s2 + 4s + 3), also auch a = a0 1 4 3 bis auf einen konstanten Faktora0 ∈ R \{0} festgeschrieben. Die Gesamtheit aller b
A
f ∈ R5 , die die Beziehung det −fPT 1P = a0 (s2 + 4s + 3) f¨ ur irgendein a0 = 0 erf¨ ullen, soll ermittelt werden. Die Gleichung a = M z lautet hier
1 1 a = a0 4 = 3 3 1 T
0 0 0 −1 0 0 0 −1 −4 0 z . 0 −1 −2 −3 −1
Der Vektor za = γa 0 0 0 0 −1 0 ∈ PR5 , γa ∈ R \ {0}, gen¨ ugt diesem Gleichungssystem. Ein R¨ uckf¨ uhrvektor fa ergibt sich daraus aber noch nicht, weil die letzte Komponente von za verschwindet. Der Kern von M wird von den Vektoren
312
6 Beschreibung von LTI-Systemen durch Polynommatrizen T
T
T
zK , zK und zK aufgespannt 1 = 0 0 −1 0 0 1 2 = 0 1 0 0 0 0 3 = 1 0 0 −1 1 0 (vgl. S. 306). Damit kann man die 3-dimensionale projektive L¨ osungsmannigfaltigkeit Ua wie folgt schreiben:
Ua =
T
5
z ∈ PR : z = λ γa 0 0 0 0 −1 0
+
3
γi zK i
,
i=1
wobei − ∞ < γi < ∞, γa = 0, λ = 0 F¨ ur λγ1= 1 erhalten wir gerade diejenigen z ∈ R6 , die sich in der Gestalt zT = −faT , 1 schreiben lassen:
0 0 1 0
1
0
0
0
−1
0
0
0 −fa
=
0 + λγ2 0 + λγ3 −1 + λγa 0 1
0 0 1 −1 1 0 0 0 mit γ2 ∈ R, γ3 ∈ R, λ ∈ R \ {0}, γa ∈ R \ {0}. Die gesuchte 3-dimensionale atigt L¨ osungsmannigfaltigkeit f¨ ur fa ∈ R5 wurde gefunden. Die Einsatzprobe best¨ dies,
det
AP bP −faT 1
= γa λ(s2 + 4s + 3).
Ersichtlich ergibt sich der Vorfaktor a0 = 0, der bei der Vorgabe des CLCP offen bleibt, hier zu a0 = λγa .
6.3.1.2 Nullstellenplatzierung mittels reell-polynomialer R¨ uckf¨ uhrungen bei einem skalaren Steuereingang Die R¨ uckf¨ uhrmatrix FP wird zum p-dimensionalen Zeilenvektor fPT mit den Komponenten fP,ν (s) = fν(0) + fν(1) s + . . . + fν(gν ) sgν
f¨ ur
ν = 1, . . . , p.
Bei der Festlegung der Grade gν wollen wir uns so einschr¨anken, dass der Grad des charakteristischen Polynoms CLCP des r¨ uckgef¨ uhrten Systems mit der gegebenen dynamischen Ordnung n des offenen Systems (AP , bP ) u ¨ bereinstimmt, d. h. AP bP = n. grad CLCP = grad det −fPT 1 Oft wird dies gelingen, wenn man in der ν-ten Spalte von AP die h¨ochste vorkommende s-Potenz feststellt und dann f¨ ur gν den um 1 erniedrigten Wert ansetzt.
6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen
313
An dieser Stelle wird also bewusst darauf verzichtet, das allgemeine Problem des Reglerentwurfs in Angriff zu nehmen. Vielmehr geht es nur um die Stabilisierung eines gegebenen Prozesses (AP bP ) mit der dynamischen Ordnung n durch Verschiebung seiner n Pole mit Hilfe einer polynomialen R¨ uckf¨ uhrung u = fPT x. Im Hinblick auf eine experimentelle Realisierung der (i) R¨ uckf¨ uhrkoeffizienten fν ist vorab zu kl¨ aren, ob die zu den Bildgr¨oßen si Xν (i) geh¨ orenden Zeitsignale xν (t) zur Verf¨ ugung stehen. Das charakteristische Polynom CLCP kann nun so geschrieben werden; vgl. (6.44): p AP bP = CLCP = det fP,ν (s) · pν (s) + 1 · det AP −fPT 1 ν=1
p gν = ( fν(γν ) sγν ) · pν (s) + 1 · det AP ν=1 γν =0
Nach Einf¨ uhrung eines Z¨ ahlindex κ = κ(ν) =
*ν−1
gi + ν + γν , der mit der p * urlichen Zahlen von 1 bis k = p + gi durchl¨auft, Festlegung g0 = 0 die nat¨ i=0
i=1
und mit den Abk¨ urzungen (γν )
fν
=: zκ ,
1 =: zk+1 ,
sγν pν (s) =: det AP =:
n *
mζ,κ sn−ζ
ζ=0 n *
mζ,k+1 sn−ζ
ζ=0
erhalten wir in Analogie zu (6.47) ein System von n + 1 skalaren Gleichungen ⎛ ⎞ z1 ⎛ ⎞ ⎛ ⎞⎜ ⎟ 1 m01 . . . m0κ . . . m0,k+1 ⎜ ... ⎟ ⎜ ⎜ . ⎟ ⎜ .. ⎟ ⎜ z ⎟ ⎟ (6.53) a := a0 ⎝ .. ⎠ = ⎝ ... . . . ... . . . . ⎠ ⎜ κ ⎟ =: M · z ⎜ . ⎟ an mn1 . . . mnκ . . . mn,k+1 ⎝ .. ⎠ a0 zk+1 Auf der Basis dieses Gleichungssystems kann das Nullstellenplatzierungsproblem in der gleichen Weise diskutiert werden wie im Abschnitt 6.3.1.1. Beispiel 6.11 Verschiebliches 1-fach-Pendel ohne D¨ampfungen mit skalarer Steuergr¨ oße F : Die Bewegungsgleichungen (2.31) lauten f¨ ur N = 1, D1 = 0, d0 = 0, d1 = 0: AP BP
X U
= AP bP
X
U
=
X0 m0 s2 −m1 g −1 0 φ1 = . 2 2 −s ls − g 0 0 F
Offensichtlich gilt p = 2, m = 1. Aus (AP , bP ) lassen sich die uhe ablesen, pν (s) ohne M¨
3 2
= 3 Minoren
314
6 Beschreibung von LTI-Systemen durch Polynommatrizen p1 (s) = ls2 − g,
p2 (s) = −s2 ,
p3 (s) = m0 ls4 − g(m0 + m1 )s2 .
Die dynamische Ordnung n des Systems stimmt hier mit dem Grad von det AP = p3 (s) u ¨ berein, d. h. n = 4. Es sei gefordert, dass die Nullstellen des CLCP bei s1 = s2 = −1,
s3,4 = −2 ± j
liegen. Damit ist das Wunsch-CLCP fixiert, CLCP = a0 (s − s1 )(s − s2 )(s − s3 )(s − s4 ) = a0 (s4 + 6s3 + 14s2 + 14s + 5). Als ein erfolgversprechender Ansatz f¨ ur den R¨ uckf¨ uhrvektor fPT erscheint fPT = f1(0) + f1(1) s, f2(0) + f2(1) s
(6.54)
Hierdurch sind die Werte g1 = 1, g2 = 1 und k = g1 + g2 + 2 = 4 festgelegt. Die Matrix M gem¨ aß Gleichung (6.53) ist damit vollst¨ andig bestimmt, und sie lautet
1 6 a0 14 = 14
0 0 0 l l 0 0 −g −g 0
5
0 0 1 0 0 (0)
(0)
−f1 0 m0 l (1) −f1 1 0 0 −g(m0 +m1 ) −f2(0) . (1) 0 0 −f2 0 0 1 (1)
(0)
(1)
Die f¨ unf unbekannten Parameter a0 , f1 , f1 , f2 , f2 bolischer Form berechnen.
(6.55)
lassen sich m¨ uhelos in sym-
Die 1. Zeile liefert a0 = m0 l, (0) die 5. Zeile f1 = 5 ag0 = g5 m0 l, (1)
die die
= 14 ag0 =
14 m0 l, g (1) (1) 2. Zeile f2 = −6a0 − lf1 = −6m0 l − 14 m0 l2 und g (0) (0) 3. Zeile f2 = −(14a0 +lf1 +g(mo +m1 )) = −(14m0 l+ g5 m0 l2 +g(m0 +m1 )).
die 4. Zeile f1
Die gestellte Aufgabe der CLCP-Nulstellenplatzierung hat so eine eindeutige L¨ osung gefunden. Das Ergebnis aber l¨ asst stutzen, weil hier dem Anschein nach Summanden mit unterschiedlichen physikalischen Einheiten addiert werden. Die notierten Symbole m0 , m1 , l, g stehen jedoch nicht f¨ ur physikalische Gr¨ oßen, sondern f¨ ur die zugeh¨ orenden normierten, also auf die jeweilige physikalische Einheit bezogenen Zahlenwerte. H¨ atten wir nicht von vornherein mit normierten Gr¨ oßen gearbeitet, so m¨ ussten wir den Zeilen des Gls. (6.55) die passenden physikalischen Einheiten zuweisen, n¨ amlich [a0 ] = N sec2 , [a1 ] = N sec, [a2 ] = N, [a3 ] = N sec−1 , [a4 ] = N sec−2 . Daraus folgen die richtigen physikalischen Einheiten der R¨ uckf¨ uhrverst¨ arkungen zu (0) (1) (0) (1) [f1 ] = N m−1 , [f1 ] = N m−1 sec, [f2 ] = N, [f2 ] = N sec. Der Ansatz (6.54) lieferte im Gls. (6.55) eine Koeffizientenmatrix M , die gew¨ ahrleistet, dass Tf¨ur jedes gew¨unschte CLCP und damit f¨ur jede linke Seite eine eindeutige Realisierung der Koeffizienten a0 1, α1 , α2 , α3 , α4
uckf¨ uhrvektors, der das Nullstellenplatzierungs−f1(0) , −f1(1) , −f2(0) , −f2(1) des R¨ problem l¨ ost, gefunden werden kann.
6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen Ein zweiter Ansatz fPT = f1(0) + f1(1) s + f1(2) s2 , f2(0)
315
h¨ atte auf das Gleichungssystem
1 α1 α a0 = 2 α3
0 0 l 0 −g
α4
0 l 0 −g 0
l 0 −g 0 0
(0)
−f1 0 m0 l (1) −f1 0 0 (2) 1 −g(m0 + m1 ) −f1 −f (0) 0 0 2 0 0 1
gef¨ uhrt. Ersichtlich k¨ onnten jetzt nur solche Wunsch-CLCP realisiert werden, f¨ ur die gilt: α1 a1 −l = = . α3 a3 g Mit dem zweiten Ansatz kann das System gewiss nicht stabilisiert werden. Ein dritter Ansatz fPT = f1(0) + f1(1) s + f1(2) s2 , f2(1) s ergibt das Gleichungssystem
1 α1 α = a0 2 α3 α4
0 0 l 0 −g
0 l 0 −g 0
l 0 −g 0 0
−f10 0 m0 l (1) −f1 1 0 (2) 0 −g(m0 + m1 ) −f1 . 0 0 −f2(1) 0 0 1
Jetzt k¨ onnen die CLCP-Nullstellen wieder beliebig platziert werden. Wegen det M = g 3 m1 l existiert die Inverse M −1 , und es gilt
(0) −f1 1 (1) α −f 1 1 1(2) −1 M α2 = −f1 α3 a0 −f2(1) α4
1 (0)
(1)
(0)
(1)
Die f¨ unf unbekannten Parameter a0 , f1 , f1 , f2 , f2 bolischer Form ermitteln: 1 (0) f = g1 α4 , Die 5. Zeile liefert a0 1 1 (1) f = 1g α3 , a0 1 (1) liefert a10 f2 = −α1
lassen sich wieder in sym-
die 4. Zeile liefert und die 2. Zeile
− gl α3 .
Aus der 1. und 3. Zeile erh¨ alt man schließlich sowie
1 (2) f a0 1 1 a0
0 = −1 +m l a0 −1 = m1 g (α2 +
g l
+ gl α4 ) .
316
6 Beschreibung von LTI-Systemen durch Polynommatrizen
6.3.1.3 Nullstellenplatzierung mittels reellwertiger R¨ uckf¨ uhrungen bei einem mehrkomponentigen Steuereingang ¨ Besitzt das LTI-Ubertragungssystem (6.36) einen m-komponentigen Steuereingang mit m > 1, so l¨ asst sich an Gleichung (6.43) ankn¨ upfen, a1 n−1 an−1 an n CLCP(s) = a0 s + s + ...+ s+ a0 a0 a0 N AP (s) BP (s) = ±pν (s) · zν . = det −F Im ν=1
Ganz analog zum Fall m = 1, der im Unterabschnitt 6.3.1.1 ausf¨ uhrlich behandelt wurde, kann das Nullstellenplatzierungsproblem eingebettet werden in das umfassendere mathematische Problem der L¨osung des Gleichungssystems ⎛ ⎞ ⎛ ⎞⎛ ⎞ m01 m02 . . . m0N z1 1 ⎜ a1 /a0 ⎟ ⎜ m11 m12 . . . m1N ⎟ ⎜ z2 ⎟ ⎜ ⎟ ⎜ ⎟⎜ ⎟ a = a0 ⎜ . ⎟ = ⎜ . (6.56) .. . . . ⎟ ⎜ . ⎟ = Mz , ⎝ .. ⎠ ⎝ .. . .. ⎠ ⎝ .. ⎠ . an /a0
mn1 mn2 . . . mnN
zN
wobei RgM = n + 1. Verglichen mit dem Fall m = 1 hat sich die Anzahl n + 1 der skalaren Gleichungen nicht ver¨ andert, doch der Vektor z ist l¨anger geworden. Er besteht aus N = ( m+p Rg M = n + 1 gibt es m ) Komponenten. Wegen N − n − 1 linear unabh¨ angige L¨ osungen z1 , z2 , . . . , zN −n−1 des homogenen Gleichungssystems M z = 0 ∈ Rn+1 . Sie spannen den Kern von M auf, kerM = span {z1 , z2 , . . . , zN −n−1 } . Haben wir irgendein korrespondierendes Punktepaar za ∈ PRN −1 und a = M za ∈ PRn gefunden, so wird bei der Abbildung M : PRN −1 → PRn die (N −n−1)-dimensionale Teilmannigfaltigkeit Ua := span {za , kerM }\kerM ∈ PRN −1 auf den Punkt a ∈ PRn abgebildet. ¨ Ahnlich wie im Falle m = 1 kann man auch f¨ ur m > 1 zeigen, dass die alt, deren letzte Komponente zN nicht Menge Ua stets solche Elemente z enth¨ verschwindet. Die im Falle m = 1 angeschlossene Folgerung auf brauchbare reellwertige R¨ uckf¨ uhrungen, die die gew¨ unschte CLCP-Nullstellenplatzierung bewirken, l¨ asst sich jedoch nicht auf den Fall m > 1 u ¨ bertragen. Im Unterabschnitt 6.3.1.1 konnten wir aus der Menge {z : z ∈ Ua mit zN = zp+1 = 0} ohne weiteres auf die Gesamtheit der gesuchten R¨ uckf¨ uhrvektoren f ∈ T RN −1 = Rp schließen, weil f = − z1 , z2 , . . . , zp galt. Im Falle m > 1 liegt ein komplizierterer Zusammenhang zwischen den N = ( p+m uckf¨ uhrverst¨arkungen, d. h. den m )Komponenten von z und den R¨
6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen
317
Elementen der (m × p)-Matrix F , vor. Die Komponenten zν (ν = 1, . . . , N ) wurden auf S. 303 eingef¨ uhrt als (m × m)-Minoren der m × (p + m)Matrix −F, Im . Beispielsweise w¨ urde im Falle m = 2 die Komponente z1 – abgesehen vom Vorzeichen – folgendermaßen aussehen: −f11 −f12 z1 = det = f11 f22 − f12 f21 . −f21 −f22 Zwischen den Komponenten des Vektors z bestehen nichtlineare Abh¨angigkeiten. Ihre Betrachtung geh¨ orte zu den klassischen Untersuchungsgegenst¨anden der algebraischen Geometrie. F¨ ur den geometrischen Ort aller zul¨assigen z ∈ RN , der eine Teilmannigfaltigkeit im projektiven Raum PRN −1 bildet, wurde der Name Grassmannsche Mannigfaltigkeit gepr¨agt, zu Ehren des Stettiner Gymnasiallehrers Hermann Grassmann (1809 - 1877). Die Abbildungsvorschrift, gem¨ aß der der Vektor z aus der zeilenregul¨aren Matrix Z = −F, Im entsteht, wird als Pl¨ ucker sche Abbildung bezeichnet, und die Komponenten von z nennt man Pl¨ ucker-Koordinaten der Matrix Z, zu Ehren des Bonner Professors Julius Pl¨ ucker (1801 - 1868). In den 1990er Jahren wurde erkannt, dass das seit Jahrzehnten immer wieder gestellte, aber ungel¨ ost gebliebene Problem der CLCP-Nullstellenplatzierung durch reellwertige R¨ uckf¨ uhrungen [Won67], [Dav70], [Kim75] f¨ ur mehrvariable LTI-Systeme mit den Werkzeugen der algebraischen Geometrie erfolgreich bearbeitet werden kann [LK95], [Wan96]. Es w¨ urde den Rahmen dieses Abschnitts sprengen, wenn wir das erforderliche mathematische R¨ ustzeug, das nicht zur tradierten Ingenieurmathematik geh¨ort, im Detail ¨ vorstellen wollten. Interessierte Leser seien auf unseren Ubersichtsaufsatz [RF04] hingewiesen. Bei einem LTI-System der dynamischen Ordnung n mit Steuersignalen u(t) ∈ Rm und weiteren Systemsignalen x(t) ∈ Rp stehen bei reellwertiger R¨ uckf¨ uhrung u = F x grunds¨ atzlich alle m · p Eintr¨age der Matrix F zur Verf¨ ugung, um das charakteristische Polynom des r¨ uckgef¨ uhrten Systems zu beeinflussen. Bei vielen Anwendungen wird die Zahl m · p der einstellbaren R¨ uckf¨ uhrverst¨ arkungen viel gr¨ oßer ausfallen als die dynami¨ sche Ordnung n des Ubertragungssystems, die wiederum mit dem Grad des CLCP u unschte ¨ bereinstimmt. Es liegt nahe zu fragen, ob sich die gew¨ CLCP-Nullstellenplatzierung nicht auch mit weniger als m · p R¨ uckf¨ uhrverst¨ arkungseinstellungen erreichen l¨ asst. Wenn es dabei gel¨ange, das zugeh¨ orende Gleichungssystem (6.56) so aufzustellen, dass die m × m-Minoren zν (ν = 1, . . . N = ( p+m m )) nur in einfacher linearer Weise von den einstellbaren R¨ uckf¨ uhrverst¨ arkungen abhingen, dann w¨ urden Kenntnisse der algebraischen Geometrie und darauf aufbauende komplizierte Berechnungen zur CLCP-Nullstellenplatzierung nicht ben¨ otigt. Nat¨ urlich darf die Anzahl der unabh¨ angig w¨ ahlbaren R¨ uckf¨ uhrverst¨ arkungen auch nicht zu klein sein. Jede Wunsch-CLCP-Nullstellenplatzierung ist gleichbedeutend mit der Vorgabe eines Koeffizientenvektors
318
6 Beschreibung von LTI-Systemen durch Polynommatrizen
aT = a0 1
a1 a2 a0 a0
an a0
...
= a0 1 α1 α2 . . . αn
mit a0 ∈ R \ {0},
d. h. der Wunsch-Vorgabe von n reellen Zahlen αν = aaν0 f¨ ur ν = 1, . . . , n. Folglich reichen weniger als n unabh¨ angig w¨ ahlbare R¨ uckf¨ uhrverst¨arkungen gewiss nicht aus, um die CLCP-Nullstellenplatzierungsaufgabe generell zu l¨ osen. Wir wollen die Verh¨ altnisse f¨ ur p ≥ n n¨ aher betrachten und zeigen, wie man auch bei mehrkomponentigen Steuereing¨angen, also f¨ ur m > 1, die Erkenntnisse, die im Unterabschnitt 6.3.1.1 f¨ ur Systeme mit m = 1 hergeleitet wurden, nutzen kann. Wenn die m × p-R¨ uckf¨ uhrmatrix F in der dyadischen Struktur f T F =g
mit einem fixierten Vektor
∈ Rm g
angesetzt wird, und nur die Elemente von f ∈ Rp als frei w¨ahlbare R¨ uckf¨ uhrverst¨ arkungen konzipiert sind, dann haben die m × m-Minoren zν der m × (p + m)-Matrix Z = −F, Im bemerkenswerte Eigenschaften: Einer der Minoren ergibt sich aus det Im = 1. Insgesamt p · m Minoren entstehen aus m × m-Teilmatrizen, die genau eine F -Spalte enthalten. Jeder dieser Minoren h¨angt linear von genau einer R¨ uckf¨ uhrverst¨ arkung ab. Beispielsweise kommt die R¨ uckf¨ uhrverst¨arkung fi in den m Minoren vor, die aus der i−ten Spalte von F und jeweils m − 1 Spalten von Im hervorgehen. Wurde die µ-te Spalte von Im nicht benutzt, so ergibt sich der Minor zu gfi e1 . . . eµ−1 eµ+1 . . . em det − fi eµ+1 . . . em = (−1)µ = (−1)µ det e1 . . . eµ−1 g gµ fi . Die u ¨ brigen m × m-Minoren von Z enthalten zwei (oder mehr) F -Spalten. Diese sind zueinander proportional. Folglich verschwindet jeder einzelne dieser u agt ( p+m ¨ brigen Minoren. Ihre Anzahl betr¨ m )−m·p−1 . T f sichert, dass die Komponenten Fazit: Der Ansatz F = g des Vektors z, die oben als Pl¨ ucker -Koordinaten der Matrix Z = −F, Im bezeichnet wurden, linear von den R¨ uckf¨ uhrverst¨ arkungen f1 , f2 , . . . , fp abh¨angen. ¨ Mithin erscheint es erfolgversprechend, die Uberlegungen des Unterabschnitts 6.3.1.1 auf den jetzt betrachteten Fall mit m > 1 Steuergr¨oßen zu u ¨ bertragen. Wir wollen dies f¨ ur eine etwas allgemeinere F -Struktur tun, n¨amlich f T F = F + g
mit festen
F ∈ Rm×p ,
Die Gleichungen des r¨ uckgef¨ uhrten Systems
∈ Rm . g
6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen u(t) ∈ Rm
319
x(t) ∈ Rp
LTI-System
−F = −F − gf T ¨ Bild 6.5. Ubertragungssystem mit R¨ uckf¨ uhrmatrix F = F + gf T ∈ Rm×p
−F
u(t) ∈ Rm
x(t) ∈ Rp
LTI-System
g
uhilf (t) ∈ R
Bild 6.6.
−f T
Ersatz¨ ubertragungssystem (gestrichelt gerahmt) mit skalarer Steuergr¨ oße uhilf .
BP AP f T Im −F − g
α0 X = U 0
lassen sich durch Einf¨ uhrung eines skalaren Hilfssteuersignals uhilf (t) := f T x(t) auf die Form
X α !0 AP + BP F BP g = Uhilf 0 −f T 1
(6.57)
bringen. Diese Umdeutung des MI-Systems zu einem SI-System kann auch leicht im regelungstechnischen Wirkungsplan vorgenommen werden (siehe Bilder 6.5 und 6.6). Setzt man im Gleichungssystem (6.57) !p , AP + BP F =: A
!P , =: b BP g
320
6 Beschreibung von LTI-Systemen durch Polynommatrizen
¨ so erreicht man formal eine v¨ ollige Ubereinstimmung mit der Ausgangssituation des Unterabschnitts 6.3.1.1. Dort galt jedoch eine Generalvoraussetzung: Das Paar AP , bP durfte keinen Linksteiler L mit grad det L ≥ 1 besitzen. Hier kann a priori nur vorausgesetzt werden, dass das gegebene Paar AP , BP linksteilerfremd ist. Dies impliziert nicht die Linksteilerfremdheit ! P . Wenn insbesondere Rg AP (s0 ) ≤ p − 2 f¨ des Paares AP , b ur irgend ! P gewiss nicht steuerbar. Durch geeignete ein s0 ∈ C, wird das Paar AP , b Festlegung vonF ∈Rm×p hat man dann daf¨ ur Sorge zu tragen, dass das ! ! Paar AP , bP = AP + BP F , BP g linksteilerfremd wird. Nach diesen Vorbereitungen kann die Aufgabe der CLCP-Nullstellenplatzierung wie im Unterabschnitt 6.3.1.1 gel¨ ost werden. 6.3.2 Rekonstruktion nicht gemessener Systemgr¨ oßen und beobachterbasierte R¨ uckf¨ uhrung Im Abschnitt 6.2.1, Gleichung (6.6), wurde festgehalten, wie sich die Ausgangssignale y(t) ∈ Rr aus den Eingangssignalen u(t) ∈ Rm und Anfangswerten bestimmen. Im Bildbereich gilt −1 Y = −β0 + CP A−1 P α0 − CP AP BP · U + DP · U .
Unter der Annahme β0 = 0,
α0 = 0,
DP = 0
vereinfacht sich diese Beziehung zu Y = −CP A−1 P BP · U . Die Eingangssignale u(t) ∈ Rm und die Ausgangssignale y(t) ∈ Rr stehen f¨ ur eine weitere Datenverarbeitung zur Verf¨ ugung, w¨ahrend die Systemsignale x(t) ∈ Rp in ihrer Gesamtheit nicht zug¨ anglich sind. Wir fragen, ob die Signa¨ le u und y in einem zweiten, zweckm¨ aßig aufgebauten Ubertragungssystem so verarbeitet werden k¨ onnen, dass der nicht zug¨angliche Signalvektor x(t) wenigstens n¨ aherungsweise ermittelt werden kann. Die Frage l¨asst sich unter bestimmten Umst¨ anden bejahen. Das zur Rekonstruktion von x aufgebaute System wird dann in der regelungstechnischen Fachsprache als Beobachter bezeichnet. Im Bild 6.7 wurde eine m¨ ogliche Beobachterstruktur skizziert. Durch Nachrechnen wollen wir uns davon u ¨ berzeugen, dass mit dem skizzierten Schema die Aufgabe gel¨ ost werden kann. Aus dem Bild l¨asst sich ablesen: ! = A−1 (−BP · U + HP (Y − Y)) ! . X P Gemeinsam mit den Beziehungen X = −A−1 P BP U, Y = CP X, denen der gesuchte Vektor x(t) ∈ Rp gen¨ ugt, folgt u ¨ ber
6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen
321
¨ gegebenes Ubertragungssystem y(t) ∈ Rr
u(t) ∈ Rm
− CP A−1 P BP
Beobachter
HP
ˆ y
CP
A−1 P
−BP
ˆ (t) ∈ Rp x ¨ Bild 6.7. Gegebenes Ubertragungssystem mit hinzugef¨ ugtem Beobachter
! = A−1 (−BP U + BP U − HP (Y − Y)) ! = −A−1 HP CP (X − X) ! X−X P P (6.58) ! (t) im Bildbereich, die maßgebliche Gleichung f¨ ur den Differenzvektor x(t)− x n¨ amlich das homogene polynomiale Gleichungssystem ! =0. (AP + HP CP )(X − X)
(6.59)
Im Zeitbereich handelt es sich um ein autonomes Differentialgleichungssystem ! (0) konf¨ ur den Differenzvektor. Unabh¨ angig von den Anfangswerten x(0)− x !(t) vergiert der Differenzvektor exponentiell gegen den Nullvektor und damit x gegen x(t) genau dann, wenn die Nullstellen der Determinante T AP CPT AP −HP det(AP + HP CP ) = det = det (6.60) CP Ir −HPT Ir ausnahmslos einen negativen Realteil haben. Die Matrizen AP und CP sind ¨ aus dem gegebenen Ubertragungssystem zu identifizieren und daher im Kontext des Beobachterentwurfs als bekannt anzusehen. Die Injektionsmatrix HP muss vom entwerfenden Ingenieur in geeigneter Weise festgelegt werden. Mathematisch handelt es sich bei der Festlegung der Nullstellen des Beobachterpolynoms (6.60) um eine gleichartige Aufgabe, wie sie im Abschnitt 6.3.1 als CLCP-Nullstellenplatzierungsaufgabe behandelt wurde: An die Stelle der Linksteilerfremdheit des Paares (AP , BP ) im Abschnitt 6.3.1 tritt jetzt die Linksteilerfremdheit des Paares (ATP , CPT ), d. h. die Rechts-
322
6 Beschreibung von LTI-Systemen durch Polynommatrizen
P teilerfremdheit des Paares A CP . Im Falle der Nichtbeobachtbarkeit im Sinne des Abschnitts 6.2.4 l¨ asst sich im allgemeinen kein Beobachter entwerfen. AP Wenn die notwendige Bedingung der Rechtsteilerfremdheit des Paares erf¨ ullt ist, kann man in Analogie zum Abschnitt 6.3.1 die Frage nach CP der Nullstellenplatzierbarkeit des Beobachterpolynoms mit Hilfe polynomialer Injektionsmatrizen HP , insbesondere f¨ ur reellwertige H, er¨ortern. Die dort gewonnenen Ergebnisse lassen sich ohne besondere M¨ uhe u ¨ bertragen. Im Falle eines skalaren Ausgangs, also f¨ ur r = 1, hat beispielsweise der Satz 6.8 die folgende Entsprechung: A Satz 6.9 Dem gegebenen Matrizenpaar cTP ∈ R[s](p+1)×p mit der dynaP mischen Ordnung n < p wird vermittels der p × p-Minoren n AP eν = det mζν sn−ζ cTP 0 ζ=0
eine Matrix M ∈ R(n+1)×(p+1) zugeordnet. Gilt RgM = n + 1, so lassen sich durch geeignete Wahl reellwertiger Injektionen h ∈ Rp die Nullstellen des Beobachterpolynoms (mit b0 ∈ R \ {0}) T b1 bn AP cP AP −h = det = det b0 sn + sn−1 + . . . + cTP 1 −hT 1 b0 b0 in gew¨ unschter Weise platzieren. Die Mannigfaltigkeit der L¨osungen h hat die Dimension (p − n). !(t) kann anstelle des nicht Der im Beobachter erzeugte N¨ aherungsvektor x zur Verf¨ ugung stehenden Signalvektors x(t) zur gezielten R¨ uckf¨ uhrung genutzt werden, um die Nullstellen des charakteristischen Polynoms des so entstandenen r¨ uckgef¨ uhrten Systems in gew¨ unschter Weise zu platzieren. Das Bild 6.8 zeigt den Aufbau des r¨ uckgef¨ uhrten Systems. Ein erster Blick auf den Signalwirkplan l¨ asst vermuten, dass das Einschwingverhalten des Signal¨ vektors x sowohl von FP als auch von HP abh¨angt. Uberraschenderweise ! – man spricht von wird das Einschwingverhalten des Differenzvektors x − x der Dynamik des Beobachters“ – allein durch die Wahl von HP bestimmt, ” w¨ ahrend das Einschwingverhalten des nicht gemessenen Vektors x nur durch die R¨ uckf¨ uhrmatrix FP festgelegt wird. Diese bemerkenswerte Separation der Dynamik des Gesamtsystems mit seinem Gesamtsystemgr¨oßenvektor x ∈ R2p ! x in Beobachterdynamik“ und Restsystemdynamik“ 7 ist leicht nachzuweisen: ” ” Die oben notierte Gleichung (6.59), 7
Die u uhrende Bezeichnung R¨ uckf¨ uhrdynamik“ wird hier ver¨ bliche, aber irref¨ ” mieden, vgl. die Erl¨ auterungen nach (6.62).
6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen
323
¨ gegebenes Ubertragungssystem y(t) ∈ Rr
u(t) ∈ Rm
− CP A−1 P BP
Beobachter HP
ˆ y
A−1 P
CP
−BP
ˆ (t) ∈ Rp x
FP
beobachterbasierter R¨ uckf¨ uhrungsblock Bild 6.8.
¨ Eingangs-Ausgangs-Ubertragungssystem R¨ uckf¨ uhrung
mit
beobachterbasierter
! = −HP CP (X − X) ! AP (X − X) erg¨ anzen wir um die Beziehung ! AP X = −BP FP X. Zusammengeschrieben ergibt dies X AP + BP FP −BP FP 0 = ! 0 0 AP + HP CP X−X
(6.61)
Die Dreiecksstruktur der 2p × 2p-Polynommatrix macht die behauptete Separationseigenschaft offenbar. Das charakteristische Polynom des Gesamtsystems besteht aus zwei Faktoren det(AP + BP FP ) und
det(AP + HP CP ) ,
von denen der erste nur von FP , der zweite nur von HP abh¨angt. Von besonderem Interesse sind auf Grund ihrer einfachen Realisierbarkeit nat¨ urlich reellwertige Injektionsmatrizen, d. h. HP = H ∈ Rp×r , und reellwertige R¨ uckf¨ uhrmatrizen, d. h. FP = F ∈ Rm×p . Unter dieser Annahme
324
6 Beschreibung von LTI-Systemen durch Polynommatrizen
¨ k¨ onnen die Uberlegungen der Unterabschnitte 6.3.1.1 und 6.3.1.3 aufgegriffen und fortgef¨ uhrt werden. Dieser Gedankengang soll hier nicht im Detail entwickelt werden. Abschließend sei mit Blick auf das Bild 6.8 nur angemerkt, dass man den beobachterbasierten R¨ uckf¨ uhrungsblock in seiner Gesamtheit als dynamische Ausgangsr¨ uckf¨ uhrung, die eine gew¨ unschte Nullstellenplatzierung des CLCP ¨ bewirkt, interpretieren kann. Die Ubertragungsmatrix von Y nach U kann aus dem Bild 6.8 abgelesen werden. Wir folgen dazu den Signalwegen vom Eintritt des Signals y in den R¨ uckf¨ uhrungsblock bis zum Austritt des Signals u aus dem R¨ uckf¨ uhrungsblock und modifizieren die zeichnerische Darstellung des R¨ uckf¨ uhrungsblockes. Aus Bild 6.9 entnehmen wir den folgenden
A−1 P H P CP
y(t)
HP
A−1 P
Ir
x ˆ(t)
FP
u(t)
A−1 P BP FP Bild 6.9. Beobachterbasierter R¨ uckf¨ uhrungsblock
¨ Ausdruck f¨ ur die Ubertragungsmatrix, & '−1 −1 −1 AP HP . Gu y (s) = FP Ip + AP (BP FP + HP CP ) Daraus erhalten wir schließlich −1 Gu HP . y (s) = FP (AP + BP FP + HP CP )
(6.62)
Das charakteristische Polynom CLCP des geregelten Systems (dargestellt im Bild 6.8) kann aus (6.61) entnommen werden, CLCP = det(AP + BP FP ) · det(AP + HP CP ). Es wurde gezeigt, dass sich durch geeignete Wahl von FP und HP die Nullstellen des CLCP in gew¨ unschter Weise platzieren lassen, also insbesondere stets ein stabiles CLCP erzeugt werden kann. Dies impliziert jedoch nicht, dass ¨ bei stabilem CLCP der dynamische Regler“ mit der Ubertragungsmatrix ” Gu ebenfalls stabil sein m¨ u sste. Bei instabilen Streckenmodellen ergibt sich y oft zwangsl¨ aufig ein instabiler beobachterbasierter R¨ uckf¨ uhrungsblock, wie im Abschnitt 5.4.3 bewiesen wurde.
6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen
325
Beispiel 6.12 Verschiebliches unged¨ampftes 1-fach-Pendel mit skalarer Steuer¨ ist gr¨ oße F und sklalarer Ausgangsgr¨ oße x0 . Das Modell des Ubertragungssystems aus Beispiel 6.11 bekannt, AP BP
X U
= AP bP
X U
X0 m0 s2 −m1 g −1 0 Φ = , 2 2 −s ls − g 0 0 F
=
Y = cTP X + dP · U = 1 0
X0 Φ
= X0 .
¨ ¨ Das Ubertragungsystem hat die dynamische Ordnung n = 4. Seine Ubertragungs¨ matrix vereinfacht sich wegen m = r = 1 zur Ubertragungsfunktion T −1 0 GX F (s) = −cP AP bP =
s2
(m0
ls2 − g . − (m0 + m1 )g)
ls2
Um die Ergebnisse des Beispiels 6.11 verwenden zu k¨ onnen, w¨ ahlen wir die WunschLagen der 2n = 8 Nullstellen des CLCP wie folgt: s1 = s2 = −1 ,
s3,4 = −2 ± j ,
s5 = s6 = −4 ,
s7 = s8 = −6 ;
und zwar det(AP + bP fPT ) = a0 (s − s1 )(s − s2 )(s − s3 )(s − s4 ) = a0 (s4 + 6s3 + 14s2 + 14s + 5) , det(AP + hP cTP ) = b0 (s − s5 )(s − s6 )(s − s7 )(s − s8 ) = b0 (s4 + 20s3 + 148s2 + 480s + 576) . Im Beispiel 6.11 wurde vorgerechnet, dass der Ansatz
fPT = f1(0) + f1(1) s , f2(0) + f2(1) s
(0)
(1)
(0)
(1)
auf die folgenden Beziehungen f¨ ur die Parameter a0 , f1 , f1 , f2 , f2 a0 = m0 l ,
= 5m0
(0)
= −14m0 l − 5m0
f2
(1)
f2 Mit dem Ansatz
l , g
(0)
f1
(1)
f1
= 14m0
l , g
l2 − g(m0 + m1 ) , g l2 = −6m0 l − 14m0 . g
(1) (0) (1) hTP = h(0) 1 + h1 s , h2 + h2 s
berechnen wir aus der polynomialen Bestimmungsgleichung
det(AP + hP cTP ) = det
(1)
(0)
m0 s2 + h1 s + h1 (1)
(0)
−s2 + h2 s + h2
−m1 g
ls2 − g
= b0 (s4 + 20s3 + 148s2 + 480s + 576)
f¨ uhrt:
326
6 Beschreibung von LTI-Systemen durch Polynommatrizen (0)
(1)
(0)
(1)
die Parameter b0 , h1 , h1 , h2 , h2 durch Koeffizientenabgleich nach s-Potenzen: (0)
b0 = m 0 l ,
h1 = 148m0 + (m0 + m1 ) (0)
h2 =
m0 m1
(1)
h2 = 20
576
m0 m1
g , l
(1)
h1 = 20m0 ,
l m1 + 148 + 1 + g m0
1 + 24
l g
g l
,
.
¨ uckf¨ uhrblockes ist damit Die Ubertragungsfunktion GF X0 des beobachterbasierten R¨ vollst¨ andig bestimmt,
T GF AP + bP fPT + hP cTP X0 (s) = fP
−1
hP .
Das Nennerpolynom sei noch in symbolischer Form angegeben,
(1)
(1)
m0 ls4 + l h1 − f1
(1)
− f2
s3
2 s (1) (1) (0) (1) (1) (0) h1 − f1 + h2 f2 + h2 f2 + m1 g s (0) (0) (0) (0) (0)
(0)
+ −(m0 + m1 )g + l h1 − f1 + −g
(0)
− f2
− g h1 − f1
(1)
(1)
+ h2 f2
+ h2
f2
+ m1 g
.
Dieses Polynom ist instabil, denn der s4 -Koeffizient und der s0 -Koeffizient sind vorzeichenverschieden, und zwar f¨ ur alle denkbaren Realisierungen der Parameter m0 , m1 , l, g. Fixiert man diese Parameter beispielsweise auf die normierten Werte m0 = 3 ,
m1 = 0.3 ,
l = 0.5 ,
g = 9.81 ,
¨ so ergibt sich als Ubertragungsfunktion der dynamischen R¨ uckf¨ uhrung GF X0 (s) =
−9316s4 − 93060s3 − 230956s2 + 1600s + 440.4 . s4 + 26s3 − 2802s2 − 28797s − 70713
Diese gebrochen rationale Funktion hat ihre Nullstellen bei −5.348, −4.648, 0.04679, −0.04065 und ihre Pole bei 47.11, −4.43, −5.35, −63.33. Der als Beispiel betrachtete dynamische R¨ uckf¨ uhrungsblock ist demnach proper, instabil und nicht minimalphasig.
6.3.3 Strecker-Nyquist-Kriterium f¨ ur den MIMO-Standardregelkreis Bild 6.10 zeigt den MIMO-Standardregelkreis. Mit der Festlegung der Dimension der unabh¨ angig voneinander agierenden exogenen Signalvektoren r(t) ∈ Rr und z(t) ∈ Rm sind auch die L¨ angen aller inneren Signalvekto¨ ren fixiert, ebenso die Dimensionen der Ubertragungsmatrix der Regelstrecke ¨ P ∈ (R[s])r×m und der Ubertragungsmatrix des Reglers K ∈ (R[s])m×r .
6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen
327
z r
e
K
v
u
P
y
Bild 6.10. MIMO-Standardregelkreis
6.3.3.1 Charakteristisches Polynom f¨ ur MIMO-Regelkreise Bei der Definition des charakteristischen Polynoms des SISO-Regelkreises im Abschnitt 4.3 auf Seite 173 war von teilerfremden Darstellungen der ¨ rationalen Ubertragungsfunktionen P (s) und K(s) ausgegangen und eine ¨ Ubertragungsfunktion Go (s) = P (s) · K(s) = K(s) · P (s) des offenen Kreises definiert worden. Beim MIMO-Regelkreis verwenden wir anstelle von Quotienten teilerfremder Polynome teilerfremde polynomiale Matrizenbruchdarstellungen (Mbd) der Strecke und des Reglers. Bei der Definition des offenen Regelkreises kommen zwei sinnvolle Schnittstellen in Betracht: Trennt man den R¨ uckf¨ uhrzweig, der im Streckenausgang beginnt, vor der Summationsstelle auf, an der das exogene Signal r eintritt, so hat der verbleibende offene Kreis die ¨ Ubertragungsmatrix Go (s) = P (s) · K(s) = Gye (s) ∈ (R(s))r×r . Trennt man hingegen den Zweig, der im Reglerausgang beginnt, vor der Summationsstelle auf, an der das exogene Signal z eintritt, so hat – von der Vor¨ zeichenumkehr abgesehen – der verbleibende offene Kreis die Ubertragungsmatrix ! o (s) = K(s) · P (s) = Gvu (s) ∈ (R(s))m×m . G !o (s) spielen in der Determi¨ Die beiden Ubertragungsmatrizen Go (s) und G nante der Regelkreisgleichungen (4.1) eine gleichberechtigte Rolle,8 Im −K ! o ). = det(Ir + Go ) = det(Im + G det (6.63) P Ir Gegeben seien teilerfremde polynomiale rechte Mbd der Strecke und des Reglers, P = ZP NP−1
und
−1 K = ZK · NK .
(6.64)
¨ Dann besitzen die Elemente der Ubertragungsmatrix des geschlossenen Kreises 8
Beweis mit Schur scher Determinantenformel
328
6 Beschreibung von LTI-Systemen durch Polynommatrizen
−1 −1 Im −K NP −ZK NP 0 = P Ir 0 NK ZP NK das gemeinsame Nennerpolynom NP −ZK = det NP · det(NK + ZP NP−1 ZK ) det ZP NK −1 ) = det NP · det NK · det(Ir + ZP NP−1 · ZK NK
= det NP · det NK · det(Ir + Go ).
(6.65)
Infolge der vorausgesetzten teilerfremden Mbd (6.64) haben die (m + r)2 Z¨ahlerpolynome, die als Eintr¨ age in der Polynommatrix NP −ZK NP 0 0 NK ZP NK adj erscheinen, keine gemeinsame Nullstelle mit dem Polynom (6.65). Daher ist allein das gemeinsame Nennerpolynom f¨ ur die Stabilit¨at des MIMORegelkreises maßgebend. Man nennt es das charakteristische Polynom CLCP des MIMO-Regelkreises, CLCP := det NP · det NK · det(Ir + Go ).
(6.66)
W¨ aren Strecke und Regler in Gestalt teilerfremder linker Mbd gegeben gewesen, also −1 Z P P =N P
und
−1 · ZK , K=N K
so h¨ atten analoge Umformungen zu dem Schluss gef¨ uhrt, dass das CLCP wie folgt zu definieren sei:
K −Z K N P · det N K · det(Im + G !o ). = det N CLCP = det P ZP N Das widerspr¨ ache nicht der Festlegung (6.66); denn einerseits gilt (6.63) und P andererseits wurde im Abschnitt 6.2.3 gezeigt, dass sich det NP und det N bzw. det NK und det NK jeweils nur um einen reellwertigen Faktor unterscheiden k¨ onnen. 9 ¨ Die vorstehenden Uberlegungen begr¨ unden den Satz 6.10 Der MIMO-Standardregelkreis ist genau dann stabil, wenn sein charakteristisches Polynom CLCP, das insbesondere durch (6.66) definiert werden kann, keine Nullstellen mit Re s ≥ 0 besitzt. 9
Auch gemischt teilerfremde Mbd von Strecke und Regler, also P = ZP NP−1 und −1 −1 K = NK ZK beziehungsweise P = NP−1 ZP und K = ZK NK , h¨ atten – bis auf einen konstanten Faktor – zum gleichen CLCP gef¨ uhrt.
6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen
329
6.3.3.2 Das Strecker-Nyquist-Kriterium f¨ ur den MIMO-Regelkreis Ausgehend von Satz 6.10 und Satz 4.2 haben wir den Nyquist-Pfad C nun so festzulegen, dass das von ihm umschlossene Gebiet G alle instabilen Nullstellen der Polynome det NP (s) und det NK (s) als innere Punkte enth¨alt, w¨ ahrend die beim stabilen MIMO-Regelkreis ohne Ausnahme stabilen Nullstellen des charakteristischen Polynoms CLCP(s) außerhalb von G bleiben. Der Nyquist-Pfad C wird nach dem gleichen Prinzip (wie im SISO-Fall in Bild 4.4 auf Seite 178 skizziert) festgelegt. Dann gilt d arc det(I + P (s)K(s)) = r ! ! d arc det(Im + K(s) · P (s)) C
C
= ! d arc CLCP(s) − ! d arc [det NP · det NK ] C C = ! d arc CLCP(s) − ! d arc det NP (s) − ! d arc det NK (s) . C
C
C
Weil der MIMO-Regelkreis genau dann stabil ist, wenn alle Nullstellen von CLCP (s) im Inneren der linken Halbebene liegen, d¨ urfen wir ! d arc CLCP(s) = 0 C
voraussetzen und das Strecker-Nyquist-Kriterium so formulieren: Satz 6.11 Liegen Strecke und Regler als teilerfremde Mbd vor, d.h. −1 · Z P und K = ZK · N −1 bzw. K = N −1 · Z K , P = ZP · NP−1 bzw. P = N P K K und bezeichnen nP bzw. nK die Anzahl der Nullstellen (unter Z¨ahlung ihrer P und det NK = β det N K Vielfachheiten) der Polynome det NP = α det N mit Re s ≥ 0, so ist der MIMO-Standardregelkreis genau dann stabil, wenn die Nyquist-Bildkurve der Funktion F (s) = det(Ir + P (s) · K(s)) = det(Im + K(s) · P (s)) den Punkt (0, j0) nicht durchl¨auft und genau (nP + nK )-mal im Gegenuhrzeigersinn umkreist. Beispiel 6.13 Die Destillationsanlagen der chemischen Verfahrenstechnik sind ein wichtiges industrielles Anwendungsfeld, auf dem sich der Regelungstechniker mit MIMO-Regelstrecken konfrontiert sieht (siehe z.B. [M¨ ul79]). Bei Temperatur- und Niveauregelungen um gew¨ unschte Arbeitspunkte haben sich LTI-MIMO-Streckenmodelle bew¨ ahrt. Der Einfachheit halber wollen wir uns hier auf m = 2 Eingangsgr¨ oßen und r = 2 Ausgangsgr¨ oßen beschr¨ anken. Beispielsweise m¨ oge es sich bei den Eingangsgr¨ oßen um die Abflussmenge und die Heizleistung am Sumpf einer Destillationskolonne handeln, w¨ ahrend als Ausgangsgr¨ oßen der Sumpfstand und die
330
6 Beschreibung von LTI-Systemen durch Polynommatrizen
Sumpftemperatur betrachtet werden. Das Streckenmodell im Bildbereich ist eine ¨ gebrochen-rationale 2 × 2−Ubertragungsmatrix P (s). Mit normierten Parameterwerten gelte
P (s) =
1 5
4 2 − s s 6 1 − s+1 s
5s 0 2 = 0 5s(s + 1) −s −1
−4 6(s + 1)
= NP−1 · ZP .
Wegen det NP = 25s2 (s + 1) handelt es sich um eine instabile 2 × 2-Regelstrecke. ¨ Einen 2 × 2-Regler mit der Ubertragungsmatrix K(s) entnehmen wir aus [Pot04]: K(s) = 5
3 2 9 5s − 3 − 4s 6s
s −
= 15s 20 3 45 25 −4 6
2 9
−1 −1 = ZK · NK
0 1
Bild des Nyquist-Pfades 250
Nyquist-Pfad
200 150
10 100
Im F (s)
50
5
0 −50
Im s
−100 −150
0
−200 −250 −250 −200 −150 −100
−50
0
50
100
150
200
250
Re F (s) Ausschnittsvergr¨ oßerung
−5 2.5 2 1.5
Im F (s)
1
−10
0.5 0
−0.5
0
5
Re s
10
−1
−1.5 −2 −2.5 −8
−6
−4
Re F (s)
−2
0
2
Bild 6.11. Nyquist-Pfad und dessen Bild zu Beispiel 6.13
ahlte Regler ebenfalls instabil. Mit Satz 4.3 l¨ asst Wegen det NK = s ist der gew¨ sich pr¨ ufen, ob der angegebene Regler den MIMO-Regelkreis stabilisiert. Dazu wird
6.3 Polynomiale MIMO-LTI-Systeme mit R¨ uckf¨ uhrungen
331
die Bildkurve der Funktion F (s) = det(I2 + P (s) · K(s)) =
(s + 3)2 (s + 2)2 s3 (s + 1)
ausgewertet. Die Anzahl nP +nK ist hier 3. Die drei instabilen Nullstellen liegen bei s = 0. Bild 6.11 zeigt den Nyquist-Pfad, der einen kleinen Bogen um die dreifache Nullstelle bei (0; j0) schl¨ agt. Der MIMO-Regelkreis ist genau dann stabil, wenn das Nyquist-Bild von F (s) den Ursprung dreimal im Gegenuhrzeigersinn umkreist. Da dies ersichtlich zutrifft, wurde der gew¨ ahlte Regler K(s) als stabilisierender Regler nachgewiesen.
Beispiel 6.14 Wir fragen, ob auch einfachere Regler den MIMO-Regelkreis aus Beispiel 6.13 stabilisieren, z. B. der Diagonalregler
50 05
K(s) =
50 05
=
Nyquist-Pfad
10 01
−1 .
Bild des Nyquist-Pfades 50
10
40
30
5
20
Im F (s)
Im s
10
0
0
−10
−5
−20
−30
−10
−40
0
2
4
6
8
−50 −50
−40
−30
−20
−10
0
10
20
30
40
50
Re F (s)
Re s
Bild 6.12. Nyquist-Pfad und dessen Bild zu Beispiel 6.14
Diesmal ist der Regler selbst stabil und nK = 0. Wegen nP + nK = 2 darf nun das Nyquist-Bild der Funktion
F (s) = det(I2 + P (s) · K(s)) = det
1+
2 s
−1 s+1
− 4s 1+
6 s
=
s3 + 9s2 + 16s + 12 s2 (s + 1)
den Ursprung nicht ber¨ uhren und muss ihn zweimal im Gegenuhrzeigersinn umkreisen, wenn s den Nyquist-Pfad einmal durchl¨ auft. Dies trifft zu, vgl. Bild 6.12.
332
6 Beschreibung von LTI-Systemen durch Polynommatrizen
6.4 LTI-Systeme in Zustandsbeschreibung Unter einer Zustandsbeschreibung eines LTI-Systems versteht man seit den 1960er Jahren in der Regelungstheorie ein mathematisches Modell der Regelstrecke in der Gestalt x˙ = Ax + Bu
(6.67a)
y = Cx + Du
(6.67b)
wobei x(t) ∈ Rn , u(t) ∈ Rm , y(t) ∈ Rr und die reellen Zahlenmatrizen A, B, C, D von passender Dimension sind. Die Gleichungen (6.67a) und (6.67b) stellen besonders gr¨ undlich studierte Spezialf¨ alle der Gleichungen (6.1) bzw. (6.4) dar. Im Bildbereich lautet die Spezialisierung AP (s) = sIn − A , CP (s) = C ,
BP (s) = −B DP (s) = D .
Die Ergebnisse der Abschnitte 6.2 und 6.3 lassen sich ohne M¨ uhe auf den Spezialfall der Zustandsbeschreibung u uber hinaus kann man ¨bertragen. Dar¨ interessante Zusammenh¨ ange, die Zustandsmodellen eigen sind, aufdecken. 6.4.1 Zustandssteuerbarkeit In Anlehnung an Definition 6.1 und Satz 6.2 erkl¨aren wir nun: Definition 6.3. Das Zustandsmodell (6.67), das durch das reelle Matrizenpaar (A, B) ∈ Rn×(n+m) bestimmt wird, heisst nicht steuerbar, wenn das Paar (sIn − A, −B) nicht linksteilerfremd ist. Andernfalls, wenn also Rg(sIn − A, −B) = n
f¨ ur alle
s∈C
(6.68)
gilt, bezeichnen wir das Zustandsmodell (6.67) als zustandssteuerbar. Die Eigenschaft der Zustandssteuerbarkeit l¨ asst sich auf vielf¨altige Weise charakterisieren. (Die Beweise k¨ onnen in [Kai80], [Lud95], [Lun97] u.a. nachgeschlagen werden.) Satz 6.12 Das Zustandsmodell (6.67) ist genau dann zustandssteuerbar, wenn eine der folgenden Bedingungen erf¨ ullt ist: 1. Die (n × n)-Matrix Wt1 =
/t1
T
etA BB T etA dt ist positiv definit, und zwar
0
f¨ ur beliebige t1 > 0. 2. F¨ ur jeden n-dimensionalen Vektor x = 0 gibt es mindestens ein t ∈ [0, t1 ] mit xT etA B = 0T .
6.4 LTI-Systeme in Zustandsbeschreibung
333
3. Kalman-Kriterium: Die Kalmansche Steuerbarkeitsmatrix S = (B, AB, ..., An−1 B) ∈ Rn×n·m ist zeilenregul¨ar, d. h. Rg S = Rg(B, AB, ..., An−1 B) = n ur alle s ∈ C 4. Hautus-Kriterium10 : Rg(sIn − A, B) = n f¨ Zustandssteuerbarkeit im hier eingef¨ uhrten Sinne impliziert, dass sich das System innerhalb eines Zeitintervalls mit einer beliebig vorgebbaren endlichen L¨ ange t1 aus jedem gegebenen Anfangszustand in einen beliebig gew¨ unschten Endzustand u uhren l¨ asst. Diese Eigenschaft der Punkt¨berf¨ ¨ zu-Punkt-Uberf¨ uhrbarkeit im Zustandsraum ist aus dem bisher Gesagten nicht offensichtlich, dient aber den meisten Lehrbuchautoren, siehe [Ack88], [Rei79], [F¨ ol05], [Lud95], [Lun97], [Gee04], [HD04] u.v.a., als konzeptionelle Basis, um die Bezeichnung Steuerbarkeit“ inhaltlich zu rechtfertigen. Wir ” wollen diesen Aspekt der Zustandssteuerbarkeit genauer beleuchten. Satz 6.13 In einem zustandssteuerbaren Modell x˙ = Ax + Bu kann der Zustandsvektor x(t) aus einem beliebig gegebenen Anfangszustand x0 = x(0) mit Hilfe eines beschr¨ankten Eingangssignals u(t) im Zeitintervall (0, t1 ) in jeden gew¨ unschten Endzustand x1 = x(t1 ) ¨ ubergef¨ uhrt werden. Der Endzeitpunkt t1 > 0 darf im voraus beliebig festgelegt werden. Beweis: Die Integration der Zustandsgleichung (6.67a) unter der Anfangsbedingung x(0) = x0 ergibt t eA(t−τ ) B u(τ ) dτ .
tA
x(t) = e x0 +
(6.69)
0
Der gew¨ unschte Endzustand x(t1 ) = x1 wird erreicht, wenn man u wie folgt w¨ ahlt: T −1 u(τ ) = B T e(t1 −τ )A (Wt1 ) x1 − et1 A x0 f¨ ur 0 ≤ τ ≤ t1 (6.70) mit t1
T
t1
eτ A BB T eτ A dτ =
Wt1 = 0
t1 =
e(t1 −τ )A BB T e(t1 −τ )A dτ
0
T eτ A B eτ A B dτ ;
0 10
Zu Ehren von M.L.J. Hautus (geb. 1940)
T
(6.71)
334
6 Beschreibung von LTI-Systemen durch Polynommatrizen
denn durch Einsetzen von (6.70) in (6.69) erh¨alt man f¨ ur t = t1 den Zustandsvektor x(t1 ) = et1 A x0 t1 +
⎛ e(t1 −τ )A BB T e(t1 −τ )A ⎝ T
0
0
"
⎞−1
t1
e(t1 −τ )A BB T e(t1 −τ )A dτ ⎠ dτ x1 − et1 A x0 T
#$
%
(·)·(·)−1 =In
= et1 A x0 + In x1 − et1 A x0 = x1 . qed.
Beispiel 6.15 Die als Beispiel 2.2 auf Seite 57 betrachteten gekoppelten W¨armeb¨ ader gen¨ ugen einer Zustandsbeschreibung (6.67a) mit n = 2 und m = 1 : ϑ˙1 (t) ϑ˙2 (t)
− 1 1 C R = 1 w1
w1
+ R1w0
1 Cw1 Rw1
− C1w2
Cw2 Rw1
1 Rw1
+ R1w2
1 Cw1 Rw0
ϑ1 (t) + ϑ2 (t)
0
ϑe (t)
Die Zustandssteuerbarkeit ist leicht nachweisbar, z. B. mit dem Kalmanschen Kriterium,
Rg b Ab = Rg
1 Cw1 Rw0
− C2
1 w1 Rw0
0
1 + R1w0 Rw1 1 Cw1 Cw2 Rw0 Rw1
= 2 = n.
Satz 6.13 besagt, 1 (0)dass das W¨armebadmodell aus einem (beliebig) gegebenen Anfangszustand ϑ = x0 innerhalb eines Zeitintervalls der vorgebbaren L¨ ange t1 ϑ2 (0) e durch geeignetes Einstellen der Zulauftemperatur ϑ (t) f¨ u r t ∈ (0, t ] in einen 1 1 (t1 ) (beliebig) gew¨ unschten Endzustand x1 = ϑ u bergef¨ u hrt werden kann. Eine ¨ ϑ2 (t1 ) M¨ oglichkeit k¨ onnen wir sogleich berechnen, n¨ amlich aus der o.a. Vorschrift e
T (t1 −t)AT
ϑ (t) = b e
t
1
e
τA
T τ AT
bb e
−1 dτ x1 − et A x0 1
f¨ ur
t ∈ (0, t1 ].
0
Die symbolische Auswertung dieser Formel w¨ are recht unbequem und m¨ uhevoll, die rechnerassistierte numerische Auswertung f¨ ur konkrete Parameterwerte Cw1 , Cw2 , Rw0 , Rw1 , Rw2 und t1 bereitet jedoch keine besondere M¨ uhe. Im folgenden w¨ ahlen wir der Einfachheit halber die normierten Werte Cw1 = Cw2 = 1, Rw0 = Rw1 = Rw2 = 1 und erhalten damit das numerische Differentialgleichungssystem ϑ˙ 1 (t) ϑ˙ 2 (t)
=
−2 1 1 −2
ϑ1 (t) ϑ2 (t)
+
1 0
ϑe (t).
(6.72)
Aufgabe: Das W¨ armebad soll aus dem Anfangszustand xT0 = ϑ1 (0), ϑ2 (0) = (0, 0) innerhalb des normierten Zeitintervalls (0, t1 ] = (0, 1] in den Endzustand uhrt werden. Eine Zwischenrechnung ergibt xT1 = ϑ1 (1), ϑ2 (1) = (1, −1) u ¨ bergef¨ mit der Abk¨ urzung
6.4 LTI-Systeme in Zustandsbeschreibung v(t) := etA b =
1 2
e−3t + e−t −e−3t + e−t
335
das Steuer-Eingangssignal
1 −1 ϑe (t) = vT (1 − t) v(τ ) · vT (τ )dτ 0
= vT (1 − t)
32.101 −116.400
1 −1
= −15.506 et + 3.697 e3t
f¨ ur
t ∈ (0, 1].
Unter Verwendung dieser Zeitfunktion ϑe (t) wurde das Differentialgleichungssystem (6.72) gel¨ ost. Das Ergebnis zeigt Bild 6.13. Ersichtlich wurde die gew¨ unschte Punktϑe
ϑ1
1
20
0
0.5
−1
10 0
ϑ2
ϑ
30
t ϑ2
−4
−2
0
1
ϑ1
1
−0.5
−2 0.5
−10
1
t
−1 −3 −4
a)
−1.5
b)
c)
¨ Bild 6.13. Uberf¨ uhrung der W¨ armeb¨ ader aus dem Anfangszustand ϑ1 (0) = 0, ϑ2 (0) = 0 in den Endzustand ϑ1 (1) = 1, ϑ2 (1) = −1 ur 0 < t ≤ 1 a) Im voraus berechnetes Steuersignal ϑe (t) f¨ (t) und ϑ b) Zeitverl¨ aufe der Temperaturen ϑ 1 2 (t) c) Trajektorie ϑ1 (t), ϑ2 (t) in der Zustandsebene. ¨ zu-Punkt-Uberf¨ uhrung mit Hilfe des berechneten Steuersignals ϑe (t) erfolgreich vollzogen. Bei der Interpretation der Ergebnisse muss man sich Klarheit u ¨ber die Brauchbarkeit des berechneten Steuersignals ϑe (t) verschaffen: Die Zeitspanne (0, t1 ] darf grunds¨ atzlich beliebig klein gew¨ ahlt werden, und man wird in jedem Falle einen ¨ uhrung aus dem Anfangszureellwertigen Signalverlauf ϑe (t) finden, der die Uberf¨ stand in den Endzustand in der gew¨ unschten Zeit leistet. In praxi unterliegt die Stellgr¨ oße ϑe (t) jedoch Beschr¨ ankungen, Kaltwassertemperatur < ϑe (t) < Heißwassertemperatur. Außerhalb dieses Temperaturbereiches liegende Stellgr¨ oßenwerte ϑe (t) sind nicht realisierbar. W¨ ahlt man die Intervall¨ ange t1 klein, so wird die Matrix Wt1 =
t
1
0
T
eτ A b bT eτ A dτ fast singul¨ ar. Bei der Bildung von Wt−1 ist mit betragsgroßen Ele1
menten zu rechnen. Daher ist anzunehmen, dass der berechnete Signalverlauf ϑe (t) die thermodynamisch begr¨ undeten Stellsignalbeschr¨ ankungen verletzen w¨ urde.
336
6 Beschreibung von LTI-Systemen durch Polynommatrizen
Bemerkenswert ist auch, dass der Begriff Endzustand“ durchaus missverstan” den werden kann. Im vorliegenden Beispiel w¨ urde dieser Zustand weder bei Abe schalten des Steuersignals, d. h. f¨ ur ϑ (t) = 0 f¨ ur t > t1 , noch bei Konstanthalten, ur t > t1 , bestehen bleiben: d. h. ϑe (t) = ϑe (t1 ) f¨ •
Beim Abschalten w¨ urden beide Badtemperaturen auf Grund der Stabilit¨ at der Regelstrecke auf Null abklingen (siehe Bild 6.14). Im Falle ϑe (t) = ϑe (t1 ) f¨ ur t > t1 w¨ urden sich die Badtemperaturen station¨ aren ahern, die man aus dem Gleichungssystem Werten ϑ1 (∞) und ϑ2 (∞) n¨
•
1 Rw1
+
1 Rw0
− R1w1
− R1w1 1 Rw1
+
1 Rw2
ϑϑ (∞) = (∞) 1
1 Rw0
2
0
ϑe (t1 )
alt (siehe Bild 6.15). f¨ ur Rw0 = Rw1 = Rw2 = 1 erh¨
ϑe
ϑ2
ϑ
30
1
20
ϑ1
0
1
−1
10
2t
ϑ2
−4
−2
0
1
ϑ1
−0.5
−2
0
2t
1
−10
−1 −3 −4
−1.5
¨ Bild 6.14. Uberf¨ uhrung der W¨ armeb¨ ader in der Zeitspanne (0, 1] aus dem Anfangszustand ϑ1 (0) = 0, ϑ2 (0) = 0 in den Endzustand ϑ1 (1) = 1, ϑ2 (1) = −1 bei anschließendem Abschalten
ϑe
ϑ
30
20
20
15
10
10
0 −10
ϑ2 ϑ1
10
ϑ2
5
5 2
4
t 0
2
4
t
0
10
20 ϑ1
¨ Bild 6.15. Uberf¨ uhrung der W¨ armeb¨ ader in der Zeitspanne (0, 1] aus dem Anfangszustand ϑ1 (0) = 0, ϑ2 (0) = 0 in den Endzustand ϑ1 (1) = 1, ϑ2 (1) = −1 bei anschließendem Konstanthalten der Zulauftemperatur ϑe (t)
Die inhaltstr¨ achtigere Frage, ob man eine gew¨ unschte Trajektorie f¨ ur die Zeitverl¨ aufe (ϑ1 (t), ϑ2 (t)) beliebig in der ϑ1 , ϑ2 -Ebene vorgeben und durch einen im
6.4 LTI-Systeme in Zustandsbeschreibung
337
voraus berechneten Verlauf des Steuersignals ϑe (t) verwirklichen kann, wird durch das Konzept der Zustandssteuerbarkeit nicht ber¨ uhrt. Eine Antwort findet man im Abschnitt 4.8 des vorliegenden Buches.
Beispiel 6.16 Wir betrachten das im Abschnitt 2.5.3 behandelte verschiebliche N -fach-Pendel im Zustandsraum, und zwar bei Linearisierung um die instabile Gleichgewichtslage ϕ1 = ϕ2 = . . . = ϕN = 0, die sich bei verschwindenden eingepr¨ agten Stellsignalen F (t) = 0, D 1 (t) = 0, . . . , D N (t) = 0 einstellen kann. Mit dem (Kleinsignal-)Zustandsvektor x = (x0 , x˙ 0 , ϕ1 , ϕ˙ 1 , ϕ2 , ϕ˙ 2 , . . . , ϕN , ϕ˙ N )T und dem (Kleinsignal-)Eingangsvektor u(t) = (F (t), D1 (t), . . . , DN (t))T kann man die auf Seite 80 angegebenen linearisierten Bewegungsgleichungen ohne große M¨ uhe umschreiben in die Zustandsgleichungen x˙ = A x + B u mit der Systemmatrix 0
0 0 0 A= .. . 0 0
1
0
0
−d0 m0
m1 g m0
−d1 l1 m0
0 −d0 m0 l1
.. .
0 1+
m1 m0
g −d1 l1 l2 1 m0
.. .
1
1+
0 ··· m0 m1
mN m0
···
0
0
0
m1 g m0 lN
−d1 l1 lN m0
···
−dN lN m0
g
0
0
mN g m0 l1
−dN l1 lN m0
.. .
.. .
.. .
−d0 m0 lN
0
0 1+
mN m0
g lN
und der Eingangsmatrix
B=
0
0
···
0
1 m0
1 m0 l1
···
1 m0 lN
0 1 m0 l1
1 l2 1 m0
0
1+
m0 m1
···
0
···
1 m0 l1 lN
.. .
.. .
.. .
···
0
0
···
1 m0 lN
1 m0 lN l1
···
1 l2 m0 N
0
1+
m0 mN
−dN l2 N m0
1
1+
m0 mN
.
Wir wollen zuerst der Frage nachgehen, ob das ged¨ ampfte verschiebliche N-fachPendel allein durch die den Wagen antreibende Kraft F zustandssteuerbar ist. Es erweist sich bei dieser Fragestellung als zweckm¨ aßig, das Zustandssteuerbarkeitskriterium nach Hautus zu benutzen.
338
6 Beschreibung von LTI-Systemen durch Polynommatrizen
Die Eingangsmatrix B vereinfacht sich jetzt zu einem (2N + 2)-komponentigen Spaltenvektor, den wir mit b0 bezeichnen. Das System ist genau dann zustandssteuerbar, wenn Rg(sI2N+2 − A, b0 ) = 2N + 2
f¨ ur alle s ∈ C.
andert, wenn man zu einer Der Rang der Matrix (sI2N+2 − A, b0 ) bleibt unver¨ ugt. Wir k¨ onnen somit Spalte der Matrix A ein Vielfaches des Vektors b0 hinzuf¨ oglichst den Vektor b0 benutzen, um die Matrix A zu vereinfachen“, indem in m¨ ” vielen Eintr¨ agen der Systemmatrix eine Null erzeugt wird: 0 1 0
0
0
0
··· 0
0
0 0
0
0
0
··· 0
0
0 0
1
0
0
··· 0
0
0
0
··· 0
0
0
0
1
··· 0
0
0 0
0
g −d2 l2 m2 l2 2
··· 0
0
.. .. . .
.. .
.. .
.. .
..
. . ..
.. .
0 0
0
0
0
··· 0
0
···
0 0 0 ˜= 0 A 0 .. . 0
0
g −d1 l1 m1 l2 1
0 0
0 0 0
0
0
g lN
1 −dN mN l2 N
b0
=
0 1 m0
0 1 m0 l1
0 1 m0 l2
.. . 0
(6.73)
1 m0 lN
˜ nur dann einen Rang kleiner als 2N + 2 hat, wenn s Da die Matrix (sI2N+2 − A) ˜ ein Eigenwert der Matrix A ist, braucht die Rangbedingung nur f¨ ur die Eigenwerte ˜u der Matrix A uft zu werden. Deren Eigenwerte sind wegen der Blockdiago¨ berpr¨ nalstruktur der Matrix A˜ leicht ablesbar: Der erste Block liefert einen Eigenwert bei s = 0 (mit algebraischer Vielfachheit zwei, aber geometrischer Vielfachheit eins) und die u ocke je einen positiv-reellen und einen negativ-reellen Ei¨ brigen Bl¨ ˜ dann wird wenigstens einer genwert. Ist s gleich einem Eigenwert der Matrix A, ˜ singul¨ der Diagonalbl¨ ocke der Matrix (sI2N+2 − A) ar. Ist nur ein Block singul¨ ar ˜ gleich eins, so kann und der sich daraus ergebende Rangabfall von (sI2N+2 − A) dieser durch Hinzunahme der Spalte b0 kompensiert werden; denn der betreffende Block hat in den jeweiligen Zeilen eine Null und einen von Null verschiedenen Wert. Werden hingegen f¨ ur einen Eigenwert s zwei oder mehr Diagonalbl¨ ocke der ˜ zugleich singul¨ Matrix (sI2N+2 − A) ar (d. h., s ist ein Eigenwert mit geometrischer Vielfachheit gr¨ oßer als eins), so reicht die Spalte b0 nicht aus, um den erh¨ ohten Rangabfall zu kompensieren. Dieser Fall tritt ein, wenn f¨ ur irgendein Indexpaar i = j gilt: l i = lj
und
zugleich
di dj = . mi mj
Andernfalls ist das ged¨ ampfte verschiebliche N -fach-Pendel allein durch die Kraft F zustandssteuerbar. Wir fragen als n¨ achstes, ob das ged¨ ampfte verschiebliche N -fach-Pendel auch allein durch die Drehkr¨ afte D1 , D2 , · · · , DN zustandssteuerbar ist und wollen wiederum das Hautussche Kriterium benutzen. Nachdem wir die Systemmatrix A durch oglich vereinfacht Kombination mit den Spalten b1 , . . . , bN der Matrix B weitestm¨
6.4 LTI-Systeme in Zustandsbeschreibung
339
ˆ erhalten haben, bleibt zu pr¨ ˆ B ˆ2 ) zustandsund eine Matrix A ufen, ob das Paar (A, steuerbar ist, wobei
0 0 0 ˆ = 0 A 0 .. . 0 0
0
ˆ2 B
=
1 l2 1 m0
1
0
00
0 ··· 0
0
0
00
0 ··· 0
0
0
10
0 ··· 0
d0 l1 m1
0
00
0 ··· 0
0
0
00
1 ··· 0
0
0
00
0 ··· 0
.. .
.. .
.. .. . .
.. . . .. . . .
0
0
00
0 ··· 0
0
0
00
0 ··· 0
0 0 0 0 , 0 .. . 1 0
0
0
0
···
0
1 m0 l1
1 m0 l2
···
1 m0 lN
0
···
0
1 m0 l1 l2
···
1 m0 l1 lN
···
0
···
1 m0 l2 lN
.. .
0
1+
m0 m1
0 1 m0 l2 l1
1 l2 2 m0
0
1+
m0 m2
.. .
.. .
.. .
0
0
···
1 m0 lN l1
1 m0 lN l2
···
1 l2 m0 N
0
1+
m0 mN
.
ˆ hat N + 1 Nullspalten. Somit kann der sich f¨ Die Matrix A ur s = 0 ergebenˆ unter keinen Umst¨ anden durch die Made Rangabfall der Matrix (sI2N+2 − A) ˆ2 kompensiert werden, denn diese besitzt nur N Spalten. Die Frage nach trix B der Zustandssteuerbarkeit allein durch die Drehkr¨ afte D1 , D2 , · · · , DN muss also verneint werden. Dies erscheint auch physikalisch plausibel, denn allein durch die Drehkr¨ afte kann der Wagen schwerlich aus einer gegebenen Anfangslage in eine gew¨ unschte Endlage versetzt werden.
6.4.2 Zustandsbeobachtbarkeit In Anlehnung an Definition 6.2 und Satz 6.4 erkl¨aren wir nun: Definition 6.4. Das Zustandsmodell (6.67) heisst nicht beobachtbar, wenn sIn − A das aus dem reellen Matrizenpaar (A, C) hervorgehende Paar C nicht rechtsteilerfremd ist. Andernfalls, wenn also
340
6 Beschreibung von LTI-Systemen durch Polynommatrizen
Rg
sIn − A =n C
f¨ ur alle
s∈C
(6.74)
gilt, bezeichnen wir das Zustandsmodell als zustandsbeobachtbar. Aus der Bedingung (6.74) lassen sich diverse Kriterien f¨ ur Zustandsbeobachtbarkeit herleiten. Zu diesem Zwecke kann man Analogien zum Abschnitt 6.4.1 u ¨ber Zustandssteuerbarkeit ausnutzen. Ersetzt man dort die Matrix (sIn − A, B) durch ihre Transponierte sIn − AT (sIn − A, B)T = BT sowie alle benutzten Vektoren durch ihre transponierten Vektoren und substituiert formal AT durch A und B T durch C, so gelangt man schließlich zu Ergebnissen, die im folgenden Satz zusammengestellt werden. Satz 6.14 Ein Zustandsmodell (6.67) ist genau dann zustandsbeobachtbar, wenn eine der folgenden Bedingungen erf¨ ullt ist: 1. Die (n × n)-Matrix Vt1 =
/t1
T
etA C T CetA dt ist positiv definit, und zwar
0
f¨ ur beliebige t1 > 0. 2. F¨ ur jeden n-dimensionalen Vektor x = 0 gibt es mindestens ein t ∈ [0, t1 ] mit CetA x = 0. 3. Kalman-Kriterium: Die Kalmansche Beobachtbarkeitsmatrix ⎛ ⎞ C ⎜ CA ⎟ ⎜ ⎟ B = ⎜ . ⎟ ∈ Rr·n×n ⎝ .. ⎠ CAn−1 ist spaltenregul¨ar, d. h.
⎛
C CA .. .
⎜ ⎜ Rg B = Rg ⎜ ⎝
⎞ ⎟ ⎟ ⎟=n ⎠
CAn−1 4. Hautus-Kriterium: Rg
sIn − A =n C
f¨ ur alle
s ∈ C.
Zustandsbeobachtbarkeit im hier eingef¨ uhrten Sinne impliziert, dass sich aus der Messung des Ausgangssignals in einem Zeitintervall beliebig vorgebbarer L¨ ange auf den Systemzustand am Anfang des Zeitintervalls schließen l¨ asst. Diese Eigenschaft der Rekonstruierbarkeit des Anfangszustandes dient den meisten Lehrbuchautoren als konzeptionelle Basis des Beobachtbarkeitsbegriffs. Wir wollen darauf n¨ aher eingehen.
6.4 LTI-Systeme in Zustandsbeschreibung
341
Satz 6.15 In einem zustandsbeobachtbaren Modell x˙ = Ax, y = Cx kann aus der Kenntnis des Ausgangsvektors y(t) im Zeitintervall 0 ≤ t ≤ t1 (bei beliebig festgelegtem t1 > 0) der Anfangszustand x(+0) =: x0 berechnet werden. Beweis: Die Integration der Systemgleichungen ergibt x(t) = etA x(+0) ,
y(t) = CetA x(+0) = CetA x0
Das Problem besteht also darin, aus dem Verlauf des r-dimensionalen Vektors y(t) in einem (m¨ oglicherweise sehr kurzen) Zeitintervall [0; t1 ] den ndimensionalen Vektor x0 zu berechnen. Da im allgemeinen r < n, ist die Aufgabe, aus r Gleichungen n Unbekannte zu ermitteln, nicht trivial. G¨abe es einen Vektor x = 0 mit CetA x = 0 f¨ ur alle t ∈ [0; t1 ], so h¨atte die gestellte Aufgabe keine eindeutige L¨ osung; denn mit einer L¨osung x0 w¨aren alle x0 = x0 + α · x f¨ ur α ∈ R ebenfalls L¨ osungen. Daher darf es keinen nichtverschwindenden Vektor x geben, der f¨ ur alle t ∈ [0; t1 ] zu den r Zeilenvektoren von CetA orthogonal ist. Mit anderen Worten: Der Anfangszustand x0 l¨ asst sich nicht berechnen, wenn das Matrizenpaar (A, C) die im Satz 6.14 , Pkt. 2, notierte Bedingung der Zustandsbeobachtbarkeit nicht erf¨ ullt. Andernfalls kann man den Anfangszustand x0 mit Hilfe der Kalmanschen Beobachtbarkeitsmatrix B berechnen. Das sieht man so: Durch wiederholte zeitliche Ableitung der Beziehung CetA x0 = y(t) erh¨alt man CAν etA x0 = y(ν) (t)
f¨ ur
ν = 0, 1, 2, . . .
CAν x0 = y(ν) (+0) f¨ ur
ν = 0, 1, 2, . . .
Der Grenz¨ ubergang t → +0 liefert
Aus dem Satz von Cayley-Hamilton der Matrizentheorie (z.B. [Gan66]) folgt, dass die Gleichungen f¨ ur ν ≥ n fortgelassen werden k¨onnen. Die Koeffizientenmatrix der verbleibenden n Gleichungen ist nichts anderes als die Kalmansche Beobachtbarkeitsmatrix, und das resultierende Gleichungssystem zur Berechnung von x0 lautet ⎛ ⎞ y(+0) ⎜ ⎟ .. (6.75) B x0 = ⎝ ⎠ =: y(0) . y(n−1) (+0) Im Falle r = 1 wird B quadratisch, und x0 berechnet sich eindeutig aus ⎛ ⎞ ⎞−1 ⎛ y(+0) cT ⎜ cT A ⎟ ⎜ y(+0) ⎟ ⎜ ⎜ ˙ ⎟ ⎟ x0 = B−1 y(0) = ⎜ ⎟ ⎟ ·⎜ .. .. ⎝ ⎝ ⎠ ⎠ . . cT An−1 y (n−1) (+0)
342
6 Beschreibung von LTI-Systemen durch Polynommatrizen
F¨ ur r > 1 kann man grunds¨ atzlich irgendeinen Satz von n Gleichungen des Systems (6.75) mit regul¨ arer (n × n)-Teilmatrix aus der ( r · n × n )-Matrix B w¨ ahlen und dann aus dem quadratischen Gleichungssystem den Vektor x0 bestimmen. Zum Ausgleich von Mess- und Rechenungenauigkeiten empfiehlt sich oft eine L¨ osung im Sinne der Methode der kleinsten Quadrate, x0 = (BT B)−1 BT y(0) . qed. Anmerkung: Die im Beweis benutzten Formeln w¨ urde man einer tats¨achlichen Ermittlung des Vektors x0 nicht zugrundelegen, weil der Ableitungsvektor y(0) durch Messungen kaum zu beschaffen ist. Statt dessen kann man die Beziehung CetA x0 = y(t) f¨ ur diskrete Zeitpunkte t = ti , i = 1, 2, . . . auswerten und daraus Gleichungssysteme zur Berechnung von x0 gewinnen. 6.4.3 Dekomposition des Zustandsraumes und minimale ¨ Realisierungen von Ubertragungsmatrizen ¨ Ein gegebenes MIMO-LTI-Ubertragungssystem in Zustandsdarstellung x˙ = Ax + Bu y = Cx ist zustandssteuerbar und zustandsbeobachtbar, falls die Steuerbarkeitsmatrix S zeilenregul¨ ar und die Beobachtbarkeitsmatrix B spaltenregul¨ar sind, also falls Rg S = n, und Rg B = n. Diese beiden Eigenschaften brauchen nicht erf¨ ullt zu sein. Im allgemeinen kann man den n-dimensionalen Zustandsraum in vier komplement¨are Teilr¨ aume zerlegen [Kal63]: 1. 2. 3. 4.
steuerbarer, aber nicht beobachtbarer Teilraum Rsb der Dimension n1 , steuerbarer und beobachtbarer Teilraum Rsb der Dimension n2 , weder steuerbarer noch beobachtbarer Teilraum Rsb der Dimension n3 , beobachtbarer, aber nicht steuerbarer Teilraum Rsb der Dimension n4 = n − (n1 + n2 + n3 ).
Wird die Rangbedingung Rg S = n nicht erf¨ ullt, so kann man den Teilraum des Zustandsraumes, der von den Spaltenvektoren der Matrix S aufgespannt wird, als steuerbaren Teilraum Rs definieren, Rs = {x :
x = Sz,
z ∈ Rn·m } := Bild(S).
Er hat die Dimension dim Rs = Rg S =: ns und m¨oge von den ns Spaltenvektoren einer spaltenregul¨ aren (n × ns )−Matrix Ts aufgespannt werden, d. h. Rs = span (Ts ). Wird die Rangbedingung Rg B = n nicht erf¨ ullt, so kann man den Teilraum des Zustandsraumes, der von den Spaltenvektoren der Matrix B auf
Dekomposition und minimale Realisierungen
343
den Nullvektor abgebildet wird, als nicht beobachtbaren Teilraum Rb definieren, Rb = {x : Bx = 0 ∈ Rr·n } := ker(B). Er hat die Dimension dim Rb = n − Rg B =: nb und m¨oge von den nb Spaltenvektoren einer spaltenregul¨ aren (n × nb )−Matrix Tb aufgespannt werden, d. h. Rb = span (Tb ). Die Schnittmenge von Rs und Rb liefert einen weiteren Teilraum des Zustandsraumes, den wir steuer- aber nicht beobachtbaren Teilraum Rs b nennen wollen: Rsb = Rs ∩ Rb = x : x ∈ span (Ts ), x ∈ span (Tb ) = span (Ts Zs1 b ) =
span (Tb Zs2 b )
mit
Zs1 b Zs2 b
:= ker(Ts , Tb )
Der Raum Rs b habe die Dimension n1 und m¨oge von den n1 Spaltenvektoren einer spaltenregul¨ aren (n × n1 )−Matrix Ts b aufgespannt werden, d. h. Rsb = span (Ts b ). Nun l¨ asst sich der steuerbare Teilraum Rs als direkte Summe von Rs b und einem steuer- und beobachtbaren Teilraum Rsb darstellen, Rs = Rs b ⊕ Rs b . Man bestimmt Rsb als Schnitt von Rs und dem orthogonalen Komplement zu Rsb : 4 5 ⊥ Rsb = x : x ∈ span (Ts ), x ∈ Bild(Tsb ) = ker (Tsb )T =: span (Ksb ) 1 = span (Ts Zsb )
=
2 span (Ksb Zsb )
mit
1 Zsb 2 Zsb
:= ker(Ts , Ksb )
Der Raum Rs b habe die Dimension n2 und m¨ oge von den n2 Spaltenvektoren einer spaltenregul¨ aren (n × n2 )−Matrix Tsb aufgespannt werden, d. h. Rs b = span (Ts b ). Analog l¨ asst sich der nicht beobachtbare Teilraum Rb als direkte Summe von Rs b und einem weder steuer- noch beobachtbaren Teilraum Rs b darstellen, Rb = Rs b ⊕ Rs b . Man bestimmt Rs b als Schnitt von Rb und dem orthogonalen Komplement zu Rs b :
344
6 Beschreibung von LTI-Systemen durch Polynommatrizen
4
Rs b = x :
5 ⊥ x ∈ span (Tb ), x ∈ Bild(Tsb ) = ker (Ts b )T =: span (Ks b )
= span (Tb Zs1 b ) = span (Ks b Zs2 b )
mit
Zs1 b Zs2 b
:= ker(Tb , Ks b )
Der Raum Rs b habe die Dimension n3 und m¨oge von den n3 Spaltenvektoren einer spaltenregul¨ aren (n × n3 )−Matrix Ts b aufgespannt werden, d. h. Rs b = span (Ts b ). Den noch fehlenden nicht steuer- aber beobachtbaren Teilraum Rs b w¨ahlen wir als orthogonales Komplement zur direkten Summe Rs b ⊕ Rs b ⊕ Rs b , also
4 Rs b = x :
5 ⊥ x ∈ Bild(Ts b , Ts b , Ts b ) =: ker (Ts b , Ts b , Ts b )T
= span (Ts b ). Die (n × n)-Matrix T := (Tsb , Tsb , Tsb , Tsb ) ist regul¨ar und kann als Transformationsmatrix benutzt werden. Durch die Zustandstransformation ⎛ ⎞ 1 x ⎜x 2 ⎟ ⎟ = (Ts b , Ts b , Ts b , Ts b ) ⎜ x = Tx ⎝x 3 ⎠ 4 x stellen sich Zustandsvektoren x, die einem der genannten Teilr¨aume angeh¨ oren, besonders u ur x ∈ Rsb zugleich ¨ bersichtlich dar, z. B. wird f¨ 1 = 0, x 3 = 0 und x 4 = 0. Die transformierten Zustandsvektoren x gen¨ x ugen dem Gleichungssystem ˙ = x y=
x u +B A x C
mit den (bei fixiertem T eindeutig bestimmten) transformierten Matrizen = T −1 AT, A
= T −1 B, B
= CT. C
Diese sind in der folgenden Weise partitioniert: ⎛ ⎞ ⎛ ⎞ 11 A 12 A 13 A 14 1 A B ⎜ 22 0 A 24 ⎟ ⎜ ⎟ 0 A ⎟ 2⎟ = ⎜B =⎜ B A ⎜ ⎟, ⎝ 0 ⎠ ⎝ 0 0 A33 A34 ⎠ 44 0 0 0 0 A = 2 0 C 4 . C 0 C
Dekomposition und minimale Realisierungen
345
Um die angegebene Struktur einzusehen, wird die dritte (Hyper-)Spalte beispielhaft betrachtet. Sie bestimmt sich aus dem Gleichungssystem von A •3 = A · T . T ·A sb Die n3 Spaltenvektoren der Matrix Ts b liegen in ker(B), aber nicht in Bild(S). Die n3 Spaltenvektoren der Matrix A · Ts b liegen gewiss auch in ker(B). Weil sich die n3 Spaltenvektoren der Matrix A · Ts b im nicht beobachtbaren •3 der zweite und der vierte Block mit Nullen Teilraum Rb befinden, muss in A besetzt sein; sonst entst¨ unde ein in sich widerspr¨ uchliches Gleichungssystem. ¨ Die Ubertragungsmatrix des Systems l¨ asst sich berechnen: −1 · sIn − A = Gyu (s) = C ·B 2 0 C
⎛ ⎞⎛ ⎞ 11 )−1 1 (sIn1 − A ∗ ∗ ∗ B ⎟⎜ ⎟ ⎜ −1 0 (sIn2 − A22 ) ∗ ∗ ⎟⎜B2⎟ 4 ⎜ ⎜ ⎟⎝ ⎠ 0 C 33 )−1 ⎝ ⎠ 0 ∗ 0 0 (sIn3 − A −1 0 0 0 0 (sIn4 − A44 ) −1 2 · sIn2 − A 22 2 . = C · B
2 , A 22 , B 2 ) bezeichnet man als eine minimale Realisierung Das Tripel (C ¨ der Ubertragungsmatrix Gyu , weil die Zustandsbeschreibung 22 x 2 u 2 + B ˙ 2 = A x 2 x 2 y=C ¨ 2 minimaler Dimension benutzt, mit dem die Ubereinen Zustandsvektor x y tragungsmatrix Gu realisiert werden kann. Die abgeleiteten Ergebnisse rechtfertigen eine verallgemeinernde Aussage. ¨ ¨ Satz 6.16 F¨ ur die Ubertragungsmatrix Gyu eines LTI-Ubertragungssystems in Zustandsdarstellung spielt lediglich der Teil des Systems eine Rolle, der sowohl zustandssteuerbar als auch zustandsbeobachtbar ist. Unter allen Realisierungen (C, A, B), die die Eigenschaft C(sI• − A)−1 B = Gyu (s) besitzen, haben die minimalen Realisierungen die kleinste Ordnung der Matrix A. Eine Realisierung (C, A, B) ist genau dann minimal, wenn sowohl das Paar (A, B) zustandssteuerbar als auch das Paar C zustandsbeobachtbar ist. A Beispiel 6.17 Betrachtet werde ein akademisches Beispiel, das so konstruiert sei, ¨ dass alle vier Teilr¨ aume nicht-leer sind. Dies gelingt bereits bei SISO- Ubertragungssystemen mit der Zustandsdimension n = 4. Wir wollen von der Zustandsdarstellung
346
6 Beschreibung von LTI-Systemen durch Polynommatrizen 7 −1 −3 1 1 1 4 −1 0 4 −1 −3
y= 3
x˙ =
2 −5
1 1 1 1
2 2 x+ 2 u,
2 x,
3
ausgehen. Die Steuerbarkeitsmatrix und die Beobachtbarkeitsmatrix lauten
S=
2 2 2 3
9 9 9 3
30 30 30 3
93 93 93 3
,
= Bild(S) = span
B=
3 11 35 107
2 −5 2 2 −13 2 2 −37 2 2 −109 2
.
Wir setzen Rs
1 1 1 0
0 0 0 1
Rb = ker(B) = span
und
Ts
1 0 1 −1 1 0 0 1
.
Tb
asst sich unmittelbar ablesen: Rsb Die Schnittmenge Rsb = Rs ∩ Rb l¨
= span . 1 1 1 0
Tsb
Die R¨ aume Rs b und Rs b werden entsprechend der auf Seite 343 f. hergeleiteten allgemeinen Konstruktionsvorschrift bestimmt. Zuerst berechnet man
span (Ks b ) = ker (Ts b )T
= ker (1, 1, 1, 0) = span
1 00 0 10 −1 −1 0 0 01
,
anschließend ker (Ts , Ksb ) = (0, 1, 0, 0, −1)T Daraus folgt Rsb
ker (Tb , Ksb ) = (−1, −3, 1, −2, 3)T .
und
= span , 0 0 0 1
Rsb
Tsb
= span . −1 2 −1 −3 Tsb
Das orthogonale Komplement dieser drei Teilr¨ aume zum vierdimensionalen Zustandsraum ergibt sich zu
Rsb = ker (Tsb , Tsb , Tsb )T
= ker
11 1 0 00 0 1 −1 2 −1 −3
−1 0 = span 1 . 0 Tsb
Dekomposition und minimale Realisierungen
347
Mit der Transformationsmatrix
T = Tsb Tsb Tsb
1 1 Tsb = 1 0
0 −1 −1 0 2 0 0 −1 1 1 −3 0
gewinnt man die neue Systemdarstellung
3 0 −1 −1 ˙ = T AT x + T Bu = x 0 0 = y =C ·T ·x
14 1 −7 −3 2 3 1 0 0 x + 0u 0 2 73 0 0 0 3
0 2 0 −8
. x
¨ Die Ubertragungsfunktion lautet 2 (sIn2 − A 22 )−1 B 2 = 2 · (s − 1)−1 · 3 = Gyu (s) = C
6 . s−1
2 , A 22 , B 2 ) = (2, 1, 3) stellt eine minimale Realisierung der Uber¨ Das Tripel (C tragungsfunktion dar.
6.4.4 Basisgr¨ oßen f¨ ur zustandssteuerbare Systeme Zustandssteuerbare Systemmodelle (6.67a), x˙ = A x + B u , bilden eine spezielle Klasse innerhalb der polynomialen Systembeschreibungen mit linksteilerfremden Polynommatrizen (AP , BP ). Die gewonnenen allgemeinen Erkenntnisse sind nat¨ urlich f¨ ur diese Klasse ohne Einschr¨ankungen nutzbar. Durch elementare Spaltenoperationen kann das Matrizenpaar (sIn − A, −B) ¨ in die Hermitesche Normalform (In , 0) u uhrt werden. Diese Uberf¨ uhrung ¨bergef¨ l¨ asst sich als Rechtsmultiplikation mit einer unimodularen (n+ m)× (n+ m) Polynommatrix U R interpretieren,
R R U U 11 12 (sIn − A, −B) · U R = (sIn − A, −B) = (In , 0), (6.76) R R U21 U22 und das Konzept der Basisgr¨ oßen Ξ kann aus Abschnitt 6.2.6 u ¨ bernommen werden, R −1 Ξ := (U22 ) ·U .
(6.77)
R R , U12 ) wurde eine teilerfremde rechte MatrizenMit dem Matrizenpaar (U22 ¨ bruchdarstellung der n × m -Ubertragungsmatrix Gxu gewonnen,
348
6 Beschreibung von LTI-Systemen durch Polynommatrizen
R R −1 X = Gxu (s) · U = (sIn − A)−1 B · U = U12 (U22 ) · U. R U12 l¨ asst sich durch elementare ZeilenDie (n + m) × m -Polynommatrix R U22 I operationen in die Hermitesche Normalform m bringen. 0 Zu diesem Zweck bildet man sukzessive eine unimodulare (n+m)×(n+m)Polynommatrix U L dergestalt, dass
R L L R U12 U11 U12 Im U12 L = = U . (6.78) R L L R U22 U21 U22 U22 0
Im Abschnitt 6.2.6 wurde gezeigt, wie sich die Basisgr¨oßen Ξ als polynomiale Linearkombination der Zustandsgr¨ oßen X und der Steuergr¨oßen U darstellen lassen, L L Ξ = U11 · X + U12 · U.
(6.79)
F¨ ur die Klasse der zustandssteuerbaren LTI-Zustandsmodelle ergeben sich Besonderheiten und spezielle Bearbeitungsm¨ oglichkeiten, auf die nun hingewiesen werden soll. Insbesondere brauchen die (ggf. numerisch st¨oranf¨alligen) ¨ Prozesse der Uberf¨ uhrung in Hermitesche Normalformen durch elementare Spaltenoperationen und elementare Zeilenoperationen nicht tats¨achlich ausgef¨ uhrt zu werden. Die vorausgesetzte Zustandssteuerbarkeit impliziert, dass das Matrizen¨ paar (sIn − A, −B) eine teilerfremde linke Mbd der Ubertragungsmatrix Gxu bildet, L U21 = sIn − A,
L U22 = −B .
Wir werden uns im folgenden mit den den dazu passenden TeilmatriL L zen U11 und U12 der unimodularen Matrix U L f¨ ur zustandssteuerbare SysteL L me besch¨ aftigen und zeigen, dass die Polynommatrizen U11 und U12 in der Darstellung (6.79) der Basisgr¨ oßen sehr einfach strukturiert gew¨ahlt werden d¨ urfen: L U12 = 0,
L U11 = P ∈ Rm×n .
(6.80)
Insbesondere wird darauf eingegangen, wie die reelle m × n -Matrix P bestimmt werden kann. Um an vertraute Bezeichnungsweisen, die in der linearen Regelungstheorie beim Umgang mit ger¨ anderten Polynommatrizen“ u ¨ blich sind (vgl. [Ros70], ” [Kai80]), besser ankn¨ upfen zu k¨ onnen, vertauschen wir die erste und zweite Zeile in (6.78) und schreiben unter Nutzung der Postulate der vorangegangenen Diskussion
R sIn − A −B 0 U12 = . (6.81) R Im P 0 U22
Dekomposition und minimale Realisierungen
349
Zul¨ assig sind nur solche m × n−Matrizen P , f¨ ur die die (n + m) × (n + m)− Polynommatrix auf der linken Seite von (6.81) unimodular wird. Damit im wesentlichen gleichwertig ist die Forderung sIn − A −B = 1. (6.82) det P 0 L R L R Die allgemeing¨ ultige B´ezout sche Identit¨ at U11 ·U12 + U12 ·U22 = Im impliziert mit der Behauptung (6.80) eine zweite Forderung an die Matrix P , n¨amlich R P · U12 = Im .
(6.83)
Hat man eine m × n−Matrix P gefunden, die die Bedingungen (6.82) und (6.83) erf¨ ullt, so ergeben sich die Basisgr¨ oßen wegen (6.79) aus der Beziehung Ξ = P · X.
(6.84)
6.4.4.1 Basisgr¨ oßen bei einem skalaren Steuereingang F¨ ur zustandssteuerbare Systeme mit einer skalaren Steuergr¨oße, also m = 1, R R liegt eine geeignete teilerfremde rechte Mbd (U12 , U22 ) von Anfang an vor. Man kann sogleich von R U22 = det(sIn − A),
R U12 = (sIn − A)adj b
(6.85)
ausgehen. Die Basisgr¨ oße Ξ wird jetzt ein Skalar, definiert durch R −1 Ξ = (U22 ) · U = (det(sIn − A))−1 · U.
Sie soll, so wurde ´ın Gl. (6.84) behauptet, darstellbar sein in der Form Ξ = pT · X. Die Forderungen (6.82) und (6.83) reduzieren sich wegen m = 1 auf sIn − A −b = 1. det pT 0
(6.86)
Der Vektor p ∈ Rn wird durch (6.86) eindeutig bestimmt. Verm¨oge einiger Determinanten- und Matrizenmanipulationen l¨asst sich aus (6.86) folgern, dass der Vektor p auch mit Hilfe der Kalmanschen Steuerbarkeitsmatrix S aus dem linearen Gleichungssystem pT (b, Ab, ..., An−2 b, An−1 b) = pT S = eTn . berechnet werden kann.
(6.87)
350
6 Beschreibung von LTI-Systemen durch Polynommatrizen
Beispiel 6.18 Im Beispiel 6.16 wurde die Zustandssteuerbarkeit des verschieblichen N -fach-Pendels, das lediglich von der Stellkraft F gesteuert wird, behandelt. Wir wollen an die Ergebnisse des Beispiels 6.16 ankn¨ upfen, setzen deshalb n = 2N + 2 und fragen nach dem Vektor pT = (p0 , p1 , p2 , ..., p2N , p2N+1 ), der (6.86) gen¨ ugt. Die polynomiale Gleichung (6.86) darf hier in der Form s −1
0 0 0 0 det 0 .. . 0 0
0
0
0
0
···
0
0
0
s
0
0
0
0
···
0
0
− m10
0
s
−1
0
0
···
0
0
0
0 − lg1 s+ md1l2
0
0
···
0
0
− m10 l1
0
0
s
−1
···
0
0
0
s+ md2l2 2 2
···
0
0
− m10 l2
1 1
0
0
0
0
− lg2
.. .
.. .
.. .
.. .
.. .
..
.
.. .
.. .
0
0
0
0
0
···
s
−1
0
0
0
0
0
g · · · − lN s+ mdNl2 − m01lN
p0 p1 p2
p3
p4
p5
0
N N
· · · p2N
p2N+1
=1
(6.88)
0
geschrieben werden. Wenn man alle Drehreibungskoeffizienten dν = 0 (ν = 1,. . . , N ) annimmt, l¨ asst sich das Gleichungsystem (6.87) auf Grund seiner sehr speziellen Struktur mit einiger M¨ uhe noch symbolisch l¨ osen und man erh¨ alt den gesuchten Vektor zu
l N
m0 pT = (−1)N
i
i=1 gN
1, 0,
(l−l − l ) , 0 , N 1
1
j
(l−l − l ) , 0 N N
··· ,
j =1
N
j
.
(6.89)
j =N
Beweis: Die Kalmansche Steuerbarkeitsmatrix S kann unter der Voraussetzung d1 = 0, . . . , dN = 0 aus (6.73) ermittelt werden 0 1 0
S = b0 , Ab0 , . . . , A2N+1 b0 =
0 .. . 0
1 l1
1 m0
1 l2
1 lN
1 0 1 l1
0 0 0
0 0 g l2 1
g l2 1
0
1 l2
0
g l2 2
0
g l2 2
0
0
0 0 0
0 ... 0 ... g2 ... l3
0 0 0
g2 l3 1
0 ...
gN 1 lN+ 1
0 g2 l3 2
1
g2 l3 2
...
0 ... ..
1 lN
0
g l2 N
0
g l2 N
0
0 g2 l3 N
g2 l3 N
0 gN 1 lN+ 2
.
...
0 ...
0 gN 1 lN+ N
0 0 gN 1 lN+ 1
0 gN N+1 l2
0 .. . gN N+1 lN
0
.
Dekomposition und minimale Realisierungen
351
Das Gleichungsystem (6.87) zerf¨ allt hier in zwei separat l¨ osbare Teilsysteme, einerseits f¨ ur den Teilvektor pT(0) := p0 p2 p4 . . . p2N und andererseits f¨ ur den Teilvektor pT(1) := p1 p3 p4 . . . p2N+1 . Der Vektor pT(0) muss die Gleichungen
1
0
1 l1 1 T l p(0) 2 . ..
g l2 1
0 ... g2 ... l3
g l2 2
g l3 2
1 2
g2 l3 N
g
1 lN
l2 N
g 1 lN+ 1 N g 1 lN+ 2 N
... ..
0
.. .
.
= m0 eTN+1
(6.90)
gN N+1 lN
...
erf¨ ullen. Die Koeffizientenmatrix kann auf einen aus der klassischen Determinantentheorie bekannten Typ symbolisch invertierbarer Matrizen – eine sog. VandermondeMatrix11 – zur¨ uckgef¨ uhrt und daher symbolisch invertiert werden. Die allgemeine Vandermonde-Matrix 1 λ0 λ20 . . . λN 0 1 1 V = . . .
λ22 . . . λN 2 .. . . .. . . .
λ1 λ21 . . . λN 1 λ2 .. .
1 λN λ2N . . . λN N wird durch eine leichte Umformulierung von (6.90) sichtbar, pT(0)
1 1 l1
1 l2
..
. 1 lN
1 0
1 1 . ..
1
g l1 g l2
g lN
0
...
g l1
...
g l2
g lN
2 2
... ..
2
.
...
N g l 1 N g T l2 = m0 eN+1 , .. . N
0
g lN
V
g f¨ ur i = 1 , . . . , N zu setzen ist. li F¨ ur unsere Zwecke wird nur die letzte Zeile von V −1 ben¨ otigt. Diese entnimmt man einem Standardlehrbuch u ¨ ber Determinanten- und Matrizenrechnung, z.B. [Zur61], oder auch [RS76], S. 202, [Wei91], S. 628:
wobei λ0 = 0 und λi =
eTN+1 V −1 = −
(−1)N gN
N i=1
li
−1,
l(l
N −1 1 1 −lj ) j=1
,
l(l −l ) , . . . , l(l
N −1 2 2 j j=2
j=N
N −1 N N −lj )
Damit wurde der Teilvektor pT(0) gefunden: 11
Zu Ehren des Pariser Mathematikers A.-T. Vandermonde (1735-1796)
.
352
6 Beschreibung von LTI-Systemen durch Polynommatrizen pT(0)
=
m0 (−1)N+1 N g
N l l l −1, (l −l ) , (l −l ) , . . . , (l li N −1 1 1 j j=1
i=1
N −1 2 2 j j=2
j=N
N −1 N N −lj )
Der zweite Teilvektor pT(1) gen¨ ugt einem Gleichungsystem mit der regul¨ aren Koeffizientenmatrix aus (6.90), aber einem Nullvektor auf der rechten Seite. Folglich gilt pT(1) = 0T . Die Behauptung (6.89) ist damit vollst¨ andig bewiesen. qed. Aus (6.89) folgt ohne weiteres im Zeitbereich eine Basissignaldarstellung in der Gestalt N
li N N i=1 x0(t) − (llνν − lj ) ϕν (t) . gN
m0 ξ(t) = pT x(t) = (−1)N
ν=1
j =ν
Die Bestimmung und Interpretation des Basissignals wird wesentlich komplizierter, wenn man von der Annahme verschwindender Drehreibungen absieht. F¨ ur den einfachsten Fall N = 1, also das u ¨ bliche Schulbeispiel des inversen Pendels“, ” liefert die Auswertung der Determinante (6.88) den Vektor pT = (p0 , p1 , p2 , p3 ) = − mithin als Basissignal ξ(t) = −
m 0 l1 g
x0 (t) +
m 0 l1 g
1,
d1 d21 d1 , −l1 − , − gm1 l1 gl1 m21 gm1
d1 d21 · x˙ 0 (t) − l1 + gm1 l1 gl1 m21
ϕ1 (t) −
,
d1 ϕ˙ 1 (t) gm1
.
6.4.4.2 Basisgr¨ oßen bei einem mehrkomponentigen Steuereingang Bei vektorwertigen Eingangssignalen, also f¨ ur u(t) ∈ Rm mit m > 1, sind die Verh¨ altnisse verwickelter. Zum einen l¨ asst sich die teilerfremde rechte Mbd R R (U12 , U22 ) nicht mehr so einfach angeben. Zum anderen ist die Kalmansche Steuerbarkeitsmatrix S zwar zeilenregul¨ ar, aber nicht quadratisch und deshalb nicht mehr unmittelbar zur Konstruktion der Basisgr¨oßen verwendbar. Um die aus der B´ezout schen Identit¨ at resultierende zweite Bedingung R R (6.83) nachzuweisen, m¨ ussen wir uns eine teilerfremde rechte Mbd (U12 , U22 ) in geigneter allgemeiner Darstellung beschaffen. Bei mehrkomponentigen Steuergr¨ oßen ist es keine triviale Aufgabe, zum gegebenen zustandssteuerR R baren System (6.67) ein Polynommatrizenpaar (U12 , U22 ) zu konstruieren, ¨ das eine teilerfremde rechte Mbd der n × m-Ubertragungsmatrix Gxu liefert. ¨ Wenn man den K¨ onigsweg“ der sukzessiven Uberf¨ uhrung des gegebenen ” Matrizenpaares (sIn − A, −B) in die Hermitesche Normalform (In , 0), vgl. (6.76) auf Seite 347, nicht gehen will, kann man auch auf dem schmalen Grat u ¨ ber eine spezielle Transformation des gegebenen zustandssteuerbaren Systems (6.67) in eine regelungstechnisch gern genutzte Standardform, die so
Dekomposition und minimale Realisierungen
353
genannte Regelungs- oder Steuerungsform, zum Ziele gelangen. Dieser Option wollen wir uns nun zuwenden. Aus der n × (n · m)-Steuerbarkeitsmatrix S = (B, AB, ..., An−1 B) kann man wegen Rg S = n auf mannigfache Art n linear unabh¨angige Spaltenvektoren ausw¨ ahlen. Um eine geeignete regul¨are Auswahlmatrix der Struktur SS = b1 , Ab1 , . . . , Aκ1 −1 b1 | . . . |bm , Abm , . . . , Aκm −1 bm systematisch aus der n×(n·m)-Steuerbarkeitsmatrix S zu extrahieren, denken wir uns deren Spalten in einem Schema wie folgt angeordnet: b1 Ab1 .. .
b2 Ab2 .. .
··· ···
bm Abm .. .
(6.91)
An−1 b1 An−1 b2 · · · An−1 bm F¨ ur unsere Zwecke f¨ uhrt die folgende Strategie, die alle m Eingangskomponenten m¨ oglichst gleichberechtigt ins Spiel zu bringen sucht, zum Ziel: Das Schema (6.91) wird zeilenweise nach der maximalen Anzahl der der Auswahlmenge hinzuf¨ ugbaren linear unabh¨ angigen Elemente durchgemustert. Die erste Zeile liefert die Anzahl z1 = RgB, d. h. z1 = m, falls die Matrix B spaltenregul¨ ar ist. Die zweite Zeile liefert eine Anzahl z2 ≤ z1 usw. Es sei ν der gr¨ oßte Zeilenindex, der noch zur Erzeugung einer regul¨aren n × nAuswahlmatrix SS ben¨ otigt wird. Dann gilt z1 + z2 + . . . + zν−1 < n z1 + z2 + . . . + zν−1 + zν = n Rg(B, AB, . . . , Aν−1 B) = n. Man bezeichnet ν als den Steuerbarkeitsindex des Paares (A, B). Aus dem Zahlensatz {z1 , z2 , . . . , zν } lassen sich auch die zugeh¨orenden Indizes κ1 , κ2 , . . . , κm ablesen, und zwar der Gr¨oße nach geordnet: κi1 ≥ κi2 ≥ . . . ≥ κim ≥ 0, wobei κiµ = Anzahl der Elemente aus {z1 , . . . , zν } mit Werten ≥ µ und
m µ=1
κiµ = n.
354
6 Beschreibung von LTI-Systemen durch Polynommatrizen
Die Indizes κi1 , κi2 , . . . , κim werden zu Ehren des Berliner Mathematikers Leopold Kronecker (1823-1891), der die mathematische Struktur von Matrizenscharen erforscht hat, als Kroneckersche Steuerbarkeitsindizes des Matrizenpaares (A, B) bezeichnet. Beispiel 6.19 Dieser Sachverhalt sei f¨ur n = 7, m = 3 und κ1 = κi2 = 2, κ2 = κi1 = 4, κ3 = κi3 = 1 illustriert: Im Schema (6.91) wurden die Elemente b1 b2 b3 Ab1 Ab2 A2 b2 A3 b2 zum Aufbau der Auswahlmatrix SS herangezogen. Dabei waren aufgrund der Konstruktionsvorschrift der Kronecker schen Steuerbarkeitsindizes die Vektoren Ab3 , A2 b1 , A2 b3 bzw. A3 b1 als Linearkombinationen Ab3 = α1 b1 + α2 b2 + α3 b3 + α4 Ab1 + α5 Ab2 A2 b1 = β1 b1 + β2 b2 + β3 b3 + β4 Ab1 + β5 Ab2 A2 b3 = γ1 b1 + γ2 b2 + γ3 b3 + γ4 Ab1 + γ5 Ab2 + γ6 A2 b2 bzw.
A3 b1 = δ1 b1 + δ2 b2 + δ3 b3 + δ4 Ab1 + δ5 Ab2 + δ6 A2 b2
erkannt worden. Die Auswahlmatrix lautet
SS = b1 , Ab1 | b2 , Ab2 , A2 b2 , A3 b2 | b3 .
Zur so konstruierten n × n-Auswahlmatrix SS = b1 , Ab1 , . . . , Aκ1 −1 b1 | . . . | bm , Abm , . . . , Aκm −1 bm berechnen wir m Zeilenvektoren pT1 , . . . , pTm durch L¨osen des linearen algebraischen Gleichungssystems ⎛ T⎞ ⎛ T ⎞ p1 e κ1 ⎜ pT2 ⎟ ⎜ eTκ +κ ⎟ ⎜ ⎜ 1 2⎟ ⎟ (6.92) ⎜ .. ⎟ SS = P · SS = ⎜ .. ⎟ . ⎝ . ⎠ ⎝ . ⎠ pTm
eTn
Satz 6.17 F¨ ur ein zustandssteuerbares Modell x˙ = Ax + Bu mit A, B ∈ Rn×(n+m) und Kroneckerschen Steuerbarkeitsindizes κ1 , κ2 , ..., κm erf¨ ullt die reelle m × n-Matrix ⎛ T ⎞ ⎛ T ⎞ e κ1 e κ1 ⎜eTκ +κ ⎟ ⎜eTκ +κ ⎟ −1 ⎜ 1 2⎟ ⎜ 1 2⎟ P = ⎜ . ⎟ S−1 = ⎜ . ⎟ b1 , . . . , Aκ1 −1 b1 | . . . |bm , . . . , Aκm −1 bm ⎝ .. ⎠ S ⎝ .. ⎠ eTn eTn (6.93)
Dekomposition und minimale Realisierungen
355
die Unimodularit¨atsbedingung (6.82), also sIn −A −B =1. det P 0 Aus dem Vektor Ξ := P · X R lassen sich eine Polynommatrix U22 , die den f¨ ur Basisgr¨oßen fundamentalen Zusammenhang R U22 ·Ξ = U R R , die der Beziehung X = U12 ·Ξ gen¨ ugt, herstellt, und eine Polynommatrix U12 so konstruieren, dass auch die Forderung (6.83), also R P · U12 = Im ,
erf¨ ullt wird. Beweis: Der erl¨ auterte Aufbau der regul¨ aren Auswahlmatrix SS hat bemerkenswerte Auswirkungen: SS · (e1 , eκ1 +1 , . . . , en−κm +1 ) = B, ⎛
00 ⎜1 0 ⎜ ⎜ .. .. ⎜. . ⎜ ⎜0 0 ⎜ ⎜0 0 ⎜ ⎜ ASS = SS ⎜ ... ... ⎜ ⎜0 0 ⎜ ⎜0 0 ⎜ ⎜. . ⎜ .. .. ⎜ ⎝0 0
... 0 ∗ ... 0 ∗ . . .. .. . . . ... ... 0 ∗ ... 1 ∗ . . .. .. . . . . . . ... 0 ∗ ... 0 ∗ . . .. .. . . . ...
... 0 ∗ 0 0 ... 0 ∗
00 00 .. .. . .
... 0 ... 0 . . .. . .
00 00 .. .. . . 00 10 .. .. . .
... 0 ... 0 . . .. . . ... 0 ... 0 . . .. . .
⎞ ∗ ∗⎟ ⎟ .. ⎟ .⎟ ⎟ ∗⎟ ⎟ ∗⎟ ⎟ .. ⎟ . .⎟ ⎟ ∗⎟ ⎟ ∗⎟ ⎟ .. ⎟ .⎟ ⎟ ∗⎠
0 0 ... 0 0 0 ... 1 ∗
Nach dieser Vorbereitung l¨ asst sich die Unimodularit¨atsbedingung (6.82) so verifizieren: ( −1 ) sIn − A −B SS 0 sIn − A −B SS 0 det = det P 0 P 0 0 Im 0 Im −1 sIn − S−1 S ASS −SS B = det P SS 0
356
6 Beschreibung von LTI-Systemen durch Polynommatrizen
⎛
s 0 . . . 0 −∗ ⎜ −1 s . . . 0 −∗ ⎜ ⎜ 0 −1 . . . 0 −∗ ⎜ ⎜ .. .. . . . .. ⎜ . . . .. . ⎜ ⎜ 0 0 . . . s −∗ ⎜ ⎜ 0 0 . . . −1 s − ∗ ⎜ ⎜ .. ⎜ . ⎜ ⎜ 0 0 . . . 0 −∗ ⎜ = det ⎜ 0 0 . . . 0 −∗ ⎜ ⎜ 0 0 . . . 0 −∗ ⎜ ⎜ . .. .. ⎜ . . . . .. . . ⎜ . . ⎜ ⎜ 0 0 . . . 0 −∗ ⎜ ⎜ 0 0 . . . 0 −∗ ⎜ ⎜ 0 0 ... 0 1 ⎜ ⎜ ⎝ 0
...
..
.
...
..
.
⎞ −∗ −1 ⎟ −∗ 0 ⎟ ⎟ −∗ 0 ⎟ ⎟ .. .. ⎟ . . 0 ⎟ ⎟ 0 0 . . . 0 −∗ 0 ⎟ ⎟ 0 0 . . . 0 −∗ 0 ⎟ ⎟ .. .. ⎟ . . ⎟ s 0 . . . 0 −∗ −1 ⎟ ⎟ = 1. −1 s . . . 0 −∗ 0⎟ ⎟ ⎟ 0 −1 . . . 0 −∗ 0⎟ .. ⎟ .. .. . . .. .. ⎟ 0 .⎟ . . . . . ⎟ 0 0 . . . s −∗ 0⎟ ⎟ 0 0 . . . −1 s − ∗ 0⎟ ⎟ ⎟ ⎟ ⎟ ⎠ 0 0 0 0 ... 0 1 0 0 0 .. .
0 ... 0 ... 0 ... .. . . . .
0 0 0 .. .
R R Wir wenden uns nun der Aufgabe zu, eine teilerfremde rechte Mbd (U12 , U22 ) u ¨ ber eine Transformation des gegebenen zustandssteuerbaren Systems (6.67) in eine bekannte Standardform, die so genannte Regelungs- oder Steuerungsform, zu gewinnen und werden diese Aufgabe in drei Schritten l¨osen. In einem ersten L¨ osungsschritt wird eine Transformation der Zustandsraum-Darstellung vorgenommen. Nach Ermittlung der Kronecker indizes κ1 , · · · , κm und der m × n−Matrix P wird die (regul¨are) Transformationsmatrix ⎛ T ⎞ p1 ⎜ pT1 A ⎟ ⎜ ⎟ ⎜ .. ⎟ ⎜. ⎟ ⎜ T κ −1 ⎟ ⎜ p1 A 1 ⎟ ⎜ ⎟ (6.94) T = ⎜. ⎟. ⎜ .. ⎟ ⎜ ⎟ ⎜ pT ⎟ ⎜ m ⎟ ⎜. ⎟ ⎝ .. ⎠ T κm −1 pm A
= T x gen¨ gebildet. Der transformierte Zustandsvektor x ugt dem Gleichungssystem ˙ = T AT −1 x + T Bu x = A x + Bu.
(6.95)
l¨ = TA Die transformierte Systemmatrix A asst sich aus der Beziehung AT rein buchhalterisch zeilenweise ablesen. Die ν-te Zeile von T A wird (f¨ ur
Dekomposition und minimale Realisierungen
357
ν = κ1 , κ1 + κ2 , . . . , n) der Einheitsvektor eTν+1 , w¨ahrend sich die κ1 -te Zeile (T A)κ1 • = pT1 Aκ1 zweifellos als Linearkombination aller Zeilen von T darstellen l¨ asst. Das gilt gleichermaßen f¨ ur die Zeilen κ1 + κ2 , . . . , n. Man erh¨alt ⎛
= T AT −1 A
11 (A) ⎜ .. =⎝ . m1 (A)
⎞ 1m · · · (A) ⎟ .. .. ⎠. . . · · · (A)mm
µµ haben κµ Zeilen und κµ Spalten und die Die Hauptdiagonalbl¨ ocke (A) Form ⎞ ⎛ 0 1 0 ··· 0 ⎜0 0 1 ··· 0⎟ ⎟ ⎜ ⎟ ⎜ (A)µµ = ⎜ ... ... ... . . . ... ⎟ , ⎟ ⎜ ⎝0 0 0 ··· 1⎠ ∗ ∗ ∗ ··· ∗ µν (µ = ν) aus κµ Zeilen und κν Spalten w¨ ahrend die u ocke (A) ¨ brigen Bl¨ bestehen. Sie sind von der Form ⎛ ⎞ 0 0 ··· 0 ⎜ .. .. . . .. ⎟ ⎟ µν = ⎜ (A) ⎜ . . . . ⎟. ⎝0 0 ··· 0⎠ ∗ ∗ ··· ∗ = T B hat m Spalten. Jede dieser Die transformierte Eingangsmatrix B Spalten setzt sich aus m u bereinander gestapelten Teilvektoren der L¨ange ¨ κ1 , κ2 , . . . , κm zusammen. In der Spalte µ erscheint als µ-ter Teilvektor der Einheitsvektor eκµ . Von Null verschiedene Eintr¨age findet man nur in den BZeilen κ1 , κ1 + κ2 , . . . , n. Die Eintr¨ age in den u brigen Zeilen ergeben sich f¨ u r ¨ µ, ν = 1, . . . , m zu pTµ Aκµ −i bν mit 1 < i ≤ κµ . Sie verschwinden ausnahmslos aufgrund der Definition (6.92) der Vektoren pTµ und der Konstruktion der
µ * Kronecker schen Indizes. An den Stellen κj , ν erhalten wir pTµ Aκµ −1 bν j=1
f¨ ur µ, ν = 1, . . . , m, mithin die Zahlenwerte 1 f¨ ur µ = ν und 0 f¨ ur κµ < κν oder µ < ν. Beispiel 6.20 Wenn beispielsweise bei n = 7 Zustandsvariablen und m = 3 Steuersignalen die Indizes κ1 = 2, κ2 = 4, κ3 = 1 als Kronecker sche Steuerbarkeitsindizes ermittelt wurden, so gen¨ ugt der transformierte Zustandsvektor x = T x dem Gleichungssystem x˙ = Ax + Bu, mit
358
6 Beschreibung von LTI-Systemen durch Polynommatrizen
A = T AT −1
=
0 ∗ 0 0 0 ∗ ∗
1 ∗ 0 0 0 ∗ ∗
0 ∗ 0 0 0 ∗ ∗
0 ∗ 1 0 0 ∗ ∗
0 ∗ 0 1 0 ∗ ∗
0 ∗ 0 0 1 ∗ ∗
0 ∗ 0 0 0 ∗ ∗
000 1 0 ∗ 0 0 0 . = TB = 0 0 0 , B 0 0 0 0 1 ∗ 001 pTµ x
lassen sich die Komponenten des Nach Einf¨ uhrung der m = 3 Gr¨ oßen ξµ := transformierten Zustandsvektors x = T x wie folgt durch diese ausdr¨ ucken:
= ( x x x x x ...x x ) x 1
2
3
4
5
6
7
T
= ( ξ1 ξ˙1 ξ2 ξ˙2 ξ¨2 ξ 2 ξ3 )T .
Die κ1 -te = zweite, (κ1 + κ2 )-te = sechste und die (κ1 + κ2 + κ3 )-te = siebente Gleichung des transformierten Zustandsgleichungssystems sehen ausgeschrieben so aus: ... ξ¨1 − a21 ξ1 − a22 ξ˙1 − a23 ξ2 − a24 ξ˙2 − a25 ξ¨2 − a26 ξ 2 − a27 ξ3 = u1 + b23 u3 ... (4) ξ2 − a61 ξ1 − a62 ξ˙1 − a63 ξ2 − a64 ξ˙2 − a65 ξ¨2 − a66 ξ 2 − a67 ξ3 = u2 + b63 u3 ... ξ˙3 − a71 ξ1 − a72 ξ˙1 − a73 ξ2 − a74 ξ˙2 − a75 ξ¨2 − a76 ξ − a77 ξ3 = u3
2
Damit wurden drei Differentialgleichungen f¨ ur die drei Signale ξ1 (t), ξ2 (t), ξ3 (t) erzeugt.
Nun kann in einem zweiten L¨ osungsschritt der gefragte Zusammenhang R · Ξ = U im Bildbereich aufgedeckt werden. Das Zustands-DifferentialU22 gleichungssystem (6.95) geht durch Laplace-Transformation u ¨ ber in das algebraische Gleichungssystem X =B · U. (sIn − A)
(6.96)
Durch die Laplace-Transformation entstehen aus den Ableitungsfolgen ξµ , ξ˙µ , (κ −1) . . . , ξµ µ die s-Potenzfolgen Ξµ , sΞµ , . . . , sκµ −1 Ξµ . Setzt man = Ξ1 , sΞ1 , . . . , sκ1 −1 Ξ1 , · · · , Ξm , sΞm , . . . , sκm −1 Ξm T , X so sind in (6.96) nur noch die m Zeilen κ1 , κ1 + κ2 ,. . . , n von Bedeutung. Die u ussig geworden. ¨brigen definitorischen n − m Gleichungen sind u ¨ berfl¨ auf Außerdem haben sich die n unbekannten Komponenten des Vektors X die m unbekannten Komponenten des Vektors Ξ = (Ξ1 , Ξ2 , . . . , Ξm )T reduziert. In dem verbleibenden m × m-Gleichungssystem ⎛ ⎞ ⎛ ⎞ Ξ1 U1 ⎜ Ξ2 ⎟ ⎜ U2 ⎟ ⎜ ⎟ ⎟ red ⎜ W ·⎜ . ⎟= B ⎜ .. ⎟ ⎝ .. ⎠ ⎝ . ⎠ Ξm
Um
(6.97)
Dekomposition und minimale Realisierungen
359
stehen die folgenden Eintr¨ age f¨ ur die Hauptdiagonalelemente von W (s) : aκ1 +...+κµ ,κ1 +...+κµ · sκµ −1 − · · · wµµ (s) = sκµ − aκ1 +...+κµ ,κ1 +...+κµ−1 +1 , − aκ1 +...+κµ ,κ1 +...+κµ−1 +2 · s − und f¨ ur die u ¨brigen Elemente: aκ1 +...+κν ,κ1 +...+κµ · sκµ −1 − · · · wνµ (s) = − aκ1 +...+κν ,κ1 +...+κµ−1 +1 , − aκ1 +...+κν ,κ1 +...+κµ−1 +2 · s − red -Elemente: sowie f¨ ur die B bred = bκ +...+κ ,ν µν 1 µ
f¨ ur
ν, µ = 1, . . . , m .
Aus der Herleitung des Gleichungssystems (6.97) ergibt sich die Determinante der Polynommatrix W (s) zu = det(sIn − A), det W (s) = det(sIn − A)
red
= 1.
det B
(6.98)
Wir setzen jetzt R red )−1 · W := (B U22
(6.99)
R · Ξ = U gefunden. und haben damit den gesuchten Zusammenhang U22 R Im dritten L¨ osungsschritt ermitteln wir eine Polynommatrix U12 , die der R ugt, und verifizieren die aus der B´ezout schen Beziehung X = U12 · Ξ gen¨ Identit¨ at stammende Forderung (6.83), n¨ amlich R P · U12 = Im .
Wegen
⎛
1 ⎜s ⎜ ⎜ .. ⎜. ⎜ κ1 −1 ⎜s ⎜ ⎜0 ⎜ ⎜0 ⎜ ⎜. = ⎜ .. X ⎜ ⎜0 ⎜ ⎜. ⎜ .. ⎜ ⎜0 ⎜ ⎜0 ⎜ ⎜. ⎝ .. 0
0 0 .. .
... 0 ... 0 . . .. ..
0 1 s .. .
... 0 ... 0 ... 0 . . .. ..
sκ2 −1 .. . 0 0 .. .
... 0 . . .. .. ... 1 ... s . . .. ..
0
. . . sκm −1
⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ · Ξ =: K · Ξ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
360
6 Beschreibung von LTI-Systemen durch Polynommatrizen
erhalten wir und X = T −1 X R U12 = T −1 · K.
Aus den Gln. (6.92) und ⎛ eT1 ⎜ eTκ +1 1 ⎜ ⎜ .. ⎝ .
(6.100)
(6.94) folgt ⎛ ⎞
⎛ T ⎞ ⎞ pT1 e κ1 ⎜ pT2 ⎟ ⎜eTκ +κ ⎟ ⎟ ⎜ ⎟ ⎜ 1 2⎟ ⎟ ⎟ (T SS ) = ⎜ .. ⎟ SS = ⎜ .. ⎟ . ⎝ . ⎠ ⎝ . ⎠ ⎠ eTn−κm +1 pTm eTn
Damit wird ⎛
eTκ1
⎞
⎛
eTκ1
⎞
⎛
eT1
⎞
⎜eTκ +κ ⎟ ⎜eTκ +κ ⎟ ⎜ eTκ +1 ⎟ 1 ⎜ 1 2⎟ ⎜ 1 2⎟ ⎜ ⎟ R −1 −1 P ·U12 (T S = ⎜ . ⎟ S−1 T K = ) K = ⎜ ⎜ ⎟ ⎟K = Im , . .. S S . . ⎝ . ⎠ ⎝ . ⎠ ⎝ ⎠ . eTn eTn eTn−κm +1 wie gezeigt werden sollte.
qed.
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
7.1 Einfu ¨hrung Zeitdiskrete Signale sind auf einer diskreten Menge von Zeitpunkten definiert, die man ohne Beschr¨ ankung der Allgemeinheit in die Menge der nat¨ urlichen Zahlen abbilden darf. An die Stelle der zeitkontinuierlichen Signale, beispielsweise x(t) mit t ∈ R, treten die Wertefolgen, z. B. {x[k]} = {x[0], x[1], x[2], . . .}. Ein zeitdiskretes MIMO-Prozessmodell transformiert eine Eingangswertefolge {u[k]} in eine Ausgangswertefolge {y[k]}. Die Tranformationsbeziehungen lassen sich als Differenzengleichungen bez¨ uglich des diskreten Zeitparameters k = 0, 1, 2, . . . schreiben. Nach Einf¨ uhrung eines Linksverschiebe-Operators z der durch seine Wirkung z y[k] = y[k + 1] ,
z u[k] = u[k + 1]
definiert wird, gewinnt man aus dem Differenzengleichungssystem eine R[z]–polynomiale Regelstreckenbeschreibung AP (z)y[k] + BP (z)u[k] = 0 mit den Polynommatrizen AP ∈ (R[z])r×r und BP ∈ (R[z])r×m . Dieses Regelstreckenmodell PZ kann mit einem zeitdiskret arbeitenden Regler KZ zum zeitdiskreten Standardregelkreis gem¨aß Bild 7.1 erg¨anzt werden. W¨ ahlt man den Regler in der Gestalt AK (z)v[k] + BK (z)e[k] = 0 mit AK ∈ (R[z])r×m und BK ∈ (R[z])m×r , so erzeugt ein wohldefinierter zeitdiskreter MIMO-Standardregelkreis die Prozesssteuerwertefolge {u[k]} und die Reglereingangswertefolge {e[k]} aus den voneinander unabh¨angigen exogenen Wertefolgen {r[k]} und {z[k]} gem¨ aß der Beziehung
362
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise z[k] r[k]
e[k]
KZ
v[k]
u[k]
y[k] PZ
Bild 7.1. Zeitdiskreter Standard-Regelkreis
−1 AP −BP e[k] AP 0 r[k] r[k] = =: GZ (z) · . 0 AK u[k] z[k] z[k] BK AK
Der Reglerentwurf erscheint nun als algebraische Aufgabe: Zum gegebenen Prozessmodell (AP , −BP ) soll ein Polynommatrizenpaar ¨ (AK , BK ) so konstruiert werden, dass die rationale (r + m) × (r + m)−Ubertragungsmatrix GZ (z) w¨ unschenswerte Eigenschaften besitzt. Das geregelte System ist genau dann stabil, wenn das R[z]− Polynom AP −BP det =: CLCP (z) BK AK nur Nullstellen besitzt, die betragskleiner 1 sind. F¨ ur die regelungstechnische Praxis bedeutsamer und f¨ ur das theoretische Verst¨ andnis anspruchsvoller als zeitdiskrete Regelkreise sind die Abtastregelkreise. Bei ihnen wird von der Tatsache ausgegangen, dass beim heutigen Stand der informationsverarbeitenden Technik in erster Linie digital arbeitende Regler eingesetzt werden, w¨ ahrend der zu beeinflussende Prozess seinem Charakter gem¨ aß zeitkontinuierlich abl¨ auft. Deshalb m¨ ussen die zeitkontinuierlich anfallenden Prozesssignale abgetastet und in einem AnalogDigital-Umsetzer (ADC) zur Wertefolge, die im Regler digital verarbeitet wird, gewandelt werden. Aus der im Regler berechneten Wertefolge wird mit Hilfe eines Digital-Analog-Umsetzer (DAC) wieder ein zeitkontinuierliches Signal erzeugt, das als Steuersignal auf den realen Prozess einwirken kann. ¨ Ublicherweise erfolgt die Abtastung a ¨quidistant mit einer prozessspezifisch fixierten Abtastperiode T. Am h¨ aufigsten werden f¨ ur die D-A-Wandlung Halteglieder nullter Ordnung eingesetzt. Dar¨ uberhinaus gehend werden im Abschnitt 7.5.1 auch kompliziertere Halteglieder untersucht und dabei gezeigt, ¨ dass interpolierende Halteglieder als akausale Ubertragungssysteme (im Sinne des Abschnitt 2.3.3) einzustufen sind. Bei der zeitdiskreten Beschreibung des Abtastregelkreises (vgl. Bild 7.2) wird offenbar, dass das Stabilit¨ atsverhalten des Abtastregelkreises von der Abtastperiode abh¨ angt. Wenn man das zeitliche Verhalten der Signale zwischen den Abtastzeitpunkten exakt beschreibt, wird erkennbar, dass die Halteglieder keine zeit¨ invarianten Ubertragunggssysteme sind, sondern als zeitvariante, aber T¨ periodische Ubertragungsoperatoren wirken. Deshalb reichen die von
7.2 Zeitdiskrete lineare Prozessmodelle
363
z r
e
Abtastglied (ADC)
Digitaler Regler algor(e[k]) = v[k]
Halteglied (DAC)
vH
u Prozess & Stellglied
y
x
Meßglied
Regelungseinrichtung Bild 7.2. Struktur eines MIMO-Abtastregelkreises
¨ den LTI-Systemen her gel¨ aufigen Ubertragungsfunktionen zur zeitkontinuierlichen Beschreibung von Abtastregelkreisen nicht mehr aus. Es wird gezeigt, ¨ ¨ dass das Konzept der parametrischen Ubertragungsfunktionen (PUF) eine geeignete Verallgemeinerung bietet. Diese werden im Abschnitt 7.5.3 gr¨ undlich studiert. Auf die m¨ oglicherweise auftretenden neuartigen Schwierigkeiten – als Schlagwort sei pathologische Abtastfrequenzen genannt – wird im Detail eingegangen. Das Kapitel endet mit der Herleitung von geschlossenen Formeln f¨ ur die pa¨ rametrischen Ubertragungsmatrizen in MIMO-Abtastregelkreisen.
7.2 Zeitdiskrete lineare Prozessmodelle Ein zeitdiskretes Prozessmodell gibt an, wie eine Eingangswertefolge {u[k]} = {u[0], u[1], u[2], . . .} in eine Ausgangswertefolge {y[k]} = {y[0], y[1], y[2], . . .} transformiert wird. Die Transformationsbeziehungen k¨onnen als Differenzengleichungen bez¨ uglich des diskreten Zeitparameters k = 0, 1, 2, . . . notiert werden: Al y[k + l] + Al−1 y[k + l − 1] + . . . + A1 y[k + 1] + A0 y[k] + Bl u[k + l] + . . . + B0 u[k] = 0 , (7.1) ur λ = 0, 1, . . . , l. wobei y[k + λ] ∈ Rr , u[k + λ] ∈ Rm f¨ Das zeitdiskrete Prozessmodell heißt zeitinvariant, wenn die Koeffizientenmatrizen Aλ ∈ Rr×r , Bλ ∈ Rr×m vom Zeitparameter k nicht abh¨angen. Das Eingangs-/Ausgangsgleichungssystem (7.1) l¨asst sich mit Hilfe eines Linksverschiebe–Operator s z, der durch seine Wirkung z y[k] = y[k + 1] ,
z u[k] = u[k + 1]
364
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
definiert wird, umschreiben in (Al z l + Al−1 z l−1 + . . . + A1 z + A0 ) y[k] + (Bl z l + . . . + B0 ) u[k] = 0. Nach Einf¨ uhrung der Polynommatrizen AP (z) := Al z l + Al−1 z l−1 + . . . + A1 z + A0 BP (z) := Bl z l + Bl−1 z l−1 + . . . + B1 z + B0 ¨ kann man formal eine z-Ubertragungsmatrix GZ definieren und in Gestalt einer linken Matrizenbruchdarstellung (Mbd) −1
y[k] = − (AP (z))
BP (z) u[k] =: GZ (z) u[k]
(7.2)
¨ angeben. Die r · m Eintr¨ age der z-Ubertragungsmatrix GZ sind skalare z¨ Ubertragungsfunktionen, n¨ amlich vom µ-ten Eingang zum -ten Ausgang f¨ ur ¨ µ = 1, . . . , m und = 1, . . . , r. Wir greifen eine solche SISO-z-Ubertragungsfunktion heraus und vergleichen verschiedene Darstellungsformen: b0 z n + b1 z n−1 + · · · + bn z n + a1 z n−1 + · · · + an b0 + b1 z −1 + · · · + bn z −n = 1 + a1 z −1 + · · · + an z −n kλ l γλκ = b0 + mit (z − zλ )κ κ=1
(GZ (z))µ =
λ=1
=
∞
l
kλ = n
λ=1
gµ [k] z −k .
(7.3)
k=0
Die erste Umformung entsteht durch Multiplikation mit z −n im Z¨ahler und Nenner. Die dritte Darstellungsm¨ oglichkeit ist bekannt als die Partialbruchzerlegung einer properen rationalen Funktion in der Unbestimmten z. Hier wurden l voneinander verschiedene (endliche) Polstellen zλ mit den Vielfachheiten kλ (λ = 1, ..., l) an genommen. Die vierte Darstellung entsteht durch Polynomdivision. Um die Gewichtsfolge {gµ [k]} zu berechnen, geht man zweckm¨ aßig von dem Ansatz b0 + b1 z −1 + · · · + bn z −n = (1 + a1 z −1 + · · · + an z −n ) ·
∞
gµ [k] z −k
k=0
aus. Die Gewichtsfolge {gµ [k]} ergibt sich aus der Rekursionsbeziehung gµ [0] = b0 , gµ [1] = b1 − a1 gµ [0], . . . , gµ [k] = bk −
k i=1
ai gµ [k − i], . . . .
7.2 Zeitdiskrete lineare Prozessmodelle
365
¨ Die Reihendarstellungen (7.3) der r · m SISO-Ubertragungsfunktionen ¨ kann man elementweise in die z-Ubertragungsmatrix u ¨ bernehmen, GZ (z) =
∞
g[k]z −k
mit Gewichtsfolgematrizen g[k] ∈ Rr×m .
(7.4)
k=0
Nun folgt aus (7.2) f¨ ur den Ausgangswertevektor y[k] = GZ (z)u[k] ∞ ∞ = g[κ]z −κ u[k] = g[κ]u[k − κ] κ=0
=
k
κ=0
g[κ]u[k − κ] =
κ=0
k
g[k − ν]u[ν]
(7.5)
ν=0
Die Formeln der letzen Zeile bezeichnet man als (zeitdiskrete) Faltungen zwischen Gewichtsfolgematrizen und Eingangswertefolgen. Aus der zuletzt notierten Formel entnimmt man, dass sich die Gewichtsfolgematrix {g[k]} als Systemantwort auf die Einheitsimpulsfolge {u[k]} = {1, 0, 0, 0, . . .} deuten l¨ asst. Man spricht von einer endlichen Gewichtsfolgematrix, wenn g[k] = 0 f¨ ur alle k ≥ k0
f¨ ur festes
k0 ∈ N.
Die Reaktion auf ein Einheitsimpuls-Eingangsfolge verklingt dann nach end¨ lich vielen Zeitschritten. Solche zeitdiskreten Ubertragungssysteme werden oft als FIR-Systeme (finite-duration impulse response systems) bezeichnet. Als wichtige Anwendungsm¨ oglichkeit betrachten wir eine zeitdiskrete Zustandsbeschreibung des Prozesses. Die Zustandsgleichungen eines linearen Automaten (vgl. z.B. [WS93b], S.179) lauten x[k + 1] = Ax[k] + Bu[k] ,
mit
x[k] ∈ Rn ,
k = 0, 1, 2, . . .
y[k] = Cx[k] + Du[k].
(7.6a) (7.6b)
Unter Nutzung des Linksverschiebe–Operators z l¨asst sich aus (7.6) ein Eingangs-/Ausgangsgleichungssystem (7.1) wie folgt gewinnen: Wegen (zIn − A)x[k] = Bu[k] wird y[k] = C(zIn − A)−1 B + D u[k] = (det(zIn − A))−1 · C(zIn − A)adj B + D u[k] = GZ (z) u[k]. (7.7) ¨ Die Gewichtsfolgematrix zu dieser z-Ubertragungsmatrix GZ (z) kann mit Hilfe der binomischen Formel ∞ ∞ −1 (In − z −1 A)−1 = (−z −1 A)k = (Az −1 )k k k=0
k=0
366
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
gewonnen werden,
GZ (z) = z −1 C(In − z −1 A)−1 B + D = z −1 C
∞
Ak z −k
B+D
k=0
=
∞
∞ CAk−1 B z −k + D = g[k]z −k ,
k=1
k=0
mit der Folge von Gewichtsmatrizen g[0] = D,
g[k] = CAk−1 B
f¨ ur
k = 1, 2, . . . .
(7.8)
Die vorangegangenen Betrachtungen mit ihrer eleganten Operatorenschreibweise lassen offen, wie Anfangswerte in die Rechnung einbezogen werden und wie die Anlaufrechnung f¨ ur kleine Werte des Zeitparameters k auszuf¨ uhren ist. Dies l¨ asst sich kl¨ aren, indem man auf das Eingangs-/AusgangsDifferenzengleichungssystem (7.1) die sogenannte z-Transformation anwendet. Dazu ben¨ otigen wir die Definition der z-Transformierten. Sie ordnet einer Wertefolge {x[k]}k∈N eine Potenzreihe im Argument z −1 zu: Z{x[k]} =
∞
x[k] · z −k =: XZ (z),
k=0
Die Eigenschaften der z-Transformierten werden z.B. in [WS93a] ausf¨ uhrlich behandelt. Wir ben¨ otigen hier nur die sog. Linksverschiebungsformel Z{x[k + l]} = Z{x[k]} · z l −
l−1
x[λ]z l−λ ,
λ=0
die sich rasch verifizieren l¨ asst: Z{x[k + l]} =
∞
x[k + l]z −k = x[l] + x[l + 1] · z −1 + x[l + 2] · z −2 + . . .
k=0
= (x[l] · z −l + x[l + 1]z −(l+1) + x[l + 2]z −(l+2) + . . .)z l
l−1 = Z{x[k]} − x[λ] · z −λ z l . λ=0
Mit den z-transformierten Vektoren YZ (z) := Z{y[k]}
und
UZ (z) = Z{u[k]}
erscheint das z-transformierte Gleichungssystem (7.1) in der Form (Al z l + Al−1 z l−1 + . . . + A0 )YZ (z) + (Bl z l + Bl−1 z l−1 + . . . + B0 )UZ (z) = α(z) ,
7.3 Stabilit¨ at zeitdiskreter linearer zeitinvarianter Systeme
wobei α(z) =
367
l λ−1 (Aλ y[κ] + Bλ u[κ])z λ−κ . Daraus folgt λ=1 κ=0
YZ (z) = −(AP (z))−1 BP (z)UZ (z) + (AP (z))−1 α(z) . Anstelle des Operators z kann man auch einen Rechtsverschiebe–Operator ζ, der durch seine Wirkung ζ y[k] = y[k − 1] ,
ζ u[k] = u[k − 1]
definiert wird, einf¨ uhren. Wegen z = ζ −1 erhalten wir u ¨ ber Al ζ −l + Al−1 ζ −l+1 + . . . + A1 ζ −1 + A0 y[k] + Bl ζ −l + . . . + B0 u[k] = 0 eine R[ζ]-polynomiale Prozessbeschreibung (Al + Al−1 ζ + . . . + A1 ζ l−1 + A0 ζ l )y[k] + (Bl + . . . + B0 ζ l )u[k] = 0. Mit den Polynommatrizen P (ζ) := A0 ζ l + A1 ζ l−1 + . . . + Al−1 ζ + Al A P (ζ) := B0 ζ l + B1 ζ l−1 + . . . + Bl−1 ζ + Bl B ¨ gewinnen wir eine linke Mbd der ζ-Ubertragungsmatrix −1 P (ζ)u[k]. P (ζ) B y[k] = − A
7.3 Stabilit¨ at zeitdiskreter linearer zeitinvarianter Systeme ¨ In Ubereinstimmung mit dem BIBO-Stabilit¨ atskonzept f¨ ur zeitkontinuierliche ¨ Systeme bezeichnet man ein zeitdiskretes lineares Ubertragungssystem (7.1) als stabil, wenn es auf jede nur denkbare beschr¨ankte Eingangsfolge {u[k]} mit einer beschr¨ ankten Ausgangsfolge {y[k]} antwortet. Definition 7.1. Eine gegebene Folge {u[k]} heißt beschr¨ankt, wenn sich eine positive Schranke M derart angeben l¨asst, dass die Folgenglieder ohne Ausnahme betragskleiner M sind, d. h. |u[k]| < M
f¨ ur
k = 0, 1, 2, . . .
(7.9)
368
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
Bei dieser Definition spielt es keine wesentliche Rolle, ob die Folgenglieder u[k] Skalare oder mehrkomponentige Vektoren sind; denn eine komponentenweise Beschr¨ anktheit zieht die Beschr¨ anktheit des mehrkomponentigen Vektors nach sich, und umgekehrt bestehen betragsbeschr¨ankte Vektoren nur aus be¨ tragsbeschr¨ ankten Komponenten. Ein r × m-Ubertragungssystem kann dann und nur dann als stabil angesehen werden, wenn jeder seiner r · m skala¨ ren Ubertragungskan¨ ale stabil ist. Deshalb gen¨ ugt es, die folgenden Stabi¨ lit¨ atsaussagen f¨ ur SISO-Ubertragungssysteme zu formulieren. ¨ Satz 7.1 Ein SISO-Ubertragungssystem (7.1) ist genau dann stabil, wenn seine Gewichtsfolge {g[k]} absolut konvergiert, d. h. ∞
|g[k]| < +∞ .
(7.10)
k=0
Beweis: 1. Hinreichender Teil (aus (7.10) folgt Stabilit¨at): ∞ * |g[k]| =: S, und die Eingangsfolge sei gem¨aß (7.9) beschr¨ankt. Es gelte k=0
Dann lassen sich die Ausgangsfolgenwerte wie folgt absch¨atzen: |y[k]| = |
k
g[κ]u[k − κ]| ≤
κ=0
k
|g[κ]| · |u[k − κ] < M
κ=0
<M
∞
|g[κ]| = M · S
k
|g[κ]|
κ=0
f¨ ur
k = 0, 1, 2, . . . (7.11)
κ=0
Dies besagt: Jede Ausgangsfolge ist beschr¨ankt. 2. Notwendiger Teil (aus Stabilit¨ at folgt (7.10)): F¨ ur einen (ausreichend groß gew¨ ahlten) Wert k0 ∈ N legen wir die Eingangsfolge fest: u[κ] = M sign(g[k0 − κ]) f¨ ur κ = 0, 1, 2, . . . , k0 . Sie erf¨ ullt die Bedingung (7.9) und bewirkt die Systemantwort y[k0 ] =
k0 κ=0
g[κ]u[k0 − κ] = M ·
k0
|g[κ]| .
κ=0
ur Nach Voraussetzung hat y[k0 ] einen beschr¨ankten Wert, und zwar f¨ beliebig groß gew¨ ahlte k0 ∈ N. Das impliziert die absolute Konvergenz der Reihe der Gewichtsfolgenwerte. Mit anderen Worten: die Bedingung (7.10) wird erf¨ ullt. qed. ¨ Die Gewichtsfolge {g[k]} und die gebrochen-rationale z-Ubertragungsfunktion GZ sind gleichwertige Charakterisierungen eines zeitdiskreten SISO– ¨ Ubertragungsgliedes
7.3 Stabilit¨ at zeitdiskreter linearer zeitinvarianter Systeme
GZ (z) =
∞
g[k]z −k .
369
(7.12)
k=0
Deutet man das Symbol z“ jedoch nicht – wie bisher – als Verschiebe– ” ¨ Operator, sondern als komplexe Variable, so vermittelt die z-Ubertragungsfunktion GZ (z) eine Abbildung GZ : C → C. Die rechte Seite von (7.12) erscheint nun als Potenzreihe in z −1 = ζ, und es ist hilfreich, an eine bekannte Aussage der Funktionentheorie zu erinnern. Hilfs-Satz 7.2 Wenn die Potenzreihe f (ζ) =
∞
gk · ζ k ,
gk ∈ R
(7.13)
k=0
ur jeden in einem Punkt ζ0 ∈ C konvergiert, so konvergiert die Reihe absolut f¨ Wert ζ mit |ζ| < |ζ0 | und die Funktion f : C → C ist holomorph im Inneren der Kreisscheibe |ζ|<|ζ0 |. Wenn die Potenzreihe (7.13) in einem Punkt ζ1 ∈ C divergiert, so divergiert sie auch in jedem Punkt ζ mit |ζ| > |ζ1 |. Die Nutzung allgemeiner funktionentheoretischer Aussagen erleichtert sich f¨ ur unsere regelungstechnischen Zwecke durch das Vorwissen, dass die z¨ Ubertragungsfunktionen gebrochen-rationale Funktionen in z – und damit auch in ζ – sind. Daher k¨ onnen lediglich Polstellen als Singularit¨aten vorkommen. ¨ Satz 7.3 Ein zeitdiskretes SISO-Ubertragungssystem ist genau dann stabil, ¨ wenn alle Pole der z-Ubertragungsfunktion GZ im Inneren des Einheitskreises der komplexen z-Ebene liegen. Beweis: ¨ Sind alle Pole der gebrochen-rationalen Ubertragungsfunktion GZ (z) betragskleiner als 1, so ist die Funktion GZ im Gebiet |z| ≥ 1 holomorph und deshalb f¨ ur alle ζ = z −1 mit |ζ| ≤ 1 als absolut-konvergente Potenzreihe (7.13) darstellbar. Mithin gilt ∞ k=0
|g[k] · ζ k | =
∞
|g[k]| · |ζ|k < +∞
k=0
f¨ ur beliebige ζ mit |ζ| ≤ 1. Dies impliziert die Konvergenz der Reihe ∞
|g[k]|
k=0
¨ und damit die Stabilit¨ at des Ubertragungssystems. Ein Pol auf dem Einheitskreis widerspr¨ ache der Stabilit¨atsbedingung (7.10); denn f¨ ur jeden Punkt zEK auf dem Einheitskreis w¨ urde gelten:
370
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
∞ ∞ ∞
−k
−k
= |GZ (zEK )| =
g[k]zEK ≤ |g[k]| zEK |g[k]| < ∞ .
k=0
k=0
k=0
Folglich kann der Punkt zEK keine Polstelle einer stabilen gebrochen-rationalen Funktion GZ sein. Ein Pol an einer Stelle zp außerhalb des Einheitskreises, also mit |zp | = |ζp |−1 > 1, w¨ urde bedeuten, dass die Reihe ∞
g[k]zp−k =
k=0
∞
g[k]ζpk
k=0
nicht konvergiert. Folglich w¨ are der Konvergenzradius der Potenzreihe (7.13) ∞ * kleiner als 1, und dies widerspr¨ ache dem Stabilit¨atskriterium |g[k]| < ∞, k=0
vgl. Satz 7.3.
qed.
7.4 Zeitdiskreter Standard-Regelkreis
z[k] r[k]
e[k]
KZ
v[k]
u[k]
y[k] PZ
Bild 7.3. Zeitdiskreter Standard-Regelkreis
Das Bild 7.3 zeigt einen zeitdiskreten Standard-Regelkreis. Die zeitdiskret modellierte Regelstrecke PZ soll in ihrem dynamischen Verhalten durch die Wirkung des zeitdiskreten Reglers KZ in gew¨ unschter Weise beeinflusst werden. Der Regler KZ realisiert einen Regelungsalgorithmus, der aus der vektorwertigen Folge e[k] mit e[k] ∈ Rr eine vektorwertige Folge v[k] mit v[k] ∈ Rm erzeugt. Wir wollen einen zeitdiskret arbeitenden linearen Regler betrachten, der das Eingangs/Ausgangs-Differenzen-Gleichungssystem l λ=0
AK,λ v[k + λ] +
l
BK,λ e[k + λ] = 0
(7.14)
λ=0
erf¨ ullt. Unter Einbeziehung der St¨ orwertefolge z[k], vgl. Bild 7.3, erhalten wir daraus eine R[z]-polynomiale Reglerbeschreibung
7.4 Zeitdiskreter Standard-Regelkreis
l
AK,λ z λ
· (u[k] − z[k]) +
λ=0
l
371
· e[k] = 0 .
BK,λ z λ
λ=0
Nach Einf¨ uhrung der Polynommatrizen AK (z) :=
l
AK,λ z λ
BK (z) :=
λ=0
l
BK,λ z λ
λ=0
verk¨ urzt sich die Reglerbeschreibung zu AK (z)u[k] + BK (z)e[k] = AK (z)z[k] . Ebenso gewinnt man aus (7.1) die R[z]-polynomiale Regelstreckenbeschreibung
l
l λ λ · (r[k] − e[k]) + · u[k] = 0 , AP,λ z BP,λ z λ=0
λ=0
also AP (z)e[k] − BP (z)u[k] = AP (z)r[k] . Das in Bild 7.3 skizzierte r¨ uckgef¨ uhrte System gen¨ ugt dem Gleichungssystem AP 0 AP −BP e[k] r[k] = 0 AK u[k] z[k] BK AK Formal kann dieses Gleichungssystem ohne weiteres nach den Folgen {u[k]} und {e[k]} aufgel¨ ost werden, −1 AP −BP e[k] AP 0 r[k] = . u[k] z[k] 0 AK BK AK
Das Problem des Reglerentwurfs wird so in eine algebraische Aufgabe gewandelt ([Kuˇc79], [RL97], [RL01]): Der zu regelnde Prozess wird durch das Polynommatrizenpaar (AP , −BP ), gewonnen durch theoretische Modellbildung oder experimentbasierte Identifikation, modelliert. Zum gegebenen Prozessmodell (AP , −BP ) soll als Reglermodell ein Polynommatrizenpaar (AK , BK ) so konstruiert werden, dass ¨ die gebrochen-rationale (r + m) × (r + m)-Ubertragungsmatrix GZ =
AP −BP BK AK
w¨ unschenswerte Eigenschaften besitzt.
−1 AP 0 0 AK
372
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
Einer unverzichtbaren Forderung hat jedes geregelte System zu gen¨ ugen: ¨ Alle (r + m)2 skalaren z-Ubertragungsfunktionen, die die Elemente der Matrix GZ bilden, m¨ ussen stabil sein. Das ist genau dann der Fall, wenn das gemeinsame Nennerpolynom AP −BP det =: CLCP ∈ R[z] (7.15) BK AK nur Nullstellen besitzt, die betragskleiner 1 sind, vgl. Satz 7.3. Diese Erkenntnis l¨ asst sich auch wie folgt formulieren. Satz 7.4 Der zeitdiskrete MIMO-Standard-Regelkreis gem¨aß Bild 7.3 ist genau dann stabil, wenn das charakteristische Polynom CLCP ∈ R[z], definiert durch (7.15), keine Nullstelle mit einem Betrag ≥ 1 hat.
7.5 Abtastregelkreis ¨ Bild 7.19 zeigt die Grobstruktur eines SISO-Abtastregelkreises. Aquidistant abgetastete Signale wurden durch einen Index d“ gekennzeichnet. Sie sind ” nur auf einer abz¨ ahlbaren Menge von diskreten Zeitpunkten, und zwar f¨ ur alle tk = kT f¨ ur festes T > 0 und ganzzahlige k, von Null verschieden. z r
e
Abtastglied ed Digitaler Regler vd Halteglied (ADC) (DAC) algor(e[k]) = v[k]
vH
u Prozess & Stellglied
y
x
Meßglied
Regelungseinrichtung Bild 7.4. Struktur eines SISO-Abtastregelkreises
7.5.1 Abtast- und Halteglieder Unter einer Abtastung (sampling) eines zeitkontinuierlichen Signals x, das auf der reellen Zeitachse definiert ist, verstehen wir den Abgriff“ bzw. die ” Entnahme“ von Signalwerten x(tk ) zu diskreten Zeitpunkten tk . Wird der ” abz¨ ahlbare Satz von Probewerten“ (sample) zu ¨aquidistanten Zeitpunkten ” gebildet, gilt also tk = k · T + δ
f¨ ur ein festes δ ≥ 0, T > 0 und k ∈ Z,
7.5 Abtastregelkreis x(t)
T -periodischer Abtaster
373
xd (t)
(ADC) Bild 7.5. Abtastglied
so spricht man von ¨ aquidistanter Abtastung mit der Abtastperiode T . Den Kehrwert T1 bezeichnet man als die Abtastrate und 2π T =: Ω als die Abtastfre¨ quenz. Bild 7.5 symbolisiert den Abtastvorgang in Form eines Ubertragungsblockes entsprechend dem in der Regelungstechnik u ¨ blichen Gebrauch von Signalfluss-Wirkungsbl¨ ocken. Man will damit ausdr¨ ucken, dass der Abtastprozess in einem Ger¨ at“, das den Namen (T -periodischer) Abtaster oder ” auch Analog-Digital-Umsetzer (analog-to-digital converter, ADC) tr¨agt, realisiert wird. Da die zeitkontinuierlichen Signale x(t) im Definitionsbereich −∞ < t < ∞ lediglich als st¨ uckweise stetig vorausgesetzt werden, nehmen wir der Eindeutigkeit halber die Abtastwerte als rechtsseitige Grenzwerte an, x[k] = x(kT + δ + 0),
δ fest, k = 0, ±1, ±2, . . . .
Wir d¨ urfen δ = 0 setzen, wenn der Zeitpunkt t = 0 selbst ein Abtastzeitpunkt ist oder zweckm¨ aßigerweise als solcher vereinbart werden kann. Im weiteren setzen wir voraus, dass eine solche Vereinbarung getroffen worden sei. Am Ausgang des T -periodischen Abtasters gewinnen wir dann ein Signal x(kT + 0) = x[k] f¨ ur t = kT xd (t) = 0 sonst. Die im Signal xd enthaltene Information kann als Wertefolge {x[k]}k∈Z gespeichert werden. Ein digitaler Regler erzeugt aus einer Wertefolge {e[k]} eine Wertefolge {v[k]}, anders ausgedr¨ uckt, aus einem Signal ed (t) ein Signal vd (t). Dieses muss in geeigneten Speichereinrichtungen in ein zeitkontinuierliches (analoges) Signal vH (t) u uhrt werden, das in der Lage ist, eine physikalische ¨ berf¨ Wirkung in den Stellgliedern des Prozesses auszul¨osen. Ein Digital-AnalogUmsetzer (digital-to-analog converter, DAC) soll die erforderliche Signalwandlung leisten. Im einfachsten Falle handelt es sich um ein Halteglied null” ter Ordnung“, das den Signalwert v[k] im Abtastintervall kT ≤ t < (k + 1)T konstant h¨ alt. So entsteht aus der Wertefolge {v[k]} bzw. dem zugeh¨orenden Signal vd (t) ein zeitkontinuierliches gestuftes Signal vH (t) =
∞
v[k] 1(t − kT ) − 1(t − (k + 1)T ) =: vh (t).
(7.16)
k=−∞
Wegen L {1(t − kT )} =
1 −skT e erh¨ alt man als zugeh¨orende Bildfunktion s
374
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
∞
H0
m(t − kT )
k=−∞
vd (t)
H00
vh (t)
vH (t) vd
m
0
T
t
−2T Bild 7.6.
−T
vh
t
vH
t
0
T
2T
3T
t
Signalverarbeitung in einem Halteglied nullter Ordnung mit einer Formierungsfunktion m
Vh (s) = L {vh (t)} =
∞ 1 (1 − e−sT ) v[k] e−skT . s k=−∞
Diesen Speicherungsvorgang symbolisieren wir durch den Operator H00. Die Amplitudenwerte des Signals vh (t) k¨ onnen zwischen den Abtastpunkten mit Hilfe einer Formierungsfunktion m moduliert werden. Als Formierungsfunktionen sind prinzipiell alle Funktionen m mit st¨ uckweise stetig f¨ ur 0 ≤ t ≤ T m(t) = 0 f¨ ur t < 0 und f¨ ur t > T zugelassen. Einen so charakterisierbaren Digital-Analog-Umsetzer wollen wir als (T -periodisches) Halteglied nullter Ordnung bezeichnen und daf¨ ur das Operatorsymbol H0“ verwenden. Das Bild 7.6 dient der Veranschaulichung ” des Gesagten. In jedem Intervall kT ≤ t < (k + 1)T gilt
7.5 Abtastregelkreis
375
vH (t) = v[k] · m(t − kT ) . asst sich so notieren: Die Wirkung des Halteglied-Operators H0 l¨ ∞
vH (t) = H0 ◦ vd (t) =
∞
m(t − kT ) vd (kT ) =
k=−∞
m(t − kT ) v[k] .
k=−∞
(7.17) Man beachte, dass der Verlauf der Funktion vH (t) zwischen den Abtastzeitpunkten, also f¨ ur kT < t < (k + 1)T , von den Funktionswerten v(t) nicht beinflusst wird. In k−ten Abtastintervall wiederholt vH (t) den Verlauf der Formierungsfunktion m(t), multipliziert mit der Konstanten v[k] = v(kT +0). ¨ alt man als zugeh¨orende Bildfunktion Uber L {m(t − kT )} = M (s) e−skT erh¨ VH (s) = L {vH (t)} = M (s)
∞
v[k] e−skT .
k=−∞
Mitunter erweisen sich kompliziertere Halteglieder als n¨ utzlich. Auf einige Aspekte derartiger Konzepte soll noch eingegangen werden. 1. Bei einer zus¨atzlichen Zeitverschiebung um ∆ (mit 0 < ∆ < T ) erscheinen am Ausgang des Haltegliedes die Signalwerte v[k] m(t − kT ) w¨ahrend des verschobenen Zeitintervalls kT + ∆ ≤ t < (k + 1)T + ∆. Mit anderen Worten, vH (t + ∆) = v[k] · m(t − kT ) f¨ ur kT ≤ t < (k + 1)T, ∞ vH (t) = v[k] m(t − ∆ − kT ) f¨ ur − ∞ < t < ∞ . k=−∞
Die Bildfunktion des Ausgangssignals ergibt sich zu VH (s) = M (s)e−s∆
∞
v[k] e−skT .
k=−∞
2. Stehen Abtastwerte von mehreren vorangegangenen Abtastzeitpunkten zur Verf¨ ugung, so kann es sinnvoll sein, im Intervall kT < t < (k + 1)T einen gewichteten Mittelwert l
αλ v[k−λ]
λ=0
(αλ > 0,
l
αλ = 1)
λ=0
auszugeben, also vH (t) =
l λ=0
αλ v[k − λ] 1(t − kT ) − 1(t − (k + 1)T )
376
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
zu setzen. F¨ ur −∞ < t < +∞ wird dann > l ? ∞ vH (t) = αλ v[k − λ] (1(t − kT ) − 1(t − (k + 1)T )) k=−∞
=
l
λ=0
>
αλ
λ=0
=
l
>
∞
αλ
l
v[k − λ] 1(t − kT ) − 1 t − (k + 1)T
?
k=−∞
λ=0
=
∞
v[k] 1(t − λT − kT ) − 1 t − λT − (k + 1)T
?
k=−∞
αλ vh (t − λT ) ,
λ=0
vgl. (7.16). Die zugeh¨ orende Bildfunktion ergibt sich dann zu VH (s) =
l
αλ e−sλT Vh (s) =
λ=0
l
αλ e−sλT
λ=0
∞ 1 − e−sT v[k]e−skT s k=−∞
3. Mit Hilfe geeigneter Formierungsfunktionen mλ (t) l¨asst sich eine F¨ ulle von Extrapolatoren gewinnen. Aus dem Strukturansatz vH (t) =
l
v[k − λ]mλ (t − kT ) f¨ ur
kT < t < (k + 1)T
(7.18)
λ=0
erh¨ alt man f¨ ur −∞ < t < ∞ ∞ l
vH (t) =
v[k − λ]mλ (t − kT ) =
k=−∞ λ=0
l ∞
v[k]mλ (t − (λ + k)T )
λ=0 k=−∞
und daraus die Bildfunktion VH (s) =
l λ=0
∞
e−sλT Mλ (s)
v[k]e−ksT
k=−∞
Beispiel 7.1 Als Anwendungsbeispiel w¨ahlen wir den linearen Extrapolator vH (t) = v[k] +
1 (v[k] − v[k − 1])(t − kT ) T
kT ≤ t < (k + 1)T .
f¨ ur
(7.19) Er stellt sich gem¨ aß dem Strukturansatz (7.18) in der Gestalt 1
v[k−λ] · mλ (t − kT ) = v[k] 1 +
vH (t) = λ=0
t − kT T
+ v[k−1] −
t − kT T
.
7.5 Abtastregelkreis m1
m0 2
2
1
1
0
377
T
0
t
−1
T
t
−1
Bild 7.7. Die Formierungsfunktionen m0 (t) und m1 (t) zum linearen Extrapolator (7.19). dar. Die Formierungsfunktionen m0 (t) und m1 (t) wurden im Bild 7.7 skizziert. Ihre Laplace-Transformierten M0 (s) und M1 (s) berechnen sich zu ∞
M0 (s) =
T
m0 (t)e 0
=
1 s
M1 (s) = −
1−e
1 T
T
−st
dt =
−sT
1+
t T
e−st dt
0
−
te−st dt =
1 (1 + sT )e−sT − 1 2 Ts 1 (1 + sT )e−sT − 1 . 2 Ts
0
Daraus ergibt sich
VH (s) = M0 (s) + e−sT M1 (s)
∞
v[k]e−skT
k=−∞
−sT 2 1 = (1 + T s) 1−e T s2
∞
v[k]e−skT .
(7.20)
k=−∞
Bei der Bearbeitung komplizierterer Extrapolationsans¨atze erweist sich die Beziehung T
p −st
t e
p T p 1 − e−sT ∂ ∂ dt = − e−st dt = − ∂s ∂s s
0
f¨ ur
p∈N
0
als n¨ utzlich. 4. Kennt man zum Zeitpunkt k = k0 auch Werte der Folge {v[k]} f¨ ur k¨ unftige Zeitpunkte ν > k0 (z. B. aus fr¨ uheren Prozessl¨aufen oder als Sch¨ atzwerte aus einer vorauseilenden Simulation des Prozesses), so werden Halteglieder realisierbar, die als Interpolatoren wirken. Aus dem sehr allgemeinen Ansatz vH (t) =
l λ=−l1
v[k − λ] · mλ (t − kT ) f¨ ur
kT ≤ t < (k + 1)T
(7.21)
378
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
folgt ∞
vH (t) =
l
v[k − λ]mλ (t − kT )
k=−∞ λ=−l1 l
=
∞
v[k]mλ (t − (λ + k)T )
λ=−l1 k=−∞
und daraus l
VH (s) =
∞
e−sλT Mλ (s)
λ=−l1
v[k]e−skT .
(7.22)
k=−∞
Beispiel 7.2 Die aus der numerischen Mathematik vertraute Trapezregel“, ”
n¨ amlich vH (t) = v[k] +
1 (v[k + 1] − v[k])(t − kT ) f¨ ur kT ≤ t < (k + 1)T, T
l¨ asst sich umschreiben in die Form vH (t) = v[k] 1 −
1 1 (t − kT ) + v[k + 1] (t − kT ). T T
Nun erscheint sie als Spezialfall des allgemeinen Interpolators (7.21), und zwar f¨ ur l=0,
l1 = 1 ,
m0 (t) = 1 −
t , T
m−1 (t) =
t . T
Man erh¨ alt vH (t) =
∞
v[k] · m0 (t − kT ) +
k=−∞
∞
v[k] · m−1 (t − (k − 1)T ))
k=−∞
und daraus die Bildfunktion
VH (s) = M0 (s) + esT M−1 (s) =
e
sT
(1 − e T s2
−sT 2
)
∞
∞
v[k]e−skT
k=−∞
v[k]e−skT
(7.23)
k=−∞
Dieses spezielle Halteglied spielt in der regelungstechnischen Literatur eine gewisse Rolle. Es wird oft schlechthin als das Halteglied erster Ordnung (first order hold, FOH) bezeichnet.1
Alle interpolierenden Halteglieder – das sind Halteglieder vom Typ (7.21) mit ¨ l1 > 0 – sind akausale Ubertragungsglieder im Sinne des Abschnitts 2.3.3. 1
Approximiert man im Interpolator (7.23) den Pr¨ adiktionsfaktor esT durch 1 + sT , so st¨ oßt man auf ein anderes Halteglied erster Ordnung, n¨ amlich den oben besprochenen Extrapolator (7.20).
7.5 Abtastregelkreis
379
7.5.2 Zeitdiskrete Beschreibung eines Abtastregelkreises Wir betrachten einen MIMO-Standardregelkreis mit digitalem Regler gem¨aß Bild 7.8. r(t) z[k]
ADC r[k] e[k]
Digitaler Regler
v[k]
u[k]
Halte- uH(t) zeitkont. y(t) glied Strecke
ADC
y[k]
Bild 7.8. MIMO-Standardregelkreis mit digitalem Regler
¨ Der digitale Regler wird durch eine z-Ubertragungsmatrix GK Z (z), die ¨ zeitkontinuierliche Regelstrecke durch eine s-Ubertragungsmatrix P (s) beschrieben. Aufgrund des der Strecke vorgeschalteten Haltegliedes und des nachgeschalteten Abtasters wirkt der gerahmte Teil wie ein zeitdiskretes ¨ ¨ Ubertragungsglied, dessen z-Ubertragungsmatrix mit GP Z (z) bezeichnet werden soll. Die Prozessst¨ orung z(t) wird als in der Steuerfolge {u[k]} additiv enthaltene Wertefolge {z[k]} ber¨ ucksichtigt. F¨ ur die weiteren Betrachtungen wird vorausgesetzt, dass Halteglied und Abtaster entkoppelte MIMO¨ Strukturen besitzen, bez¨ uglich ihrer einzelnen Ubertragungskan¨ ale jeweils identisch aufgebaut und mit der Abtastperiode T synchronisiert sind. Insgesamt handelt es sich dann um einen zeitdiskreten LTI-Regelkreis. Die Zeitinvarianz der Signalverarbeitung innerhalb des gestrichelt eingerahm¨ ten Ubertragungsblocks mag fragw¨ urdig erscheinen. (Wir kommen darauf im Abschnitt 7.5.3 zur¨ uck.) Wenn man aber ignoriert, welche Signalwerte uH (t) und y(t) zwischen den Abtastzeitpunkten annehmen, und nur die Wertefolgen {r[k]}, {e[k]} und {y[k]} in die Betrachtung einbezieht, so ist der Abtastregelkreis in dem durch die Abtastperiode T bestimmten diskreten Zeitraster gewiss zeitinvariant. F¨ ur den praktisch bedeutsamen Fall eines Haltegliedes nullter Ordnung mit der Formierungsfunktion m(t) = 1(t) − 1(t − T ) soll nun der Regelkreis aus Bild 7.8 genauer untersucht werden. Dieses Halteglied transformiert die Folge {u[k]}k∈Z in eine Treppenfunktion, die auf der ganzen t-Achse definiert ist, uH (t) = uh (t) =
∞
u[k] 1(t − kT ) − 1(t − (k + 1)T )
k=−∞
Mittels Laplace-Transformation gewinnt man
380
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
UH (s) =
∞ k=−∞
1 1 − e−T s · · e−skT u[k] s
und daraus Y(s) = P (s) · UH (s) =
∞ k=−∞
P (s) · u[k] 1 − e−T s e−kT s · s
Es sei daran erinnert, dass die Laplace-R¨ ucktransformierte von 1s P (s) die ¨ (hier matrixwertige) Ubergangsfunktion h(t) der Regelstrecke liefert, 6 P (s) = h(t) · 1(t) (7.24) L−1 s Der Signalvektor am Streckenausgang ergibt sich zu y(t) = L−1 {Y(s)} =
∞ h(t − kT ) · 1(t − kT ) − h(t − (k + 1)T ) · 1(t − (k + 1)T ) u[k] . k=−∞
(7.25) Daraus folgen die Abtastwerte y[i] = y(iT ) f¨ ur alle i ∈ Z: i i y[i] = h[i−k] − h[i−(k+1)] u[k] =: g[i−k] · u[k] . k=−∞
k=−∞
Die Glieder der matrixwertigen Gewichtsfolge {g[k]} berechnen sich demnach so: g[0] = h[0], g[k] = h[k] − h[k − 1] f¨ ur k ≥ 1. Um den vertrauten Apparat der z-Transformation anwenden zu k¨onnen, setzen wir u[k] = 0
f¨ ur
k < 0.
Dann wird y[i] =
i
g[i−k] · u[k]
f¨ ur
i∈N
k=0
¨ Durch z-Transformation der Gewichtsfolge {g[k]} kann die z-Ubertragungsmatrix ¨ des im Bild gestrichelt gerahmten Ubertragungsblockes berechnet werden: −1 )Z{h[k]} = (1 − z −1 ) GP Z (z) = Z{g[k]} = (1 − z
∞ k=0
h[k]z −k .
(7.26)
7.5 Abtastregelkreis
381
Die z-Transformierte YZ (z) = Z{y[k]} ergibt sich zu YZ (z) = GP Z (z) UZ (z) ,
(7.27)
und die Ausgangswertefolge {y[k]} kann mit der R¨ ucktransformationsformel 1 (7.28) GP (z) · UZ (z) · z k−1 dz y[k] = 2πj ! Z C
ermittelt werden. Aus (7.26) und (7.24) bekommt man eine erste Berechnungsvorschrift f¨ ur ¨ die z−Ubertragungsmatrix: 6) 6 ( 1 −1 −1 GP P (s) . (7.29) (z) = (1 − z )Z L Z s t=kT Bei der Bearbeitung kleiner Beispiele mit Papier und Bleistift erweist sich die Formel (7.29) als recht praktikabel, weil die sukzessive Ausf¨ uhrung der erforderlichen Umformungsschritte wenig M¨ uhe bereitet. Beispiel 7.3 Die zeitkontinuierliche Regelstrecke sei durch ein P T1 −Glied modelliert worden, 1 T1 s + 1
P (s) =
(T1 > 0) .
¨ Dank der Rechenvorschrift (7.29) gewinnt man die zugeh¨ orende z−Ubertragungsfunktion so: GP Z (z)
z−1 = Z z =
=
z−1 Z z z−1 Z z
z−1 = z z−1 = z
L
P (s) s
−1
L −1
1−e
∞
1−e
k=0
t=kT
1 1 − s s + T11
− Tt
1
−k TT
1
1(t)
z
−k
z−1 = Z z
t=kT
=
t=kT
z−1 = z
1 1 − T 1 − z −1 1 − (e T1 z)−1
L
−1
=
t=kT
z−1 −k T Z 1 − e T1 z
∞
1 s(T1 s + 1)
z
−k
−
k=0
∞
e
T T1
z
−k
k=0
1−e
− TT
z −e
− TT
1 1
Eine zweite Vorschrift zur Ermittlung von GP Z (z) aus P (s) basiert auf dem Residuensatz der Funktionentheorie: 6 P (s) sT −1 z − e GP (z) = (z − 1) Res , Z s s=pν ν
382
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
*
wobei die Summe Herleitung: GP Z (z)
=
∞
ν
P (s) s
sich u ¨ ber die Pole pν von
erstreckt.
g[k]z −k
k=0
= (1 − z −1 )
∞
z −k h(k T )
k=0
= (1 − z −1 )
∞ k=0
= (1 − z
−1
⎛
= (1 − z
mit r > max Re pν ν
r−j∞ r+j∞
1 ) 2πj
P (s) s
r+j∞
1 ) 2πj
∞
z
−1 sT k
ds
e
k=0
r−j∞ −1
⎞ P (s) s k T ⎠ e ds s
r+j∞
1 z −k ⎝ 2πj
−1 P (s) 1 − z −1 esT ds , s
falls |z| > erT .
r−j∞
Schließt man das Linienintegral nach links durch einen großen Halbkreis, so liegen alle Pole von P s(s) in dem Gebiet, das beim Integrieren umfahren wird. Der Residuensatz l¨ asst sich anwenden und ergibt 6 P (s) P −1 −1 sT −1 GZ (z) = 1 − z 1−z e Res s s=pν ν 6 P (s) −1 z − esT = (z − 1) Res (7.30) s s=pν ν Beispiel 7.4 Als Anwendungsbeispiel f¨ur die zweite Rechenvorschrift w¨ahlen wir P (s) = (s − s0 )−m Man erh¨ alt GP Z (z)
= (z − 1) Res
1 = (m − 1)! 1 = (m − 1)!
−1
z−esT s(s−s0 )m
1 = (z − 1) (m − 1)! ∂ m−1 ∂sm−1 ∂ m−1 ∂sm−1
Im Spezialfall m = 1 ergibt sich
m ∈ N.
f¨ ur irgendein
m−1
∂ ∂sm−1
+
Res
s=s0
sT −1
(z − e ) s
z−1 1 − s(z − esT ) s esT − 1 s(z − esT )
−1
z−esT s(s−s0 )m
s=s0
s=0
(z − 1)−1 + (−s0 )m
s=s0
(7.31) s=s0
7.5 Abtastregelkreis GP Z (z) =
es0 T − 1 . s0 (z − es0 T )
383 (7.32)
¨ Aus dem Beispielergebnis (7.31) geht ohne weiteres die z−Ubertragungsmatrix P GZ (z) zur allgemeinen zeitkontinuierlichen LTI-Prozessbeschreibung P (s) = P00 +
kλ l λ=1
Pλκ (s − sλ )κ κ=1
mit
Pλκ ∈ Rp×m
hervor: GP Z (z) = P00 +
( κ−1 wT ) Pλκ ∂ e −1 . (κ − 1)! ∂wκ−1 w(z − ewT ) w=sλ κ=1
kλ l λ=1
(7.33)
Den vorstehenden Formeln liegt die Annahme zugrunde, dass die Steuerfolge {u[k]} auf ein Halteglied nullter Ordnung mit der Formierungsfunktion m(t) = 1(t) − 1(t − T ) trifft. Aber auch bei komplizierteren Haltegliedern ¨ l¨ asst sich eine allgemeine Vorschrift zur Ermittlung der z-Ubertragungsmatrix GP (z) angeben. Geht man von der allgemeinsten Halteglieddarstellung (7.22) Z aus, so ergibt sich das Bild Y(s) des Streckenausgangssignalvektors y(t) zu l
Y(s) = P (s) · UH (s) = P (s)
∞
e−sλT Mλ (s)
λ=−l1
u[k]e−skT .
k=−∞
Wird als Steuerfolge {u[k]} eine Einheitsimpulsfolge k = 0 ; i ∈ {1, 2, . . . , m} ei f¨ ur u[k] = k = 0 , 0 gew¨ ahlt, dann antwortet das Teilsystem, das im Bild 7.8 gestrichelt gerahmt hervorgehoben wurde, mit der vektorwertigen Gewichtsfolge > 7? l −1 −sλT g•i [k] = L P (s) · e Mλ (s) · ei f¨ ur k = 0, 1, 2, . . . . λ=−l1
t=kT
¨ Die gesuchte z-Ubertragungsmatrix gewinnt man aus GP Z (z) =
∞
g[k]z −k =
k=0
∞
g•1 [k], g•2 [k], . . . , g•m [k] z −k ,
k=0
anders ausgedr¨ uckt, GP Z (z) = Z
⎧> ⎨ ⎩
L−1
P (s) ·
l λ=−l1
7? e−sλT Mλ (s) t=kT
⎫ ⎬ ⎭
.
384
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
Insbesondere ergibt sich mit dem Halteglied erster Ordnung (7.23) die z¨ Ubertragungsmatrix 6) 6 ( P (s) L−1 esT (1 − e−sT )2 · T s2 t=kT ( 6) 6 −1 2 P (s) z(1 − z ) ·Z L−1 = T s2 t=kT
GP Z (z) = Z
Abschließend wollen wir anhand eines einfachen Beispiels zeigen, dass die Stabilit¨ at des Abtastregelkreises von der Abtastperiode T beeinflusst werden kann. Beispiel 7.5 Betrachtet wird ein SISO-Abtastregelkreis gem¨aß Bild 7.8, wobei das u ¨ bliche Halteglied nullter Ordnung mit der Formierungsfunktion m(t) = 1(t) − 1(t − T ), als digitaler Regler ein gew¨ ohnliches Proportionalglied und als Regelstrecke ein stabiles P T1 -Glied gew¨ ahlt wurden, also GK Z (z) = V
und
P (s) =
1 T1 s + 1
(T1 > 0) .
Gefragt wird, f¨ ur welche Verst¨ arkungen V und welche Abtastperioden T die z−F¨ uhrungs¨ ubertragungsfunktion stabil ist. Im zeitkontinuierlichen Vergleichssystem gilt K(s) = V ,
P (s) =
1 , T1 s + 1
und die F¨ uhrungs¨ ubertragungsfunktion Gyr (s) =
K(s) · P (s) V = 1 + K(s) · P (s) T1 s + 1 + V
ist stabil f¨ ur alle V > −1. F¨ ur die gesuchte z-F¨ uhrungs¨ ubertragungsfunktion gilt Gyr (z) =
P V · GP GK Z (z) · GZ (z) Z (z) = . K P 1 + GZ (z) · GZ (z) 1 + V · GP Z (z)
Die Funktion GP Z (z) wurde im Beispiel 7.3 bestimmt: GP Z (z) =
1−e
− TT
z−e
1
.
− TT
1
− T
¨ Diese z-Ubertragungsfunktion ist stabil f¨ ur beliebige T > 0, weil der Pol z0 = e T1 im Inneren des Einheitskreises der z-Ebene liegt. Die interessierende z-F¨ uhrungsu ¨ bertragungsfunktion Gyr (z) =
1−e
V z−e
− TT
1
+V
− TT
1
1−e
− TT
1
(7.34)
7.5 Abtastregelkreis
385
wird jedoch nur stabil, wenn ihr Pol betragskleiner Eins ausf¨ allt, d. h. f¨ ur ¬ ¬ − TT
|z0 | = ¬e
1
−V
1−e
− TT
1
<1,
oder, umgerechnet, f¨ ur −1 < V <
1+e
− TT
1
. 1−e 1 Das Verh¨ altnis von Abtastperiode T zur Zeitkonstante T1 beeinflusst ersichtlich das Stabilit¨ atsverhalten. Im Bild 7.9 wurde der Stabilit¨ atsbereich in der ( TT1 , V )Parameterebene durch Schattierung hervorgehoben. − TT
10
8
V
6
4
2 1 0 −1 −2
0
0.5
1
1.5
2
2.5
Bild 7.9. Stabilit¨ atsbereich in der
T T1
3
T ,V T1
3.5
4
4.5
5
–Parameterebene
¨ 7.5.3 Zeitkontinuierliche Beschreibung der Ubertragungsglieder eines Abtastregelkreises Bisher wurde ein zeitdiskretes Modell des Abtastregelkreises betrachtet. Alle ¨ ¨ Ubertragungsglieder ließen sich durch eine z-Ubertragungsfunktion oder eiene ¨ z-Ubertragungsmatrix darstellen. Das Verhalten des geregelten Systems wurde durch ein lineares zeitinvariantes Modell beschrieben. Dabei bezog sich die Zeitinvarianz freilich nur auf die diskrete Zeitskala . . . , −2T, −T, 0, T, 2T, . . . ¨ Uber das Verhalten der Signale zwischen den Abtastzeitpunkten konnte nichts ausgesagt werden. Diesem bisher offen gelassenen Problem wollen wir uns nun zuwenden.
386
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
7.5.3.1 Zeitvarianz von Haltegliedern Wir betrachten den Abtastregelkreis in der Standard-Darstellung des Bildes 7.8 und fragen, ob der Operator H, der vom Halteglied (DAC) realisiert wird, zeitinvariant oder zeitvariant ist. Ohne wesentliche Beschr¨ankung der Allgemeinheit legen wir dabei ein Halteglied nullter Ordnung zugrunde, also den Operator H = H0 . Die Wirkung eines solchen Haltegliedes in SISOStruktur wurde im Abschnitt 7.5.1 beschrieben. Gem¨aß (7.17) und Bild 7.6 gilt vH (t) = H0 ◦ vd (t) =
∞
vd (kT )m(t − kT )
k=−∞
= vh (t)
∞
m(t − kT ) =
k=−∞
vd
∞
(7.35) v[k]m(t − kT )
k=−∞
t
Zeitverschiebung um τ = T3
vd
Halteglied nullter Ord. mit Amplitudenmodulation
t Halteglied nullter Ord. mit Amplitudenmodulation
t Zeitverschiebung um τ = T3
t f1
t
t f2
Bild 7.10. Illustrationsbeispiel zum Nachweis der Zeitvarianz von Haltegliedern
Um festzustellen, ob der Halteoperator H0 zeitinvariant ist oder nicht, muss entsprechend den Ausf¨ uhrungen des Abschnitts 2.3.2 gepr¨ uft werden,
7.5 Abtastregelkreis
387
ob er f¨ ur beliebige Werte τ > 0 mit dem Zeitverschiebeoperator Sτ vertauscht werden darf. F¨ ur irgendein τ ∈ (0; T ) erhalten wir einerseits H0 ◦ Sτ ◦ vd (t) = H0 ◦ vd (t − τ ) ∞ = m(t − kT ) · vh (kT − τ ) =
k=−∞ ∞
m(t − kT ) · v[k − 1] =: f1 (t),
(7.36)
k=−∞
und andererseits ∞
Sτ ◦ H0 ◦ vd (t) = Sτ ◦
m(t − kT ) · v[k]
k=−∞
=
∞
m(t − τ − kT ) · v[k] =: f2 (t).
(7.37)
k=−∞
Bild 7.10 dient der Veranschaulichung des Sachverhalts. Im linken Teilbild wird zuerst die Zeitverschiebung und anschließend die Halteoperation ausgef¨ uhrt, im rechten Teilbild zuerst die Halteoperation und dann die Zeitverschiebung. Ersichtlich stimmen die beiden auf der ganzen t-Achse definierten (und st¨ uckweise stetigen) Funktionen f1 und f2 f¨ ur τ = T /3 nicht u ¨ berein. Man kann sich rasch davon u ur alle ¨ berzeugen, dass sich im Beispielfalle f¨ 0 < τ < T unterschiedliche Ausgangssignalverl¨aufe einstellen. F¨ ur τ = T ergibt sich jedoch stets f1 (t) =
∞
m(t − kT ) v[k − 1] =
k=−∞
∞
m(t − (k + 1)T ) v[k] = f2 (t).
k=−∞
Hilfreich f¨ ur das anschauliche Verst¨ andnis mag eine vergleichende Betrachtung der Bilder 7.10 und 7.11 sein. Die gewonnene Erkenntnis l¨ asst sich in Operatorschreibweise so zusammenfassen: H0 ◦ Sτ = Sτ ◦ H0
f¨ ur
τ = νT,
H0 ◦ Sτ = Sτ ◦ H0
f¨ ur
τ = νT,
ν ∈ Z.
Man sagt, der Halteoperator H0 sei zeitvariant, aber T -periodisch. Die Tperiodischen Operatoren spielen eine zentrale Rolle bei der Analyse und Synthese von Abtastregelkreisen. ¨ 7.5.3.2 Ubertragungsverhalten von Abtast-Haltegliedern ¨ Bei linearen zeitinvarianten Systemen hat sich das Konzept der Ubertragungsfunktionen als außerordentlich n¨ utzlich erwiesen. Wir wollen pr¨ ufen,
388
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
t
vd
vd
t
Halteglied nullter Ord. mit Amplitudenmodulation
Zeitverschiebung um τ = T
t
t
Halteglied nullter Ord. mit Amplitudenmodulation
Zeitverschiebung um τ = T
t
f1
f2
t
Bild 7.11. Illustrationsbeispiel zum Nachweis der T-Periodizit¨ at von Haltegliedern
inwieweit es sich auf lineare Abtastsysteme, die wegen der Ausf¨ uhrungen in Unterabschnitt 7.5.3.1 als nicht zeitinvariant erkannt wurden, anwenden l¨asst.
y(t)
A
u(t)
Bild 7.12. Operator A
Es sei A ein linearer Operator, der ein Eingangssignal u(t) auf mathematisch eindeutige Weise in ein Ausgangssignal y(t) transformiert, y = A ◦ u, vgl. Bild 7.12. Wir folgen dem Euler schen Ansatz zur Behandlung linearer Differentialgleichungen und w¨ ahlen das spezielle Eingangssignal u(t) = est mit s ∈ C. Das Ausgangssignal y(t) = A ◦ est multiplizieren wir mit e−st und erhalten eine Funktion e−st (A ◦ est ) =: GA (s, t) ,
(7.38)
7.5 Abtastregelkreis
389
¨ die wir zur Charakterisierung des Ubertragungsverhaltens des Operators benutzen werden. Im Falle eines zeitinvarianten Operators A gilt definitionsgem¨aß mit y(t) = A ◦ est auch y(t − τ ) = A ◦ es(t−τ ) f¨ ur beliebige Zeitverschiebungen τ . Daraus folgt GA (s, t − τ ) = e−s(t−τ ) y(t − τ ) = e−s(t−τ ) A ◦ es(t−τ ) = e−s(t−τ ) e−sτ A ◦ est = e−st A ◦ est = GA (s, t) . Die Abh¨ angigkeit vom zweiten Argument entf¨allt, und die Funktion ¨ GA (s, t) = GA (s) ist nichts anderes als die vertraute Ubertragungsfunktion des LTI-Operators A. ¨ Bei linearen zeitvarianten Ubertragungsoperatoren A h¨angt die durch (7.38) definierte Funktion GA (s, t) von beiden Argumenten ab. Sie wird als ¨ ¨ des Operators A bezeichnet. Beparametrische Ubertragungsfunktion (PUF) reits 1950 hat L. A. Zadeh (geb. 1921) gezeigt, dass sie sich zur Charakteri¨ sierung von linearen, T -periodischen Ubertragungssystemen eignet [Zad50]. ¨ Eine gr¨ undliche Behandlung der parametrischen Ubertragungsfunktionen findet der deutschsprachige Leser in der Monographie [RL97]. An dieser Stelle sei betont, dass die in den Wirkungsplan-Bildern die¨ ses Abschnitts benutzten Ubertragungsbl¨ ocke f¨ ur Operationen stehen, die im ¨ Kontext n¨ aher beschrieben sind, zu denen aber meistens keine Ubertragungsfunktion im Sinne der linearen zeitinvarianten Systeme geh¨ort. Das aus der LTI-Systemtheorie vertraute Denkschema, n¨ amlich Bild des Ausgangssignals ” ¨ = Ubertragungsfunktion multipliziert mit Bild des Eingangssignals“, reicht nicht mehr aus. Der Operator A sei nun ein T -periodisches Abtast-Halteglied nullter Ordnung in SISO-Struktur, das sich aus einem T -periodischen Abtastglied und einem Halteglied nullter Ordnung zusammensetzt, wie im Bild 7.13 dargestellt. Das Abtast-Halteglied antwortet auf ein (beschr¨anktes) Eingangssignal A u(t)
Abtastglied ADC
ud (t)
Halteglied H0
uH (t)
Bild 7.13. Abtast-Halte-Operator A
u : R → C mit dem Ausgangssignal uH (t) = A ◦ u(t) = H0 ◦ ADC ◦ u(t) = H0 ◦ ud (t) ∞ ∞ = m(t − kT )ud (kT ) = m(t − kT )u(kT + 0) k=−∞
k=−∞
(7.39)
390
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
Bei Einspeisung des Testsignals u(t) = est erh¨ alt man uH (s, t) = =
∞ k=−∞ ∞
m(t − kT ) · eskT m(t + kT ) · e−skT .
k=−∞
¨ des Abtast-Halte-Operators A unmittelbar aus (7.38) Daraus folgt die PUF zu GA (s, t) = e
∞
−st
m(t + kT ) · e−skT
k=−∞ ∞
=
m(t + kT ) · e−s(t+kT ) .
(7.40)
k=−∞
F¨ ur 0 ≤ t < T wird GA (s, t) = m(t) · e−st . ¨ (7.40) ist T -periodisch im Argument t; denn Die PUF GA (s, t + T ) = GA (s, t). ¨ in eine Fourier-Reihe entwickeln, Deshalb darf man die PUF GF A (s, t)
=
∞ ν=−∞
wν (s) exp(jνΩt)
mit
Ω=
⎛
2π T ⎞
T 1 ⎝ GA (s, τ ) exp(−jνΩτ )dτ ⎠ exp(jνΩt) = T ν=−∞ 0 ⎞ ⎛ T ∞ 1 ⎝ m(τ )e−sτ exp(−jνΩτ )dτ ⎠ exp(jνΩt) = T ν=−∞ ∞
0
∞ 1 M (s + jνΩ) exp(jνΩt) . = T ν=−∞
(7.41)
An den Stetigkeitsstellen von uH (s, t) (bez. des Arguments t) gilt GA (s, t) = GF A (s, t).
(7.42)
Die Fourier-Reihe (7.41) h¨ angt lediglich von der Funktion M , dem Bild der Formierungsfunktion, die im Abtast-Halteglied realisiert wird, ab. Deshalb wird im folgenden die k¨ urzere und zugleich pr¨ azisere Bezeichnung GM (s, t) := GF A (s, t)
7.5 Abtastregelkreis
391
verwendet. In der regelungstechnischen Praxis begn¨ ugt man sich meistens mit der Formierungsfunktion 1 f¨ ur 0 ≤ t < T 0 m (t) = 1(t) − 1(t − T ) = 0 sonst. Unter dieser Annahme berechnet man T m0 (τ ) exp(−sτ − jνΩτ )dτ
M 0 (s + jνΩ) = 0
T =
exp(−(s + jνΩ)τ )dτ =
1 (1 − e−sT ) , s + jνΩ
0
GM 0 (s, t) =
∞ exp(jνΩt) 1 (1 − e−sT ) . T s + jνΩ ν=−∞
F¨ ur kT ≤ t < (k + 1)T gilt wegen (7.40) andererseits GM 0 (s, t) = GA (s, t) = e−s(t−kT ) . Aus beiden Ausdr¨ ucken entnehmen wir eine grundlegende, unabh¨angig von m(t) geltende Beziehung ∞ e−s(t−kT ) 1 exp(jνΩt) = T ν=−∞ s + jνΩ 1 − e−sT
f¨ ur
kT ≤ t < (k + 1)T .
(7.43)
Der Abtast-Halte-Operator A reagiert bei beliebigen Formierungsfunktionen m auf das Eingangssignal u(t) = est mit einem Ausgangssignal uH (s, t), das auch im Argument s periodisch ist. Dies erkennt man so: An den t¨ gilt, vgl. (7.42), Stetigkeitsstellen der PUF uH (s, t) = GA (s, t) · est = GM (s, t) · est ∞ 1 = M (s + jνΩ) · exp([s + jνΩ]t) T ν=−∞
(7.44) (7.45)
Der zuletzt notierte Ausdruck ist offensichtlich periodisch in s, und zwar mit der Periode jΩ. Die Grundbeziehung (7.39) der Signalverarbeitung im Abtast-Halteglied gestattet eine alternative Auslegung, die Nachrichten- und Regelungstechniker seit den 1950er Jahren h¨ aufig verwenden, vgl. Bild 7.14. Durch Laplace-Transformation von (7.39) gewinnt man
392
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise A
u∗ (t)
u(t)
uH (t)
M (s)
δ-Abtaster
Bild 7.14. Alternative Interpretation der Wirkungsweise des Abtast-Haltegliedes ∞
L {uH (t)} = UH (s) =
M (s)e−skT u(kT + 0) = M (s) · U ∗ (s)
k=−∞ ∞
= M (s)
∞
u[k]e−skT = M (s) · L
k=−∞
7 u[k]δ(t − kT )
k=−∞
= M (s) · L {u∗ (t)} .
(7.46)
In diesem Buch wird das mysteri¨ ose Konzept des δ−Abtaster s, der ein zeitkontinuierliches Eingangsgsignal u(t) in einen δ−Impuls-Kamm u∗ (t) :=
∞
u[k] · δ(t − kT )
k=−∞
oglich, weil man die in der Bewandelt, nicht weiter benutzt. 2 Das wird m¨ ziehung (7.46) vorkommende Bildfunktion U ∗ (s) =
∞
u(kT + 0)e−skT
(7.47)
k=−∞
direkt berechnen kann. Die u ¨blichen Testsignale u(t) geh¨oren zur Signalfamilie u(t) = c · tm · eat · 1(t) f¨ ur
a, c ∈ C,
m∈N
(7.48)
oder ergeben sich aus Linearkombinationen dieser Grundform. F¨ ur die zuasst sich ein geschlossener analytischer Ausgeh¨ orende Bildfunktion U ∗ (s) l¨ druck finden: U ∗ (s) =
∞ k=−∞ ∞
=c·
k=0
u(kT + 0)e−skT =
c(kT )m eakT · e−skT
k=0
(kT )m e(a−s)kT = c ·
c ∂m = m ∂a 1 − e(a−s)T 2
∞
∞ ∂ m (s−a)T −k e ∂am k=0
(7.49)
Das Konzept der damit im Zusammenhang stehenden sog. modifizierten zTransformation, die alternativ zur Gewinnung von Signalwerten zwischen den Abtastzeitpunkten eingesetzt werden kann, wird hier ebenfalls nicht verfolgt.
7.5 Abtastregelkreis
393
Beispiel 7.6 Sei u(t) = 0.5 · t · 1(t). Dieses Signal geh¨ort zur Familie (7.48) f¨ur c = 0.5, m = 1, a = 0. Die Formel (7.49) liefert hier ∂ 0.5 ∂a 1 − e(a−s)T a=0 0.5 T e(a−s)T = (1 − e(a−s)T )2 a=0
U ∗ (s) =
=
0.5 T e−sT . (1 − e−sT )2
Wenn das Halteglied nullter Ordnung mit m(t) = m0 (t) = 1(t) − 1(t − T ) verwendet wird, so ist im Beispielfalle der Verlauf der Funktion uH (t) ohne jede Rechnung skizzierbar, siehe Bild 7.15. Dieser evidente Sachverhalt l¨ asst sich nutzen, um das
u, uH u uH
3T
Bild 7.15. Eingangssignal u(t) = 12 · t · 1(t) und zugeh¨ orendes Ausgangssignal uH (t) bei einem Abtast– Halteglied nullter Ordnung mit m0 (t) = 1(t) − 1(t − T )
2T
T
0
T
2T
t
3T
Ergebnis (7.49) einer Plausibilit¨ atspr¨ ufung zu unterziehen. Das Bild UH (s) des Signals am Ausgang des Abtast-Haltegliedes berechnet man so, 1 − e−sT 0.5 T e−sT · s (1 − e−sT )2 ∞ ∞ −νsT T −(ν+1)sT e = e . 2s ν=0 ν=0
UH (s) = M (s) · U ∗ (s) = =
T −sT e 2s
Daraus folgt uH (t) =
∞ T 1(t − (ν + 1)T ) , 2 ν=0
wie es sein muss, vgl. Bild 7.15.
7.5.3.3 Digitaler Regler in offener Kette Bild 7.16 zeigt einen digitalen Regler mit vorgeschaltetem T -periodischen Abtastglied und einem nachgesetzten Halteglied nullter Ordnung. Der Operator
394
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
R dieser offenen Kette transformiert ein Eingangssignal e in ein Ausgangssignal vH . Hinsichtlich der Eigenschaften der MIMO-Strukturen von Abtastgliedern ADC und Haltegliedern H0 gelten die Voraussetzungen, die zu Bild 7.8 erkl¨ art wurden. R e
Abtastglied ADC
ed
Digitaler Regler DIR
vd
Halteglied H0
vH
Bild 7.16. Digitaler Regler mit vorgeschaltetem Abtast- und nachgeschaltetem Halteglied
¨ Wir fragen nach der parametrischen Ubertragungsmatrix des Operators R. Ganz allgemein gilt vH = R ◦ e = H0 ◦ DIR ◦ ADC ◦ e = H0 ◦ DIR ◦ ed , wobei
ed (t) =
e(kT + 0) = e[k] f¨ ur t = kT 0 sonst.
Der Operator DIR steht f¨ ur die Signalverarbeitung im digitalen Regler. Er erzeugt aus der Wertefolge {e[k]}k∈Z eine Wertefolge {v[k]}k∈Z , und zwar gem¨ aß einem Differenzen-Gleichungssystem, vgl. (7.4) im Abschnitt 7.4, n¨ amlich l λ=0
AK λ v[k + λ] +
l
BλK e[k + λ] = 0 .
(7.50)
λ=0
Dabei gelte auch hier e ∈ Rr und v ∈ Rm . ¨ Um die parametrische Ubertragungsmatrix des Operators R zu ermitteln, haben wir als Eingangssignal e(t) = est e0 , wobei e0 einen m−dimensionalen konstanten Vektor bezeichnet, und damit e[k] = eskT e0 zu w¨ahlen. Wir ersetzen k durch k − l und erhalten aus (7.50) den Ausdruck K K AK l v[k] + Al−1 v[k − 1] + ... + A0 v[k − l] K K + Bl + e−sT Bl−1 + ... + e−slT B0K e[k] = 0 .
Eine L¨ osung l¨ asst sich sogleich angeben:
(7.51)
7.5 Abtastregelkreis
395
−sT K −1 v[k] = −(AK Al−1 + ... + e−slT AK l +e 0 ) K · (BlK + e−sT Bl−1 + ... + e−slT B0K )e[k] =: GDIR (s) · e[k]
(7.52)
Die L¨ osung ist sogar eindeutig (nachlesbar in [RL97] und [RL01]), wenn nur −sT K det(AK Al−1 + ... + e−slT AK l +e 0 ) = 0.
¨ Am Ausgang der betrachteten Ubertragungskette erscheint das Signal vH (t) = H0 ◦ vd (t) =
∞
m(t − kT )v[k],
k=−∞
beim gew¨ ahlten Eingangssignal e(t) = est e0 also vH (s, t) =
∞
m(t − kT ) · eskT · GDIR (s) · e0 .
k=−∞
¨ ¨ ergibt Gem¨ aß der Definition der parametrischen Ubertragungsfunktion PUF ¨ sich die parametrische Ubertragungsmatrix des Operators R nun zu GR (s, t) = e
−st
vH (s, t) = =
∞ k=−∞ ∞
m(t − kT ) · e−s(t−kT ) · GDIR (s) · e0 m(t + kT ) · e−s(t+kT ) · GDIR (s) · e0
k=−∞
= GA (s, t) · GDIR (s) · e0 . ¨ Aufgrund ihrer T -Periodizit¨ at im Argument t darf man diese PUF-Matrix in eine Fourier-Reihe, vgl. die Herleitung von (7.41), entwickeln, GF R (s, t) =
∞ 1 M (s + jνΩ) exp(jνΩt) · GDIR (s) · e0 T ν=−∞
= GF A (s, t) · GDIR (s) · e0 = GM (s, t) · GDIR (s) · e0 . 7.5.3.4 Zeitkontinuierlicher LTI-Prozess mit vorgeschaltetem Abtast-Halteglied ¨ Wir untersuchen das Ubertragungsverhalten eines zeitkontinuierlichen MIMOLTI-Prozesses mit vorgeschaltetem Abtast-Halteglied (vgl. Bild 7.17). Die vorausgesetzten Eigenschaften der MIMO-Struktur des Abtast-Haltegliedes
396
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise P u(t)
Abtast-Halteglied uH (t) Zeitkontinuierl. LTI-Prozess A
x(t)
Bild 7.17. Zeitkontinuierlicher LTI-Prozess mit vorgeschaltetem Abtast-Halteglied
¨ wurden oben zu Bild 7.8 erkl¨ art. Das Ubertragungsverhalten des AbtastHaltegliedes wurde im Abschn. 7.5.3.2 diskutiert. Der LTI-Prozess, der im Zeitbereich durch das Differentialgleichungssystem (6.1) ⎛ ⎞
g h j di d Ai i x(t) + ⎝ Bj j ⎠ uH (t) = 0 (7.53) dt dt i=0 j=0 beschrieben wird, l¨ asst sich im Bildbereich durch das polynomiale Gleichungssystem (6.2) darstellen, AP X(s) + BP UH (s) = α0 (s). Die Koeffizienten des polynomialen Vektors α0 (s) h¨angen von den Anfangswerten x(−0), x(−0), ˙ . . . ; uH (−0), u˙ H (−0), . . . ab, wie es in den Gleichungen (6.3) im Detail formuliert wurde. Das Stellsignal uH ist st¨ uckweise stetig und f¨ ur ein Halteglied nullter Ordnung mit allgemeiner Formierungsfunktion m(t) durch uH (t) =
∞
·m(t − kT )u(kT + 0)
k=−∞
¨ gegeben. Die p× m-Ubertragungsmatrix P (s) = −A−1 P (s) · BP (s) wird hier als proper vorausgesetzt und in der Form GxuH (s)
= P (s) = P00 +
kλ l λ=1
Pλκ (s − sλ )κ κ=1
mit
P00 , Pλκ ∈ Rp×m (7.54)
dargestellt. Angenommen werden dabei l voneinander verschiedene (endliche) Polstellen sλ mit den Vielfachheiten kλ (λ = 1, ..., l). Die p × m-Residuenmatrizen Pλκ k¨ onnen mit der Formel ( kλ −κ ) ∂ 1 kλ Pλκ = (P (s) − P ) · (s − s ) 00 λ (kλ − κ)! ∂skλ −κ s=sλ berechnet werden. Zur Matrix P (s) = GxuH (s) geh¨ ort in der Halbebene Re(s) > max Re(sλ ) 1≤λ≤l
das Original im Zeitbereich
7.5 Abtastregelkreis
guxH (t) = P00 · δ(t) +
kλ l
Pλκ
λ=1 κ=1
tκ−1 esλ t (κ − 1)!
397
· 1(t)
In der gleichen Weise gelangt man von dem anfangswertabh¨angigen Bildanteil X0 (s) = A−1 P α0 (s) zu dem anfangswertabh¨ angigen Signalvektor x0 (t) = L−1 {X0 (s)}. Die allgemeine L¨ osung von (7.53) f¨ ur t > 0 gewinnt man mit Hilfe des Faltungssatzes: t x(t) =
guxH (t − τ )uH (τ )dτ + x0 (t).
−0
¨ Nun wenden wir uns der parametrischen Ubertragungsmatrix des Operators P = P ◦ A zu, vgl. Bild 7.17. Bei einem Eingangssignal u(t) = est u0
mit konstantem u0
(7.55)
erzeugt das Abtast-Halteglied das Signal
∞ skT · u0 uH (s, t) = m(t − kT ) · e k=−∞
An den Stetigkeitsstellen von uH (s, t) bez. des Arguments t gilt
uH (s, t) =
∞ 1 M (s + jνΩ) exp([s + jνΩ]t) · u0 . T ν=−∞
Am Ausgang der LTI-Strecke erscheint dann (bei verschwindendem anfangswertabh¨ angigen Anteil x0 (t)) das Signal x(s, t) = P (s) · uH (s, t) ∞ 1 = P (s + jνΩ)M (s + jνΩ) exp([s + jνΩ]t)u0 . T ν=−∞
(7.56)
¨ Dabei wurde stillschweigend vorausgesetzt, dass kein Pol sλ der Ubertragungsmatrix P mit einer der komplexen Zahlen s + jνΩ (mit ν ∈ Z) zusammenf¨ allt und dass M (sλ ) = 0 gilt, um Pol-Nullstellen-K¨ urzungen auszuschließen.
398
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
Der Ausdruck (7.56) l¨ asst sich wie folgt umformen: x(s, t) − P00 uH (s, t) =
kλ ∞ l Gλκ 1 M (s + jνΩ) exp([s + jνΩ]t)u0 T ν=−∞ (s + jνΩ − sλ )κ κ=1 λ=1
=
kλ l
Pλκ
∞ 1 1 M (s + jνΩ) exp([s + jνΩ]t)u0 T ν=−∞ (s + jνΩ − sλ )κ
Pλκ
1 · (κ − 1)!
λ=1 κ=1
=
kλ l λ=1 κ=1
∂ κ−1 ∂sκ−1 λ
>
? ∞ 1 1 M (s + jνΩ) exp ([s + jνΩ]t) u0 T ν=−∞ (s + jνΩ − sλ )
Bei der Auswertung der eckigen Klammer wollen wir die Bestimmungsgleichung von M (s + jνΩ), vgl. (7.41), und die Formel (7.43) ausnutzen und 0 ≤ t < T voraussetzen: T ∞ 1 1 m(τ )e−[s+jνΩ]τ dτ · e[s+jΩν]t T ν=−∞ s − sλ + jνΩ = 0
T ∞ ∞ 1 e(s+jνΩ)(t−τ ) 1 e(s+jνΩ)(t−τ ) dτ + m(τ ) dτ m(τ ) T ν=−∞ s − sλ + jνΩ T ν=−∞ s − sλ + jνΩ t
t =
T
=
es(t−τ ) · e(sλ −s)(t−τ ) es(t−τ ) e((sλ −s)(t−τ +T ) dτ + m(τ ) dτ (−(s−s )T λ 1−e 1 − e−(s−sλ )T t ⎤ ⎡ t T 1 ⎣ m(τ )esλ (t−τ ) dτ + m(τ )e−sT esλ (t−τ +T ) dτ ⎦ (−(s−s )T
m(τ ) 0
=
0
t
1−e
λ
esλ t 1 − e(−(s−sλ )T
⎡ =
=
t
0
⎡ T ⎤ T ⎣ m(τ )e−sλ τ dτ + m(τ )e−sλ τ dτ · e(sλ −s)T − 1 ⎦
esλ t 1 − e(−(s−sλ )T M (sλ )esλ t − 1 − e(sλ −s)T
t
0
⎣M (sλ ) +
T
⎤ m(τ )e−sλ τ dτ · e(sλ −s)T − 1 ⎦
t
T m(τ )esλ (t−τ ) dτ t
Das Ergebnis, das f¨ ur das Zeitintervall 0 ≤ t < T hergeleitet wurde, kann so zusammengefasst werden:
7.5 Abtastregelkreis
x(s, t) = P00 · m(t) · u0 + ⎞⎤ ⎛ ⎡ T kλ l κ−1 wt Pλκ ⎣ ∂ ⎝ M (w)e − m(τ )ew(t−τ ) dτ ⎠⎦ κ−1 (w−s)T (κ − 1)! ∂w 1 − e κ=1 λ=1
t
399
(7.57) · u0
w=sλ
Der Definitionsbereich von x l¨ asst sich auf die ganze t-Achse erweitern; denn aus (7.56) folgt unmittelbar x(s, t) = x(s, t − kT ) · eskT
f¨ ur
kT ≤ t < (k + 1)T.
(7.58)
¨ ¨ Die parametrische Ubertragungsmatrix (PUF) des Operators P = P ◦ A −st ergibt sich u ¨ ber e x(s, t) aus (7.56) zu GF P (s, t) =
∞ 1 P (s + jνΩ)M (s + jνΩ) exp(jνΩt) =: GP M (s, t) T ν=−∞
(7.59) ¨ ist periodisch in t; denn Diese PUF GP M (s, t + T ) = GP M (s, t) .
(7.60)
F¨ ur 0 ≤ t < T folgt aus (7.57) die Beziehung est GP M (s, t) = P00 m(t) + ⎞⎤ ⎛ ⎡ T kλ l Pλκ ⎣ ∂ κ−1 ⎝ M (w)ewt − m(t)ew(t−τ ) dτ ⎠⎦ κ−1 (w−s)T (κ − 1)! ∂w 1 − e λ=1 κ=1 t
(7.61)
w=sλ
F¨ ur den praktisch bedeutsamsten Fall eines Haltegliedes nullter Ordnung mit der Formierungsfunktion m(t) = m0 (t) = 1(t) − 1(t − T ) nehmen die abgeleiteten Zusammenh¨ ange eine einpr¨ agsamere konkrete Gestalt an. Aus Platzgr¨ unden begn¨ ugen wir uns damit, die Konkretisierung f¨ ur die große eckige Klammer [...] in (7.57) vorzuf¨ uhren: ⎡ ⎞⎤ ⎛ T κ−1 0 wt ⎣ ∂ ⎝ M (w)e − m0 (τ )ew(t−τ ) dτ ⎠⎦ ∂wκ−1 1 − e(w−s)T t
⎡
⎛
∂ κ−1 (1 − e−wT )ewt − = ⎣ κ−1 ⎝ ∂w w(1 − e(w−s)T ) ( =
∂ κ−1 ∂wκ−1
w=sλ
T t
⎞⎤
ew(t−τ ) dτ ⎠⎦ w=sλ
(1 − e−wT )ewt esT + (ew(t−T ) − 1)(esT − ewT ) w(esT − ewT )
) w=sλ
400
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
(
∂ κ−1 = ∂wκ−1
1 ewt (esT − 1) − w(esT − ewT ) w
F¨ ur t = 0 erhalten wir (
∂ κ−1 ∂wκ−1
) mit 0 ≤ t < T . w=sλ
ewT − 1 w(esT − ewT )
) w=sλ
An dieser Stelle erweist sich ein Vergleich mit Ergebnissen des Abschnitts 7.5.2 als sehr aufschlussreich. An den Abtastzeitpunkten t = kT gilt n¨amlich wegen (7.58) und (7.55) x(s, kT ) = x(s, 0) eskT = GP M 0 (s, 0) · u(kT ) ? > ( κ−1 ) kλ l Pλκ ∂ ewT − 1 u(kT ) = P00 + (κ − 1)! ∂wκ−1 w(esT − ewT ) w=sλ κ=1 λ=1
Eine Gegen¨ uberstellung mit (7.33) lehrt & P ' GZ (z) z=esT = GP M 0 (s, 0) = P00 +
kλ l λ=1
(7.62) (
Pλκ ∂ κ−1 (κ − 1)! ∂wκ−1 κ=1
ewT − 1 w(esT − ewT )
) w=sλ
Die gewonnene Erkenntnis formulieren wir als Satz 7.5 Bei zeitkontinuierlicher Beschreibung des Abtastregelkreises stimmt ¨ (f¨ ur beliebige LTI-Prozesse der Gestalt (7.54)) die PUF GP M 0 (s, t) = > e
−st
P00 +
? ( κ−1 wt sT ) Pλκ ∂ 1 e (e −1) − (κ−1)! ∂wκ−1 w(esT −ewT ) w w=sλ κ=1
kλ l λ=1
(7.63)
des Operators P = P ◦ A an der Stelle τ = 0, wenn man esT = z substituiert, ¨ mit der z−Ubertragungsfunktion GP ublichen Z (z), die sich bei Verwendung des ¨ Abtast-Haltegliedes nullter Ordnung ergibt, u ¨berein. Beispiel 7.7 Zur Erl¨auterung wird P (s) = (s − s0 )−1 ¨ lautet gew¨ ahlt. Die zugeh¨ orende PUF GP M 0 (s, t) = e
−st
es0 t (esT − 1) 1 − s0 (esT − es0 T ) s0
F¨ ur τ = 0 ergibt sich daraus GP M 0 (s, 0) =
1 esT − 1 − s0 (esT − es0 T ) s0
=
,
0≤t
es0 T − 1 s0 (esT − es0 T )
.
7.5 Abtastregelkreis Mit der Substitution esT = z folgt 1 z−1 − s0 (z − es0 T ) s0
=
es0 T − 1 s0 (z − es0 T )
401
= GP Z (z),
¨ in Ubereinstimmung mit (7.32) aus Abschnitt 7.5.2 .
¨ Mit Hilfe der parametrischen Ubertragungsmatrix GP M (s, t) im Parameterbereich 0 ≤ t < T lassen sich aber auch die Verl¨aufe der Prozessvariablen zwischen den Abtastzeitpunkten berechnen. Wir betrachten dazu den ¨ Ubertragungsoperator P = P ◦ A in seiner allgemeinen Form (vergl. Bild 7.17) und treffen keine speziellen Annahmen u ¨ ber das Eingangssignal u(t). Berechnet werden soll das Ausgangssignal x(t). Der Zeitpunkt t wird nicht fixiert, doch wird im Laufe der Rechnung ausgenutzt, dass sich zu jedem t ∈ R ein k ∈ Z derart finden l¨ asst, dass gilt t = kT + τ
mit
0≤τ
¨ Wir starten unsere Uberlegungen mit dem Bild des Ausgangssignals, X(s) = P (s) · UH (s) = P (s) · M (s) · U∗ (s) .
(7.64)
(Die Beziehung UH (s) = M (s) · U∗ (s) stammt aus Abschnitt 7.5.3.2, Gl. (7.46) auf S. 392.) Durch Laplace-R¨ ucktransformation gelangt man zu 1 x(t) = x(kT + τ ) = 2πj
c+j∞
X(s)est ds
(7.65)
c−j∞
mit einer reellen Konstanten c > max Re pi , wobei pi f¨ ur die Polstellen von X(s) steht. Das Integral auf der rechten Seite von (7.65) wird nun umgeformt, indem (7.64) eingesetzt, anschließend der Integrationsweg in Periodizit¨atsintervalle geteilt und schließlich Gebrauch von (7.59) und (7.60) gemacht wird: 1 x(t) = x(kT + τ ) = 2πj
c+j∞
P (s)M (s)est U ∗ (s)ds
c−j∞ ∞ 1 = 2πj ν=−∞
c+(ν+ 12 )jΩ
P (s)M (s)est U∗ (s)ds
mit Ω =
2π T
c+(ν− 12 )jΩ 1
c+ 2 jΩ ∞ 1 = P (s + jνΩ)M (s + jνΩ)e(s+jνΩ)t U∗ (s + jνΩ)ds 2πj ν=−∞ c− 12 jΩ
402
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
T = 2πj
c+ 12 jΩ
c− 12 jΩ
T = 2πj
∞ 1 P (s + jνΩ)M (s + jνΩ)e(s+jνΩ)t U∗ (s + jνΩ)ds T ν=−∞
1 c+ 2 jΩ
GP M (s, t)est U∗ (s)ds
c− 12 jΩ
T = 2πj
c+ 12 jΩ
GP M (s, t mod(T ))esτ eskT U∗ (s)ds
c− 12 jΩ
=
T 2πj
1 c+ 2 jΩ
GP M (s, τ )esτ · U∗ (s) · eskT ds
(7.66)
c− 12 jΩ
Aus Gl. (7.47) des Abschnitts 7.5.2 und Gl. (7.61) ist bekannt, dass sowohl U∗ (s) als auch GP M (s, t)est eine s-Abh¨angigkeit spezieller Art aufweisen. Beidemal handelt es sich um gebrochen-rationale Funktionen von esT . Es liegt daher nahe, im Integral (7.66) eine Substitution der Integrationsvariablen vorzunehmen, n¨ amlich esT = z zu setzen. Dies impliziert T ds = z −1 dz,
j
e(c− 2 Ω)T = ecT · e−jπ ,
j
e(c+ 2 Ω)T = ecT · e−jπ .
Das Linienintegral wird zum Ringintegral. In der z−Ebene hat man u ¨ ber einen Kreisring C um den Ursprung mit dem Radius ecT im Gegenuhrzeigersinn zu integrieren. Mit den Abk¨ urzungen P M (z, τ ), GP M (s, τ )esτ |esT =z =: G
U∗ (s)|esT =z =: U(z)
(7.67)
gewinnt man aus (7.66) die Beziehung x(t) = x(kT + τ ) =
1 P M (z, τ ) · U(z) G · z k−1 dz 2πj !
(7.68)
C
Zur Plausibilit¨ atskontrolle pr¨ ufen wir, ob das abgeleitete Resultat (7.68) im Spezialfall τ = 0, M (s) = M 0 (s) und Eingangssignalen u(t), die f¨ ur t < 0 verschwinden, auf die bekannte Formel der z−R¨ ucktransformation, d.h. auf (7.28) im Abschnitt 7.5.2, f¨ uhrt. Tats¨ achlich gilt wegen (7.62) und (7.47) bei den genannten Spezialisierungen P M 0 (z, 0) = GP (z) und G Z
U(z) =
∞ k=0
und damit
u(k] z −k = UZ (z)
7.5 Abtastregelkreis
403
1 1 k−1 x[k] = (z) · U (z) · z dz = ! GP XZ (z) · z k−1 dz , Z Z 2πj 2πj ! C
C
wie gew¨ unscht. Der qualitative Unterschied und besondere Wert der abgeleiteten Beziehung (7.68) besteht gerade darin, auch das Verhalten des Ausgangssignals zwischen den Abtastzeitpunkten zu erfassen. Unter den u ¨blichen Annahmen von Abtast-Haltegliedern nullter Ordnung mit m(t) = m0 (t) = 1(t)−1(t−T ) und LTI-Prozessen der Gestalt (7.54) konkretisiert sich die allgemeine Beziehung (7.68) wie folgt: > 1 x(kT +τ ) = P00 + 2πj ! C ? ( κ−1 wτ ) kλ l Pλκ ∂ 1 e (z − 1) + − · U(z) ·z k−1 dz . κ−1 wT ) (κ − 1)! ∂w w(z − e w w=sλ κ=1 λ=1
¨ beschrieBeispiel 7.8 Der Prozess m¨oge durch ein SISO-P T1-Ubertragungsglied ben sein, P (s) =
1 1 1 . = T1 s + 1 T1 s + T1 1
Aus der Definition der Funktion GP M 0 (z, τ ) und (7.63) entnehmen wir hier 1 GP M 0 (z, τ ) = T1
e
z−1
− Tτ
1
− T11
z−e
− TT
1
1
−
−1 T1
τ = 1 − e− T1
z−1 z−e
− TT
.
1
P M 0 (z, τ ) an den Stellen τ = 0 und Zur Kontrolle wird der berechnete Ausdruck G τ = T ausgewertet. Man erh¨ alt einerseits P M 0 (z, 0) = G
1−e
− TT
z−e
− TT
1
= GP Z (z),
1
wie der Vergleich mit Beispiel 7.3 zeigt, und andererseits
P M 0 (z, T ) = G
z 1−e z−e
− TT
1
− TT
= z · GP Z (z),
1
also bei beiden Proben die richtigen Ergebnisse. Als Eingangssignal werde u(t) = t · e−t · 1(t) angenommen. Dieses Signal geh¨ ort zur Signalfamilie (7.48), und zwar mit den Paalt rametern c = 1, m = 1, a = −1 . Mit der Rechenvorschrift (7.49) f¨ ur U ∗ (s) erh¨ man U (z) zu
404
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise U (z) =
∂ 1 −1 aT ∂a 1 − z e
= −(1 − z
−1 aT −2
e
)
a=−1
(−z −1 T eaT )
z . (z − e−T )2
= T e−T
a=−1
Dank des allgemeinen Zusammenhangs (7.68) l¨ asst sich das Ausgangssignal x(t) f¨ ur jeden Zeitpunkt t > 0 berechnen:
1 0 (z, τ ) · U (z) · z k−1 dz G 2πj P M
x(t) = x(kT + τ ) =
C
1 = 2πj
1−e
z−e
C
z−1
− Tτ 1
− TT
1
T e−T · z k dz . (z − e−T )2
− T
Der Integrand hat einen einfachen Pol an der Stelle z1 = e T1 und einen zweifachen Pol an der Stelle z2 = e−T . Die Berechnung des Integrals kann mit Hilfe der Residuen des Integranden erfolgen: x(kT + τ ) =
2
1−e
Res
z=zi
z−1
− Tτ
1
− TT
z−e T e−T · z1k − Tτ = −e 1 (z1 − 1) (z1 − e−T )2 i=1
+ = −e
∂ ∂z
− Tτ 1
1−e (z1 − 1)
+
T e−T z2k−1
1
z−1
− Tτ
1
z−e
T e−T · z k (z − e−T )2
− TT
T e−T · z k
1
z=z2
−T
Te (z1 −
k−e
· z1k −T e )2
− Tτ
1
k(z2 − 1)(z2 − e
− TT
1
(z2 − e
) + z2 (1 − e
− TT
1
− TT
1
)
.
)2
Das gewonnene Ergebnis wurde im Bild 7.18 unter Annahme der normierten Parameterwerte T1 = 10 und T = 1 graphisch ausgewertet. Die Funktionswerte x(kT ) an den Abtaststellen wurden durch Kreuze markiert, und zwar f¨ ur ¨ k = 0, 1, . . . , 30. Zum Vergleich wurde die Antwort des Ubertragungsliedes mit 1 ¨ der Ubertragungsfunktion P (s) = T1 s+1 auf das zeitkontinuierliche Eingangsignal −t u(t) = t · e · 1(t) berechnet, x(t) = L−1 {P (s)U (s)} = L−1
= (T1 − 1)−2 T1 e
− Tt
1
1 1 · T1 s + 1 (s + 1)2
− [T1 + t(T1 − 1)]e−t ,
und als punktierte Linie in das Bild 7.18 eingetragen.
7.5.3.5 Pathologische Abtastfrequenzen In diesem Abschnitt soll auf einen Sachverhalt, der in einer Bemerkung im Anschluss an (7.56) bereits anklang, genauer eingegangen werden. Bei der
7.5 Abtastregelkreis
405
0.08
0.07
0.06
x(t)
0.05
0.04
0.03
0.02
0.01
0
5
10
15
20
t
25
30
Bild 7.18. Zeitkontinuierliche Systemantwort mit Abtast- Halteglied (durchgezogene Linie) und ohne Abtast-Halteglied (strich–punktierte Linie)
Herleitung der fundamentalen Beziehung (7.68) wurde wesentlich ausgenutzt, dass die (bei MIMO-Prozessen matrixwertige) Funktion est GP M (s, t) eine s−Abh¨ angigkeit spezieller Art besitzt. Die Matrixelemente, die jeweils f¨ ur sich einen SISO−Prozess beschreiben, sind gebrochen-rationale Funktionen von esT = z. Problematisch sind die F¨ alle, bei denen ein Element der Ma τ ) gemeinsame z−Nullstellen im Z¨ahler- und im trix esτ GP M (s, τ ) = G(z, Nennerpolynom besitzt. ¨ Wir wollen einen SISO-Ubertragungskanal betrachten und dabei von der Darstellung (7.61) ausgehen. Mit der Substitution ζ := e−sT darf man schreiben: esτ GP M (s, τ )|e−sT =ζ =:
¯ τ) Z(ζ, ¯ (ζ) ; N
0 ≤ τ < T.
Das Nennerpolynom l¨ asst sich ohne M¨ uhe aus (7.61) entnehmen: ¯ (ζ) = N
l <
1 − esλ T ζ
kλ
.
λ=1
¯ (ζ) in der ζ-Ebene Ersichtlich h¨ angt die Lage der Nullstellen des Polynoms N vom Regelstreckenmodell (7.54), das die Polstellen sλ mit ihren Vielfachheiten kλ (λ = 1, . . . , l) festlegt, aber auch von der Abtastperiode T oder, anders ausgedr¨ uckt, von der Abtastfrequenz Ω = 2π T ab.
406
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
¯ τ ) w¨ Die explizite Ermittlung des Z¨ ahlerpolynoms Z(ζ, urde viel mehr Aufwand kosten und wird hier nicht angestrebt. Es gen¨ ugt, die prinzipielle Struktur zu kennen: ¯ τ ) = Z0 (τ ) + Z1 (τ ) · ζ + Z2 (τ ) · ζ 2 + . . . + Zn (τ ) · ζ n Z(ζ, mit zeitabh¨ angigen Koeffizienten Zν (τ ) f¨ ur ν = 0, 1, . . . , n, wobei n =
l *
kλ .
λ=1
Definition 7.2. Eine Abtastperiode T bzw. Abtastfrequenz Ω = 2π T heißt ¯ (ζ) und Z(ζ, ¯ τ ) in der parametrischen pathologisch, wenn die Polynome N ¨ Ubertragungsfunktion esτ GP M (s, τ )|e−sT =ζ =:
¯ τ) Z(ζ, ; ¯ N(ζ)
0≤τ
(mindestens) eine gemeinsame Nullstelle haben. Beim Entwurf von Abtastregelkreisen kommt es ganz wesentlich darauf an, keine pathologischen Abtastfrequenzen zu w¨ ahlen. Nach Ermittlung der Pole sλ der Regelstrecke und Festlegung der Formierungsfunktion m(t) des Haltegliedes muss gekl¨ art werden, ob eine vorgesehene Abtastfrequenz pathologisch ist oder nicht. Dabei ist zu ber¨ ucksichtigen, dass auch die Bildfunktion M (s) von der Abtastfrequenz abh¨ angt. Satz 7.6 Bei Zugrundelegung des zeitkontinuierlichen Regelstreckenmodells (7.54) ist eine Abtastperiode T dann und nur dann nicht pathologisch, wenn die beiden Bedingungen M (sλ ) = 0 e
sλ T
= e
sµ T
f¨ ur λ = 1, . . . , l f¨ ur λ = µ
und
(λ, µ = 1, . . . , l)
erf¨ ullt werden. Beweis: a) Beide Bedingungen seien erf¨ ullt. Die Pole der Funktion −sλ T
¯ Z(ζ,τ ) ¯ (ζ) N
liegen bei
. Bei der Ausf¨ uhrung der Differentiation im zweiten Sumζ = ζλ = e manden auf der rechten Seite von (7.61) erh¨alt man einen Term ) ( 1 ∂ kλ −1 1 Pλkλ M (w)ewt k −1 , (7.69) (kλ − 1)! ∂w λ 1 − ewT ζ w=sλ aus dem ein Pol bei ζλ der maximalen Ordnung kλ resultiert, der wegen M (sλ ) = 0 nicht ausgel¨ oscht werden kann. Andererseits gilt ζλ = ζµ f¨ ur λ = µ, so dass jede Polstelle sλ mit ihrer Vielfachheit kλ wirksam wird. *l ¯ ) Insgesamt hat der gebrochen rationale Ausdruck Z(ζ,τ ¯ (ζ) also λ=1 kλ = n N Pole, und K¨ urzungen sind nicht m¨ oglich.
7.5 Abtastregelkreis
407
b) Wenn zwei Pole u ¨ bereinstimmen, z. B. ζ1 = ζ2 , so tragen die beiden zugeh¨ orenden Summanden (7.69) nicht (k1 + k2 ) Pole, sondern h¨ochstens max(k1 , k2 ) < (k1 + k2 ) Pole zur Gesamtzahl bei. Gilt M (sλ ) = 0, so kann der Pol ζλ h¨ ochstens mit (kλ − 1)-facher Vielfachheit wirksam werden, vgl. (7.69). In beiden F¨allen hat die gebrochen¯ ) rationale Funktion Z(ζ,τ ¯ (ζ) eine Gesamtzahl von Polen, die kleiner als N *l ¯ λ=1 kλ = n ist. Mithin besitzen das Polynom N (ζ) und das Polynom ¯ Z(ζ, τ ) mindestens eine gemeinsame Nullstelle. qed. Im vorstehenden Beweis spielt der Parameter τ keine Rolle. Wenn Pol τ ) auftreten, Nullstellen-K¨ urzungen in der Funktion esτ GP M (s, τ ) = G(z, 0) stimmt mit der zso auch an der Stelle τ = 0. Die Funktion G(z, ¨ (z) u berein, die im Abschnitt 7.5.2 bei der zeitUbertragungsfunktion GP ¨ Z diskreten Beschreibung von Abtastregelkreisen benutzt wurde, vgl. insbesondere (7.33). Das Ph¨ anomen der pathologischen Abtastfrequenzen h¨angt nicht davon ab, ob man sich mit der einfacheren zeitdiskreten Beschreibung von Abtastregelkreisen begn¨ ugt oder ob man die genauere zeitkontinuierliche Beschreibung bevorzugt. Pathologische Abtastfrequenzen werden allein durch die Pole der Regelstrecke und die Formierungsfunktion des Haltegliedes bestimmt. Bei fixierten Zahlenwerten f¨ ur T > 0, sλ = sµ l¨asst sich die in der komplexen z-Ebene formulierte Bedingung zλ = esλ T = esµ T = zµ in der s-Ebene so ausdr¨ ucken: sλ T = sµ T + jν2π oder sλ − sµ = jν
2π T
f¨ ur irgendein ν ∈ Z f¨ ur irgendein ν ∈ Z.
¨ Die vorstehenden Uberlegungen rechtfertigen die folgende Aussage. Satz 7.7 Bei Abtastregelkreisen mit einem zeitkontinuierlichen Regelstreckenmodell (7.54), das die Pole {s1 , . . . , sl } besitzt, und einem Halteglied mit der Bildfunktion M (s) wird sich eine vorgesehene Abtastperiode T dann und nur dann als pathologisch erweisen, wenn dieser Zahlenwert T > 0 einer der beiden Bedingungen M (sλ ) = 0 2π sλ − sµ = jν T
f¨ ur irgendein
λ ∈ {1, . . . , l}
f¨ ur irgendein
ν ∈ Z,
oder
λ = µ,
gen¨ ugt. Beispiel 7.9 Eine SISO-Regelstrecke sei als P − T3 −Glied in der Gestalt P (s) =
b0 (s + 1/T1 )(s2 + 2d0 ω0 s + ω02 );
0 < d0 < 1;
ω0 > 0
408
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
modelliert worden. Als Halteglied soll ein linearer Extrapolator mit der Bildfunktion M (s) =
1 + Ts (1 − e−sT )2 T s2
eingesetzt werden, vgl. Abschnitt 7.5.1, Gl.(7.20). Die Regelstrecke hat drei einfache Pole, und zwar s1 = −
1 , T1
s2 = −d0 ω0 + jω0
1 − d20 ,
s3 = −d0 ω0 − jω0
1 − d20 .
Unter diesen Annahmen wird M (s1 ) = 0
f¨ ur T = T1 ,
M (s2 ) = 0, M (s3 ) = 0
und
Weiterhin gilt s2 − s3 = 2jω0
f¨ ur alle T > 0.
1 − d20 .
Daraus l¨ asst sich auf die Gesamtheit der pathologischen Werte der Abtastperiode schließen: Die Abtastperiode wird pathologisch, wenn sie einen der Werte T1
oder
1 −νπd
2 0
ω0
f¨ ur ein ν ∈ {1, 2, 3, . . .}
¨ annimmt. Im Beispielfalle sind Pol-Nullstellen-K¨ urzungen in der z-Ubertragungsfunktion P GZ (z) gewiss ausgeschlossen, solange man eine Abtastperiode T mit T < min T1 ,
ω0
π 2 1 − d0
w¨ ahlt.
¨ 7.6 Parametrische Ubertragungsmatrizen in geschlossenen Abtastregelkreisen Betrachtet wird ein MIMO-Abtastregelkreis der im Bild 7.19 gezeigten Struktur. z r
e
Abtastglied ed Digitaler Regler vd Halteglied (ADC) (DAC) algor(e[k]) = v[k]
vH
u Prozess & Stellglied
y
Meßglied
Regelungseinrichtung Bild 7.19. Struktur eines MIMO-Abtastregelkreises
x
¨ 7.6 Parametrische Ubertragungsmatrizen in geschlossenen Abtastregelkreisen
409
Im Block ADC wird das zeitkontinuierlich gebildete Regeldifferenzsignal r(t) − y(t) = e(t) ∈ Rr ¨ aquidistant mit der Tastperiode T abgetastet. Die ¨ Wirkung des digitalen Reglers wird durch die Ubertragungsmatrix GDIR (s) charakterisiert, die im Abschnitt 7.5.3.3 eingef¨ uhrt wurde. Beim Block DAC wollen wir ein Halteglied nullter Ordnung mit gegebener Formierungsfunktion m(t) annehmen, vgl. Abschnitt 7.5.3.2. Der Prozess und die Meßein¨ richtung werden durch eine p×m-Ubertragungsmatrix Gxu (s) bzw. eine r×py ¨ Ubertragungsmatrix Gx (s) beschrieben. Manchmal ist es zweckm¨aßig, auch ¨ die Ubertragungsmatrix Gyu (s) = Gyx (s) · Gxu (s) zu verwenden. Nun soll gezeigt werden, wie man bei geschlossenem Abtast¨ regelkreis zu den parametrischen Ubertragungsmatrizen von den exogenen zu den inneren Signalen gelangt. ¨ Zuerst wird die parametrische Ubertragungsmatrix Gyr (s, t) vom F¨ uhrungsr signalvektor r(t) ∈ R zum Meßsignalvektor y(t) ∈ Rr ermittelt. Entspre¨ chend dem generellen Konzept der Ubertragungsfunktionen wird der geschlossene MIMO-Abtastregelkreis angeregt mit dem F¨ uhrungssignal r(t) = est r0
mit beliebig fixiertem r0 = 0,
(7.70)
und es wird nach Reaktionen der Form y(t) = Gyr (s, t)est r0
mit
Gyr (s, t + T ) = Gyr (s, t)
(7.71)
gefragt. Satz 7.8 Im geschlossenen Abtastregelkreis gem¨aß Bild 7.19 ist die para¨ metrische Ubertragungsmatrix Gyr (s, t) im Argument t periodisch mit der Abtastperiode T und gen¨ ugt f¨ ur 0 ≤ t < T der Bestimmungsgleichung −1 Gyr (s, t) = GGyu ·M (s, t) · GDIR (s) Ir + GGyu ·M (s, 0)·GDIR (s) . (7.72) Die Elemente der Matrizen est Gyr (s, t) und GDIR (s) sind gebrochen-rationale Funktionen von esT =: z. Mit den Abk¨ urzungen y (z, τ ), esτ Gyr (s, τ )|esT =z =: G r
DIR (z) GDIR (s)|esT =z =: G
gewinnt man eine zu (7.72) gleichwertige Darstellung Gy ·M (z, τ ) · G DIR (z) Ir + G Gy ·M (z, 0) · G DIR (z) −1 . yr (z, τ ) = G G u u
(7.73)
Beweis: Unter den getroffenen Annahmen (7.70) und (7.71) liegt am Eingang des digitalen Reglers das Signal ur t = kT (Ir − Gyr (s, 0))est r0 f¨ ed (t) = 0 sonst.
410
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
an, und am Ausgang des Haltegliedes vH (t) = GM (s, t) · GDIR (s) (Ir − Gyr (s, 0)) est r0 , vgl. Abschnitt 7.5.3.3. Das Meßsignal y(t) ergibt sich dann – vorausgesetzt z = 0 – zu y(t) = GGyu ·M (s, t) · GDIR (s) (Ir − Gyr (s, 0)) est r0 . Ein Vergleich mit (7.71) liefert Gyr (s, t)est r0 = GGyu ·M (s, t) · GDIR (s) (Ir − Gyr (s, 0)) est r0 . Weil der konstante Vektor r0 ∈ Rr beliebig gew¨ahlt werden darf, folgt daraus die Matrizengleichung Gyr (s, t) = GGyu ·M (s, t) · GDIR (s) (Ir − Gyr (s, 0)) .
(7.74)
¨ GGy ·M (s, t), vgl. (7.60), u Die t-Periodizit¨ at der PUF ¨ bertr¨agt sich auf Gyr (s, t), u d.h. Gyr (s, t + T ) = Gyr (s, t) . Um Gyr (s, 0) zu bestimmen, setzen wir t = 0 in (7.74) und erhalten u ¨ber Gyr (s, 0) = GGyu ·M (s, 0)GDIR (s) (Ir − Gyr (s, 0)) schließlich −1 Gyr (s, 0) = Ir + GGyu ·M (s, 0) · GDIR (s) GGyu ·M (s, 0) · GDIR (s).
(7.75)
Dieser Ausdruck wird nun in (7.74) eingesetzt: Gyr (s, t) = GGyu ·M (s, t) · GDIR (s)· Ir − [Ir + GGyu ·M (s, 0)GDIR (s)]−1 GGyu ·M (s, 0) · GDIR (s) −1 = GGyu ·M (s, t) · GDIR (s) Ir + GGyu ·M (s, 0) · GDIR (s) . Damit wurde die Bestimmungsgleichung (7.72) verifiziert. Die behaupteten speziellen s−Abh¨ angigkeiten wurden einerseits im Zusammenhang mit der Formel (7.67) und andererseits im Abschnitt 7.5.3.3, Gl. (7.52) festgestellt. Dies rechtfertigt die Darstellungsform (7.73). qed. Beispiel 7.10 Bei der zeitdiskreten Beschreibung von Abtastregelkreisen im Abschnitt 7.5.2 wurde im Beispiel 7.5 die z−F¨ uhrungs¨ ubertragungsfunktion eines einfachen SISO-Abtastregelkreises berechnet. Hier soll f¨ ur den gleichen SISO-Abtastregelkreis die Funktion
¨ 7.6 Parametrische Ubertragungsmatrizen in geschlossenen Abtastregelkreisen Gyr (z, τ )
411
0≤τ ≤T
f¨ ur
bestimmt werden. Im Beispielfall ist der digitale Regler ein Proportionalglied mit einem Verst¨ arkungsfaktor V , d.h. GDIR (z) = V. Verwendet wird das u ¨ bliche Halteglied null¨ ter Ordnung, und der Prozess wird als P T1 −Glied mit der Ubertragungsfunktion P (s) = (1 + T1 s)−1 beschrieben. Die Funktion GGyu ·M z, τ ) = GP M 0 z, τ ) wurde bereits im Rahmen des Beispiels 7.8 ermittelt: GP M 0 z, τ ) = 1 − e
− Tτ
1
z−1 z−e
,
− TT
insbesondere
GP M 0 (z, 0) =
1
1−e
− TT
z−e
− TT
1
.
1
Jetzt kann in (7.73) eingesetzt werden,
P M 0 (z, 0) · V Gyr (z, τ ) = GP M 0 (z, τ ) · V · 1 + G 1−e
− Tτ
1
=V ·
1+V · =V ·
z−e z−e
(z − 1) z − e
1−e
− TT
−e
1
− TT
1
− TT
1
(z − 1)
+V · 1−e
− TT
1−e
V =
z−e
− TT
− TT
−1
1
1
+V · 1−e
1
− TT
1
Insbesondere erh¨ alt man f¨ ur τ = 0 und f¨ ur τ = T Gyr (z, 0)
−1
1
z −e
1
− Tτ
− TT
−1
− TT
1
bzw.
yr (z, T ) = G
V (1 − e z−e
− TT
1
− TT
1
yr (z, 0) . =z·G
)z
+ V · (1 − e
− TT
1
)
Eine Gegen¨ uberstellung mit dem Beispiel 7.5 im Abschnitt 7.5.2, Gl. (7.34), yr (z, 0) mit der dort berechneten zbest¨ atigt die zu erwartende Gleichheit von G y F¨ uhrungs¨ ubertragungsfunktion Gr (z). Auf der Basis des allgemeinen Zusammenhangs (7.68) kann nun der Verlauf der Regelgr¨ oße y(t) zu gegebenen F¨ uhrungssignalen berechnet werden. Als F¨ uhrungssignal werde r(t) = t · e−t · 1(t) angenommen. Dieses Signal geh¨ ort zur Signalfamilie (7.48). Es wurde bereits im gefunden: Beispiel 7.8 verwendet und die zugeh¨ orende Bildgr¨ oße R(z)
= R(z)
∂ ∂a
1 1 − z −1 eaT
a=−1
= T e−T
z . (z − e−T )2
Der Verlauf der Regelgr¨ oße y(t) ergibt sich aus (7.68) mit 0 ≤ τ < T ; k = 0, 1, 2, . . . zu
412
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
y(t) = y(kT + τ ) =
1 yr (z, τ ) · R(z) · z k−1 dz G 2πj C
− T
− τ
z − e T1 − e T1 (z − 1) T e−T · z k 1
V · dz = − T − T 2πj (z − e−T )2 z − e T1 + V · 1 − e T1 C Der Integrand hat einen zweifachen Pol an der Stelle z1 = e−T und einen einfachen − T
− T
Pol an der Stelle z2 = e T1 − V · (1 − e T1 ). Die Berechnung des Integrals kann mit Hilfe der Residuen des Integranden erfolgen: y(kT + τ ) =
2 i=1
=
Res V ·
z 1−e
− Tτ
1
+e
− Tτ
1
−e
1
·
z − z2
z=zi
− TT
−T
·z Te (z − z1 )2 k
V T e−T − TT − τ k k 1 + e T1 (1 − z2 ) (z − z ) z − e 2 2 1 (z1 − z2 )2
+kz1k−1 (z1 − z2 ) z1 − e
− TT
1
+e
− Tτ
1
(1 − z1 )
Im Bild 7.20 wurde y(t) f¨ ur zwei Reglerverst¨ arkungswerte V bei angenommenen normierten Parametern T = 1 f¨ ur die Abtastperiode und T1 = 10 f¨ ur die Streckenzeitkonstante graphisch dargestellt. Kleine Kreise heben die Signalwerte y(kT ) an den Abtaststellen hervor. Zum Vergleich wurde der Verlauf der Regelgr¨ oße im nicht abgetasteten, zeitkontinuierlich wirkenden Regelkreis (mit P (s) = (1 + T1 s)−1 , K(s) = V ) gestrichelt eingetragen.
V=5
ohne Abtastung Abtastwerte mit Abtastung
0.6 0.5
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
−0.1
−0.1
−0.2
ohne Abtastung Abtastwerte mit Abtastung
0.6
y(t)
y(t)
V = 19
−0.2 0
5
10
t
15
0
5
10
15
t
Bild 7.20. Antwort der Regelg¨ oße y(t) auf die F¨ uhrungsgr¨ oße r(t) = te−t ·1(t) bei T = 1, T1 = 10 und unterschiedlichen Reglerverst¨ arkungen V (links V = 5 und rechts V = 19)
¨ 7.6 Parametrische Ubertragungsmatrizen in geschlossenen Abtastregelkreisen
413
Die Bilder 7.18 und 7.20 k¨ onnten den Eindruck vermitteln, als ob die Ausgangsgr¨ oßen x(t) bzw. y(t) zwischen den Abtastzeitpunkten quasi geradlinig interpolierend verliefen. Dieser Eindruck t¨auscht. Um das zu erken¨ nen, braucht man die Ubertragungsglieder nur ein wenig anspruchsvoller zu w¨ahlen. Beispiel 7.11 Die in den Beispielen 7.8 und 7.10 verwendete Strecken¨ubertragungsfunktion wird lediglich um einen Pol im Ursprung erweitert, d.h. wir setzen P (s) =
1 1 1 . = − s(1 + sT1 ) s s + T11
Aus (7.63) in Verbindung mit der Abk¨ urzung (7.67) gewinnt man GP M 0 (z, τ ) =
ewτ (z − 1) − (z − ewT ) w(z − ewT )
+ T1
e
− Tτ
1
(z − 1)
z−e
w=0
− TT
−1
1
Setzt man in den eckigen Klammern w = 0 ein, entsteht zun¨ achst ein unbestimmter Ausdruck 00 . Mit der Bernoulli-l’Hospital schen Regel oder durch TaylorEntwicklung des Z¨ ahlers und des Nenners um die Stelle w = 0 erh¨ alt man
P M 0 (z, τ ) = τ + G
T + T1 z−1
e
− Tτ
1
(z − 1)
z−e
− TT
−1
1
Als Regler kommt wie bisher ein digitaler Proportionalregler zum Einsatz DIR (z) = V ). Die parametrische Ubertragungsfunktion ¨ (G des geschlossenen Regelkreises ergibt sich damit aus (7.73) zu
yr (z, τ ) = G P M 0 (z, τ ) · V · 1 + G P M 0 (z, 0) · V G
=
V c2 (τ )z 2 + c1 (τ )z + c0 (τ ) z 2 + a1 · z + a0
=
V c2 (τ )z 2 + c1 (τ )z + c0 (τ ) , (z − z0 )(z − z1 )
−1
wobei a1 = V (T − T1 ) − 1 − e a0 = V
c2 (τ ) = T1 e
T1 − (T1 + T ) e
− Tτ
1
− Tτ
1
1
− TT 1
(1 − V T1 )
+e
− TT
1
+ τ − T1
c1 (τ ) = T − 2T1 e c0 (τ ) = T1 e
− TT
− Tτ
1
− (τ − T1 )(e
+ (τ − T1 − T )e
− TT
1
− TT
1
+ 1)
.
Als Testsignal wird der Einheitssprung verwendet, also r(t) = 1(t) gesetzt. Daraus folgt 1 z = . R(z) = 1 − z −1 z−1
414
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise 1.8
ohne Abtastung Abtastwerte mit Abtastung
1.6
1.4
y(t)
1.2
1
0.8
0.6
0.4
0.2
0
1
2
3
4
5
6
t
7
8
¨ Bild 7.21. Ubergangsfunktion der Regelg¨ oße y(t) bei T = 2, T1 =
9
1 2
10
und V = 1
Mit Hilfe von (7.68) kann nun die Regelgr¨ oße y(t) berechnet werden (0 ≤ τ < T ; k = 0, 1, 2, . . .):
V c2 (τ )z 2 + c1 (τ )z + c0 (τ ) z k 1 dz y(t) = y(kT + τ ) = 2πj (z − z0 )(z − z1 )(z − 1)
2
C
V c2 (τ )z 2 + c1 (τ )z + c0 (τ ) z k = Res z=zi (z − z0 )(z − z1 )(z − 1) i=0
=V
(c2 z02 + c1 z0 + c0 )z0k (c2 z12 + c1 z1 + c0 )z1k c2 + c1 + c0 + + (1 − z0 )(1 − z1 ) (z0 − z1 )(z0 − 1) (z1 − z0 )(z1 − 1)
=1+
V z0 − z1
(c2 z12 + c1 z1 + c0 )z1k (c2 z02 + c1 z0 + c0 )z0k − z0 − 1 z1 − 1
Bild 7.21 zeigt den Verlauf von y(t) f¨ ur ausgew¨ ahlte Parameterwerte T, T1 und V . ¨ Zum Vergleich wurde die Ubergangsfunktion des nicht abgetasteten Regelkreises (mit P (s) = (s(1 + T1 s))−1 und K(s) = V ) in das gleiche Bild gestrichelt eingetragen.
Mit Hilfe des Zwischenergebnisses (7.75) f¨ allt es nicht schwer, die u ¨brigen parametrischen F¨ uhrungs¨ ubertragungsmatrizen zu berechnen:
¨ 7.6 Parametrische Ubertragungsmatrizen in geschlossenen Abtastregelkreisen
Ger (s, t) = Ir − Gyr (s, t),
415
(7.76)
Gu r (s, t)
Gyr (s, 0))
= GM (s, t)GDIR (s)(Ir − −1 , = GM (s, t)GDIR (s) Ir + GGyu ·M (s, 0)GDIR (s) −1 Gxr (s, t) = GGxu ·M (s, t)GDIR (s) Ir + GGyu ·M (s, 0)GDIR (s) .
(7.77) (7.78)
Um zu den parametrischen St¨or¨ ubertragungsmatrizen zu gelangen, hat man den Abtastregelkreis mit dem St¨ orsignal mit beliebig fixiertem z0 = 0
z(t) = est z0
(7.79)
anzuregen und nach Reaktionen der Form y(t) = Gyz (s, t)est z0 x(t) = u(t) =
Gxz (s, t)est z0 st Gu z (s, t)e z0
mit
Gyz (s, t + T ) = Gyz (s, t)
(7.80a)
mit
Gxz (s, t + T ) Gu z (s, t + T )
(7.80b)
mit
= =
Gxz (s, t) Gu z (s, t)
(7.80c)
zu suchen. Satz 7.9 Im geschlossenen Abtastregelkreis gem¨aß Bild 7.19 ist die parametrische St¨or¨ ubertragungsmatrix Gyz (s, t) im Argument t periodisch mit der Abtastperiode T und gen¨ ugt f¨ ur 0 ≤ t < T der Bestimmungsgleichung −1 y Gyz (s, t) = Ir − GGyu ·M (s, t)GDIR (s) Ir + GGyu ·M (s, 0)GDIR (s) Gu (s) (7.81) Beweis: Von der Richtigkeit der Behauptung kann man sich ohne lange Rechnungen durch Betrachtung des Wirkungsplan-Bildes 7.19 und Nutzung der bereits bekannten F¨ uhrungs¨ ubertragungsmatrizen u ¨ berzeugen. Zu diesem Zwecke wurde im Bild 7.22 a) das Bild 7.19 nochmals in gestraffter Form wiedergegeben. Unter der jetzt zutreffenden Voraussetzung identisch verschwindender F¨ uhrungssignale, also r = 0, und nicht verschwindender St¨orsignale, also z = 0, wurde der Wirkungsplan umgezeichnet in Bild 7.22 b). Dem Bild 7.22 b) kann man Gyz (s, t) = Ir + Gyr (s, t) · Gyu (s). entnehmen. Ein Vergleich von Bild 7.22 a) mit Bild 7.22 b) liefert
Gyr (s, t) = −Gyr (s, t). Einsetzen von (7.72) f¨ ur die F¨ uhrungs¨ ubertragungsmatrix Gyr (s, t) f¨ uhrt auf das gew¨ unschte Ergebnis (7.81). qed.
416
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise z
r=0 ADC
GDIR
DAC
ADC
GDIR
DAC
u
y
Gyu
a) y
Gyu
y r
b) z
Gyu
Bild 7.22. Zur Herleitung der parametrischen St¨ or¨ ubertragungsmatrix a) Komprimierte Darstellung des MIMO-Abtastregelkreises b) Umgezeichneter MIMO-Abtastregelkreis
Mit Hilfe ¨ ahnlicher Manipulationen am Wirkungsplan-Bild 7.19 lassen sich auch die u or¨ ubertragungsmatrizen ohne Rech¨brigen parametrischen St¨ nung gewinnen: Gxz (s, t) = Gxu (s) − Gxr (s, t) · Gyu (s), u y Gu z (s, t) = Im − Gr (s, t) · Gu (s) .
Die F¨ uhrungs¨ ubertragungsmatrix Gxr (s, t) kann aus (7.78) und die F¨ uhrungs(s, t) aus (7.77) entnommen werden. u ¨ bertragungsmatrix Gu r ¨ Beispiel 7.12 Der Prozess m¨oge durch ein SISO-Ubertragungsglied mit der ¨ Ubertragungsfunktion 2 = P (s) s+2 beschrieben sein. Der Regler sei ein Proportionalregler mit einem Verst¨ arkungsfaktor V . Gefragt wird nach der Reaktion y(t) des Systems auf einen St¨ orimpuls z(t) = e−t 1(t), und zwar Gyu (s) =
a) bei nicht angeschlossenem Regler, b) bei zeitkontinuierlich wirkendem Regler, c) bei einem zeitdiskret wirkenden Regler unter Verwendung des u ¨ blichen Haltegliedes nullter Ordnung. zu a): Bei abgeschalteter R¨ uckf¨ uhrung erscheint am Streckenausgang ein Bildsignal Ya (s) = P (s) · Z(s) = mithin
2 2 · L e−t 1(t) = , s+2 (s + 2)(s + 1)
ya (t) = L −1 {Ya (s)} = 2 e−t − e−2t 1(t) .
¨ 7.6 Parametrische Ubertragungsmatrizen in geschlossenen Abtastregelkreisen
417
¨ zu b): Bei zeitkontinuierlich wirkendem Regler mit der Ubertragungsfunktion K(s) = V ergibt sich am Streckenausgang ein Bildsignal Yb (s) =
P (s) · Z(s) 2 = , 1 + K(s) · P (s) (s + 2 + 2V )(s + 1)
2 e−t − e−2(V +1)t 1(t) . 2V + 1 ur zu c): Bei zeitdiskret wirkendem Regler erh¨ alt man das Ausgangssignal yc (t) f¨ t = kT + τ (0 ≤ τ < T ; k = 0, 1, 2, . . .) aus mithin
yb (t) = L −1 {Yb (s)} =
yc (kT + τ ) = L −1 {Gyu (s) · Z(s)}|t=kT +τ +
1 yr (z, τ ) · R (z) z k−1 dz G 2πj C
yr (z, τ ) · R (z) = ya (kT + τ ) + Z −1 G
.
Weiter gilt
yr (z, τ ) = −Gyr (z, τ ) = −GP M 0 (z, τ ) · GDIR (z) 1 + GP M 0 (z, 0) · GDIR (z) G
−1
,
wobei (vgl. Beispiel 7.8)
1 − e−2τ z + e−2τ − e−2T z − 1 −2τ GPM0 (z, τ ) = 1 − e = −2T −2T z−e
und
z−e
DIR (z) = V , G 1 − e−2τ z + e−2τ − e−2T y Gr (z, τ ) = −V . z + V − (V + 1)e−2T −t −2t
also
Das Signal r (t) = ya (t) = 2 e hin wird
(z) = 2 R
1 1 − z −1 e−T
−
−e
1(t) geh¨ ort zur Signalfamilie (7.48). Mit-
1 1 − z −1 e−2T
= 2z
1 1 − z − e−T z − e−2T
.
Das Ausgangssignal yc (t) ergibt sich demnach aus der Beziehung yc (kT + τ ) = 2e−(kT +τ ) 1 − e−(kT +τ )
−Z
−1
V z e−T − e−2T 1 − e−2τ z + e−2τ − e−2T 2 (z − e−2T ) (z − e−T ) (z + V − (V + 1)e−2T )
.
Der Nenner der z-Transformierten besitzt drei einfache Nullstellen, und zwar bei z1 = e−T , z2 = e−2T und z3 = (V + 1)e−2T − V . Die Stabilit¨ at des Abtastregelkreises ist daher nur f¨ ur Abtastperioden T mit
V +1 −2T 1 |z3 | = V − (V + 1)e , falls V > 1, < 1 , dh., f¨ur 0 < T < 2 ln V −1
gesichert (vgl. Beispiel 7.5). Die z-R¨ ucktransformation kann mit dem Residuensatz erfolgen:
418
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
yc (kT + τ ) = 2e−(kT +τ ) 1 − e−(kT +τ ) −
3 i=1
Res
z=zi
V z k e−T − e−2T 1 − e−2τ z + e−2τ − e−2T 2 (z − e−2T ) (z − e−T ) (z + V − (V + 1)e−2T )
= 2e−(kT +τ ) 1 − e−(kT +τ ) − 2V
1 + eT −2τ e−kT 1 + V (1 + eT )
+ 2e−2(τ +kT )
V −1 + e−2τ + e−2τ −2 1 + V (1 + eT )
(V + 1)e−2T − V
k
.
Der Ausdruck auf der rechten Seite l¨ asst sich vereinfachen zu yc (kT + τ ) =
2· e−(kT +τ ) −
V 1 + eT −2τ e−kT V − (V + 1)e−2τ + T 1 + V (1 + e ) 1 + V (1 + eT )
(V + 1)e−2T − V
k
.
ya (t) yb (t) yc (t)
0.5
0.4
0.3
0.2
0.1
0
0.5
1
1.5
2
2.5
3
t ur V = 3 und T = 0.25. Bild 7.23. Verlauf der Signale ya (t), yb (t) und yc (t) f¨
ur die beispielhaft Im Bild 7.23 ist die Verl¨ aufe der Signale ya (t), yb (t) und yc (t) f¨ gew¨ ahlten Parameterwerte V = 3 und T = 0.25 zu sehen. Bei V = 3 w¨ urde der Abtastregelkreis f¨ ur T ≥ 12 ln2 = 0.346 instabil werden.
¨ 7.6 Parametrische Ubertragungsmatrizen in geschlossenen Abtastregelkreisen
419
Abschließend sei darauf hingewiesen, dass es bei der Modellierung von St¨orgr¨ oßenwirkungen nicht immer zweckm¨ aßig und gerechtfertigt ist, die St¨ orgr¨ oßen am Eingang der Regelstrecke eingreifen zu lassen, wie es auch im Bild 7.22 geschah. St¨ orgr¨ oßen k¨ onnen auch im Inneren“ der Regelstrecke ” oder erst am Ausgang der Regelstrecke auftreten. Diesem Sachverhalt kann ¨ man mitunter nach einer geeigneten Faktorisierung der Ubertragungsmatrix, Gyu (s) = P2 (s) · P1 (s) , gerecht werden, indem man die St¨ orgr¨ oßen zwischen“ P1 (s) und P2 (s) ein” greifen l¨ asst. F¨ ur P1 (s) = Im erh¨ alt man den Spezialfall der St¨orung am Streckeneingang und f¨ ur P2 (s) = Ir den der St¨orung am Streckenausgang.
z r=0 ADC
GDIR
DAC
u
y
Gyu = P1 · P2
a) z r=0 ADC
GDIR
DAC
ADC
GDIR
DAC
u
P1
y
P2
b) y
Gyu
y r
c) z
P2
Bild 7.24. MIMO-Abtastregelkreis bei St¨ oreingriff im Innern der Regelstrecke a) Veranschaulichung des Sachverhalts b) Nutzung einer angenommenen Faktorisierungsm¨ oglichkeit der Strecken¨ ubertragungsmatrix c) Umgezeichnete Darstellung zum Wirkungsplan b)
Das Bild (Skizze a) veranschaulicht den Sachverhalt. Hat man eine Faktorisierung der Strecken¨ ubertragungsmatrix gefunden, die den Wirkungsplan gem¨ aß Bild (Skizze b) rechtfertigt, so kann dieser Wirkungsplan ohne weiteres in die Form des Bildes (Skizze c) umgezeichnet werden.
420
7 Zeitdiskrete LTI-Systeme und Abtastregelkreise
Die Bestimmungsgleichungen f¨ ur die parametrischen St¨or¨ ubertragungsfunktionen folgen nun unmittelbar aus dem Vergleich des Bildes (Skizze c) mit dem Bild 7.24 c) in Verbindung mit dem Satz 7.9: Gyz (s, t) = Ir − Gyr (s, t) · P2 (s) , wobei Gyr (s, t) mit (7.72) berechnet werden kann. Ferner wird y Gu z (s, t) = −GM (s, t) · GDIR (s) · Gz (s, 0) .
Im Spezialfall der St¨ orung am Regelstreckenausgang, also f¨ ur P1 (s) = Gyu ,
P2 (s) = Ir ,
ergibt sich Gyz (s, t) = Ir − Gyr (s, t) ,
y Gu z (s, t) = −GM (s, t) · GDIR (s) · Ir − Gr (s, 0) .
Literaturverzeichnis
[Ack93]
[Ack02] [Ack88] [AH95]
[And72]
[Arn88]
[Bei95] [Ber96] [Ber03]
[Ber02] [Bie79] [Bod45] [B¨ ur90] [Buc01]
Ackermann, J. [u. a.]: Robuste Regelung – Analyse und Entwurf von linearen Regelungssystemen mit unsicheren physikalischen Parametern. Berlin : Springer-Verlag, 1993 Ackermann, J. [u. a.]: Robust Control. The Parameter Space Approach. 2. Auflage. London, Berlin, Heidelberg : Springer-Verlag, 2002 Ackermann, J.: Abtastregelung. 3. Auflage. Berlin : Springer-Verlag, 1988 Astrom, K. J. ; Hagglund, T.: PID Controllers: Theory, Design and Tuning. 2. Auflage. North Carolina, USA : Instrument Society of America, 1995 Anderson, B. D. O.: The Reduced Hermite Criterion with Application to Proof of the Li´enard-Chipart Criterion. In: IEEE Trans. on Automatic Control AC-17 (1972), S. 669–672 Arnol’d, V.: Mathematische Methoden der klassischen Mechanik. Ber¨ lin : Deutscher Verlag der Wissenschaften, 1988. – Ubersetzung aus dem Russischen Beitz, K.-H. (Hrsg.): DUBBEL – Taschenbuch f¨ ur den Maschinenbau. 18. Auflage. Berlin und Heidelberg : Springer-Verlag, 1995 Bernoulli, J.: Einladung zur mathematischen L¨ osung eines neuen Problems. In: Acta Eruditorum Lipsiae. Leipzig, 1696, S. 269 Bernoulli, J.: D´emonstration g´en´erale du centre de balancement ou d’oscillation, tir´ee de la nature du levier. In: Mem. Acad. Sci. Paris (1703). – Brief vom 13. M¨ arz 1703 Bernstein, D. S.: Feedback Control: In Invisible Thread in the History of Technology. In: IEEE Control Magazine 22 (2002), S. 53–68 Biehler, M.: Sur une classe d’´equations alg´ebriques dont toutes les racines sont r´eelles. In: J. Reine Angew. Mathem. 87 (1879), S. 350–352 Bode, H. W.: Network analysis and feedback amplifier design. Princeton : D. van Nostrand Comp. Inc., 1945 B¨ urger, Wolfgang: Die stumme Kaiserglocke. In: Bild der Wissenschaft 27 (1990), S. 120–121 Buchta, H. Praktikable Wege zur Reglersynthese auf der mathematischen Grundlage der teilerfremden Zerlegung ¨ uber RH∞ . Seminarvortr¨ age im WS 2000/2001, Institut f¨ ur Regelungs- und Steuerungstheorie, Technische Universit¨ at Dresden. 2001
422 [BY77]
Literaturverzeichnis
Bongiorno, J. J. ; Youla, D. C.: On the design of single-loop singleinput single-output feedback control systems in the complex frequency domain. In: IEEE Trans. on Automatic Control AC-22 (1977), S. 416– 423 [CD81] Callier, F.M. ; Desoer, Ch.A.: Multivariable Feedback Systems. New York : Springer-Verlag, 1981 [Cre47] Cremer, L.: Ein neues Verfahren zur Beurteilung der Stabilit¨ at linearer Regelungssysteme. In: ZAMM 25, 27 (1947), S. 161–163 [CZ95] Curtain, R.F. ; Zwart, H.J.: An Introduction to Infinite-dimensional Linear Systems Theory. Berlin : Springer-Verlag, 1995 [D’A43] D’Alembert, J.-B. le R.: Trait´ e de dynamique. Paris : David, 1743 [Dav70] Davison, E. J.: On Pole Assignment in Linear Systems with Incomplete State Feedback. In: IEEE Trans. on Automatic Control AC-15 (1970), S. 348–351 [DFT92] Doyle, J. C. ; Francis, B. A. ; Tannenbaum, A. R.: Feedback Control Theory. New York : Macmillan, 1992 [DHB00] Datta, A. ; Ho, M. T. ; Bhattacharyya, S. P.: Structure and Synthesis of PID Controllers. London, Berlin, Heidelberg : Springer-Verlag, 2000 [Dit99] Dittmann, F.: Zum philosophischen Denken von Hermann Schmidt. In: Humankybernetik 40 (1999), S. 117–128 [DLMS80] Desoer, C. A. ; Liu, R.-W. ; Murray, J. ; Saeks, R.: Feedback System Design: The Fractional Representation Approach to Analysis and Synthesis. In: IEEE Trans. on Automatic Control AC-25 (1980), S. 399–412 [EJP88] El Jai, A. ; Pritchard, A. J.: Sensors and Controls in the Analysis of Distributed Systems. Chicester : Ellis Horwood, 1988 [Eva48] Evans, W. R.: Graphical Analysis of Control Systems. In: Trans. AIEE 67 (1948), S. 547–551 Fasol, K. H.: Herrmann Schmidt: Pioneer in Control and Cybernetics. [Fas02] In: IEEE Control Systems Magazine 22 (2002), S. 24–28 [Fel48] Feldbaum, A. A.: Integralkriterien f¨ ur die Regelg¨ ute (russ.). In: Avtomatika i Telemehanika 9 (1948), S. 9–19 [F¨ ol82] F¨ ollinger, O.: Laplace- und Fourier-Transformation. 3. Auflage. Frankfurt a. M. : AEG-Telefunken [Abt. Verl.], 1982 [F¨ ol05] F¨ ollinger, O.: Regelungstechnik. 8. u ¨ berarb. Auflage. Heidelberg : H¨ uthig-Verlag, 2005 ¨ [FOT96] Foias, C. ; Ozbay, H. ; Tannenbaum, A.: Robust Control of Infinite Dimensional Systems. London, Berlin, Heidelberg : Springer-Verlag, 1996 [Fra87] Francis, B. A.: A Course in H ∞ Control Theory. London, Berlin, Heidelberg : Springer-Verlag, 1987 ¨ [Fuj26] Fujiwara, M.: Uber die algebraischen Gleichungen, deren Wurzeln in einem Kreise oder in einer Halbebene liegen. In: Math. Zeitschrift 24 (1926), S. 161–169 [Gan66] Gantmaher, F. R.: Teori matric. Izd. vtoroe. Moskva : Izdat. ¨ Nauka, 1966. – Deutsche Ubersetzung: Gantmacher, F. R.: Matrizentheorie, Berlin : Springer-Verlag, 1986 [Gar77] Garmax, I. I.: Zanimatelna avtomatika. Kiev : Izdat. Radnska xkola, 1977
Literaturverzeichnis [Gee04] [GR57] [GS03] [Ham49] [HD04] [Hea02] [Hei63] [Her56]
[Her79] [Hof98] [Hor19]
[Hor59] [Hor63] [Hur95]
[JNP47] [Jur74] [Kai80] [Kal88] [Kal63] [Kes58] [Kha78]
[Kim75]
423
Geering, H. P.: Regelungstechnik. 6. Auflage. Berlin : Springer-Verlag, 2004 Gradstejn, I. S. ; Ryzik, I. M.: Summen-, Produkt- und Integraltafeln. Berlin : Deutscher Verlag der Wissenschaften, 1957 Glattfelder, A. H. ; Schaufelberger, W.: Control Systems with Input and Output Constraints. Heidelberg : Springer-Verlag, 2003 Hamel, G.: Theoretische Mechanik. Eine einheitliche Einf¨ uhrung in die gesamte Mechanik. Berlin : Springer-Verlag, 1949 Horn, M. ; Dourdoumas, N.: Regelungstechnik. M¨ unchen : Pearson Studium, 2004 Headrick, M. V.: Origin and Evolution of the Anchor Clock Escapement. In: IEEE Control Magazine 22 (2002), S. 41–52 Heinrich, H.: Einf¨ uhrung in die praktische Analysis. Leipzig : B.G. Teubner Verlagsgesellschaft, 1963 Hermite, C.: Extrait d’une lettre de Mr. Ch. Hermite de Paris `a Mr. Borchardt de Berlin sur le nombre des racines d’une ´equation alg´ebrique comprises entre des limites donn´ees. In: J. Reine angew. Mathem. 52 (1856), S. 397–414 Hermite, C.: Sur l’indice des fractions rationnelles. In: Bull. Soc. Math. France 7 (1879), S. 128–131 Hoffmann, R.: Signalanalyse und -erkennung. Berlin : Springer-Verlag, 1998 Horner, W. G.: A new method of solving numerical equations of all orders, by continuous approximation. In: Phil. Transactions 1 (1819), S. 308 – 333 Horowitz, I.: Fundamental theory of automatic linear feedback control systems. In: IRE Transactions on Automatic Control 4 (1959), S. 5 – 19 Horowitz, I. M.: Synthesis of Feedback Systems. New York, London : Academic Press, 1963 ¨ die Bedingungen, unter denen eine Gleichung nur Hurwitz, A.: Uber Wurzeln mit negativen reellen Theilen besitzt. In: Mathem. Annalen 46 (1895), S. 273 – 284 James, H. M. ; Nichols, N. B. ; Phillips, R. S.: Theory of ServoMechanisms. New York : McGraw Hill, 1947 Jury, E. I.: Inners and Stability of Dynamic Systems. New York : John Wiley & Sons, 1974 Kailath, T.: Linear Systems. Englewood Cliffs : Prentice Hall, 1980 Kalligeropoulos, D.: Die Automaten des Heron von Alexandria. In: Automatisierungstechnik 36 (1988), S. 161–169 Kalman, R.E.: Mahematical Description of Linear Systems. In: SIAM J. Control 1 (1963), S. 152–192 Kessler, C.: Das symmetrische Optimum. In: Regelungstechnik 6 (1958), S. 395–400, 432–436 Haritonov, V. L.: Ob asimptotiqesko˘ i usto˘ iqivosti poloeni ravnovesi seme˘ istva sistem line˘ inyh differencialnyh uravneni˘ i. In: Differencialnye uravneni 14 (1978), S. 2086–2088 Kimura, J.: Pole assignment by gain output feedback. In: IEEE Trans. on Automatic Control AC-20 (1975), S. 509–516
424 [KN81]
[Kre99] [K¨ up28] [Kuˇc79] [Kun97] [LC14]
[Leo40] [Leo44] [Lit05]
[LK95]
[Lud95] [Lun97] [Mac33]
[Mac60]
[Mac62] [May70]
[Mey90] [MG90]
[Mic38]
[M¨ ul79] [M¨ ul96]
Literaturverzeichnis Krein, M. G. ; Naimark, M. A.: The Method of Symmetric and Hermitian Forms in the Theory of the Separation of the Roots of Algebraic Equations. In: Linear and Multilinear Algebra 10 (1981), S. 265–308. – Erstver¨ offentlichung in Russisch, Harkov, 1936 Kreißelmeier, G.: Struktur mit zwei Freiheitsgraden. In: Automatisierungstechnik at-47 (1999), S. 266–269 K¨ upfm¨ uller, K.: Die Dynamik der selbstt¨ atigen Verst¨ arkungsregler. In: Elektrische Nachrichtentechnik 5 (1928), S. 456–467 ˇera, V.: Discrete Linear control. Prague : Academic Press, 1979 Kuc Kunz, E.: Einf¨ uhrung in die algebraische Geometrie. Braunschweig, Wiesbaden : Friedr. Vieweg & Sohn Verlagsgesellschaft mbH, 1997 Li´ enard, A. ; Chipart, M. H.: Sur la signe de la partie r´eelle des racines d’une ´equation alg´ebrique. In: J. Math. Pures Appl. Ser. 6 10 (1914), S. 291–346 Leonhard, A.: Die selbstt¨ atige Regelung in der Elektrotechnik. Berlin : Springer-Verlag, 1940 Leonhard, A.: Neues Verfahren zur Stabilit¨ atsuntersuchung. In: Arch. Elektrotechnik 38 (1944), S. 17–28 Litz, L.: Grundlagen der Automatisierungstechnik. Regelungssysteme – Steuerungssysteme – Hybride Systeme. M¨ unchen, Wien : Oldenbourg Verlag, 2005 Leventides, J. ; Karcanias, N.: Global asymptotic linearisation of the pole placement map: A closed form solution for the constant output feedback problem. In: Automatica 31 (1995), S. 1303–1309 Ludyk, G.: Theoretische Regelungstechnik. 2 B¨ ande. Berlin : SpringerVerlag, 1995 Lunze, J.: Regelungstechnik. 2 B¨ ande. Berlin : Springer-Verlag, 1997 MacDuffee, C. C.: The Theory of Matrices. Berlin : Verlag von Julius Springer, 1933 (Ergebnisse der Mathematik und ihrer Grenzgebiete, Band 2) Macke, W.: Elektromagnetische Felder. Ein Lehrbuch der Theoretischen Physik. Leipzig : Akademische Verlagsgesellschaft Geest & Portig K.-G., 1960 Macke, W.: Mechanik der Teilchen, Systeme und Kontinua. Leipzig : Akademische Verlagsgesellschaft Geest & Portig K.-G., 1962 Mayr, O.: Zur Fr¨ uhgeschichte technischer Regelungen bzw. The Origins of Feedback Control. M¨ unchen bzw. Cambridge, MA : R. Oldenbourg bzw. MIT Press, 1969 bzw. 1970 Meyers Konversations-Lexikon in 17 B¨ anden. 4. Auflage. Leipzig und Wien : Bibliographisches Institut, 1890 McFarlane, D. C. ; Glover, K.: Robust Controller Design Using Normalized Coprime Factor Plant Description. London, Berlin, Heidelberg : Springer-Verlag, 1990 Michailow, A. W.: Die Methode der harmonischen Analyse in der Regelungstheorie (russ.). In: Avtomatika i Telemehanika 3 (1938), S. 27–81 M¨ uller, R.: Projektierung von Automatisierungsanlagen. Berlin : Verlag Technik, 1979 M¨ uller, K.: Entwurf robuster Regelungen. Stuttgart : B. G. Teubner, 1996
Literaturverzeichnis [MS02]
425
M¨ uller-Slany, H. H.: Beitr¨ age zur Glockendynamik. In: Festschrift zum 90. Geburtstag von Prof.Dr. Kurt Magnus. In: Lehrstuhl f¨ ur Angewandte Mechanik der TU M¨ unchen (2002), S. 245–254 [NN75] N. N.: Die Kaiserglocke. In: Neuer Social-Demokrat. Ausgabe Nr. 106 vom 8. September 5 (1875), S. 126–147 [NGK57] Newton, G. ; Gould, L. ; Kaiser, J.: Analytical Design of Linear Feedback Controls. New York : John Wiley and Sons, 1957 [O’D03] O’Dwyer, D.: Handbook of PI and PID Controller Tuning Rules. London : Imperial College Press, 2003 [Opp64] Oppelt, W.: Kleines Handbuch technischer Regelungsvorg¨ ange. 4. Auflage. Berlin : Verlag Technik, 1964 [Orl11] Orlando, L.: Sul problema di Hurwitz relativo alle parti reali delle radici di un’ equazione algebrica. In: Math. Annalen 71 (1911), S. 233– 245 [OS44] Oldenbourg, R. C. ; Sartorius, H.: Dynamik selbstt¨ atiger Regelungen. M¨ unchen und Berlin : R. Oldenbourg Verlag, 1944 [Pot04] Potthoff, U.: Reglerentwurf f¨ ur lineare zeitinvariante Mehrgr¨ oßensysteme durch teilerfremde Faktorisierung. Aachen : Shaker Verlag, 2004 (Berichte aus der Steuerungs- und Regelungstechnik) [Rai94] Raisch, J.: Mehrgr¨ oßenregelung im Frequenzbereich. M¨ unchen : R. Oldenbourg Verlag, 1994 (Methoden der Regelungs- und Automatisierungstechnik) [Rei79] Reinisch, K.: Analyse und Synthese kontinuierlicher Steuerungssysteme. Berlin : Verlag Technik, 1979 [Rei94] Reinschke, K. J.: How could stability criteria be taught to University students. In: Proc. European seminar on automation and control technology education. SEFI document No.11, ISBN 2-87352-015-9. 1994, S. 25–43 [RF02] Reinschke, K. ; Fritsche, O.: Trajektoriensteuerung und Folgeregelung bei linearen Regelstrecken. In: Schlacher, K. (Hrsg.): Tagungsband GMA-Fachausschuss 1.4, Theoretische Verfahren der Regelungstechnik, 22.-25. Sept. 2002, Interlaken, Schweiz, S. 102–116 [RF04] Reinschke, K. ; Fritsche, O.: Geometrischer Zugang zur Polzuweisbarkeit mittels konstanter Ausgangsr¨ uckf¨ uhrungen. In: Automatisierungstechnik 52 (2004), S. 432–439 [RL97] Rosenwasser, E. ; Lampe, B.: Digitale Regelung in kontinuierlicher Zeit – Analyse und Entwurf im Frequenzbereich. Stuttgart : B. G. Teubner, 1997 [RL01] Rosenwasser, E. ; Lampe, B.: Algebraische Methoden zur Theorie der Mehrgr¨ oßen-Abtastsysteme. Rostock : Universit¨ atsverlag, 2001 [Ros70] Rosenbrock, H. H.: State-Space and Multivariable Theory. London : Nelson, 1970 [Rou98] Routh, E. J.: Dynamik der Systeme starrer K¨ orper. Band 2: Die h¨ ohere ¨ Dynamik. Leipzig : B. G. Teubner Verlag, 1898. – Deutsche Ubersetzung von A. Schepp [RS76] Reinschke, K. ; Schwarz, P.: Verfahren zur rechnergest¨ utzten Analyse linearer Netzwerke. Berlin : Akademie-Verlag, 1976 [Sch41] Schmidt, H.: Denkschrift zur Gr¨ undung eines Institutes f¨ ur Regelungstechnik. Berlin : Eigenverlag, 1941. – Nachdruck 1961 in Grundlagen”
426
Literaturverzeichnis
[Sch49] [SE04] [SF86]
[Smi58] [SP96] [Sza58] [Tol05] [Tru68] [Tus52] [Tus53] [Unb05] [VDI44] [Vid85] [Wae50] [Wae84] [Wag47] [Wan96]
[Wei91] [Wei94] [Wes52] [Wie48] [Wil57] [Won67]
studien aus Kybernetik und Geisteswissenschaften“, Beiheft zu Band 2, Verlag Schnelle, Quickborn in Holstein Schmeidler, W.: Vortr¨ age ¨ uber Determinanten und Matrizen mit Anwendungen in Physik und Technik. Berlin : Akademie Verlag, 1949 Schiehlen, W. ; Eberhard, P.: Technische Dynamik. Modelle f¨ ur Regelung und Simulation. 2. Auflage. Stuttgart : B. G. Teubner, 2004 Sprockhoff, G. ; Fischer, J.: Physikalische Schulexperimente. Mechanik der festen K¨ orper. 9. Auflage. Berlin : Volk und Wissen Volkseigener Verlag, 1986 Smith, D. E.: History of Mathematics. Vol. 1. New York : Dover, 1958 Skogestad, S. ; Postlethwaite, I.: Multivariable Feedback Control. Analysis and Design. New York : John Wiley & Sons, 1996 ´ , I.: H¨ Szabo ohere Technische Mechanik. 2. Auflage. Berlin : SpringerVerlag, 1958 Tolle, M.: Die Regelung der Kraftmaschinen. Berlin : Springer-Verlag, 1905 Truesdell, C.: Essays in the History of Mechanics. Berlin, Heidelberg, New York : Springer-Verlag, 1968 Tustin, A. (Hrsg.): Automatic and manual control. London : Butterworth Verlag, 1952 Tustin, A.: The mechanism of economic systems. London : Heinemann Verlag, 1953 Unbehauen, H.: Regelungstechnik I. 13.,verb.Aufl. Braunschweig : Friedrich Vieweg & Sohn, 2005 Regelungstechnik. Begriffe und Bezeichnungen. VDI-Fachausschuß f¨ ur Regelungstechnik, VDI-Verlag GmbH, 1944 Vidyasagar, M.: Control System Synthesis: A Factorization Approach. Cambridge, MA : MIT Press, 1985 Van der Waerden, B. L.: Moderne Algebra. Band I. 3. Auflage. Berlin : Springer-Verlag, 1950 Van der Waerden, B. L.: Geometry and Algebra in Ancient Civilizations. New York : Springer-Verlag, 1984 Wagner, K. W.: Einf¨ uhrung in die Lehre von Schwingungen und Wellen. Wiesbaden : Dieterich, 1947 Wang, X. A.: Grassmannian, central projection, and output feedback pole assignment of linear systems. In: IEEE Trans. on Automatic Control AC-41 (1996), S. 786–794 Weinmann, A.: Uncertain Models and Robust Control. Wien : SpringerVerlag, 1991 Weinmann, A.: Regelungen. Analyse und technischer Entwurf. Band 1. 3. Auflage. Wien : Springer-Verlag, 1994 Westcott, J. H.: Automatic and Manual Control. London : Butterworths Scientific Publications, 1952, S. 45–64 Wiener, R.: Cybernetics. New York : J. Wiley, 1948 Willers, F. A.: Methoden der praktischen Analysis. 3. Auflage. Berlin : Walter de Gruyter und Co., 1957 Wonham, W. M.: On pole assignment in multi-input, controllable linear systems. In: IEEE Trans. on Automatic Control AC-12 (1967), S. 660– 665
Literaturverzeichnis [WS93a] [WS93b] [YBJ76]
[Zad50] [ZDG96] [ZG04]
[ZN42] [Zur61] [Zur63]
427
Wunsch, G. ; Schreiber, H.: Analoge Systeme. 3. Auflage. Berlin : Springer-Verlag, 1993 Wunsch, G. ; Schreiber, H.: Digitale Systeme. 4. Auflage. Berlin : Springer-Verlag, 1993 Youla, D. C. ; Bongiorno, J. J. ; Jabr, H. A.: Modern Wiener-Hopf Design of Optimal Controllers. In: IEEE Trans. on Automatic Control AC-21 (1976), S. 3 –13 and 319 – 338 Zadeh, L.A.: Frequency Analysis of Variable Networks. In: Proc. IRE 38 (1950), S. 291–299 Zhou, K. ; Doyle, J. ; Glover, K.: Robust and Optimal Control. New York : Prentice Hall, 1996 Zeitz, M. ; Graichen, K.: Nichtlineare Folgeregelung mit Vorsteuerung zum Aufschwingen eines polaren Doppelpendels mit beschr¨ ankter Stellgr¨ oße. In: Schlacher, K. (Hrsg.): Tagungsband GMA-Fachausschuss 1.4, Theoretische Verfahren der Regelungstechnik, 26.-28. Sept. 2004, Interlaken, Schweiz, S. 73–82 Ziegler, J. G. ; Nichols, N. B.: Optimum Settings for Automatic Controllers. In: Trans. ASME 64 (1942), S. 759–767 Zurm¨ uhl, R.: Matrizen und ihre technischen Anwendungen. 3. Auflage. Berlin : Springer-Verlag, 1961 Zurm¨ uhl, R.: Praktische Mathematik f¨ ur Ingenieure und Physiker. 4. Auflage. Berlin : Springer-Verlag, 1963
Index
RH∞ , 49, 256, 262 ∞−Norm, 184 L 2 (R), 47 L 2 (jR), 47 Abtaster, 373 Abtastfrequenz, 373 pathologische, 406 Abtastperiode, 373 Abtastrate, 373 Abtastregelkreis geschlossener, 409 zeitdiskrete Beschreibung, 379 Abtastung, 372 aquidistante, 373 ¨ ADC, 373 Algorithmus Euklidischer, 106, 262 Routhscher, 107, 134 Allpass, 242 Amplitudenfrequenzgang, 63, 244 Amplitudenspektrum, 43 Anfangswerte, 51, 105, 273, 366 Anlage hydraulische, 14 Arbeit virtuelle, 73 Aufdreh-Effekt, 22 Ausgangssignal, 8, 169 Auswahlmatrix, 353 Automat linearer, 365 Bandbreite, 206
Basisgr¨ oße, 229, 291, 347 Basissignal, 171, 230, 234, 292 Referenzverlauf, 235 Befreiungsprinzip Lagrangesches, 73, 93 Beobachtbarkeitsmatrix Kalmansche, 340 Beobachter, 320 Beruhigungszeit, 202 Betragsreserve, 184 Bewegungsgleichung, 78 linearisierte, 80 Bewegungsgleichungen in Zustandsform, 84 kanonische , 86 B´ezoutsche Identit¨ at, 106, 111, 258, 261, 283, 349 BIBO-Verhalten, 103 Bildbereich, 40 Bindungen einseitige, 74 geometrische, 92 holonome, 93 kinematische, 92 rheonome, 93 skleronome, 93 Bode-Diagramm, 62 Bodesche Empfindlichkeitsfunktion, 212 Brachistochrone, 67 charakteristisches Polynom, 173 des geschlossenen Kreises, 174
430
Index
f¨ ur MIMO-Regelkreise, 327 CLCP, 174 closed-loop characteristic polynomial, 174 controller, 169 DAC, 373 Dampfmaschine, 2 δ−Abtaster, 392 δ−Impuls-Kamm, 392 Deskriptordarstellung, 59, 229 Deskriptormodell, 40 Deskriptorsystem regul¨ ares, 60, 234 Deskriptorvektor, 59 Differentiationsoperator, 104 Differenzengleichung, 363 Differenzierglied, 104 Dirac-Impuls, 62 disturbance, 169 Drehkraft, 70, 94 Durchtrittsfrequenz, 248 Dynamik Beobachter-, 322 R¨ uckf¨ uhr-, 322 dynamische Ordnung, 303 Eck-Polynome, 154 Eigenbewegung, 284 Eingangssignal, 169 Einheiten in Euklidischen Ringen, 257 Einheitsimpulsfolge, 365, 383 Einheitssprung, 48 Einheitsvektor, 60 Einschaltzeitpunkt, 51 Einschwingverhalten, 200 Einstellregeln, 185 Empfindlichkeitsfunktion, 204, 212 Bodesche, 212 komplement¨ are, 204, 212 Endwerts¨ atze, 50 Entwicklungssatz Laplacescher, 303 Entwurfsfreiheitsgrad zweiter, 226 Erhaltungsgr¨ oße, 89 Erhaltungssatz, 82 Euklidischer Algorithmus, 116, 257
in RH∞ , 258 Euler-Lagrangesche Gleichungen, 82 Hamiltonsche kanonische Form, 86 Eulersche Differentialgleichung eines Variationspoblems, 67 Extrapolator, 376 Extremale, 65 Extremalprinzipien, 41 Faktorisierung ¨ der Ubertragungsmatrix, 419 Faltung im Frequenzbereich, 46 im Zeitbereich, 45 zeitdiskret, 365 Faltungssatz, 397 Fl¨ achenformel, 251 Fliehkraftregler, 2 Folgeregelung, 234 Formel von Orlando, 146 Formierungsfunktion, 374 Fourier-Reihe, 42, 390 Fourier-Transformierte, 44 Freiheitsgrade mechanische, 76, 92 Frequenzdichtespektrum, 44 Frequenzgang, 44, 62 Frequenzganggestaltung, 208, 223 Frequenzspektrum diskretes, 44 F¨ uhrungsgr¨ oße, 169 F¨ uhrungsverhalten, 28 F¨ ullstandsregelung, 9, 11 F¨ ullstandssteuerung, 12 Funktion reell-rationale, 57 Funktionalanalysis, 47 G¨ uteforderungen an das Einschwingverhalten, 200 an das F¨ uhrungsverhalten, 198 an das St¨ orverhalten, 199 im Frequenzbereich, 209 gain margin, 184 Genauigkeit station¨ are, 198 Geometrie algebraische, 317 Gewichtsfolge, 364, 380
Index Gibbssche Erscheinung, 42 Gleichgewicht, 72 Gleichgewichtslage, 24, 79 Gleichungen Diophantische, 111 Euler-Lagrangesche, 82 Glocke schwingende, 281 Grenzfrequenz, 206 grenzstabil, 105 G¨ utemaße integrale, 204 Halteglied, 386 erster Ordnung, 378 kompliziertes, 375 nullter Ordnung, 374 T-Periodizit¨ at, 388 Zeitvarianz, 386 Halteoperator, 386 Hamiltonfunktion, 86 Hamiltonsches System, 89 Hantel, 70, 281 Hardy-Raum, 49 harmonischer Oszillator linearer, 29 high gain control, 164 Hilbert-Raum, 47 Hurwitz-Determinante, 141, 143–145 Hurwitz-Polynom, 142 Impuls kanonischer, 85 Impuls-Signal, 45 Impuls-Spektralfunktion, 45 Injektionsmatrix, 321 Integral ITAE, 204 ITSE, 204 of Squared Error, ISE, 203 Integralformel Cauchysche, 240 Integrierglied, 104 interlacing property, 151 Interpolator, 377 Isomorphie isometrische, 47 Kaiserglocke
431
K¨ olner, 281 Kausalit¨ at, 54 Kette Sturmsche, 134 Kettenlinie, 64, 101 Kettenpendel, 281 Kinetik, 75 KleinsignalKoordinaten, 25 Modelle, 24 Verhalten, 26, 95 Koeffizient parameterabh¨ angiger, 134 Kompensator, 207 Konfigurationsraum, 76 Konvergenz-Halbebene, 49 Konvergenzradius, 370 Koordinaten generalisierte, 85 kartesische, 76 konjugierte, 85 Lagrangesche, 76 Pl¨ ucker-, 317 Korrekturglied phasennacheilendes, 208 phasenvoreilendes, 208 Kr¨ afte eingepr¨ agte, 70, 73 Lagrangesche, 76 Kr¨ aftepaar aquivalentes, 94 ¨ Kriterium der Nichtbeobachtbarkeit, 290 der Nichtsteuerbarkeit, 285 Kroneckerindizes, 356 Kybernetik, 5 LAG-Kompensator, 208 Lagrangesche Gleichungen zweiter Art, 82 Lagrangesche Unbestimmte, 94, 95, 99 Laplace-Transformation einseitige, 48 Laufzeit, 36, 52, 183 LEAD-Kompensator, 208 Linearform, 66 Linearisierung, 36, 95 Linksteiler, 275, 302 loop-shaping, 208, 223
432
Index
Lorentz-Kraft, 83 LTI-Systeme, 55 L¨ uckenkriterium, 150 Mannigfaltigkeit Grassmannsche, 317 Massenpunkte-Modell, 69 Matrix unimodulare, 276 Matrizenbruchdarstellung linke, 364 linke teilerfremde, 286 rechte, 286 rechte teilerfremde, 286 teilerfremde polynomiale, 327 Mbd, 292 Messglied, 10 method computed torque, 299 Methode der kleinsten Quadrate, 342 ¨ MIMO-Ubertragungssystem, 50, 169 Modell inneres, 198 mathematisches, 33 objektnahes, 33 Modellbildung, 33 Modellgenauigkeit, 33 Modellierung mathematische, 32, 33 unstrukturierter Unbestimmtheiten, 213 Modul, 291 multiple-input multiple output system, 169 Multiplikatoren Lagrangesche, 93 Nacheilung, 36, 183 Netzwerkmodell thermisches, 58 Newtonsches Grundgesetz, 73 Nichols-Diagramm, 63 nicht beobachtbar, 288 nicht steuerbar, 284 Niveaustufen-Funktion, 258 Normalform Hermitesche, 275, 287, 347, 348 Nullstelle
Eingangs-Entkopplungs-, 285, 303 Nullstellen mit positiven Realteilen, 254 Nullstellenplatzierbarkeit beliebige, 302 Nullstellenplatzierung konstante R¨ uckf¨ uhrung, 304 polynomiale R¨ uckf¨ uhrung, 312 Nyquist-Bildkurve, 178 Nyquist-Diagramm, 62 Nyquist-Pfad, 176, 182 Operator Abtast-Halte-, 390 Linksverschiebe-, 363 Rechtsverschiebe-, 367 T-periodischer, 387 Optimalit¨ atsprinzip, 64 Ordnung dynamische, 303 Ortskurve, 62 Oszillator harmonischer, 29, 103, 242 P-Regler stabilisierender, 185 Parameterabh¨ angigkeit, 211 Parameterempfindlichkeit, 211 logarithmische, 211 relative, 211 Parsevalsche Gleichung, 46 PD-Regler, 192, 193 Pendel mathematisches, 71, 283 physisches, 69 verschiebliches N -fach-, 69, 78, 87, 92, 94, 337, 350 Pendeluhr mechanische, 2 performance specifications, 197 phase margin, 184 Phasenfluß, 89 Phasenfrequenzgang, 63, 244 Phasenraum, 88 Phasenreserve, 184 Phasenspektrum, 43 PI-Regler, 188 PID-Regler, 185, 194 plant, 169
Index Polpaar dominierendes, 202 Polynom Hurwitz-, 142 Polynommatrix linksassoziierte, 287 Polynommatrizen, 274 Potenzreihe, 369 absolut-konvergente, 369 Pr¨ adiktionsfaktor, 378 Prinzip d’Alembertsches, 75 der virtuellen Arbeit, 73 Hamiltonsches, 81 Probespalte Routhsche, 142 Problem isoperimetrisches, 99 Proportionalglied, 103 Prozess, 169 Prozess¨ uberwachung, 9 Prozessmodell zeitdiskretes, 363 Prozessoptimierung, 9 Prozesstabilisierung, 9 ¨ 389, 390, 399 PUF, Punkt projektiver, 306 Raum projektiver, 304, 309 RC-Schaltung mit Operationsverst¨ arker, 58 Reaktionskraft, 73 Realisierung minimale, 345 Rechenschema Hornersches, 133 Routhsches, 142 Rechentableau Routhsches, 133 Rechtsteiler, 275, 287 reference, 169 Referenzsignal, 169 Regeldifferenz, 10, 169 bleibende, 198 Regelfaktor dynamischer, 205 Regelg¨ ute, 197
433
Regelgr¨ oße, 11, 169 Regelkreis, 10 Abtast-, 372 wohldefinierter, 172 Regelstrecke, 169 Regelstreckenbeschreibung R[z]-polynomiale, 371 Regelung, 11 mit großer Kreisverst¨ arkung, 164 Regelungseinrichtung, 10, 16 Regelungstechnik, 3 Regler, 169 alle stabilisierenden, 260 digitaler, 373 instabiler, 267 P-, 185 PD-, 192 PI-, 188 PID-, 185 robuster, 223 Reglerbeschreibung R[z]-polynomiale, 370 Regulator, 2 Rekonstruierbarkeit des Anfangszustandes, 340 Residuen, 412 Residuen-Satz, 49, 381 Resonanzfrequenz, 206 Resonanzverst¨ arkung, 206 Resultante, 107, 145 Ring euklidischer, 257 Routhscher Algorithmus, 107 R¨ uckf¨ uhrmatrix, 303 R¨ uckf¨ uhrung, 301 beobachterbasierte, 320 reell-polynomiale, 312 reelle, 304 R¨ uckf¨ uhrungsblock instabiler beobachterbasierter, 324 R¨ ucktransformation, 44 R¨ uckwirkungsfreiheit, 12 sampling, 372 Satz von den kleinen Kreisverst¨ arkungen, 183 Separationseigenschaft, 323 Signal absolut integrierbares, 43, 48
434
Index
bandbegrenztes, 44 eingeschaltetes, 48 energiebeschr¨ anktes, 47 nicht-periodisches, 43 periodisches, 41 quadratisch integrierbares, 47 reellwertiges, 41 zeitbegrenztes, 44 zeitdiskretes, 41 zeitkontinuierliches, 41 Simulation, 33 single-input single-output system, 169 ¨ SISO-Ubertragungssystem, 51, 169 Skalarprodukt, 66 im Hilbertraum, 47 small gain theorem, 183 Spaltenoperation elementare, 275 Spektraldarstellung reellwertiger Signale, 39 Spektralfunktion, 44 Spektrum, 43 Sprungantwort, 62 Stabilisierbarkeit starke, 267 Stabilit¨ at, 103 asymptotische, 106 BIBO, 103, 367 innere, 170 robuste, 156, 218 Stabilit¨ atsbedingung notwendige, 140 Stabilit¨ atskriterium f¨ ur Intervallpolynome, 154 Hurwitz, 141 von Michailov, Leonhard, Cremer, 149 von Strecker-Nyquist, 174 Stabilit¨ atsreserve, 184 Standardregelkreis, 169 zeitdiskreter, 362, 370 stark stabilisierbar, 267 Starrk¨ orperbewegung, 70 Hantel-Modell, 70 Stationarit¨ atsbedingung, 66 Stellglied, 8, 10 Stellgr¨ oßenspr¨ unge, 200 Stellsignal, 8 Steuerbarkeitsindex, 353
Steuerbarkeitsindizes Kroneckersche, 354 Steuerbarkeitsmatrix, 353 Kalmansche, 333, 349 Steuersignal, 7 Stodola-Bedingung, 142, 189 St¨ oransatz additiver, 214 multiplikativer, 214 multiplikativer R¨ uckf¨ uhrungs-, 217 R¨ uckf¨ uhrungs-, 217 St¨ oreingriff, 419 St¨ orgr¨ oßenunterdr¨ uckung vollst¨ andige, 199 St¨ orsignal, 169 or¨ ubertragungsfunktion St¨ parametrische, 420 St¨ or¨ ubertragungsmatrizen parametrische, 415 St¨ orungen, 7 St¨ orverhalten, 31 Strecker-Nyquist-Kriterium, 174, 178, 249 MIMO-Regelkreis, 329 vereinfachtes, 182 Sturmsche Kette, 107, 116 Sturmscher Satz, 117 System FIR-, 365 r¨ uckgef¨ uhrtes, 302 vollst¨ andig direkt gesteuertes, 298 system fully actuated, 299 Systembeschreibung polynomiale, 57, 273 Systemgr¨ oßenbeschr¨ ankungen, 20 Teiler gr¨ oßter gemeinsamer, 257 in RH∞ , 257 teilerfremd, 257 in RH∞ , 257 Teilraum beobachtbarer, 342 steuer- und beobachtbarer, 343 steuerbarer, 342 Theorem von Hermite-Biehler, 152 Totzeit, 36, 52, 183, 215
Index Totzeitglied, 36, 52 Tr¨ agheit rotatorische, 70 translatorische, 70 Trajektorie, 106 optimale, 65 Trajektorienplanung, 236 Trajektoriensteuerung, 171 mit Folgeregelung, 234 Trapezregel, 378 ¨ Ubergangsfunktion, 62, 104, 108 ¨ Uberschwingweite, 202 ¨ Uberf¨ uhrbarkeit Punkt-zu-Punkt, 333 ¨ Ubertragungsfunktion, 56 des offenen Kreises, 173 minimalphasige, 242 parametrische, 389, 406 stabile, 240 teilerfremde in RH∞ , 258 ¨ Ubertragungsglied, 23, 26 akausales, 378 zeitdiskretes, 133 ¨ Ubertragungsmatrix, 40, 56 allgemeine, 274 minimale Realisierung, 345 parametrische, 394, 397, 409 ¨ Ubertragungsoperator, 40, 51, 52, 56 kausaler, 54 linearer, 52 zeitinvarianter, 53 zeitvariante, 389 ¨ Ubertragungssysteme MIMO, 50 SISO, 51 Umkehrintegral, 49 Umsetzer Analog-Digital-, 373 Digital-Analog-, 373 Unbestimmtheit, 211 strukturierte, 7, 211 unstrukturierte, 7, 213 uncertainty, 211 Unimodularit¨ atsbedingung, 355 Unl¨ autbarkeit, 281 Vandermonde-Matrix, 351 Variationen
435
kleine, 66 Variationsproblem, 65 unter Nebenbedingungen, 99 Variationsrechnung, 41, 64 Verschiebung virtuelle, 73, 92 Verschiebungsformel Links-, 366 Verz¨ ogerungsglied, 28 zweiter Ordnung, 200 Vorsteuerung inversionsbasierte, 227 W¨ armeb¨ ader gekoppelte, 57, 334 Wasserbett-Effekt, 252 Wasserm¨ uhle, 2 Wertefolge Ausgangs-, 363 beschr¨ ankte Ausgangs-, 367 beschr¨ ankte Eingangs-, 367 Eingangs-, 363 St¨ or-, 370 Wind-up–Effekt, 22 Windm¨ uhle, 2 Wirkungsfunktional, 65 Wirkungskreislauf, 10 Wirkungsplan, 12, 23 Wohldefiniertheit, 172 WOK, 157 Wurzelortskurve, 157, 189 Youla-Parameter, 262 z-Transformation, 366, 380 modifizierte, 392 ¨ z-Ubertragungsfunktion, 364 ¨ z-Ubertragungsmatrix, 364, 379, 383 Zeilenoperation elementare, 287 Zeitparameter diskreter, 363 Zeitverschiebeoperator, 52 Zerlegung normalisierte teilerfremde, 259 Routhsche, 135, 140, 186, 189, 194 teilerfremde, 258 Zielvorstellungen, 8 zustandsbeobachtbar, 340
436
Index
Zustandsbeobachtbarkeit Hautus-Kriterium, 340 Kalman-Kriterium, 340 Zustandsbeschreibung, 60, 332 Zustandsdarstellung, 85 Zustandsgleichungen, 85 Zustandsmodell, 332 Zustandsraum
Dekomposition, 342 zustandssteuerbar, 332 Zustandssteuerbarkeit Hautus-Kriterium, 333 Kalman-Kriterium, 333 Zwangsbedingung geometrische, 73