Konvergenzbetrachtungen zum Newton-Verfahren

Das Newton-Verfahren ist ein so genanntes lokal konvergentes Verfahren. Konvergenz der in der Newton-Iteration erzeugten Folge zu einer Nullstelle ist also nur garantiert, wenn der Startwert, d.h. das \(\displaystyle 0\)-te Glied der Folge, schon "ausreichend nahe" an der Nullstelle liegt. Ist der Startwert zu weit weg, kann alles passieren:

  • Die Folge divergiert, der Abstand zur Nullstelle wächst über alle Grenzen.
  • Die Folge divergiert, bleibt aber beschränkt. Sie kann z.B. periodisch werden, d.h. endlich viele Punkte wechseln sich in immer derselben Reihenfolge ab. Man sagt auch, dass die Folge oszilliert.
  • Die Folge konvergiert trotz der Distanz zur Nullstelle, kann jedoch, falls die Funktion mehrere Nullstellen hat, gegen eine andere als die gewünschte Nullstelle (falls man weiß, welche man will) konvergieren.

Newton-Fraktal für p(z)=z^3-1

Newton-Fraktal für \(\displaystyle p(z)=z^3-1\)

Ist der Startwert \(\displaystyle x_0\,\) so gewählt, dass das Newton-Verfahren konvergiert, so ist die Konvergenz allerdings quadratisch, also mit der Konvergenzordnung 2 (falls die Ableitung an der Nullstelle nicht verschwindet). Die Menge der Startpunkte, für die das Newton-Verfahren gegen eine bestimmte Nullstelle konvergiert, bildet den Einzugsbereich dieser Nullstelle. Färbt man für eine Polynomfunktion, mit reellen oder komplexen Koeffizienten, die Einzugsbereiche verschiedener Nullstellen in der komplexen Ebene verschieden ein, so ergibt sich ein Newton-Fraktal. In diesem ist zu erkennen, dass die Einzugsbereiche Bassins, d.h. Kreisscheiben um die Nullstellen enthalten, aus welchen heraus die Newton-Iteration stabil gegen die Nullstelle im Zentrum konvergiert. Aber es ist auch zu erkennen, dass die Ränder der Einzugsbereiche "ausgefranst" sind, sie haben sogar eine fraktale Struktur. Geringe Abweichungen im Startpunkt können also zu verschiedenen Nullstellen führen. Falls es jedoch im Intervall \(\displaystyle I=]a;b[\,\) genau eine Nullstelle gibt, in \(\displaystyle I\,\) durchweg \(\displaystyle f\, \prime>0\) sowie \(\displaystyle f\, {\prime\prime}<0\) gilt und der Startwert \(\displaystyle x_0\in I=]a;b[\) links von der Nullstelle \(\displaystyle \xi\in I\,\) gewählt wird, dann konvergiert das Newton-Verfahren stets, und zwar streng monoton wachsend (siehe Abbildung unten bzw. die Tabelle oben ab \(\displaystyle n=1\)).

 
 

Beispiele für Nicht-Konvergenz

Oszillierendes Verhalten

Oszillierendes Verhalten ergibt sich für das Polynom \(\displaystyle f(x):=x^3-2x+2 \) mit \(\displaystyle f\, \prime(x)=3x^2-2 \). Der Punkt \(\displaystyle x=0 \) mit \(\displaystyle f(0)=2 \) und \(\displaystyle f\, \prime(0)=-2 \) wird durch den Newton-Operator auf den Punkt \(\displaystyle N(0)=0-2/(-2)=1 \) abgebildet, der Punkt \(\displaystyle x=1 \) wiederum, mit \(\displaystyle f(1)=1 \) und \(\displaystyle f\, \prime(1)=1 \), wird auf \(\displaystyle N(1)=1-1/1=0 \) abgebildet, so dass die Newton-Iteration mit einem dieser Punkte als Startwert eine periodische Folge ergibt, diese beiden Punkte wechseln sich zyklisch ab. Des Weiteren ist dieser Zyklus stabil, er bildet einen Attraktor der Newton-Iteration. Das bedeutet, es gibt eine kleine Umgebung beider Punkte, so dass Startpunkte in dieser Umgebung gegen den Zyklus konvergieren und somit je einen der Punkte \(\displaystyle 0\) und \(\displaystyle 1\) als Grenzwert der Teilfolge mit geradem Index und der mit ungeradem Index haben.

Divergenz

Divergenz bzw. beliebig weites Entfernen vom Startpunkt ergibt sich für \(\displaystyle f(x)=\sin(x) \) mit \(\displaystyle f^\prime(x)=\cos(x) \) und \(\displaystyle N(x)=x-\tan(x) \). Es gibt eine Stelle \(\displaystyle x_0 \isin\lbrack -\pi /2,0 \rbrack \) mit \(\displaystyle \tan(x_0)=-2\pi \). Man überzeugt sich, dass dann \(\displaystyle x_n =x_0+2\pi n\) gilt. Dieses Verhalten ist nicht stabil, denn bei leichter Variation des Anfangswertes, wie sie zum Beispiel durch die numerische Berechnung entsteht, entfernt sich die Newton-Iteration immer weiter von der idealen divergierenden Folge. Selbst bei schließlicher Konvergenz wird die gefundene Nullstelle sehr weit vom Startwert entfernt sein.

Lokale quadratische Konvergenz

Sei \(\displaystyle f \) eine zweimal stetig differenzierbare reelle Funktion und \(\displaystyle a \) eine Nullstelle von \(\displaystyle f \), in welcher die Ableitung keine Nullstelle hat. Das bedeutet, dass der Graph der Funktion transversal, d.h. nicht-berührend, die \(\displaystyle x\)-Achse schneidet. Sei \(\displaystyle x\) ein Punkt nahe bei \(\displaystyle a\). Dann kann die Taylor-Formel zweiten Grades (mit Restglied)

\(\displaystyle 0=f(a)=f(x)+f'(x)(a-x)+\dfrac12 f''(\xi)(a-x)^2\) (\(\displaystyle \xi\) liegt zwischen \(\displaystyle x\) und \(\displaystyle a\)),

nach der Differenz \(\displaystyle (x-a)\) umgestellt werden,

\(\displaystyle x-a=\dfrac{f(x)}{f'(x)}+\dfrac{f''(\xi)}{2\,f'(x)}(x-a)^2\).

Es wird nun so umgestellt, dass der Newton-Operator auf der rechten Seite erscheint,

\(\displaystyle N_f(x)-a=x-\dfrac{f(x)}{f'(x)}-a=\dfrac{f''(\xi)}{2\,f'(x)}(x-a)^2\).

Seien \(\displaystyle I\) ein Intervall um \(\displaystyle a\) ohne Nullstelle der Ableitung \(\displaystyle f\, '(x)\) und \(\displaystyle m_1=\min_{x\in I}|f´(x)|\) sowie \(\displaystyle M_2=\max_{x\in I}|f''(x)|\) Schranken der Ableitungen von \(\displaystyle f\). Dann folgt für alle \(\displaystyle x\in I\) die Abschätzung

\(\displaystyle \left|N_f(x)-a\right|\le\dfrac{M_2}{2m_1}|x-a|^2\).

Mit \(\displaystyle K=\dfrac{M_2}{2m_1}\) sei der konstante Faktor bezeichnet. In jedem Schritt \(\displaystyle n\) der Newtoniteration wird die Größe \(\displaystyle K\,|x_n-a|\) kleiner sein als das Quadrat derselben Größe im vorhergehenden Schritt \(\displaystyle (n-1)\). Nach vollständiger Induktion ergibt sich

\(\displaystyle K\,|x_n-a|\le (K\,|x_0-a|)^{2^n}\).

Kann also für den Startpunkt der Iteration die Abschätzung \(\displaystyle K\,|x_0-a |<1\) garantiert werden, z.B. indem die Intervallänge von \(\displaystyle I\) kleiner als \(\displaystyle 1/K\) ist, so konvergiert die Folge \(\displaystyle (x_n)\) der Newton-Iteration gegen die Nullstelle \(\displaystyle a\), denn die Folge \(\displaystyle (K\,|x_n-a|) \) ist nach der angegebenen Abschätzung eine Nullfolge. Die Verkürzung des Intervalls kann durch einige Iterationen eines langsameren Verfahrens zur Nullstelleneinschränkung erreicht werden, z.B. des Bisektionsverfahrens oder der Regula falsi.

Die aus dieser Abschätzungen folgende Konvergenzgeschwindigkeit wird als quadratisch bezeichnet, die (logarithmische) Genauigkeit bzw. Anzahl gültiger Stellen verdoppelt sich in jedem Schritt. Die Abschätzung des Abstands \(\displaystyle |x_n -a| \) zur Nullstelle wird oft linear in \(\displaystyle | x_0- a|\) angegeben, so gilt z.B.

  • \(\displaystyle |x_n-a|\le \left(\dfrac12\right)^{2^n-1}\cdot |x_0-a|\), falls die Länge des Intervalls \(\displaystyle I\) kleiner als \(\displaystyle \dfrac{1}{2K}\) ist. Dies ergibt eine Abschätzung der gültigen Stellen im Binärsystem.
  • \(\displaystyle |x_n-a|\le \left(\dfrac1{10}\right)^{2^n-1}\cdot |x_0-a|\), falls die Länge des Intervalls \(\displaystyle I\) kleiner als \(\displaystyle \dfrac{1}{10K}\) ist, d.h. nahe genug an der Nullstelle ergibt sich eine Verdopplung der Dezimalstellen in jedem Schritt.

Bemerkungen

  • Der lokale Konvergenzbeweis kann auch auf gleiche Weise im mehrdimensionalen Fall geführt werden, allerdings ist er dann technisch etwas schwieriger, da mit zwei- und dreistufigen Tensoren für die erste bzw. zweite Ableitung gearbeitet wird. Im wesentlichen ist die Konstante \(\displaystyle K\) durch \(\displaystyle K=\dfrac12\,\sup_{x\in U}\|f'(x)^{-1}\|_{(1,1)}\,\sup_{x\in U}\|f´´(x)\|_{(1,2)}\) zu ersetzen, mit geeigneten induzierten Operatornormen.
  • Der lokale Konvergenzbeweis setzt voraus, dass ein eine Nullstelle enthaltendes Intervall bekannt ist. Aus seinem Beweis ergibt sich aber keine Möglichkeit, dies schnell zu testen. Ein Konvergenzbeweis, auch hierfür ein Kriterium liefert, wurde zuerst von Leonid Kantorowitsch geführt und ist als Satz von Kantorowitsch bekannt.
  • Um einen geeigneten Startpunkt zu finden, verwendet man gelegentlich andere ("gröbere") Verfahren. Beispielsweise kann man mit dem Gradientenverfahren eine ungefähre Lösung ermitteln und diese dann mit dem Newton-Verfahren verfeinern.
  • Bei unbekanntem Startpunkt kann man mittels einer Homotopie die Funktion \(\displaystyle f \), von der man eine Nullstelle sucht, zu einer einfacheren Funktion \(\displaystyle g \) deformieren, von der (mindestens) eine Nullstelle bekannt ist. Man durchläuft dann die Deformation rückwärts in Form einer endlichen Folge sich nur "wenig" unterscheidender Funktionen. Von der ersten Funktion \(\displaystyle g \) kennt man eine Nullstelle. Als Startwert der Newton-Iteration zur gerade aktuellen Funktion der Folge verwendet man die Näherung einer Nullstelle der in der Folge vorhergehenden Funktion.
:Als Beispiel mag die "Flutungshomotopie" dienen: mit einem willkürlichen \(\displaystyle z \) bilden wir die Ausgangsfunktion \(\displaystyle g(x)= f_0(x):= f(x)-f(z) \) mit bekannter Nullstelle \(\displaystyle z \) . Wir haben den "Wasserspiegel" vom "Nullpegel" auf die Höhe \(\displaystyle f(z) \) geflutet. Nun senken wir schrittweise den Wasserstand, \(\displaystyle f_n(x):= f(x)-(f(z)-n\cdot h\cdot f(z)),\, h=1/N ,\, n=1\dots N \). In jedem Schritt wird eine Näherung \(\displaystyle \xi^{(n)} \) einer Nullstelle bestimmt, wobei \(\displaystyle x_0 := \xi^{(n-1)} \) gesetzt wird. Es ist \(\displaystyle f_N=f \) und somit \(\displaystyle \xi ^{(N)}\) eine der gesuchten Näherungslösungen.

Die Mathematik ist eine Art Spielzeug, welches die Natur uns zuwarf zum Troste und zur Unterhaltung in der Finsternis.

Jean-Baptist le Rond d'Alembert

Copyright- und Lizenzinformationen: Diese Seite basiert dem Artikel Newton-Verfahren aus der frеiеn Enzyklοpädιe Wιkιpеdιa und stеht unter der Dοppellizеnz GNU-Lιzenz für freie Dokumentation und Crеative Commons CC-BY-SA 3.0 Unportеd (Kurzfassung). In der Wιkιpеdιa ist eine Listе dеr Autorеn des Originalartikels verfügbar. Da der Artikel geändert wurde, reicht die Angabe dieser Liste für eine lizenzkonforme Weiternutzung nicht aus!
Anbieterkеnnzeichnung: Wurzelzieher Mathеpеdιa  •  Тhοmas Stеιnfеld  • Dοrfplatz 25  •  17237 Blankеnsее  • Tel.: 01734332309 (Vodafone/D2)  •  Email: cο@maτhepedιa.dе
 
G: 28.08.2015 01:27:28 (740 ms; 479 M)

Nichtlineare Gleichungssysteme