Teorema de reducción a ejes principales. Reducir la forma cuadrática a los ejes principales.

Considere una forma cuadrática real arbitraria

Su matriz de coeficientes es simétrica real. Por lo tanto (ver Capítulo IX, § 13) es ortogonalmente similar a alguna matriz diagonal real, es decir, hay una matriz ortogonal real tal que

Aquí están los números característicos de la matriz.

Porque para matriz ortogonal, entonces de (41) se deduce que la forma bajo la transformación ortogonal de variables

o más registro detallado

(42")

entra en forma

. (43)

Teorema 7. Real forma cuadrática siempre se puede dar usando transformación ortogonal A forma canónica(43); en este caso, son los números característicos de la matriz.

Reducir una forma cuadrática a la forma canónica (43) usando una transformación ortogonal se llama reducción a los ejes principales. Este nombre se debe a que la ecuación de la hipersuperficie central de segundo orden,

, (44)

con una transformación ortogonal de variables (42) toma la forma canónica

. (45)

Si las consideramos como coordenadas en alguna base ortonormal del espacio euclidiano de dimensión, entonces serán coordenadas en una nueva base ortonormal del mismo espacio, y la "rotación" de los ejes se lleva a cabo mediante transformación ortogonal (42). Los nuevos ejes de coordenadas son los ejes de simetría de la superficie central (44) y suelen denominarse ejes principales de esta superficie.

De la fórmula (43) se deduce que el rango de la forma igual al numero números característicos distintos de cero de la matriz, y la firma es igual a la diferencia entre el número de números característicos positivos y negativos de la matriz.

De aquí, en particular, se desprende la siguiente propuesta:

Si con un cambio continuo en los coeficientes de una forma cuadrática su rango permanece sin cambios, entonces con este cambio en los coeficientes su firma también permanece sin cambios.

En este caso, partimos del hecho de que un cambio continuo en los coeficientes implica un cambio continuo en los números característicos. La firma sólo puede cambiar cuando algún número característico cambia de signo. Pero luego, en algún momento intermedio, el número característico en cuestión llegará a cero, lo que implica un cambio en el rango de la forma. (48)

La teoría de reducir una forma cuadrática a una forma canónica, expuesta en el párrafo anterior, se construye por analogía con la teoría geométrica de las curvas centrales de segundo orden, pero no puede considerarse una generalización de esta última teoría. De hecho, en nuestra teoría se permite el uso de cualquier transformación lineal no degenerada, mientras que llevar una curva de segundo orden a la forma canónica se logra utilizando transformaciones lineales muy tipo especial(2), que son rotaciones del avión. Este teoría geométrica Sin embargo, se puede generalizar al caso de formas cuadráticas en incógnitas con coeficientes reales al requerir que la matriz de transformación sea ortogonal. Esta transformación se llama ortogonal y el procedimiento en sí reducir formas cuadráticas a los ejes principales.

TEOREMA. Cada forma cuadrática se puede reducir a una forma canónica mediante alguna transformación ortogonal.

PRUEBA. Consideraremos una matriz de forma cuadrática como una matriz de algunos operador lineal en el espacio euclidiano. Si la matriz es de forma cuadrática, entonces es simétrica de orden. Si alguna base ortonormal del espacio euclidiano dimensional, entonces la matriz define un operador simétrico en esta base. Según el teorema principal sobre los operadores simétricos en el espacio euclidiano, en una base ortonormal adecuada su matriz será diagonal. Sea la matriz de transición de a , entonces .

Pero la matriz , como matriz de transición de una base ortonormal a otra, según el Teorema 2 §1.6 será ortogonal y, por tanto, . Es por eso . Es decir, así se transforma una matriz de forma cuadrática, sometida a una transformación lineal de incógnitas con la matriz.

Entonces, la transformación de incógnitas que tienen una matriz es ortogonal, y la matriz, al ser diagonal, corresponde a la forma cuadrática. forma canónica. □

El hecho de que la matriz de un operador lineal en una base compuesta por vectores propios, tiene forma diagonal (con valores propios a lo largo de la diagonal principal), nos brinda un método para encontrar prácticamente la forma canónica de una forma cuadrática, así como esta transformación ortogonal en sí.

Ejemplo 2. Encuentra una transformación ortogonal que reduzca la forma cuadrática.

a la vista canónica y escriba esta vista canónica.

Solución. La matriz de esta forma tiene la forma

,

vamos a encontrarla polinomio característico:

.

Por tanto, la matriz tiene una raíz doble y una raíz simple. Por tanto, la forma canónica de esta forma cuadrática será

.

Encontremos una transformación ortogonal que implemente esta reducción. Para hacer esto, encontramos los vectores propios correspondientes a los valores propios encontrados. , es decir, resolvemos sistemas de lineales ecuaciones homogéneas para cada .

Cuando nosotros tenemos

.

Dónde , es decir, hay 2 variables independientes, y conjunto fundamental las soluciones serán:

Aplicándoles el proceso de ortogonalización, obtenemos.

La teoría de reducir una forma cuadrática a una forma canónica, expuesta en el párrafo anterior, se construye por analogía con la teoría geométrica de las curvas centrales de segundo orden, pero no puede considerarse una generalización de esta última teoría. De hecho, nuestra teoría permite el uso de cualquier transformación lineal no degenerada, mientras que llevar una curva de segundo orden a su forma canónica se logra mediante el uso de transformaciones lineales de un tipo muy especial (2), que son rotaciones del plano. Sin embargo, esta teoría geométrica puede generalizarse al caso de formas cuadráticas con incógnitas con coeficientes reales requiriendo que la matriz de transformación sea ortogonal. Esta transformación se llama ortogonal y el procedimiento en sí reducir formas cuadráticas a los ejes principales.

TEOREMA. Cada forma cuadrática se puede reducir a una forma canónica mediante alguna transformación ortogonal.

PRUEBA. Consideraremos una matriz de forma cuadrática como la matriz de algún operador lineal en el espacio euclidiano. Si la matriz es de forma cuadrática, entonces es simétrica de orden. Si alguna base ortonormal del espacio euclidiano dimensional, entonces la matriz define un operador simétrico en esta base. Según el teorema principal sobre los operadores simétricos en el espacio euclidiano, en una base ortonormal adecuada su matriz será diagonal. Sea la matriz de transición de a , entonces .

Pero la matriz , como matriz de transición de una base ortonormal a otra, según el Teorema 2 §1.6 será ortogonal y, por tanto, . Es por eso . Es decir, así se transforma una matriz de forma cuadrática, sometida a una transformación lineal de incógnitas con la matriz.

Entonces, una transformación de incógnitas que tiene una matriz es ortogonal, y la matriz, al ser diagonal, corresponde a una forma cuadrática de la forma canónica. □

El hecho de que la matriz de un operador lineal en una base compuesta de vectores propios tenga forma diagonal (con valores propios a lo largo de la diagonal principal) nos da un método para encontrar prácticamente la forma canónica de la forma cuadrática, así como esta transformación ortogonal. sí mismo.

Ejemplo 2. Encuentra una transformación ortogonal que reduzca la forma cuadrática.

a la vista canónica y escriba esta vista canónica.

Solución. La matriz de esta forma tiene la forma

,

Encontremos su polinomio característico:

.

Por tanto, la matriz tiene una raíz doble y una raíz simple. Por tanto, la forma canónica de esta forma cuadrática será

.

Encontremos una transformación ortogonal que implemente esta reducción. Para hacer esto, encontramos los vectores propios correspondientes a los valores propios encontrados. , es decir, resolveremos sistemas de ecuaciones lineales homogéneas para cada .

Cuando nosotros tenemos

.

Dónde , es decir, hay 2 variables independientes, y el conjunto fundamental de soluciones será:

Aplicándoles el proceso de ortogonalización obtenemos:

Cuando nosotros tenemos

.

Este sistema es equivalente a lo siguiente:

,

cuya solución será

- Álgebra lineal

Reducir la forma cuadrática a los ejes principales.

Anteriormente, consideramos el problema de reducir un valor real.


q(x)= \sum_(n=1)^(n) \sum_(j=1)^(n) a_(ij)x_ix_j=x^TAx


n variables para


\widetilde(q)(y)=\lambda_1y_1^2+ \lambda_2y_2^2+ \ldots+ \lambda_ny_n^2


utilizando un cambio lineal no degenerado de variables x=Sy. Para resolver este problema utilizamos .


Consideremos otro enfoque para la solución. Un cambio lineal no degenerado de variables x=Sy con una matriz ortogonal S~(S^(-1)=S^T) se denominará cambio ortogonal de variables (o transformación ortogonal de variables).


Formulemos el problema. reducir una forma cuadrática a los ejes principales: se requiere encontrar un cambio ortogonal de las variables x=Sy (S^(-1)=S^T), llevando la forma cuadrática (9.23) a la forma canónica (9.24).


Para resolver utilizamos lo siguiente significado geométrico tareas. Contemos las variables. x_1,x_2,\ldots,x_n coordenadas del vector \boldsymbol(x) del espacio euclidiano n-dimensional \mathbb(E) en base ortonormal (\boldsymbol(e))= (\boldsymbol(e)_1,\ldots,\boldsymbol(e)_n), y la matriz A de forma cuadrática (9.23) es la matriz de algunos transformación lineal \mathcal(A)\dos puntos \mathbb(E)\to \mathbb(E) sobre la misma base. Además, esta transformación es autoadjunta, ya que su matriz es simétrica: A^T=A. La forma cuadrática (9.23) se puede representar como un producto escalar.


q(\boldsymbol(x))= \bigl\langle \mathcal(A)(\boldsymbol(x)), \boldsymbol(x)\bigr\rangle= \bigl\langle \boldsymbol(x), \mathcal(A )(\boldsymbol(x))\bigr\rangle.


Un cambio ortogonal de variables x=Sy corresponde a la transición de una base ortonormal a otra. De hecho, sea S la matriz de transición de una base ortonormal (\boldsymbol(e)) a una base ortonormal (\boldsymbol(s))= (\boldsymbol(s)_1,\ldots,\boldsymbol(s)_n), es decir. (\boldsymbol(s))= (\boldsymbol(e))S y S^(-1)=S^T. Entonces las coordenadas x del vector \boldsymbol(x) en la base (\boldsymbol(e)) y las coordenadas y del mismo vector en la base (\boldsymbol(s)) están relacionadas por la fórmula (8.11): x= Sí.


Así, el problema de reducir una forma cuadrática a los ejes principales se puede formular de la siguiente manera: se requiere encontrar en el espacio \mathbb(E) una base en la que la matriz de transformación autoadjunta \mathcal(A) tenga una diagonal forma. Según el teorema 9.10, es necesario elegir una base ortonormal de los vectores propios de la transformación autoadjunta. En este caso, la matriz de transición S a la base canónica resulta ser ortogonal: S^T=S^(-1) .


Formulemos este resultado para la forma cuadrática.

Teorema (9.12) sobre la reducción de la forma cuadrática a los ejes principales

La forma cuadrática real (9.23) se puede reducir a la forma canónica (9.24) usando una transformación ortogonal de las variables x=Sy, donde - valores propios matrices a.


Consecuencia. La forma cuadrática (9.23) es definida positiva (definida no negativa) si y solo si todos los valores propios de su matriz son positivos (no negativos).


Notas 9.10


1. Con reemplazo lineal no degenerado matriz variable La forma cuadrática cambia según la fórmula (6.10): A"=S^TAS. Para una matriz ortogonal S, esta fórmula toma la forma A"=S^(-1)AS, que coincide con la fórmula (9.4) para cambiar la forma lineal. matriz de transformación al cambiar la base.


2. Para encontrar la forma canónica (9.24), basta con determinar todas las raíces. \lambda_1, \lambda_2,\ldots,\lambda_m(entre las cuales puede haber iguales) (ecuaciones) \det(A-\lambda E)=0, donde E es la matriz identidad.


3. El corolario del teorema 9.12 se puede utilizar para analizar el signo de una forma cuadrática:


– si todos los valores propios son positivos (negativos), entonces la forma cuadrática es positiva (negativa) definida;


– si todos los valores propios no son negativos (no positivos), entonces la forma cuadrática es definida no negativa (no positiva);


– si hay valores propios de diferentes signos, entonces la forma cuadrática es indefinida (alterna).


4. Los resultados formulados en el párrafo 3 de los comentarios pueden utilizarse para verificar que sea suficiente y condiciones necesarias Segundo orden en el problema de buscar el extremo incondicional de funciones. Para hacer esto, necesitas encontrar los valores propios. \lambda_1, \lambda_2,\ldots,\lambda_m \dfrac(d^2f(x))(dx^Tdx) en cada puntos estacionarios funciones x^(\ast) f(x)=f(x_1,\ldots,x_n).


Si todos los valores propios son positivos: \lambda_i>0,~ i=1,\ldots,n, entonces en el punto x^(\ast) mínimo local;


– si todos los valores propios son negativos: \lambda_i<0,~ i=1,\ldots,n , entonces en el punto x^(\ast) hay un máximo local;


– si todos los valores propios no son negativos: \lambda_i\geqslant0,~ i=1,\ldots,n, entonces en el punto x^(\ast) puede haber un mínimo local;


– si todos los valores propios no son positivos: \lambda_i\leqslant0,~ i=1,\ldots,n, entonces en el punto x^(\ast) puede haber un máximo local;


– si los valores propios \lambda_i,~ i=1,\ldots,n, signos diferentes, entonces no hay ningún extremo en el punto x^(\ast);


– si todos los valores propios son cero: \lambda_i=0,~ i=1,\ldots,n, entonces se requiere investigación adicional.


5. El problema de reducir una forma cuadrática a los ejes principales se resuelve utilizando un algoritmo para reducir una transformación autoadjunta a una forma diagonal. En este caso se encuentra la forma diagonal de la matriz de forma cuadrática y la matriz ortogonal S del cambio de variables x=Sy, llevando la forma cuadrática a la forma canónica (a los ejes principales).

Ejemplo 9.7. Determinar el signo de la forma cuadrática de tres variables.


q(x)= x_1^2+2x_1x_2+2x_1x_3+x_2^2+2x_2x_3+x_3^2


y encontrar un cambio ortogonal de variables x=Sy, llevando la forma cuadrática a la forma canónica (a los ejes principales).

Solución. Componemos una matriz de forma cuadrática: A=\begin(pmatriz) 1&1&1\\ 1&1&1\\ 1&1&1 \end(pmatriz). En el ejemplo 9.6, se encontraron los valores propios de esta matriz: \lambda_(1,2)=0, \lambda_3=3. Todos los valores propios son no negativos, por lo que la forma cuadrática es definida no negativa (ver el punto 4 de las Observaciones 9.10).


Se encontró una matriz ortogonal.


S=\begin(pmatrix) \dfrac(\sqrt(2))(2)& \dfrac(\sqrt(6))(6)& \dfrac(\sqrt(3))(3)\\ 0&-\ dfrac(\sqrt(6))(3)& \dfrac(\sqrt(3))(3)\\ -\dfrac(\sqrt(2))(2)& \dfrac(\sqrt(6))( 6)& \dfrac(\sqrt(3))(3) \end(pmatrix)\!,


reducir la matriz A a forma diagonal \Lambda= \nombreoperador(diag) (0,0,3). Anotamos el cambio ortogonal requerido de las variables x=Sy:


x_1= \frac(\sqrt(2))(2)\,y_1+ \frac(\sqrt(6))(6)\,y_2+ \frac(\sqrt(3))(3)\,y_3;\quad x_2= -\frac(\sqrt(6))(3)\,y_2+ \frac(\sqrt(3))(3)\,y_3;\quad x_3= -\frac(\sqrt(2))(2 )\,y_1+ \frac(\sqrt(6))(6)\,y_2+ \frac(\sqrt(3))(3)\,y_3.


y la forma cuadrática en forma canónica: \widetilde(q)(y)= 3y_3^2.

Ejemplo 9.8. Encuentre puntos extremos locales de una función de dos variables usando matrices


f(x)=3x_1^5+x_1^4-5x_1^3-2x_1^2x_2+x_2^2.


Solución. En el paso 1 se encontró el gradiente de la función, y de la condición necesaria para un extremo de primer orden, tres puntos estacionarios:


x^0= \begin(pmatrix)0&0 \end(pmatrix)^T,\qquad x^1=\begin(pmatrix) 1&1 \end(pmatrix)^T,\qquad x^2=\begin(pmatrix) - 1&1\end(pmatriz)^T.


La matriz de Hesse tiene la forma

\frac(df(x))(dx^Tdx)= \begin(pmatrix) 60x_1^3+12x_1^2-30x_1-4x_2&-4x_1\\-4x_1&2 \end(pmatrix)\!.


Encontremos los valores propios de la matriz de Hesse en cada punto estacionario:


\frac(df(x^0))(dx^Tdx)= \begin(pmatrix)0&0\\ 0&2 \end(pmatrix)\!;\quad \frac(df(x^1))(dx^Tdx ) = \begin(pmatrix)38&-4\\ -4&2 \end(pmatrix)\!,\quad \frac(df(x^2))(dx^Tdx)= \begin(pmatrix) -22&4\\4&2\ final (pmatriz)


y utilizar el párrafo 4 del comentario 9.10.

En el punto x^0=\begin(pmatriz)0\\0 \end(pmatriz) la matriz de Hesse tiene la forma \begin(pmatriz) 0&0\\ 0&2\end(pmatriz). De la ecuación. \begin(vmatrix) -\lambda&0\\ 0&2-\lambda\end(vmatrix)=0 encontramos \lambda_1=0, \lambda_2=2 . Dado que todos los valores propios no son negativos, puede haber un mínimo local en el punto x^0 y se requiere investigación adicional para llegar a una conclusión final (ver ejemplo 6.13).


En el punto x^1=\begin(pmatriz)1\\1 \end(pmatriz) la matriz de Hesse tiene la forma \begin(pmatriz) 38&-4\\ -4&2 \end(pmatriz). De la ecuación. \begin(vmatrix) 38-\lambda&-4\\ -4&2-\lambda\end(vmatrix)=0, o \lambda^2-40 \lambda+60=0 obtenemos \lambda_(1,2)= 20\pm2\sqrt(85). Dado que todos los valores propios son positivos, en el punto x^1 hay un mínimo local de la función.


En el punto x^2=\begin(pmatriz)-1\\1 \end(pmatriz) la matriz de Hesse tiene la forma \begin(pmatriz) -22&4\\ 4&2 \end(pmatriz). De la ecuación. \begin(vmatrix) -22-\lambda&4\\ 4&2-\lambda\end(vmatrix)=0, o \lambda^2+40 \lambda-60=0 obtenemos \lambda_(1,2)=-10\pm4\sqrt(10). Dado que los valores propios tienen signos diferentes, no hay ningún extremo en el punto x^2.



¿Te gustó el artículo? ¡Compartir con tus amigos!