Приведение квадратичной формы к главным осям пример. Приведение квадратичной формы к главным осям

Теория приведения квадратичной формы к каноническому виду, изложенная в предыдущем параграфе, построена по аналогии с геометрической теорией центральных кривых второго порядка, но не может считаться обобщением этой последней теории. В самом деле, в нашей теории допускается использование любых невырожденных линейных преобразований, в то время как приведение кривой второго порядка к каноническому виду достигается применением линейных преобразований весьма специального вида (2), являющихся вращениями плоскости. Эта геометрическая теория может быть, однако, обобщена на случай квадратичных форм от неизвестных с действительными коэффициентами, если потребовать, чтобы матрица преобразования была ортогональной. Такое преобразование называется ортогональным , а сама процедура приведением квадратичных форм к главным осям .

ТЕОРЕМА. Каждая квадратичная форма некоторым ортогональным преобразованием может быть приведена к каноническому виду.

ДОКАЗАТЕЛЬСТВО. Будем смотреть на матрицу квадратичной формы как на матрицу некоторого линейного оператора в евклидовом пространстве. Если матрица квадратичной формы, то она симметрическая порядка . Если некоторый ортонормированный базис мерного евклидова пространства, то матрица задаёт в этом базисе симметрический оператор . По основной теореме о симметрических операторах в евклидовом пространстве в подходящем ортонормированном базисе его матрица будет диагональной. Пусть матрица перехода от к , тогда .

Но матрица , как матрица перехода от одного ортонормированного базиса к другому, по теореме 2 §1.6 будет ортогональной, а значит, . Поэтому . А именно так преобразуется матрица квадратичной формы, подвергнутой линейному преобразованию неизвестных с матрицей .

Итак, преобразование неизвестных, имеющее матрицу ортогонально, а матрица , будучи диагональной, соответствует квадратичной форме канонического вида. □

Тот факт, что матрица линейного оператора в базисе, составленном из собственных векторов, имеет диагональный вид (с собственными значениями по главной диагонали) , даёт нам метод практического отыскания канонического вида квадратичной формы, а также самого этого ортогонального преобразования.

Пример 2. Найти ортогональное преобразование, приводящее квадратичную форму

к каноническому виду и написать этот канонический вид.

Решение . Матрица этой формы имеет вид

,

Найдём её характеристический многочлен:

.

Таким образом, матрица имеет двукратный корень и простой корень . Следовательно, канонический вид данной квадратичной формы будет

.

Найдём ортогональное преобразование, осуществляющее это приведение. Для этого найдём собственные векторы, соответствующие найденным собственным значениям , т. е. решим системы линейных однородных уравнений для каждого .

При имеем

.

Откуда , т. е. имеются 2 независимые переменные, и фундаментальный набор решений будет:

Применив к ним процесс ортогонализации, получим.

Теория приведения квадратичной формы к каноническому виду, изложенная в предыдущем параграфе, построена по аналогии с геометрической теорией центральных кривых второго порядка, но не может считаться обобщением этой последней теории. В самом деле, в нашей теории допускается использование любых невырожденных линейных преобразований, в то время как приведение кривой второго порядка к каноническому виду достигается применением линейных преобразований весьма специального вида (2), являющихся вращениями плоскости. Эта геометрическая теория может быть, однако, обобщена на случай квадратичных форм от неизвестных с действительными коэффициентами, если потребовать, чтобы матрица преобразования была ортогональной. Такое преобразование называется ортогональным , а сама процедура приведением квадратичных форм к главным осям .

ТЕОРЕМА. Каждая квадратичная форма некоторым ортогональным преобразованием может быть приведена к каноническому виду.

ДОКАЗАТЕЛЬСТВО. Будем смотреть на матрицу квадратичной формы как на матрицу некоторого линейного оператора в евклидовом пространстве. Если матрица квадратичной формы, то она симметрическая порядка . Если некоторый ортонормированный базис мерного евклидова пространства, то матрица задаёт в этом базисе симметрический оператор . По основной теореме о симметрических операторах в евклидовом пространстве в подходящем ортонормированном базисе его матрица будет диагональной. Пусть матрица перехода от к , тогда .

Но матрица , как матрица перехода от одного ортонормированного базиса к другому, по теореме 2 §1.6 будет ортогональной, а значит, . Поэтому . А именно так преобразуется матрица квадратичной формы, подвергнутой линейному преобразованию неизвестных с матрицей .

Итак, преобразование неизвестных, имеющее матрицу ортогонально, а матрица , будучи диагональной, соответствует квадратичной форме канонического вида. □

Тот факт, что матрица линейного оператора в базисе, составленном из собственных векторов, имеет диагональный вид (с собственными значениями по главной диагонали) , даёт нам метод практического отыскания канонического вида квадратичной формы, а также самого этого ортогонального преобразования.

Пример 2. Найти ортогональное преобразование, приводящее квадратичную форму

к каноническому виду и написать этот канонический вид.

Решение . Матрица этой формы имеет вид

,

Найдём её характеристический многочлен:

.

Таким образом, матрица имеет двукратный корень и простой корень . Следовательно, канонический вид данной квадратичной формы будет

.

Найдём ортогональное преобразование, осуществляющее это приведение. Для этого найдём собственные векторы, соответствующие найденным собственным значениям , т. е. решим системы линейных однородных уравнений для каждого .

При имеем

.

Откуда , т. е. имеются 2 независимые переменные, и фундаментальный набор решений будет:

Применив к ним процесс ортогонализации, получим:

При имеем

.

Данная система эквивалентна следующей:

,

решением которой будет

- Линейная алгебра

Приведение квадратичной формы к главным осям

Ранее была рассмотрена задача приведения вещественной


q(x)= \sum_{n=1}^{n} \sum_{j=1}^{n} a_{ij}x_ix_j=x^TAx


n переменных к


\widetilde{q}(y)=\lambda_1y_1^2+ \lambda_2y_2^2+ \ldots+ \lambda_ny_n^2


при помощи невырожденной линейной замены переменных x=Sy . Для решения этой задачи использовался .


Рассмотрим другой подход к решению. Линейную невырожденную замену переменных x=Sy с ортогональной матрицей S~(S^{-1}=S^T) будем называть ортогональной заменой переменных (или ортогональным преобразованием переменных).


Сформулируем задачу приведения квадратичной формы к главным осям : требуется найти ортогональную замену переменных x=Sy (S^{-1}=S^T) , приводящую квадратичную форму (9.23) к каноническому виду (9.24).


Для решения используем следующий геометрический смысл задачи. Будем считать переменные x_1,x_2,\ldots,x_n координатами вектора \boldsymbol{x} n-мерного евклидова пространства \mathbb{E} в ортонормированном базисе (\boldsymbol{e})= (\boldsymbol{e}_1,\ldots,\boldsymbol{e}_n) , а матрицу A квадратичной формы (9.23) - матрицей некоторого линейного преобразования \mathcal{A}\colon \mathbb{E}\to \mathbb{E} в том же базисе. Причем это преобразование самосопряженное, так как его матрица симметрическая: A^T=A . Квадратичную форму (9.23) можно представить в виде скалярного произведения


q(\boldsymbol{x})= \bigl\langle \mathcal{A}(\boldsymbol{x}), \boldsymbol{x}\bigr\rangle= \bigl\langle \boldsymbol{x}, \mathcal{A}(\boldsymbol{x})\bigr\rangle.


Ортогональной замене переменных x=Sy соответствует переход от одного ортонормированного базиса к другому. Действительно, пусть S - матрица перехода от ортонормированного базиса (\boldsymbol{e}) к ортонормированному базису (\boldsymbol{s})= (\boldsymbol{s}_1,\ldots,\boldsymbol{s}_n) , т.е. (\boldsymbol{s})= (\boldsymbol{e})S и S^{-1}=S^T . Тогда координаты x вектора \boldsymbol{x} в базисе (\boldsymbol{e}) и координаты y того же вектора в базисе (\boldsymbol{s}) связаны формулой (8.11): x=Sy .


Таким образом, задача приведения квадратичной формы к главным осям может быть сформулирована так: требуется найти в пространстве \mathbb{E} такой базис, в котором матрица самосопряженного преобразования \mathcal{A} имеет диагональный вид. По теореме 9.10 нужно выбрать ортонормированный базис из собственных векторов самосопряженного преобразования. При этом матрица перехода S к каноническому базису оказывается ортогональной: S^T=S^{-1} .


Сформулируем этот результат для квадратичной формы.

Теорема (9.12) о приведении квадратичной формы к главным осям

Вещественная квадратичная форма (9.23) при помощи ортогонального преобразования переменных x=Sy может быть приведена к каноническому виду (9.24), где - собственные значения матрицы A .


Следствие. Квадратичная форма (9.23) является положительно определенной (неотрицательно определенной) тогда и только тогда, когда все собственные значения ее матрицы положительны (неотрицательны).


Замечания 9.10


1. При линейной невырожденной замене переменных матрица квадратичной формы изменяется по формуле (6.10): A"=S^TAS . Для ортогональной матрицы S эта формула принимает вид A"=S^{-1}AS , который совпадает с формулой (9.4) изменения матрицы линейного преобразования при замене базиса.


2. Для нахождения канонического вида (9.24) достаточно определить все корни \lambda_1, \lambda_2,\ldots,\lambda_m (среди которых могут быть равные) (уравнения) \det(A-\lambda E)=0 , где E - единичная матрица.


3. Следствие теоремы 9.12 можно использовать для анализа знакоопределенности квадратичной формы:


– если все собственные значения положительные (отрицательные), то квадратичная форма положительно (отрицательно) определенная;


– если все собственные значения неотрицательные (неположительные), то квадратичная форма неотрицательно (неположительно) определенная;


– если имеются собственные значения разных знаков, то квадратичная форма неопределенная (знакопеременная).


4. Результаты, сформулированные в пункте 3 замечаний, могут быть использованы для проверки достаточных и необходимых условий второго порядка в задаче поиска безусловного экстремума функций. Для этого следует найти собственные значения \lambda_1, \lambda_2,\ldots,\lambda_m \dfrac{d^2f(x)}{dx^Tdx} в каждой из стационарных точек x^{\ast} функции f(x)=f(x_1,\ldots,x_n) .


Если все собственные значения положительные: \lambda_i>0,~ i=1,\ldots,n , то в точке x^{\ast} локальный минимум;


– если все собственные значения отрицательные: \lambda_i<0,~ i=1,\ldots,n , то в точке x^{\ast} локальный максимум;


– если все собственные значения неотрицательные: \lambda_i\geqslant0,~ i=1,\ldots,n , то в точке x^{\ast} может быть локальный минимум;


– если все собственные значения неположительные: \lambda_i\leqslant0,~ i=1,\ldots,n , то в точке x^{\ast} может быть локальный максимум;


– если собственные значения \lambda_i,~ i=1,\ldots,n , разных знаков, то в точке x^{\ast} нет экстремума;


– если все собственные значения нулевые: \lambda_i=0,~ i=1,\ldots,n , то требуется дополнительное исследование.


5. Задача приведения квадратичной формы к главным осям решается при помощи алгоритма приведения самосопряженного преобразования к диагональному виду. При этом находится диагональный вид матрицы квадратичной формы и ортогональная матрица S замены переменных x=Sy , приводящей квадратичную форму к каноническому виду (к главным осям).

Пример 9.7. Выяснить знакоопределенность квадратичной формы трёх переменных


q(x)= x_1^2+2x_1x_2+2x_1x_3+x_2^2+2x_2x_3+x_3^2


и найти ортогональную замену переменных x=Sy , приводящую квадратичную форму к каноническому виду (к главным осям).

Решение. Составляем матрицу квадратичной формы: A=\begin{pmatrix} 1&1&1\\ 1&1&1\\ 1&1&1 \end{pmatrix} . В примере 9.6 были найдены собственные значения этой матрицы: \lambda_{1,2}=0, \lambda_3=3 . Все собственные значения неотрицательные, поэтому квадратичная форма является неотрицательно определенной (см. пункт 4 замечаний 9.10).


В была найдена ортогональная матрица


S=\begin{pmatrix} \dfrac{\sqrt{2}}{2}& \dfrac{\sqrt{6}}{6}& \dfrac{\sqrt{3}}{3}\\ 0&-\dfrac{\sqrt{6}}{3}& \dfrac{\sqrt{3}}{3}\\ -\dfrac{\sqrt{2}}{2}& \dfrac{\sqrt{6}}{6}& \dfrac{\sqrt{3}}{3} \end{pmatrix}\!,


приводящая матрицу A к диагональному виду \Lambda= \operatorname{diag} (0,0,3) . Записываем искомую ортогональную замену переменных x=Sy:


x_1= \frac{\sqrt{2}}{2}\,y_1+ \frac{\sqrt{6}}{6}\,y_2+ \frac{\sqrt{3}}{3}\,y_3;\quad x_2= -\frac{\sqrt{6}}{3}\,y_2+ \frac{\sqrt{3}}{3}\,y_3;\quad x_3= -\frac{\sqrt{2}}{2}\,y_1+ \frac{\sqrt{6}}{6}\,y_2+ \frac{\sqrt{3}}{3}\,y_3.


и квадратичную форму в каноническом виде: \widetilde{q}(y)= 3y_3^2 .

Пример 9.8. Найти точки локального экстремума функции двух переменных с помощью матриц


f(x)=3x_1^5+x_1^4-5x_1^3-2x_1^2x_2+x_2^2.


Решение. В пункте 1 найден градиент функции, а из необходимого условия экстремума первого порядка три стационарные точки:


x^0= \begin{pmatrix}0&0 \end{pmatrix}^T,\qquad x^1=\begin{pmatrix} 1&1 \end{pmatrix}^T,\qquad x^2=\begin{pmatrix} -1&1\end{pmatrix}^T.


Матрица Гессе имеет вид

\frac{df(x)}{dx^Tdx}= \begin{pmatrix} 60x_1^3+12x_1^2-30x_1-4x_2&-4x_1\\-4x_1&2 \end{pmatrix}\!.


Найдем собственные значения матрицы Гессе в каждой стационарной точке:


\frac{df(x^0)}{dx^Tdx}= \begin{pmatrix}0&0\\ 0&2 \end{pmatrix}\!;\quad \frac{df(x^1)}{dx^Tdx }= \begin{pmatrix}38&-4\\ -4&2 \end{pmatrix}\!,\quad \frac{df(x^2)}{dx^Tdx}= \begin{pmatrix} -22&4\\4&2\end{pmatrix}


и воспользуемся пунктом 4 замечаний 9.10.

В точке x^0=\begin{pmatrix}0\\0 \end{pmatrix} матрица Гессе имеет вид \begin{pmatrix} 0&0\\ 0&2\end{pmatrix} . Из уравнения \begin{vmatrix} -\lambda&0\\ 0&2-\lambda\end{vmatrix}=0 находим \lambda_1=0, \lambda_2=2 . Так как все собственные значения неотрицательные, то в точке x^0 может быть локальный минимум и для окончательного вывода требуется дополнительное исследование (см. пример 6.13).


В точке x^1=\begin{pmatrix}1\\1 \end{pmatrix} матрица Гессе имеет вид \begin{pmatrix} 38&-4\\ -4&2 \end{pmatrix} . Из уравнения \begin{vmatrix} 38-\lambda&-4\\ -4&2-\lambda\end{vmatrix}=0 , или \lambda^2-40 \lambda+60=0 получаем \lambda_{1,2}= 20\pm2\sqrt{85} . Поскольку все собственные значения положительные, то в точке x^1 локальный минимум функции.


В точке x^2=\begin{pmatrix}-1\\1 \end{pmatrix} матрица Гессе имеет вид \begin{pmatrix} -22&4\\ 4&2 \end{pmatrix} . Из уравнения \begin{vmatrix} -22-\lambda&4\\ 4&2-\lambda\end{vmatrix}=0 , или \lambda^2+40 \lambda-60=0 получаем \lambda_{1,2}=-10\pm4\sqrt{10} . Поскольку собственные значения имеют разные знаки, то в точке x^2 нет экстремума.

Рассмотрим произвольную вещественную квадратичную форму

Ее матрица коэффициентов является вещественной симметрической. Поэтому (см. гл. IX, § 13) она ортогонально-подобна некоторой вещественной диагональной матрице , т. е. существует такая вещественная ортогональная матрица , что

Здесь – характеристические числа матрицы .

Поскольку для ортогональной матрицы , то из (41) следует, что форма при ортогональном преобразовании переменных

или в более подробной записи

(42")

переходит в форму

. (43)

Теорема 7. Вещественная квадратичная форма всегда может быть приведена при помощи ортогонального преобразования к канонической форме (43); при этом – характеристические числа матрицы .

Приведение квадратичной формы при помощи ортогонального преобразования к канонической форме (43) называется приведением к главным осям. Это название связано с тем, что уравнение центральной гиперповерхности второго порядка,

, (44)

при ортогональном преобразовании переменных (42) принимает канонический вид

. (45)

Если мы будем рассматривать как координаты в некотором ортонормированном базисе -мерного евклидова пространства, то будут координатами в новом ортонормированном базисе того же пространства, причем «поворот» осей осуществляется ортогональным преобразованием (42). Новые оси координат являются осями симметрии центральной поверхности (44) и обычно называются главными осями этой поверхности.

Из формулы (43) следует, что ранг формы равен числу отличных от нуля характеристических чисел матрицы , а сигнатура равна разности между числом положительных и числом отрицательных характеристических чисел матрицы .

Отсюда, в частности, вытекает и такое предложение:

Если при непрерывном изменении коэффициентов квадратичной формы остается неизменным ее ранг, то при этом изменении коэффициентов остается неизменной и ее сигнатура.

При этом мы исходим из того, что непрерывное изменение коэффициентов влечет непрерывное изменение характеристических чисел. Сигнатура может измениться лишь тогда, когда какое-либо характеристическое число поменяет знак. Но тогда в какой-то промежуточный момент рассматриваемое характеристическое число обратится в нуль, что влечет изменение ранга формы.. (48)



Понравилась статья? Поделитесь с друзьями!