Teorema pengurangan sumbu utama. Mengurangi bentuk kuadrat menjadi sumbu utama

Pertimbangkan bentuk kuadrat nyata yang berubah-ubah

Matriks koefisiennya benar-benar simetris. Oleh karena itu (lihat Bab IX, § 13) secara ortogonal mirip dengan beberapa matriks diagonal nyata, yaitu ada matriks ortogonal nyata sedemikian rupa sehingga

Berikut adalah bilangan karakteristik matriks tersebut.

Karena untuk matriks ortogonal, maka dari (41) diperoleh bentuk transformasi ortogonal variabel

atau lebih catatan rinci

(42")

menjadi bentuk

. (43)

Teorema 7. Nyata bentuk kuadrat selalu dapat diberikan menggunakan transformasi ortogonal Ke bentuk kanonik(43); dalam hal ini adalah bilangan karakteristik matriks.

Reduksi suatu bentuk kuadrat menjadi bentuk kanonik (43) dengan menggunakan transformasi ortogonal disebut reduksi ke sumbu utama. Nama ini disebabkan oleh fakta bahwa persamaan permukaan hiper pusat orde kedua,

, (44)

dengan transformasi variabel ortogonal (42) mengambil bentuk kanonik

. (45)

Jika kita menganggapnya sebagai koordinat dalam beberapa basis ortonormal dari ruang Euclidean -dimensi, maka koordinat tersebut akan menjadi koordinat dalam basis ortonormal baru dari ruang yang sama, dan “rotasi” sumbu dilakukan dengan transformasi ortogonal (42). Sumbu koordinat baru merupakan sumbu simetri permukaan pusat (44) dan biasa disebut sumbu utama permukaan tersebut.

Dari rumus (43) diperoleh pangkat dari bentuk sama dengan nomornya bilangan karakteristik matriks yang bukan nol, dan tanda tangannya sama dengan selisih antara bilangan karakteristik positif dan bilangan karakteristik negatif matriks.

Oleh karena itu, khususnya, usulan berikut berikut:

Jika, dengan perubahan terus-menerus pada koefisien-koefisien bentuk kuadrat, pangkatnya tetap tidak berubah, maka dengan perubahan koefisien-koefisien ini, tanda tangannya juga tetap tidak berubah.

Dalam hal ini, kita berasumsi bahwa perubahan koefisien yang terus-menerus menyebabkan perubahan bilangan karakteristik yang terus-menerus. Tanda tangan hanya dapat berubah bila suatu bilangan karakteristik berubah tandanya. Tetapi kemudian pada saat tertentu, bilangan karakteristik yang dimaksud akan menjadi nol, yang menyebabkan perubahan pangkat bentuk.. (48)

Teori mereduksi bentuk kuadrat menjadi bentuk kanonik, yang dikemukakan pada paragraf sebelumnya, dibangun dengan analogi dengan teori geometri kurva pusat orde kedua, tetapi tidak dapat dianggap sebagai generalisasi dari teori terakhir ini. Faktanya, dalam teori kami, penggunaan transformasi linier apa pun yang tidak merosot diperbolehkan, sementara membawa kurva orde kedua ke bentuk kanonik dicapai dengan menggunakan transformasi linier yang sangat tipe khusus(2), yang merupakan rotasi bidang. Ini teori geometri Namun, dapat digeneralisasikan ke kasus bentuk kuadrat yang tidak diketahui dengan koefisien nyata dengan mensyaratkan matriks transformasinya ortogonal. Transformasi ini disebut ortogonal, dan prosedur itu sendiri mereduksi bentuk kuadrat ke sumbu utama.

DALIL. Setiap bentuk kuadrat dapat direduksi menjadi bentuk kanonik melalui beberapa transformasi ortogonal.

BUKTI. Kita akan melihat matriks berbentuk kuadrat sebagai matriks dari beberapa operator linier di ruang Euclidean. Jika matriksnya berbentuk kuadrat, maka matriks tersebut berordo simetris. Jika beberapa basis ortonormal dari dimensi ruang Euclidean, maka matriks tersebut mendefinisikan operator simetris dalam basis ini. Berdasarkan teorema utama tentang operator simetris dalam ruang Euclidean, dalam basis ortonormal yang sesuai, matriksnya akan berbentuk diagonal. Misalkan matriks transisi dari ke , maka .

Tetapi matriks , sebagai matriks transisi dari satu basis ortonormal ke basis ortonormal lainnya, menurut Teorema 2 §1.6 akan menjadi ortogonal, dan oleh karena itu . Itu sebabnya. Yaitu, bagaimana suatu matriks berbentuk kuadrat ditransformasikan, yang mengalami transformasi linier yang tidak diketahui dengan matriks tersebut.

Jadi, transformasi bilangan tak diketahui yang memiliki matriks adalah ortogonal, dan matriksnya, karena diagonal, sesuai dengan bentuk kuadrat bentuk kanonik. □

Fakta bahwa matriks operator linier dalam suatu basis terdiri dari vektor eigen, memiliki bentuk diagonal (dengan nilai eigen di sepanjang diagonal utama), memberi kita metode untuk secara praktis menemukan bentuk kanonik dari bentuk kuadrat, serta transformasi ortogonal itu sendiri.

Contoh 2. Temukan transformasi ortogonal yang mereduksi bentuk kuadrat

ke tampilan kanonik dan tuliskan pandangan kanonik ini.

Larutan. Matriks bentuk ini mempunyai bentuk

,

Mari kita temukan dia polinomial karakteristik:

.

Jadi, matriks tersebut mempunyai akar ganda dan akar sederhana. Oleh karena itu, bentuk kanonik dari bentuk kuadrat ini adalah

.

Mari kita cari transformasi ortogonal yang mengimplementasikan reduksi ini. Untuk melakukan ini, kami menemukan vektor eigen yang sesuai dengan nilai eigen yang ditemukan , yaitu, kita memecahkan sistem linier persamaan homogen untuk semua orang.

Ketika kita punya

.

Di mana , yaitu ada 2 variabel bebas, dan himpunan mendasar solusinya adalah:

Dengan menerapkan proses ortogonalisasi pada mereka, kita peroleh.

Teori mereduksi bentuk kuadrat menjadi bentuk kanonik, yang dikemukakan pada paragraf sebelumnya, dibangun dengan analogi dengan teori geometri kurva pusat orde kedua, tetapi tidak dapat dianggap sebagai generalisasi dari teori terakhir ini. Faktanya, teori kami mengizinkan penggunaan transformasi linier apa pun yang tidak merosot, sementara membawa kurva orde kedua ke bentuk kanoniknya dicapai dengan menggunakan transformasi linier dari tipe yang sangat khusus (2), yaitu rotasi bidang. Namun, teori geometri ini dapat digeneralisasikan ke kasus bentuk kuadrat yang tidak diketahui dengan koefisien nyata dengan mensyaratkan matriks transformasinya ortogonal. Transformasi ini disebut ortogonal, dan prosedur itu sendiri mereduksi bentuk kuadrat ke sumbu utama.

DALIL. Setiap bentuk kuadrat dapat direduksi menjadi bentuk kanonik melalui beberapa transformasi ortogonal.

BUKTI. Kita akan melihat matriks berbentuk kuadrat sebagai matriks dari beberapa operator linier dalam ruang Euclidean. Jika matriksnya berbentuk kuadrat, maka matriks tersebut berordo simetris. Jika beberapa basis ortonormal dari dimensi ruang Euclidean, maka matriks tersebut mendefinisikan operator simetris dalam basis ini. Berdasarkan teorema utama tentang operator simetris dalam ruang Euclidean, dalam basis ortonormal yang sesuai, matriksnya akan berbentuk diagonal. Misalkan matriks transisi dari ke , maka .

Tetapi matriks , sebagai matriks transisi dari satu basis ortonormal ke basis ortonormal lainnya, menurut Teorema 2 §1.6 akan menjadi ortogonal, dan oleh karena itu . Itu sebabnya. Yaitu, bagaimana suatu matriks berbentuk kuadrat ditransformasikan, yang mengalami transformasi linier yang tidak diketahui dengan matriks tersebut.

Jadi, transformasi bilangan tak diketahui yang memiliki matriks bersifat ortogonal, dan matriks tersebut, karena diagonal, sesuai dengan bentuk kuadrat dari bentuk kanonik. □

Fakta bahwa matriks operator linier dalam basis yang terdiri dari vektor eigen memiliki bentuk diagonal (dengan nilai eigen sepanjang diagonal utama) memberi kita metode untuk secara praktis menemukan bentuk kanonik dari bentuk kuadrat, serta transformasi ortogonal ini diri.

Contoh 2. Temukan transformasi ortogonal yang mereduksi bentuk kuadrat

ke tampilan kanonik dan tuliskan pandangan kanonik ini.

Larutan. Matriks bentuk ini mempunyai bentuk

,

Mari kita cari polinomial karakteristiknya:

.

Jadi, matriks tersebut mempunyai akar ganda dan akar sederhana. Oleh karena itu, bentuk kanonik dari bentuk kuadrat ini adalah

.

Mari kita cari transformasi ortogonal yang mengimplementasikan reduksi ini. Untuk melakukan ini, kami menemukan vektor eigen yang sesuai dengan nilai eigen yang ditemukan , yaitu, kita akan menyelesaikan sistem persamaan linier homogen untuk masing-masing .

Ketika kita punya

.

Di mana , yaitu ada 2 variabel independen, dan himpunan solusi fundamentalnya adalah:

Dengan menerapkan proses ortogonalisasi pada mereka, kita memperoleh:

Ketika kita punya

.

Sistem ini setara dengan berikut ini:

,

solusinya akan menjadi siapa

- Aljabar linier

Mengurangi bentuk kuadrat menjadi sumbu utama

Sebelumnya, kami mempertimbangkan masalah pengurangan yang nyata


q(x)= \jumlah_(n=1)^(n) \jumlah_(j=1)^(n) a_(ij)x_ix_j=x^TAx


n variabel ke


\widetilde(q)(y)=\lambda_1y_1^2+ \lambda_2y_2^2+ \ldots+ \lambda_ny_n^2


menggunakan perubahan variabel linier non-degenerasi x=Sy. Untuk mengatasi masalah ini kami menggunakan .


Mari kita pertimbangkan pendekatan lain untuk solusinya. Perubahan variabel linier non-degenerasi x=Sy dengan matriks ortogonal S~(S^(-1)=S^T) disebut perubahan variabel ortogonal (atau transformasi variabel ortogonal).


Mari kita rumuskan masalahnya mereduksi bentuk kuadrat ke sumbu utama: diperlukan untuk mencari perubahan ortogonal variabel x=Sy (S^(-1)=S^T), sehingga bentuk kuadrat (9.23) menjadi bentuk kanonik (9.24).


Untuk menyelesaikannya kami menggunakan yang berikut ini makna geometris tugas. Kami akan menghitung variabelnya x_1,x_2,\ltitik,x_n koordinat vektor \boldsymbol(x) dari ruang Euclidean berdimensi n \mathbb(E) dalam basis ortonormal (\boldsymbol(e))= (\boldsymbol(e)_1,\ldots,\boldsymbol(e)_n), dan matriks A berbentuk kuadrat (9.23) adalah matriks dari beberapa transformasi linier \mathcal(A)\titik dua \mathbb(E)\ke \mathbb(E) atas dasar yang sama. Selain itu, transformasi ini bersifat self-adjoint, karena matriksnya simetris: A^T=A. Bentuk kuadrat (9.23) dapat direpresentasikan sebagai produk skalar


q(\boldsymbol(x))= \bigl\langle \mathcal(A)(\boldsymbol(x)), \boldsymbol(x)\bigr\rangle= \bigl\langle \boldsymbol(x), \mathcal(A )(\boldsymbol(x))\bigr\rangle.


Perubahan ortogonal variabel x=Sy berhubungan dengan transisi dari satu basis ortonormal ke basis ortonormal lainnya. Misalkan S adalah matriks transisi dari basis ortonormal (\boldsymbol(e)) ke basis ortonormal (\boldsymbol(s))= (\boldsymbol(s)_1,\ldots,\boldsymbol(s)_n), yaitu. (\boldsymbol(s))= (\boldsymbol(e))S dan S^(-1)=S^T . Maka koordinat x dari vektor \boldsymbol(x) pada basis (\boldsymbol(e)) dan koordinat y dari vektor yang sama pada basis (\boldsymbol(s)) dihubungkan dengan rumus (8.11): x= Sy.


Dengan demikian, permasalahan mereduksi suatu bentuk kuadrat ke sumbu-sumbu utama dapat dirumuskan sebagai berikut: dicari suatu basis dalam ruang \mathbb(E) yang matriks transformasi adjoint-dirinya \mathcal(A) mempunyai diagonal membentuk. Menurut Teorema 9.10, perlu untuk memilih basis ortonormal dari vektor eigen transformasi self-adjoint. Dalam hal ini, matriks transisi S ke basis kanonik ternyata ortogonal: S^T=S^(-1) .


Mari kita rumuskan hasil ini untuk bentuk kuadrat.

Teorema (9.12) tentang mereduksi bentuk kuadrat ke sumbu utama

Bentuk kuadrat riil (9.23) dapat direduksi menjadi bentuk kanonik (9.24) menggunakan transformasi ortogonal dari variabel x=Sy, dimana - nilai eigen matriks A.


Konsekuensi. Bentuk kuadrat (9.23) adalah pasti positif (pasti non-negatif) jika dan hanya jika semua nilai eigen matriksnya positif (non-negatif).


Catatan 9.10


1. Dengan penggantian linier yang tidak merosot matriks variabel perubahan bentuk kuadrat menurut rumus (6.10): A"=S^TAS. Untuk matriks ortogonal S, rumus ini berbentuk A"=S^(-1)AS, yang bertepatan dengan rumus (9.4) untuk mengubah linier matriks transformasi ketika mengubah basis.


2. Untuk mencari bentuk kanonik (9.24) cukup dengan menentukan semua akarnya \lambda_1, \lambda_2,\ltitik,\lambda_m(diantaranya mungkin ada yang setara) (persamaan) \det(A-\lambda E)=0, dimana E adalah matriks identitas.


3. Akibat wajar dari Teorema 9.12 dapat digunakan untuk menganalisis tanda bentuk kuadrat:


– jika semua nilai eigennya positif (negatif), maka bentuk kuadratnya pasti positif (negatif);


– jika semua nilai eigennya non-negatif (non-positif), maka bentuk kuadratnya adalah pasti non-negatif (non-positif);


– jika terdapat nilai eigen yang tandanya berbeda, maka bentuk kuadratnya tidak tentu (bergantian).


4. Hasil yang dirumuskan dalam paragraf 3 komentar dapat digunakan untuk memverifikasi kecukupan dan kondisi yang diperlukan urutan kedua dalam masalah mencari fungsi ekstrem tanpa syarat. Untuk melakukan ini, Anda perlu mencari nilai eigen \lambda_1, \lambda_2,\ltitik,\lambda_m \dfrac(d^2f(x))(dx^Tdx) di masing-masing titik stasioner x^(\ast) fungsi f(x)=f(x_1,\ltitik,x_n).


Jika semua nilai eigen positif: \lambda_i>0,~ i=1,\ltitik,n, lalu di titik x^(\ast) minimum lokal;


– jika semua nilai eigen negatif: \lambda_i<0,~ i=1,\ldots,n , maka pada titik x^(\ast) terdapat maksimum lokal;


– jika semua nilai eigen bukan negatif: \lambda_i\geqslant0,~ i=1,\ltitik,n, maka pada titik x^(\ast) mungkin terdapat minimum lokal;


– jika semua nilai eigen tidak positif: \lambda_i\leqslant0,~ i=1,\ltitik,n, maka pada titik x^(\ast) mungkin terdapat maksimum lokal;


– jika nilai eigen \lambda_i,~ i=1,\ltitik,n, tandanya berbeda, maka tidak ada titik ekstrem di titik x^(\ast);


– jika semua nilai eigen adalah nol: \lambda_i=0,~ i=1,\ltitik,n, maka diperlukan penelitian tambahan.


5. Masalah mereduksi bentuk kuadrat ke sumbu utama diselesaikan dengan menggunakan algoritma untuk mereduksi transformasi self-adjoint ke bentuk diagonal. Dalam hal ini, ditemukan bentuk diagonal dari matriks berbentuk kuadrat dan matriks ortogonal S dari perubahan variabel x=Sy, sehingga membawa bentuk kuadrat ke bentuk kanonik (ke sumbu utama).

Contoh 9.7. Tentukan tanda bentuk kuadrat tiga variabel


q(x)= x_1^2+2x_1x_2+2x_1x_3+x_2^2+2x_2x_3+x_3^2


dan temukan perubahan ortogonal variabel x=Sy, sehingga bentuk kuadrat menjadi bentuk kanonik (ke sumbu utama).

Larutan. Kami membuat matriks bentuk kuadrat: A=\begin(pmatrix) 1&1&1\\ 1&1&1\\ 1&1&1 \end(pmatrix). Pada Contoh 9.6, nilai eigen matriks ini ditemukan: \lambda_(1,2)=0, \lambda_3=3. Semua nilai eigennya adalah non-negatif, sehingga bentuk kuadratnya adalah pasti non-negatif (lihat poin 4 pada Keterangan 9.10).


Matriks ortogonal ditemukan


S=\begin(pmatrix) \dfrac(\sqrt(2))(2)& \dfrac(\sqrt(6))(6)& \dfrac(\sqrt(3))(3)\\ 0&-\ dfrac(\sqrt(6))(3)& \dfrac(\sqrt(3))(3)\\ -\dfrac(\sqrt(2))(2)& \dfrac(\sqrt(6))( 6)& \dfrac(\sqrt(3))(3) \end(pmatrix)\!,


mereduksi matriks A menjadi bentuk diagonal \Lambda= \nama operator(diag) (0,0,3). Kami menuliskan perubahan ortogonal yang diperlukan dari variabel x=Sy:


x_1= \frac(\sqrt(2))(2)\,y_1+ \frac(\sqrt(6))(6)\,y_2+ \frac(\sqrt(3))(3)\,y_3;\quad x_2= -\frac(\sqrt(6))(3)\,y_2+ \frac(\sqrt(3))(3)\,y_3;\quad x_3= -\frac(\sqrt(2))(2 )\,y_1+ \frac(\sqrt(6))(6)\,y_2+ \frac(\sqrt(3))(3)\,y_3.


dan bentuk kuadrat dalam bentuk kanonik: \luastilde(q)(y)= 3y_3^2.

Contoh 9.8. Temukan titik ekstrem lokal dari fungsi dua variabel menggunakan matriks


f(x)=3x_1^5+x_1^4-5x_1^3-2x_1^2x_2+x_2^2.


Larutan. Pada langkah 1, gradien fungsi ditemukan, dan dari kondisi yang diperlukan untuk ekstrem orde pertama, tiga titik stasioner:


x^0= \begin(pmatrix)0&0 \end(pmatrix)^T,\qquad x^1=\begin(pmatrix) 1&1 \end(pmatrix)^T,\qquad x^2=\begin(pmatrix) - 1&1\akhir(pmatriks)^T.


Matriks Hessian mempunyai bentuk

\frac(df(x))(dx^Tdx)= \begin(pmatrix) 60x_1^3+12x_1^2-30x_1-4x_2&-4x_1\\-4x_1&2 \end(pmatrix)\!.


Mari kita cari nilai eigen matriks Hessian pada setiap titik stasioner:


\frac(df(x^0))(dx^Tdx)= \begin(pmatrix)0&0\\ 0&2 \end(pmatrix)\!;\quad \frac(df(x^1))(dx^Tdx ) = \begin(pmatrix)38&-4\\ -4&2 \end(pmatrix)\!,\quad \frac(df(x^2))(dx^Tdx)= \begin(pmatrix) -22&4\\4&2\ akhir (matriks p)


dan gunakan paragraf 4 dari komentar 9.10.

Pada intinya x^0=\begin(pmatrix)0\\0 \end(pmatrix) matriks Hessian mempunyai bentuk \begin(pmatrix) 0&0\\ 0&2\end(pmatrix). Dari Persamaan. \begin(vmatrix) -\lambda&0\\ 0&2-\lambda\end(vmatrix)=0 kita menemukan \lambda_1=0, \lambda_2=2 . Karena semua nilai eigen adalah non-negatif, mungkin terdapat minimum lokal di titik x^0 dan diperlukan penelitian tambahan untuk mendapatkan kesimpulan akhir (lihat contoh 6.13).


Pada intinya x^1=\begin(pmatrix)1\\1 \end(pmatrix) matriks Hessian mempunyai bentuk \begin(pmatrix) 38&-4\\ -4&2 \end(pmatrix). Dari Persamaan. \begin(vmatrix) 38-\lambda&-4\\ -4&2-\lambda\end(vmatrix)=0, atau \lambda^2-40 \lambda+60=0 kita dapatkan \lambda_(1,2)= 20\pm2\sqrt(85). Karena semua nilai eigen positif, maka pada titik x^1 terdapat minimum lokal dari fungsi tersebut.


Pada intinya x^2=\begin(pmatrix)-1\\1 \end(pmatrix) matriks Hessian mempunyai bentuk \begin(pmatrix) -22&4\\ 4&2 \end(pmatrix). Dari Persamaan. \begin(vmatrix) -22-\lambda&4\\ 4&2-\lambda\end(vmatrix)=0, atau \lambda^2+40 \lambda-60=0 kita dapatkan \lambda_(1,2)=-10\pm4\sqrt(10). Karena nilai eigen memiliki tanda yang berbeda, maka tidak ada titik ekstrem di titik x^2.



Apakah Anda menyukai artikelnya? Bagikan dengan teman Anda!