Asal eksenlere indirgeme teoremi. İkinci dereceden formu ana eksenlere indirgeme

Rastgele bir gerçek ikinci dereceden form düşünün

Katsayı matrisi gerçek simetriktir. Bu nedenle (bkz. Bölüm IX, § 13) bazı gerçek köşegen matrislere dik olarak benzerdir, yani şöyle bir gerçek dik matris vardır:

Burada matrisin karakteristik sayıları verilmiştir.

Çünkü için ortogonal matris, daha sonra (41)'den değişkenlerin ortogonal dönüşümü altındaki formun olduğu sonucu çıkar

veya daha fazlası detaylı kayıt

(42")

şekle girer

. (43)

Teorem 7. Gerçek ikinci dereceden form her zaman kullanılarak verilebilir ortogonal dönüşümİle kanonik form(43); bu durumda matrisin karakteristik sayılarıdır.

Dik bir dönüşüm kullanarak ikinci dereceden bir formun kanonik forma (43) indirgenmesine asal eksenlere indirgeme adı verilir. Bu isim, ikinci dereceden merkezi hiperyüzey denkleminin,

, (44)

değişkenlerin ortogonal dönüşümü ile (42) kanonik formu alır

. (45)

Bunları -boyutlu Öklid uzayının bazı ortonormal bazındaki koordinatlar olarak düşünürsek, o zaman aynı uzayın yeni bir ortonormal bazındaki koordinatlar olacaklardır ve eksenlerin "dönmesi" ortogonal dönüşümle gerçekleştirilir (42). Yeni koordinat eksenleri, merkezi yüzeyin (44) simetri eksenleridir ve genellikle bu yüzeyin ana eksenleri olarak adlandırılır.

Formül (43)'ten formun sıralaması şu şekildedir: sayıya eşit Matrisin sıfır olmayan karakteristik sayıları ve imzası, matrisin pozitif ve negatif karakteristik sayıları arasındaki farka eşittir.

Buradan özellikle aşağıdaki öneri ortaya çıkıyor:

İkinci dereceden bir formun katsayılarındaki sürekli bir değişiklikle sırası değişmeden kalırsa, katsayılardaki bu değişiklikle imzası da değişmeden kalır.

Bu durumda katsayılardaki sürekli bir değişimin karakteristik sayılarda sürekli bir değişime yol açtığı gerçeğinden yola çıkıyoruz. İmza yalnızca bazı karakteristik sayıların işareti değiştiğinde değişebilir. Ancak daha sonra ara bir anda söz konusu karakteristik sayı sıfıra gidecek ve bu da formun sıralamasında bir değişikliğe yol açacaktır. (48)

Önceki paragrafta ortaya konan ikinci dereceden bir formu kanonik forma indirgeme teorisi, ikinci dereceden merkezi eğrilerin geometrik teorisine benzetilerek oluşturulmuştur, ancak bu ikinci teorinin bir genellemesi olarak kabul edilemez. Aslında teorimizde, dejenere olmayan herhangi bir doğrusal dönüşümün kullanımına izin verilirken, ikinci dereceden bir eğrinin kanonik forma getirilmesi, doğrusal dönüşümlerin çok kullanılmasıyla elde edilir. özel tip(2), bunlar düzlemin dönüşleridir. Bu geometrik teori bununla birlikte, dönüşüm matrisinin dik olmasını gerektirerek, gerçek katsayılara sahip bilinmeyenlerdeki ikinci dereceden formlar durumuna genelleştirilebilir. Bu dönüşüme denir ortogonal ve prosedürün kendisi İkinci dereceden formları ana eksenlere indirgemek.

TEOREM. Her ikinci dereceden form, bazı dik dönüşümlerle kanonik forma indirgenebilir.

KANIT. İkinci dereceden formdaki bir matrise bazılarının matrisi olarak bakacağız. doğrusal operatörÖklid uzayında. Matris ikinci dereceden formdaysa, o zaman simetriktir. Eğer boyutlu Öklid uzayının bazı ortonormal temelleri varsa, matris bu temelde simetrik bir operatör tanımlar. Öklid uzayındaki simetrik operatörlerle ilgili ana teoreme göre, uygun bir ortonormal temelde matrisi köşegen olacaktır. Geçiş matrisinin 'den 'ye olmasına izin verin, o zaman.

Ancak matris, Teorem 2 §1.6'ya göre bir ortonormal tabandan diğerine geçiş matrisi olarak dik olacaktır ve bu nedenle . Bu yüzden . Yani ikinci dereceden bir formun matrisi bu şekilde dönüştürülür, matris ile bilinmeyenlerin doğrusal dönüşümüne tabi tutulur.

Dolayısıyla, bir matrise sahip bilinmeyenlerin dönüşümü diktir ve köşegen olan matris ikinci dereceden forma karşılık gelir. kanonik form. □

Gerçek şu ki, bir doğrusal operatörün matrisinin aşağıdakilerden oluştuğu özvektörler, köşegen bir forma sahiptir (ana köşegen boyunca özdeğerlerle birlikte), bize ikinci dereceden bir formun kanonik formunu ve bu ortogonal dönüşümün kendisini pratik olarak bulmak için bir yöntem sunar.

Örnek 2.İkinci dereceden formu azaltan dik bir dönüşüm bulun

kanonik görünüme geçin ve bu kanonik görünümü yazın.

Çözüm. Bu formun matrisi şu şekle sahiptir:

,

Hadi onu bulalım karakteristik polinom:

.

Bu nedenle matrisin bir çift kökü ve bir basit kökü vardır. Bu nedenle, bu ikinci dereceden formun kanonik formu şöyle olacaktır:

.

Bu indirgemeyi uygulayan dik bir dönüşüm bulalım. Bunu yapmak için bulunan özdeğerlere karşılık gelen özvektörleri buluyoruz yani doğrusal sistemleri çözüyoruz homojen denklemler herkes için.

elimizde olduğunda

.

Nerede yani 2 bağımsız değişken var ve temel kümeçözümler şöyle olacaktır:

Bunlara dikleştirme işlemini uygulayarak elde ederiz.

Önceki paragrafta ortaya konan ikinci dereceden bir formu kanonik forma indirgeme teorisi, ikinci dereceden merkezi eğrilerin geometrik teorisine benzetilerek oluşturulmuştur, ancak bu ikinci teorinin bir genellemesi olarak kabul edilemez. Aslında teorimizde, herhangi bir dejenere olmayan doğrusal dönüşümün kullanımına izin verilirken, ikinci dereceden bir eğrinin kanonik forma getirilmesi, düzlemin dönüşleri olan çok özel tipte (2) doğrusal dönüşümler kullanılarak elde edilir. . Bununla birlikte, bu geometrik teori, dönüşüm matrisinin dik olmasını gerektirerek gerçek katsayılı bilinmeyenlerdeki ikinci dereceden formlar durumuna genelleştirilebilir. Bu dönüşüme denir ortogonal ve prosedürün kendisi İkinci dereceden formları ana eksenlere indirgemek.

TEOREM. Her ikinci dereceden form, bazı dik dönüşümlerle kanonik forma indirgenebilir.

KANIT. İkinci dereceden formdaki bir matrise Öklid uzayındaki bazı doğrusal operatörlerin matrisi olarak bakacağız. Matris ikinci dereceden formdaysa, o zaman simetriktir. Eğer boyutlu Öklid uzayının bir ortonormal temeli varsa, matris bu temelde simetrik bir operatörü tanımlar. Öklid uzayındaki simetrik operatörlerle ilgili ana teoreme göre, uygun bir ortonormal temelde matrisi köşegen olacaktır. Geçiş matrisinin 'den 'ye olmasına izin verin, o zaman.

Ancak matris, Teorem 2 §1.6'ya göre bir ortonormal tabandan diğerine geçiş matrisi olarak dik olacaktır ve bu nedenle . Bu yüzden . Yani ikinci dereceden bir formun matrisi bu şekilde dönüştürülür, matris ile bilinmeyenlerin doğrusal dönüşümüne tabi tutulur.

Dolayısıyla, bir matrise sahip bilinmeyenlerin dönüşümü ortogonaldir ve köşegen olan matris, kanonik formun ikinci dereceden bir formuna karşılık gelir. □

Özvektörlerden oluşan bir temelde doğrusal bir operatörün matrisinin köşegen bir forma sahip olması (ana köşegen boyunca özdeğerlerle birlikte) bize ikinci dereceden formun kanonik formunun yanı sıra bu ortogonal dönüşümün pratik olarak bulunması için bir yöntem verir. kendisi.

Örnek 2.İkinci dereceden formu azaltan dik bir dönüşüm bulun

kanonik görünüme geçin ve bu kanonik görünümü yazın.

Çözüm. Bu formun matrisi şu şekle sahiptir:

,

Karakteristik polinomunu bulalım:

.

Bu nedenle matrisin bir çift kökü ve bir basit kökü vardır. Bu nedenle, bu ikinci dereceden formun kanonik formu şöyle olacaktır:

.

Bu indirgemeyi uygulayan dik bir dönüşüm bulalım. Bunu yapmak için bulunan özdeğerlere karşılık gelen özvektörleri buluyoruz yani her biri için doğrusal homojen denklem sistemlerini çözeceğiz.

elimizde olduğunda

.

Nerede yani 2 bağımsız değişken vardır ve temel çözüm kümesi şöyle olacaktır:

Dikleştirme işlemini bunlara uygulayarak şunu elde ederiz:

elimizde olduğunda

.

Bu sistem aşağıdakine eşdeğerdir:

,

kimin çözümü olacak

- Doğrusal cebir

İkinci dereceden formu ana eksenlere indirgeme

Daha önce gerçek değeri azaltma problemini ele almıştık.


q(x)= \sum_(n=1)^(n) \sum_(j=1)^(n) a_(ij)x_ix_j=x^TAx


n değişken


\widetilde(q)(y)=\lambda_1y_1^2+ \lambda_2y_2^2+ \ldots+ \lambda_ny_n^2


x=Sy değişkenlerinin dejenere olmayan doğrusal değişimini kullanarak. Bu sorunu çözmek için kullandık.


Çözüme başka bir yaklaşım düşünelim. S~(S^(-1)=S^T) ortogonal matrisiyle x=Sy değişkenlerinin doğrusal, dejenere olmayan değişimine, değişkenlerin ortogonal değişimi (veya değişkenlerin ortogonal dönüşümü) adı verilecektir.


Sorunu formüle edelim İkinci dereceden bir formu asal eksenlere indirgemek: x=Sy (S^(-1)=S^T) değişkenlerinin ortogonal değişimini bulmak ve ikinci dereceden formu (9.23) kanonik forma (9.24) getirmek gerekir.


Çözmek için aşağıdakileri kullanıyoruz geometrik anlamı görevler. Değişkenleri sayacağız x_1,x_2,\ldots,x_n n boyutlu Öklid uzayının \mathbb(E) vektörünün \boldsymbol(x) ortonormal bazdaki koordinatları (\boldsymbol(e))= (\boldsymbol(e)_1,\ldots,\boldsymbol(e)_n) ve ikinci dereceden formdaki A matrisi (9.23), bazılarının matrisidir. doğrusal dönüşüm \mathcal(A)\iki nokta üst üste \mathbb(E)\to \mathbb(E) aynı temelde. Üstelik bu dönüşüm kendine eşleniktir, çünkü matrisi simetriktir: A^T=A. İkinci dereceden form (9.23), skaler bir çarpım olarak temsil edilebilir


q(\boldsymbol(x))= \bigl\langle \mathcal(A)(\boldsymbol(x)), \boldsymbol(x)\bigr\rangle= \bigl\langle \boldsymbol(x), \mathcal(A) )(\boldsymbol(x))\bigr\rangle.


x=Sy değişkenlerinin ortogonal değişimi, bir ortonormal tabandan diğerine geçişe karşılık gelir. Aslında, S'nin ortonormal tabandan (\boldsymbol(e)) ortonormal tabana geçiş matrisi olmasına izin verin. (\boldsymbol(s))= (\boldsymbol(s)_1,\ldots,\boldsymbol(s)_n) yani (\boldsymbol(s))= (\boldsymbol(e))S ve S^(-1)=S^T . Daha sonra \boldsymbol(x) vektörünün (\boldsymbol(e)) tabanındaki x koordinatları ve aynı vektörün (\boldsymbol(s)) tabanındaki y koordinatları formül (8.11) ile ilişkilendirilir: x= Sy.


Böylece, ikinci dereceden bir formu asal eksenlere indirgeme problemi şu şekilde formüle edilebilir: \mathbb(E) uzayında kendine eşlenik dönüşüm matrisinin \mathcal(A) köşegenine sahip olduğu bir taban bulmak gerekir. biçim. Teorem 9.10'a göre, kendine eşlenik dönüşümün özvektörlerinden bir ortonormal taban seçmek gereklidir. Bu durumda, S kanonik tabana geçiş matrisinin dik olduğu ortaya çıkar: S^T=S^(-1) .


Bu sonucu ikinci dereceden form için formüle edelim.

İkinci dereceden formun asal eksenlere indirgenmesine ilişkin Teorem (9.12)

Gerçek ikinci dereceden form (9.23), x=Sy değişkenlerinin ortogonal dönüşümü kullanılarak kanonik forma (9.24) indirgenebilir; burada - özdeğerler matrisler A.


Sonuçlar. İkinci dereceden form (9.23), ancak ve ancak matrisinin tüm özdeğerlerinin pozitif (negatif olmayan) olması durumunda pozitif tanımlıdır (negatif olmayan tanımlıdır).


Notlar 9.10


1. Doğrusal, dejenere olmayan bir değişimle değişken matrisİkinci dereceden form, formül (6.10)'a göre değişir: A"=S^TAS. Dik bir S matrisi için bu formül A"=S^(-1)AS formunu alır ve bu, doğrusalın değiştirilmesi için formül (9.4) ile örtüşür. temeli değiştirirken dönüşüm matrisi.


2. Kanonik formu (9.24) bulmak için tüm kökleri belirlemek yeterlidir. \lambda_1, \lambda_2,\ldots,\lambda_m(aralarında eşit olanlar olabilir) (denklemler) \det(A-\lambda E)=0 burada E birim matristir.


3. Teorem 9.12'nin sonucu ikinci dereceden bir formun işaretini analiz etmek için kullanılabilir:


– eğer tüm özdeğerler pozitif (negatif) ise, o zaman ikinci dereceden form pozitif (negatif) kesindir;


– eğer tüm özdeğerler negatif değilse (pozitif değilse), o zaman ikinci dereceden form negatif değildir (pozitif değildir);


– farklı işaretlerin özdeğerleri varsa, ikinci dereceden form belirsizdir (alternatif).


4. Yorumların 3. paragrafında formüle edilen sonuçlar, yeterli ve uygun olanı doğrulamak için kullanılabilir. gerekli koşullar Fonksiyonların koşulsuz ekstremumunu arama probleminde ikinci dereceden. Bunu yapmak için özdeğerleri bulmanız gerekir. \lambda_1, \lambda_2,\ldots,\lambda_m \dfrac(d^2f(x))(dx^Tdx) her birinde sabit noktalar x^(\ast) işlevleri f(x)=f(x_1,\ldots,x_n).


Tüm özdeğerler pozitifse: \lambda_i>0,~ i=1,\ldots,n, sonra x^(\ast) noktasında yerel minimum;


– eğer tüm özdeğerler negatifse: \lambda_i<0,~ i=1,\ldots,n ise x^(\ast) noktasında yerel bir maksimum vardır;


– eğer tüm özdeğerler negatif değilse: \lambda_i\geqslant0,~ i=1,\ldots,n ise x^(\ast) noktasında yerel bir minimum olabilir;


– eğer tüm özdeğerler pozitif değilse: \lambda_i\leqslant0,~ i=1,\ldots,n ise x^(\ast) noktasında yerel bir maksimum olabilir;


– eğer özdeğerler \lambda_i,~ i=1,\ldots,n, farklı işaretler varsa x^(\ast) noktasında ekstremum yoktur;


– eğer tüm özdeğerler sıfır ise: \lambda_i=0,~ i=1,\ldots,n, o zaman ek araştırma gereklidir.


5. İkinci dereceden bir formu ana eksenlere indirgeme sorunu, kendine eşlenik bir dönüşümü köşegen bir forma indirgemeye yönelik bir algoritma kullanılarak çözülür. Bu durumda, ikinci dereceden formun matrisinin köşegen formu ve x=Sy değişkenlerinin değişiminin ortogonal matrisi S bulunur ve ikinci dereceden formu kanonik forma (ana eksenlere) getirir.

Örnek 9.7.Üç değişkenin ikinci dereceden formunun işaretini belirleyin


q(x)= x_1^2+2x_1x_2+2x_1x_3+x_2^2+2x_2x_3+x_3^2


ve ikinci dereceden formu kanonik forma (ana eksenlere) getiren x=Sy değişkenlerinin ortogonal değişimini bulun.

Çözüm.İkinci dereceden formda bir matris oluşturuyoruz: A=\begin(pmatrix) 1&1&1\\ 1&1&1\\ 1&1&1 \end(pmatrix). Örnek 9.6'da bu matrisin özdeğerleri bulunmuştur: \lambda_(1,2)=0, \lambda_3=3. Tüm özdeğerler negatif değildir, dolayısıyla ikinci dereceden form negatif olmayan kesindir (bkz. Açıklamalar 9.10'un 4. maddesi).


Dik bir matris bulundu


S=\begin(pmatrix) \dfrac(\sqrt(2))(2)& \dfrac(\sqrt(6))(6)& \dfrac(\sqrt(3))(3)\\ 0&-\ dfrac(\sqrt(6))(3)& \dfrac(\sqrt(3))(3)\\ -\dfrac(\sqrt(2))(2)& \dfrac(\sqrt(6))( 6)& \dfrac(\sqrt(3))(3) \end(pmatrix)\!,


A matrisini köşegen forma indirgemek \Lambda= \operatöradı(diag) (0,0,3). x=Sy değişkenlerinin gerekli ortogonal değişimini yazıyoruz:


x_1= \frac(\sqrt(2))(2)\,y_1+ \frac(\sqrt(6))(6)\,y_2+ \frac(\sqrt(3))(3)\,y_3;\quad x_2= -\frac(\sqrt(6))(3)\,y_2+ \frac(\sqrt(3))(3)\,y_3;\quad x_3= -\frac(\sqrt(2))(2 )\,y_1+ \frac(\sqrt(6))(6)\,y_2+ \frac(\sqrt(3))(3)\,y_3.


ve kanonik formdaki ikinci dereceden form: \widetilde(q)(y)= 3y_3^2.

Örnek 9.8. Matrisleri kullanarak iki değişkenli bir fonksiyonun yerel ekstremum noktalarını bulun


f(x)=3x_1^5+x_1^4-5x_1^3-2x_1^2x_2+x_2^2.


Çözüm. 1. adımda, fonksiyonun gradyanı bulundu ve birinci dereceden bir ekstremum için gerekli koşuldan üç sabit nokta bulundu:


x^0= \begin(pmatrix)0&0 \end(pmatrix)^T,\qquad x^1=\begin(pmatrix) 1&1 \end(pmatrix)^T,\qquad x^2=\begin(pmatrix) - 1&1\son(pmatrix)^T.


Hessian matrisi şu şekle sahiptir:

\frac(df(x))(dx^Tdx)= \begin(pmatrix) 60x_1^3+12x_1^2-30x_1-4x_2&-4x_1\\-4x_1&2 \end(pmatrix)\!.


Her durağan noktada Hessian matrisinin özdeğerlerini bulalım:


\frac(df(x^0))(dx^Tdx)= \begin(pmatrix)0&0\\ 0&2 \end(pmatrix)\!;\quad \frac(df(x^1))(dx^Tdx ) = \begin(pmatrix)38&-4\\ -4&2 \end(pmatrix)\!,\quad \frac(df(x^2))(dx^Tdx)= \begin(pmatrix) -22&4\\4&2\ son(pmatris)


ve 9.10 yorumlarının 4. paragrafını kullanın.

bu noktada x^0=\begin(pmatrix)0\\0 \end(pmatrix) Hessian matrisi şu forma sahiptir: \begin(pmatrix) 0&0\\ 0&2\end(pmatrix). Denklemden. \begin(vmatrix) -\lambda&0\\ 0&2-\lambda\end(vmatrix)=0\lambda_1=0, \lambda_2=2'yi buluyoruz. Tüm özdeğerler negatif olmadığından, x^0 noktasında yerel bir minimum olabilir ve nihai bir sonuca varmak için ek araştırmalar yapılması gerekir (bkz. örnek 6.13).


bu noktada x^1=\begin(pmatrix)1\\1 \end(pmatrix) Hessian matrisi şu forma sahiptir: \begin(pmatrix) 38&-4\\ -4&2 \end(pmatrix). Denklemden. \begin(vmatrix) 38-\lambda&-4\\ -4&2-\lambda\end(vmatrix)=0, veya \lambda^2-40 \lambda+60=0 aldık \lambda_(1,2)= 20\pm2\sqrt(85). Tüm özdeğerler pozitif olduğundan, x^1 noktasında fonksiyonun yerel minimumu vardır.


bu noktada x^2=\begin(pmatrix)-1\\1 \end(pmatrix) Hessian matrisi şu forma sahiptir: \begin(pmatrix) -22&4\\ 4&2 \end(pmatrix). Denklemden. \begin(vmatrix) -22-\lambda&4\\ 4&2-\lambda\end(vmatrix)=0, veya \lambda^2+40 \lambda-60=0 aldık \lambda_(1,2)=-10\pm4\sqrt(10). Özdeğerlerin işaretleri farklı olduğundan x^2 noktasında ekstremum yoktur.



Makaleyi beğendin mi? Arkadaşlarınızla paylaşın!