Optimalus Kalman-Bucy filtras. Optimalus linijinis dinaminis filtravimas

Šiame skyriuje apžvelgsime diskrečią linijinio nešališko algoritmo formą, kuri suteikia mažiausią vidutinę kvadratinę paklaidą, darant prielaidą, kad pranešimo modelis pateikiamas linijine vektorių skirtumo lygtimi.

kur įvesties triukšmas (arba objekto triukšmas) yra baltas triukšmas su nuliniu vidurkiu ir kovariacijos matrica

Stebėjimo arba matavimo modelis pateikiamas tiesiniu algebriniu ryšiu

. (7.3)

kur matavimo triukšmas v yra nulinis vidutinis baltasis triukšmas ir

. (7.4)

Pradinių skaičiavimų paprastumo sumetimais darome prielaidą, kad ir yra nekoreliuojami, t.y.

Visiems (7,5)

Kitaip tariant, sėkla reiškia atsitiktinį kintamąjį su vidurkiu ir dispersija

; . (7.6)

Taip pat manysime, kad tai visiems.

Raskime vertės įvertinimą, pagrįstą nuoseklių stebėjimų rinkiniu. Šį įvertį pažymėkime , o įvertinimo paklaidą -

Priklausomai nuo santykio tarp dydžių ir įvertinimas vadinamas numatymu arba ekstrapoliacija, filtravimu arba išlyginimu ir galiausiai interpoliacija. Toks skirstymas intuityviai suprantamas, nes, pavyzdžiui, numatymas reiškia įvertinimą valstija momentu, remiantis visais stebėjimais iki 2-ojo momento. Šiame skyriuje daugiausia dėmesio bus skiriama filtravimo problemai, o prognozavimas ir interpoliacija bus nagrinėjami kitame skyriuje.

Įvertis bus sąlygiškai ir besąlygiškai nešališkas, ty ir , taip pat bus tiesinė stebėjimų sekos funkcija. Iš galimų tiesinio nešališko vertinimo algoritmų rinkinio pasirenkame tik tą, kuris suteikia mažiausią paklaidos dispersiją, t.y., kuriai arba minimalus.

IN ankstesnis skyrius Nustatėme, kad įvertis, pagrįstas minimalios vidutinės kvadratinės paklaidos kriterijumi, sutampa su sąlygine vidutine dydžio verte tam tikram stebėjimų rinkiniui. Tačiau apskritai, net jei ataskaitų teikimo ir stebėjimo modeliai yra tiesiniai (o čia suformuluotai problemai jie yra), sąlyginis vidurkis nėra tiesinė stebėjimų funkcija, todėl vertinimo algoritmas neturi norimos tiesiškumo savybės. .

Gauti tiesinis algoritmasįvertinimas, kuris užtikrina minimalų klaidų dispersiją, turime naudoti vieną iš dviejų metodų. Vienas iš jų yra nustatyti sąlyginį vidurkį, reiškiantį tiesinę formą, ir tada rasti geriausias variantasšią formą. Šis metodas pagrįstas ortogonaliosios projekcijos naudojimu. Kitas metodas pagrįstas prielaida, kad atsitiktiniai dydžiai , , ir kartu yra normalūs. Remiantis tuo, kas buvo įrodyta sk. 4 tiesinių sistemų savybės normaliojo skirstinio dėsnio nekeičia, tikslus sąlyginis vidurkis šiuo atveju bus linijinė forma. Linijinis minimalios dispersijos įvertis turi būti lygus minimalaus dispersijos įverčiui, jei pastarasis tikrai tiesinis. Taip atsitinka, jei laikomės normalaus pasiskirstymo dėsnių.

Atkreipkite dėmesį, kad jei reikalaujame, kad įvertinimo algoritmas būtų tiesinis, tada tikrasis pasiskirstymo dėsnis ir neturi reikšmės. Tačiau jei skirstiniai yra tikrai normalūs, kaip dažnai būna, tada sąlyginis vidurkis iš tikrųjų yra tiesinė forma. Kitaip tariant, Kalmano filtras yra geriausias (minimalios paklaidos dispersijos prasme) tiesinis filtras, nepriklausomai nuo pasiskirstymo tipo, ir geriausias algoritmas iš visų galimų tiesinio ir netiesinio įvertinimo algoritmų, jei objektas ir matavimo triukšmas taip pat. kaip pradinė būsena, turi normalaus paskirstymo dėsnius.

Išvesdami Kalmano filtro lygtį, manysime ir reikalausime, kad stebėjimai būtų apdorojami nuosekliai. Nepriklausomai nuo to, ar vertinimo algoritmas yra nuoseklus, ar ne, gautų būsenų įverčių reikšmės nėra koreguojamos. Tačiau metodo skaičiavimo galimybė yra labai svarbi. Bene reikšmingiausias Kalmano ir Bucy indėlis yra tai, kad jie pirmieji gavo tiesinį minimalaus dispersijos įvertinimo algoritmą nuoseklia forma, naudodami būsenos kintamųjų sąvoką. Linijinio nuoseklaus filtravimo, pagrįsto minimalios paklaidos dispersijos kriterijumi, problemą Wiener ir kiti autoriai jau seniai išsprendė sistemoms su vienu įėjimu ir vienu išėjimu. Pagrindinis Kalmano nuopelnas yra tai, kad jis apibendrino Wienerio filtravimo teoriją nestacionarioms daugiamatėms sistemoms su nestacionariais baigtinės trukmės triukšmo įgyvendinimais ir gavo filtravimo problemos sprendimą pasikartojančia forma.

Kadangi problemos esmės pristatymas buvo šiek tiek atidėtas, apibendrinkime prieš tiesiogiai pradedant ją spręsti. Pagal minimalios paklaidos dispersijos kriterijų norime gauti optimalų tiesinį nešališką tiesinės nestacionarios dinaminės sistemos, kuriai įtakos turi nulinis vidurkis ir žinoma dispersija, būsenos įvertinimą.

Norėdami gauti įvertinimą, priedo fone stebime laike kintančią tiesinę būsenos funkciją baltas triukšmas su nuliniu vidurkiu ir žinoma dispersija. Pradinė proceso būsena yra atsitiktinis dydis, kurio vidurkis ir dispersija yra žinomi. Nėra jokios koreliacijos tarp įvesties triukšmo ir matavimo triukšmo, todėl būtina rasti pasikartojantį vertinimo algoritmą. Kalmano filtravimo algoritmas yra šios problemos sprendimas. Kalbant apie atskiras sistemas, mes svarstome du skirtingus Kalmano filtro lygties išvedimo būdus, kurie yra dviejų aukščiau išdėstytų idėjų iliustracija. Pirmuoju atveju, kai naudojamas ortogonaliosios projekcijos metodas, iš anksto parinksime tiesinę vertinimo algoritmo formą ir tada surasime geriausią algoritmą. Antruoju atveju, kai įvertinimas atliekamas pagal maksimalią a posteriori tikimybę, manysime, kad atsitiktiniai dydžiai turi normalaus pasiskirstymo dėsnius ir rasime optimalų vertinimo algoritmą, kuris tikrai bus tiesinis. Išvesdamas filtravimo lygtį, Kalmanas naudojo metodą, pagrįstą ortogonaliosios projekcijos metodu, todėl pristatymą pradėsime šiuo metodu.

Stačiakampisprojekcija. Stačiakampės projekcijos teorija trumpai aptarta § 6.6. Kai kurie ten pateiktų rezultatų apibendrinimai čia bus pateikti be įrodymų; mums jų prireiks vėliau. Tiesinis vertės įvertinimas, pagrįstas duotosios minimalios paklaidos dispersijos kriterijumi linijinė erdvė stebėjimai pateikiami stačiakampe projekcija į , t.y.

Čia simbolis naudojamas vietoj , nes tiesinis įvertis su minimalia dispersija paprastai nesutampa su sąlyginiu matematiniu lūkesčiu. Jei iš anksto būtume darę prielaidą, kad atsitiktiniai dydžiai turi normalųjį skirstinį, tai tiesiog sutaptų su ; Tačiau sąmoningai pasirinkome kitokį požiūrį, kad pabrėžtume, jog normaliųjų skirstinių prielaida nėra būtina, jei atsiminsime, kad gautas vertinimo algoritmas gali būti ne absoliučiai geriausias, o tik geriausias tiesinių algoritmų klasėje. Jei stačiakampė seka sudaro pagrindą , tada ją galima pavaizduoti taip

. (7.8)

Norint gauti pasikartojančią formą, mums reikia tokio rezultato. Jei yra vektorius stačiakampis, t.y. , Už , Kur yra stačiakampis pagrindas , Tada

Šis rezultatas yra ortogonaliosios projekcijos lema. Nors mums bus įdomu filtruoti, t.y., pirmiausia panagrinėkime vieno žingsnio prognozę, t.y. Tam, kad gautume sprendimą reikiama pasikartojančia forma, naudojame matematinės indukcijos principą. Tarkime, kad tai žinoma, ir įsivaizduokime naują stebėjimą per ir . Tačiau paprastai kalbant, jis nėra stačiakampis, ir prieš naudojant (7.9) lygtį būtina rasti stebėjimo komponentą, kuris yra stačiakampis. Iš esmės tai susiję su paryškinimu nauja informacija esantis .

Nesunku parodyti, kad vektorius

stačiakampis Atkreipkite dėmesį, kas yra „nauja informacija“, esanti , nes norėdami gauti geriausią kiekio įvertinimą, atsižvelgiant į tai, kad , atimama iš . Tai dar viena teiginio forma, kuri yra stačiakampė. Atsitiktinis kintamasis yra žinomas kaip „atnaujinamasis“ kintamasis. Naudojant (7.10) lygtį, ji gali būti išreikšta atnaujinamu atsitiktiniu dydžiu taip:

.

Šios dvi išraiškos yra lygiavertės, nes yra stebėjimo erdvėje ir todėl neprideda jokios papildomos informacijos, palyginti su esančia . Kadangi ir yra stačiakampiai, galime naudoti lygtį (7.9) ir parašyti ją kaip . Kadangi , ši išraiška gali būti pavaizduota tokia forma:

Iš to išplaukia, kad ji gaunama numatant atsitiktinio dydžio reikšmę iš ankstesnių stebėjimų ir tada koreguojant numatomą vertę pagal naują informaciją, esančią dabartinėje atsitiktinio dydžio imtyje. Numatymo ir taisymo koncepcija yra labai vaisinga ir leidžia aiškiai interpretuoti Kalmano algoritmą. Todėl kurdami filtravimo algoritmą naudosime metodą, pagrįstą numatymo ir taisymo idėja. Išanalizuokime atskirai kiekvieną iš dviejų dešinėje lygties (7.11) pusėje esančių dėmenų. Pagal išraišką (7.1) pateikiama kaip . Todėl kuri pagal apibrėžimą yra lygi , dabar tampa lygus

Pagal apibrėžimą taip pat turime

Kadangi tai priklauso tik nuo baltojo triukšmo ir yra baltasis triukšmas, matematinis tam tikros vertės reikšmės lūkestis tiesiog sutampa su besąlyginiu matematiniu lūkesčiu. Taigi aukščiau pateiktas rezultatas paverčiamas taip:

Matome, kad prognozuojama reikšmė, remiantis stebėjimu , gaunama iš netrukdomo perėjimo žingsniu į priekį, ty esant . Ši išvada nėra netikėta, nes geriausias stebėjimu pagrįstas įvertinimas, kaip parodyta aukščiau, yra identiškas nuliui. Iš to taip pat išplaukia

Tai reiškia, kad tiek filtruojant, tiek numatant, geriausias baltojo triukšmo įvertinimas su nuline vidurkiu yra identiškas nuliui. Ši išvada yra nepaprastai svarbi ir bus labai naudinga, ypač aptariant „atnaujinimo“ proceso koncepciją. Toliau panašiai parodysime, kas yra apibrėžta ir kas iš tikrųjų

Jei lygtį (7.12) pakeisime į (7.11), gausime

Panagrinėkime antrąjį šios lygties dešinėje pusėje esantį narį. Naudojant (7.8) lygtį, gali būti parašytas tokia forma:

Dabar mes atskirai išnagrinėjame kiekvieną terminą dešinėje šios lygties pusėje. Pakeitę (7.1) , gauname pirmąjį lygties narį

Dabar, naudojant dydžių apibrėžimus ir [žr (7.3) ir (7.10) lygtis] ​​galima parašyti tokia forma:

Kur. Todėl (7.17) lygtis įgauna formą

o padauginus atitinkamus narius jis transformuojamas į formą

Kadangi tai priklauso tik nuo , ir , ir nėra koreliuojami, tada . Kadangi tai yra baltas triukšmas ir priklauso tik nuo , tada o trečiasis narys dešinėje pirmiau pateiktos lygties pusėje turėtų būti lygus nuliui. Paskutinis narys dešinėje lygties pusėje taip pat yra nulis, nes ir nėra koreliuojami. Todėl lieka tik pirmas terminas ir dėl to turime

Gautą išraišką galima dar labiau supaprastinti, jei atsižvelgsime į tai. Kuriame tampa lygus

Bet pirmasis narys pagal ortogonaliosios projekcijos lemą yra lygus nuliui. Todėl (7.18) lygtis gali būti parašyta taip:

kur Panašiai galima parodyti, kad

Jei lygtis (7.19), (7.20) ir (7.10) pakeisime į (7.16), tada

Todėl išraiška už įgauna formą

Šį rezultatą galima pateikti patogesne forma, įvedant žymėjimą

taigi pagaliau gauname

Dydis vadinamas vieno žingsnio Kalmano ekstrapoliatoriaus prieaugiu. (7.23) ir (7.24) lygtimis pavaizduota sprendinio forma yra labai įdomi ir patogi skaičiavimo požiūriu. Gavome nuoseklaus skaičiavimo algoritmą, pagrįstą žinoma verte, apskaičiuota ankstesniame žingsnyje, ir nauju stebėjimu. Naujasis įvertis čia susidaro ekstrapoliavus senąjį įvertį ir vėlesnį pataisymą naudojant svertinį stebėjimo klaidos signalą. Kalmano ekstrapoliatoriaus blokinė schema parodyta Fig. 7.1b; Palyginimui, pirminiai ataskaitų teikimo ir stebėjimo modeliai parodyti Fig. 7.1, a. Prieš naudodami aukščiau gautą rezultatą, pirmiausia turite rasti išraišką, kad galėtumėte apskaičiuoti . Galite padaryti kitaip ir rasti. Norėdami nustatyti , pirmiausia randame pasikartojančią išraišką . Sujungę (7.1) ir (7.24) lygtis, gauname

7.1 pav. Vieno žingsnio numatymo problemos blokinės diagramos: a) pranešimų ir stebėjimo modeliai, b) vieno žingsnio numatymo įrenginys

Jei dabar reiškinį (7.3) pakeisime ir atliksime eilę paprastų algebrinės transformacijos, tada aukščiau pateikta išraiška sumažinama iki formos

Be to, kad (7.25) lygtis gali būti naudojama skaičiuojant , ji taip pat yra nepriklausoma kaip vertinimo paklaidos kitimo dėsnis.

Kadangi vidutinė kiekio reikšmė yra nulis (kadangi įvertis yra nešališkas), o dydžiai , ir nėra koreliuojami, išraišką už galima gauti tiesiogiai, remiantis šio dydžio apibrėžimu ir (7.25) lygtimi, formoje

Jei dabar gautą rezultatą pakeisime (7.23) ir supaprastinsime, gautume tokią klaidos dispersijos išraišką:

Lygtis (7.26) kartu su (7.23) ir (7.24) visiškai apibrėžia tiesinį nuoseklų vienos pakopos ekstrapoliatorių su minimalia paklaidos dispersija.

Prieš naudojant aukščiau gautą rezultatą, ir lygtyse būtina nustatyti atitinkamas pradines sąlygas. Akivaizdu, kad geriausias kiekio įvertinimas, jei nebuvo atlikta jokių pastabų, yra ir todėl

Taigi, kaip pradines vieno žingsnio prognozavimo algoritmų sąlygas, pasirenkame ; .

Visi vieno žingsnio numatymo algoritmai yra apibendrinti lentelėje. 7.1.

Lygtį (7.26) taip pat galima perrašyti taip:

Jei nustatysite pradines sąlygas (7.24) ir (7.26) lygtyse, galėsite nuosekliai naudoti vieno žingsnio numatymo algoritmus. Pavyzdžiui, lygtis (7.23) su pradine sąlyga gali būti naudojama norint rasti , kuri vėliau turi būti pakeista į (7.24), kad būtų galima apskaičiuoti nuo pirmojo stebėjimo. Dispersijos lygtis (7.26) naudojama kitame etape, kai konvertuojama į . Tada gauta dydžio reikšmė naudojama skaičiavimams ir tt Duomenų apdorojimas pagal prognozavimo lygtis schematiškai parodytas pav. 7.2. Kruopšti (7.23) ir (7.26) lygčių analizė rodo, kad dydžių apskaičiavimas ir faktiškai atliekamas nesinaudojant stebėjimų seka. . Stiprinimo matricas galima apskaičiuoti ir išsaugoti iš anksto. Tikriausiai negalėtume priimti šio preliminaraus matricų skaičiavimo būdo, jei stebėjimų atėjimo į procesoriaus įvestį greitis nebūtų toks didelis ir netrukdytų realiai atlikti skaičiavimų pagal (7.23) ir (7.26) lygtis. laiko, arba, jei būtų įmanoma, įsiminimas nebuvo prieinamesnis ar pigesnis nei realiojo laiko skaičiavimo galimybės.

7.1 lentelė. Diskretūs vieno žingsnio numatymo algoritmai

Pranešimo modelis

Stebėjimo modelis

A priori duomenys

; ; ;

Numatymo algoritmas

Pelno skaičiavimas

Ankstesnės dispersijos apskaičiavimas

Pradinės sąlygos

Pagrindinis Kalmano filtravimo algoritmų privalumas yra ne tiek tai, kad jie pateikia filtravimo problemos sprendimą (sprendimas buvo gautas kitais metodais daug anksčiau), bet tai, kad sprendimas tiesiogiai nulemia praktinį rezultatų įgyvendinimą. Sprendžiant daugelį praktinių uždavinių, galima užtikrinti skaičiavimų, naudojant (7.23) ir (7.26) lygtis realiu laiku, pagrįstumą ir tuo realiu laiku realizuoti nuoseklaus filtravimo algoritmus. Kitas būdingas nagrinėjamo metodo bruožas yra tai, kad paklaidos dispersija apskaičiuojama kaip įverčio komponentas, todėl gali būti naudojama įvertinimo procedūros tikslumui kontroliuoti. Tai pagrįsta prielaida, kad ataskaitų teikimo ir stebėjimo modeliai bei ankstesnis paskirstymas yra visiškai žinomi.

Ryžiai. 7.2. Skaičiavimų, naudojant prognozavimo algoritmus, blokinė diagrama

7.1 pavyzdys. Tegul pranešimo ir stebėjimo modeliai nurodomi skaliarinėmis lygtimis:

; .

ir Ir arba,. Čia darome prielaidą, kad triukšmas yra stacionarus ir baltas, nors apskritai nebūtina, kad jis būtų nejudantis. Taip pat manykime pradinė vertė turi nulinį vidurkį ir vieneto dispersiją, taigi ir .

Šiame pavyzdyje įvertinimo lygtis (7.24) įgauna formą

su padidėjimu, nustatytu iš lygties

Dispersijos lygtis turi formą

Taip pat apskaičiuokime darydami prielaidą, kad turime stebėjimų , . Pirmiausia apskaičiuojame pelną naudodami pradinę sąlygą:

; .

Naudodami pradinę sąlygą gauname Ir . Šio įvertinimo paklaidos dispersiją nustatome iš dispersijos lygties taip:

Dabar reikia pakartoti visus skaičiavimo etapus, norint rasti , įvertinti ir galiausiai dispersiją. Nors nagrinėjamas pavyzdys itin paprastas, jis gana aiškiai iliustruoja visus skaičiavimo etapus, kuriuos reikia atlikti taikant vieno žingsnio Kalmano numatymo algoritmus.

Viena iš praktiškai svarbių problemų, iškylančių naudojant aukščiau pateiktus rezultatus ir dar sunkesnė nei nustatyti pradinės būsenos vidutinę reikšmę ir dispersiją, yra įvesties triukšmo ir matavimo triukšmo dispersijos nustatymas. Nuokrypių vertes ir dažnai galima gauti išanalizavus problemos fizinį pobūdį arba išmatuojant tiesioginį pagrįstą tikslumą. Panašių pastabų galima pasakyti ir apie būsenos vektoriaus apriorinius momentus. Vertė buvo pasirinkta kaip geriausias vidutinės būsenos vektoriaus vertės nuliniame žingsnyje, ty prieš atliekant stebėjimus, įvertinimas ir kaip neapibrėžtumo laipsnio charakteristika pasirenkant .

Grynai kokybine prasme galima teigti, kad kuo didesnis netikrumas dėl tikrosios vertės, tuo didesnes reikšmes nustatome.

Dabar pereikime prie filtravimo problemos. Vieno žingsnio ekstrapoliatorius buvo naudojamas kaip patogus žingsnis sprendžiant šią pagrindinę problemą ir dažnai turi praktinę reikšmę. Pamatysime, kad filtravimo problemos sprendimas apima vieno žingsnio numatymą, kurio rezultatai koreguojami pagal esamą informaciją. Dažnai, bet ne visada, pirmenybė turėtų būti teikiama filtravimo problemos sprendimui, o ne vieno žingsnio filtravimo problemos sprendimui.

Jei filtravimo rezultatas gautas įvertinimas, būtent , yra žinomas, tada jį galima gauti kaip

Kadangi ir todėl priklauso tik nuo , stebėjimo erdvėje nėra informacijos apie , kur yra diskretinis baltasis triukšmas. Todėl norint prognozuoti reikšmes iš stebėjimų, pakanka numatyti reikšmes vienu žingsniu į priekį, darant prielaidą . Šis metodas leido mums gauti (7.27) lygtį, kuri bus naudojama toliau. Sąmoningai leisdami laisvą žymėjimą dėl žymėjimo paprastumo, rašome jį kaip . Išskyrus specialiai nurodytus atvejus, kaip ir , manysime, kad sąlygas nurodo tarpas . Šiuose žymėjimuose lygtis (7.27) bus perrašyta kaip

Akivaizdu, kad du stebėjimu pagrįsti įverčiai turi būti lygiaverčiai. Todėl galime naudoti (7.28) lygtį, norėdami gauti nuoseklaus vertinimo algoritmą iš (7.23), (7.24) ir (7.26) lygčių. Pirmiausia pakeiskime yp-n.ie (7.28) į (7.24). Kaip rezultatas, mes gauname

Jei abi šios lygties puses padauginsime iš , kuri dėl pereinamosios būsenos matricos savybių yra lygi , gausime

Norėdami supaprastinti gautą išraišką, pristatome , apibrėžtą kaip , arba

jei panaudosime lygtį (7.23) nustatyti. Todėl parašyta formoje

Nors lygtis (7.30) yra turbūt patogiausia Kalmano filtro įvertinimo lygties rašymo forma, iš esmės galima gauti keletą kitų rašymo formų. Du iš jų yra ypač naudingi. Jei naudosime ryšį, tada (7.30) lygtį galima perrašyti taip:

Ši išraiška gali būti dar labiau supaprastinta įvedant „atnaujinimo“ kiekį, kurį reikia gauti

Lygtys (7.29)-(7.31) arba (7.32) kartu su lygtimi (7.26) visiškai išsprendžia problemą linijinis filtravimas pagal minimalios vidutinės kvadratinės paklaidos kriterijų. Pateiktos pradinės sąlygos , ty ir , naudojamos formuojant pradines sąlygas ir atitinkamai, taip pat, kaip ir vieno žingsnio ekstrapoliatoriuje.

Kalmano filtravimo algoritmai gali būti pateikti patogesne forma, jei rasime filtravimo klaidos dispersijos išraiškas . Be to, dispersija gali būti naudojama kaip vertinimo procedūros kokybės kriterijus. Dispersija dažnai vadinama išankstine dispersija, nes ji reiškia įverčio dispersiją prieš stebėjimą, o dispersija vadinama užpakaline dispersija. Norėdami nustatyti , pirmiausia randame išraišką . Vėlgi, galimos kelios vaizdavimo formos. Vienas iš patogiausių mūsų atveju yra vaizdavimas naudojant (7.32) lygtį. Šiuo atveju jis apibrėžiamas taip:

Jei dabar pakeisime lygtis (7.29) ir (7.19) bei (7.20) ir į šią išraišką gauname

Jei naudosime lygtį (7.29), tada paskutinę išraišką galima perrašyti kaip

Pagal šią lygtį filtravimo paklaidos dispersija gana paprastai išreiškiama per vienos pakopos prognozės paklaidos dispersiją. Naudojant kiekį taip pat galima žymiai supaprastinti (7.26) lygtį. Perrašykime į formą

Naudodami formulę (7.29) , galime parašyti šią išraišką kaip

Nesunku pastebėti, kad vertė in garbanoti breketai, reiškia ne ką kitą, kaip . Todėl turime

Šią išraišką būtų galima gauti įprastu būdu, apskaičiuojant atsitiktinio dydžio, pateikto (7.1) lygtimi, dispersiją duotam .

Lygtys (7.29), (7.30), (7.33) ir (7.34) visiškai apibrėžia galutinę diskretinio Kalmano filtro versiją. Šios lygtys apibendrintos lentelėje. 7.2. Skaičiavimų pagal gautus algoritmus blokinė schema parodyta pav. 7.3, o atskirojo Kalmano filtro blokinė schema yra pav. 7.4.

Dar kartą atkreipkite dėmesį, kad dispersijos ir padidėjimo lygtis neapima stebėjimų sekos, todėl prireikus šias vertes galima apskaičiuoti iš anksto. Ši galimybė paprastai parodyta fig. 7.3 su punktyrine linija.

7.2 lentelė. Diskrečiųjų Kalmano filtravimo algoritmų santrauka

Pranešimo modelis

Stebėjimo modelis

A priori duomenys

Filtravimo algoritmai

Pelno skaičiavimas

Ankstesnės dispersijos apskaičiavimas

Užpakalinės dispersijos lygtis

Pradinės sąlygos

7.4 pav. pateiktos blokinės schemos analizė rodo, kad Kalmano filtras įgyvendina numatymo – korekcijos idėją. Ankstesnis įvertinimas ekstrapoliuojamas vienu žingsniu į priekį ir tada naudojamas gauti geriausią naujo stebėjimo įvertinimą, remiantis visais ankstesniais stebėjimais. Klaida tarp dabartinio stebėjimo „geriausio įvertinimo“ ir tikrojo stebėjimo, būtent arba , reiškia naują informaciją [komponentas statmenas į ]. Klaida pasveriama su svoriu, kuriame atsižvelgiama į įvesties proceso dispersijų vertę, matavimo ir įvertinimo paklaidą, kad būtų sukurtas pataisos signalas. Pataisos signalas pridedamas prie numatomo įvertinimo ir gaunamas naujas įvertinimas.

7.3 pav. Skaičiavimų, naudojant Kalmano filtravimo algoritmą, blokinė diagrama.

Ryžiai. 7.4. Diskretinio Kalmano filtro blokinė schema.

Atkreipkite dėmesį, kad Kalmano filtro struktūra atitinka (7.30) lygtį ir parodyta fig. 7.4, yra labai panaši į pradinio pranešimo modelio struktūrą, pateiktą pagal (7.1) lygtį ir parodytą Fig. 7.1a. Filtravimo algoritmas pagrįstas „atnaujinančio“ komponento, kuriame yra stebėjimo rezultatas, gauta nauja informacija, naudojimu.

7.2 pavyzdys. Norėdami iliustruoti Kalmano filtravimo algoritmo taikymą, apsvarstykite dvimatį pranešimo modelį, pateiktą pagal lygtį

Stebėjimas atliekamas pagal skaliarinį modelį

Įvesties triukšmas yra stacionarus su , o matavimo triukšmas yra nestacionarus . Kitaip tariant, lyginių indeksų matavimai yra mažiau tikslūs nei nelyginių indeksų. Tarkime, kad pradinių klaidų (arba pradinės būsenos) dispersiją suteikia matrica . Turite apskaičiuoti vertę nuo 1 iki 10.

Naudodami lygtis (7.29) ir (7.34), taip pat pradinę sąlygą, galite lengvai apskaičiuoti ir , kurios yra atitinkamai lygios

Dabar naudodami (7 23) lygtį galite apskaičiuoti užpakalinę dispersiją

taip pat a priori dispersija, kuri pasikeičia kitam žingsniui pagal (7.34) lygtį ir tampa lygi

Ryžiai. 7.5. Kalmano filtro stiprinimo keitimas, aptartas 7.2 pavyzdyje

Dabar galite skaičiuoti ir pan. Vektoriaus komponentai, keičiant nuo 1 iki 10, pavaizduoti 7.5 pav. Pastebėkime būdingą nelyginių verčių stiprinimo padidėjimą, dėl kurio sustiprinami gana tikslūs matavimai. Galima pastebėti, kad stiprinimas pasiekia pastovią būseną, periodiškai kintančią reikšmę per kelis mėginius. Tikriausiai pravartu trumpai ir grynai kokybiškai aptarti dydžių santykio įtaką ir į , net jei sunku gauti bendrą kiekybiniai rezultatai. Pirma, čia svarbios santykinės vertybės, o ne absoliučios. Visų pirma, lengva parodyti, kad tuo atveju, kai , ir yra dauginami iš tos pačios teigiamos skaliarinės konstantos, tada nesikeičia. Labai apytiksliai galime pasakyti tik tiek, kad stiprinimas priklauso nuo signalo ir triukšmo santykio. Koeficientų matricos elementai mažėja, kai matricos elementų reikšmės mažėja ir [arba tik ] arba matricos elementų reikšmės didėja. Toks rezultatas atrodo intuityviai suprantamas, nes mažėjant turėtume tikėtis vis mažesnių būsenos pokyčių, todėl nereikia taip tiksliai „sekti“ stebėjimų. Taip pat, jei jis mažėja, pradinio įverčio tikslumas didėja, o stebėjimuose esančios informacijos poreikis mažėja, taigi ir padidėjimas. Kita vertus, jei jis didėja, stiprinimas vėl mažėja, todėl į įvertinimą neįtraukiamas per didelis matavimo triukšmas. Riboje, kai jis linkęs į nulį, kaip nesunku parodyti, jis asimptotiškai artėja prie nulio didelės vertės. Kai klaidų dispersija siekia nulį, klaidų dispersija taip pat linkusi į nulį, o įvertinimo procedūra tampa nepriklausoma nuo stebėjimo ir pereina į režimą, vadinamą įvesties prisotinimu. Šis režimas gali sukelti rimtų nukrypimų problemų. Skirtumų koregavimo metodai bus išsamiai aptarti skyriuje. 8.5.

Įvertinimas pagal didžiausios posteriorinės tikimybės kriterijų. Gaukime tiesinio įvertinimo algoritmą, darydami prielaidą, kad , ir turėti normalaus skirstinio dėsnius. Šiuo atveju nesunku parodyti (žr. § 4.2), kad ir yra atsitiktiniai dydžiai, turintys normalų paskirstymo dėsnį visiems . Todėl tai yra tiesinė stebėjimo funkcija. Kitaip tariant, tiesinio įvertinimo algoritmas, pagrįstas minimalios paklaidos dispersijos kriterijumi, yra vertinimo algoritmas su minimalia paklaidos dispersija, o paklaidos dispersija yra mažesnė arba lygi bet kurio kito tiesinio ar netiesinio vertinimo algoritmo paklaidai.

Norint gauti įvertinimo algoritmą, pagrįstą didžiausios a posteriori tikimybės kriterijumi, tereikia nustatyti tam tikros vertės sąlyginės tikimybės tankį ir rasti jos matematinį lūkesčius. Kadangi sąlyginis skirstinys yra normalus tam tikrai reikšmei, žinoma (žr. §6.2), kad įvertinimo algoritmas, apskaičiuojantis sąlyginį lūkestį, sumažina ne tik vidutinę kvadratinę paklaidą, bet ir vidutinę absoliučią pirminio ir daugelio kitų nuostolių funkcijų paklaidą.

Taigi galima priskirti minimalų dispersijos įvertinimo algoritmą, atsižvelgiant į įvertinimą pagal bet kokias kitas nuostolių funkcijas, pavyzdžiui, įvertinimą naudojant didžiausios posteriorinės tikimybės kriterijų (sutrumpintai kaip MAP įvertinimas), kai nuostolių funkcija pasirenkama kaip paprasta ir įvertis sutampa su sąlyginio tankio režimu.

Naudokime šią techniką ir sukurkime MAV įvertinimo algoritmą. Kadangi kai kurie posakiai, su kuriais turėsime operuoti, gali būti per ilgi, pateikimo procese kartais naudosime supaprastintą žymėjimo formą. Atsižvelgdami į šiek tiek griežtumo trūkumą, atsisakysime tikimybių tankių indekso žymėjimo, o nagrinėjamus atsitiktinius dydžius pažymėsime kaip šių tankių argumentus. Pavyzdžiui, atsitiktinio dydžio tikimybės tankio reikšmė taške šiuo atveju rašoma kaip; panašiai parašyta kaip . Ir nereikia bandyti šios supaprastintos žymėjimo formos interpretuoti kaip tikimybę, kad (tai akivaizdi nesąmonė), tiksliau, tikimybės tankis turėtų būti laikomas funkcija, o ne šios funkcijos verte, kurios reikia konkretus pastebėjimas. Deja, negriežtoje matematikoje, kurią naudoja inžinieriai, skirtumas tarp funkcijos, kaip vienos rinkinio atvaizdavimo su kita, ir specifinę reikšmęšią funkciją.

Tikimybių tankio funkcija, į kurią atsižvelgiama vertinant pagal didžiausios užpakalinės tikimybės kriterijų arba remiantis sąlyginiu matematiniu lūkesčiu, yra tam tikros stebėjimų sekos atsitiktinio dydžio funkcija ir žymima kaip . Sąlyginiu matematiniu lūkesčiu pagrįstas įvertinimo algoritmas apibrėžiamas kaip

(7.35)

Įvertis, pagrįstas didžiausios užpakalinės tikimybės kriterijumi, kurį žymėsime kaip , randamas kaip lygties sprendimas

. (7.36)

su sąlyga, kad

(7.37)

Jei tenkinama sąlyga (7.37), kuri reikalauja, kad antrųjų išvestinių matrica būtų neigiama apibrėžtoji, tai (7.36) lygties sprendinys atitinka sąlyginio tankio maksimumą.

Norėdami rasti išraišką , naudojame daugybos teoremą ir rašome Kaip

Jei laikysime tai naujo stebėjimo ir ankstesnių stebėjimų deriniu, tada (7.38) lygtis bus perrašyta į formą

(7.39)

Pažiūrėkime į šios išraiškos skaitiklį. Naudodamiesi daugybos teorema, galime rašyti

nes žinios neabejotinai pašalina konservavimo poreikį. Jei nurodyta, tada in yra tik atsitiktinis kintamasis, o kadangi yra baltas triukšmas, tai jokia informacija nėra įtraukta į . Jei išraišką (7.40) pakeisime į (7.39), gausime

Taikydami vardikliui daugybos teoremą, gautą išraišką įrašome į formą

Sumažinę bendrąja skaliarinės tikimybės funkcija, gauname

(7.41)

Dabar galime nustatyti tam tikro atsitiktinio dydžio sąlyginį tikimybės tankį, apskaičiuodami kiekvieną tikimybės išraišką dešinėje (7.41) lygties pusėje. Panagrinėkime kiekvieną narį atskirai, įrodydami, kad kiekvienas į (7.41) įtrauktas tikimybių tankis yra normalus, ir nustatydami pirmuosius du momentus, apibūdinančius normalųjį skirstinį. Pirmiausia patyrinėkime. Kadangi jis pateikiamas pagal lygtį, a yra normalus atsitiktinis procesas, tada tikimybės tankis neabejotinai yra normalus, nes tai yra normalaus atsitiktinio proceso ir pastovios vertės suma. Vidutinė proceso vertė yra

nes tai yra atsitiktinis procesas, kurio vidutinė vertė nulinė. Atsitiktinio proceso dispersija pagal apibrėžimą yra lygi

ir šiuo atveju

Taigi tikimybės tankis gali būti parašytas tokia forma:

Dabar apsvarstykite išraiškos vardiklį (7.41), tiksliau, trijų pateiktų reikšmės tikimybės tankį. Naudojant stebėjimo modelio lygtį, galima parašyti kaip

Pagal pirminę problemos formuluotę žinoma, kad ji turi normalaus skirstymo dėsnį ir nepriklauso nuo . Tariant, kad - normalu, be jokios abejonės taip pat yra normalus, nes tai yra dviejų atsitiktinių dydžių, turinčių normalųjį pasiskirstymo dėsnį, tiesinė funkcija (suma). Atsitiktinio dydžio tikimybės tankis duotam u yra normalus, nes šiuo atveju jis tiesiog sutampa su , o tai, remiantis pradine prielaida, yra normalu. Žemiau parodysime prielaidos, kad , ir todėl yra normalus visiems. Vidutinis su tankiu lygus

kur naudojamas anksčiau įvestas užrašas; lygus nuliui, nes tai baltas triukšmas su nuline vidurkiu. Proceso sklaida pagal apibrėžimą yra lygi nurodytai vertei, nes dydžių:, laikomų pradiniais šioje grandinėje, sklaida yra normali. Todėl patvirtinama prielaida, kad tankis normalus.

Būsenos įvertinimas duotam , remiantis sąlyginiu matematiniu lūkesčiu (vertinimas pagal minimalios paklaidos dispersijos kriterijų), nustatomas pagal (7.54) lygtį ir atitinka anksčiau gautus rezultatus [žr. (7.30)]. Tačiau šiuo atveju įvertis yra lygiai lygus sąlyginiam matematinis lūkestis(kadangi čia buvo daroma prielaida, kad normalus skirstinys), ir nėra geriausias tik tiesinių įverčių klasėje. Žinoma už normalus skirstinys abu įverčiai sutampa, nes sąlyginis matematinis lūkestis yra tiesinė funkcija pastebėjimai.

Norint nustatyti MAV įvertį, reikia rasti maksimalią vertę . Naudokime gerai žinomą techniką ir ieškokime maksimumo, o ne paties tankio

ir šiuo atveju pastebima dėl fizinių paklaidos dispersijos matricos savybių. Vadinasi, MAV įvertis sutampa su sąlyginio matematinio lūkesčio įvertinimu ir įvertinimu, pagrįstu minimalios paklaidos dispersijos kriterijumi. Vertybių rinkinys yra pakankamas statistinis įvertinimas ta prasme, kad jie visiškai nustato sąlyginį tankį.

Reikėtų pažymėti, kad galima naudoti tiesiogiai originali forma tankio rekordai [išraiška (7.52)], o ne kompaktiška forma (7.53). Šis metodas atrodo patrauklesnis, nes šiuo atveju nereikia žinoti kompaktiškesnės formos, o tai nėra gana paprasta ir akivaizdu. Jei naudosime išraišką (7.52) už , tada lygties (7.57) transformacijos rezultate turime

Jei dabar sugrupuotume terminus, kuriuose yra , gautume

kurio sprendimas sąlyginai duoda tokį rezultatą:

Nors šis optimalaus įvertinimo sprendimas nėra pateiktas tokia patogia forma kaip ankstesnis, jį galima nesunkiai sumažinti iki (7,62), jei naudosime matricos inversijos lemą arba tiesiogines išraiškas (7,55) ir (7,56).

Iš Kalmano filtravimo algoritmų galima gauti daugybę įdomių ir naudingų dispersijos išraiškų. Štai keletas naudingiausių, susijusių su „atnaujinimo proceso“ sąvoka:

Su (7.70) lygtimi gauname [kuris taip pat yra optimalus įvertinimas, veikiantis sistemos išvestyje, t. y. kai stebėjimo modelis turi tokią formą:

Jie pateikia linijinio diskrečiojo filtravimo problemos sprendimą bendriausioje formuluotėje. Pabaigoje pažymime, kad bendrieji rezultatai, kaip konkretūs, seka lentelėje pateiktus rezultatus. 7.2, jei nustatome ir lygus nuliui.

Kaip žinoma, filtravimo esmė yra nuolatinis atsitiktinio proceso laike kintančių parametrų vertinimas. Jei pranešimas yra skaliarinis Markovo procesas(stacionariam Gauso procesui tai reiškia, kad kovariacijos funkcija yra Aexp(-B|t-u|), tada problemos sprendimas gali būti pagrįstas vadovaujantis principais, supaprastinant tikslo pasiekimą:

Mus dominančių procesų aprašymas turėtų būti atliktas naudojant linijines sistemas su laike kintančių parametrų, kurios generuotų juos, kai sistemų įvadams taikomas baltasis triukšmas;

Linijinė sistema, generuojanti pranešimą, turėtų būti aprašyta naudojant diferencialinę lygtį, kurios sprendimas yra norimas pranešimas;

Optimalus įvertis kaip tiesinės sistemos išėjimo reikšmė turėtų būti nurodytas kaip diferencialinės lygties, kurios koeficientus lemia procesų statistika, sprendimas.

Pagal šiuos principus sukurtos linijinės sistemos vadinamos Kalman-Bucy filtrais, kuriems priklauso originalus šios srities darbas. Skirtingai nuo šių principų, integraliniame Vynerio filtravime procesų aprašymas atliekamas naudojant kovariacijos funkcijas, tiesines sistemas - naudojant impulsinį pereinamąjį atsaką, optimalius įverčius - kaip Wiener-Hopf integralinės lygties sprendimą.

Optimalaus Kalmano filtro diferencialinė lygtis kanonine forma yra tokia:

kur yra optimalaus filtro matricos stiprinimas.

Kalmano filtras atlieka dinamišką optimalų nestacionarių atsitiktinių procesų filtravimą. Optimalios filtravimo problemos sprendimas yra vektoriaus matricos diferencialinių (arba skirtumų) lygčių sistemos sprendimas. Šis metodas leidžia valdyti uždarą lygčių sistemą pasikartojančia forma, kuri yra patogiausia techniniam įgyvendinimui. Iš esmės Kalmano filtras yra skaičiavimo informacijos apdorojimo algoritmas, kuris naudoja a priori informacijos apie pradinę sistemą kompleksą (struktūrą, parametrus, būsenos triukšmo ir matavimo triukšmo statistines charakteristikas, informaciją apie pradines sąlygas ir kt.). Šis filtras gamina statistinis apdorojimas stebėjimo informaciją, atsižvelgiant į šaltinio sistemos modelio dinamines savybes. Kalmano filtro struktūra yra originalios dinaminės sistemos modelis su filtravimo klaidų taisymu naudojant korekcijos signalą

kur yra formos koregavimo signalas:

Šiuo atveju optimalus nestacionarus dinaminis Kalmano filtras yra uždara automatinė valdymo sistema, turinti matematinį pradinės sistemos modelį, o modelio išvestyje generuojamas būsenos įvertinimas ir korekcinis signalas su nestacionaria matrica. pelnas gaunamas įėjime K(t):


Vadinasi, dinaminio filtravimo algoritmas remiasi klasikiniu nukrypimų valdymo principu su matricos stiprinimo K(t) principu, suteikiančiu minimalią vidutinę kvadratinę filtravimo paklaidą. Koreguojantis signalas susideda iš pradinės sistemos būsenos dabartinio stebėjimo signalo z(t), papildyto pradinės sistemos modelio būsenos einamuoju signalu. Signalas yra filtravimo klaidų taisymo signalas ir charakterizuoja Papildoma informacija tarp dabartinių matavimų z(t) ir būsenos įverčių, gautų iš įverčių, gautų prieš dabartinius matavimus z(t), rezultatų. Optimalaus Kalmano filtro matricos diagrama yra tokia, kaip parodyta Fig. 4.18. Šioje schemoje realizuojamas dinaminis filtravimo algoritmas, kai pradinės sistemos būsena nurodoma diferencialinėmis lygtimis, kurių dešinioji pusė nuo stebėjimo nepriklauso.

Optimalus diskretiškasis Kalmano filtravimas ypač paplito plėtojant diskrečius informacijos apdorojimo metodus. Tai nuolatinio optimalaus dinaminio filtravimo rezultatų išplėtimas iki diskrečiųjų dinaminių sistemų, aprašytų skirtumo vektorių-matricų lygtimis.

Ryžiai. 4.17. Optimalaus Kalmano filtro matricinė grandinė

Optimali lygtis linijinis filtras leidžia skaičiuoti balus nuosekliai. Apskaičiuojant balą, naudojamos tik ankstesnės balo reikšmės ir parametro numeris. Laiko įverčio vertė apskaičiuojama iš laiko įvertinimo, pridedant svertinį skirtumą tarp matavimo metu ir įvertinimo laike. Šis įverčių apskaičiavimo metodas vadinamas rekursiniu. Taigi, diskretiškasis Kalmano filtras pasikartojančioje formoje atlieka rekursinę procedūrą, skirtą nuoseklių įverčių skaičiavimui, kuriai kiekviename žingsnyje reikia įsiminti nedidelį skaičių skaičiavimo rezultatų.

Diskretaus Kalmano filtro matricos grandinė parodyta Fig. 4.19 kartu su originalios dinaminės sistemos ir matavimo sistemos modeliais.

Ryžiai. 4.18. Diskretinio Kalmano filtro matricinė grandinė

Filtravimo lygties išvedimo pagrindas yra dinaminės sistemos būsenos lygtys ir stebėjimo (matavimo) lygtis. Tiesinės dinaminės sistemos būsenos lygtis apibūdinama vektoriaus matricos formos skirtumų lygčių sistema:

kur - pereinamoji matrica dimensijos būsenos , -dinaminės sistemos matmenų būsenos vektorius; - trikdžių matrica arba dimensijos įvesties signalas; - -atsitiktinės Gauso sekos matmenų vektorius.

Matavimo sistemos modelio išvestyje gaunamo signalo stebėjimo (matavimo) lygtis aprašoma skirtumo vektoriaus lygtimi:




kur yra stebėjimo (matavimo) matmenų vektorius; -atsitiktinės Gauso nekoreliuotos matavimo paklaidų sekos, iškreipiančios dinaminės sistemos būsenos stebėjimo rezultatą, matmenų vektorius; matmenų matmenų matrica

Tarkime, kad yra žinomas sistemos būsenos šiuo metu įvertinimas ir perėjimo matrica. Tada šis įvertinimas gali būti laikomas pradiniu, o įvertis tam tikru momentu gali būti apskaičiuotas pagal lygtį:


Šis įvertinimas yra prognozuojamas (ekstrapoliuotas) iš ankstesnių stebėjimų. Jį skaičiuojant nebuvo naudojamas paskutinis šiuo metu atliktas dinaminės sistemos būklės matavimas. Tai sukels klaidų įvertinant sistemos būsenos vektorių. Įvertinimo paklaida šiuo metu per perėjimo matricą apima visus vėlesnius įvertinimus , o per ilgą filtro veikimo laikotarpį gali kauptis klaidos ir gauti nepatenkinamus rezultatus. Įvertinimą galima pagerinti naudojant matavimus tam tikru momentu ir generuojant pataisos signalą: . Iš čia

Pakeitę (9.14) į šią išraišką, gauname diskretinio Kalmano filtro lygtį kanonine forma:

Optimalus tokio filtro perdavimo koeficientas turėtų užtikrinti mažiausią vidutinę kvadratinę filtravimo paklaidą pagal sąlygą (4.152).

Kontroliniai klausimai prie 4 skyriaus

1. Kokie sprendimų priėmimo kriterijai taikomi DUJŲ NK?

2. Kokie yra „Idealaus stebėtojo“, „Nayman-Pearson“ ir „Wald“ aptikimo kriterijų panašumai ir skirtumai?

3. Kokia yra teisingo aptikimo, teisingo neaptikimo, praleisto signalo ir klaidingo pavojaus signalo tikimybių fizinė esmė?

4. Kaip netikro pavojaus signalo tikimybė „tam tikrame taške“ skiriasi nuo kelių kanalų sistemos?

5. Kaip parenkamas aptikimo slenkstis įgyvendinant Neyman-Pearson kriterijų?

6. Kaip parenkamas aptikimo slenkstis įgyvendinant Kotelnikovo-Siegerto kriterijų?

7. Kaip parenkamas aptikimo slenkstis įgyvendinant Wald aptikimo kriterijų?

8. Koks yra koreliacijos imtuvo ir suderinto filtro tinkamumas ir savybės?

9. Kokia yra vertinimo pagrįstumo esmė?

10. Kokia yra vertinimo efektyvumo esmė?

11. Kokia yra nešališko vertinimo esmė?

12. Kas yra Fišerio informacijos matrica?

13. Kaip konstruojamas sonarui būdingas krypties nustatymas?

14. Kaip formuojamas ženklų žodynas ir sonaro objektų vaizdų abėcėlė?

15. Kuo adekvatumas ir skirtumas tarp sonaro objektų klasifikavimo ir atpažinimo sąvokų?

TOMSK VALSTYBINIO UNIVERSITETO BIULETENIS 2011 Vadyba, kompiuterių technologijos ir informacijos mokslas Nr. 3(16) UDK 517.511 V.I. Smaginas, S.V. Smagin FILTRACIJA TIESINIUOSE DISKREČIUOSE NESTAČIUOSE SISTEMOSE SU NEŽINOMIS TRŪKDIMIS Nagrinėjamas optimalaus filtro sintezės algoritmas, kuris nustato diskrečios tiesinės nestacionarios dinaminės sistemos su adityviais trikdžiais, turinčios nežinomą pastovų komponentą, būsenos vektoriaus įvertinimą. Pateikiami skaičiavimo eksperimento rezultatai. Raktažodžiai: tiesinės diskretinės nestacionarios sistemos, Kalmano filtras, nežinomi trikdžiai. Daugelio autorių darbuose didelis dėmesys daugiausia dėmesio skiria Kalmano filtravimo algoritmų, skirtų nežinomų priedų trikdžių ir parametrų sistemų klasei, kūrimui, kurie gali būti naudojami kaip realių fizinių sistemų modeliai, objektų su nežinomais gedimais modeliai. Žinomi būsenos vektoriaus įverčių skaičiavimo metodai yra pagrįsti algoritmais, naudojantys nežinomo trikdymo įverčius. Straipsniuose aptariami būsenos erdvės išplėtimo algoritmai (prie pagrindinio objekto modelio pridedamas nepastebimų trikdžių modelis) ir dviejų pakopų filtravimo algoritmas, kuris sumažina skaičiavimo kaštus dėl problemos išskaidymo. Straipsniuose buvo tiriami pasikartojantys optimalūs filtravimo algoritmai, kuriuose naudojami nežinomų trikdžių įverčiai, kurių išsprendžiamumas yra gana griežtas. Šiame darbe diskretiškam nestacionariam objektui su nežinomu pastoviu trikdžių komponentu siūlomas optimalus filtravimo metodas, kuriame nenaudojami nežinomo trikdymo įverčiai. Metodas pagrįstas modelio transformavimu ir sumažinimu iki tiesinio Kalmano filtravimo problemos. IN Šis straipsnis rezultatai apibendrinami nestacionaraus diskretiško objekto problemos sprendimo atveju. 1. Uždavinio teiginys Nagrinėjame diskrečiąją sistemą, kuri apibūdinama tokiomis skirtumo lygtimis: x(k + 1) = A(k) x(k) + f + q (k), x(0) = x0 , (1) čia x( k) ∈ R n – būsenos vektorius; A(k) – n×n matrica; f – nežinomas pastovus vektorius; q(k) – baltas Gausas atsitiktinė seka kurių charakteristikos M (q (k)) = 0, M(q(k)q Τ (j)) = Q(k)δk, j. (2) Stebėjimo kanalas turi formą y (k) = S (k) x(k) + v(k) , (3) y (k) ∈ R l – matavimo vektorius; S(k) – l × n matmenų matrica; v(k) – baltas gauss- V.I. Smaginas, S.V. Smagin 44 Sov atsitiktinė matavimo paklaidų seka, kurios charakteristikos: M(v(k)) = 0, M(q (k)v Τ (j)) = 0, M(v(k)v Τ (j)) = V (k)δi , j ; (4) matricų (S(k), A(k)) stebėjimo sąlygos tenkinamos. Vektorius x0 yra atsitiktinis ir nepriklauso nuo procesų q(k) ir v(k), kai M(x(0)) = x0 , M ((x(0) − x0)(x(0) − x0 ) T ) = P0 . Sistemai (1) ir stebėjimo kanalui (3) reikia susintetinti filtrą, kuris apskaičiuoja būsenos vektoriaus įvertį nenaudojant nežinomo pastovaus trikdžių komponento įverčių. 2. Filtro sintezė Transformuokime diskrečiąją sistemą (1). Iš objekto aprašymo neįtraukiame nuolatinio trikdžių komponento f, iš (1) lygties atimdami tą pačią lygtį, bet paslinktą vienu laikrodžio ciklu: x(k) = A(k − 1) x(k − 1) + f + q(k − 1) . (5) Kaip rezultatas, mes gauname sekančią lygtį: x(k + 1) = (A(k) + En) x(k) − A(k − 1) x(k − 1) + q (k) − q(k − 1) . (6) Išplėskime sistemos būsenų erdvę, prie (6) lygties pridėdami tapatybę x(k) = x(k) . Pažymime x(k) ⎞ ⎛ q(k) − q(k − 1) ⎞ . X (k) = ⎛⎜ ⎟ ⎟ , q (k) = ⎜ 0 ⎝ ⎠ ⎝ x(k − 1) ⎠ Pavaizduokime sistemą (1) vektorinės matricos forma X (k + 1) = A(k) X (k) + q (k), X (0) = X 0, (7) (8) kur A(k) – 2n × 2n matrica turi tokią blokų struktūrą: ⎛ A(k) + En A(k) ) = ⎜ En ⎝ − A(k − 1) ⎞ ⎟. 0 ⎠ (9) Atsitiktinis vektorius X 0 = (x0Τ x−Τ1)Τ turi tokias charakteristikas: M( X (0)) = X 0, M ((X 0 − X 0)(X 0 − X 0)Τ ) = P0 , (x0Τ (10) x−Τ1)Τ kur X 0 = . Atkreipkite dėmesį, kad čia papildomai įvedame n matmenų vektorių x−1, kuris nepriklauso nuo q(k) ir v(k), o charakteristikas (10) galima gauti iš a priori informacijos apie objektą (1). Atkreipkite dėmesį, kad nagrinėjamame modelyje (8) procesas q (k) nėra baltoji Gauso seka, procesai q (k) ir q (k − 1) bus koreliuojami: jei j = k, ⎧ Q (k), ⎪ M(q (k)q (j)) = ⎨Q (k − 1), jei j = k − 1, ⎪ 0, jei 0 ≤ j< k − 1, ⎩ (11) Q(k) + Q(k − 1) 0 ⎞ ⎛ −Q(k − 1) 0 ⎞ . Q(k) = ⎛⎜ ⎟ , Q (k − 1) = ⎜ 0 0 0 0 ⎟⎠ ⎝ ⎠ ⎝ (12) Τ где Фильтрация в линейных дискретных нестационарных системах 45 Представим канал наблюдений для расширенной системы (8) в виде y (k) = S (k) X (k) + v(k) , (13) где S (k) = (S (k) 0) , v(k) − случайная последовательность ошибок измерений с характеристиками (4). В качестве уравнения для вычисления оценки вектора состояния расширенной системы выберем уравнение, по своей структуре совпадающее с фильтром Калмана: Xˆ (k + 1) = A(k) Xˆ (k) + K (k)(y (k + 1) − S (k + 1) A(k) Xˆ (k)) , Xˆ (0) = X . (14) 0 Учитывая (8) и (14), получим следующее уравнение для ошибки e(k) = Xˆ (k) − X (k) : e(k + 1) = (A(k) − K (k) S (k + 1) A(k))e(k) + K (k)v(k + 1) + (K (k) S (k + 1) − E2 n)q (k) . (15) В силу (11) и (15), матрица P (k) = M{e(k)eΤ (k)} определится из следующего разностного уравнения: P (k + 1) = (A(k) − K (k) S (k + 1) A(k)) P (k)(A(k) − K (k) S (k + 1) A(k))Τ + +(K (k) S (k + 1) − E2 n)Q (k)(K (k) S (k + 1) − E2 n)Τ + K (k)V (k + 1) K Τ (k) + +(A(k) − K (k) S (k + 1) A(k))(K (k − 1) S (k) − E2 n) × ×Q (k − 1)(K (k) S (k + 1) − E2 n)Τ + (K (k) S (k + 1) − E2 n) × ×Q (k − 1)(K (k − 1) S (k) − E2 n)Τ (A(k) − K (k) S (k + 1) A(k))Τ , P (0) = P0 . (16) Оптимизируемый критерий зададим в виде J (k + 1) = trP (k + 1) . (17) Оптимальные коэффициенты передачи фильтра K(k) определяются из условия dJ (k + 1) =0. (18) dK (k) Учитывая (17) и правую часть уравнения (16), применяя правила матричного дифференцирования следа от матрицы , получим из условия (18) уравнение для определения матрицы K(k): − A(k) P (k) A(k)Τ S (k + 1)Τ + K (k) S (k + 1) A(k) P (k) A(k)Τ S (k + 1)Τ + + K (k) S (k + 1)Q (k) S (k)Τ − Q (k) S (k + 1)Τ − K (k) S (k + 1)Q (k − 1) × ×S (k)Τ K (k − 1)Τ A(k)Τ S (k + 1)Τ + K (k) S (k + 1)Q (k − 1) A(k)Τ S (k + 1)Τ − − K (k) S (k + 1) A(k) K (k − 1) S (k)Q (k − 1) S (k + 1)Τ + + K (k) S (k + 1) A(k)Q (k − 1) S (k + 1)Τ + Q (k − 1) S (k)Τ K (k − 1)Τ × × A(k)Τ S (k + 1)Τ − Q (k − 1) A(k)Τ S (k + 1)Τ − A(k)Q (k − 1) S (k + 1)Τ + + A(k) K (k − 1) S (k)Q (k − 1) S (k + 1)Τ + K (k)V (k + 1) = 0 . (19) Решение последнего уравнения относительно K(k) дает следующий результат: K (k) = P (k) S (k + 1)Τ (S (k + 1) P (k) S (k + 1)Τ + V (k + 1)) −1 , (20) 46 В.И. Смагин, С.В. Смагин где P (k) = A(k) P (k) A(k)Τ + Q (k − 1)(E2 n − S (k)Τ K (k − 1)Τ) A(k)Τ + + A(k)(E2 n − K (k − 1) S (k))Q (k − 1) + Q (k) . (21) Отметим, что для вычисления коэффициентов передачи (20), в силу (21), необходимо задать начальные значения коэффициентов K(−1). Подставив в уравнение (16) выражение для оптимального коэффициента передачи (20), получим уравнение P (k + 1) = (E2 n − K (k) S (k + 1)) P(k) , P (0) = P0 . (22) Основной результат сформулируем в виде теоремы, учитывая симметричность и блочное представление матриц P (k) и P (k) : ⎛ p (k) P(k) = ⎜ 1 ⎝ p2 (k) ⎛ p (k) p2Τ (k) ⎞ , P (k) = ⎜ 1 p3 (k) ⎟⎠ ⎝ p2 (k) p2Τ (k) ⎞ , p3 (k) ⎟⎠ (23) блочные структуры матриц A(k), Q(k), Q (k), S (k) и представление матрицы K (k) в виде ⎛ K (k) ⎞ K (k) = ⎜ 1 ⎟ . (24) ⎝ K 2 (k) ⎠ Теорема. Пусть процесс с неизвестным постоянным возмущением определяется уравнениями (1) и канал наблюдений имеет вид (3). Тогда оптимальный алгоритм фильтрации определится следующими разностными уравнениями: xˆ (k + 1) = (A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1) + K1 (k)(y (k + 1) − − S (k + 1)[(A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1)] (25) с pradines sąlygas xˆ(0) = x0 , xˆ(1) = M(x(1)) = x1 . Matrica K1 (k) (25) nustatoma pagal formulę (26) K1 (k) = p1 (k) S (k + 1)T (S (k + 1) p1 (k) S (k + 1) )T + V (k + 1)) −1, kur matrica p1 (k) apskaičiuojama iš lygčių sistemos (27) p1 (k) = (A(k) + En) p1 (k)(A( k) + En)Τ − A(k − 1) p2 (k)(A(k) + En)Τ − −(A(k) + En) p2Τ (k) A(k − 1)Τ + A( k − 1) p3 (k ) A(k − 1)Τ + Q(k − 1) S (k)Τ K1 (k − 1)Τ × ×(A(k) + En)Τ − Q(k − 1) S (k)Τ K 2 (k − 1)Τ AΤ (k − 1) + +(A(k) + En) K1 (k − 1) S (k)Q(k − 1) − A( k − 1) K 2 ( k − 1) S (k) × ×Q(k − 1) − (A(k) + En)Q(k − 1) − Q(k − 1)(A(k) + En)Τ + Q( k) + Q(k − 1) , p2 (k) = p1 (k)(A(k) + En)Τ − p2Τ (k) A(k − 1)Τ + + K1 (k − 1) S ( k)Q(k − 1) − Q(k − 1) , p3 (k) = p1 (k) , p1 (k + 1) = (En − K1 (k) S (k) + 1)) p1 (k ) , p1 (0) = p1,0 , p2 (k + 1) = − K 2 (k) S (k + 1) p1 (k) + p2 (k) , p2 (0 ) = p2,0 , p3 (k + 1) = − K 2 (k) S (k + 1) p2Τ (k) + p3 (k) , p3 (0) = p3,0 , K 2 (k) = p2 (k) S (k + 1)Τ (S (k + 1) p1 (k) S (k + 1)T + V (k + 1)) −1. (28) Filtravimas tiesinėse diskrečiose nestacionariose sistemose 47 (28) pradinės sąlygos p1,0, p2,0, p3,0 yra atitinkami matricos P0 blokai. Atkreipkite dėmesį, kad norint atlikti skaičiavimus (28), būtina nustatyti pradines sąlygas K1 (−1) ir K 2 (−1). komentuoti. Valdomas objektas x(k + 1) = A(k) x(k) + B(k)u (k) + f + q(k), x(0) = x0 , (29) neįskaitant nežinomo pastovaus trikdymo f objektą, reikia jį transformuoti į formą, kuri nuo (8) skirsis vienu nariu: X (k + 1) = A(k) X (k) + B (k)(u (k) − u ( k − 1) + q (k), X (0) = X 0, (30) kur matrica A(k) pateikta (9) formulėje, q (k) turi charakteristikas (11), (12) ( 30) matrica B (k) yra B (k) ⎞ B (k) = ⎛⎜ ⎟ ⎠ Tada filtro lygtys bus tokios: (31) xˆ (k + 1) = (A). (k) + En) xˆ (k) − A(k − 1) xˆ (k − 1) + B(k)(u (k) − u (k − 1)) + K1 (k)(y (k) + 1) − − S (k + 1) [(A(k) + En) xˆ (k) − A(k − 1) xˆ (k − 1) + B(k)(u (k) − u ( k − 1))] , (32) su pradinėmis sąlygomis (26), o matrica K1 (k) nustatoma pagal (27) ir (28) Skaičiavimo eksperimento rezultatai Panagrinėkime filtravimo taikymą algoritmas antros eilės modeliui (1) ir stebėjimo kanalui (3) su. su šiomis reikšmėmis parametrai: 0 1 0 ⎞ ⎞ ; Q = ⎛ 0,01; V = 0,9; A(k) = ⎛⎜ ⎟ ⎜ 0 0, 02 ⎟⎠ ⎝ ⎝ 0, 05 0,925 + 0,1 sin(0, 01 k) ⎠ 1, 0 1, 0 0 ⎞ S = (1 1) ; x0 = ⎛⎜ ⎞⎟ ; P0 = ⎛⎜ (33) ⎟. ⎝ 1.5 ⎠ ⎝ 0 1, 0 ⎠ Vektoriaus x(k) įverčių apskaičiavimas gali būti atliktas naudojant dviejų pakopų filtravimo algoritmą. Šiuo atveju matavimo modelis, atsižvelgiant į (1), pavaizduotas kaip y (k + 1) = Sx(k + 1) + v(k + 1) = SA(k) x(k) + Sf + Sq( k) + v(k + 1) . (34) Pasikartojančios lygtys, skirtos įvertinti nežinomą vektorių f, yra tokios formos: fˆ (k + 1) = fˆ (k) + K (k) (y (k + 1) − SA(k) xˆ (k) − Sfˆ (k) )) , fˆ (0) = f , 0 f Τ Τ Τ −1 K f (k) = Pf (k) S (SPf (k) S + SQS + V) , kur Pf (k + 1) = (E2 − K f (k) S) Pf (k), Pf (0) = Pf0, (35) M( f ) = f 0, M((f − f 0)(f − f 0)Τ ) = Pf0. (36) V.I. Smaginas, S.V. Smagin 48 Būsenos vektoriaus įvertinimas objektui, kurio pastovioji įvestis nežinoma, pateikiama pagal lygtį: xˆ (k + 1) = A(k) xˆ (k) + fˆ (k) + K (k)(y (k) + 1) − SA(k ) xˆ (k) − Sfˆ (k)) , (37) x kur matrica K x (k) nustato Kalmano filtro perdavimo koeficientus. Modeliuodami naudojame 0 1, 0 0 ⎞ f 0 = ⎛⎜ ⎞⎟ , Pf0 = ⎛⎜ (38) ⎟. ⎝0⎠ ⎝ 0 1, 0 ⎠ Šiam pavyzdžiui taikant išplėstinį Kalmano filtrą (šiuo atveju (1) lygtis išplečiama pridedant lygtį f(k+1) = f(k)) lemia poreikį sukurti Kalmano filtrą diskreti sistema su šiomis dinamikos, stebėjimo kanalo ir adityviųjų trikdžių intensyvumo matricomis: Q 0⎞ ⎛ A(k) E2 ⎞ , (S 0) , ⎛⎜ (39) ⎟. ⎜ 0 E2 ⎟⎠ ⎝ 0 0⎠ ⎝ Šiame pavyzdyje panaudoti darbuose aprašytus metodus neįmanoma, nes netenkinamos nežinomo įvesties vektoriaus optimalių įverčių egzistavimo sąlygos: n≥m ir l≥m. (40) Nežinomas trikdis apibrėžiamas kaip f = Gd, kur d yra nežinomas m matmenų vektorius, G yra n × m žinoma matrica. Nagrinėjamame pavyzdyje G = E2, n = 2, m = 2, l = 1, o tai reiškia, kad sąlygos (40) netenkinamos. Taip pat buvo tiriamas filtravimo algoritmo taikymas nežinomam kintamajam trikdžiui su trimis galimas vertes vektoriaus f komponentai: ⎧ 1, jei 0 ≤ k ≤ 9, ⎪ f1 (k) = f 2 (k) = ⎨ −1, jei 9< k < 25, ⎪ 1, если 25 ≤ k ≤ 50. ⎩ На рис. 1 приведены реализации процессов и их оценок для трех сравниваемых фильтров. Отметим, что при реализации алгоритма фильтрации (25), начальные значения K1 (−1) и K 2 (−1) задавались нулевые. x1(k) x1(k) x2(k) x2(k) 2 10 0 –10 0 3 4 20 30 40 k –10 0 4 1 0 1 10 3 10 2 10 20 30 40 k Рис. 1. Реализации процессов и оценок (1 – реализация x(k); 2 – оценка, построенная по алгоритму (25); 3 – оценка, построенная по двухэтапному алгоритму; 4 – оценка для расширенного фильтра Калмана) Фильтрация в линейных дискретных нестационарных системах 49 На рис. 2 приведены ошибки оценивания компонент вектора состояния. e1(k) 4 2 e2(k) 4 3 1 0 –2 –4 –6 0 2 2 3 1 0 2 –2 10 20 30 40 k –4 0 10 20 30 40 k Рис. 2. Графики ошибок фильтрации (1 – ошибка для оценки, построенной по алгоритму (25); 2 – ошибка для оценки, построенной по двухэтапному алгоритму; 3 – ошибка для расширенного фильтра Калмана) Как видно из рисунков для рассмотренного примера, качество оценок, полученных с помощью фильтра (25), лучше, чем для двухэтапного алгоритма фильтрации и расширенного фильтра Калмана, использующих оценки неизвестного возмущения. Отметим также, что для алгоритма фильтрации (25) не нужно задавать априорную информацию о характеристиках распределения начальных значений f 0 и Pf0 . Ниже, в таблице, приведены средние значения среднеквадратических ошибок оценивания для трех рассматриваемых методов, рассчитанных по 50 реализациям. Как видно из таблицы, предложенный метод фильтрации (25) обеспечивает vidutinė klaida 3–4 kartus mažiau nei kitais būdais. Būsenos vektoriaus komponentų vidutinių kvadratinių paklaidų reikšmės Algoritmas (25) e1,avg = 0,0912 Dviejų pakopų algoritmas e1,avg = 0,3128 Išplėstinis Kalmano filtras e1,avg = 0,4103 e2,avg4 =g 0.209 =g 0 ,2917 e2,av = 0,4296 Išvada Sukurtas algoritmas diskretiniam optimaliam nestacionariam objektui, kurio trikdžiuose yra nežinomas pastovus komponentas, sintezei. Algoritmas sudarytas remiantis būsenos erdvės išplėtimu ir nežinomo komponento pašalinimu iš modelio. Skirtingai nuo klasikinio Kalmano filtro, siūlomas filtras naudoja pasikartojančius įverčius, pagrįstus dviem ankstesniais veiksmais. Kaip parodė skaičiavimo eksperimento rezultatai, algoritmas gali būti pritaikytas nuosekliai pastoviai nežinomam adityviam trikdžių komponentui. LITERATŪRA 1. Astrom K., Eykhoff P. Sistemos identifikavimas. Apklausa // Automatica. 1971. V. 7. P. 123−162. 2. Friedland B. Rekursyvaus filtravimo šališkumo gydymas // IEEE Trans. ant automato. Kontr. 1969. V. AC-14. P. 359−367. 3. Chen J., Patton R. J. Optimalus filtravimas ir patikima stochastinių sistemų su nežinomais trikdžiais gedimų diagnostika // IEE Proc. Valdymo teorijos taik. 1996. V. 143. P. 31–36. 50 V.I. Smaginas, S.V. Smagin 4. Darouach M., Zasadzinski M. Nešališkas minimalios dispersijos įvertinimas sistemoms su nežinomais išoriniais įėjimais // Automatica. 1997. V. 33. P. 717–719. 5. Darouach M., Zasadzinski M., Xu S. J. Pilnos eilės stebėtojai tiesinėms sistemoms su nežinomais įėjimais // IEEE Trans. ant automato. Kontr. 1999. V. AC-39. P. 606. 6. Gillijns S., Moor B. Nešališkas minimalios dispersijos įvestis ir būsenos įvertinimas tiesinėms diskretinio laiko sistemoms // Automatica. 2007. V. 43. P. 111–116. 7. Hou M., Patton R. Optimalus filtravimas sistemoms su nežinomais įėjimais // IEEE Trans. ant automato. Kontr. 1998. V. AC-43. P. 445–449. 8. Hsieh C.-S. Vieningas sprendimas nešališkam minimalaus dispersijos įvertinimui sistemoms su nežinomais įėjimais // Proc.17th World Congress The International Federation of Automatic Control. Seulas. Korėja. 2008 liepos 6 – 11. P. 14502–14509. 9. Hsieh C.-S. Tvirti dviejų pakopų Kalman filtrai sistemoms su nežinomais įėjimais // IEEE Trans. ant automato. Kontr. 2000. V. AC-45. P. 2374–2378. 10. Hsieh C.-S. Optimalaus nešališko minimalaus dispersijos filtro išplėtimas sistemoms su nežinomais įėjimais // Proc. 15-asis IEEE tarptautinis seminaras apie netiesinę elektroninių sistemų dinamiką. Tokušima. Japonija. 2007. P. 217–220. 11. Hsieh C. -S. Tvirtas parametrizuotas minimalios dispersijos filtravimas neapibrėžtoms sistemoms su nežinomais įėjimais // Proc. Amerikos kontrolės konferencija. Niujorkas. 2007, 5118–5123 p. 12. Kalman R.E., Busy R. Nauji tiesinio filtravimo ir prognozavimo teorijos rezultatai // Trans. ASME J. Pagrindinės inžin. 1961. V. 83. P. 95–108. 13. Brammeris K., Ziffling G. Kalman-Bucy filtras. M.: Nauka, 1972. 200 p. 14. Pugačiovas V.S., Sinicinas I.N. Stochastinės diferencialinės lygtys M.: Nauka, 1990. 630 p. 15. Smagin S.V. Filtravimas tiesinėse diskrečiose sistemose su nežinomais trikdžiais // Autometrija. 2009. T. 45. Nr 6. P. 29−37. 16. Amosovas A.A., Kolpakovas V.V. Skaliarinė matricinė diferenciacija ir jos taikymas konstruktyvioms komunikacijos teorijos problemoms // Informacijos perdavimo problemos. 1972. Nr.1. P. 3−15. Smagin Valerijus Ivanovičius Smagin Sergejus Valerijevičius Tomskis Valstijos universitetas El. paštas: [apsaugotas el. paštas]; [apsaugotas el. paštas] Redaktorius gavo 2010-12-06.

Ieškant optimalaus Vynerio filtro, buvo panaudota Wiener-Hopf integralinė lygtis, kurią sprendžiant buvo nagrinėjami stacionarūs atsitiktiniai procesai dažnių srityje. 1960 metais R. Kalmanas ir R. Bucy svarstė linijinio filtravimo laiko srityje problemą ir, pasitelkę „būsenos erdvės“ sąvoką, pasiūlė naują efektyvus metodas optimalių sistemų sintezė pagal minimalios matematinės atsitiktinės paklaidos kvadrato kriterijų, taikytiną tiek stacionariems, tiek nestacionariems Markovo atsitiktiniams procesams. Kadangi Kalmano ir Bucy vartojama „būsenos erdvės“ sąvoka remiasi prielaida, kad atsitiktinis procesas yra Markovo, jų požiūris į optimalių tiesinių sistemų sintezę kartais vadinamas Markovo optimalaus tiesinio filtravimo teorija.

Visų atsitiktinių procesų, nenaudojamų, aprašymas koreliacinės funkcijos arba spektrinius tankius, o diferencialinių lygčių arba būsenų lygčių pagalba Kalmanas ir Bucy parodė, kad esant atsitiktinėms įtakoms optimalus linijinė sistema(optimalus Kalmano-Bucy filtras) turi tenkinti tam tikrą nehomogeninių tiesinių diferencialinių lygčių sistemą. Rasti optimalią sistemą naudojant šias diferencialines lygtis yra daug lengviau nei naudojant Wiener-Hopf integralines lygtis, ypač nestacionarių atsitiktinių procesų atveju.

Optimalių filtrų lygčių išvedimą atliko Kalmanas ir Bucy daugiamačiams atsitiktiniams procesams. Susipažinkime su pagrindine Kalman-Bucy metodo idėja, naudodamiesi paprastesnių, tačiau praktikoje dažnai sutinkamų vienmačių filtrų pavyzdžiu.

Tarkime, kad sintezuojama sistema turi atkurti tam tikrą signalą, kuris bendru atveju yra nestacionarus atsitiktinis procesas. Tarkime, kad be šio signalo sistemos įėjime yra ir triukšmo

kuris bendru atveju yra nestacionarus atsitiktinis „baltojo triukšmo“ tipo procesas, kurio vidutinė vertė nulinė. Taigi bendras įvesties signalas

Norint gauti vienmačio optimalaus Kalmano-Bucy filtro lygtį, būtina, kad atsitiktinis procesas pirmiausia būtų pavaizduotas tokios formos pirmos eilės diferencialine lygtimi:

kur priklauso kokia nors laiko funkcija statistinės charakteristikos atsitiktinis procesas - nestacionarus atsitiktinis „baltojo triukšmo“ tipo procesas, kurio vidutinė vertė nulinė.

Nestacionarių atsitiktinių procesų koreliacinės funkcijos turi formą

kur yra nuolatinės, nuolat diferencijuojamos laiko funkcijos, ir

Ypatingu stacionarių atsitiktinių procesų atveju jų koreliacinės funkcijos

Jei atsitiktinis procesas sistemos išvestyje yra lygus , tai atsitiktinė sistemos klaida lygus skirtumui tarp atkuriamo signalo ir išvesties signalo turi tokią formą

Kalmanas ir Bucy parodė, kad optimali sistema (optimalus Kalman-Bucy filtras), užtikrinantis bet kuriuo metu signalo atkūrimą su minimaliu matematiniu atsitiktinės paklaidos kvadratu, turėtų būti aprašyta nehomogenine formos diferencialine lygtimi.

Taigi, sintezuojant optimalų Kalman-Byosi filtrą, problema redukuojama iki tokių laiko funkcijų diferencialinėje lygtyje (9.140), kurios užtikrintų minimalų matematinį kvadratinės atsitiktinės paklaidos lūkestį, t.y.

Darant prielaidą, kad atsitiktinis procesas pateikiamas forma (9.135), pateikiame be įrodymų formules, kaip rasti funkcijas, kurios užtikrina minimumą (9.141).

Prieš apibrėždami funkcijas, suraskite tam tikrą laiko funkciją, lygią atsitiktinės paklaidos kvadrato matematiniam lūkesčiui (klaidos dispersija):

jis apibrėžiamas kaip šios Riccati diferencialinės lygties sprendimas:

Norėdami išspręsti (9.143), turite žinoti pradinę reikšmę paprastai

Suradę funkciją, pagal formulę nustatykite funkciją

ir funkcija pagal formulę

Sunkiausias optimalių filtrų sintezės Kalmano-Bucy metodu etapas yra Riccati lygties (9.143) sprendimas. Apskritai tam reikia naudotis kompiuteriu.

Nepriklausomos reikšmės turi ir (9.143) lygties sprendinio egzistavimo, jo unikalumo ir stabilumo tyrimo klausimai.

Atsižvelgiant į (9.146), optimalaus Kalmano-Bucy filtro lygtis kartais rašoma taip:

Diferencialinė lygtis (9.140) atitinka optimalaus filtro blokinę schemą, parodytą fig. 9.19, a; diferencialinė lygtis (9.147) atitinka blokinę schemą, parodytą pav. 9.19, gim. Taigi, optimalus Kalman-Bucy filtras gali būti laikomas tam tikra dinamine sistema su grįžtamuoju ryšiu, turinčia blokinę diagramą, parodytą Fig. 9.19, a arba pav. 9.19, gim. Natūralu, kad abi šios struktūrinės diagramos yra lygiavertės.

Nestacionariems atsitiktiniams procesams funkcijos priklauso nuo laiko, o optimalus Kalman-Bucy filtras yra nestacionarus.

Stacionariems atsitiktiniams procesams funkcijos ir taip pat pastovioje būsenoje nepriklauso nuo laiko, todėl optimalus Kalman-Bucy filtras šiuo atveju yra stacionarus, nulemtas diferencialinės lygties su pastovūs koeficientai

Sistema, aprašyta pagal (9.148), pastovioje būsenoje savo išvestyje atkurs stacionarią atsitiktinis signalas su mažiausia vidutine kvadratine paklaida.

Natūralu, kad stacionarių procesų rezultatai, gauti taikant Kalman-Bucy metodą ir Wiener metodą, sutampa. Lygtis (9.148), gauta laiko srityje, yra lygiavertė optimaliam Vynerio filtrui, apibrėžtam dažnio srityje pagal (9.125) lygtį.

Trumpai apsistokime ties Kalmano-Bucy filtrams labai svarbiu klausimu apie galimybę pavaizduoti atsitiktinį procesą diferencialinės lygties (9.135) forma.

Radimas (9.135) yra susijęs su uždaviniu nustatyti formuojantį filtrą (stacionarų ar nestacionarų), kuris, veikiamas baltojo triukšmo jo įėjime, leidžia gauti tam tikrą atsitiktinį procesą jo išvestyje formavimo filtras pagal (9.135) gali būti pavaizduotas taip, kaip parodyta ryžiuose. 9.20.

Stacionariems atsitiktiniams procesams formavimo filtrų parametrų nustatymo metodai yra gerai išvystyti. Tokiais atvejais formuojantis filtras gali būti aprašytas įprasta diferencialine lygtimi su pastoviais koeficientais arba atitinkama formavimo filtro perdavimo funkcija. Formavimo filtro perdavimo funkciją ypač lengva rasti tuo atveju, kai stacionaraus atsitiktinio proceso spektrinio tankio išraiška turi trupmeninės racionalios dažnio funkcijos formą, tai yra, kai spektrinio tankio išraiška gali būti pavaizduotas kaip dviejų sudėtingų konjuguotų veiksnių sandauga:

Tegul formuojamojo filtro įėjime veikia stacionarus atsitiktinis „baltojo triukšmo“ signalas, turintis spektrinį tankį spektrinis tankis signalas formavimo filtro išvestyje

Atsižvelgdami į (9.149), galime rašyti

kur yra formavimo filtro dažnio perdavimo funkcija

Pakeitę paskutinę išraišką, gauname formavimo filtro perdavimo funkcijos išraišką

Žinodami formuojamojo filtro perdavimo funkciją, randame (9.135) formos diferencialinę lygtį, susiejančią atsitiktinius procesus

Jei spektrinis tankis nėra trupmeninė racionali dažnio funkcija arba gaunamas eksperimentiniu būdu, tada norint rasti formavimo filtrą, pirmiausia jį reikia aproksimuoti trupmeninė racionali funkcija dažnius.

Apibendrinant, reikia pažymėti, kad jei įvesties įtaka yra stacionarūs atsitiktiniai procesai, tai Kalman-Bucy metodas neturi pranašumų prieš optimalių Wiener filtrų sintezės metodą. Šis metodas daugiausia naudojamas optimaliems nestacionariems linijiniams filtrams susintetinti.

Tai taip pat leidžia gana paprastai rasti optimalaus filtro struktūrą ir parametrus net ir tuo atveju, kai atkuriamas signalas apibūdinamas polinomu su atsitiktiniais koeficientais:

kur yra atsitiktiniai dydžiai su žinomomis statistinėmis charakteristikomis.

Optimalių linijinių Kalmano-Bucy filtrų sintezė, iš pradžių atlikta trikdžiams baltojo triukšmo pavidalu, buvo toliau plėtojama bendresniems atvejams, pavyzdžiui, koreliuojamų trukdžių, turinčių nevienodą spektrinį tankį, atveju. netiesinis filtravimas ir kt. Galiausiai atkreipkime dėmesį, kad optimalūs Kalman-Bucy filtrai, kaip ir optimalūs Wiener filtrai, leidžia išspręsti ne tik optimalaus atkūrimo problemą

signalas triukšmo fone (filtravimas), bet ir statistinio numatymo, statistinės diferenciacijos ir kt.

9.8 pavyzdys. Tiesinio sekimo sistemos įėjime yra stacionarus atsitiktinis procesas, kurio spektrinis tankis

ir atsitiktinis „baltojo triukšmo“ tipo triukšmas, turintis spektrinį tankį

Koeficientų skaitinės reikšmės

Kalman-Bucy metodu nustatykite optimalią sistemos perdavimo funkciją, užtikrinančią minimalią vidutinę kvadratinę paklaidą.

1. Kadangi sistema skirta atkurti naudingą signalą, konvertuojantis operatorius atkuria signalą, todėl

Pagal (9.149) spektrinio tankio išraišką pateikiame sudėtingų konjuguotų faktorių sandaugos forma

ir randame

2. Atsižvelgiant į duotą stacionarų atsitiktinį procesą kaip kokio nors formuojančio filtro reakciją į stacionarų atsitiktinį „baltojo triukšmo“ tipo procesą, turintį spektrinį tankį, šio formavimo filtro dažnio perdavimo funkciją randame naudodami (9.150):

3. Raskite formavimo filtro perdavimo funkciją:

4. Gauta formavimo filtro perdavimo funkcija atitinka šią diferencialinę lygtį, susijusią su atsitiktiniais procesais

Norėdami pateikti paskutinę diferencialinę lygtį į formą (9.135), darome prielaidą, kad baltojo triukšmo spektrinis tankis yra tada ir galutinis atsitiktinis procesas gali būti pavaizduotas kaip

480 rub. | 150 UAH | 7,5 USD ", MOUSEOFF, FGCOLOR, "#FFFFCC", BGCOLOR, "#393939");" onMouseOut="return nd();"> Disertacija - 480 RUR, pristatymas 10 minučių, visą parą, septynias dienas per savaitę ir švenčių dienomis

Biriukovas Ruslanas Sergejevičius. Diskretus apibendrintas H-optimalus valdymas ir filtravimas tiesiniuose ištisiniuose objektuose: disertacija... Fizinių ir matematikos mokslų kandidatas: 01.01.09 / Biriukovas Ruslanas Sergeevičius;[Gynimo vieta: Federalinė valstybinė aukštojo mokslo institucija "Nacionalinių tyrimų Nižnij Novgorodo valstija Universitetas pavadintas. N.I. Lobačevskis “], 2017 m

Įvadas

1 skyrius. Linijinių diskrečių sistemų apibendrinto valdymo ir filtravimo teorijos apžvalga 8

1. Apibendrinta -tiesinio objekto norma 8

2. Apibendrintos kontrolės sintezė 11

3. Apibendrinto -filtro sintezė 13

2 skyrius. Apibendrinta - tęstinio objekto su atskira tiksline išvestimi norma 15

1. Ištisinio-diskrečiojo objekto trikdžių slopinimo lygis 15

2. Blogiausi išoriniai trikdžiai ir pradinė būsena nuolat diskretiškame objekte 28

3. Trikdžių slopinimo lygis diskrečiame-diskrečiame objekte 32

4. Blogiausi išoriniai trikdžiai ir pradinė būsena diskrečiame diskrečiame objekte 49

5. Trikdžių slopinimo lygis begalinio horizonto atveju 56

6. Trikdžių slopinimo lygio apibūdinimas pagal LMI 61

7. 64 išvados

3 skyrius. Diskreti apibendrinta optimali kontrolė 66

1. Optimalaus valdymo sintezė remiantis 66 būsena

2. 74 išėjimo optimalaus valdymo sintezė

3. Elektromagnetinis pakabos valdymas 94

4. 101 išvados

4 skyrius. Diskretus apibendrintas - optimalus filtravimas 102

1. Optimalaus filtro 102 sintezė

2. Duomenų filtravimas sprendžiant pastatų vibracijų slopinimo problemą 108

3. 114 išvados

115 išvada

Bibliografija

Įvadas į darbą

Tyrimo temos aktualumas.Šiuolaikinės valdymo sistemos, kaip taisyklė, yra įdiegtos skaitmenine forma, o dauguma realių objektų veikia nepertraukiamu laiku. Toks padalijimas į analogines ir skaitmenines dalis praranda informaciją, nes nuolatinio signalo, gaunamo iš objekto į valdiklį, reikšmės žinomos tik fiksuotais diskretiniais laiko momentais. Dėl šios priežasties tampa svarbi užduotis atskiro valdiklio, kuris kiek įmanoma labiau atsižvelgia į pradinio objekto elgesį tarp matavimų, analizė ir sintezė. Priklausomai nuo objektą veikiančių išorinių trikdžių klasių ir galutinių valdymo tikslų, skirtingus požiūrius išspręsti šią problemą. Ypatingas susidomėjimas reiškia atvejį, kai objektas yra veikiamas išorinių trikdžių su ribota „energija“, o valdymo tikslas yra sumažinti bendrą objekto tikslinės išvesties „energiją“. Šiuo atveju problema yra diskrečiojo %00 optimalaus nuolatinio objekto valdymo, naudojant diskretinio laiko matavimus, problema.

Siekiant išspręsti šią problemą, buvo pasiūlyti įvairūs metodai. Vienas iš pirmųjų buvo požiūris, pagrįstas originalios ištisinės sistemos su diskreti išvestis kaip ištisinis-diskretusis, kurio elgsena apibūdinama diferencialinių ir skirtumų lygčių rinkiniu (Sun W., Nagpal K.M., Poolla K.R., Khargonekar P.P., Sagfors M.F., Toivonen H.T. ir kt.). Šiuo atveju diskrečiųjų 7^^-optimalių valdiklių ir filtrų sintezės procedūra buvo pagrįsta Riccati diferencialinėmis lygtimis, kurių sprendiniai patiria šuolius, atitinkančius stebėjimus. Praktinis įgyvendinimas Siūlomi sintezės algoritmai susiduria su daugybe sunkumų, susijusių su netiesinės ribinės vertės problemos sprendimu Riccati diferencialinėms lygtims.

Panašus metodas buvo naudojamas Basar T. ir Bernhard P. darbuose, kur buvo nagrinėjama diskrečiojo ^^-optimalaus nuolatinio objekto valdymo problema žaidimo teorijos požiūriu. Sąlygos %^-optimalių valdiklių egzistavimui buvo suformuluotos išmatuotos objekto būsenos atveju pagal Riccati skirtumų lygtis, o tokių valdiklių sintezės procedūra taip pat pagrįsta netiesinės ribinės reikšmės problemos sprendimu.

Kitas metodas pagrįstas kėlimo metodu, kai originali ištisinė sistema paverčiama lygiaverte atskira (Bamieh B.A., Pearson J.B., Chen T., Francis B.A., Tadmor G., Sagfors M.F., Toivonen H.T., Lall S., Dullerud G. ir kt.). Be to, kadangi tarp stebėjimo momentų yra išorinis trikdymas, taip pat pradinio objekto tikslinė išvestis dalimis ištisinės funkcijos, tada lygiavertės diskrečios sistemos trikdis ir tikslinė išvestis jau priklauso begalybei

matmenų erdvė. Šiuose darbuose optimalių valdiklių sintezė yra pagrįsta nuosekliu (iteraciniu) algebrinių arba pasikartojančių Riccati lygčių sprendimu, priklausomai nuo pagalbinio parametro, kurį reikia sumažinti. Praktinis šios procedūros įgyvendinimas sukelia skaičiavimo sunkumų.

Galiausiai Mikheevo Yu.V., Sobolevo V.A., Fridmano E.M., Shakedo U., Suplino V. darbuose buvo pasiūlytas požiūris, pagal kurį diskrečios ištisinio objekto valdymo sintezės problema buvo formaliai pakeista sintezės problema. valdiklis su vėlavimu. -kontrolės egzistavimo sąlygos buvo suformuluotos pakankamų sąlygų forma tiesinės matricos nelygybių atžvilgiu.

Vienas iš reikšmingų kontrolės teorijos trūkumų yra prielaida, kad in pradžios momentas laiko, objektas yra ramybės būsenoje, tai yra, jo pradinė būsena lygi nuliui. Jei šis reikalavimas neįvykdytas, tada susintetinti valdikliai gerai slopina išorinius trikdžius, tačiau ne visada tinkamai susidoroja su pradinių trikdžių, kuriuos sukelia nenulinės pradinės sąlygos, slopinimo užduotimi. Šiuo atveju apibendrinta norma buvo pasiūlyta kaip vienas kriterijus, kuriame atsižvelgiama į išorinių ir pradinių trikdžių įtaką (Khargonekar P.P., Nagpal K.M. ir Poolla K.R.). Ši norma sutampa su klasikine -norma, jei pradiniu laiko momentu objektas yra ramybės būsenoje, o kai pradinė objekto būsena yra ne nulis ir nėra išorinio trikdymo, tada apibendrinta -norma sutampa su 0 - normą, apibrėžtą D. V. Balandino darbuose. ir Koganas M.M. Ištisiniams objektams su nuolatine išmatuojama išvestimi mes sintezavome tęstiniai dėsniai kontrolė ir filtravimas Khargonekar P.P., Nagpal K.M., Balandin D.V., Kogan M.M. darbuose. ir tt Ištisinio objekto su atskira išvestimi atveju yra žinomas Sun W., Nagpal K.M. ir Khargonekar P.P., kuriuose buvo gautas diskrečios apibendrintos valdymo problemos sprendimas objektui begaliniame horizonte. Tuo pačiu metu suformuluoti valdymo ir filtravimo dėsniai yra pagrįsti netiesinės Riccati diferencialinės lygties sprendimu, o tai apsunkina jų naudojimą. Taigi, tolimesnis vystymas Nuolatinių sistemų diskrečios apibendrinto valdymo teorija yra labai aktuali valdymo teorijos problema.

Disertacinio darbo tikslas. Pagrindinis darbo tikslas – sukurti diskretinio apibendrinto valdymo ir filtravimo linijiniam filtravimui teoriją nuolatinės sistemos. Atsižvelgiant į užsibrėžtą tikslą, disertacija yra skirta išspręsti šias problemas:

Tiesiniams nestacionariems objektams baigtiniame laiko intervale gaukite diskrečių apibendrintų optimalaus valdymo dėsnių egzistavimo sąlygas ir lygtis linijinių nestacionarių klasėje. Atsiliepimas pagal būseną ir linijinių nestacionarių pilnos eilės dinaminių valdiklių klasėje.

Tiesiniams stacionariems objektams begaliniame laiko intervale gauti sąlygas ir lygtis diskrečių apibendrintų optimalaus valdymo dėsnių linijinių stacionarių būsenų grįžtamojo ryšio klasėje ir tiesinių stacionarių dinaminių pilnos eilės išėjimo valdiklių klasėje.

Tiesiniams nestacionariems objektams, esantiems baigtiniame laiko intervale, gaukite stebėtojo pavidalo diskrečiųjų nestacionarių apibendrintų optimalių filtrų egzistavimo sąlygas ir lygtis.

Tiesiniams stacionariems objektams, esantiems baigtiniame laiko intervale, gaukite sąlygas ir lygtis diskrečiųjų stacionarių apibendrintų -optimalių visos eilės filtrų stebėtojo pavidalu.

Tyrimo metodai. Darbe naudojami variacijų skaičiavimo ir optimalaus valdymo metodai, išgaubto optimizavimo teorija ir ypač pusiau apibrėžto programavimo teorija.

Mokslinis naujumas ir pagrindiniai rezultatai. Baigiamajame darbe gauti šie nauji linijinių ištisinių objektų diskrečios apibendrinto valdymo ir filtravimo teorijos rezultatai:

    Parodyta, kad tiesinio nestacionariojo objekto apibendrinta -norma baigtiniame laiko intervale gali būti rasta kaip netiesinės ribinės reikšmės uždavinio sprendimas matricinei diferencialinei arba skirtumo Riccati lygčiai, taip pat tiesinės matricos nelygybių požiūriu. Linijinio stabilaus nejudančio objekto begaliniame laiko intervale atveju apibendrinta -norma randama kaip diskrečios problemos sprendimas. algebrinė lygtis Riccati arba tiesinės matricos nelygybių požiūriu (atitinka specialybės paso 01.01.09 6 punktą).

    Linijiniams nestacionariems objektams baigtiniame laiko intervale būtina ir pakankamai sąlygų, o neišmatuotos būsenos atveju tik pakankamos sąlygos egzistuoti diskretiškiems apibendrintiems optimalaus valdymo dėsniams. Šie valdymo dėsniai yra susintetinti linijinių nestacionarių būsenų grįžtamojo ryšio klasėje ir linijinių nestacionarių dinaminių išėjimų valdiklių klasėje (atitinka specialybės paso 01.01.09 6 punktą).

    Linijiniams stacionariems objektams begaliniame laiko intervale gaunamos būtinos ir pakankamos sąlygos, kad egzistuotų diskretūs apibendrinti optimalaus valdymo dėsniai. Šie valdymo dėsniai yra susintetinti linijinių stacionarių būsenų grįžtamojo ryšio klasėje ir linijinių stacionarių dinaminių išėjimų valdiklių klasėje (atitinka specialybės paso 01.01.09 6 punktą).

    Linijiniams nestacionariems objektams, esantiems baigtiniame (begaliniame) laiko intervale, gaunamos būtinos ir pakankamos egzistavimo sąlygos ir nestacionarių (stacionarių) diskrečių apibendrintų "H^-optimalių pilnos eilės filtrų sintezė stebėtojo pavidalu. yra vykdomas

    Kaip programos, diskrečios apibendrintos Ti^-optimalūs valdikliai sprendžiant kėbulo valdymą elektromagnetinėje pakaboje ir diskretūs apibendrinti ^-optimalūs filtrai sprendžiant virpesių slopinimo problemą daugiaaukščių pastatų ir struktūros (atitinka specialybės paso 01.01.09 6 punktą).

Specialybės kodekso laikymasis. Darbas atitinka specialybės 01.01.09 formulę - Diskretioji matematika ir matematinė kibernetika ir apima šias į specialybę įtrauktas 01.01.09 tyrimų sritis: 6 punktas. Optimalaus valdymo matematinė teorija.

Teorinė ir praktinė reikšmė. Darbas yra teorinio pobūdžio ir atspindi diskrečios apibendrintos "H^-optimalaus nuolatinių objektų valdymo teorijos plėtrą. Jame gauti rezultatai perkeliami į konstruktyvias procedūras, kurių veiksmingumą patvirtina reguliatorių sintezė. elektromagnetinės pakabos valdymo ir filtrų sintezės problema daugiaaukščių pastatų ir konstrukcijų vibracijų slopinimo problemoje.

Tyrimo rezultatų patikimumo ir patikrinimo laipsnis. Pagrindiniai disertacijos darbo rezultatai buvo aptarti Nižnij Novgorodo mokslinio seminaro posėdyje. Matematinis modeliavimas sistemų ir valdymo procesų dinamika“ Taikomosios matematikos ir kibernetikos tyrimų institute, taip pat pristatytas šiose tarptautinėse ir visos Rusijos konferencijose:

X visos Rusijos Mokslinė konferencija"Netiesinės mechaninių sistemų virpesiai" pavadinti. Yu.I. Neumark ( Nižnij Novgorodas, 2016);

XIII tarptautinė konferencija „Netiesinių valdymo sistemų stabilumas ir virpesiai“ (Pyatnitsky konferencija) (Maskva, 2016 m.);

XI visos Rusijos kongresas esminių problemų teorinė ir taikomoji mechanika (Kazanė, 2015);

Tarptautinė konferencija apie matematinė teorija vadyba ir mechanika (Suzdal, 2015);

Šeštasis tradicinis visos Rusijos jaunimas vasaros mokykla„Valdymas, informacija ir optimizavimas“ (Maskva, 2014);

XII visos Rusijos vadybos problemų konferencija (Maskva, 2014 m.);

XIX Nižnij Novgorodo jaunųjų mokslininkų sesija: gamtos ir matematikos mokslai (Nižnij Novgorodas, 2014).

2013-2014 metais ir 2014–2015 m Tyrimas buvo paremtas akademiko G.A. vardu pavadinta stipendija. Razuvajevas magistrantams, taip pat Vyriausybės stipendija Rusijos Federacija(2014–2015 m.).

Pirmųjų trijų disertacijos skyrių rezultatai gauti įgyvendinant projektą Nr.14-01-31120 mol_a 2014-2015 m. (vadovas) ir projektai Nr.12-01-31358 mol_a 2012-2013 m., Nr.14-01-00266 2014-2016 m. (atlikėjas), atliktas finansiškai remiant Rusijos fundamentinių tyrimų fondui.

Ketvirtojo skyriaus rezultatai gauti finansiškai remiant Rusijos Federacijos švietimo ir mokslo ministerijai pagal federalinę tikslinę programą „Moksliniai tyrimai ir plėtra prioritetines sritis Rusijos mokslinio ir technologinio komplekso plėtra 2014-2020 m.“ (2015 m. spalio 27 d. sutartis 14.578.21.0110, unikalus identifikatorius RFMEFI57815X0110).

Publikacijos. Pagrindiniai rezultatai disertacijos tema pateikti 10 spausdintų darbų, įskaitant 4 pirmaujančias publikacijas mokslo žurnalai, rekomendavo Rusijos Federacijos Švietimo ir mokslo ministerijos Aukštoji atestacijos komisija -], dviejų tarptautinių konferencijų pranešimų medžiaga ir keturios regioninių ir tarptautinių pranešimų santraukos. Visos Rusijos konferencijos[-. Bendrame darbe] autoriui priklauso skaitmeninio modeliavimo rezultatai.

Asmeninis pareiškėjo indėlis. Visus disertacijoje pateiktus tyrimus pareiškėjas atliko asmeniškai, vykdydamas mokslinę veiklą. Iš bendrų publikacijų į disertaciją įtraukiama tik medžiaga, kuri tiesiogiai priklauso pareiškėjui.

Darbo struktūra ir apimtis. Disertaciją sudaro įvadas, keturi skyriai, išvados ir literatūros sąrašas. Kūrinys pateikiamas 123 puslapiuose, jame yra 11 iliustracijų. Bibliografijoje yra 81 pavadinimas.

Apibendrintos kontrolės sintezė

Apibendrinto valdymo teorijoje nagrinėjamas linijinis valdomas objektas, veikiamas išorinių poveikių ir pradinių trikdžių, kuriuos sukelia nežinomos pradinės sąlygos. Jei pradiniu laiko momentu objektas yra ramybės būsenoje, tai yra, pradinis trikdymas lygus nuliui, tai kaip išorinio poveikio nagrinėjamam objektui matą, išorinio trikdymo slopinimo lygis sutampa su imama %oo-norma, o valdymo, kuris sumažina šį kriterijų, projektavimo problema yra N-optimalaus valdymo problema. Priešingai, kai pradinė būsena yra ne nulis ir nėra išorinių trikdžių, sistemos atsako matas suprantamas kaip pradinio trikdymo slopinimo lygis, lygus 7o normai. Šiuo atveju valdymo įstatymas, optimizuojantis blogiausio atvejo pereinamąjį procesą, yra žinomas kaip 7o-optimalus. Bendru atveju šie kriterijai yra prieštaringi, todėl pagrindinis apibendrintos %oc kontrolės tikslas yra nustatyti valdymo dėsnį, kuris būtų kompromisas vertinant tiek išorinių, tiek pradinių trikdžių įtaką.

Dabar pateiksime pagrindinius faktus, susijusius su apibendrinta Hoo norma, o pristatyme pažvelgsime į darbus. Tikslumui apsvarstykite linijinį diskretišką nestacionarų objektą, kurio forma Xk+i = Akkhk + Bkvk, k = 0,...,N-l, zk = Ckxk + Dkvk, kur x Є Ж1 yra būsena, z Є E" -2 yra tikslinis išėjimas, o Rnv - išorinis trikdis, N-l t ribojamas 2-norma: vk vk fc=0.

Tarkime, kad bendruoju atveju pradinė būsena x0 yra nulis ir nežinoma, o jos įtaka objekto dinamikai interpretuojama kaip pradinis trikdymas.

Objekto valdoma išvestis fiksuotai pradinei būsenai x0 ir trikdžių sekai v0,... , vN_ i bus apibūdinama funkcinės N-1 reikšme j(x0,v0,..., vN_ij = \ \z\\i2 + xNSxN = У zk zk -\- xNSxN, (1.2) fc=0 čia S = S 0 yra svorio matrica, kuri nustato prioritetą tarp pereinamojo proceso kokybės ir galutinės objekto būsenos.

Pirma, atskirai nagrinėjame du kraštutinius atvejus: objektą veikia tik pradinis arba tik išorinis trikdymas. Tegul objektas pradiniu laiko momentu būna ramybėje, o tai atitinka atvejį, kai nėra pradinio trikdymo. Toliau nustatome išorinių trikdžių įtakos tikslinei išeičiai rodiklį (1.1) – išorinių trikdžių slopinimo lygį – kaip santykinė vertė funkcinis (1.2) blogiausiu atveju: J(0,VO,...,VN_1) 2 = sup 2 0 2

Atkreipkite dėmesį, kad jei objektas (1.1) yra nejudantis ir nagrinėjamas per begalinį laiko intervalą, tai naudojant Parseval lygybę, galima parodyti, kad (1.3) išraiška sutampa su nagrinėjamo objekto 7 -norma. Tolesnis teiginys charakterizuoja išorinių trikdžių slopinimo lygį tiesinės matricos nelygybių sprendiniais.

Pareiškimas 1.1. Išorinių trikdžių slopinimo lygis sistemoje (1.1) baigtiniu laiko intervalu tenkina nelygybę 7oo 7 tada ir tik tada, kai tiesinės matricos nelygybės /AlXk+1Ak - Xk AjXk+lBk Ck\ BTkXk+lAk BjXk+1Bk--f2I Dj Ck Dk - i) 0, (1.4) yra sprendžiami atsižvelgiant į matricas Xk = Xk 0, k = 0,..., N - 1, kai XN = S.

Iš teiginio išplaukia, kad išorinio trikdymo slopinimo lygis 7oo randamas kaip tikslus visų 7 aibės infimumas, kuriam tiesinių matricų nelygybių sistema (1.4) yra sprendžiama matricų Xk = Xk 0 ir 7 atžvilgiu. .

Jei išorinio trikdymo nėra, tai pradinio trikdymo įtaką perėjimo proceso kokybei sistemoje (1.1) galima apibūdinti dydžiu 2 J(x0,0,...,0) 70 = sup 2 ( 1.5) x0ф0 \Х0\, kuris vadinamas pradiniu trikdžių slopinimo lygiu. Parodyta, kad šią reikšmę galima rasti kaip optimizavimo problemos sprendimą su apribojimais, nurodytais tiesinės matricos nelygybėmis.

1.2 teiginys. Pradinio trikdymo sistemoje (1.1) slopinimo lygis baigtiniu laiko intervalu tenkina nelygybę 70 7 tada ir tik tada, kai tiesinės matricos nelygybės ATkXk+1Ak -Xk + ClCk O, X0 -f2I, (1.6) yra išsprendžiamos naudojant matricų Xk = Xk O atžvilgiu, k = 0,..., N - 1, kai XN = S. Norėdami apibūdinti bendrą išorinių ir pradinių trikdžių įtaką objekto išėjimui (1.1), apibrėžiame lygį trikdžių slopinimas kaip tam tikra dviejų nagrinėjamų veiksnių konvoliucija: 7W = slopinimas

Jx0, v0,. . . ,VN_1 =F , (1.7) čia R = R 0 yra svorio matrica, skirta nustatyti prioritetą tarp išorinio trikdymo ir pradinės būsenos komponentų. Tokiu būdu įvestas rodiklis vadinamas apibendrinta 7 norma. Tai lengva pamatyti ekstremalūs atvejai išraiška (1.7) virsta arba (1.3) arba (1.5), tai yra, jei x0 = 0 turime 7w = 7oo, o v = 0 gauname 7", = 70/max(-). Pasirodo, trikdžių slopinimo lygis gali būti išreikštas tiesinės matricos nelygybėmis, tam pakanka reikalauti egzistavimo bendras sprendimas nelygybės (1.4) ir (1.6), kurios atskirai apibūdina išorinio trikdymo slopinimo lygį ir pradinio trikdymo slopinimo lygį, atsižvelgiant į svertinį koeficientą.

Trikdžių slopinimo lygis sistemoje (1.1) baigtiniu laiko intervalu tenkina nelygybę 7w 7 tada ir tik tada, kai tiesinės matricos nelygybės (A.

Blogiausi išoriniai trikdžiai ir pradinė būsena nuolat atskirtame objekte

Atkreipkite dėmesį, kad pagal suformuluotą teoremą trikdžių 7C slopinimo lygis naudojant ryšį (2.45) išreiškiamas per matricos funkcijos X(t) reikšmę. Tačiau pagal (2.6a) lygtį X(t) reikšmė netiesiogiai priklauso nuo ge. Dėl to, norint nustatyti trikdžių slopinimo lygį, matricos diferencialinei Riccati lygčiai iškyla netiesinės ribinės reikšmės problema: raskite (2.6a) lygties sprendimą su ribines sąlygas(2.6b) ir (2.45), taip pat sąlyga (2.6d).

Dabar pereikime prie teoremos įrodymo.

2.2 teoremos įrodymas. Nesunku parodyti, kad santykis (2.4) yra ekvivalentiškas lygybei sup J(xo,v,w) = 0. (2.48) Иі!2 +ІНІ2 2 + 0Д 0=і Pagal (2.39) formulę funkcinė J (x0,v,w ) gali būti parašytas taip: J(x0,v,w) = xUcJC0 + X(t0) - %R)X0 %\\v - v \\l2 + N-l + J2(wk w k) T(AjX(tk) Ak - %l) (wk - w k) + fc=l + wN - w N (AdgbAdg - 7C- (wN - w N kur v ir w k yra apibrėžti ryšiais (2.46). nelygybių (2.6b), (2.6 c) ir (2.6e) galiojimas, pirmasis narys yra neteigiamas apibrėžtis, o likusieji yra neigiamos apibrėžtosios kvadratinės formos, todėl maksimali vertė funkcinės J(x0, v, w) išnyksta, kai v = v ir wk = w k, k = 1,... , N ir atitinkamas pasirinkimas x0. Vadinasi, trikdžiai v ir wl yra blogiausi išoriniai trikdžiai pagal 7c kriterijų. Pakeiskime v ir w k į santykį (2.48), tada: sup J(x0,v ,w)= sup xUx(t0) + CjC0--fcR)x0. \\v \\L+\\v \\2+x0R 0=l ll « llL+lh ll2+ ftr0 = l Dabar atkreipkite dėmesį, kad ir priklauso nuo 0 ir galioja šie santykiai: v (t) = ъ1В (t)X ( t) b(t,t0)x0, / -g- \ -1 -g w k = - (AjX(tk)Ak - 7c L AjX(t (tk - 0, t0)x0, čia Ф(Mo) - pagrindinė matrica uždarosios sistemos (2.115) sprendinių, todėl apribojimas yra kvadratinė forma x0: \\v \\l2 + \\w \\l+xUxo = x Qx0 = l, kur tN Q = R + 1-. 2 Ft(t,i0)X(t)V(t)W(t)X(t)F(t,i0)(it + «o N + fc=l J2 fT(- 0, t0)X(tk) )Ak( AlX(tk)Ak - 7сЛ \іХ(ік)Ф(ік - 0, t0). Taigi uždavinys (2.48) buvo sumažintas iki šios: sup x0 ПІКО =1 Xo(x(t0) + C0TC0 - 7ci?W

Paskutiniam uždaviniui išspręsti naudojame Lagranžo daugiklių taisyklę: maksimalus taškas x0 turi tenkinti lygčių sistemą: pirmoji lygtis kaip (X(t0) + CQ С0 + /іП)х0 = lcRxo, iš kur randame xo = «emax (R 1 \x(t0) + CjC0 + q ы V 7с = Ataksas (i?-1 [x( 0) + С0ТСО + /х fil V) a reikšmė randama iš antrosios lygties (2.49) Rastas reikšmes pakeiskime kvadratine forma ir supaprastinkime: Xo(x(t0) + Co Co - 1CR)XQ = -iixoflx о = Iі Atkreipkite dėmesį, kad pagal sąlygą tiksli suma yra lygi nuliui, todėl /. i = 0. Pakeitę rastą /i reikšmę į x0 išraišką, gauname ryšius (2.45) ir (2.46c).

Suformuluokime ir įrodykime keletą išvadų, atsakančių į klausimą apie blogiausius trikdžius, susijusius su pradinio trikdymo C slopinimo lygiais, nuolatiniu išoriniu trikdžiu c, diskrečiu išoriniu trikdžiu Г ir mišrių išorinių trikdžių slopinimo lygiu c w. .

Išvada 2.5. Objektuose (2.1), (2.2) ir (2.3) pradinių trikdžių slopinimo lygis, kai = max (J0 + (0)) (2.50), pasiekiamas esant blogiausiajai pradinei būsenai = max (J0 + (0)] , (2.51) kur ( ) yra sistemos (2.41) sprendimas, rastas su Įrodymu. Kadangi objektas nėra veikiamas nei nuolatinio, nei diskretiškojo išorinio trikdymo, santykis (2.51) gaunamas iš santykių (2.46), jei įdėsime. = , () = 0 pastarajame k = 0, = 1,... , Ш Išvada (2.1), (2.2) ir (2.3) nuolatinių išorinių trikdžių slopinimo lygis ї =. max (J0 + (0)) (2.52) pasiekiamas esant blogiausiam išoriniam trikdžiui () = ") 1T()()(), (2.53) kur () yra sistemos (2.42) sprendimas, rastas c.

Įrodymas. Ryšys (2.53) gaunamas iš santykių (2.46), jei į pastarąjį įdėsime k = 0, = 1,..., kas tolygu tam, kad objektas nėra veikiamas diskretiško išorinio trikdymo, ir dėl jei nėra pradinio trikdymo, būtina atmesti sąlygą (2.46 c) ir įdėti = santykyje (2.45).

Išvada 2.7. Objektuose (2.1), (2.2) ir (2.3) diskrečiųjų išorinių trikdžių slopinimo lygis с = max (j 0 + (0)) (2.54) pasiekiamas esant blogiausiam išoriniam trikdžiui / -г- \ -1 -г k = - (j(k)k - с") j(k)(k - 0), (2.55) čia () yra lygties (2.43) sprendimas su sąlygomis (2.6b) ir (2.6d) , rasta с" . Įrodymas. Kadangi objekto neveikia nuolatinis išorinis trikdymas, tai santykis (2.55) gaunamas iš santykių (2.46), jei į pastarąjį įdėsime B(i) = O, o dėl pradinio trikdymo nebuvimo tai būtina atmesti sąlygą (2.46c) ir į santykį (2.45) įdėti R = I. Išvada 2.8. Objektuose (2.1), (2.2) ir (2.3) mišrių išorinių trikdžių slopinimo lygis lT = Amax (cJC0 + X(t0)) (2.56) pasiekiamas esant blogiausiems išoriniams trikdžiams (t-\-1 - r AjX(tk)Ak – fc wl\ AjX(tk)x(tk-0), (2.57a) v (t) = (w) 1BT(t)X(t)x(t), (2.57b) kur X(i) – sistemos (2.6a), (2.6b) ir (2.6d) sprendimas, rastas % w Įrodymas Kadangi objektas nėra paveiktas pradinio trikdymo, tada atmetus sąlygą (2.46c). santykiuose (2.46) ir nustatant R = I formulėje (2.45), gauname ryšius (2.57).

Dar kartą pažymime, kad 2.2 teorema ir jos išvados leidžia sumažinti atitinkamų trikdžių slopinimo lygių skaičiavimą iki netiesinės ribinės reikšmės uždavinio sprendimo. Pastarasis gali būti išspręstas įvairiais būdais skaitmeniniai metodai, pavyzdžiui, naudojant paprastą iteracijos metodą. Trumpai apibūdinkime programą šis metodas naudojant trikdžių slopinimo lygio apskaičiavimo pavyzdį 7c. Pasirinkime pakankamai didelę pradinę reikšmę 7 ir išspręskime uždavinius (2.6b), (2.6a) ir (2.6d). Toliau, naudodami formulę (2.45), apskaičiuojame kitą aproksimaciją iki 7c. Kartosime šią procedūrą tol, kol skirtumas tarp dviejų gretimų rastų verčių taps mažesnis už tam tikrą iš anksto nustatytą mažą teigiamą skaičių. Vienas iš reikšmingų minėto metodo trūkumų, be galimo generuojamos aproksimacijų sekos konvergencijos trūkumo, yra poreikis kiekviename žingsnyje išspręsti matricinę diferencialinę lygtį. Galite to atsikratyti, jei pereisite nuo nuolatinio diskretinio modelio prie atskirojo modelio. Kitas skyrius skirtas šios idėjos įgyvendinimui.

Optimalaus išėjimo valdymo sintezė

Sugrupuokime pirmąjį ir antrąjį terminus į (2.105) ir supaprastinkime P2 išraišką, kuriai vėl pritaikome Sherman-Morrison-Woodbury formulę, tada: "Г 1 Г / 1 -г \-1 1 1 -г CTkGk+ lWklx \l + Ek +lXk+l(I - Ek+1\k-IgEtk+1Xk+1) Ek+1]kTs GTk+lCk = -g / -g \-1 -g = CTkGk+l(Wk+ l - ETk+lXk +lEk+l) GTk+lCk ir P2 = ATkXk+l l - Ek+l, matrica S susidaro, pvz., pagal formulę

3.4 teorema taip pat leidžia susintetinti apibendrintą ft -optimalų išėjimo valdymą begaliniu laiko intervalu. Norėdami tai padaryti, pakanka rasti 7c() mažinimo problemos sprendimą pagal nelygybių (3.51) nurodytus apribojimus, o po to randamas optimalus valdiklis kaip (3.52) sprendimas.

Galiausiai, užbaigdami skyrių, be įrodymų pateikiame 3.4 teoremos pasekmes, kurios nustato būtinas ir pakankamas sąlygas 70 ir Pse išvesties valdikliams egzistuoti nejudančiam objektui begaliniame horizonte.

Išvada 3.13. Stacionariai įrenginiams (3.21), (3.22), esant tam tikram 7 0, yra atskiras išėjimo valdymas begaliniu laiko intervalu tada ir tik tada, kai tiesinės matricos nelygybės Ah,XAh 0, C1 AhYAl Y C1YAl (Wc2 0 0 II MT X I C1YCj WC 0 0 I M 0, (3.53a) (3.53b) x l Y 0, X yl, (3.53c) yra sprendžiami atsižvelgiant į X = X 0, Y = Y 0, o matricų Wr KJ stulpeliai 2 ir M sudaro atitinkamai matricos branduolių pagrindus.

Išvada 3.14. Nejudančiam objektui (3.21), (3.22) per begalinį laiko intervalą yra atskiras I išvesties valdiklis, užtikrinantis nuolatinių išorinių trikdžių slopinimą, esant tam tikram 7 0, tada ir tik tada, kai yra tiesinės matricos nelygybės ir pirmoji nelygybė. (3.51c) yra sprendžiami X = X O, Y = Y O atžvilgiu, o matricų Wr ir M stulpeliai sudaro atitinkamai tarpų ket Co ir ket [B.. D-,) pagrindus.

Išvada 3.15. Nejudančiam objektui (3.21), (3.22) per begalinį laiko intervalą yra atskiras I išvesties valdiklis, užtikrinantis diskrečiųjų išorinių trikdžių slopinimą esant tam tikram 7 O, jei yra matricos X = X O, Y = Y O, tenkinantis tiesinės matricos nelygybes ir pirmąją nelygybę (3.51c), o matricų N ir M stulpeliai sudaro atitinkamai erdvių ker (C2 D2j ir ker [Bi Dx) pagrindus. Išvada 3.16. Nejudančiam objektui (3.21), (3.22) per begalinį laiko intervalą yra atskiras I išėjimo valdiklis, užtikrinantis mišrių išorinių trikdžių slopinimą, esant tam tikram 7 0, tada ir tik tada, kai tiesinės matricos nelygybės (3.51a) , (3.51b) ir pirmoji nelygybė (3.51c) yra išsprendžiamos matricų XT = X 0 ir Y = Y O atžvilgiu, o matricų N ir M stulpeliai sudaro erdvių ker C2 0 D2 0 ir pagrindus. ker BI Dj 0 O atitinkamai.

Iš 2.8 teoremos pastabos išplaukia, kad egzistuoja baigtinė matrica R, kad bet kokiam svorio koeficientui R R apibendrintas I -optimalus išvesties valdiklis per begalinį laiko intervalą sutampa su // -optimalaus išvesties valdikliu, susintetintu pagal 3.16 išvadą ir užtikrinantį mišrių išorinių trikdžių slopinimas. Vadinasi, norint gauti tikrą kompromisą, atsižvelgiant į pradinių ir išorinių trikdžių įtaką, svorio matrica R turi atitikti Amax(A_1A) I sąlygą. Svorio matricos skaitinė ribinė vertė R nustatoma taip: brx y1, kur X žymi matricą, tenkinančią nelygybes (3.51a), (3.51b) ir pirmąją nelygybę (3.51c) ties minimalią vertę 7s.

Panagrinėkime tą, kuris parodytas fig. 3.3 mechaninė sistema, susidedanti iš m masės pakabinamo kūno ir elektromagneto. Kūno levitaciją užtikrina magnetinio lauko pokytis, atsirandantis pasikeitus į elektromagneto apviją tiekiamai įtampai U. Tokio paprasto dalyko dinamika magnetinė pakaba paklūsta dviem lygtims: mti) = F - mA, (3.56) V + RI=U. Pirmoji lygtis (3.56) išreiškia antrąjį Niutono dėsnį ir nustato kabančio kūno koordinačių s pokytį veikiant gravitacijai td ir jėgai F nuo elektromagneto, o antroji – srovės stiprio / elektromagneto grandinėje pokytį. varža R, kai keičiasi jai taikoma įtampa U, ir atspindi Kirchhoffo dėsnį elektromagneto elektros grandinei. F žymi elektromagneto apvijos srauto jungtį, F = pF, kur F yra magnetinis srautas, einantis per vieną posūkį, o n yra apvijos apsisukimų skaičius.

Srauto jungtis Ф ir srovės stipris / elektromagnetinėje grandinėje yra susiję su ryšiu: = L(s)/, L(s) = , CL = /i0n2A/2, (3.57) čia L(s) yra induktyvumas elektromagnetas, CL yra projektinis parametras, o 6 - vardinio tarpo tarp elektromagneto ir pakabinamo korpuso dydis. Jei vardinį induktyvumą pažymėsime kaip L0 = L(0), tada C = L05, o tada



Ar jums patiko straipsnis? Pasidalinkite su draugais!