Asmens identifikavimas naudojant modelio atpažinimo metodus. Esamų modelio atpažinimo metodų apžvalga

→

3 skyrius: Analitinė modelio atpažinimo ir sprendimų priėmimo metodų apžvalga

Modelių atpažinimo teorija ir valdymo automatizavimas

Pagrindiniai adaptyvaus modelio atpažinimo uždaviniai

Pripažinimas yra informacijos procesas, įdiegtas tam tikru informacijos keitikliu (protingas informacijos kanalas, atpažinimo sistema), turintis įvestį ir išvestį. Sistemos įvestis yra informacija apie tai, kokias savybes turi pateikti objektai. Sistemos išvestyje rodoma informacija apie tai, kurioms klasėms (apibendrinti atvaizdai) priklauso atpažinti objektai.

Kuriant ir eksploatuojant automatizuotą raštų atpažinimo sistemą, išsprendžiama nemažai problemų. Trumpai ir paprastai apsvarstykime šias užduotis. Atkreipkite dėmesį, kad skirtingi autoriai turi tas pačias šių užduočių formuluotes, o pats rinkinys nesutampa, nes tam tikru mastu priklauso nuo konkretaus matematinis modelis, kuria remiasi ta ar kita atpažinimo sistema. Be to, kai kurios tam tikrų atpažinimo modelių problemos neturi sprendimo ir, atitinkamai, nėra keliamos.

Dalyko srities formalizavimo užduotis

Iš esmės ši užduotis yra kodavimo užduotis. Sudaromas apibendrintų klasių, kurioms gali priklausyti konkretūs objektų įgyvendinimai, sąrašas, taip pat sąrašas savybių, kurias šie objektai iš esmės gali turėti.

Mokymų imties formavimo užduotis

Mokomasis rinkinys – tai duomenų bazė, kurioje yra konkrečių objektų realizacijų aprašymai požymių kalba, papildyta informacija apie šių objektų priklausomybę tam tikroms atpažinimo klasėms.

Atpažinimo sistemos mokymo užduotis

Mokomasis pavyzdys naudojamas formuoti apibendrintus atpažinimo klasių vaizdinius, remiantis informacijos apibendrinimu apie tai, kokias savybes turi šiai klasei ir kitoms klasėms priklausantys mokymo imties objektai.

Funkcijų erdvės dydžio mažinimo problema

Išmokius atpažinimo sistemą (gavus statistiką apie požymių pasiskirstymą pagal klases pagal dažnius), atsiranda galimybė nustatyti kiekvieno požymio reikšmę atpažinimo problemai spręsti. Po to mažiausiai vertingos savybės gali būti pašalintos iš funkcijų sistemos. Tada atpažinimo sistema turi būti treniruojama iš naujo, nes pašalinus kai kuriuos požymius pasikeičia likusių požymių pasiskirstymo pagal klases statistika. Šis procesas gali būti kartojamas, t.y. būti pasikartojantis.

Atpažinimo užduotis

Atpažįstami atpažinto pavyzdžio objektai, kurie visų pirma gali sudaryti iš vieno objekto. Atpažintas pavyzdys formuojamas panašiai kaip mokomoji, tačiau joje nėra informacijos apie objektų priklausomybę klasėms, nes būtent tai ir nustatoma atpažinimo proceso metu. Kiekvieno objekto atpažinimo rezultatas yra visų atpažinimo klasių paskirstymas arba sąrašas mažėjančia tvarka pagal atpažinto objekto panašumo į jas laipsnį.

Atpažinimo kokybės kontrolės problema

Po atpažinimo galima nustatyti jo tinkamumą. Mokymo pavyzdžio objektams tai galima padaryti iš karto, nes jiems tiesiog žinoma, kurioms klasėms jie priklauso. Apie kitus objektus šią informaciją galima gauti vėliau. Bet kokiu atveju faktinis vidutinė tikimybė klaidų visoms atpažinimo klasėms, taip pat klaidos tikimybę priskiriant atpažintą objektą konkrečiai klasei.

Pripažinimo rezultatai turi būti interpretuojami atsižvelgiant į turimą informaciją apie atpažinimo kokybę.

Adaptacijos problema

Jei atlikus kokybės kontrolės procedūrą nustatoma, kad ji yra nepatenkinama, neteisingai atpažintų objektų aprašymai gali būti nukopijuoti iš atpažinto pavyzdžio į mokomąjį, papildyti atitinkama klasifikavimo informacija ir panaudoti pertvarkymui. lemiamos taisyklės, t.y. atsižvelgta. Be to, jei šie objektai nepriklauso esamoms atpažinimo klasėms, o tai gali būti jų neteisingo atpažinimo priežastis, šį sąrašą galima išplėsti. Dėl to atpažinimo sistema prisitaiko ir pradeda adekvačiai klasifikuoti šiuos objektus.

Atvirkštinio atpažinimo problema

Atpažinimo užduotis yra ta, kad tam tikram objektui, remdamasi žinomomis jo savybėmis, sistema nustato jo priklausymą kokiai nors anksčiau nežinomai klasei. Atvirkštinio atpažinimo uždavinyje, priešingai, už šios klasės atpažinimo, sistema nustato, kurios savybės būdingiausios tam tikros klasės objektams, o kurios – ne (arba kurie mokomosios imties objektai priklauso tam tikrai klasei).

Klasterinės ir konstruktyviosios analizės problemos

Klasteriai – tai tokios objektų, klasių ar ypatybių grupės, kurios kiekviename klasteryje yra kuo panašesnės, o tarp skirtingų klasterių – kuo skirtingos.

Konstrukcija (šiame skyriuje aptariamame kontekste) yra priešingų klasterių sistema. Taigi tam tikra prasme konstrukcijos yra klasterių klasterinės analizės rezultatas.

Klasterinėje analizėje kiekybiškai matuojamas objektų (klasių, požymių) panašumo ir skirtumo laipsnis, o ši informacija naudojama klasifikavimui. Klasterinės analizės rezultatas – objektų klasifikavimas į grupes. Šią klasifikaciją galima pavaizduoti semantinių tinklų forma.

Kognityvinės analizės užduotis

Atliekant kognityvinę analizę, informacija apie klasių ar savybių panašumus ir skirtumus tyrėją domina pati savaime, o ne tam, kad ją panaudotų klasifikavimui, kaip klasterinėje ir konstruktyvioje analizėje.

Jei ta pati savybė būdinga dviem atpažinimo klasėms, tai prisideda prie šių dviejų klasių panašumo. Jei vienai iš klasių ši savybė yra nebūdinga, tai prisideda prie skirtumo.

Jei du požymiai koreliuoja vienas su kitu, tai tam tikra prasme jie gali būti laikomi vienu požymiu, o jei yra antikoreliuoti, tada kaip skirtingi. Atsižvelgiant į šią aplinkybę, buvimas įvairių ženklų skirtingose klasėse taip pat tam tikrą indėlį į jų panašumus ir skirtumus.

Kognityvinės analizės rezultatai gali būti pateikiami kognityvinių diagramų pavidalu.

Rašto atpažinimo metodai ir jų charakteristikos

Modelių atpažinimo metodų klasifikavimo principai

Modelių atpažinimas reiškia formalių operacijų kūrimo ir taikymo skaitiniams arba simboliniams objektų vaizdiniams realiame ar idealiame pasaulyje, kurių rezultatai atspindi šių objektų lygiavertiškumo ryšius. Ekvivalentiškumo santykiai išreiškia vertinamų objektų priklausymą bet kurioms klasėms, laikomoms nepriklausomais semantiniais vienetais.

Konstruodamas atpažinimo algoritmus, lygiavertiškumo klases gali nurodyti tyrėjas, pasitelkęs savo prasmingas idėjas arba pasitelkęs išorinę papildomą informaciją apie objektų panašumus ir skirtumus sprendžiamos problemos kontekste. Tada jie kalba apie „pripažinimą su mokytoju“. Priešingu atveju, t.y. Kai automatizuota sistema išsprendžia klasifikavimo problemą nenaudodama išorinės mokymo informacijos, mes kalbame apie automatinį klasifikavimą arba „neprižiūrimą atpažinimą“. Daugumai modelių atpažinimo algoritmų reikia naudoti labai didelę skaičiavimo galią, kurią gali užtikrinti tik didelio našumo kompiuterinės technologijos.

Įvairūs autoriai (Yu.L. Barabash, V.I. Vasiljevas, A.L. Gorelikas, V.A. Skripkinas, R. Duda, P. Hartas, L. T. Kuzinas, F. I. Peregudovas, F. P. Tarasenko, F. E. Temnikovas, J. Tu, R. Gonzalezas, P. Winstonas K. Fu, Ya.Z. Tsypkin ir kt.) pateikia kitokią modelio atpažinimo metodų tipologiją. Vieni autoriai skiria parametrinius, neparametrinius ir euristinius metodus, kiti skiria metodų grupes remdamiesi istoriškai susiklosčiusiomis mokyklomis ir šios srities tendencijomis. Pavyzdžiui, darbe, kuriame pateikiama akademinė atpažinimo metodų apžvalga, naudojama tokia modelių atpažinimo metodų tipologija:

atskyrimo principu pagrįsti metodai;
statistiniai metodai;
metodai, sukurti remiantis " potencialias funkcijas»;
reitingų apskaičiavimo metodai (balsavimas);
metodai, pagrįsti teiginių skaičiavimu, ypač loginės algebros aparatu.

Ši klasifikacija grindžiama formalių modelių atpažinimo metodų skirtumais, todėl atsižvelgiama į euristinį požiūrį į atpažinimą, kuris yra visiškai ir adekvatus vystymasis ekspertinėse sistemose. Euristinis požiūris pagrįstas sunkiai įforminamomis žiniomis ir tyrėjo intuicija. Šiuo atveju tyrėjas pats nustato, kokią informaciją ir kaip turi naudoti sistema, kad pasiektų reikiamą atpažinimo efektą.

Panaši atpažinimo metodų tipologija su įvairaus detalumo laipsniu randama daugelyje atpažinimo darbų. Tuo pačiu metu žinomose tipologijose neatsižvelgiama į vieną labai reikšmingą ypatybę, kuri atspindi žinių apie dalykinę sritį vaizdavimo būdo specifiškumą naudojant bet kokį formalų modelio atpažinimo algoritmą.

D.A. Pospelovas (1990) išskiria du pagrindinius žinių pateikimo būdus:

intencionalus, atributų (ypatybių) sąsajų diagramos pavidalu.
išplėstinis, pasitelkiant konkrečius faktus (objektus, pavyzdžius).

Intensyvus vaizdavimas fiksuoja modelius ir ryšius, paaiškinančius duomenų struktūrą. Kalbant apie diagnostikos problemas, toks fiksavimas apima operacijų su objektų atributais (ypatybėmis) apibrėžimą, vedančią į reikiamą diagnostikos rezultatas. Intensyvios reprezentacijos įgyvendinamos atliekant operacijas su atributų reikšmėmis ir nereiškia operacijų su konkrečiais informacijos faktais (objektais).

Savo ruožtu, išplėstinės žinių reprezentacijos yra susijusios su konkrečių objektų iš dalykinės srities aprašymu ir fiksavimu ir yra įgyvendinamos operacijose, kurių elementai yra tokie objektai kaip pilnos sistemos.

Galima nubrėžti analogiją tarp intensyvaus ir išplėstinio žinių vaizdavimo ir mechanizmų, kuriais grindžiama kairiojo ir dešiniojo žmogaus smegenų pusrutulių veikla. Jeigu dešiniajam pusrutuliui būdingas holistinis supančio pasaulio prototipas, tai kairysis pusrutulis operuoja modeliais, atspindinčiais šio pasaulio atributų ryšius.

Du pagrindiniai aukščiau aprašyti žinių pateikimo būdai leidžia pasiūlyti tokią modelio atpažinimo metodų klasifikaciją:

intensyvūs metodai, pagrįsti operacijomis su ypatybėmis.
išplėtimo metodai, pagrįsti operacijomis su objektais.

Ypač reikia pabrėžti, kad būtent šių dviejų (ir tik dviejų) atpažinimo metodų grupių – veikiančių ženklais ir veikiančių daiktais – egzistavimas yra giliai natūralus. Šiuo požiūriu nė vienas iš šių metodų, paimtas atskirai nuo kito, neleidžia susidaryti tinkamo dalykinės srities atspindžio. Autorių nuomone, tarp šių metodų N. Bohro prasme yra papildomumo ryšys, todėl perspektyvios atpažinimo sistemos turėtų užtikrinti abiejų šių metodų įgyvendinimą, o ne bet kurį iš jų.

Taigi D. A. Pospelovo pasiūlyta atpažinimo metodų klasifikacija remiasi pagrindiniais dėsniais žmogaus būdasžinių apskritai, o tai iškelia jį į visiškai ypatingą (privilegijuotą) padėtį, palyginti su kitomis klasifikacijomis, kurios šiame fone atrodo lengvesnės ir dirbtinesnės.

Intensyvūs metodai

Išskirtinis intencionalinių metodų bruožas yra tai, kad konstruojant ir taikant modelio atpažinimo algoritmus jie naudoja įvairias požymių charakteristikas ir jų ryšius kaip operacijų elementus. Tokie elementai galėtų būti individualias vertybes arba požymių reikšmių intervalai, vidutinės reikšmės ir dispersijos, požymių ryšio matricos ir kt., per kuriuos atliekami veiksmai, išreikšti analitiniais arba konstruktyvi forma. Tuo pačiu metu objektai šiuose metoduose nėra laikomi vientisais informacijos vienetais, o veikia kaip rodikliai vertinant jų atributų sąveiką ir elgesį.

Intensyviųjų modelių atpažinimo metodų grupė yra plati, o jos skirstymas į poklasius tam tikru mastu yra sąlyginis.

Metodai, pagrįsti bruožų reikšmių pasiskirstymo tankių įverčiais

Šie modelio atpažinimo metodai yra pasiskolinti iš klasikinė teorija statistiniai sprendimai, kuriuose tiriami objektai laikomi daugiamačio realijomis atsitiktinis kintamasis, paskirstytas požymių erdvėje pagal kokį nors dėsnį. Jie pagrįsti Bajeso sprendimų priėmimo schema, kuri apeliuoja į a priori objektų, priklausančių tam tikrai pripažintai klasei, tikimybę ir sąlyginį ypatybių vektoriaus reikšmių pasiskirstymo tankį. Šie metodai apsiriboja tikimybės santykio nustatymu įvairiose daugiamatės objektų erdvės srityse.

Metodų grupė, pagrįsta požymių reikšmių pasiskirstymo tankių įvertinimu, yra tiesiogiai susijusi su diskriminacinės analizės metodais. Bajeso požiūris į sprendimų priėmimą yra vienas iš vadinamųjų parametrinių metodų, labiausiai išplėtotų šiuolaikinėje statistikoje, kuriam pasiskirstymo dėsnio analitinė išraiška laikoma žinoma. šiuo atveju normalus įstatymas) ir tereikia įvertinti mažas kiekis parametrai (vidutinių verčių vektoriai ir kovariacijos matricos).

Pagrindiniai sunkumai naudojant šiuos metodus yra būtinybė prisiminti visą mokymo imtį, kad būtų galima apskaičiuoti vietinio tikimybių pasiskirstymo tankio įverčius ir didelį jautrumą mokymo imties nereprezentatyvumui.

Metodai, pagrįsti prielaidomis apie sprendimo funkcijų klasę

Šioje metodų grupėje bendra sprendimo funkcijos forma laikoma žinoma ir nurodoma jos kokybės funkcionalumas. Remiantis šia funkcija, geriausias sprendimo funkcijos aproksimavimas randamas naudojant mokymo seką. Dažniausios nuomonės yra lemiamos funkcijos tiesinių ir apibendrintų netiesinių daugianario pavidalu. Sprendimo taisyklės kokybės funkcija paprastai siejama su klasifikavimo klaida.

Pagrindinis metodų, pagrįstų prielaidomis apie sprendimo funkcijų klasę, privalumas yra atpažinimo problemos, kaip ekstremumo paieškos problemos, matematinės formuluotės aiškumas. Šios grupės metodų įvairovė paaiškinama plačiu sprendimų taisyklių kokybės funkcinių ir naudojamų ekstremalių paieškos algoritmų spektru. Nagrinėjamų algoritmų, kurie visų pirma apima Niutono algoritmą, perceptrono tipo algoritmus ir kt., apibendrinimas yra stochastinės aproksimacijos metodas.

Užteks aukštos kokybės sprendimo taisyklė gali būti pasiekta naudojant algoritmus, kurie neturi griežtų matematinis įrodymas sprendimo priartėjimas prie pasaulinio ekstremumo. Tokie algoritmai apima didelė grupė euristinio programavimo procedūros, atstovaujančios evoliucinio modeliavimo kryptį. Evoliucinis modeliavimas yra bioninis metodas, pasiskolintas iš gamtos. Jis pagrįstas žinomų evoliucijos mechanizmų naudojimu, siekiant pakeisti sudėtingo objekto prasmingo modeliavimo procesą fenomenologiniu jo evoliucijos modeliavimu. Gerai žinomas modelių atpažinimo evoliucinio modeliavimo atstovas yra argumentų grupinės apskaitos (MGUA) metodas. GMDH pagrindas yra saviorganizacijos principas, o GMDH algoritmai atkuria masės atrankos schemą.

Tačiau praktinių tikslų pasiekimas šiuo atveju nėra lydimas naujų žinių apie atpažįstamų objektų prigimtį gavimo. Galimybę išgauti šias žinias, ypač žinias apie atributų (požymių) sąveikos mechanizmus, čia iš esmės riboja pateikta tokios sąveikos struktūra, fiksuota pasirinktoje sprendimo funkcijų formoje.

Būlio metodai

Loginiai modelio atpažinimo metodai yra pagrįsti loginės algebros aparatu ir leidžia operuoti su informacija, esančia ne tik atskiruose požymiuose, bet ir ypatybių reikšmių deriniuose. Taikant šiuos metodus, bet kurio atributo reikšmės laikomos elementariais įvykiais.

Pačioje bendras vaizdas loginius metodus galima apibūdinti kaip paieškos tipą per mokomąjį loginių šablonų pavyzdį ir tam tikros loginių sprendimų taisyklių sistemos formavimą (pavyzdžiui, elementarių įvykių jungčių pavidalu), kurių kiekvienas turi savo svorį. Loginių metodų grupė yra įvairi ir apima metodus įvairaus sudėtingumo ir analizės gylį. Dichotominėms (Bulio) ypatybėms populiarūs vadinamieji medžių klasifikatoriai, aklavietės bandymo metodas, „žievės“ algoritmas ir kt.

„Kora“ algoritmas, kaip ir kiti loginiai modelio atpažinimo metodai, yra gana daug skaičiavimo reikalaujantis, nes pasirenkant jungtis reikia atlikti pilną paiešką. Todėl naudojant loginius metodus keliami aukšti reikalavimai efektyvi organizacija skaičiavimo procesas, ir šie metodai gerai veikia esant santykinai nedideliems funkcijų erdvės matmenims ir tik galinguose kompiuteriuose.

Kalbiniai (struktūriniai) metodai

Lingvistiniai modelio atpažinimo metodai yra pagrįsti specialių gramatikų, kurios generuoja kalbas, kurios gali būti naudojamos atpažintų objektų savybių rinkiniui apibūdinti, naudojimu.

Įvairių klasių objektams nustatomi neišvestiniai (atominiai) elementai (pavaizdžiai, atributai) ir galimi ryšiai tarp jų. Gramatika reiškia objektų konstravimo iš šių neišvestinių elementų taisykles.

Taigi kiekvienas objektas yra neišvestinių elementų rinkinys, vienaip ar kitaip „sujungtas“ vienas su kitu arba, kitaip tariant, kokios nors „kalbos“ „sakiniu“. Norėčiau ypač pabrėžti labai reikšmingą idėjinę šios minties vertę.

Sintaksiškai analizuojant „sakinį“ nustatomas jo sintaksinis „teisingumas“ arba, lygiaverčiai, ar kokia nors fiksuota klasę apibūdinanti gramatika gali sukurti esamą objekto aprašymą.

Tačiau užduotis rekonstruoti (apibūdinti) gramatikas iš tam tikro teiginių (sakinių – objektų aprašymų), generuojančių duotą kalbą, yra sunkiai formalizuojama.

Išplėtimo metodai

Šios grupės metoduose, priešingai nei intensyvioji kryptis, kiekvienam tiriamam objektui didesniu ar mažesniu mastu suteikiamas nepriklausomas diagnostinė vertė. Iš esmės šie metodai yra artimi klinikiniam požiūriui, kai žmonės vertinami ne kaip objektų, surūšiuotų pagal vieną ar kitą rodiklį, grandine, o kaip vientisomis sistemomis, kurių kiekviena yra individuali ir turi ypatingą diagnostinę vertę. Toks atidus požiūris į tiriamus objektus neleidžia atmesti ar prarasti informacijos apie kiekvieną atskiras objektas, kas nutinka, kai naudojami intensyvūs krypties metodai, kurie naudoja objektus tik aptikti ir įrašyti jų atributų elgesio modelius.

Pagrindinės modelių atpažinimo operacijos taikant aptartus metodus yra objektų panašumų ir skirtumų nustatymo operacijos. Objektai, esantys nurodytoje metodų grupėje, atlieka diagnostikos precedentų vaidmenį. Tačiau priklausomai nuo sąlygų konkreti užduotis individualaus precedento vaidmuo gali būti labai įvairus: nuo pagrindinio ir lemiamo vaidmens iki labai netiesioginio dalyvavimo pripažinimo procese. Savo ruožtu, dėl problemos sąlygų sėkmingam sprendimui gali tekti dalyvauti įvairaus skaičiaus diagnostinių precedentų: nuo vieno kiekvienoje pripažintoje klasėje iki viso imties dydžio, taip pat skirtingais būdais skaičiuojant objektų panašumo ir skirtumo matus. Šie reikalavimai paaiškina tolesnį išplėstinių metodų skirstymą į poklasius.

Palyginimo su prototipu metodas

Tai paprasčiausias išplėstinio atpažinimo būdas. Jis naudojamas, pavyzdžiui, tuo atveju, kai atpažintos klasės objektų erdvėje atvaizduojamos kompaktiškomis geometrinėmis grupėmis. Šiuo atveju paprastai prototipo tašku pasirenkamas klasės geometrinės grupavimo centras (arba arčiausiai centro esantis objektas).

Norint klasifikuoti nežinomą objektą, randamas artimiausias prototipas ir objektas priklauso tai pačiai klasei kaip ir šis prototipas. Akivaizdu, kad naudojant šį metodą negeneruojami apibendrinti klasės vaizdai.

Įvairių tipų atstumai gali būti naudojami kaip artumo matas. Dažnai dichotominiams požymiams naudojamas Hamingo atstumas, kuris šiuo atveju yra lygus Euklido atstumo kvadratui. Šiuo atveju objektų klasifikavimo sprendimo taisyklė yra lygiavertė tiesinio sprendimo funkcijai.

Į šį faktą reikėtų ypač atkreipti dėmesį. Tai aiškiai parodo ryšį tarp prototipo ir informacijos apie duomenų struktūrą atributo vaizdavimo. Naudodami aukščiau pateiktą vaizdą, galite, pavyzdžiui, bet kokį tradicinį matavimo skalė, kuris yra tiesinė funkcija iš dichotominių požymių reikšmių, laikomų hipotetiniu diagnostikos prototipu. Savo ruožtu, jei pripažintų klasių erdvinės struktūros analizė leidžia padaryti išvadą apie jų geometrinį kompaktiškumą, pakanka kiekvieną iš šių klasių pakeisti vienu prototipu, kuris iš tikrųjų yra lygiavertis tiesiniam diagnostikos modeliui.

Praktikoje, žinoma, situacija dažnai skiriasi nuo aprašyto idealizuoto pavyzdžio. Prieš tyrėją, ketinantį taikyti atpažinimo metodą, pagrįstą palyginimu su prototipais diagnostikos užsiėmimai, kelkis sunkių problemų.

Pirma, tai yra artumo matavimo (metrikos) pasirinkimas, kuris gali žymiai pakeisti objektų pasiskirstymo erdvinę konfigūraciją. Antra, savarankiška problema yra daugiamačių eksperimentinių duomenų struktūrų analizė. Abi šios problemos ypač aktualios tyrėjui esant didelėms ypatybių erdvės matmenims, būdingoms tikroms problemoms.

k artimiausių kaimynų metodas

K-arčiausio kaimyno metodas diskriminacinės analizės problemoms spręsti pirmą kartą buvo pasiūlytas dar 1952 m. Tai yra taip.

Klasifikuojant nežinomą objektą, randama duotas numeris k) geometriškai arčiausiai jo kitų objektų (artimiausių kaimynų), turinčių jau žinomą priklausymą atpažįstamoms klasėms, savybių erdvėje. Sprendimas priskirti nežinomą objektą tam tikrai diagnostikos klasei priimamas analizuojant informaciją apie šį žinomą artimiausių kaimynų priklausomybę, pavyzdžiui, naudojant paprastą balsų skaičiavimą.

Iš pradžių k-arčiausių kaimynų metodas buvo laikomas neparametriniu tikimybių santykio įvertinimo metodu. Taikant šį metodą, buvo gauti teoriniai jo efektyvumo įverčiai, palyginti su optimaliu Bajeso klasifikatoriumi. Įrodyta, kad k-arčiausių kaimynų metodo asimptotinės paklaidos tikimybės ne daugiau kaip du kartus viršija Bajeso taisyklės paklaidas.

Naudodamas k-arčiausių kaimynų metodą modelio atpažinimui, tyrėjas turi nuspręsti sudėtinga problema pasirenkant metriką diagnozuotų objektų artumui nustatyti. Ši problema esant dideliam objektų erdvės matmeniui labai apsunkina dėl šio metodo pakankamo sudėtingumo, kuris tampa reikšmingas net ir didelio našumo kompiuteriams. Todėl čia, kaip ir palyginimo su prototipu metodu, būtina išspręsti kūrybinę eksperimentinių duomenų daugiamatės struktūros analizės problemą, kad būtų sumažintas diagnostines klases reprezentuojančių objektų skaičius.

Poreikis sumažinti objektų skaičių mokymo imtyje (diagnostikos precedentai) yra šio metodo trūkumas, nes jis sumažina mokymo imties reprezentatyvumą.

Reitingų skaičiavimo („balsavimo“) algoritmai

Vertinimo skaičiavimo algoritmų (ABO) veikimo principas yra skaičiuoti prioritetus (panašumo balus), apibūdinančius atpažintų ir atskaitos objektų „artimumą“ pagal savybių ansamblių sistemą, kuri yra tam tikro savybių rinkinio poaibių sistema. .

Skirtingai nuo visų anksčiau aptartų metodų, įverčių skaičiavimo algoritmai su objektų aprašymais veikia iš esmės nauju būdu. Šiems algoritmams objektai vienu metu egzistuoja labai skirtingose funkcijų erdvės poerdėse. ABO klasė perkelia idėją naudoti ypatybes iki logiškos išvados: kadangi ne visada žinoma, kurios požymių kombinacijos yra informatyviausios, tai ABO objektų panašumo laipsnis apskaičiuojamas lyginant visus galimus ar konkrečius derinius. požymius, įtrauktus į objektų aprašymus.

Naudojamus ypatybių (poerdvių) derinius autoriai vadina paramos rinkiniais arba dalinių objektų aprašymų rinkiniais. Supažindinama su apibendrinto artumo tarp atpažinto objekto ir mokomojo pavyzdžio objektų sąvoka (su gerai žinoma klasifikacija), kurie vadinami atskaitos objektais. Šis artumas parodomas atpažinto objekto artumo su atskaitos objektais deriniu, apskaičiuotu pagal dalinių aprašymų rinkinius. Taigi, ABO yra k-arčiausių kaimynų metodo, kuriame objektų artumas atsižvelgiama tik į vieną, išplėtimas. suteikta erdvėženklai.

Kitas ABO išplėtimas yra tas, kad šiuose algoritmuose objektų panašumų ir skirtumų nustatymo užduotis suformuluota kaip parametrinė ir išryškinamas ABO nustatymo pagal mokymo pavyzdį etapas, kuriame optimalios vertėsįvesti parametrai. Kokybės kriterijus yra atpažinimo klaida, o tiesiog viskas yra parametrizuota:

objektų artumo skaičiavimo taisyklės pagal individualias savybes;
objektų artumo objektų poerdėse skaičiavimo taisyklės;
konkretaus pamatinio objekto, kaip diagnostinio precedento, svarbos laipsnį;
kiekvieno etaloninio požymių rinkinio indėlio į reikšmę galutinis pažymys atpažinto objekto panašumas į bet kurią diagnostinę klasę.

ABO parametrai nurodomi kaip slenkstinės vertės ir (arba) kaip nurodytų komponentų svoris.

Teorinės AVO galimybės yra bent jau ne mažesnės nei bet kurio kito modelio atpažinimo algoritmo, nes AVO pagalba galima įgyvendinti visas įmanomas operacijas su tiriamais objektais.

Tačiau, kaip dažniausiai būna, potencialių galimybių išplėtimas susiduria su dideliais sunkumais juos praktiškai įgyvendinant, ypač tokio tipo algoritmų konstravimo (derinimo) stadijoje.

Kai kurie sunkumai buvo pastebėti anksčiau, aptariant k-artimiausių kaimynų metodą, kuris gali būti interpretuojamas kaip sutrumpinta ABO versija. Tai taip pat gali būti laikoma parametrinė forma ir sumažinkite problemą iki pasirinkto tipo svertinės metrikos radimo. Tuo pačiu metu čia iškyla sudėtingų problemų, susijusių su didelės apimties problemomis. teoriniai klausimai ir problemas, susijusias su efektyvaus skaičiavimo proceso organizavimu.

AVO atveju, jei bandote išnaudoti šių algoritmų galimybes iki galo, šie sunkumai išaugs daug kartų.

Pažymėtos problemos paaiškina, kad praktikoje ABO naudojimas sprendžiant didelės apimties problemas yra susijęs su kai kurių euristinių apribojimų ir prielaidų įvedimu. Visų pirma, yra žinomas ABO naudojimo psichodiagnostikoje pavyzdys, kai buvo išbandytas ABO tipas, kuris iš tikrųjų yra lygiavertis k-artimiausių kaimynų metodui.

Sprendimų taisyklės kolektyvai

Norėdami užbaigti modelio atpažinimo metodų apžvalgą, pažvelkime į dar vieną metodą. Tai yra vadinamieji sprendimų taisyklių kolektyvai (DRR).

Kadangi skirtingi atpažinimo algoritmai toje pačioje objektų pavyzdyje pasireiškia skirtingai, natūraliai kyla klausimas dėl sintetinių lemiama taisyklė, kuri adaptyviai naudoja šių algoritmų stipriąsias puses. Sintetinio sprendimo taisyklė naudoja dviejų lygių atpažinimo schemą. Pirmajame lygyje veikia privatūs atpažinimo algoritmai, kurių rezultatai sujungiami antrame lygyje sintezės bloke. Dažniausiai pasitaikantys tokio unifikavimo metodai yra pagrįsti konkretaus algoritmo kompetencijos sričių nustatymu. Paprasčiausias būdas rasti kompetencijos sritis yra a priori padalinti atributų erdvę remiantis profesiniais konkretaus mokslo sumetimais (pavyzdžiui, suskirstyti imtį pagal tam tikrą požymį). Tada kiekvienai pasirinktai sričiai sukuriamas atskiras atpažinimo algoritmas. Kitas metodas yra pagrįstas formalios analizės naudojimu, siekiant nustatyti vietines objektų erdvės sritis kaip atpažintų objektų apylinkes, kurioms buvo įrodyta bet kurio konkretaus atpažinimo algoritmo sėkmė.

Dauguma bendras požiūris sintezės blokui sukonstruoti, gautus privačių algoritmų rodiklius laiko pradiniais ženklais konstruojant naują apibendrintą sprendimo taisyklę. Šiuo atveju galima naudoti visus aukščiau išvardintus įtempimo ir išplėtimo krypčių modelio atpažinimo metodus. Veiksmingi sprendimo taisyklių grupės sukūrimo problemai išspręsti yra „Kora“ tipo loginiai algoritmai ir įverčių skaičiavimo (ABO) algoritmai, kurie sudaro vadinamojo algebrinio metodo, teikiančio tyrimus ir tyrimus, pagrindą. konstruktyvus aprašymas atpažinimo algoritmai, kurių rėmuose visi telpa esamų tipų algoritmai

Modelių atpažinimo metodų lyginamoji analizė

Palyginkime aukščiau aprašytus modelių atpažinimo būdus ir įvertinkime jų tinkamumo laipsnį 3.3.3 skirsnyje suformuluotiems reikalavimams adaptyvių automatizuotų valdymo sistemų SDA modeliams. sudėtingos sistemos.

Realioms problemoms spręsti iš intensyviosios krypties metodų grupės turi praktinę vertę parametriniai metodai ir metodai, pagrįsti pasiūlymais dėl sprendimų funkcijų formos. Parametriniai metodai sudaro tradicinės rodiklių konstravimo metodikos pagrindą. Šių metodų taikymas tikros problemos yra susijęs su griežtų duomenų struktūros apribojimų įvedimu, dėl kurio sukuriami linijiniai diagnostikos modeliai su labai apytiksliais jų parametrų įverčiais. Taikant metodus, pagrįstus prielaidomis apie sprendimo funkcijų formą, tyrėjas taip pat yra priverstas atsigręžti į tiesinius modelius. Taip yra dėl didelio ypatybių erdvės matmens, būdingo tikroms problemoms, kuri, didėjant daugianario sprendimo funkcijos laipsniui, suteikia didžiulis augimas jos narių skaičius, kartu su probleminiu atpažinimo kokybės padidėjimu. Taigi, projektuojant potencialaus intensyvaus atpažinimo metodų taikymo sritį į realias problemas, gauname vaizdą, atitinkantį gerai išvystytą tradicinę linijinės diagnostikos modelių metodiką.

Linijinių diagnostinių modelių, kuriuose diagnostinis rodiklis atvaizduojamas svertine pradinių charakteristikų suma, savybės buvo gerai ištirtos. Šių modelių rezultatai (su atitinkamu normalizavimu) interpretuojami kaip atstumai nuo tiriamų objektų iki tam tikros hiperplokštumos objektų erdvėje arba, lygiaverčiai, kaip objektų projekcijos į kokią nors tiesią liniją šioje erdvėje. Todėl linijiniai modeliai yra tinkami tik paprastoms geometrinėms objektų erdvės sričių konfigūracijoms, į kurias atvaizduojami skirtingų diagnostinių klasių objektai. Su daugiau sudėtingi paskirstymaiŠie modeliai iš esmės negali atspindėti daugelio eksperimentinių duomenų struktūros ypatybių. Tuo pačiu metu tokios funkcijos gali suteikti vertingos diagnostinės informacijos.

Tuo pačiu metu bet kurioje tikroje problemoje atsiranda paprastų daugiamačių struktūrų (ypač daugiamačių normalieji skirstiniai) turėtų būti laikoma išimtimi, o ne taisykle. Diagnostinės klasės dažnai formuojamos remiantis sudėtingais išoriniais kriterijais, o tai automatiškai lemia šių klasių geometrinį nevienalytiškumą objektų erdvėje. Tai ypač pasakytina apie „gyvybiškai svarbius“ kriterijus, su kuriais dažniausiai susiduriama praktikoje. Esant tokioms sąlygoms, linijiniai modeliai fiksuoja tik pačius „grubiausius“ eksperimentinės informacijos modelius.

Išplėstinių metodų naudojimas nėra susijęs su prielaidomis apie eksperimentinės informacijos struktūrą, išskyrus tai, kad atpažįstamose klasėse turėtų būti viena ar kelios šiek tiek panašių objektų grupės, o skirtingų klasių objektai turėtų šiek tiek skirtis vienas nuo kito. Akivaizdu, kad bet kokiam baigtiniam mokymo imties dydžiui (ir negali būti jokio kito), šis reikalavimas visada tenkinamas vien dėl to, kad tarp objektų yra atsitiktinių skirtumų. Kaip panašumo matai naudojami įvairūs objektų artumo (atstumo) matai požymio erdvėje. Štai kodėl efektyvus naudojimas Išplėstiniai modelio atpažinimo metodai priklauso nuo to, kaip gerai nustatomos nurodytos artumo priemonės, taip pat nuo to, kurie mokomosios imties objektai (objektai su žinoma klasifikacija) yra diagnostiniai precedentai. Sėkmingas šių problemų sprendimas duoda rezultatų, artėjančių prie teoriškai pasiekiamų atpažinimo efektyvumo ribų.

Išplėstinių modelių atpažinimo metodų pranašumus pirmiausia atsveria didelis techninis jų praktinio įgyvendinimo sudėtingumas. Didelių matmenų objektų erdvėse iš pažiūros paprasta užduotis surasti artimiausių taškų poras virsta rimta problema. Be to, daugelis autorių kaip problemą pažymi poreikį atsiminti pakankamai daug objektų, atstovaujančių pripažintoms klasėms.

Tai savaime nėra problema, tačiau ji suvokiama kaip problema (pavyzdžiui, taikant k-artimiausių kaimynų metodą) dėl to, kad atpažįstant kiekvieną objektą, įvyksta pilna visų mokymo rinkinio objektų paieška.

Todėl patartina taikyti atpažinimo sistemos modelį, kuriame pašalinama visiško objektų surašymo pratybų pavyzdyje problema atpažinimo metu, nes generuojant apibendrintus atpažinimo klasių vaizdus, tai atliekama tik vieną kartą. Pačio atpažinimo metu identifikuotas objektas lyginamas tik su apibendrintais atpažinimo klasių vaizdais, kurių skaičius yra fiksuotas ir visiškai nepriklausomas nuo mokomosios imties dydžio. Šis metodas leidžia padidinti mokomosios imties dydį, kol bus pasiekta reikiama aukšta apibendrintų vaizdų kokybė, nesibaiminant, kad dėl to gali nepriimtinai pailgėti atpažinimo laikas (nes atpažinimo laikas šiame modelyje nepriklauso nuo mokymo imties dydis).

Teorinės išplėstinio atpažinimo metodų naudojimo problemos siejamos su informacinių požymių grupių paieškos, optimalių objektų panašumų ir skirtumų matavimo metrikų radimo bei eksperimentinės informacijos struktūros analizės problemomis. Kartu sėkmingas šių problemų sprendimas leidžia ne tik sukonstruoti efektyvius atpažinimo algoritmus, bet ir pereiti nuo išplėstinių empirinių faktų žinojimo prie intencionalių žinių apie jų struktūros modelius.

Perėjimas nuo išplėstinių prie intencionalių žinių įvyksta tada, kai jau yra sukurtas formalus atpažinimo algoritmas ir įrodytas jo efektyvumas. Tada tiriami mechanizmai, kuriais pasiekiamas gaunamas efektyvumas. Toks tyrimas, siejamas su geometrinės duomenų struktūros analize, gali, pavyzdžiui, leisti daryti išvadą, kad pakanka tam tikrą diagnostinę klasę reprezentuojančius objektus pakeisti vienu tipišku atstovu (prototipu). Kaip minėta aukščiau, tai prilygsta tradicinės tiesinės diagnostikos skalės nustatymui. Taip pat gali būti, kad užtenka kiekvieną diagnostinę klasę pakeisti keliais objektais, konceptualizuotais kaip tipiniai kai kurių poklasių atstovai, o tai prilygsta tiesinių mastelių ventiliatoriaus konstravimui. Yra ir kitų variantų, kurie bus aptarti toliau.

Taigi, atpažinimo metodų apžvalga rodo, kad dabar teoriškai sukurta nemažai skirtingų modelių atpažinimo metodų. Literatūroje pateikiama išsami jų klasifikacija. Tačiau daugumai šių metodų nėra programinės įrangos įdiegimo, ir tai yra labai natūralu, netgi galima sakyti, „nulemta“ pačių atpažinimo metodų savybių. Tai galima spręsti iš to, kad tokios sistemos retai minimos specializuotoje literatūroje ir kituose informacijos šaltiniuose.

Vadinasi, klausimas dėl tam tikrų teorinių atpažinimo metodų praktinio pritaikymo sprendžiant praktines problemas su realiais (t.y. gana reikšmingais) duomenų matmenimis ir realiuose šiuolaikiniuose kompiuteriuose lieka nepakankamai išplėtotas.

Aukščiau minėtą aplinkybę galima suprasti, jei prisiminsime, kad matematinio modelio sudėtingumas eksponentiškai padidina sistemos programinio diegimo sudėtingumą ir tuo pačiu sumažina tikimybę, kad ši sistema praktiškai veiks. Tai reiškia, kad realiai rinkoje gali būti įdiegtos tik gana paprastais ir „skaidriais“ matematiniais modeliais pagrįstos programinės įrangos sistemos. Todėl kūrėjas, norintis pakartoti savo programinės įrangos produktą, nesprendžia matematinio modelio pasirinkimo tik su mokslinis taškas vizija, bet kaip pragmatikas, atsižvelgdamas į programinės įrangos diegimo galimybes. Jis mano, kad modelis turi būti kuo paprastesnis, vadinasi, diegiamas mažesnėmis sąnaudomis ir kokybiškiau, be to, turi veikti (būti praktiškai efektyvus).

Šiuo atžvilgiu ypač aktualus atrodo uždavinys atpažinimo sistemose įdiegti tai pačiai klasei priklausančių objektų aprašymų apibendrinimo mechanizmą, t.y. kompaktiškų apibendrintų vaizdų formavimo mechanizmas. Akivaizdu, kad toks apibendrinimo mechanizmas leis „suspausti“ bet kokio matmens mokymo pavyzdį į apibendrintų vaizdų, iš anksto žinomų pagal matmenis, duomenų bazę. Tai taip pat leis kelti ir išspręsti daugybę problemų, kurių net neįmanoma suformuluoti tokiuose atpažinimo metoduose kaip palyginimo su prototipu metodas, k-artimiausių kaimynų metodas ir ABO.

Tai yra užduotys:

ypatybių informacinio indėlio į apibendrinto vaizdo informacinį portretą nustatymas;
klasterinė apibendrintų vaizdų analizė;
ypatybės semantinės apkrovos nustatymas;
semantinė klasterinė-konstruktyvi požymių analizė;
prasmingas apibendrintų klasių vaizdų tarpusavyje ir charakteristikų palyginimas (kognityvinės diagramos, įskaitant Merlin diagramas).

Metodas, kuris leido išspręsti šias problemas, taip pat išskiria ja pagrįstą perspektyvią sistemą iš kitų sistemų, kaip ir kompiliatoriai skiriasi nuo interpretatorių, nes dėl apibendrintų vaizdų formavimo šioje perspektyvioje sistemoje atpažinimo laikas nepriklauso nuo kitų sistemų. pasiekiamas mokomosios imties dydis. Yra žinoma, kad būtent šios priklausomybės buvimas lemia praktiškai nepriimtinas kompiuterinio laiko sąnaudas atpažinimui naudojant tokius metodus kaip k-artimiausių kaimynų metodas, ABO ir KRP, esant tokiems mokymo imties matmenims, kai galime kalbėti apie pakankamą statistiką. .

Baigdami trumpą atpažinimo metodų apžvalgą, pateiksime aukščiau paminėtų dalykų esmę suvestinėje lentelėje (3.1 lentelė), kurioje trumpai aprašomi įvairūs modelio atpažinimo metodai pagal šiuos parametrus:

atpažinimo metodų klasifikacija;
atpažinimo metodų taikymo sritys;
atpažinimo metodų apribojimų klasifikacija.

Atpažinimo metodų klasifikacija		Taikymo sritis	Apribojimai (trūkumai)
Intensyvūs atpažinimo metodai	Metodai, pagrįsti bruožų reikšmių (arba objektų panašumų ir skirtumų) pasiskirstymo tankio įvertinimu	Žinomo pasiskirstymo problemos, paprastai normalios, reikalauja didelio statistikos rinkinio	Poreikis surašyti visą mokymo pavyzdį atpažinimo metu, didelis jautrumas mokymo pavyzdžio nereprezentatyvumui ir artefaktams
	Metodai, pagrįsti prielaidomis apie sprendimo funkcijų klasę	Klasės turi būti gerai atskiriamos, požymių sistema turi būti ortonormali	Sprendimo funkcijos tipas turi būti žinomas iš anksto. Nesugebėjimas atsižvelgti į naujas žinias apie bruožų sąsajas
	Būlio metodai		Renkantis loginio sprendimo taisykles (jungtukus), būtina pilna paieška. Didelis skaičiavimo sudėtingumas
	Kalbiniai (struktūriniai) metodai	Mažo objekto erdvės matmenų problemos	Užduotis rekonstruoti (apibūdinti) gramatiką iš tam tikro teiginių (objektų aprašymų) rinkinio yra sunkiai formalizuojama. Neišspręstas teorinės problemos
Išplėstinio atpažinimo metodai	Palyginimo su prototipu metodas	Mažo objekto erdvės matmenų problemos	Didelė klasifikavimo rezultatų priklausomybė nuo atstumo matavimo (metrikos). Nežinoma optimali metrika
	k artimiausių kaimynų metodas		Didelė klasifikavimo rezultatų priklausomybė nuo atstumo matavimo (metrikos). Pripažinimo metu reikia išsamiai surašyti mokymo pavyzdį. Skaičiavimo pastangos
	AVO reitingų (balsavimo) skaičiavimo algoritmai	Mažo matmens problemos klasių ir savybių atžvilgiu	Klasifikavimo rezultatų priklausomybė nuo atstumo matavimo (metrikos). Pripažinimo metu reikia išsamiai surašyti mokymo pavyzdį. Didelis techninis metodo sudėtingumas
	Sprendimų taisyklių kolektyvai (DRC)	Mažo matmens problemos klasių ir savybių atžvilgiu	Labai didelis metodo techninis sudėtingumas, neišspręstas teorinių problemų skaičius tiek nustatant privačių metodų kompetencijos sritis, tiek pačiuose privačiuose metoduose

3.1 lentelė. Suvestinė atpažinimo metodų klasifikavimo lentelė, jų taikymo sričių ir apribojimų palyginimas

Modelių atpažinimo vaidmuo ir vieta sudėtingų sistemų valdymo automatizavime

Automatizuota valdymo sistema susideda iš dviejų pagrindinių dalių: valdymo objekto ir valdymo sistemos.

Valdymo sistema atlieka šias funkcijas:

valdymo objekto būklės identifikavimas;
valdymo veiksmo kūrimas remiantis valdymo tikslais, atsižvelgiant į valdymo objekto ir aplinkos būklę;
suteikiant valdymo įtaką valdymo objektui.

Modelio atpažinimas yra ne kas kita, kaip kokio nors objekto būsenos nustatymas.

Vadinasi, galimybė naudoti modelio atpažinimo sistemą valdymo objekto būsenos nustatymo etape atrodo gana akivaizdi ir natūrali. Tačiau tai gali būti nereikalinga. Todėl kyla klausimas, kokiais atvejais atpažinimo sistemą patartina naudoti automatizuotoje valdymo sistemoje, o kokiais – ne.

Literatūros duomenimis, daugelis anksčiau sukurtų ir modernių automatizuotų valdymo sistemų valdymo objekto būklei nustatyti ir valdymo veiksmams kurti naudoja deterministinius matematinius „tiesioginio skaičiavimo“ modelius, kurie vienareikšmiškai ir gana paprastai nustato, ką daryti su valdikliu. objektą, jei jis turi tam tikrus išorinius parametrus.

Tuo pačiu nekeliamas ir neišspręstas klausimas, kaip šie parametrai yra susiję su tam tikromis valdymo objekto būsenomis. Ši pozicija atitinka požiūrį, kad „pagal nutylėjimą“ jų santykiai vienas su vienu yra priimtini. Todėl sąvokos „valdymo objekto parametrai“ ir „valdymo objekto būsena“ laikomos sinonimais, o sąvoka „valdymo objekto būsena“ apskritai nėra aiškiai įvedama. Tačiau akivaizdu, kad bendruoju atveju ryšys tarp stebimų valdymo objekto parametrų ir jo būsenos yra dinamiškas ir tikimybinis pobūdis.

Taigi tradicinės automatizuotos valdymo sistemos iš esmės yra parametrinės valdymo sistemos, t.y. sistemos, valdančios ne valdymo objekto būsenas, o tik stebimus jo parametrus. Sprendimas dėl valdymo veiksmo tokiose sistemose priimamas tarsi „aklai“, t.y. nesudarant holistinio valdymo objekto ir aplinkos dabartinės būsenos vaizdo, taip pat neprognozuojant aplinkos raidos ir valdymo objekto reakcijos į tam tikrus valdymo poveikius jai, veikiant kartu su numatoma aplinkos įtaka. .

Žvelgiant iš šio darbo perspektyvos, sąvoka „sprendimų priėmimas“ šiuolaikine prasme vargu ar visiškai tinka tradicinėms automatizuotoms valdymo sistemoms. Faktas yra tas, kad „sprendimų priėmimas“ bent jau suponuoja holistinę objekto viziją aplinkoje, ne tik dabartinės būsenos, bet ir dinamikos, o sąveikoje tiek tarpusavyje, tiek su valdymo sistema. svarstyti įvairius alternatyvius visos šios sistemos kūrimo variantus, taip pat susiaurinti šių alternatyvų įvairovę (sumažinimą), remiantis tam tikrais tiksliniais kriterijais. Akivaizdu, kad to nėra tradicinėse automatizuotose valdymo sistemose arba ji egzistuoja, bet supaprastinta forma.

tikrai, tradicinis metodas yra tinkamas ir jo naudojimas yra gana teisingas ir pagrįstas tais atvejais, kai valdymo objektas yra tikrai stabilus ir standus deterministinė sistema, o aplinkos įtakos jai galima nepaisyti.

Tačiau kitais atvejais šis metodas yra neveiksmingas.

Jei valdymo objektas yra dinamiškas, tai valdymo algoritmais grindžiami modeliai greitai tampa neadekvatūs, nes kinta įvesties ir išvesties parametrų ryšiai bei pati esminių parametrų rinkinys. Iš esmės tai reiškia, kad tradicinės automatizuotos valdymo sistemos yra pajėgios valdyti valdymo objekto būseną tik šalia pusiausvyros taško per silpnus valdymo veiksmus jame, t.y. mažų perturbacijų metodu. Toli nuo pusiausvyros būsenos, tradiciniu požiūriu, valdymo objekto elgesys atrodo nenuspėjamas ir nekontroliuojamas.

Jei nėra vienareikšmio ryšio tarp valdymo objekto įvesties ir išvesties parametrų (t. y. tarp įvesties parametrų ir objekto būsenos), kitaip tariant, jei šis ryšys turi ryškų tikimybinį pobūdį, tada deterministiniai modeliai, kuriuose jis yra Daroma prielaida, kad tam tikro parametro matavimo rezultatas yra tiesiog skaičius, iš pradžių netaikomi. Be to, šio ryšio tipas gali būti tiesiog nežinomas, ir tuomet reikia vadovautis pačia bendriausia prielaida: kad ji yra tikimybinė arba visai neapibrėžta.

Tradiciniais principais sukurta automatizuota valdymo sistema gali veikti tik remiantis parametrais, kurių jungčių schemos jau žinomos, ištirtos ir atspindėtos matematiniame modelyje Šiame darbe keliamas uždavinys sukurti tokius automatizuoto projektavimo metodus valdymo sistemos, kurios leis sukurti sistemas, gebančias identifikuoti ir reikšmingiausius parametrus bei nustatyti ryšių tarp jų ir valdymo objekto būsenų pobūdį.

Šiuo atveju būtina naudoti labiau išvystytą ir tinkamą reali situacija matavimo metodai:

vaizdų klasifikavimas ar atpažinimas (mokymasis remiantis mokymo rinkiniu, atpažinimo algoritmų pritaikomumas, tiriamų klasių ir parametrų aibių pritaikomumas, reikšmingiausių parametrų parinkimas ir aprašymo dimensijos sumažinimas išlaikant duotą pertekliškumą ir kt.);
statistiniai matavimai, kai tam tikro parametro matavimo rezultatas yra ne atskiras skaičius, o tikimybių skirstinys: statistinio kintamojo pokytis reiškia ne jo vertės pasikeitimą savaime, o tikimybių skirstinio charakteristikų pasikeitimą. jos vertybes.

Dėl to automatizuotos valdymo sistemos, pagrįstos tradiciniu deterministiniu požiūriu, praktiškai neveikia su sudėtingais dinaminiais kelių parametrų silpnai deterministiniais valdymo objektais, tokiais kaip, pavyzdžiui, makro- ir mikrosocialinės ir ekonominės sistemos dinamiškoje pasaulio ekonomikoje. pereinamasis laikotarpis“, hierarchinis elitas ir etninės grupės, visuomenė ir elektoratas, žmogaus fiziologija ir psichika, gamtos ir dirbtinės ekosistemos ir daugelis kitų.

Labai reikšminga, kad devintojo dešimtmečio viduryje I. Prigogine'o mokykla sukūrė požiūrį, pagal kurį bet kurios sistemos (taip pat ir žmonių) raida keičia periodus, per kuriuos sistema elgiasi arba kaip „daugiausia deterministinė“, arba „daugiausia atsitiktinė“. Natūralu, tikroji sistema vadovybė turi nuolat valdyti valdymo objektą ne tik „deterministinėse“ jo istorijos dalyse, bet ir tais momentais, kai tolesnis jo elgesys tampa labai neaiškus. Jau vien tai reiškia, kad būtina sukurti požiūrį į valdymo sistemas, kurių elgesys turi didelį atsitiktinumo elementą (arba tai, kas šiuo metu matematiškai apibūdinama kaip „atsitiktinumas“).

Todėl perspektyvios automatizuotos valdymo sistemos, užtikrinančios sudėtingų dinaminių kelių parametrų silpnai deterministinių sistemų valdymą, kaip esminės funkcinės jungtys, matyt, apims posistemes, skirtas aplinkos ir valdymo objekto būsenoms nustatyti ir nuspėti, remiantis dirbtinio intelekto metodais (pirmiausia modeliu). atpažinimas), sprendimų priėmimo pagalbos metodai ir informacijos teorija.

Trumpai apsvarstykime vaizdų atpažinimo sistemų panaudojimo priimant sprendimus dėl valdymo veiksmų klausimą (šis klausimas bus išsamiau aptartas vėliau, nes tai yra esminis dalykas šiame darbe). Jei kaip atpažinimo klases imsime taikinį ir kitas valdymo objekto būsenas, o kaip požymius – veiksnius, įtakojančius jį, tai modelio atpažinimo modelyje gali susidaryti veiksnių ir būsenų santykio matas. Tai leidžia tam tikrai valdymo objekto būsenai gauti informaciją apie veiksnius, skatinančius arba trukdančius jo perėjimui į šią būseną, ir tuo remiantis parengti sprendimą dėl valdymo veiksmo.

Veiksnius galima suskirstyti į šias grupes:

charakterizuojant valdymo objekto foną;
apibūdinti esamą valdymo objekto būseną;
aplinkos veiksniai;
technologiniai (valdomi) veiksniai.

Taigi modelio atpažinimo sistemos gali būti naudojamos kaip automatizuotų valdymo sistemų dalis: valdymo objekto būklei nustatyti ir valdymo veiksmams kurti posistemėse.

Tai tinka, kai valdymo objektas yra sudėtinga sistema.

Sprendimo dėl valdymo veiksmo priėmimas automatizuotoje valdymo sistemoje

Šiame darbe nagrinėjamas adaptyvių automatizuotų valdymo sistemų sintezavimo sudėtingomis sistemomis problemos sprendimas, atsižvelgiant į daugybę ir gilių modelių atpažinimo ir sprendimų priėmimo metodų analogijų.

Viena vertus, modelio atpažinimo problema yra priimti sprendimą, ar atpažintas objektas priklauso tam tikrai atpažinimo klasei.

Kita vertus, autoriai siūlo sprendimų priėmimo problemą svarstyti kaip atvirkštinė problema dekodavimo arba atvirkštinio modelio atpažinimo užduotis (žr. 2.2.2 skyrių).

Pagrindinių idėjų, kuriomis grindžiami modelių atpažinimo ir sprendimų priėmimo metodai, bendrumas ypač išryškėja nagrinėjant juos informacijos teorijos požiūriu.

Įvairios sprendimų priėmimo problemos

Sprendimų priėmimas kaip tikslo įgyvendinimas

Apibrėžimas: sprendimo priėmimas („pasirinkimas“) – tai veiksmas prieš aibę alternatyvų, dėl kurio susiaurinamas pradinis alternatyvų rinkinys, t.y. įvyksta jo sumažinimas.

Pasirinkimas yra veiksmas, kuris suteikia tikslą visoms veikloms. Būtent pasirinkimo aktais realizuojamas visos veiklos pajungimas konkrečiam tikslui arba tarpusavyje susijusių tikslų rinkiniui.

Taigi, kad pasirinkimo veiksmas taptų įmanomas, būtina:

Alternatyvų rinkinio, pagal kurį būtų galima pasirinkti, sukūrimas arba atradimas;
tikslų, dėl kurių renkamasi, nustatymas;
alternatyvų tarpusavio palyginimo metodo sukūrimas ir taikymas, t.y. nustatant kiekvienos alternatyvos pirmenybės įvertinimą pagal tam tikrus kriterijus, leidžianti netiesiogiai įvertinti, kaip kiekviena alternatyva atitinka tikslą.

Šiuolaikinis darbas sprendimų palaikymo srityje atskleidė būdingą situaciją, kad visiškas geriausio (tam tikra prasme) sprendimo suradimo formalizavimas įmanomas tik gerai išnagrinėtoms, gana paprastoms problemoms, o praktikoje silpnai struktūrizuotos problemos. dažniau susiduriama, kuriai nėra sukurti visiškai formalizuoti algoritmai (išskyrus išsamią paiešką ir bandymus bei klaidas). Tačiau patyrę, kompetentingi ir pajėgūs specialistai dažnai pasirenka, kurie pasirodo gana geri. Štai kodėl moderni tendencija sprendimų priėmimo praktika natūraliose situacijose susideda iš žmogaus gebėjimo spręsti neformalias problemas derinimo su galimybėmis formalūs metodai ir kompiuterinis modeliavimas: interaktyvios sprendimų palaikymo sistemos, ekspertų sistemos, adaptyvios žmogaus ir mašinos automatizuotos valdymo sistemos, neuroniniai tinklai ir pažinimo sistemos.

Sprendimų priėmimas kaip netikrumo pašalinimas (informacinis metodas)

Informacijos gavimo procesas gali būti vertinamas kaip neapibrėžtumo sumažėjimas dėl signalo priėmimo, o informacijos kiekis gali būti laikomas kiekybiniu neapibrėžtumo pašalinimo laipsnio matu.

Bet dėl to, kad iš rinkinio pasirenkamas tam tikras alternatyvų poaibis, t.y. dėl sprendimų priėmimo vyksta tas pats (mažinamas neapibrėžtumas). Tai reiškia, kad kiekvienas pasirinkimas, kiekvienas sprendimas generuoja tam tikrą informacijos kiekį, todėl gali būti apibūdintas informacijos teorija.

Sprendimų priėmimo problemų klasifikacija

Sprendimų priėmimo užduočių įvairovė atsiranda dėl to, kad kiekvienas situacijos, kurioje priimami sprendimai, komponentas gali būti įgyvendintas kokybiškai skirtingais variantais.

Išvardykime tik keletą iš šių parinkčių:

alternatyvų rinkinys, viena vertus, gali būti baigtinis, skaičiuojamas arba tęstinis, kita vertus, uždaras (t. y. visiškai žinomas) arba atviras (įskaitant nežinomus elementus);
alternatyvų vertinimas gali būti atliekamas pagal vieną ar kelis kriterijus, kurie savo ruožtu gali būti kiekybinio arba kokybinio pobūdžio;
Pasirinkimo režimas gali būti vienkartinis (vienkartinis), arba daugkartinis, pasikartojantis, įskaitant grįžtamąjį ryšį apie pasirinkimo rezultatus, t.y. leisti apmokyti sprendimų priėmimo algoritmus, atsižvelgiant į ankstesnių rinkimų pasekmes;
kiekvienos alternatyvos pasirinkimo pasekmės gali būti tiksliai žinomos iš anksto (pasirinkimas pagal tikrumą), turi tikimybinį pobūdį, kai žinomos galimų pasekmių tikimybė po pasirinkimo (pasirinkimas rizikingas) arba dviprasmiškas rezultatas su nežinomomis tikimybėmis (pasirinkimas neapibrėžtumo sąlygomis);
atsakomybės už pasirinkimą gali nebūti, ji gali būti individuali arba grupinė;
grupės pasirinkimo tikslų nuoseklumo laipsnis gali skirtis nuo visiško šalių interesų sutapimo (bendradarbiaujantis pasirinkimas) iki priešingo (pasirinkimo konfliktinė situacija). Galimi ir tarpiniai variantai: kompromisas, koalicija, augantis ar blėstantis konfliktas.

Įvairūs šių variantų deriniai sukelia daugybę sprendimų priėmimo problemų, kurios buvo ištirtos skirtingu laipsniu.

Kalbos, skirtos apibūdinti sprendimų priėmimo metodus

Apie vieną ir tą patį reiškinį galima aptarti įvairių kalbųįvairaus laipsnio bendrumo ir adekvatumo. Iki šiol atsirado trys pagrindinės kalbos, apibūdinančios pasirinkimą.

Paprasčiausia, labiausiai išvystyta ir populiariausia yra kriterijų kalba.

Kriterijų kalba

Šios kalbos pavadinimas siejamas su pagrindine prielaida, kad kiekviena atskira alternatyva gali būti įvertinta kokiu nors konkrečiu (vienu) skaičiumi, po kurio alternatyvų palyginimas redukuojamas į atitinkamų skaičių palyginimą.

Tegu, pavyzdžiui, (X) yra alternatyvų aibė, o x – kokia nors specifinė alternatyva, priklausanti šiai aibei: x∈X. Tada manoma, kad visiems x galima nurodyti funkciją q(x), kuri vadinama kriterijumi (kokybės kriterijumi, tikslo funkcija, pirmenybės funkcija, naudingumo funkcija ir kt.), kuri turi savybę, kad jei alternatyva x 1 yra pageidautina. iki x 2 (žymimas: x 1 > x 2), tada q(x 1) > q(x 2).

Šiuo atveju pasirenkama rasti alternatyvą, kurios kriterijaus funkcijos vertė yra didžiausia.

Tačiau praktiškai naudojant tik vieną kriterijų alternatyvų pirmenybės laipsniui palyginti, pasirodo, yra nepagrįstas supaprastinimas, nes daugiau išsamus svarstymas alternatyvas lemia būtinybė jas vertinti ne pagal vieną, o pagal daugybę kriterijų, kurie gali būti skirtingo pobūdžio ir kokybiškai skirtis vienas nuo kito.

Pavyzdžiui, renkantis keleiviams priimtiniausią orlaivių tipą ir skrydžių organizavimą tam tikro tipo maršrutuose, lyginimai atliekami vienu metu pagal daugybę kriterijų grupių: techninius, technologinius, ekonominius, socialinius, ergonominius ir kt.

Daugiakriterinės problemos neturi unikalaus bendro sprendimo. Todėl siūloma daug būdų, kaip pateikti daugiakriterinę problemą privatus vaizdas, leidžiant tik vieną bendras sprendimas. Žinoma, šie sprendimai skirtingiems metodams paprastai skiriasi. Todėl bene svarbiausias dalykas sprendžiant daugiakriterinę problemą yra tokio tipo formuluotės pagrindimas.

Norint supaprastinti daugiakriterinio pasirinkimo problemą, naudojamos įvairios parinktys. Išvardinkime kai kuriuos iš jų.

Sąlyginis maksimizavimas (randamas ne globalus integralo kriterijaus ekstremumas, bet vietinis ekstremumas pagrindinis kriterijus).
Ieškokite alternatyvos su nurodytomis savybėmis.
Pareto rinkinio radimas.
Sumažinti kelių kriterijų problemą į vieno kriterijaus problemą, įvedant integralų kriterijų.

Išsamiau panagrinėkime formalią daugiakriterinės problemos sumažinimo iki vieno kriterijaus metodo formuluotę.

Įveskime integralo kriterijų q 0 (x) kaip vektoriaus argumento skaliarinę funkciją:

q 0 (x) = q 0 ((q 1 (x), q 2 (x), ..., q n (x)).

Integralinis kriterijus leidžia užsakyti alternatyvas pagal q 0 reikšmę, taip išryškinant geriausias (šio kriterijaus prasme). Funkcijos q 0 formą lemia tai, kaip konkrečiai įsivaizduojame kiekvieno kriterijaus indėlį į integralinį kriterijų. Paprastai naudojamos adityvinės ir multiplikacinės funkcijos:

q 0 = ∑a i ⋅q i /s i

1 – q 0 = ∏(1 – b i ⋅q i /s i)

Pateikiu koeficientus:

Skaičiaus a i ⋅q i /s i matmenų nebuvimas arba vienas matmuo (gali būti įvairių kriterijų skirtingų dydžių, o tada su jais atlikti aritmetinių operacijų ir redukuoti į integralų kriterijų neįmanoma).
Normalizavimas, t.y. užtikrinančios sąlygą: b i ⋅q i /s i<1.

Koeficientai a i ir b i atspindi dalinių kriterijų q i santykinį indėlį į integralinį kriterijų.

Taigi, daugiakriterinėje formuluotėje sprendimo dėl vienos iš alternatyvų pasirinkimo problema kyla dėl integralaus kriterijaus maksimizavimo:

x * = arg max(q 0 (q 1 (x), q 2 (x), ..., q n (x)))

Pagrindinė daugiakriterinio sprendimo priėmimo problemos formulavimo problema yra ta, kad būtina rasti tokią analitinę koeficientų a i ir b i formą, kuri suteiktų tokias modelio savybes:

aukšto lygio atitikimas dalykinei sričiai ir ekspertų požiūriui;
minimalūs skaičiavimo sunkumai maksimizuojant integralo kriterijų, t.y. jo apskaičiavimas skirtingoms alternatyvoms;
integralo kriterijaus maksimizavimo rezultatų stabilumas nuo nedidelių pradinių duomenų trikdžių.
Sprendimo stabilumas reiškia, kad nedidelis pradinių duomenų pakeitimas turėtų lemti nedidelį integralo kriterijaus vertės pokytį ir atitinkamai nedidelį priimto sprendimo pasikeitimą. Taigi, jei pradiniai duomenys praktiškai sutampa, tuomet sprendimas turėtų būti toks pat arba labai artimas.

Nuosekliojo dvejetainio pasirinkimo kalba

Dvejetainių santykių kalba yra daugiakriterinės kalbos apibendrinimas ir remiasi atsižvelgimu į tai, kad kai vertiname alternatyvą, šis vertinimas visada yra santykinis, t.y. aiškiai arba dažniau netiesiogiai, kaip palyginimo pagrindas arba atskaitos sistema yra naudojamos kitos tiriamojo rinkinio arba bendros populiacijos alternatyvos. Žmogaus mąstymas paremtas priešybių (konstrukcijų) paieška ir analize, todėl mums visada lengviau pasirinkti vieną iš dviejų priešingų variantų nei vieną variantą iš didelio ir niekaip nesutvarkyto rinkinio.

Taigi pagrindinės šios kalbos prielaidos yra šios:

nevertinama atskira alternatyva, t.y. kriterijaus funkcija neįvesta;
kiekvienai alternatyvų porai galima kokiu nors būdu nustatyti, kad viena iš jų yra pranašesnė už kitą arba kad jos yra lygiavertės arba nepalyginamos;
pirmenybės santykis bet kurioje alternatyvų poroje nepriklauso nuo likusių pasirinkimui pateiktų alternatyvų.

Dvejetainius ryšius galima nurodyti įvairiais būdais: tiesioginis, matricinis, naudojant pirmenybių grafikus, sekcijos metodą ir kt.

Santykiai tarp vienos poros alternatyvų išreiškiami lygiavertiškumo, tvarkos ir dominavimo sąvokomis.

Apibendrinta pasirinkimo funkcijos kalba

Pasirinkimo funkcijos kalba yra pagrįsta aibių teorija ir leidžia dirbti su žemėlapiais nuo aibių iki jų poaibių, atitinkančių skirtingus pasirinkimus, neišvardijant elementų. Ši kalba yra labai bendra ir gali apibūdinti bet kokį pasirinkimą. Tačiau apibendrintų atrankos funkcijų matematinis aparatas šiuo metu tik kuriamas ir išbandomas daugiausia su problemomis, kurios jau buvo išspręstos taikant kriterijų arba dvejetainius metodus.

Grupės pasirinkimas

Tegul atsiranda grupė žmonių, kurie turi teisę dalyvauti priimant kolektyvinius sprendimus. Tarkime, kad ši grupė svarsto tam tikrą alternatyvų rinkinį ir kiekvienas grupės narys pasirenka savo pasirinkimą. Keliamas uždavinys sukurti sprendimą, kuris tam tikru būdu derina individualius pasirinkimus ir tam tikra prasme išreiškia „bendrą grupės nuomonę“, t.y. priimtas kaip grupės pasirinkimas.

Natūralu, kad skirtingi individualių sprendimų derinimo principai atitiks skirtingus grupės sprendimus.

Individualių sprendimų derinimo grupinio pasirinkimo metu taisyklės vadinamos balsavimo taisyklėmis. Labiausiai paplitusi yra „daugumos taisyklė“, kai daugiausiai balsų surinkusi alternatyva priimama kaip grupės sprendimas.

Reikia suprasti, kad toks sprendimas atspindi tik skirtingų požiūrių paplitimą grupėje, o ne tikrai optimalų variantą, už kurį apskritai niekas negali balsuoti. „Balsuojant tiesa nenusprendžiama“.

Be to, yra vadinamųjų „balsavimo paradoksų“, iš kurių garsiausias yra Arrow paradoksas.

Šie paradoksai gali lemti, o kartais ir lemia labai nemalonius balsavimo procedūros bruožus: pavyzdžiui, būna atvejų, kai grupė apskritai negali priimti vieno sprendimo (nėra kvorumo arba kiekvienas balsuoja už savo unikalų variantą ir pan. .), o kartais (balsuojant keliais etapais) mažuma gali primesti savo valią daugumai.

Pasirinkimas neapibrėžtumo sąlygomis

Tikrumas yra ypatingas neapibrėžtumo atvejis, būtent: tai netikrumas, artimas nuliui.

Šiuolaikinėje pasirinkimo teorijoje manoma, kad sprendimų priėmimo problemose yra trys pagrindiniai neapibrėžtumo tipai:

Informacinis (statistinis) pradinių duomenų neapibrėžtumas sprendimams priimti.
Sprendimo priėmimo (pasirinkimo) pasekmių neapibrėžtumas.
Neaiškumai aprašant sprendimo priėmimo proceso komponentus.

Pažvelkime į juos eilės tvarka.

Informacijos (statistinis) neapibrėžtumas šaltinio duomenyse

Duomenys, gauti apie dalykinę sritį, negali būti laikomi visiškai tiksliais. Be to, akivaizdu, kad šie duomenys mus domina ne patys, o tik kaip signalai, galintys nešti tam tikrą informaciją apie tai, kas mus iš tikrųjų domina. Taigi realiau manyti, kad kalbame su duomenimis, kurie yra ne tik triukšmingi ir netikslūs, bet ir netiesioginiai, o gal ir neišsamūs. Be to, šie duomenys liečia ne visą tiriamą populiaciją, o tik tam tikrą jos pogrupį, apie kurį iš tikrųjų galėjome surinkti duomenis, tačiau tuo pačiu norime padaryti išvadas apie visą populiaciją, o taip pat nori sužinoti šių išvadų patikimumo laipsnį.

Esant tokioms sąlygoms, naudojama statistinių sprendimų teorija.

Šioje teorijoje yra du pagrindiniai neapibrėžtumo šaltiniai. Pirma, nežinoma, kokiu paskirstymu vadovaujasi pirminiai duomenys. Antra, nežinoma, kokį pasiskirstymą turi aibė (bendra populiacija), apie kurią norime padaryti išvadas iš jos poaibio, sudarančio pradinius duomenis.

Statistinės procedūros yra sprendimų priėmimo procedūros, kurios pašalina abu šiuos neapibrėžtumo tipus.

Reikėtų pažymėti, kad yra keletas priežasčių, dėl kurių netinkamai taikomi statistiniai metodai:

Statistinės išvados, kaip ir bet kurios kitos, visada turi tam tikrą patikimumą ar pagrįstumą. Tačiau, skirtingai nei daugeliu kitų atvejų, statistinių išvadų patikimumas yra žinomas ir nustatomas atliekant statistinį tyrimą;
taikant statistinę procedūrą gauto sprendimo kokybė priklauso nuo pirminių duomenų kokybės;
duomenys, kurie nėra statistinio pobūdžio, neturėtų būti statistiškai tvarkomi;
turėtų būti naudojamos statistinės procedūros, atitinkančios a priori informacijos apie tiriamą populiaciją lygį (pavyzdžiui, ANOVA metodai neturėtų būti taikomi ne Gauso duomenims). Jei pradinių duomenų pasiskirstymas nežinomas, reikia arba jį nustatyti, arba naudoti kelis skirtingus metodus ir palyginti rezultatus. Jei jos labai skiriasi, tai rodo kai kurių naudojamų procedūrų nepritaikymą.

Pasekmių neapibrėžtumas

Kai vienos ar kitos alternatyvos pasirinkimo pasekmes vienareikšmiškai lemia pati alternatyva, tada negalime atskirti alternatyvos ir jos pasekmių, nes savaime suprantama, kad pasirinkdami alternatyvą, iš tikrųjų renkamės jos pasekmes.

Tačiau realioje praktikoje dažnai tenka susidurti su sudėtingesne situacija, kai vienos ar kitos alternatyvos pasirinkimas nevienareikšmiškai nulemia pasirinkto pasirinkimo pasekmes.

Diskrečios alternatyvų ir jų pasirinktų rezultatų rinkinio atveju, su sąlyga, kad pati galimų rezultatų rinkinys yra bendras visoms alternatyvoms, galime daryti prielaidą, kad skirtingos alternatyvos skiriasi viena nuo kitos rezultatų tikimybių pasiskirstymu. Šie tikimybių pasiskirstymai bendruoju atveju gali priklausyti nuo alternatyvų pasirinkimo rezultatų ir faktinių rezultatų. Paprasčiausiu atveju rezultatai yra vienodai tikėtini. Patys rezultatai paprastai turi pelno arba nuostolių reikšmę ir yra išreiškiami kiekybiškai.

Jei visų alternatyvų rezultatai yra vienodi, nėra ko rinktis. Jei jie skiriasi, galite palyginti alternatyvas, įvesdami tam tikrus kiekybinius jų įvertinimus. Žaidimų teorijos problemų įvairovė yra susijusi su skirtingais nuostolių ir pelno skaitinių charakteristikų pasirinkimais dėl alternatyvų pasirinkimo, skirtingu konflikto laipsniu tarp šalių, pasirenkančių alternatyvas, ir kt.

Apsvarstykite tokio tipo neapibrėžtumą kaip miglotą neapibrėžtumą

Bet kokia pasirinkimo problema yra tikslingai susiaurinti alternatyvų rinkinį. Tiek formalus alternatyvų aprašymas (pats jų sąrašas, ypatybių ar parametrų sąrašas), tiek palyginimo taisyklių (kriterijų, ryšių) aprašymas visada pateikiami pagal vieną ar kitą matavimo skalę (net ir tada, kai kas tai daro, to nežino).

Yra žinoma, kad visos skalės yra neryškios, tačiau skirtingu laipsniu. Sąvoka „blurring“ reiškia mastelių savybę, kuri susideda iš to, kad visada galima pateikti dvi skirtingas alternatyvas, t.y. skirtingos to paties masto ir nesiskiriančios, t.y. identiški, kitoje – labiau neryškūs. Kuo mažiau gradacijų tam tikroje skalėje, tuo jis neryškesnis.

Taigi aiškiai matome alternatyvas ir kartu miglotai jas klasifikuoti, t.y. neaišku, kurioms klasėms jie priklauso.

Jau pirmajame savo darbe apie sprendimų priėmimą neaiškiose situacijose Bellmanas ir Zadehas iškėlė idėją, kad tikslai ir apribojimai turėtų būti pateikiami kaip neaiški rinkiniai alternatyvų rinkinyje.

Apie kai kuriuos optimizavimo metodo apribojimus

Visose aukščiau aptartose atrankos problemose ir sprendimų priėmimo metoduose iškilo problema pirminiame rinkinyje surasti geriausius pateiktomis sąlygomis, t.y. tam tikra prasme optimalios alternatyvos.

Optimalumo idėja yra pagrindinė kibernetikos idėja ir tvirtai įsitvirtino techninių sistemų projektavimo ir eksploatavimo praktikoje. Kartu ši idėja reikalauja kruopštaus požiūrio, kai bandome ją perkelti į sudėtingų, didelių ir silpnai apibrėžtų sistemų, tokių kaip, pavyzdžiui, socialinių ir ekonominių, valdymo sritį.

Šiai išvadai yra gana rimtų priežasčių. Pažvelkime į kai kuriuos iš jų:

Optimalus sprendimas dažnai pasirodo esantis nestabilus, t.y. nedideli probleminių sąlygų, įvesties ar apribojimų pakeitimai gali lemti labai skirtingų alternatyvų pasirinkimą.
Optimizavimo modeliai kuriami tik siauroms gana paprastų problemų klasėms, kurios ne visada adekvačiai ir sistemingai atspindi tikrus valdymo objektus. Dažniausiai optimizavimo metodai leidžia optimizuoti tik gana paprastas ir gerai formaliai aprašytas kai kurių didelių ir sudėtingų sistemų posistemes, t.y. leisti tik vietinį optimizavimą. Tačiau jei kiekviena didelės sistemos posistemė veikia optimaliai, tai visai nereiškia, kad visa sistema veiks optimaliai. Todėl posistemio optimizavimas nebūtinai lemia elgesį, kurio iš jo reikalaujama optimizuojant visą sistemą. Be to, kartais vietinis optimizavimas gali turėti neigiamų pasekmių visai sistemai. Todėl optimizuojant posistemes ir visą sistemą, būtina nustatyti tikslų ir potikslių medį bei jų prioritetą.
Dažnai optimizavimo kriterijaus maksimizavimas pagal kokį nors matematinį modelį laikomas optimizavimo tikslu, tačiau iš tikrųjų tikslas yra optimizuoti valdymo objektą. Optimizavimo kriterijai ir matematiniai modeliai visada su tikslu susiję tik netiesiogiai, t.y. daugiau ar mažiau adekvačiai, bet visada apytiksliai.

Taigi optimalumo idėją, kuri yra itin vaisinga sistemoms, kurias galima tinkamai formalizuoti matematiškai, reikia atsargiai perkelti į sudėtingas sistemas. Žinoma, matematinius modelius, kuriuos kartais galima pasiūlyti tokioms sistemoms, galima optimizuoti. Tačiau visada reikia atsižvelgti į didelį šių modelių supaprastinimą, kurio sudėtingų sistemų atveju nebegalima pamiršti, taip pat į tai, kad šių modelių tinkamumo laipsnis sudėtingų sistemų atveju praktiškai nežinomas. . Todėl nežinoma, kokią grynai praktinę šio optimizavimo reikšmę turi. Didelis techninių sistemų optimizavimo praktiškumas neturėtų sukelti iliuzijų, kad optimizuojant sudėtingas sistemas jis bus toks pat efektyvus. Prasmingas matematinis sudėtingų sistemų modeliavimas yra labai sunkus, apytikslis ir netikslus. Kuo sudėtingesnė sistema, tuo atidžiau turėtumėte ją optimizuoti.

Todėl, kurdami sudėtingų, didelių, silpnai deterministinių sistemų valdymo metodus, autoriai svarbiausiu dalyku laiko ne tik pasirinkto požiūrio optimalumą formaliuoju matematiniu požiūriu, bet ir jo tinkamumą tikslui bei pačią sistemos prigimtį. valdymo objektas.

Ekspertų atrankos metodai

Tiriant sudėtingas sistemas dažnai iškyla problemų, kurių dėl įvairių priežasčių neįmanoma griežtai suformuluoti ir išspręsti naudojant šiuo metu sukurtą matematinį aparatą. Tokiais atvejais pasitelkiamos ekspertų (sistemų analitikų) paslaugos, kurių patirtis ir intuicija padeda sumažinti problemos sudėtingumą.

Tačiau reikia atsižvelgti į tai, kad patys ekspertai yra labai sudėtingos sistemos, o jų veikla taip pat priklauso nuo daugelio išorinių ir vidinių sąlygų. Todėl ekspertinių vertinimų organizavimo metoduose daug dėmesio skiriama palankių išorinių ir psichologinių sąlygų ekspertų darbui sudarymui.

Eksperto darbui įtakos turi šie veiksniai:

atsakomybė už tyrimo rezultatų panaudojimą;
žinojimas, kad dalyvauja ir kiti ekspertai;
informacijos kontakto tarp ekspertų prieinamumas;
ekspertų tarpusavio santykiai (jei tarp jų yra informacinis kontaktas);
asmeninis eksperto susidomėjimas vertinimo rezultatais;
asmeninės ekspertų savybės (pasipuikavimas, atitiktis, valia ir kt.)

Sąveika tarp ekspertų gali ir paskatinti, ir slopinti jų veiklą. Todėl skirtingais atvejais naudojami įvairūs tyrimo metodai, besiskiriantys ekspertų tarpusavio sąveikos pobūdžiu: anoniminės ir atviros apklausos bei anketos, susitikimai, diskusijos, dalykiniai žaidimai, minčių šturmas ir kt.

Yra įvairių ekspertų išvadų matematinio apdorojimo metodų. Ekspertų prašoma įvertinti įvairias alternatyvas naudojant vieną arba rodiklių sistemą. Be to, jų prašoma įvertinti kiekvieno rodiklio svarbą (jo „svorį“ ar „indėlį“). Patiems ekspertams taip pat priskiriamas kompetencijos lygis, atitinkantis kiekvieno iš jų indėlį formuojant grupės nuomonę.

Sukurta darbo su ekspertais metodika yra Delphi metodas. Pagrindinė šio metodo mintis yra ta, kad kritika ir argumentavimas turi teigiamą poveikį ekspertui, jei nepažeidžiamas jo pasididžiavimas ir sudaromos sąlygos, neleidžiančios asmeniniam susipriešimui.

Ypač reikia pabrėžti, kad iš esmės skiriasi ekspertinių metodų naudojimo ekspertinėse sistemose ir sprendimų palaikymo pobūdis. Jei pirmuoju atveju ekspertai privalo formalizuoti sprendimų priėmimo būdus, tai antruoju – tik patį sprendimą, kaip tokį.

Kadangi ekspertai dalyvauja įgyvendinant būtent tas funkcijas, kurių šiuo metu arba visiškai neteikia automatizuotos sistemos, arba jos atlieka prasčiau nei žmogus, perspektyvi automatizuotų sistemų kūrimo kryptis yra maksimalus šių funkcijų automatizavimas.

Automatizuotos sprendimų palaikymo sistemos

Priimdamas sprendimus žmogus visada naudodavosi asistentais: tai tiesiog informacijos apie valdymo objektą teikėjai ir konsultantai (patarėjai), siūlantys sprendimų variantus ir analizuojantys jų pasekmes. Žmogus, priimantis sprendimus, visada juos priimdavo tam tikroje informacinėje aplinkoje: kariniam vadovui – štabas, rektoriui – akademinė taryba, ministrui – kolegija.

Šiais laikais informacinė sprendimų priėmimo infrastruktūra neįsivaizduojama be automatizuotų interaktyvaus sprendimų vertinimo sistemų ir ypač sprendimų paramos sistemų (DDS – Decision Support Systems), t.y. automatizuotos sistemos, kurios yra specialiai sukurtos tam, kad paruoštų informaciją, reikalingą žmogui priimti sprendimą. Sprendimų paramos sistemų kūrimas visų pirma vykdomas pagal tarptautinį projektą, vykdomą pagal Tarptautinį taikomųjų sistemų analizės institutą Laxenburge (Austrija).

Norint priimti sprendimus realiose situacijose, reikia atlikti daugybę operacijų, kai kurias iš jų efektyviau atlieka žmonės, o kitas – mašinos. Veiksmingas jų pranašumų derinys kompensuojant trūkumus yra įkūnytas automatizuotose sprendimų palaikymo sistemose.

Žmogus sprendimus neapibrėžtumo sąlygomis priima geriau nei mašina, tačiau tam, kad priimtų teisingą sprendimą, jam reikia ir adekvačios (išsamios ir patikimos) dalykinę sritį apibūdinančios informacijos. Tačiau žinoma, kad žmonės blogai susidoroja su dideliais kiekiais „neapdorotos“ informacijos. Todėl mašinos vaidmuo palaikant sprendimus gali būti išankstinis informacijos apie valdymo objektą ir nekontroliuojamus veiksnius (aplinką) parengimas, padėti apžvelgti tam tikrų sprendimų priėmimo pasekmes, taip pat visą šią informaciją pateikti vaizdiniu pavidalu. ir patogus sprendimų priėmimo būdas.

Taigi automatizuotos sprendimų palaikymo sistemos kompensuoja žmogaus silpnąsias vietas, išlaisvindamos jį nuo įprastinio išankstinio informacijos apdorojimo ir suteikia jam patogią informacinę aplinką, kurioje jis gali geriau pademonstruoti savo stipriąsias puses. Šiomis sistemomis siekiama ne automatizuoti sprendimus priimančio asmens funkcijas (ir dėl to šias funkcijas atstumti nuo jo, taigi ir atsakomybę už priimtus sprendimus, o tai dažniausiai yra nepriimtina), o padėti jam rasti prekę. sprendimas.

Esamų modelio atpažinimo metodų apžvalga

L.P. Popova , I.O. Datijevas

Gebėjimas „atpažinti“ laikomas pagrindine žmogaus, kaip ir kitų gyvų organizmų, savybe. Modelių atpažinimas yra kibernetikos šaka, kurianti klasifikavimo principus ir metodus, taip pat objektų, reiškinių, procesų, signalų, situacijų identifikavimą – visus tuos objektus, kuriuos galima apibūdinti baigtiniu tam tikrų ženklų ar savybių rinkiniu, apibūdinančiu objektą. .

Vaizdas yra objekto aprašymas. Vaizdai turi būdingą savybę, kuri pasireiškia tuo, kad susipažinus su baigtiniu reiškinių skaičiumi iš tos pačios aibės galima atpažinti savavališkai didelį skaičių jos atstovų.

Modelių atpažinimo teorijoje galima išskirti dvi pagrindines kryptis:

žmonių ir kitų gyvų organizmų turimų atpažinimo gebėjimų tyrimas;

įtaisų, skirtų atskiroms modelio atpažinimo problemoms tam tikrose taikymo srityse spręsti, konstravimo teorijos ir metodų kūrimas.

Toliau straipsnyje aprašomos su antrosios krypties kūrimu susijusios vaizdų atpažinimo sistemų diegimo problemos, principai ir metodai. Antroje straipsnio dalyje aptariami neuroninių tinklų modelių atpažinimo metodai, kuriuos galima priskirti pirmajai modelio atpažinimo teorijos krypčiai.

Vaizdo atpažinimo sistemų kūrimo problemos

Statybos metu kylantys iššūkiai automatinės sistemos Modelio atpažinimą paprastai galima suskirstyti į kelias pagrindines sritis. Pirmasis iš jų yra susijęs su gautų pradinių duomenų pateikimu atpažįstamam objektui jautrumo problema. Kiekviena išmatuota reikšmė yra tam tikra vaizdo ar objekto charakteristika. Tarkime, kad vaizdai yra raidiniai ir skaitmeniniai naudojamas jutiklyje Jei tinklainė susideda iš n elementų, tai matavimo rezultatai gali būti pavaizduoti kaip matavimo vektorius arba vaizdo vektorius. ,

kur kiekvienas elementas xi įgauna, pavyzdžiui, reikšmę 1, jei simbolio vaizdas eina per i-ąją tinklainės ląstelę, o vertė 0 kitu atveju.

Pažiūrėkime į pav. 2(b). Šiuo atveju vaizdai yra nuolatinės kintamojo t funkcijos (pavyzdžiui, garso signalai). Jei funkcijos reikšmių matavimas atliekamas atskiruose taškuose t1,t2, ..., tn, tada vaizdo vektorių galima sudaryti imant x1= f(t1),x2=f(t2),... , xn = f(tn).

1 pav. Tinklainės matavimas

Antroji modelio atpažinimo problema yra susijusi su būdingų bruožų ar savybių išskyrimu iš gautų šaltinio duomenų ir šablonų vektorių dimensijos sumažinimu. Ši problema dažnai apibrėžiama kaip problema išankstinis apdorojimas ir funkcijų pasirinkimas.

Vaizdų klasės ypatybės yra būdingos savybės, bendros visiems tam tikros klasės vaizdams. Požymiai, apibūdinantys atskirų klasių skirtumus, gali būti interpretuojami kaip tarpklasiniai požymiai. Vidinės klasės ypatybės, bendros visoms nagrinėjamoms klasėms, neteikia naudingos informacijos atpažinimo požiūriu ir į jas gali būti neatsižvelgiama. Funkcijos pasirinkimas laikomas vienu iš svarbių užduočių, susijusių su atpažinimo sistemų konstravimu. Jei matavimo rezultatai leis mums gauti visą visų klasių skiriamųjų požymių rinkinį, tikrasis vaizdų atpažinimas ir klasifikavimas nesukels ypatingų sunkumų. Tada automatinis atpažinimas bus sumažintas iki paprasto suderinimo proceso arba procedūrų, tokių kaip lentelės nuskaitymas. Tačiau daugumoje praktinių atpažinimo problemų nustatyti visą skiriamųjų požymių rinkinį yra labai sunku, o gal net neįmanoma. Paprastai iš pirminių duomenų galima išskirti kai kurias išskirtines savybes ir jas panaudoti automatinio modelio atpažinimo procesui supaprastinti. Visų pirma, matavimo vektorių matmenis galima sumažinti naudojant transformacijas, kurios sumažina informacijos praradimą.

Trečioji problema, susijusi su modelių atpažinimo sistemų konstravimu, yra optimalių sprendimų procedūrų, reikalingų identifikavimui ir klasifikavimui, paieška. Po to, kai surinkti duomenys apie atpažįstamus vaizdus atvaizduojami taškais arba matavimo vektoriais vaizdų erdvėje, leidžiame mašinai išsiaiškinti, kurią vaizdų klasę šie duomenys atitinka. Tegul mašina yra skirta atskirti M klases, pažymėtas w1, w2, ... ..., wm. Šiuo atveju galima laikyti, kad vaizdo erdvę sudaro M regionai, kurių kiekviename yra taškai, atitinkantys vienos klasės vaizdus. Šiuo atveju atpažinimo užduotis gali būti laikoma sprendimų sričių, skiriančių M klases, ribų konstravimas pagal registruotus matavimo vektorius. Tegul šios ribos apibrėžiamos, pavyzdžiui, sprendimo funkcijomis d1(x), d2(x),..., dm(x). Šios funkcijos, dar vadinamos diskriminacinėmis funkcijomis, yra skaliarinės ir vienareikšmės x vaizdo funkcijos. Jei di (x) > dj (x), tai vaizdas x priklauso klasei w1. Kitaip tariant, jei i-tas lemiamas funkcija di(x) turi didžiausią reikšmę, tada prasminga tokios automatinės klasifikavimo schemos, paremtos sprendimų priėmimo proceso įgyvendinimu, iliustracija parodyta pav. 2 (schemoje „GR“ yra sprendimo funkcijų generatorius).

2 pav. Automatinė klasifikavimo schema.

Lemiamas funkcijas galima gauti keliais būdais. Tais atvejais, kai yra išsami a priori informacija apie atpažintus vaizdus, sprendimo funkcijas galima tiksliai nustatyti remiantis šia informacija. Jei yra tik kokybinė informacija apie vaizdus, galima daryti pagrįstas prielaidas apie lemiamų funkcijų formą. Pastaruoju atveju sprendimo sričių ribos gali labai nukrypti nuo tikrųjų, todėl būtina sukurti sistemą, galinčią pasiekti patenkinamą rezultatą, atliekant nuoseklius koregavimus.

Objektai (vaizdai), kuriuos reikia atpažinti ir klasifikuoti naudojant automatinio modelio atpažinimo sistemą, turi turėti išmatuojamų charakteristikų rinkinį. Kai visos vaizdų grupės atitinkamų matavimų rezultatai yra panašūs, šie objektai laikomi priklausančiais tai pačiai klasei. Modelių atpažinimo sistemos tikslas yra, remiantis surinkta informacija nustatyti objektų klasę, kurios charakteristikos panašios į tas, kurios matuojamos atpažįstamuose objektuose. Atpažinimo teisingumas priklauso nuo išmatuotose charakteristikose esančios diskriminacinės informacijos kiekio ir šios informacijos panaudojimo efektyvumo.

Pagrindiniai modelių atpažinimo sistemų diegimo metodai

Įvairūs autoriai (Ju.L. Barabašas, V.I. Vasiljevas, A.L. Gorelikas, V.A. Skripkinas, R. Duda, P. Hartas, L.T. Kuzinas, F.I. Peregudovas, F.P. Tarasenko, Temnikovas F.E., Afoninas V.A., Dmitrijevas V.I. Gonzalez, P. Winston, K. Fu, Ya.Zypkin ir kt.) pateikia kitokią modelių atpažinimo tipologiją. Vieni autoriai skiria parametrinius, neparametrinius ir euristinius metodus, kiti skiria metodų grupes remdamiesi istoriškai susiklosčiusiomis mokyklomis ir šios srities tendencijomis.

Tuo pačiu metu žinomose tipologijose neatsižvelgiama į vieną labai reikšmingą ypatybę, kuri atspindi žinių apie dalykinę sritį vaizdavimo būdo specifiškumą naudojant bet kokį formalų modelio atpažinimo algoritmą. D.A. Pospelovas išskiria du pagrindinius žinių pateikimo būdus:

Intensyvus vaizdavimas – atributų (ypatybių) sąsajų diagramos pavidalu.

Išplėstinis vaizdavimas – naudojant konkrečius faktus (objektus, pavyzdžius).

Pažymėtina, kad būtent šių dviejų atpažinimo metodų grupių – veikiančių ženklais ir veikiančių daiktais – egzistavimas yra labai natūralus. Šiuo požiūriu nė vienas iš šių metodų, paimtas atskirai nuo kito, neleidžia susidaryti tinkamo dalykinės srities atspindžio. Tarp šių metodų yra papildomumo ryšys N. Bohro prasme, todėl perspektyvios atpažinimo sistemos turėtų užtikrinti abiejų šių metodų, o ne vieno iš jų įgyvendinimą.

Taigi, D. A. Pospelovo pasiūlyta atpažinimo metodų klasifikacija remiasi pagrindiniais modeliais, kuriais grindžiamas žmogaus pažinimo būdas apskritai, todėl jis yra visiškai ypatingas (privilegijuotas), palyginti su kitomis klasifikacijomis, kurios šiame fone atrodo lengvesnės ir lengvesnės. dirbtinis.

Intensyvūs metodai

Išskirtinis intencionalinių metodų bruožas yra tai, kad konstruojant ir taikant modelio atpažinimo algoritmus jie naudoja įvairias požymių charakteristikas ir jų ryšius kaip operacijų elementus. Tokie elementai gali būti atskiros reikšmės arba ypatybių reikšmių intervalai, vidutinės reikšmės ir dispersijos, savybių ryšio matricos ir kt., su kuriomis atliekami veiksmai, išreikšti analitine ar konstruktyvia forma. Tuo pačiu metu objektai šiuose metoduose nėra laikomi vientisais informacijos vienetais, o veikia kaip rodikliai vertinant jų atributų sąveiką ir elgesį.

Intensyviųjų modelių atpažinimo metodų grupė yra plati, o jos skirstymas į poklasius tam tikru mastu yra sąlyginis:

– metodai, pagrįsti požymių reikšmių pasiskirstymo tankių įverčiais

– metodai, pagrįsti prielaidomis apie sprendimo funkcijų klasę

– loginiai metodai

– kalbiniai (struktūriniai) metodai.

Metodai, pagrįsti bruožų reikšmių pasiskirstymo tankių įverčiais.Šie modelių atpažinimo metodai yra pasiskolinti iš klasikinės statistinių sprendimų teorijos, kurioje tiriamieji objektai laikomi daugiamačio atsitiktinio dydžio, pasiskirstyto požymių erdvėje pagal tam tikrą dėsnį, realizacijomis. Jie pagrįsti Bajeso sprendimų priėmimo schema, kuri apeliuoja į a priori objektų, priklausančių tam tikrai pripažintai klasei, tikimybę ir sąlyginį ypatybių vektoriaus reikšmių pasiskirstymo tankį. Šie metodai apsiriboja tikimybės santykio nustatymu įvairiose daugiamatės objektų erdvės srityse.

Metodų grupė, pagrįsta požymių reikšmių pasiskirstymo tankių įvertinimu, yra tiesiogiai susijusi su diskriminacinės analizės metodais. Bajeso požiūris į sprendimų priėmimą yra vienas iš labiausiai išplėtotų vadinamųjų parametrinių metodų šiuolaikinėje statistikoje, kuriam pasiskirstymo dėsnio (šiuo atveju normalaus dėsnio) analitinė išraiška laikoma žinoma ir tik nedidelis parametrų skaičius ( reikia įvertinti vidutinių verčių vektorius ir kovariacijos matricas).

Šiai grupei taip pat priklauso nepriklausomų charakteristikų tikimybės santykio apskaičiavimo metodas. Šis metodas, išskyrus ženklų nepriklausomumo prielaidą (kuris iš tikrųjų beveik niekada nepasitenkina), neprisiima žinių funkcinis tipas paskirstymo įstatymas. Jis gali būti klasifikuojamas kaip neparametrinis metodas.

Kiti neparametriniai metodai, naudojami, kai pasiskirstymo tankio kreivės forma nežinoma ir iš viso negalima daryti prielaidų apie jos pobūdį, užima ypatingą vietą. Tai apima gerai žinomą daugiamačių histogramų metodą „ k-artimiausi kaimynai, Euklido atstumo metodas, potencialių funkcijų metodas ir kt., kurio apibendrinimas yra metodas, vadinamas „Parzeno įverčiais“. Šie metodai formaliai veikia su objektais kaip vientisomis struktūromis, tačiau priklausomai nuo atpažinimo užduoties tipo, jie gali veikti tiek įtemptomis, tiek išplėstinėmis formomis.

Neparametriniai metodai analizuoja santykinį objektų, patenkančių į duotus daugiamačius tūrius, skaičių ir naudojimą įvairių funkcijų atstumai tarp mokomojo pavyzdžio objektų ir atpažintų objektų. Kiekybinėms charakteristikoms, kai jų skaičius yra daug mažesnis už imties dydį, operacijos su objektais atlieka tarpinį vaidmenį įvertinant vietinio pasiskirstymo tankį. sąlyginės tikimybės o objektai nekelia nepriklausomų informacijos vienetų semantinės apkrovos. Tuo pačiu metu, kai požymių skaičius yra proporcingas arba didesnis nei tiriamų objektų skaičius, o požymiai yra kokybinio arba dichotominio pobūdžio, tada apie jokius lokalius tikimybių pasiskirstymo tankių įverčius negali būti nė kalbos. Šiuo atveju objektai nurodytuose neparametriniuose metoduose laikomi nepriklausomais informacijos vienetais (integralu empiriniai faktai) ir šie metodai įgyja tiriamų objektų panašumų ir skirtumų vertinimo prasmę.

Taigi, tos pačios neparametrinių metodų technologinės operacijos, priklausomai nuo problemos sąlygų, įprasmina arba lokalius požymių reikšmių tikimybių pasiskirstymo tankių įverčius, arba objektų panašumo ir skirtumo įverčius.

Intensyvaus žinių vaizdavimo kontekste čia nagrinėjama pirmoji neparametrinių metodų pusė, kaip tikimybių pasiskirstymo tankių įverčiai. Daugelis autorių pažymi, kad praktikoje neparametriniai metodai, tokie kaip Parzen įvertinimai, veikia gerai. Pagrindiniai sunkumai naudojant šiuos metodus yra būtinybė prisiminti visą mokymo imtį, kad būtų galima apskaičiuoti vietinio tikimybių pasiskirstymo tankio įverčius ir didelį jautrumą mokymo imties nereprezentatyvumui.

Metodai, pagrįsti prielaidomis apie sprendimo funkcijų klasę.Šioje metodų grupėje bendra sprendimo funkcijos forma laikoma žinoma ir nurodoma jos kokybės funkcionalumas. Remiantis šia funkcija, mokymo sekoje ieškoma geriausio sprendimo funkcijos aproksimacijos. Labiausiai paplitę yra sprendimų funkcijų atvaizdavimas tiesinių ir apibendrintų netiesinių daugianarių pavidalu. Sprendimo taisyklės kokybės funkcija paprastai siejama su klasifikavimo klaida.

Pagrindinis metodų, pagrįstų prielaidomis apie sprendimo funkcijų klasę, privalumas yra atpažinimo problemos, kaip ekstremumo paieškos problemos, matematinės formuluotės aiškumas. Šios problemos sprendimas dažnai pasiekiamas naudojant kai kuriuos gradiento algoritmus. Šios grupės metodų įvairovė paaiškinama plačiu sprendimų taisyklių kokybės funkcinių ir naudojamų ekstremalių paieškos algoritmų spektru. Nagrinėjamų algoritmų, kurie visų pirma apima Niutono algoritmą, perceptrono tipo algoritmus ir kt., apibendrinimas yra stochastinės aproksimacijos metodas. Skirtingai nuo parametrinių atpažinimo metodų, šios metodų grupės naudojimo sėkmė ne tiek priklauso nuo teorinių idėjų apie objektų pasiskirstymo požymių erdvėje dėsnius ir empirinės tikrovės neatitikimo. Visos operacijos yra subordinuotos vienam pagrindiniam tikslui – sprendimo taisyklės kokybės funkcinės ekstremumo suradimui. Tuo pačiu metu parametrinio ir svarstomo metodo rezultatai gali būti panašūs. Kaip parodyta aukščiau, parametriniai metodai, skirti normaliam objektų pasiskirstymui skirtingose klasėse su vienodomis kovariacijos matricomis, lemia tiesines sprendimo funkcijas. Taip pat atkreipkite dėmesį, kad linijinių diagnostinių modelių informacinių ypatybių atrankos algoritmai gali būti interpretuojami kaip specialios gradiento algoritmų versijos, skirtos ekstremumų paieškai.

Gradiento ekstremumo paieškos algoritmų galimybės, ypač linijinių sprendimų taisyklių grupėje, buvo gana gerai ištirtos. Šių algoritmų konvergencija įrodyta tik tuo atveju, kai atpažintų objektų klasės objektų erdvėje atvaizduojamos kompaktiškomis geometrinėmis struktūromis. Tačiau norą pasiekti pakankamą sprendimo taisyklės kokybę dažnai galima patenkinti pasitelkus algoritmus, kurie neturi griežto matematinio sprendimo konvergencijos į globalų ekstremumą įrodymo.

Tokie algoritmai apima didelę euristinio programavimo procedūrų grupę, kuri atspindi evoliucinio modeliavimo kryptį. Evoliucinis modeliavimas yra bioninis metodas, pasiskolintas iš gamtos. Jis pagrįstas žinomų evoliucijos mechanizmų naudojimu, siekiant pakeisti sudėtingo objekto prasmingo modeliavimo procesą fenomenologiniu jo evoliucijos modeliavimu.

Gerai žinomas modelių atpažinimo evoliucinio modeliavimo atstovas yra argumentų grupinės apskaitos (MGUA) metodas. GMDH pagrindas yra saviorganizacijos principas, o GMDH algoritmai atkuria masės atrankos schemą. GMDH algoritmuose apibendrinto polinomo nariai sintezuojami ir parenkami ypatingu būdu, kuris dažnai vadinamas Kolmogorovo-Gaboro polinomu. Ši sintezė ir atranka atliekama vis sudėtingiau, todėl iš anksto neįmanoma numatyti, kokią galutinę formą turės apibendrintas daugianario. Pirmiausia paprastai nagrinėjamos paprastos porinės pradinių požymių kombinacijos, iš kurių sudaromos sprendimo funkcijų lygtys, dažniausiai ne aukštesnės kaip antros eilės. Kiekviena lygtis analizuojama kaip nepriklausoma sprendimo funkcija, o sudarytų lygčių parametrų reikšmės vienaip ar kitaip randamos naudojant mokymo pavyzdį. Tada iš gauto sprendimo funkcijų rinkinio atrenkamos geriausios. Atskirų sprendimų funkcijų kokybė tikrinama kontroliniu (validavimo) pavyzdžiu, kuris kartais vadinamas išorinio papildymo principu. Pasirinktos dalinio sprendimo funkcijos toliau laikomos tarpiniais kintamaisiais, kurie tarnauja kaip pradiniai argumentai panašiai naujų sprendimų funkcijų sintezei ir pan. Tokios hierarchinės sintezės procesas tęsiasi tol, kol pasiekiamas sprendimo funkcijos kokybės kriterijaus ekstremumas, kuris praktikoje pasireiškia šios kokybės pablogėjimu, kai bandoma toliau didinti daugianario terminų tvarką, palyginti su pradiniais požymiais.

Savitvarkos principas, kuriuo grindžiamas GMDH, vadinamas euristine saviorganizacija, nes visas procesas yra pagrįstas išorinių papildymų, parinktų euristiškai, įvedimu. Sprendimo rezultatas gali labai priklausyti nuo šios euristikos. Gautas diagnostinis modelis priklauso nuo to, kaip objektai skirstomi į mokomuosius ir testavimo pavyzdžius, kaip nustatomas atpažinimo kokybės kriterijus, kiek kintamųjų perduodama į kitą atrankos eilutę ir kt.

Nurodytos GMDH algoritmų savybės būdingos ir kitiems evoliucinio modeliavimo požiūriams. Tačiau atkreipkime dėmesį į dar vieną nagrinėjamų metodų aspektą. Tai yra jų prasminga esmė. Naudojant metodus, pagrįstus prielaidomis apie sprendimų funkcijų klasę (evoliucinę ir gradientinę), galima sukurti didelio sudėtingumo diagnostinius modelius ir gauti praktiškai priimtinus rezultatus. Tuo pačiu metu praktinių tikslų pasiekimas šiuo atveju nėra lydimas naujų žinių apie atpažintų objektų prigimtį gavimo. Galimybę išgauti šias žinias, ypač žinias apie atributų (požymių) sąveikos mechanizmus, čia iš esmės riboja pateikta tokios sąveikos struktūra, fiksuota pasirinktoje sprendimo funkcijų formoje. Todėl daugiausia, ką galima pasakyti sukūrus konkretų diagnostinį modelį, yra išvardinti savybių derinius ir pačias savybes, įtrauktas į gautą modelį. Tačiau derinių, atspindinčių tiriamų objektų pasiskirstymo pobūdį ir struktūrą, reikšmė šio požiūrio rėmuose dažnai lieka neatskleista.

Būlio metodai. Loginiai modelio atpažinimo metodai yra pagrįsti loginės algebros aparatu ir leidžia operuoti su informacija, esančia ne tik atskiruose požymiuose, bet ir ypatybių reikšmių deriniuose. Taikant šiuos metodus, bet kurio atributo reikšmės laikomos elementariais įvykiais.

Bendriausia forma loginius metodus galima apibūdinti kaip paieškos tipą per mokomąjį loginių šablonų pavyzdį ir tam tikros loginių sprendimų taisyklių sistemos formavimą (pavyzdžiui, elementarių įvykių jungčių pavidalu), kiekvienas iš kuris turi savo svorį. Loginių metodų grupė yra įvairi ir apima įvairaus sudėtingumo ir analizės gilumo metodus. Dėl dichotominių (Bulio) ypatybių populiarūs vadinamieji medžių klasifikatoriai, aklavietės bandymo metodas, algoritmas „Žievė“ ir kt. Sudėtingesni metodai yra pagrįsti formalizavimu indukciniai metodai D.S.Mill. Formalizavimas atliekamas sukūrus kvaziaksiomatinę teoriją ir yra pagrįstas daugiarūše daugiareikšme logika su kvantoriais per kintamo ilgio eilutes.

Algoritmas „Kora“, kaip ir kiti loginiai modelio atpažinimo metodai, yra gana daug darbo jėgos, nes pasirenkant jungtis reikia atlikti visišką paiešką. Todėl naudojant loginius metodus keliami aukšti reikalavimai efektyviam skaičiavimo proceso organizavimui, o šie metodai puikiai veikia esant santykinai nedideliems funkcijų erdvės matmenims ir tik galinguose kompiuteriuose.

Kalbiniai (sintaksiniai arba struktūriniai) metodai. Lingvistiniai modelių atpažinimo metodai yra pagrįsti specialių gramatikų, generuojančių kalbas, naudojimu, kurių pagalba galima apibūdinti atpažįstamų objektų savybių rinkinį. Gramatika reiškia objektų konstravimo iš šių neišvestinių elementų taisykles.

Jei vaizdų aprašymas atliekamas naudojant neišvestinius elementus (subvaizdus) ir jų ryšius, tai automatinio atpažinimo sistemoms kurti naudojamas kalbinis arba sintaksinis požiūris, naudojant savybių bendrumo principą. Vaizdą galima apibūdinti naudojant hierarchinę povaizdų struktūrą, panašią į kalbos sintaksinę struktūrą. Ši aplinkybė leidžia taikyti formaliųjų kalbų teoriją sprendžiant vaizdo atpažinimo problemas. Manoma, kad vaizdų gramatikoje yra baigtinių elementų rinkinių, vadinamų kintamaisiais, neišvestiniais elementais ir pakeitimo taisyklėmis. Pakeitimo taisyklių pobūdis lemia gramatikos tipą. Tarp labiausiai ištirtų gramatikų galime išskirti taisyklingas, bekontekstines ir tiesioginių komponentų gramatikas. Pagrindiniai punktaiŠio požiūrio yra nedarinių vaizdo elementų parinkimas, šių elementų ir ryšių, jungiančių juos į vaizdų gramatikas, derinimas ir galiausiai analizės bei atpažinimo procesų įgyvendinimas atitinkama kalba. Šis metodas yra ypač naudingas dirbant su vaizdais, kurių neįmanoma apibūdinti skaitiniais matavimais arba kurie yra tokie sudėtingi, kad negalima nustatyti jų vietinių ypatybių ir reikia kreiptis į pasaulines objektų savybes.

Pavyzdžiui, E.A. Butakovas, V.I. Ostrovskis, I.L. Fadejevas siūlo tokią vaizdo apdorojimo sistemos struktūrą (3 pav.), naudojant kalbinis požiūris, kur kiekvienas iš funkcinių blokų yra programinės įrangos (mikroprogramų) kompleksas (modulis), kuris įgyvendina atitinkamas funkcijas.

3 pav. Atpažinimo įrenginio blokinė schema

Bandymai taikyti matematinės lingvistikos metodus vaizdų analizės problemai lemia būtinybę išspręsti daugybę problemų, susijusių su dvimatės vaizdo struktūros atvaizdavimu į vienmates formalios kalbos grandines.

Išplėtimo metodai

Šios grupės metodais, priešingai nei intensyvios krypties, kiekvienam tiriamam objektui didesniu ar mažesniu mastu suteikiama nepriklausoma diagnostinė reikšmė. Iš esmės šie metodai yra artimi klinikiniam požiūriui, kai žmonės vertinami ne kaip objektų, surūšiuotų pagal vieną ar kitą rodiklį, grandine, o kaip vientisomis sistemomis, kurių kiekviena yra individuali ir turi ypatingą diagnostinę vertę. Toks kruopštus požiūris į tiriamus objektus neleidžia atmesti ar prarasti informacijos apie kiekvieną atskirą objektą, o tai atsitinka naudojant intensyvios krypties metodus, kurie naudoja objektus tik jų atributų elgesio modeliams aptikti ir fiksuoti.

Pagrindinės modelių atpažinimo operacijos taikant aptartus metodus yra objektų panašumų ir skirtumų nustatymo operacijos. Objektai, esantys nurodytoje metodų grupėje, atlieka diagnostikos precedentų vaidmenį. Be to, priklausomai nuo konkrečios užduoties sąlygų, individualaus precedento vaidmuo gali skirtis plačiausiose ribose: nuo pagrindinio ir lemiančio iki labai netiesioginio dalyvavimo pripažinimo procese. Savo ruožtu, problemos sąlygos gali reikalauti, kad sėkmingam sprendimui būtų įtrauktas skirtingas diagnostinių precedentų skaičius: nuo vieno kiekvienoje pripažintoje klasėje iki visos imties dydžio, taip pat skirtingų objektų panašumo ir skirtumo matavimo metodų. . Šie reikalavimai paaiškina tolesnį išplėstinių metodų skirstymą į poklasius:

palyginimo su prototipu metodas;

k-artimiausių kaimynų metodas;

sprendimų taisyklių kolektyvai.

Palyginimo su prototipu metodas. Tai paprasčiausias išplėstinio atpažinimo būdas. Jis naudojamas, pavyzdžiui, kai atpažintos klasės objektų erdvėje rodomos kompaktiškomis geometrinėmis grupėmis. Šiuo atveju paprastai prototipo tašku pasirenkamas klasės geometrinės grupavimo centras (arba arčiausiai centro esantis objektas).

Į šį faktą reikėtų ypač atkreipti dėmesį. Tai aiškiai parodo ryšį tarp prototipo ir informacijos apie duomenų struktūrą atributo vaizdavimo. Pavyzdžiui, naudojant aukščiau pateiktą vaizdą, bet kurią tradicinę matavimo skalę, kuri yra tiesinė dichotominių charakteristikų reikšmių funkcija, galima laikyti hipotetiniu diagnostikos prototipu. Savo ruožtu, jei atpažintų klasių erdvinės struktūros analizė leidžia padaryti išvadą apie jų geometrinį kompaktiškumą, tada pakanka kiekvieną iš šių klasių pakeisti vienu prototipu, kuris iš tikrųjų prilygsta tiesiniam diagnostikos modeliui.

Praktikoje, žinoma, situacija dažnai skiriasi nuo aprašyto idealizuoto pavyzdžio. Tyrėjas, ketinantis taikyti atpažinimo metodą, pagrįstą palyginimu su prototipų diagnostikos klasėmis, susiduria su sudėtingomis problemomis. Tai, visų pirma, artumo matavimo (metrikos) pasirinkimas, galintis gerokai pakeisti objektų pasiskirstymo erdvinę konfigūraciją. Ir, antra, savarankiška problema yra daugiamačių eksperimentinių duomenų struktūrų analizė. Abi šios problemos ypač aktualios tyrėjui esant didelėms ypatybių erdvės matmenims, būdingoms tikroms problemoms.

k-artimiausių kaimynų metodas. K-arčiausių kaimynų metodas diskriminacinės analizės problemoms spręsti pirmą kartą buvo pasiūlytas dar 1952 m. Tai yra taip.

Klasifikuojant nežinomą objektą, kitų objektų (artimiausių kaimynų), turinčių jau žinomą priklausymą pripažintoms klasėms, požymių erdvėje randamas tam tikras skaičius (k) geometriškai artimiausio jam. Sprendimas priskirti nežinomą objektą tam tikrai diagnostikos klasei priimamas analizuojant informaciją apie šį žinomą artimiausių kaimynų priklausomybę, pavyzdžiui, naudojant paprastą balsų skaičiavimą.

Kaip minėta pirmiau, tikrosiose problemose dažnai reikia operuoti su aprašytais objektais didelis skaičius kokybinės (dichotominės) savybės. Šiuo atveju objekto erdvės matmuo yra proporcingas arba viršija tiriamos imties tūrį. Tokiomis sąlygomis patogu kiekvieną mokomosios imties objektą interpretuoti kaip atskirą tiesinį klasifikatorių. Tada tą ar kitą diagnostinę klasę vaizduoja ne vienas prototipas, o linijinių klasifikatorių rinkinys. Kombinuota linijinių klasifikatorių sąveika galiausiai lemia atskirą linijinį paviršių, atskiriantį pripažintas klases objektų erdvėje. Skiriamojo paviršiaus, susidedančio iš hiperplokštumų dalių, tipas gali būti įvairus ir priklauso nuo klasifikuojamų agregatų santykinės padėties.

Taip pat galima naudoti kitą klasifikavimo mechanizmų interpretaciją, naudojant k-arčiausių kaimynų taisyklę. Jis pagrįstas kai kurių latentinių kintamųjų, abstrakčių arba tam tikra transformacija susijusių su pradine ypatybių erdve, egzistavimo idėja. Jei latentinių kintamųjų erdvėje poriniai atstumai tarp objektų yra tokie pat kaip ir pirminių požymių erdvėje, o šių kintamųjų skaičius yra reikšmingas mažesnis skaičius objektus, tuomet k-arčiausių kaimynų metodo interpretacija gali būti nagrinėjama sąlyginių tikimybių pasiskirstymo tankių neparametrinių įverčių palyginimo požiūriu. Čia pateiktas latentinių kintamųjų vaizdas yra artimas tikrojo matmens vaizdui ir kitiems vaizdams, naudojamiems įvairiuose matmenų mažinimo metoduose.

Naudodamas k-arčiausių kaimynų metodą modelio atpažinimui, tyrėjas turi išspręsti sudėtingą metrikos parinkimo diagnozuotų objektų artumui nustatyti problemą. Ši problema esant dideliam objektų erdvės matmeniui labai apsunkina dėl šio metodo pakankamo sudėtingumo, kuris tampa reikšmingas net ir didelio našumo kompiuteriams. Todėl čia, kaip ir palyginimo su prototipu metodu, būtina išspręsti kūrybinę eksperimentinių duomenų daugiamatės struktūros analizės problemą, kad būtų sumažintas diagnostines klases reprezentuojančių objektų skaičius.

Reitingų skaičiavimo (balsavimo) algoritmai. Vertinimo skaičiavimo algoritmų (ABO) veikimo principas yra skaičiuoti prioritetą (panašumo balus), apibūdinančius atpažintų ir atskaitos objektų „artimumą“ pagal savybių ansamblių sistemą, kuri yra tam tikros požymių rinkinio poaibių sistema. .

Sprendimų taisyklių kolektyvai. Sprendimo taisyklėje naudojama dviejų lygių atpažinimo schema. Pirmajame lygyje veikia privatūs atpažinimo algoritmai, kurių rezultatai sujungiami antrame lygyje sintezės bloke. Dažniausiai pasitaikantys tokio unifikavimo metodai yra pagrįsti konkretaus algoritmo kompetencijos sričių nustatymu. Paprasčiausias būdas rasti kompetencijos sritis yra a priori padalinti atributų erdvę remiantis profesiniais konkretaus mokslo sumetimais (pavyzdžiui, suskirstyti imtį pagal tam tikrą požymį). Tada kiekvienai pasirinktai sričiai sukuriamas atskiras atpažinimo algoritmas. Kitas metodas yra pagrįstas formalios analizės naudojimu, siekiant nustatyti vietines objektų erdvės sritis kaip atpažintų objektų apylinkes, kurioms buvo įrodyta bet kurio konkretaus atpažinimo algoritmo sėkmė.

Bendriausias požiūris į sintezės bloko konstravimą laikomi tam tikrų algoritmų rodikliais kaip pradinėmis charakteristikomis kuriant naują apibendrintą sprendimo taisyklę. Šiuo atveju galima naudoti visus aukščiau išvardintus įtempimo ir išplėtimo krypčių modelio atpažinimo metodus. Veiksmingi sprendimo taisyklių rinkinio sukūrimo problemai išspręsti yra „Kora“ tipo loginiai algoritmai ir įverčių skaičiavimo (ABO) algoritmai, kurie sudaro vadinamojo algebrinio metodo, kuriame pateikiamas tyrimas ir konstruktyvus aprašymas. atpažinimo algoritmai, kurių rėmuose telpa visi esami algoritmų tipai.

Neuroninių tinklų metodai

Neuroninio tinklo metodai yra metodai, pagrįsti programa įvairių tipų neuroniniai tinklai (NN). Pagrindinės įvairių neuroninių tinklų taikymo sritys modeliams ir vaizdams atpažinti:

programa, skirta išgauti pagrindines pateiktų vaizdų charakteristikas ar ypatybes,

pačių vaizdų arba jau iš jų išskirtų charakteristikų klasifikavimas (pirmuoju atveju pagrindinės charakteristikos išgaunamos netiesiogiai tinkle),

optimizavimo problemų sprendimas.

Daugiasluoksniai neuroniniai tinklai. Daugiasluoksnio neuroninio tinklo (MNN) architektūra susideda iš nuosekliai sujungtų sluoksnių, kur kiekvieno sluoksnio neuronas su savo įėjimais yra prijungtas prie visų ankstesnio sluoksnio neuronų, o kito sluoksnio išėjimais.

Paprasčiausias vieno sluoksnio neuroninio tinklo (vadinamo auto-asociacine atmintimi) taikymas yra išmokyti tinklą atkurti tiekiamus vaizdus. Pateikdami bandomąjį vaizdą kaip įvestį ir apskaičiuodami atkurto vaizdo kokybę, galite įvertinti, kaip tinklas atpažino įvesties vaizdą. Teigiamos savybėsŠis metodas yra toks, kad tinklas gali atkurti iškraipytus ir triukšmingus vaizdus, tačiau jis netinka rimtesniems tikslams.

MNN taip pat naudojamas tiesioginiam vaizdų klasifikavimui - arba pats vaizdas tam tikra forma, arba anksčiau ištrauktų pagrindinių vaizdo charakteristikų rinkinys, pateikiamas kaip įvestis, o neuronas, kurio aktyvumas yra didžiausias, rodo priklausymą atpažintai klasei (1 pav.). 4). Jei ši veikla yra žemiau tam tikros ribos, laikoma, kad pateiktas vaizdas nepriklauso nė vienai iš žinomų klasių. Mokymosi procesas nustato įvestyje pateiktų vaizdų atitikimą priklausymui tam tikrai klasei. Tai vadinama prižiūrimu mokymusi. Šis metodas tinka mažos žmonių grupės prieigos kontrolės užduotims. Šis metodas užtikrina, kad tinklas tiesiogiai lygina pačius vaizdus, tačiau didėjant klasių skaičiui, tinklo mokymo ir veikimo laikas didėja eksponentiškai. Todėl tokioms užduotims kaip paieška panašus asmuo didelėje duomenų bazėje, reikia išgauti kompaktišką pagrindinių charakteristikų rinkinį, pagal kurį galima ieškoti.

Klasifikavimo metodas, naudojant viso vaizdo dažnines charakteristikas, aprašytas. Buvo naudojamas vieno sluoksnio neuronų tinklas, pagrįstas daugiareikšmiais neuronais.

Neuroninio tinklo taikymas vaizdų klasifikavimui parodomas, kai tinklo įvestis gauna vaizdo skaidymo, naudojant pagrindinio komponento metodą, rezultatus.

Klasikiniame MNN tarpsluoksnių neuronų jungtys yra visiškai sujungtos, o vaizdas vaizduojamas kaip vienmatis vektorius, nors jis yra dvimatis. Konvoliucinio neuroninio tinklo architektūra siekiama pašalinti šiuos trūkumus. Jis naudojo vietinius receptorių laukus (užtikrina vietinį dvimatį neuronų ryšį), bendrinamus svorius (suteikia tam tikrų ypatybių aptikimą bet kurioje vaizdo vietoje) ir hierarchinę organizaciją su erdvinio atranka. Konvoliucinis neuroninis tinklas (CNN) suteikia dalinį atsparumą mastelio pokyčiams, poslinkiams, sukimams ir iškraipymams.

MNN taip pat naudojami tam tikro tipo objektams aptikti. Be to, kad bet kuris apmokytas MNN tam tikru mastu gali nustatyti, ar vaizdai priklauso „jų“ klasėms, jis gali būti specialiai išmokytas patikimai aptikti tam tikras klases. Šiuo atveju išvesties klasės bus klasės, kurios priklauso ir nepriklauso nurodytam vaizdo tipui. Neuroninio tinklo detektorius buvo naudojamas veido atvaizdui aptikti įvesties vaizde. Vaizdas buvo nuskaitytas 20x20 pikselių langu, kuris buvo tiekiamas į tinklo įvestį, kuris nusprendžia, ar tam tikra sritis priklauso veidų klasei. Mokymai buvo vykdomi naudojant teigiamus pavyzdžius ( įvairių vaizdų veidai) ir neigiamas (vaizdai, kurie nėra veidai). Aptikimo patikimumui padidinti buvo panaudota neuroninių tinklų komanda, apmokyta su skirtingais pradiniais svoriais, dėl ko neuroniniai tinklai skirtingai darė klaidas ir galutinis sprendimas buvo priimtas visos komandos balsavimu.

5 pav. Pagrindiniai komponentai (savieji veidai) ir vaizdo skaidymas į pagrindinius komponentus

Neuroninis tinklas taip pat naudojamas pagrindinėms vaizdo charakteristikoms išgauti, kurios vėliau naudojamos klasifikuojant. Pateiktas pagrindinių komponentų analizės metodo neuroninio tinklo įgyvendinimo metodas. Pagrindinio komponento analizės metodo esmė – gauti maksimaliai dekoruotus įvesties vaizdus apibūdinančius koeficientus. Šie koeficientai vadinami pagrindiniais komponentais ir naudojami statistiniam vaizdo glaudinimui, kai nedidelis koeficientų skaičius naudojamas visam vaizdui pavaizduoti. Neuroninis tinklas su vienu paslėptu sluoksniu, kuriame yra N neuronų (kuris yra daug mažesnis už vaizdo matmenį), išmokytas naudojant atgalinio sklidimo metodą atkurti išvesties vaizdą, pateiktą kaip įvestis, generuoja pirmųjų N pagrindinių komponentų koeficientus paslėptų neuronų išvestyje. , kurie naudojami palyginimui. Paprastai naudojama nuo 10 iki 200 pagrindinių komponentų. Didėjant komponento skaičiui, jo reprezentatyvumas labai sumažėja, todėl nėra prasmės naudoti komponentus su didesniais skaičiais. Naudojant netiesines nervinių elementų aktyvinimo funkcijas, galimas netiesinis skaidymas į pagrindinius komponentus. Netiesiškumas leidžia tiksliau atspindėti įvesties duomenų pokyčius. Pritaikius pagrindinių komponentų analizę veido vaizdų skaidymui, gauname pagrindinius komponentus, vadinamus savaisiais veidais, kurie turi ir naudingą savybę – yra komponentai, kurie daugiausia atspindi tokias esmines veido savybes kaip lytis, rasė, emocijos. Restauruoti komponentai atrodo kaip veidas, o pirmieji atspindi labiausiai bendra forma veidai, pastarieji – įvairūs nedideli skirtumai tarp veidų (5 pav.). Šis metodas puikiai tinka ieškant panašių veidų vaizdų didelėse duomenų bazėse. Taip pat parodyta galimybė toliau sumažinti pagrindinių komponentų matmenis naudojant NN. Įvertinę įvesties vaizdo rekonstrukcijos kokybę, galite labai tiksliai nustatyti jo priklausomybę veidų klasei.

Aukštos eilės neuroniniai tinklai. Aukštos eilės neuroniniai tinklai (HANN) skiriasi nuo MNN tuo, kad jie turi tik vieną sluoksnį, tačiau neuronų įvestis taip pat gauna aukšto laipsnio terminus, kurie yra dviejų ar daugiau įvesties vektoriaus komponentų sandauga. Tokie tinklai taip pat gali sudaryti sudėtingus skiriamuosius paviršius.

Hopfieldo neuroniniai tinklai. Hopfield NN (HNS) yra vieno sluoksnio ir pilnai sujungtas (tarp jų pačių neuronų nėra jungčių), jo išėjimai prijungti prie įėjimų. Skirtingai nei MNS, NSC yra atsipalaidavimas – t.y. nustatytas į pradinę būseną, jis veikia tol, kol pasiekia stabilią būseną, kuri bus jo išvesties vertė. Norint ieškoti visuotinio minimumo, susijusio su optimizavimo problemomis, naudojamos stochastinės NSC modifikacijos.

NSH naudojimas kaip asociatyvioji atmintis leidžia tiksliai atkurti vaizdus, kuriems tinklas yra apmokytas, kai į įvestį įvedamas iškraipytas vaizdas. Tokiu atveju tinklas „prisimins“ artimiausią (tam tikra prasme vietinis minimumas energijos) įvaizdį ir taip jį atpažįsta. Toks veikimas taip pat gali būti vaizduojamas kaip aukščiau aprašytas nuoseklus automatinio susiejimo atminties taikymas. Skirtingai nuo automatinio susiejimo atminties, NSC idealiai tiksliai atkurs vaizdą. Siekiant išvengti trikdžių minimumų ir padidinti tinklo pajėgumą, naudojami įvairūs metodai.

Savaime besitvarkantys Kohonen neuroniniai tinklai. Savaime organizuojantys Kohonen neuroniniai tinklai (KONN) suteikia topologinę įvesties vaizdo erdvės tvarką. Jie leidžia topologiškai nenutrūkstamai rodyti įvestį n matmenų erdvė iki išvesties m-matmenų, m<

Cognitron. Cognitron architektūra yra panaši į regėjimo žievės struktūrą, ji turi hierarchinę daugiasluoksnę organizaciją, kurioje neuronai tarp sluoksnių yra sujungti tik lokaliai. Mokėsi konkursinio mokymosi būdu (be mokytojo). Kiekvienas smegenų sluoksnis įgyvendina skirtingus apibendrinimo lygius; įvesties sluoksnis yra jautrus paprastiems raštams, pavyzdžiui, linijoms, ir jų orientacijai tam tikrose regėjimo srities srityse, o kitų sluoksnių atsakas yra sudėtingesnis, abstraktesnis ir nepriklausomas nuo modelio padėties. Panašios funkcijos įgyvendinamos kognitrone, modeliuojant regos žievės organizaciją.

Neocognitron yra tolesnis kognitrono idėjos vystymas ir tiksliau atspindi regėjimo sistemos struktūrą, leidžia atpažinti vaizdus, nepriklausomai nuo jų transformacijų, sukimų, iškraipymų ir mastelio pokyčių.

Cognitron yra galingas vaizdų atpažinimo įrankis, tačiau reikalauja didelių skaičiavimo sąnaudų, kurios šiuo metu nepasiekiamos.

Nagrinėjami neuroninio tinklo metodai užtikrina greitą ir patikimą vaizdo atpažinimą, tačiau naudojant šiuos metodus iškyla problemų atpažįstant trimačius objektus. Tačiau šis metodas turi daug privalumų.

Išvada

Šiuo metu yra gana daug automatinių modelių atpažinimo sistemų įvairioms taikomoms užduotims atlikti.

Modelių atpažinimas formaliais metodais, kaip fundamentali mokslo kryptis, yra neišsemiamas.

Matematiniai vaizdo apdorojimo metodai yra labai įvairūs: moksle, technikoje, medicinoje, socialinėje sferoje. Ateityje modelio atpažinimo vaidmuo žmogaus gyvenime dar labiau padidės.

Neuroninio tinklo metodai užtikrina greitą ir patikimą vaizdo atpažinimą. Šis metodas turi daug privalumų ir yra vienas perspektyviausių.

Literatūra

D.V. Briliukas, V.V. Starovoitovas. Neuroninių tinklų vaizdų atpažinimo metodai // /

Kuzinas L.T. Kibernetikos pagrindai: Kibernetikos modelių pagrindai. T.2. - M.: Energija, 1979. - 584 p.

Peregudovas F.I., Tarasenko F.P. Įvadas į sistemų analizę: Vadovėlis. – M.: Aukštoji mokykla, 1997. - 389 p.

Temnikovas F.E., Afoninas V.A., Dmitrijevas V.I. Informacinių technologijų teoriniai pagrindai. - M.: Energija, 1979. - 511 p.

Tu J., Gonzalez R. Modelių atpažinimo principai. /Trans. iš anglų kalbos - M.: Mir, 1978. - 410 p.

Winstonas P. Dirbtinis intelektas. /Trans. iš anglų kalbos - M.: Mir, 1980. - 520 p.

Fu K. Struktūriniai modelių atpažinimo metodai: išversta iš anglų kalbos. - M.: Mir, 1977. - 320 p.

Tsypkin Ya.Z. Informacinės identifikavimo teorijos pagrindai. - M.: Nauka, 1984. - 520 p.

Pospelovas G.S. Dirbtinis intelektas yra naujų informacinių technologijų pagrindas. - M.: Nauka, 1988. - 280 p.

Yu Lifshits, Statistiniai modelio atpažinimo metodai ///modern/07modernnote.pdf

Bohr N. Atominė fizika ir žmogaus pažinimas. /Iš anglų kalbos išversta - M.: Mir, 1961. - 151 p.

Butakovas E.A., Ostrovskis V.I., Fadejevas I.L. Vaizdo apdorojimas kompiuteriu.1987.-236psl.

Duda R., Hart P. Rašto atpažinimas ir scenos analizė. /Iš anglų kalbos išversta - M.: Mir, 1978. - 510 p.

kunigaikštis V.A. Kompiuterinė psichodiagnostika. - Sankt Peterburgas: brolija, 1994. - 365 p.

Aizenbergas I. N., Aizenbergas N. N. ir Krivošejevas G. A. Daugiareikšmiai ir universalūs dvejetainiai neuronai: mokymosi algoritmai, vaizdo apdorojimo ir atpažinimo programos. Dirbtinio intelekto paskaitų pastabos – mašininis mokymasis ir duomenų gavyba modelių atpažinimo srityje, 1999, p. 21-35.

Ranganath S. ir Arun K. Veido atpažinimas naudojant transformavimo funkcijas ir neuroninius tinklus. Pattern Recognition 1997, t. 30, p. 1615-1622 m.

Golovko V.A. Neurointelektas: teorija ir taikymas. 1 knyga. Neuroninių tinklų su tiesioginiais ir grįžtamaisiais ryšiais organizavimas ir mokymas - Brestas: BPI, 1999, - 260 p.

Vetter T. ir Poggio T. Linijinių objektų klasės ir vaizdo sintezė iš vieno vaizdo pavyzdžio. IEEE Transactions on Pattern Analysis and Machine Intelligence 1997, t. 19, p. 733-742.

Golovko V.A. Neurointelektas: teorija ir taikymas. 2 knyga. Neuroninių tinklų saviorganizacija, atsparumas gedimams ir taikymas - Brestas: BPI, 1999, - 228 p.

Lawrence S., Giles C. L., Tsoi A. C. ir Back A. D. Veido atpažinimas: konvoliucinis neuroninio tinklo metodas. IEEE Transactions on Neural Networks, Special Issue on Neural Networks and Pattern Recognition, p. 1-24.

Wasserman F. Neurokompiuterių technologija: teorija ir praktika, 1992 – 184 p.

Rowley, H. A., Baluja, S. ir Kanade, T. Neuroniniu tinklu pagrįstas veido aptikimas. IEEE Transactions on Pattern Analysis and Machine Intelligence 1998, Vol. 20, p. 23-37.

Valentin D., Abdi H., O"Toole A. J. ir Cottrell G. W. Konnekcionistiniai veido apdorojimo modeliai: apklausa. IN: Pattern Recognition 1994, Vol. 27, p. 1209-1230.

dokumentas

Jie sudaro algoritmus pripažinimasvaizdai. Metodaipripažinimasvaizdai Kaip minėta aukščiau... tikrovė nėra tokia egzistuoja„ekosistemos apskritai“ ir egzistuoja tik individualios... išvados iš šio detalaus apžvalgametoduspripažinimas pristatėme...

Žmonių atpažinimo pagal veido atvaizdus metodų apžvalga, atsižvelgiant į vizualinio atpažinimo ypatybes
Apžvalga
... pripažinimas asmens mažo kontrasto objektų, įskaitant. asmenų Duota apžvalga bendras metodus ... Egzistuoja visa serija metodus ... būdu, kaip tyrimo rezultatas, platforma plėtrai metodaspripažinimas ...
Pavadintas Glazkovos Valentinos Vladimirovnos vardu. PROGRAMINĖS ĮRANGOS KŪRIMAS METODŲ TYRIMAI IR KŪRIMAS DAUGIŲ TEMIŲ HIPERTEKSTO DOKUMENTŲ KLASIFIKACIJOS TYRIMAI IR KŪRIMAS Specialybė 05
Disertacijos santrauka
Hipertekstiniai dokumentai. Skyriuje numatyta apžvalgaesamasmetodus svarstomo uždavinio sprendimai, aprašymas... atkertant mažiausiai aktualias klases // Matematika metoduspripažinimasvaizdai: 13-oji visos Rusijos konferencija. Leningrado sritis...
0 skaidrė Bioinformatikos užduočių, susijusių su genetinių tekstų analize ir apdorojimu, apžvalga
Paskaita
DNR ir baltymų sekos. Apžvalga bioinformatikos užduotys kaip užduotys... signalams reikia naudoti šiuolaikines metoduspripažinimasvaizdai, statistiniai metodai ir... su mažu genų tankiu. Esama genų prognozavimo programos nėra...

Šiame straipsnyje siekiu pabrėžti kai kuriuos pagrindinius mašininio mokymosi teorijos rezultatus taip, kad šios sąvokos būtų aiškios skaitytojams, turintiems šiek tiek žinių apie klasifikavimo ir regresijos problemas. Mintis parašyti tokį straipsnį vis labiau ryškėjo mano galvoje su kiekviena perskaityta knyga, kurioje tarsi iš vidurio buvo pasakojamos mašinos mokymo atpažinti idėjos ir buvo visiškai neaišku, ką šios ar tuo metodu rėmėsi jį kuriant. Kita vertus, yra nemažai knygų, skirtų pagrindinėms mašininio mokymosi sąvokoms, tačiau jose pateikta medžiaga gali pasirodyti per sudėtinga pirmajam skaitymui.

Motyvacija

Panagrinėkime šią problemą. Turime dviejų klasių obuolių – skanių ir neskanių, 1 ir 0. Obuoliai turi savybes – spalvą ir dydį. Spalva nuolat keisis nuo 0 iki 1, t.y. 0 - visiškai žalias obuolys, 1 - visiškai raudonas. Dydis gali keistis taip pat, 0 - mažas obuolys, 1 - didelis. Norėtume sukurti algoritmą, kuris gautų spalvą ir dydį kaip įvestį ir išvestų obuolio klasę – ar jis skanus, ar ne. Labai pageidautina, kad kuo mažiau klaidų, tuo geriau. Tuo pačiu metu turime galutinį sąrašą, kuriame yra istoriniai duomenys apie obuolių spalvą, dydį ir klasę. Kaip galėtume išspręsti tokią problemą?

Logiškas požiūris

Sprendžiant problemą, pirmasis būdas, kuris gali ateiti į galvą, gali būti toks: rankiniu būdu sukurkime taisykles, pvz., if-else ir, priklausomai nuo spalvos ir dydžio reikšmių, obuoliui priskirsime tam tikrą klasę. Tie. turime prielaidas – spalvą ir dydį, ir yra pasekmė – obuolio skonis. Visiškai pagrįsta, kai ženklų yra nedaug ir palyginimui galite įvertinti slenksčius akimis. Bet gali atsitikti taip, kad neįmanoma sugalvoti aiškių sąlygų, o iš duomenų neaišku, kokius slenksčius imti, o ateityje ženklų gali daugėti. O jeigu mūsų sąraše su istoriniais duomenimis aptiktume du vienodos spalvos ir dydžio obuolius, bet vienas pažymėtas kaip skanus, o kitas – ne? Taigi pirmasis mūsų metodas nėra toks lankstus ir keičiamas, kaip norėtume.

Pavadinimai

Įveskime tokį užrašą. Tąjį obuolį pažymėsime kaip . Savo ruožtu kiekvienas susideda iš dviejų skaičių – spalvos ir dydžio. Šį faktą pažymėsime skaičių pora: . Kiekvieno obuolio klasę pažymime kaip . Sąrašas su istoriniais duomenimis bus pažymėtas raide , šio sąrašo ilgis yra . Šio sąrašo elementas yra obuolio atributų ir jo klasės reikšmė. Tie. . Taip pat vadinsime pavyzdžiu. Mes naudojame didžiąsias raides, kad žymėtume kintamuosius, kurie gali įgyti konkretaus atributo ir klasės reikšmes. Pristatome naują koncepciją – sprendimo taisyklė yra funkcija, kuri kaip įvestį paima spalvą ir dydį, o kaip išvestį grąžina klasės etiketę:

Tikimybinis požiūris

Plėtodami loginio metodo su prielaidomis ir pasekmėmis idėją, užduokime sau klausimą – kokia tikimybė, kad mūsų mėginiui nepriklausantis obuolys bus skanus, atsižvelgiant į išmatuotas spalvos ir dydžio vertes. ? Tikimybių teorijos žymėjime šis klausimas gali būti parašytas taip:

Šią išraišką galima interpretuoti kaip prielaidą, kaip pasekmę, tačiau perėjimas nuo prielaidos prie pasekmės paklus tikimybiniams dėsniams, o ne loginiams. Tie. Vietoj tiesos lentelės su Būlio reikšmėmis 0 ir 1 klasei, bus tikimybės reikšmės, kurios svyruoja nuo 0 iki 1. Taikykite Bayes formulę ir gaukite tokią išraišką:

Pažvelkime į dešinę šios išraiškos pusę išsamiau. Daugiklis vadinamas išankstine tikimybe ir reiškia tikimybę rasti skanų obuolį tarp visų galimų obuolių. Yra a priori tikimybė susidurti su neskaniu obuoliu. Ši tikimybė gali atspindėti mūsų asmenines žinias apie tai, kaip gamtoje pasiskirsto skanūs ir neskanūs obuoliai. Pavyzdžiui, iš savo praeities patirties žinome, kad 80% visų obuolių yra skanūs. Arba galime įvertinti šią vertę tiesiog apskaičiuodami skanių obuolių dalį mūsų sąraše su istoriniais duomenimis S. Kitas veiksnys parodo, kokia tikimybė gauti tam tikrą 1 klasės obuolio spalvą ir dydį. Ši išraiška taip pat vadinama tikimybės funkcija ir gali atrodyti taip: koks nors specifinis skirstinys, pavyzdžiui, normalus. Vardiklį naudojame kaip normalizavimo konstantą, kad norima tikimybė svyruotų nuo 0 iki 1. Mūsų pagrindinis tikslas yra ne ieškoti tikimybių, o ieškoti lemiamos taisyklės, kuri iš karto suteiktų mums klasę. Galutinė sprendimo taisyklės forma priklauso nuo to, kokios reikšmės ir parametrai mums žinomi. Pavyzdžiui, mes galime žinoti tik ankstesnės tikimybės reikšmes, o likusios reikšmės negali būti įvertintos. Tada lemiama taisyklė bus tokia – priskirkite visiems obuoliams tos klasės vertę, kurios a priori tikimybė yra didžiausia. Tie. jei žinome, kad 80% obuolių gamtoje yra skanūs, tai kiekvienam obuoliui suteikiame 1 klasę. Tada mūsų paklaida bus 20%. Jei taip pat galime įvertinti tikimybės funkcijos $p(X=x_m | Y=1)$ reikšmes, tada norimos tikimybės reikšmę galime rasti naudodami Bayes formulę, kaip parašyta aukščiau. Čia bus lemiama taisyklė: pažymėkite klasę, kurios tikimybė yra didžiausia:

Pavadinkime šią taisyklę Bajeso klasifikatoriumi. Kadangi kalbame apie tikimybes, net didelė tikimybės reikšmė negarantuoja, kad obuolys nepriklauso 0 klasei. Įvertinkime obuolio klaidos tikimybę taip: jei sprendimo taisyklė grąžino klasės reikšmę, lygią 1 , tada klaidos tikimybė bus ir atvirkščiai:

Mus domina klasifikatoriaus klaidos tikimybė ne tik šiame konkrečiame pavyzdyje, bet ir apskritai visiems įmanomiems obuoliams:

Ši išraiška yra numatoma klaidos reikšmė. Taigi, išspręsdami pradinę problemą, priėjome prie Bajeso klasifikatoriaus, bet kokie jo trūkumai? Pagrindinė problema yra įvertinti sąlyginę tikimybę iš duomenų. Mūsų atveju objektą vaizduojame skaičių pora – spalva ir dydis, tačiau sudėtingesnėse problemose funkcijų matmenys gali būti daug kartų didesni, o stebėjimų iš mūsų sąrašo su istoriniais duomenimis gali nepakakti, kad būtų galima įvertinti daugiamačio atsitiktinio dydžio tikimybė. Toliau pabandysime apibendrinti savo klasifikatoriaus klaidos sampratą, taip pat pažiūrėsime, ar problemai išspręsti galima pasirinkti bet kurį kitą klasifikatorių.

Klasifikatoriaus klaidų nuostoliai

Tarkime, kad jau turime tam tikrą sprendimo taisyklę. Tada jis gali padaryti dviejų tipų klaidas – pirmoji yra priskirti objektą 0 klasei, kurios tikroji klasė yra 1, ir atvirkščiai, priskirti objektą 1 klasei, kurios tikroji klasė yra 0. Kai kuriose problemose tai svarbu. atskirti šiuos atvejus. Pavyzdžiui, labiau kenčiame, kai obuolys, pažymėtas kaip skanus, pasirodo neskanus ir atvirkščiai. Savo diskomforto laipsnį įforminame dėl nusivylusių lūkesčių sąvokoje. Apskritai, mes turime praradimo funkciją, kuri grąžina kiekvienos klasifikatoriaus klaidos skaičių. Tebūnie tikra klasės etiketė. Tada praradimo funkcija grąžina tikrosios klasės etiketės praradimo vertę ir mūsų sprendimo taisyklės vertę. Šios funkcijos naudojimo pavyzdys – paimame iš obuolio su žinoma klase, perduodame obuolį kaip įvestį į mūsų sprendimo taisyklę, gauname klasės įvertinimą iš sprendimo taisyklės, jei reikšmės sutampa, darome prielaidą kad klasifikatorius neklydo ir nėra nuostolių, jei reikšmės nesutampa, tada mūsų funkcija pasakys nuostolių dydį

Sąlyginė ir Bajeso rizika

Dabar, kai turime nuostolių funkciją ir žinome, kiek prarandame dėl netinkamo objekto klasifikavimo, būtų malonu suprasti, kiek vidutiniškai prarandame daugelyje objektų. Jei žinome vertę - tikimybė, kad obuolys bus skanus, atsižvelgiant į išmatuotas spalvos ir dydžio vertes, taip pat tikrąją klasės vertę (pavyzdžiui, paimkite obuolį iš S mėginio, žr. straipsnio pradžioje), tada galime pristatyti sąlyginės rizikos sąvoką. Sąlyginė rizika yra vidutinė objekto nuostolių vertė pagal lemiamą taisyklę:

Mūsų dvejetainės klasifikacijos atveju, kai paaiškėja:

Aukščiau aprašėme sprendimo taisyklę, kuri priskiria objektą tai klasei, kuri turi didžiausią tikimybės reikšmę. Ši taisyklė užtikrina mūsų vidutinių nuostolių minimumą (Bayeso riziką), todėl Bajeso klasifikatorius yra optimalus rizikos funkcijos požiūriu. supažindinome. Tai reiškia, kad Bajeso klasifikatorius turi mažiausią įmanomą klasifikavimo paklaidą.

Kai kurios tipiškos praradimo funkcijos

Viena iš labiausiai paplitusių nuostolių funkcijų yra simetrinė funkcija, kai nuostoliai dėl pirmojo ir antrojo tipo klaidų yra lygiaverčiai. Pavyzdžiui, nuostolių funkcija 1-0 (nulis-vienas nuostolis) apibrėžiama taip:

Tada sąlyginė rizika a(x) = 1 bus tiesiog tikimybės gauti 0 klasę objektui reikšmė:

Panašiai, jei a(x) = 0:

1-0 praradimo funkcija įgauna reikšmę 1, jei klasifikatorius padaro klaidą objekte, ir 0, jei ne. Dabar įsitikinkime, kad klaidos reikšmė yra ne 1, o kitai funkcijai Q, priklausomai nuo sprendimo taisyklės ir tikrosios klasės etiketės:

Tada sąlyginę riziką galima parašyti taip:

Pastabos dėl žymėjimo

Ankstesnis tekstas buvo parašytas pagal Dudos ir Harto knygoje priimtą užrašą. Originalioje knygoje V.N. Vapnikas svarstė tokį procesą: gamta pasirenka objektą pagal pasiskirstymą $p(x)$, o tada priskiria jam klasės etiketę pagal sąlyginį skirstymą $p(y|x)$. Tada rizika (nuostolių tikėjimasis) apibrėžiama kaip

Kur yra funkcija, su kuria mes bandome aproksimuoti nežinomą priklausomybę, yra tikrosios vertės praradimo funkcija ir mūsų funkcijos vertė. Šis žymėjimas yra aiškesnis, norint įvesti kitą sąvoką – empirinę riziką.

Empirinė rizika

Šiame etape jau išsiaiškinome, kad loginis metodas mums netinka, nes jis nėra pakankamai lankstus ir negalime naudoti Bajeso klasifikatoriaus, kai yra daug funkcijų, tačiau yra ribotas treniruočių duomenų skaičius ir mes negali atkurti tikimybės. Taip pat žinome, kad Bajeso klasifikatorius turi mažiausią įmanomą klasifikavimo paklaidą. Kadangi negalime naudoti Bajeso klasifikatoriaus, naudokite ką nors paprastesnio. Pataisykime kokią nors parametrinę funkcijų šeimą H ir iš šios šeimos parinksime klasifikatorių.

Pavyzdys: tegul yra visų formos funkcijų rinkinys

Visos šios aibės funkcijos viena nuo kitos skirsis tik koeficientais. Pasirinkę tokią šeimą, darėme prielaidą, kad spalvų dydžio koordinatėse tarp 1 klasės taškų ir 0 klasės taškų galime nubrėžti tiesią liniją su koeficientais. taip, kad skirtingų klasių taškai yra skirtingose tiesės pusėse. Yra žinoma, kad tokio tipo tiesei koeficiento vektorius yra normalus tiesei. Dabar darome taip – paimame savo obuolį, išmatuojame jo spalvą bei dydį ir tašką su gautomis koordinatėmis nubrėžiame grafike spalvų dydžio ašimis. Toliau išmatuojame kampą tarp šio taško ir vektoriaus $w$. Pastebime, kad mūsų taškas gali būti tiek vienoje, tiek kitoje tiesės pusėje. Tada kampas tarp ir taško bus ūmus arba bukas, o skaliarinė sandauga bus teigiama arba neigiama. Tai veda prie lemiamos taisyklės:

Užfiksavus funkcijų klasę $H$, kyla klausimas – kaip iš jos parinkti funkciją su reikalingais koeficientais? Atsakymas yra toks – pasirinkime funkciją, kuri sumažina mūsų Bajeso riziką $R()$. Vėlgi, bėda ta, kad norint apskaičiuoti Bajeso rizikos reikšmes, reikia žinoti skirstinį $p(x,y)$, tačiau jis mums nėra duotas, ir ne visada įmanoma jį atkurti. Kita idėja yra sumažinti riziką ne visuose įmanomuose objektuose, o tik pavyzdyje. Tie. sumažinti funkciją:

Ši funkcija vadinama empirine rizika. Kitas klausimas, kodėl nusprendėme, kad sumažindami empirinę riziką, sumažiname ir Bajeso riziką? Priminsiu, kad mūsų praktinė užduotis – padaryti kuo mažiau klasifikavimo klaidų. Kuo mažiau klaidų, tuo mažesnė Bajeso rizika. Empirinės rizikos konvergencijos prie Bajeso rizikos, didėjant duomenų kiekiui, pagrindimą 70-aisiais gavo du mokslininkai - V. N. Vapnikas ir A. Chervonenkis.

Konvergencijos garantijos. Paprasčiausias atvejis

Taigi, priėjome išvados, kad Bajeso klasifikatorius pateikia mažiausią įmanomą paklaidą, tačiau daugeliu atvejų mes negalime jos išmokyti ir taip pat negalime apskaičiuoti paklaidos (rizikos). Tačiau galime apskaičiuoti aproksimaciją prie Bajeso rizikos, kuri vadinama empirine rizika, ir, žinodami empirinę riziką, pasirinkti aproksimuojančią funkciją, kuri sumažintų empirinę riziką. Pažvelkime į paprasčiausią situaciją, kai empirinės rizikos sumažinimas sukuria klasifikatorių, kuris taip pat sumažina Bajeso riziką. Paprasčiausiu atveju turėsime daryti prielaidą, kuri retai tenkinama praktikoje, bet kurią vėliau galima sušvelninti. Nustatykime baigtinę funkcijų klasę, iš kurios pasirinksime savo klasifikatorių, ir manykime, kad tikroji funkcija, kurią gamta naudoja mūsų obuoliams suskirstyti į skonį, yra šioje baigtinėje hipotezių rinkinyje: . Taip pat turime pavyzdį, gautą iš paskirstymo per objektus. Laikome, kad visi imties objektai yra vienodai nepriklausomai paskirstyti (iid). Tada tai bus tiesa

Teorema

Pasirinkę funkciją iš klasės, kurioje naudojamas empirinis rizikos mažinimas, garantuojame, kad rasime tokią, kurios Bajeso rizikos vertė būtų nedidelė, jei imtis, kurioje atliekame sumažinimą, yra pakankamo dydžio.

Ką reiškia „maža vertė“ ir „pakankamas dydis“, skaitykite toliau pateiktoje literatūroje.

Įrodinėjimo idėja

Pagal teoremos sąlygas iš skirstinio gauname imtį, t.y. objektų atrankos iš gamtos procesas yra atsitiktinis. Kiekvieną kartą, kai renkame pavyzdį, jis bus iš to paties skirstinio, tačiau patys objektai gali skirtis. Pagrindinė įrodymo mintis yra ta, kad galime gauti tokią blogą pavyzdį, kad algoritmas, kurį pasirenkame sumažindami šios imties empirinę riziką, bus blogai sumažinant Bajeso riziką, tačiau tuo pat metu jis bus geras sumažinant empirinę riziką, tačiau tikimybė gauti tokią imtį yra maža ir didėjant imties dydžiui, ši tikimybė mažėja. Panašios teoremos egzistuoja realistiškesnėms prielaidoms, tačiau čia jų nenagrinėsime.

Praktiniai rezultatai

Turėdami įrodymų, kad funkcija, rasta sumažinus empirinę riziką, neturės didelės paklaidos anksčiau nepastebėtuose duomenims esant pakankamam mokymo imties dydžiui, šį principą galime naudoti praktikoje, pavyzdžiui, taip – imame išraišką:

Ir mes pakeičiame įvairias praradimo funkcijas, priklausomai nuo sprendžiamos problemos. Tiesinei regresijai:

Logistinės regresijos atveju:

Nors atramos vektorių mašinos pirmiausia turi geometrinę motyvaciją, jos taip pat gali būti laikomos empirine rizikos mažinimo problema.

Išvada

Daugelis prižiūrimų mokymosi metodų, be kita ko, gali būti laikomi ypatingais V. N. Vapniko ir A. Červonenkio sukurtos teorijos atvejais. Ši teorija suteikia garantijas dėl bandymo rinkinio klaidos, jei yra pakankamas mokymo imties dydis ir tam tikri reikalavimai hipotezių erdvei, kurioje ieškome savo algoritmo.

Naudota literatūra

Statistinio mokymosi teorijos prigimtis, Vladimiras N. Vapnikas
Šablonų klasifikacija, 2-asis leidimas, Richard O. Duda, Peter E. Hart, David G. Stork
Mašininio mokymosi supratimas: nuo teorijos iki algoritmų, Shai Shalev-Shwartz, Shai Ben-David

P.S. Dėl netikslumų ir rašybos klaidų rašykite asmenine žinute.

Žymos: pridėti žymų

Pamoka

Jau seniai norėjau parašyti bendrą straipsnį, kuriame būtų patys vaizdo atpažinimo pagrindai, savotiškas pagrindinių metodų vadovas, nurodantis, kada juos naudoti, kokias problemas jie išsprendžia, ką galima padaryti vakare atsiklaupus ir kas yra geriau negalvoti apie tai, kad neturite 20 metų žmonių komandos.

Kai kuriuos straipsnius optinio atpažinimo tema rašau jau seniai, todėl porą kartų per mėnesį man rašo įvairūs žmonės su klausimais šia tema. Kartais apima jausmas, kad gyveni su jais skirtinguose pasauliuose. Viena vertus, jūs suprantate, kad asmuo greičiausiai yra susijusios temos profesionalas, tačiau labai mažai žino apie optinio atpažinimo metodus. O labiausiai erzina tai, kad jis bando pritaikyti metodą iš šalia esančios žinių srities, kuris yra logiškas, bet ne iki galo veikia Vaizdo atpažinimo sistemoje, bet jis to nesupranta ir labai įsižeidžia, jei pradedi jam ką nors pasakoti. nuo pačių pagrindų. O turint galvoje, kad pasakojimas nuo pagrindų atima daug laiko, kurio dažnai nėra, darosi dar liūdniau.

Šis straipsnis skirtas tam, kad vaizdų atpažinimo metodais niekada nedirbęs žmogus per 10-15 minučių savo galvoje susikurtų tam tikrą pagrindinį temą atitinkantį pasaulio vaizdą ir suprastų, kuria kryptimi reikia kapstytis. Daugelis čia aprašytų metodų yra taikomi radarui ir garso apdorojimui.
Pradėsiu nuo kelių principų, kuriuos visada pradedame pasakyti potencialiam klientui arba asmeniui, norinčiam pradėti optinio atpažinimo funkciją:

Spręsdami problemą visada eikite nuo paprasčiausio. Žmogui daug lengviau uždėti oranžinę etiketę, nei sekti žmogų, išryškinant jį kaskadomis. Daug lengviau paimti fotoaparatą su didesne raiška, nei sukurti super raiškos algoritmą.
Griežta problemos formuluotė optinio atpažinimo metoduose yra daug svarbesnė nei sistemos programavimo problemose: vienas papildomas žodis specifikacijoje gali papildyti 50% darbo.
Universalių atpažinimo problemų sprendimų nėra. Negalite sukurti algoritmo, kuris tiesiog „atpažins bet kokį užrašą“. Ženklas gatvėje ir teksto lapas – iš esmės skirtingi objektai. Tikriausiai įmanoma sukurti bendrą algoritmą (čia geras pavyzdys iš Google), tačiau jis pareikalaus daug didelės komandos darbo ir susideda iš dešimčių skirtingų paprogramių.
OpenCV yra Biblija, kuri turi daug metodų ir gali išspręsti 50% beveik bet kokios problemos, tačiau OpenCV yra tik maža dalis to, ką iš tikrųjų galima padaryti. Viename tyrime buvo parašytos išvados: „Problemos negalima išspręsti naudojant OpenCV metodus, todėl ji yra neišsprendžiama“. Stenkitės to išvengti, netingėkite ir kiekvieną kartą blaiviai įvertinkite esamą užduotį nuo nulio, nenaudodami OpenCV šablonų.

Labai sunku duoti kokį nors universalų patarimą ar pasakyti, kaip sukurti kažkokią struktūrą, aplink kurią būtų galima sukurti savavališkų kompiuterinio regėjimo problemų sprendimą. Šio straipsnio tikslas – susisteminti, ką galima naudoti. Esamus metodus pabandysiu suskirstyti į tris grupes. Pirmoji grupė yra išankstinis filtravimas ir vaizdo paruošimas. Antroji grupė yra loginis filtravimo rezultatų apdorojimas. Trečioji grupė – sprendimų priėmimo algoritmai, pagrįsti loginiu apdorojimu. Ribos tarp grupių yra labai savavališkos. Norint išspręsti problemą, ne visada reikia naudoti visų grupių metodus, kartais pakanka dviejų, o kartais net vieno.

Čia pateiktas metodų sąrašas nėra išsamus. Siūlau komentaruose pridėti kritinius metodus, kurių neparašiau ir kiekvienam priskirti po 2-3 lydinčius žodžius.

1 dalis. Filtravimas

Šioje grupėje įdėjau metodus, kurie leidžia pasirinkti vaizdų dominančias sritis jų neanalizuojant. Dauguma šių metodų taiko tam tikrą vieną transformaciją visuose vaizdo taškuose. Filtravimo lygmenyje vaizdo analizė neatliekama, tačiau filtruojami taškai gali būti laikomi sritimis, turinčiomis specialių savybių.

Binarizavimas pagal slenkstį, histogramos srities pasirinkimas

Paprasčiausias transformavimas yra vaizdo binarinimas pagal slenkstį. RGB ir pilkos spalvos vaizdams slenkstis yra spalvos reikšmė. Yra idealių problemų, kuriose tokios transformacijos pakanka. Tarkime, kad norite automatiškai pasirinkti objektus baltame popieriaus lape:

Slenksčio, prie kurio įvyksta binarizacija, pasirinkimas daugiausia lemia patį binarizacijos procesą. Šiuo atveju vaizdas buvo dvejetainis pagal vidutinę spalvą. Paprastai dvejetainis nustatymas atliekamas naudojant algoritmą, kuris adaptyviai parenka slenkstį. Toks algoritmas gali būti lūkesčių arba režimo pasirinkimas. Arba galite pasirinkti didžiausią histogramos smailę.

Binarizacija gali duoti labai įdomių rezultatų dirbant su histogramomis, įskaitant situaciją, kai vaizdą laikome ne RGB, o HSV formatu. Pavyzdžiui, segmentuoti dominančias spalvas. Šiuo principu galite sukurti ir žymų detektorių, ir žmogaus odos detektorių.

Klasikinis filtravimas: Furjė, žemųjų dažnių filtras, aukšto dažnio filtras

Klasikiniai radaro filtravimo ir signalų apdorojimo metodai gali būti sėkmingai taikomi atliekant įvairias šablono atpažinimo užduotis. Tradicinis radaro metodas, kuris beveik niekada nenaudojamas grynos formos vaizduose, yra Furjė transformacija (konkrečiau, FFT). Viena iš nedaugelio išimčių, kai naudojama vienmatė Furjė transformacija, yra vaizdo suspaudimas. Vaizdo analizei vienmatės transformacijos paprastai neužtenka, reikia naudoti daug daugiau išteklių reikalaujančią dvimatę transformaciją.

Nedaug žmonių iš tikrųjų tai apskaičiuoja, paprastai daug greičiau ir lengviau naudoti dominančios srities konvoliuciją su paruoštu filtru, suderintu aukštiems (HPF) arba žemiems (LPF) dažniams. Šis metodas, žinoma, neleidžia atlikti spektrinės analizės, tačiau atliekant konkrečią vaizdo apdorojimo užduotį dažniausiai reikia ne analizės, o rezultato.

Paprasčiausi filtrų, pabrėžiančių žemus dažnius (Gauso filtras) ir aukštus dažnius (Gaboro filtras), pavyzdžiai.
Kiekvienam vaizdo taškui parenkamas langas ir padauginamas su tokio pat dydžio filtru. Tokios konvoliucijos rezultatas yra nauja taško reikšmė. Diegiant žemų dažnių filtrus ir aukšto dažnio filtrus gaunami tokio tipo vaizdai:

Bangelės

Bet ką daryti, jei signalo konvoliucijai naudosime kokią nors savavališką charakteristikos funkciją? Tada jis vadinsis „Wavelet transform“. Šis bangelių apibrėžimas nėra teisingas, tačiau tradiciškai daugelyje komandų bangelių analizė yra savavališko modelio paieška vaizde naudojant konvoliuciją su šio modelio modeliu. Yra klasikinių funkcijų rinkinys, naudojamas bangelių analizėje. Tai apima Haar bangelę, Morlet bangelę, Meksikos skrybėlių bangelę ir kt. Haar primityvai, apie kuriuos buvo keli mano ankstesni straipsniai (,), yra susiję su tokiomis dvimatės erdvės funkcijomis.

Aukščiau yra 4 klasikinių bangelių pavyzdžiai. 3 dimensijos Haar bangelės, 2 dimensijos Meyer bangelės, Meksikos kepurės bangelės, Daubechies bangelės. Geras išplėstinio bangelių aiškinimo pavyzdys yra blyksnio akyje radimo problema, kuriai bangelė yra pats akinimas:

Klasikinės bangelės dažniausiai naudojamos vaizdams suspausti arba vaizdų klasifikavimui (bus aprašyta toliau).

Koreliacija

Po tokios laisvos bangelių interpretacijos iš mano pusės verta paminėti tikrąją jų pagrindą. Tai nepakeičiamas įrankis filtruojant vaizdus. Klasikinė programa koreliuoja vaizdo srautą, kad surastų poslinkius arba optinius srautus. Paprasčiausias poslinkio detektorius tam tikra prasme taip pat yra skirtumo koreliatorius. Ten, kur vaizdai nesiderino, buvo judėjimas.

Filtravimo funkcijos

Įdomi filtrų klasė yra funkcijų filtravimas. Tai yra grynai matematiniai filtrai, leidžiantys vaizde aptikti paprastą matematinę funkciją (liniją, parabolę, apskritimą). Konstruojamas kaupiamasis vaizdas, kuriame kiekvienam pradinio vaizdo taškui nubraižytas jį generuojančių funkcijų rinkinys. Klasikiškiausia transformacija yra Hough transformacija linijoms. Šioje transformacijoje kiekvienam taškui (x;y) nubrėžiama tiesės y=ax+b taškų (a;b), kurių lygybė yra teisinga, rinkinys. Gaunate gražių nuotraukų:

(pirmas pliusas yra tam, kuris pirmas randa laimikį paveikslėlyje ir šį apibrėžimą ir paaiškina, antrasis pliusas yra tam, kuris pirmas pasako, kas čia parodyta)
Hough transformacija leidžia rasti bet kokias parametrizuojamas funkcijas. Pavyzdžiui, ratai. Yra modifikuota transformacija, leidžianti ieškoti bet kokių formų. Matematikai siaubingai mėgsta šią transformaciją. Bet apdorojant vaizdus, deja, tai ne visada veikia. Labai lėtas veikimo greitis, labai didelis jautrumas binarizacijos kokybei. Net ir idealiose situacijose man labiau patiko tenkinti kitus metodus.
Tiesių linijų Hough transformacijos analogas yra Radono transformacija. Jis apskaičiuojamas naudojant FFT, kuris suteikia našumo padidėjimą situacijoje, kai yra daug taškų. Be to, jį galima pritaikyti nebinarizuotam vaizdui.

Kontūrų filtravimas

Atskira filtrų klasė yra kraštinių ir kontūrų filtravimas. Kontūrai yra labai naudingi, kai norime pereiti nuo darbo su vaizdu prie darbo su tame vaizde esančiais objektais. Kai objektas yra gana sudėtingas, bet gerai išsiskiriantis, dažnai vienintelis būdas su juo dirbti yra pasirinkti jo kontūrus. Yra keletas algoritmų, kurie išsprendžia kontūrų filtravimo problemą:

Dažniausiai naudojamas Canny, kuris veikia gerai ir kurio įdiegimas yra OpenCV (yra ir Sobel, bet prasčiau ieško kontūrų).

Kiti filtrai

Aukščiau yra filtrai, kurių modifikacijos padeda išspręsti 80-90% problemų. Tačiau be jų yra ir retesnių filtrų, naudojamų atliekant vietines užduotis. Tokių filtrų yra dešimtys, visų neišvardinsiu. Įdomūs yra iteraciniai filtrai (pavyzdžiui, aktyvaus išvaizdos modelis), taip pat keteros ir kreivės transformacijos, kurios yra klasikinio bangelių filtravimo ir analizės radono transformacijos lauke sintezė. Beamleto transformacija puikiai veikia bangelės transformacijos ir loginės analizės ribose, leidžianti paryškinti kontūrus:

Tačiau šios transformacijos yra labai specifinės ir pritaikytos retoms užduotims.

2 dalis. Loginis filtravimo rezultatų apdorojimas

Filtruojant gaunamas duomenų rinkinys, tinkamas apdoroti. Tačiau dažnai negalite tiesiog paimti ir naudoti šių duomenų jų neapdoroję. Šiame skyriuje bus keletas klasikinių metodų, leidžiančių nuo vaizdo pereiti prie objektų savybių arba prie pačių objektų.

Morfologija

Perėjimas nuo filtravimo prie logikos, mano nuomone, yra matematinės morfologijos metodai (, ,). Iš esmės tai yra paprasčiausios dvejetainių vaizdų auginimo ir ardymo operacijos. Šie metodai leidžia pašalinti triukšmą iš dvejetainio vaizdo padidinant arba sumažinant esamus elementus. Yra kontūravimo algoritmai, pagrįsti matematine morfologija, tačiau dažniausiai naudojami tam tikri hibridiniai algoritmai arba algoritmų derinys.

Kontūrų analizė

Filtravimo skyriuje jau buvo paminėti ribų gavimo algoritmai. Gautos ribos gana paprastai paverčiamos kontūrais. Canny algoritmui tai vyksta automatiškai, kitiems algoritmams reikalingas papildomas dvejetainis nustatymas. Galite gauti dvejetainio algoritmo kontūrą, pavyzdžiui, naudodami vabalo algoritmą.
Kontūras yra unikali objekto savybė. Tai dažnai leidžia atpažinti objektą pagal jo kontūrą. Yra galingas matematinis aparatas, leidžiantis tai padaryti. Prietaisas vadinamas kontūrų analize (,).

Tiesą sakant, aš niekada negalėjau pritaikyti kontūrų analizės tikroms problemoms. Reikalingos pernelyg idealios sąlygos. Arba nėra ribos, arba per daug triukšmo. Bet jei jums reikia ką nors atpažinti idealiomis sąlygomis, kontūrų analizė yra puikus pasirinkimas. Veikia labai greitai, graži matematika ir aiški logika.

Ypatingi taškai

Vienetiniai taškai yra unikalios objekto savybės, leidžiančios objektą palyginti su pačiu savimi arba su panašiomis objektų klasėmis. Yra kelios dešimtys tokių taškų nustatymo būdų. Kai kurie metodai nustato specialius taškus gretimuose kadruose, kai kurie po ilgo laiko tarpo ir pasikeitus apšvietimui, kai kurie leidžia rasti specialius taškus, kurie tokie išlieka net ir sukant objektą. Pradėkime nuo metodų, leidžiančių rasti specialius taškus, kurie nėra tokie stabilūs, bet greitai apskaičiuojami, o tada eisime vis sudėtingiau:
Pirma klasė. Specialūs taškai, kurie yra stabilūs per kelias sekundes. Tokie taškai naudojami nukreipti objektą tarp gretimų vaizdo kadrų arba sujungti vaizdus iš gretimų kamerų. Tokie taškai apima vietinius vaizdo maksimumus, vaizdo kampus (geriausias detektorius galbūt yra Chariso detektorius), taškus, kuriuose pasiekiama didžiausia sklaida, tam tikrus gradientus ir kt.
Antra klasė. Specialūs taškai, kurie yra stabilūs keičiantis apšvietimui ir nedideliems objekto judesiams. Tokie taškai pirmiausia skirti mokymui ir vėlesniam objektų tipų klasifikavimui. Pavyzdžiui, pėsčiųjų klasifikatorius arba veido klasifikatorius yra sistemos, sukurtos būtent ant tokių taškų, produktas. Kai kurios iš anksčiau paminėtų bangelių gali būti tokių taškų pagrindas. Pavyzdžiui, Haar primityvai, ieškokite svarbiausių elementų, ieškokite kitų specifinių funkcijų. Šie taškai apima tuos, kurie rasti kryptinių gradientų histogramos (HOG) metodu.
Trečia klasė. Stabilūs taškai.Žinau tik apie du visišką stabilumą užtikrinančius metodus ir apie jų modifikacijas. Tai yra SURF ir SIFT. Jie leidžia rasti specialius taškus net sukant vaizdą. Tokių taškų skaičiavimas užtrunka ilgiau, palyginti su kitais metodais, tačiau laikas yra gana ribotas. Deja, šie metodai yra patentuoti. Nors Rusijoje neįmanoma patentuoti algoritmų, todėl naudokite jį vidaus rinkai.

3 dalis. Mokymai

Trečioji pasakojimo dalis bus skirta metodams, kurie tiesiogiai neveikia su įvaizdžiu, bet leidžia priimti sprendimus. Tai daugiausia įvairūs mašininio mokymosi ir sprendimų priėmimo metodai. Neseniai Yandyx paskelbė kursą šia tema Habr, ten yra labai geras pasirinkimas. Čia jis yra tekstinėje versijoje. Norint rimtai studijuoti temą, labai rekomenduoju juos pažiūrėti. Čia pabandysiu apibūdinti kelis pagrindinius metodus, naudojamus konkrečiai modelio atpažinimui.
80% situacijų mokymosi atpažinimo užduotyje esmė yra tokia:
Yra bandomasis pavyzdys, kuriame yra keletas objektų klasių. Tebūnie tai žmogaus buvimas/nebuvimas nuotraukoje. Kiekvienam vaizdui yra aibė funkcijų, kurias paryškino kuri nors funkcija, ar tai būtų Haar, HOG, SURF ar kokia nors banga. Mokymosi algoritmas turi sukurti modelį, kad galėtų analizuoti naują vaizdą ir nuspręsti, kuris objektas yra vaizde.
Kaip tai daroma? Kiekvienas bandomasis vaizdas yra taškas funkcijų erdvėje. Jo koordinatės yra kiekvienos vaizdo ypatybės svoris. Tebūnie mūsų ženklai: „Akių buvimas“, „Nosies buvimas“, „Dviejų rankų buvimas“, „Ausų buvimas“ ir tt... Visus šiuos ženklus išryškinsime naudodami turimus detektorius, kurie yra išmokyti. kūno dalys, panašios į žmogaus Žmogui tokioje erdvėje teisingas taškas būtų . Beždžionei – taškas arkliui. Klasifikatorius mokomas naudojant pavyzdžių pavyzdį. Tačiau ne visose nuotraukose buvo matyti rankos, kitose nebuvo akių, o trečioje beždžionė dėl klasifikatoriaus klaidos turėjo žmogaus nosį. Išmokytas žmogaus klasifikatorius automatiškai padalina objektų erdvę taip, kad sakytų: jei pirmoji savybė yra diapazone 0,5 Iš esmės klasifikatoriaus tikslas yra požymių erdvėje nubrėžti sritis, būdingas klasifikavimo objektams. Taip atrodys vieno iš klasifikatorių (AdaBoost) nuoseklus atsakymo priartinimas dvimatėje erdvėje:

Yra daug klasifikatorių. Kiekvienas iš jų geriau atlieka tam tikrą užduotį. Klasifikatoriaus parinkimas konkrečiai užduočiai iš esmės yra menas. Štai keletas gražių nuotraukų šia tema.

Paprastas dėklas, vienmatis atskyrimas

Pažiūrėkime į paprasčiausio klasifikavimo atvejo pavyzdį, kai požymio erdvė yra vienmatė ir reikia atskirti 2 klases. Situacija pasitaiko dažniau, nei manote: pavyzdžiui, kai reikia atskirti du signalus arba palyginti modelį su pavyzdžiu. Pateikiame mokymo pavyzdį. Taip sukuriamas vaizdas, kuriame X ašis yra panašumo matas, o Y ašis – įvykių su tokiu matu skaičius. Kai norimas objektas yra panašus į save, gaunamas kairysis Gausas. Kai neatrodo – teisingas. X=0,4 reikšmė atskiria imtį taip, kad neteisingas sprendimas sumažintų tikimybę, kad bus priimtas neteisingas sprendimas. Būtent tokio separatoriaus paieška yra klasifikavimo užduotis.

Maža pastaba. Kriterijus, kuris sumažina klaidą, ne visada bus optimalus. Šis grafikas yra tikrosios rainelės atpažinimo sistemos grafikas. Tokiai sistemai kriterijus pasirenkamas siekiant sumažinti tikimybę, kad neįgaliotas asmuo klaidingai pateks į objektą. Ši tikimybė vadinama „I tipo klaida“, „klaidingo pavojaus tikimybe“, „klaidingai teigiama“. Literatūroje anglų kalba „False Access Rate“.
) AdaBusta yra vienas iš labiausiai paplitusių klasifikatorių. Pavyzdžiui, ant jo pastatyta Haar kaskada. Paprastai naudojamas, kai reikalinga dvejetainė klasifikacija, tačiau niekas netrukdo treniruotis didesniam klasių skaičiui.
SVM ( , , , ) Vienas iš galingiausių klasifikatorių, turintis daugybę įgyvendinimų. Iš esmės, atliekant mokymosi užduotis, su kuriomis susidūriau, jis veikė panašiai kaip Adabusta. Manoma, kad jis yra gana greitas, tačiau jo mokymas yra sunkesnis nei Adabusta ir reikalauja pasirinkti tinkamą branduolį.

Taip pat yra neuroniniai tinklai ir regresija. Tačiau norint juos trumpai klasifikuoti ir parodyti, kuo jie skiriasi, mums reikia daug ilgesnio straipsnio.
________________________________________________
Tikiuosi, kad man pavyko greitai apžvelgti naudojamus metodus, nesigilindamas į matematiką ir aprašymą. Gal kam nors tai padės. Nors, žinoma, straipsnis yra neišsamus ir nėra nė žodžio apie darbą su stereo vaizdais, nei apie LSM su Kalman filtru, nei apie adaptyvų Bayes požiūrį.
Jei jums patinka straipsnis, pabandysiu padaryti antrą dalį su pavyzdžiais, kaip sprendžiamos esamos ImageRecognition problemos.

Ir pagaliau

Ką skaityti?
1) Man kažkada labai patiko B. Yane knyga „Skaitmeninis vaizdo apdorojimas“, kuri parašyta paprastai ir aiškiai, bet tuo pat metu pateikta beveik visa matematika. Puikiai tinka susipažinti su esamais metodais.
2) Žanro klasika – R. Gonzalez, R. Woods „Skaitmeninis vaizdo apdorojimas“. Kažkodėl man buvo sunkiau nei pirmasis. Daug mažiau matematikos, bet daugiau metodų ir paveikslėlių.
3) „Vaizdo apdorojimas ir analizė kompiuterinio regėjimo problemomis“ – parašyta pagal kursą, dėstomą vienoje iš Fizikos ir technologijų katedrų. Metodų ir jų detalių aprašymų yra labai daug. Tačiau, mano nuomone, knyga turi du didelius minusus: knygoje labai daug dėmesio skiriama programiniam paketui, kuris knygoje pateikiamas, per dažnai paprasto metodo aprašymas virsta matematinėmis džiunglėmis, iš kurių sunku išeiti; išvesti metodo struktūrinę schemą. Tačiau autoriai sukūrė patogią svetainę, kurioje pateikiamas beveik visas turinys - wiki.technicalvision.ru Pridėti žymų

Apskritai galima išskirti tris modelio atpažinimo būdus: Brute force metodas. Šiuo atveju lyginama su duomenų baze, kur kiekvienam objekto tipui pateikiamos įvairios ekrano modifikacijos. Pavyzdžiui, optiniam modelio atpažinimui galite naudoti objekto išvaizdos įvairiais kampais, mastelių, poslinkių, deformacijų ir tt surašymo metodą. Raidėms reikia surašyti šriftą, šrifto savybes ir pan. garso vaizdo atpažinimo, atitinkamai lyginama su kai kuriais žinomais raštais (pavyzdžiui, kelių žmonių ištartu žodžiu).

Antrasis metodas apima išsamesnę vaizdo savybių analizę. Optinio atpažinimo atveju tai gali būti įvairių geometrinių charakteristikų nustatymas. Šiuo atveju garso mėginiui atliekama dažnio, amplitudės analizė ir kt.

Kitas metodas yra dirbtinių neuroninių tinklų (ANN) naudojimas. Šis metodas reikalauja arba daug atpažinimo užduoties pavyzdžių treniruočių metu, arba specialios neuroninio tinklo struktūros, kuri atsižvelgia į šios užduoties specifiką. Tačiau jis siūlo didesnį efektyvumą ir produktyvumą.

4. Modelių atpažinimo istorija

Trumpai panagrinėkime matematinį modelio atpažinimo formalizmą. Modelio atpažinimo objektas apibūdinamas pagrindinių charakteristikų (ypatybių, savybių) visuma. Pagrindinės charakteristikos gali būti skirtingo pobūdžio: jos gali būti paimtos iš tvarkingos tikrosios linijos tipo rinkinio arba iš atskiros aibės (kurios taip pat gali būti aprūpintos struktūra). Šis objekto supratimas atitinka tiek praktinio modelio atpažinimo pritaikymo poreikį, tiek mūsų supratimą apie žmogaus objekto suvokimo mechanizmą. Iš tiesų, mes manome, kad kai žmogus stebi (matuoja) objektą, informacija apie jį per baigtinį skaičių jutiklių (analizuotų kanalų) patenka į smegenis, ir kiekvienas jutiklis gali būti susietas su atitinkama objekto charakteristika. Be ypatybių, atitinkančių mūsų objekto matavimus, taip pat yra pasirinkta ypatybė arba požymių grupė, kurią vadiname ypatybių klasifikavimu, o jų reikšmių nustatymas tam tikram vektoriui X yra užduotis, kurią atlieka natūralios ir dirbtinės atpažinimo sistemos.

Akivaizdu, kad norint nustatyti šių požymių reikšmes, būtina turėti informacijos apie tai, kaip žinomos savybės yra susijusios su klasifikuojamaisiais. Informacija apie šį ryšį pateikiama precedentų forma, tai yra objektų aprašymų rinkinys su žinomomis klasifikavimo charakteristikų reikšmėmis. Ir remiantis šia precedento informacija, būtina sukurti sprendimo taisyklę, kuri savavališkam objekto aprašymui priskirtų jo klasifikuojamųjų požymių reikšmes.

Toks modelio atpažinimo problemos supratimas moksle įsitvirtino nuo praėjusio amžiaus 50-ųjų. Ir tada buvo pastebėta, kad tokia produkcija – visai ne naujiena. Mes susidūrėme su panašia formuluote ir jau egzistavo gana gerai pasiteisinę statistinių duomenų analizės metodai, kurie buvo aktyviai naudojami daugeliui praktinių problemų, tokių kaip, pavyzdžiui, techninė diagnostika. Todėl pirmieji modelio atpažinimo žingsniai vyko po statistinio požiūrio ženklu, kuris ir padiktavo pagrindines problemas.

Statistinis požiūris grindžiamas idėja, kad pradinė objektų erdvė yra tikimybinė erdvė, o objektų ženklai (charakteristikos) yra joje nurodyti atsitiktiniai dydžiai. Tada duomenų mokslininko užduotis buvo, remiantis tam tikrais samprotavimais, iškelti statistinę hipotezę apie požymių pasiskirstymą, o tiksliau – apie klasifikuojamųjų požymių priklausomybę nuo kitų. Statistinė hipotezė, kaip taisyklė, buvo parametriškai apibrėžtas požymių pasiskirstymo funkcijų rinkinys. Tipiška ir klasikinė statistinė hipotezė yra hipotezė apie šio skirstinio normalumą (statistai yra sugalvoję labai daug tokių hipotezių variantų). Suformulavus hipotezę, beliko patikrinti šią hipotezę precedentų duomenimis. Šį testą sudarė tam tikro skirstinio parinkimas iš iš pradžių nurodyto skirstinių rinkinio (paskirstymo hipotezės parametras) ir šio pasirinkimo patikimumo (pasitikėjimo intervalo) įvertinimas. Tiesą sakant, ši paskirstymo funkcija buvo atsakymas į problemą, tik objektas buvo klasifikuojamas ne vienareikšmiškai, o su tam tikromis tikimybėmis priklausyti klasėms. Statistikai taip pat sukūrė asimptotinį tokių metodų pagrindimą. Tokie pagrindimai buvo pateikti pagal tokią schemą: buvo nustatytas tam tikras pasiskirstymo pasirinkimo kokybės funkcionalumas (pasitikėjimo intervalas) ir parodyta, kad didėjant precedentų skaičiui, mūsų pasirinkimas su tikimybe, linkusia į 1, tapo teisingas. šios funkcijos prasmė (pasitikėjimo intervalas linkęs į 0). Žvelgdami į ateitį, sakysime, kad statistinis atpažinimo problemos vaizdas pasirodė esąs labai vaisingas ne tik sukurtų algoritmų (kurie apima klasterinės ir diskriminacinės analizės metodus, neparametrinę regresiją ir kt.), bet ir vėliau paskatino. Vapnik iki gilios statistinės atpažinimo teorijos sukūrimo.

Tačiau yra rimtas argumentas, kad modelio atpažinimo problemos negali būti sumažintos iki statistikos. Bet kuri tokia problema iš esmės gali būti nagrinėjama statistiniu požiūriu ir jos sprendimo rezultatai gali būti interpretuojami statistiškai. Norėdami tai padaryti, tereikia manyti, kad problemos objektų erdvė yra tikimybinė. Tačiau instrumentalizmo požiūriu tam tikro atpažinimo metodo statistinės interpretacijos sėkmės kriterijus gali būti tik šio metodo pagrindimo buvimas statistikos, kaip matematikos šakos, kalboje. Pateisinimas čia reiškia pagrindinių reikalavimų, užtikrinančių šio metodo taikymo sėkmę, sukūrimą. Tačiau šiuo metu daugumai pripažinimo metodų, įskaitant tuos, kurie tiesiogiai atsirado taikant statistinį metodą, tokio patenkinamo pagrindimo nerasta. Be to, šiuo metu dažniausiai naudojami statistiniai algoritmai, tokie kaip Fišerio linijinis diskriminantas, Parzen langas, EM algoritmas, artimiausio kaimyno metodas, jau nekalbant apie Bajeso įsitikinimų tinklus, turi stiprią euristinę prigimtį ir gali turėti interpretacijų, kurios skiriasi nuo statistinių. Ir galiausiai, prie viso to, kas išdėstyta pirmiau, reikėtų pridurti, kad be asimptotinio atpažinimo metodų elgesio, kuris yra pagrindinė statistikos problema, atpažinimo praktika kelia klausimų dėl metodų skaičiavimo ir struktūrinio sudėtingumo, kurie yra daug daugiau. vien tikimybių teorijos apimtis.

Taigi, priešingai nei statistikos siekiai modelių atpažinimą laikyti statistikos šaka, į atpažinimo praktiką ir ideologiją buvo įtrauktos visiškai kitos idėjos. Vienas iš jų atsirado dėl tyrimų vizualinio modelio atpažinimo srityje ir yra pagrįstas tokia analogija.

Kaip jau minėta, kasdieniame gyvenime žmonės nuolat (dažnai nesąmoningai) sprendžia įvairių situacijų atpažinimo, klausos ir vaizdo vaizdų problemas. Tokios galimybės kompiuteriams geriausiu atveju yra ateities dalykas. Todėl kai kurie modelių atpažinimo pradininkai padarė išvadą, kad sprendžiant šias problemas kompiuteriu, apskritai turėtų būti modeliuojami žmogaus mąstymo procesai. Garsiausias bandymas prieiti prie problemos šiuo kampu buvo garsusis F. Rosenblatto tyrimas apie perceptronus.

Iki šeštojo dešimtmečio vidurio atrodė, kad neurofiziologai suprato fizinius smegenų principus (knygoje „The New Mind of the King“ garsus britų fizikas R. Penrose'as įdomiai kvestionuoja smegenų neuroninio tinklo modelį, pateisindamas reikšmingas kvantinių mechaninių efektų vaidmuo, nors nuo pat pradžių šis modelis buvo suabejotas, remdamasis šiais atradimais, F. Rosenblatt sukūrė vizualinio vaizdo atpažinimo modelį, kurį pavadino Rosenblatt perceptronu, kuris reprezentuoja. šią funkciją (1 pav.):

1 pav. Perceptrono grandinė

Įvestyje perceptronas gauna objekto vektorių, kuris Rosenblatto darbe buvo dvejetainis vektorius, rodantis, kuris iš ekrano pikselių yra pajuodęs nuo vaizdo, o kuris ne. Toliau kiekvienas iš ženklų yra tiekiamas į neurono įvestį, kurio veiksmas yra paprastas dauginimas iš tam tikro neurono svorio. Rezultatai paduodami į paskutinį neuroną, kuris juos sumuoja ir palygina bendrą kiekį su tam tikra riba. Priklausomai nuo palyginimo rezultatų, įvesties objektas X atpažįstamas kaip reikalingas arba ne. Tada užduotis mokyti atpažinti šabloną buvo pasirinkti neuronų svorius ir ribines reikšmes, kad perceptronas pateiktų teisingus atsakymus į precedentus vaizdinius vaizdus. Rosenblatt manė, kad gauta funkcija būtų gera norint atpažinti norimą vaizdinį vaizdą, net jei įvesties objektas nebuvo tarp precedentų. Dėl bioninių priežasčių jis taip pat sugalvojo svorių ir slenksčių parinkimo metodą, prie kurio nesigilinsime. Tarkime, kad jo požiūris pasirodė esąs sėkmingas sprendžiant daugybę atpažinimo problemų ir paskatino visą kryptį tyrinėti mokymosi algoritmus, pagrįstus neuroniniais tinklais, kurių ypatingas atvejis yra perceptronas.

Toliau buvo išrasti įvairūs perceptrono apibendrinimai, komplikavosi neuronų funkcija: dabar neuronai galėjo ne tik padauginti įvestus skaičius arba juos sudėti ir palyginti rezultatą su slenksčiais, bet ir pritaikyti jiems sudėtingesnes funkcijas. 2 paveiksle parodyta viena iš šių neuronų komplikacijų:

Ryžiai. 2 Neuroninio tinklo diagrama.

Be to, neuroninio tinklo topologija gali būti daug sudėtingesnė nei ta, kurią svarstė Rosenblatt, pavyzdžiui:

Ryžiai. 3. Rosenblatto neuroninio tinklo diagrama.

Dėl komplikacijų treniruočių metu padaugėjo reguliuojamų parametrų, tačiau tuo pat metu padidėjo galimybė prisitaikyti prie labai sudėtingų modelių. Tyrimai šioje srityje dabar vyksta dviem glaudžiai susijusiomis kryptimis – tiriamos įvairios tinklo topologijos ir įvairūs konfigūravimo metodai.

Neuroniniai tinklai šiuo metu yra ne tik šablonų atpažinimo problemų sprendimo įrankis, bet ir buvo naudojami asociatyvinės atminties bei vaizdų glaudinimo tyrimuose. Nors ši tyrimų sritis stipriai kertasi su modelių atpažinimo problemomis, ji yra atskira kibernetikos šaka. Šiuo metu atpažintojui neuroniniai tinklai yra ne kas kita, kaip labai konkrečiai apibrėžtas, parametriškai apibrėžtas atvaizdų rinkinys, kuris šia prasme neturi jokių reikšmingų pranašumų, palyginti su daugeliu kitų panašių mokymosi modelių, kurie bus trumpai išvardyti toliau.

Kalbant apie neuroninių tinklų vaidmens pačiam atpažinimui (ty ne bionikai, kuriai jie dabar yra nepaprastai svarbūs) vertinimą, norėčiau atkreipti dėmesį į tai: neuroniniai tinklai yra nepaprastai sudėtingas matematinio tyrimo objektas. analizė, kai naudojama teisingai, leidžia rasti labai nereikšmingus dėsnius duomenis. Jų analizės sudėtingumas apskritai paaiškinamas jų sudėtinga struktūra ir dėl to praktiškai neišsemiamomis galimybėmis apibendrinti įvairius modelius. Tačiau šie pranašumai, kaip dažnai nutinka, yra galimų klaidų šaltinis ir galimybė persikvalifikuoti. Kaip bus aptarta toliau, toks dvejopas požiūris į bet kurio mokymosi modelio perspektyvas yra vienas iš mašininio mokymosi principų.

Kita populiari atpažinimo kryptis yra loginės taisyklės ir sprendimų medžiai. Palyginti su aukščiau minėtais atpažinimo metodais, šie metodai aktyviausiai naudoja idėją savo žinias apie dalykinę sritį išreikšti bene natūraliausių (sąmoningo lygio) struktūrų – loginių taisyklių – forma. Elementari loginė taisyklė reiškia teiginį, pavyzdžiui, „jei neklasifikuojami požymiai yra santykyje X, tada klasifikuojami yra Y atžvilgiu“. Tokios taisyklės medicinos diagnostikoje pavyzdys yra toks: jei paciento amžius yra vyresnis nei 60 metų ir jis anksčiau buvo patyręs širdies smūgį, tada neatlikite operacijos - neigiamo rezultato rizika yra didelė.

Norint ieškoti duomenų loginių taisyklių, reikia dviejų dalykų: nustatyti taisyklės „informatyvumo“ matą ir taisyklių erdvę. O taisyklių paieškos užduotis tada virsta visiško ar dalinio išvardinimu taisyklių erdvėje, siekiant rasti informatyviausią iš jų. Informacijos turinio apibrėžimas gali būti pateikiamas įvairiais būdais, ir mes apie tai nesigilinsime, nes tai taip pat yra tam tikras modelio parametras. Paieškos erdvė apibrėžiama standartiniu būdu.

Radus pakankamai informatyvias taisykles, prasideda taisyklių „surinkimo“ į galutinį klasifikatorių etapas. Išsamiai neaptardami čia iškylančių problemų (o jų yra nemažai), išvardinsime 2 pagrindinius „surinkimo“ būdus. Pirmasis tipas yra linijinis sąrašas. Antrasis tipas – svertinis balsavimas, kai kiekvienai taisyklei priskiriamas tam tikras svoris, o objektas klasifikatoriaus priskiriamas tai klasei, už kurią balsavo daugiausiai taisyklių.

Tiesą sakant, taisyklės kūrimo fazė ir „surinkimo“ fazės atliekamos kartu, o kuriant svertinį balsavimą ar sąrašą, taisyklių paieška atvejo duomenų dalyse iškviečiama vėl ir vėl, kad būtų užtikrintas geresnis duomenų ir modelio suderinimas. .