Pamoka

Jau seniai norėjau parašyti bendrą straipsnį, kuriame būtų patys vaizdo atpažinimo pagrindai, savotiškas pagrindinių metodų vadovas, nurodantis, kada juos naudoti, kokias problemas jie išsprendžia, ką galima padaryti vakare atsiklaupus ir kas yra geriau negalvoti apie tai, kad neturite 20 metų žmonių komandos.

Kai kuriuos straipsnius apie optinį atpažinimą rašau jau seniai, todėl žmonės man rašo porą kartų per mėnesį įvairių žmonių su klausimais šia tema. Kartais apima jausmas, kad gyveni su jais skirtingi pasauliai. Viena vertus, jūs suprantate, kad asmuo greičiausiai yra susijusios temos profesionalas, tačiau labai mažai žino apie optinio atpažinimo metodus. O labiausiai erzina tai, kad jis bando pritaikyti metodą iš šalia esančios žinių srities, kuris yra logiškas, bet ne iki galo veikia Vaizdo atpažinimo sistemoje, bet jis to nesupranta ir labai įsižeidžia, jei pradedi jam ką nors pasakoti. nuo pačių pagrindų. O turint galvoje, kad pasakojimas nuo pagrindų atima daug laiko, kurio dažnai nėra, darosi dar liūdniau.

Šis straipsnis skirtas tam, kad vaizdų atpažinimo metodais niekada nedirbęs žmogus per 10-15 minučių savo galvoje susikurtų tam tikrą pagrindinį temą atitinkantį pasaulio vaizdą ir suprastų, kuria kryptimi reikia kapstytis. Daugelis čia aprašytų metodų yra taikomi radarui ir garso apdorojimui.
Pradėsiu nuo kelių principų, kuriuos visada pradedame pasakyti potencialiam klientui arba asmeniui, norinčiam pradėti optinio atpažinimo funkciją:

Spręsdami problemą visada eikite nuo paprasčiausio. Žmogui uždėti žymą yra daug lengviau oranžinės spalvos nei sekti žmogų, išryškinant jį kaskadomis. Daug lengviau paimti fotoaparatą su didesne raiška, nei sukurti super raiškos algoritmą.
Griežta problemos formuluotė optinio atpažinimo metoduose yra daug svarbesnė nei uždaviniuose sistemos programavimas: vienas papildomas žodis gali pridėti 50% darbo prie techninių specifikacijų.
Universalių atpažinimo problemų sprendimų nėra. Negalite sukurti algoritmo, kuris tiesiog „atpažins bet kokį užrašą“. Ženklas gatvėje ir teksto lapas yra esminiai dalykai skirtingi objektai. Tikriausiai įmanoma sukurti bendrą algoritmą (čia geras pavyzdys iš Google), tačiau jis pareikalaus daug didelės komandos darbo ir susideda iš dešimčių skirtingų paprogramių.
OpenCV yra Biblija, kuri turi daug metodų ir gali išspręsti 50% beveik bet kokios problemos, tačiau OpenCV yra tik maža dalis to, ką iš tikrųjų galima padaryti. Viename tyrime buvo parašytos išvados: „Problemos negalima išspręsti naudojant OpenCV metodus, todėl ji yra neišsprendžiama“. Stenkitės to išvengti, nepatingėkite ir kiekvieną kartą blaiviai įvertinkite esamą užduotį nuo nulio, nenaudodami OpenCV šablonų.

Labai sunku duoti kokį nors universalų patarimą ar pasakyti, kaip sukurti kažkokią struktūrą, aplink kurią būtų galima sukurti savavališkų kompiuterinio regėjimo problemų sprendimą. Šio straipsnio tikslas – susisteminti, ką galima naudoti. Pabandysiu jį sulaužyti esamus metodusį tris grupes. Pirmoji grupė yra išankstinis filtravimas ir vaizdo paruošimas. Antroji grupė yra loginis filtravimo rezultatų apdorojimas. Trečioji grupė – sprendimų priėmimo algoritmai, pagrįsti loginiu apdorojimu. Ribos tarp grupių yra labai savavališkos. Norint išspręsti problemą, ne visada reikia naudoti visų grupių metodus, kartais pakanka dviejų, o kartais net vieno.

Čia pateiktas metodų sąrašas nėra išsamus. Siūlau papildyti komentaruose kritiniais metodais, kurio nerašiau ir kiekvienam priskiriu po 2-3 lydinčius žodžius.

1 dalis. Filtravimas

Į šią grupę įdėjau metodus, kurie leidžia pasirinkti vaizdų dominančias sritis jų neanalizuojant. Dauguma iš šių metodų visuose vaizdo taškuose taiko kažkokią vieną transformaciją. Filtravimo lygiu vaizdo analizė neatliekama, tačiau taškai, kurie filtruojami, gali būti laikomi sritimis su ypatingos savybės.

Binarizavimas pagal slenkstį, histogramos srities pasirinkimas

Paprasčiausias transformavimas yra vaizdo binarinimas pagal slenkstį. RGB ir pilkos spalvos vaizdams slenkstis yra spalvos reikšmė. Susipažink idealios problemos, kuriame pakanka tokios transformacijos. Tarkime, kad norite automatiškai pasirinkti objektus baltame popieriaus lape:

Binarizacijos slenksčio pasirinkimas iš esmės lemia patį binarizacijos procesą. IN šiuo atveju, vaizdas buvo dvejetainis pagal vidutinę spalvą. Paprastai dvejetainis nustatymas atliekamas naudojant algoritmą, kuris adaptyviai parenka slenkstį. Toks algoritmas gali būti lūkesčių arba režimo pasirinkimas. Arba galite pasirinkti didžiausią histogramos smailę.

Binarizacija gali suteikti labai įdomių rezultatų dirbant su histogramomis, įskaitant situaciją, kai vaizdą laikome ne RGB, o HSV formatu. Pavyzdžiui, segmentuoti dominančias spalvas. Šiuo principu galite sukurti ir žymų detektorių, ir žmogaus odos detektorių.

Klasikinis filtravimas: Furjė, žemo dažnio filtras, aukšto dažnio filtras

Klasikiniai radaro filtravimo ir signalų apdorojimo metodai gali būti sėkmingai taikomi atliekant įvairias šablono atpažinimo užduotis. Tradicinis metodas radare, kuris vaizduose beveik niekada nenaudojamas gryna forma, yra Furjė transformacija (konkrečiau, FFT). Viena iš nedaugelio išimčių, kai naudojama vienmatė Furjė transformacija, yra vaizdo glaudinimas. Vaizdo analizei vienmatės transformacijos paprastai neužtenka, reikia naudoti daug daugiau išteklių reikalaujančią dvimatę transformaciją.

Nedaug žmonių iš tikrųjų tai apskaičiuoja, paprastai daug greičiau ir lengviau naudoti dominančios srities konvoliuciją su paruoštu filtru, suderintu aukštiems (HPF) arba žemiems (LPF) dažniams. Šis metodas, žinoma, neleidžia atlikti spektro analizės, bet konkreti užduotis Vaizdo apdorojimui dažniausiai reikia ne analizės, o rezultatų.

Labiausiai paprasti pavyzdžiai filtrai, pabrėžiantys žemus dažnius (Gauso filtras) ir aukšti dažniai(Gaboro filtras).
Kiekvienam vaizdo taškui parenkamas langas ir padauginamas su tokio pat dydžio filtru. Tokios konvoliucijos rezultatas yra nauja taško reikšmė. Diegiant žemų dažnių filtrus ir aukšto dažnio filtrus gaunami tokio tipo vaizdai:

Bangelės

Bet ką daryti, jei konvoliucijai naudosite kokį nors savavališką signalą? būdinga funkcija? Tada jis vadinsis „Wavelet transform“. Šis bangelių apibrėžimas nėra teisingas, tačiau tradiciškai daugelyje komandų bangelių analizė yra savavališko modelio paieška vaizde naudojant konvoliuciją su šio modelio modeliu. Yra klasikinių funkcijų rinkinys, naudojamas bangelių analizėje. Tai apima Haar bangelę, Morlet bangelę, Meksikos skrybėlių bangelę ir kt. Haar primityvai, apie kuriuos buvo keli mano ankstesni straipsniai (,), yra susiję su tokiomis dvimatės erdvės funkcijomis.

Aukščiau yra 4 klasikinių bangelių pavyzdžiai. 3 dimensijos Haar bangelės, 2 dimensijos Meyer bangelės, Meksikos kepurės bangelės, Daubechies bangelės. Geras pavyzdys Naudojant išplėstinį bangelių aiškinimą, kyla problemų, kaip rasti akinimo akyje, kai bangelė yra pats akinimas:

Klasikinės bangelės dažniausiai naudojamos vaizdų glaudinimui arba vaizdų klasifikavimui (bus aprašyta toliau).

Koreliacija

Po tokios laisvos bangelių interpretacijos iš mano pusės verta paminėti tikrąją koreliaciją, kuri yra jų pagrindas. Tai nepakeičiamas įrankis filtruojant vaizdus. Klasikinė programa- vaizdo srauto koreliacija, siekiant rasti poslinkius arba optinius srautus. Paprasčiausias poslinkio detektorius tam tikra prasme taip pat yra skirtumo koreliatorius. Ten, kur vaizdai nesiderino, buvo judėjimas.

Filtravimo funkcijos

Įdomi filtrų klasė yra funkcijų filtravimas. Tai yra grynai matematiniai filtrai, leidžiantys aptikti paprastus matematinė funkcija ant atvaizdo (tiesi linija, parabolė, apskritimas). Konstruojamas kaupiamasis vaizdas, kuriame kiekvienam taškui originalus vaizdas nubraižoma daug jį generuojančių funkcijų. Klasikiškiausia transformacija yra Hough transformacija linijoms. Šioje transformacijoje kiekvienam taškui (x;y) nubrėžiama tiesės y=ax+b taškų (a;b), kurių lygybė yra teisinga, rinkinys. Gaunate gražių nuotraukų:

(pirmas pliusas yra tam, kuris pirmas randa laimikį paveikslėlyje ir šį apibrėžimą ir paaiškina, antrasis pliusas yra tam, kuris pirmas pasako, kas čia parodyta)
Hough transformacija leidžia rasti bet kokias parametrizuojamas funkcijas. Pavyzdžiui, ratai. Yra modifikuota transformacija, leidžianti ieškoti bet kokių formų. Matematikai siaubingai mėgsta šią transformaciją. Bet apdorojant vaizdus, deja, tai ne visada veikia. Labai lėtas veikimo greitis, labai didelis jautrumas binarizacijos kokybei. Net ir idealiose situacijose man labiau patiko tenkinti kitus metodus.
Tiesių linijų Hough transformacijos analogas yra Radono transformacija. Jis apskaičiuojamas naudojant FFT, kuris suteikia našumo padidėjimą situacijoje, kai yra daug taškų. Be to, jį galima pritaikyti nebinarizuotam vaizdui.

Kontūrų filtravimas

Atskira filtrų klasė yra kraštinių ir kontūrų filtravimas. Kontūrai yra labai naudingi, kai norime pereiti nuo darbo su vaizdu prie darbo su tame vaizde esančiais objektais. Kai objektas yra gana sudėtingas, bet gerai išsiskiriantis, tada dažnai vienintelis būdas dirbant su juo reikia paryškinti jo kontūrus. Yra keletas algoritmų problemos sprendimas filtravimo grandinės:

Dažniausiai naudojamas Canny, kuris veikia gerai ir kurio įdiegimas yra OpenCV (yra ir Sobel, bet prasčiau ieško kontūrų).

Kiti filtrai

Aukščiau yra filtrai, kurių modifikacijos padeda išspręsti 80-90% problemų. Tačiau be jų yra naudojami retesni filtrai vietines užduotis. Tokių filtrų yra dešimtys, visų neišvardinsiu. Įdomūs yra iteraciniai filtrai (pavyzdžiui, aktyvaus išvaizdos modelis), taip pat keteros ir kreivės transformacijos, kurios yra klasikinio bangelių filtravimo ir analizės radono transformacijos lauke sintezė. Beamlet transformacija puikiai veikia bangletės transformacijos ribose ir loginė analizė, leidžiantis pasirinkti kontūrus:

Tačiau šios transformacijos yra labai specifinės ir pritaikytos retoms užduotims.

2 dalis. Loginis filtravimo rezultatų apdorojimas

Filtruojant gaunamas duomenų rinkinys, tinkamas apdoroti. Tačiau dažnai negalite tiesiog paimti ir naudoti šių duomenų jų neapdoroję. Šioje dalyje bus keletas klasikiniai metodai, leidžiantis nuo vaizdo pereiti prie objektų savybių arba prie pačių objektų.

Morfologija

Perėjimas nuo filtravimo prie logikos, mano nuomone, yra metodai matematinė morfologija( , , ). Iš esmės tai yra paprasčiausios dvejetainių vaizdų auginimo ir ardymo operacijos. Šie metodai leidžia pašalinti triukšmą iš dvejetainio vaizdo padidinant arba sumažinant esamus elementus. Yra kontūravimo algoritmai, pagrįsti matematine morfologija, tačiau dažniausiai naudojami tam tikri hibridiniai algoritmai arba algoritmų derinys.

Kontūrų analizė

Filtravimo skyriuje jau buvo paminėti ribų gavimo algoritmai. Gautos ribos gana paprastai paverčiamos kontūrais. Naudojant „Canny“ algoritmą, tai vyksta automatiškai; Galite gauti dvejetainio algoritmo kontūrą, pavyzdžiui, naudodami vabalo algoritmą.
Kontūras yra unikali objekto savybė. Tai dažnai leidžia atpažinti objektą pagal jo kontūrą. Yra galingas matematinis aparatas, leidžiantis tai padaryti. Prietaisas vadinamas kontūrų analize (,).

Tiesą sakant, aš niekada negalėjau pritaikyti kontūrų analizės tikros problemos. Reikalingos pernelyg idealios sąlygos. Arba nėra ribos, arba per daug triukšmo. Bet jei reikia ką nors atpažinti idealios sąlygos- tada kontūrų analizė yra puikus pasirinkimas. Veikia labai greitai, graži matematika ir aiški logika.

Ypatingi taškai

Vienetiniai taškai yra unikalios objekto savybės, leidžiančios objektą palyginti su pačiu savimi arba su panašiomis objektų klasėmis. Yra kelios dešimtys tokių taškų nustatymo būdų. Kai kurie metodai pabrėžia vienetiniai taškai gretimuose kadruose, kai kurie per didelis tarpas laiko ir pasikeitus apšvietimui, kai kurie leidžia rasti specialius taškus, kurie tokie išlieka net ir sukant objektą. Pradėkime nuo metodų, leidžiančių rasti specialius taškus, kurie nėra tokie stabilūs, bet greitai apskaičiuojami, o tada mes eisime vis sudėtingiau:
Pirma klasė. Specialūs taškai, kurie yra stabilūs per kelias sekundes. Tokie taškai naudojami nukreipti objektą tarp gretimų vaizdo kadrų arba sujungti vaizdus iš gretimų kamerų. Tokie taškai apima vietinius vaizdo maksimumus, vaizdo kampus (geriausias iš detektorių, ko gero, Chariso detektorius), taškus, kuriuose pasiekiama didžiausia dispersija, tam tikrus gradientus ir kt.
Antra klasė. Specialūs taškai, kurie yra stabilūs keičiantis apšvietimui ir nedideliems objekto judesiams. Tokie taškai pirmiausia skirti mokymui ir vėlesniam objektų tipų klasifikavimui. Pavyzdžiui, pėsčiųjų klasifikatorius arba veido klasifikatorius yra sistemos, sukurtos būtent ant tokių taškų, produktas. Kai kurios iš anksčiau paminėtų bangelių gali būti tokių taškų pagrindas. Pavyzdžiui, Haar primityvai, ieškokite svarbiausių elementų, ieškokite kitų specifinių funkcijų. Šie taškai apima tuos, kurie rasti kryptinių gradientų histogramos (HOG) metodu.
Trečia klasė. Stabilūs taškai.Žinau tik apie du visišką stabilumą užtikrinančius metodus ir apie jų modifikacijas. Tai yra SURF ir SIFT. Jie leidžia rasti specialius taškus net sukant vaizdą. Tokių taškų skaičiavimas užtrunka ilgiau, lyginant su kitais metodais, tačiau to pakanka ribotas laikas. Deja, šie metodai yra patentuoti. Nors Rusijoje neįmanoma patentuoti algoritmų, todėl naudokite jį vidaus rinkai.

3 dalis. Mokymai

Trečioji pasakojimo dalis bus skirta metodams, kurie tiesiogiai neveikia su įvaizdžiu, bet leidžia priimti sprendimus. Iš esmės tai įvairių metodų mašininis mokymasis ir sprendimų priėmimas. Neseniai Yandyx paskelbė kursą šia tema Habr, tai labai geras pasirinkimas. Čia jis yra tekstinėje versijoje. Norint rimtai studijuoti temą, labai rekomenduoju juos pažiūrėti. Čia pabandysiu apibūdinti kelis pagrindinius metodus, naudojamus konkrečiai modelio atpažinimui.
80% situacijų mokymosi atpažinimo užduotyje esmė yra tokia:
Yra bandomasis pavyzdys, kuriame yra keletas objektų klasių. Tebūnie tai žmogaus buvimas/nebuvimas nuotraukoje. Kiekvienam vaizdui yra aibė funkcijų, kurias paryškino kuri nors funkcija, ar tai būtų Haar, HOG, SURF ar kokia nors banga. Mokymosi algoritmas turi sukurti modelį, kad galėtų analizuoti naują vaizdą ir nuspręsti, kuris objektas yra vaizde.
Kaip tai daroma? Kiekvienas bandomasis vaizdas yra taškas funkcijų erdvėje. Jo koordinatės yra kiekvienos vaizdo ypatybės svoris. Tebūnie mūsų ženklai: „Akių buvimas“, „Nosies buvimas“, „Dviejų rankų buvimas“, „Ausų buvimas“ ir tt... Visus šiuos ženklus išryškinsime naudodami turimus detektorius, kurie yra išmokyti. kūno dalys, panašios į žmogaus Žmogui tokioje erdvėje teisingas taškas būtų . Beždžionei – taškas arkliui. Klasifikatorius mokomas naudojant pavyzdžių pavyzdį. Tačiau ne visose nuotraukose buvo matyti rankos, kitose nebuvo akių, o trečioje beždžionė dėl klasifikatoriaus klaidos turėjo žmogaus nosį. Išmokytas žmogaus klasifikatorius automatiškai padalina objektų erdvę taip, kad sakytų: jei pirmoji savybė yra diapazone 0,5 Iš esmės klasifikatoriaus tikslas yra požymių erdvėje nubrėžti sritis, būdingas klasifikavimo objektams. Taip atrodys vieno iš klasifikatorių (AdaBoost) nuoseklus atsakymo priartinimas dvimatėje erdvėje:

Yra daug klasifikatorių. Kiekvienas iš jų geriau atlieka tam tikrą užduotį. Klasifikatoriaus parinkimas konkrečiai užduočiai iš esmės yra menas. Štai keletas gražių nuotraukų šia tema.

Paprastas dėklas, vienmatis atskyrimas

Pažiūrėkime į paprasčiausio klasifikavimo atvejo pavyzdį, kai požymio erdvė yra vienmatė ir reikia atskirti 2 klases. Situacija pasitaiko dažniau, nei manote: pavyzdžiui, kai reikia atskirti du signalus arba palyginti modelį su pavyzdžiu. Pateikiame mokymo pavyzdį. Taip sukuriamas vaizdas, kuriame X ašis yra panašumo matas, o Y ašis – įvykių su tokiu matu skaičius. Kai norimas objektas yra panašus į save, gaunamas kairysis Gausas. Kai neatrodo – teisingas. X=0,4 reikšmė atskiria imtį taip, kad neteisingas sprendimas sumažintų tikimybę priimti bet kokį neteisingą sprendimą. Tokio separatoriaus paieška yra klasifikavimo užduotis.

Maža pastaba. Kriterijus, kuris sumažina klaidą, ne visada bus optimalus. Šis grafikas yra tikrosios rainelės atpažinimo sistemos grafikas. Tokiai sistemai kriterijus pasirenkamas siekiant sumažinti tikimybę, kad neįgaliotas asmuo klaidingai pateks į objektą. Ši tikimybė vadinama „I tipo klaida“, „klaidingo pavojaus tikimybe“, „klaidingai teigiama“. Literatūroje anglų kalba „False Access Rate“.
) AdaBusta yra vienas iš labiausiai paplitusių klasifikatorių. Pavyzdžiui, ant jo pastatyta Haar kaskada. Paprastai naudojamas, kai reikalinga dvejetainė klasifikacija, tačiau niekas netrukdo treniruotis didesniam klasių skaičiui.
SVM ( , , , ) Vienas iš galingiausių klasifikatorių, turintis daugybę įgyvendinimų. Iš esmės, atliekant mokymosi užduotis, su kuriomis susidūriau, jis veikė panašiai kaip Adabusta. Manoma, kad jis yra gana greitas, tačiau jo mokymas yra sunkesnis nei Adabusta ir reikalauja pasirinkti tinkamą branduolį.

Taip pat yra neuroniniai tinklai ir regresija. Tačiau norint juos trumpai klasifikuoti ir parodyti, kuo jie skiriasi, mums reikia daug ilgesnio straipsnio.
________________________________________________
Tikiuosi, kad man pavyko greitai apžvelgti naudojamus metodus, nesigilindamas į matematiką ir aprašymą. Gal kam nors tai padės. Nors, žinoma, straipsnis yra neišsamus ir nėra nė žodžio apie darbą su stereo vaizdais, nei apie LSM su Kalman filtru, nei apie adaptyvų Bayes požiūrį.
Jei jums patinka straipsnis, pabandysiu padaryti antrą dalį su pavyzdžiais, kaip sprendžiamos esamos ImageRecognition problemos.

Ir pagaliau

Ką skaityti?
1) Man kažkada labai patiko B. Yane knyga „Skaitmeninis vaizdo apdorojimas“, kuri parašyta paprastai ir aiškiai, bet tuo pat metu pateikta beveik visa matematika. Tinka susipažinti su esamais metodais.
2) Žanro klasika – R. Gonzalez, R. Woods „Skaitmeninis vaizdo apdorojimas“. Kažkodėl man buvo sunkiau nei pirmasis. Daug mažiau matematikos, bet daugiau metodų ir paveikslėlių.
3) „Vaizdo apdorojimas ir analizė kompiuterinio regėjimo problemomis“ – parašyta pagal kursą, dėstomą vienoje iš Fizikos ir technologijų katedrų. Metodų ir jų detalių aprašymų yra labai daug. Tačiau, mano nuomone, knyga turi du didelius minusus: knygoje labai daug dėmesio skiriama programiniam paketui, kuris knygoje pateikiamas, per dažnai paprasto metodo aprašymas virsta matematinėmis džiunglėmis, iš kurių sunku išeiti; išvesti metodo struktūrinę schemą. Tačiau autoriai sukūrė patogią svetainę, kurioje pateikiamas beveik visas turinys - wiki.technicalvision.ru Pridėti žymų

Sekmadienis, 2015 m. kovo 29 d

Šiuo metu yra daug užduočių, kurias atliekant būtina priimti kokį nors sprendimą, atsižvelgiant į objekto buvimą vaizde arba jį klasifikuoti. Gebėjimas „atpažinti“ laikomas pagrindine biologinių būtybių savybe, o kompiuterinės sistemos šios savybės visiškai neturi.

Pažvelkime į bendruosius klasifikavimo modelio elementus.

Klasė- objektų, turinčių bendrų savybių, rinkinys. Tos pačios klasės objektams daroma prielaida, kad yra „panašumas“. Atpažinimo užduočiai gali būti nustatytas bet koks klasių skaičius, didesnis nei 1. Klasių skaičius žymimas skaičiumi S. Kiekviena klasė turi savo identifikavimo klasės etiketę.

Klasifikacija- klasių etikečių priskyrimo objektams procesas, remiantis tam tikru šių objektų savybių aprašymu. Klasifikatorius yra įrenginys, kuris gauna objekto atributų rinkinį kaip įvesties duomenis ir dėl to sukuria klasės etiketę.

Patikrinimas- objekto egzemplioriaus susiejimo su vienu objekto modeliu arba klasės aprašymu procesas.

Pagal būdu vietovės pavadinimą suprasime ypatybių erdvėje, kurioje rodoma daug materialaus pasaulio objektų ar reiškinių. Pasirašyti- kiekybinis tam tikros tiriamo objekto ar reiškinio savybės aprašymas.

Funkcijų erdvė tai yra N matmenų erdvė, apibrėžta tam tikrai atpažinimo užduočiai, kur N yra fiksuotas bet kokių objektų išmatuotų savybių skaičius. Vektorius iš objektų erdvės x, atitinkantis atpažinimo užduoties objektą, yra N matmenų vektorius su komponentais (x_1,x_2,…,x_N), kurie yra šio objekto ypatybių reikšmės.

Kitaip tariant, modelio atpažinimas gali būti apibrėžtas kaip šaltinio duomenų priskyrimas tam tikrai klasei, identifikuojant reikšmingus požymius ar savybes, apibūdinančias šiuos duomenis iš bendros nesvarbių detalių masės.

Klasifikavimo problemų pavyzdžiai:

simbolių atpažinimas;
kalbos atpažinimas;
medicininės diagnozės nustatymas;
orų prognozė;
veido atpažinimas
dokumentų įslaptinimas ir kt.

Dažniausiai pirminė medžiaga yra vaizdas, gautas iš fotoaparato. Problema gali būti suformuluota kaip kiekvienos nagrinėjamo vaizdo ypatybių vektorių gavimas. Procesas gali būti vertinamas kaip kodavimo procesas, kurio metu kiekvienai ypatybei priskiriama vertė iš kiekvienos klasės funkcijų erdvės.

Jei laikytume 2 objektų klases: suaugusiųjų ir vaikų. Galite pasirinkti ūgį ir svorį kaip ženklus. Kaip matyti iš paveikslo, šios dvi klasės sudaro dvi atskiras aibes, kurias galima paaiškinti pasirinktomis savybėmis. Tačiau ne visada įmanoma pasirinkti tinkamus išmatuotus parametrus kaip klasės ypatybes. Pavyzdžiui, pasirinkti parametrai netinka sukurti atskiras futbolininkų ir krepšininkų klases.

Antroji atpažinimo užduotis – iš šaltinio vaizdų išskirti būdingus bruožus arba savybes. Ši užduotis gali būti klasifikuojama kaip išankstinis apdorojimas. Jei atsižvelgsime į kalbos atpažinimo užduotį, galime išskirti tokius bruožus kaip balsiai ir priebalsiai. Atributas turi būti būdinga tam tikros klasės savybė ir tuo pat metu bendra šiai klasei. Savybės, apibūdinančios skirtumus tarp - tarpklasinės savybės. Visoms klasėms būdingos savybės neteikia naudingos informacijos ir nėra laikomos atpažinimo užduoties savybėmis. Funkcijos pasirinkimas yra viena iš svarbių užduočių, susijusių su atpažinimo sistemos kūrimu.

Nustačius požymius, turi būti nustatyta optimali klasifikavimo sprendimo procedūra. Panagrinėkime modelio atpažinimo sistemą, skirtą atpažinti skirtingas M klases, pažymėtas kaip m_1,m_2,…,m 3. Tada galime daryti prielaidą, kad vaizdo erdvę sudaro M regionai, kurių kiekvienoje yra taškai, atitinkantys vaizdą iš vienos klasės. Tada atpažinimo problema gali būti laikoma ribų, skiriančių M klases, konstravimas remiantis priimtais matavimo vektoriais.

Vaizdo išankstinio apdorojimo, savybių išskyrimo ir optimalaus sprendimo gavimo bei klasifikavimo problemos sprendimas dažniausiai siejamas su poreikiu įvertinti daugybę parametrų. Tai veda prie parametrų įvertinimo problemos. Be to, akivaizdu, kad funkcijų išgavimas gali naudoti papildomą informaciją, pagrįstą klasių pobūdžiu.

Objektai gali būti lyginami remiantis jų vaizdavimu kaip matavimo vektoriais. Matavimo duomenis patogu vaizduoti realiųjų skaičių forma. Tada dviejų objektų požymių vektorių panašumą galima apibūdinti naudojant Euklido atstumą.

čia d yra požymio vektoriaus matmuo.

Yra 3 modelių atpažinimo metodų grupės:

Palyginimas su pavyzdžiu. Ši grupė apima klasifikaciją pagal artimiausią vidurkį, klasifikaciją pagal atstumą iki artimiausio kaimyno. Struktūrinio atpažinimo metodai taip pat gali būti įtraukti į palyginimo su imtimi grupę.
Statistiniai metodai. Kaip rodo pavadinimas, statistiniai metodai naudoja tam tikrą statistinę informaciją sprendžiant atpažinimo problemą. Metodas nustato, ar objektas priklauso konkrečiai klasei, remiantis tikimybe. Kai kuriais atvejais tai reiškia, kad nustatoma užpakalinė tikimybė, kad objektas priklausys konkrečiai klasei, su sąlyga, kad šio objekto charakteristikos turi atitinkamas reikšmes. Pavyzdys yra metodas, pagrįstas Bajeso sprendimo taisykle.
Neuroniniai tinklai. Atskira atpažinimo metodų klasė. Iš kitų išskirtinis bruožas yra gebėjimas mokytis.

Klasifikacija pagal artimiausią vidurkį

Taikant klasikinį modelio atpažinimo metodą, kai nežinomas objektas klasifikavimui vaizduojamas kaip elementarių savybių vektorius. Funkcijomis pagrįsta atpažinimo sistema gali būti sukurta įvairiais būdais. Šiuos vektorius sistema gali žinoti iš anksto treniruojant arba numatyti realiu laiku, remiantis kai kuriais modeliais.

Paprastas klasifikavimo algoritmas yra sugrupuoti klasės atskaitos duomenis naudojant klasės lūkesčių vektorių (vidurkį).

čia x(i,j) yra j-asis i klasės atskaitos požymis, n_j – i klasės atskaitos vektorių skaičius.

Tada nežinomas objektas priklausys i klasei, jei jis yra žymiai artimesnis i klasės matematinių lūkesčių vektoriui nei kitų klasių matematinių lūkesčių vektoriams. Šis metodas tinka problemoms, kuriose kiekvienos klasės taškai yra kompaktiškai ir toli nuo kitų klasių taškų.

Sunkumai kils, jei klasių struktūra bus šiek tiek sudėtingesnė, pavyzdžiui, kaip parodyta paveikslėlyje. Šiuo atveju 2 klasė yra padalinta į dvi atskiras dalis, kurios blogai apibūdinamos viena vidutine verte. Be to, 3 klasė yra per pailgi;

Aprašytą problemą kai kuriais atvejais galima išspręsti pakeitus atstumo skaičiavimą.

Atsižvelgsime į klasės reikšmių „sklaidos“ charakteristikas - σ_i, išilgai kiekvienos koordinatės krypties i. Standartinis nuokrypis yra lygus dispersijos kvadratinei šakniai. Euklidinis atstumas tarp vektoriaus x ir lūkesčių vektoriaus x_c yra

Ši atstumo formulė sumažins klasifikavimo klaidų skaičių, tačiau iš tikrųjų daugumos problemų negalima pavaizduoti tokia paprasta klase.

Klasifikavimas pagal atstumą iki artimiausio kaimyno

Kitas klasifikavimo būdas yra priskirti nežinomą ypatybių vektorių x tai klasei, į kurią šis vektorius yra labiausiai panašus. Ši taisyklė vadinama artimiausio kaimyno taisykle. Artimiausio kaimyno klasifikacija gali būti efektyvesnė net tada, kai klasės turi sudėtingą struktūrą arba kai klasės persidengia.

Šis metodas nereikalauja prielaidų apie požymių vektorių pasiskirstymo erdvėje modelius. Algoritmas naudoja tik informaciją apie žinomus etaloninius pavyzdžius. Sprendimo metodas pagrįstas atstumo x apskaičiavimu iki kiekvieno duomenų bazės pavyzdžio ir minimalaus atstumo suradimu. Šio metodo pranašumai yra akivaizdūs:

bet kada galite įtraukti naujus pavyzdžius į duomenų bazę;
medžio ir tinklelio duomenų struktūros sumažina apskaičiuotų atstumų skaičių.

Be to, sprendimas bus geresnis, jei duomenų bazėje ieškosime ne vieno artimiausio kaimyno, o k. Tada, kai k > 1, jis pateikia geriausią vektorių pasiskirstymo d-mačio erdvėje atranką. Tačiau efektyvus k reikšmių naudojimas priklauso nuo to, ar kiekviename erdvės regione yra pakankamai skaičių. Jei yra daugiau nei dvi klasės, padaryti teisingą sprendimą bus sunkiau.

Literatūra

M. Castrillon, . O. Denizas,. D. Hernández ir J. Lorenzo, „Veido ir veido bruožų detektorių palyginimas pagal Viola-Jones bendrą objektų aptikimo sistemą“, International Journal of Computer Vision, Nr. 22, p. 481-494, 2011 m.
Y.-Q. Wang, „Viola-Jones veido aptikimo algoritmo analizė“, IPOL žurnalas, 2013 m.
L. Shapiro ir D. Stockman, Computer Vision, Binom. Žinių laboratorija, 2006 m.
Z. N. G., Atpažinimo metodai ir jų taikymas, Sovietų radijas, 1972 m.
J. Tu, R. Gonzalez, Matematiniai modelio atpažinimo principai, Maskva: „Mir“ Maskva, 1974 m.
Khan, H. Abdullah ir M. Shamian Bin Zainal, „Efektyvus akių ir burnos aptikimo algoritmas, naudojant viola jones ir odos spalvos pikselių aptikimo derinį“, International Journal of Engineering and Applied Sciences, Nr. 3 Nr.4 2013 m.
V. Gaede ir O. Gunther, "Multidimensional Access Methods", ACM Computing Surveys, p. 170-231, 1998.

→

3 skyrius: Analitinė modelio atpažinimo ir sprendimų priėmimo metodų apžvalga

Modelių atpažinimo teorija ir valdymo automatizavimas

Pagrindiniai adaptyvaus modelio atpažinimo uždaviniai

Atpažinimas – informacijos procesas, įgyvendinamas tam tikru informacijos keitikliu (išmaniuoju informacijos kanalu, atpažinimo sistema), turinčiu įvestį ir išvestį. Sistemos įvestis yra informacija apie tai, kokias savybes turi pateikti objektai. Sistemos išvestis rodo informaciją apie tai, kurioms klasėms (apibendrinti vaizdai) priklauso atpažinti objektai.

Kuriant ir eksploatuojant automatizuotą raštų atpažinimo sistemą, išsprendžiama nemažai problemų. Trumpai ir paprastai apsvarstykime šias užduotis. Atkreipkite dėmesį, kad skirtingi autoriai turi tas pačias šių problemų formuluotes, o pati aibė nesutampa, nes ji tam tikru mastu priklauso nuo konkretaus matematinio modelio, kuriuo remiasi ta ar kita atpažinimo sistema. Be to, kai kurios tam tikrų atpažinimo modelių problemos neturi sprendimo ir, atitinkamai, nėra keliamos.

Dalyko srities formalizavimo užduotis

Iš esmės ši užduotis yra kodavimo užduotis. Sudaromas apibendrintų klasių, kurioms gali priklausyti konkretūs objektų įgyvendinimai, sąrašas, taip pat sąrašas savybių, kurias šie objektai iš esmės gali turėti.

Mokymų imties formavimo užduotis

Mokomasis rinkinys – tai duomenų bazė, kurioje yra konkrečių objektų realizacijų aprašymai požymių kalba, papildyta informacija apie šių objektų priklausomybę tam tikroms atpažinimo klasėms.

Atpažinimo sistemos mokymo užduotis

Mokomasis pavyzdys naudojamas formuoti apibendrintus atpažinimo klasių vaizdinius, remiantis informacijos apibendrinimu apie tai, kokias savybes turi šiai klasei ir kitoms klasėms priklausantys mokymo imties objektai.

Objektų erdvės dydžio mažinimo problema

Išmokius atpažinimo sistemą (gavus statistiką apie ypatybių pasiskirstymą pagal klases pagal dažnius), atsiranda galimybė kiekvienam požymiui nustatyti jo reikšmę atpažinimo problemai spręsti. Po to mažiausiai vertingos savybės gali būti pašalintos iš funkcijų sistemos. Tada atpažinimo sistema turi būti treniruojama iš naujo, nes pašalinus kai kuriuos požymius, pasikeičia likusių požymių pasiskirstymo pagal klases statistika. Šis procesas gali būti kartojamas, t.y. būti pasikartojantis.

Atpažinimo užduotis

Atpažįstami atpažintos imties objektai, kurie visų pirma gali būti sudaryti iš vieno objekto. Atpažintas pavyzdys formuojamas panašiai kaip mokomoji, tačiau joje nėra informacijos apie objektų priklausomybę klasėms, nes būtent tai ir nustatoma atpažinimo proceso metu. Kiekvieno objekto atpažinimo rezultatas yra visų atpažinimo klasių paskirstymas arba sąrašas mažėjančia tvarka pagal atpažinto objekto panašumo į jas laipsnį.

Atpažinimo kokybės kontrolės problema

Po atpažinimo galima nustatyti jo tinkamumą. Mokymo pavyzdžio objektams tai galima padaryti iš karto, nes jiems tiesiog žinoma, kurioms klasėms jie priklauso. Apie kitus objektus šią informaciją galima gauti vėliau. Bet kuriuo atveju galima nustatyti tikrąją vidutinę klaidos tikimybę visoms atpažinimo klasėms, taip pat ir klaidos tikimybę priskiriant atpažintą objektą konkrečiai klasei.

Pripažinimo rezultatai turi būti interpretuojami atsižvelgiant į turimą informaciją apie atpažinimo kokybę.

Adaptacijos problema

Jei atlikus kokybės kontrolės procedūrą nustatoma, kad ji yra nepatenkinama, neteisingai atpažintų objektų aprašymai gali būti nukopijuoti iš pripažinto pavyzdžio į mokomąjį, papildyti atitinkama klasifikavimo informacija ir panaudoti sprendimo taisyklių performatavimui. , t.y. atsižvelgta. Be to, jei šie objektai nepriklauso esamoms atpažinimo klasėms, o tai gali būti jų neteisingo atpažinimo priežastis, šį sąrašą galima išplėsti. Dėl to atpažinimo sistema prisitaiko ir pradeda adekvačiai klasifikuoti šiuos objektus.

Atvirkštinio atpažinimo problema

Atpažinimo užduotis yra ta, kad tam tikram objektui, remdamasi žinomomis jo savybėmis, sistema nustato jo priklausymą kokiai nors anksčiau nežinomai klasei. Atvirkštinio atpažinimo uždavinyje, priešingai, tam tikrai atpažinimo klasei sistema nustato, kurios savybės yra būdingiausios šios klasės objektams, o kurios ne (arba kurie mokomosios imties objektai priklauso šiai klasei).

Klasterinės ir konstruktyviosios analizės problemos

Klasteriai – tai tokios objektų, klasių ar ypatybių grupės, kurios kiekviename klasteryje yra kuo panašesnės, o tarp skirtingų klasterių – kuo skirtingos.

Konstrukcija (šiame skyriuje aptariamame kontekste) yra priešingų klasterių sistema. Taigi tam tikra prasme konstrukcijos yra klasterių klasterinės analizės rezultatas.

Klasterinėje analizėje kiekybiškai matuojamas objektų (klasių, požymių) panašumo ir skirtumo laipsnis, o ši informacija naudojama klasifikavimui. Klasterinės analizės rezultatas – objektų klasifikavimas į grupes. Šią klasifikaciją galima pavaizduoti semantinių tinklų forma.

Kognityvinės analizės užduotis

Atliekant kognityvinę analizę, informacija apie klasių ar savybių panašumus ir skirtumus tyrėją domina pati savaime, o ne tam, kad ją panaudotų klasifikavimui, kaip klasterinėje ir konstruktyvioje analizėje.

Jei ta pati savybė būdinga dviem atpažinimo klasėms, tai prisideda prie šių dviejų klasių panašumo. Jei vienai iš klasių ši savybė yra nebūdinga, tai prisideda prie skirtumo.

Jei du požymiai koreliuoja vienas su kitu, tai tam tikra prasme jie gali būti laikomi vienu požymiu, o jei yra antikoreliuoti, tada kaip skirtingi. Atsižvelgiant į šią aplinkybę, skirtingų savybių buvimas skirtingose klasėse taip pat tam tikru būdu prisideda prie jų panašumo ir skirtumo.

Kognityvinės analizės rezultatai gali būti pateikiami kognityvinių diagramų pavidalu.

Rašto atpažinimo metodai ir jų charakteristikos

Modelių atpažinimo metodų klasifikavimo principai

Modelių atpažinimas reiškia formalių operacijų kūrimo ir taikymo skaitiniams arba simboliniams objektų vaizdiniams realiame ar idealiame pasaulyje, kurių rezultatai atspindi šių objektų lygiavertiškumo ryšius. Ekvivalentiškumo santykiai išreiškia vertinamų objektų priklausymą bet kurioms klasėms, laikomoms nepriklausomais semantiniais vienetais.

Konstruodamas atpažinimo algoritmus, lygiavertiškumo klases gali nurodyti tyrėjas, pasitelkęs savo prasmingas idėjas arba pasitelkęs išorinę papildomą informaciją apie objektų panašumus ir skirtumus sprendžiamos problemos kontekste. Tada jie kalba apie „pripažinimą su mokytoju“. Priešingu atveju, t.y. Kai automatizuota sistema išsprendžia klasifikavimo problemą nenaudodama išorinės mokymo informacijos, mes kalbame apie automatinį klasifikavimą arba „neprižiūrimą atpažinimą“. Daugumai modelių atpažinimo algoritmų reikia naudoti labai didelę skaičiavimo galią, kurią gali užtikrinti tik didelio našumo kompiuterinės technologijos.

Įvairūs autoriai (Yu.L. Barabash, V.I. Vasiljevas, A.L. Gorelikas, V.A. Skripkinas, R. Duda, P. Hartas, L. T. Kuzinas, F. I. Peregudovas, F. P. Tarasenko, F. E. Temnikovas, J. Tu, R. Gonzalezas, P. Winstonas K. Fu, Ya.Z. Tsypkin ir kt.) pateikia kitokią modelių atpažinimo metodų tipologiją. Vieni autoriai skiria parametrinius, neparametrinius ir euristinius metodus, kiti skiria metodų grupes remdamiesi istoriškai susiklosčiusiomis mokyklomis ir šios srities tendencijomis. Pavyzdžiui, darbe, kuriame pateikiama akademinė atpažinimo metodų apžvalga, naudojama tokia modelių atpažinimo metodų tipologija:

atskyrimo principu pagrįsti metodai;
statistiniai metodai;
metodai, sukurti remiantis „potencialiomis funkcijomis“;
reitingų skaičiavimo (balsavimo) metodai;
metodai, pagrįsti teiginių skaičiavimu, ypač loginės algebros aparatu.

Ši klasifikacija pagrįsta formalių modelių atpažinimo metodų skirtumais, todėl neatsižvelgiama į euristinį atpažinimo metodą, kuris buvo visiškai ir tinkamai išplėtotas ekspertinėse sistemose. Euristinis požiūris pagrįstas sunkiai įforminamomis žiniomis ir tyrėjo intuicija. Šiuo atveju tyrėjas pats nustato, kokią informaciją ir kaip turi naudoti sistema, kad pasiektų reikiamą atpažinimo efektą.

Panaši atpažinimo metodų tipologija su įvairaus detalumo laipsniu randama daugelyje atpažinimo darbų. Tuo pačiu metu žinomose tipologijose neatsižvelgiama į vieną labai reikšmingą ypatybę, kuri atspindi žinių apie dalykinę sritį vaizdavimo būdo specifiškumą naudojant bet kokį formalų modelio atpažinimo algoritmą.

D.A. Pospelovas (1990) išskiria du pagrindinius žinių pateikimo būdus:

intencionalus, atributų (ypatybių) sąsajų diagramos pavidalu.
išplėstinis, pasitelkiant konkrečius faktus (objektus, pavyzdžius).

Intensyvus vaizdavimas fiksuoja modelius ir ryšius, paaiškinančius duomenų struktūrą. Kalbant apie diagnostikos užduotis, toks fiksavimas apima operacijų su objektų atributais (ypatybėmis), kurios lemia reikiamą diagnostinį rezultatą, apibrėžimą. Intensyvios reprezentacijos įgyvendinamos atliekant operacijas su atributų reikšmėmis ir nereiškia operacijų su konkrečiais informacijos faktais (objektais).

Savo ruožtu išplėstinės žinių reprezentacijos yra susijusios su konkrečių objektų iš dalykinės srities aprašymu ir fiksavimu ir yra įgyvendinamos operacijose, kurių elementai yra objektai kaip vientisos sistemos.

Galima nubrėžti analogiją tarp intensyvaus ir išplėstinio žinių vaizdavimo ir mechanizmų, kuriais grindžiama kairiojo ir dešiniojo žmogaus smegenų pusrutulių veikla. Jei dešiniajam pusrutuliui būdingas holistinis supančio pasaulio prototipas, tai kairysis pusrutulis operuoja modeliais, atspindinčiais šio pasaulio atributų ryšius.

Du pagrindiniai aukščiau aprašyti žinių pateikimo būdai leidžia pasiūlyti tokią modelio atpažinimo metodų klasifikaciją:

intensyvūs metodai, pagrįsti operacijomis su ypatybėmis.
išplėtimo metodai, pagrįsti operacijomis su objektais.

Ypač reikia pabrėžti, kad būtent šių dviejų (ir tik dviejų) atpažinimo metodų grupių – veikiančių ženklais ir veikiančių daiktais – egzistavimas yra giliai natūralus. Šiuo požiūriu nė vienas iš šių metodų, paimtas atskirai nuo kito, neleidžia susidaryti tinkamo dalykinės srities atspindžio. Autorių nuomone, tarp šių metodų N. Bohro prasme yra papildomumo ryšys, todėl perspektyvios atpažinimo sistemos turėtų užtikrinti abiejų šių metodų, o ne bet kurio iš jų, įgyvendinimą.

Taigi, D. A. Pospelovo pasiūlyta atpažinimo metodų klasifikacija remiasi pagrindiniais modeliais, kuriais grindžiamas žmogaus pažinimo būdas apskritai, todėl jis yra visiškai ypatingas (privilegijuotas) lyginant su kitomis klasifikacijomis, kurios šiame fone atrodo lengvesnės ir lengvesnės. dirbtinis.

Intensyvūs metodai

Išskirtinis intencionalinių metodų bruožas yra tai, kad konstruojant ir taikant modelio atpažinimo algoritmus jie naudoja įvairias požymių charakteristikas ir jų ryšius kaip operacijų elementus. Tokie elementai gali būti atskiros reikšmės arba ypatybių reikšmių intervalai, vidutinės reikšmės ir dispersijos, savybių ryšio matricos ir kt., su kuriomis atliekami veiksmai, išreikšti analitine ar konstruktyvia forma. Tuo pačiu metu objektai šiuose metoduose nėra laikomi vientisais informacijos vienetais, o veikia kaip rodikliai vertinant jų atributų sąveiką ir elgesį.

Intensyviųjų modelių atpažinimo metodų grupė yra plati, o jos skirstymas į poklasius tam tikru mastu yra sąlyginis.

Metodai, pagrįsti bruožų reikšmių pasiskirstymo tankių įverčiais

Šie modelių atpažinimo metodai yra pasiskolinti iš klasikinės statistinių sprendimų teorijos, kurioje tiriamieji objektai laikomi daugiamačio atsitiktinio dydžio, pasiskirstyto požymių erdvėje pagal tam tikrą dėsnį, realizacijomis. Jie yra pagrįsti Bajeso sprendimų priėmimo schema, kuri apeliuoja į a priori objektų, priklausančių tam tikrai atpažįstamai klasei, tikimybę ir sąlyginį ypatybių vektorių reikšmių pasiskirstymo tankį. Šie metodai apsiriboja tikimybės santykio nustatymu įvairiose daugiamatės objektų erdvės srityse.

Metodų grupė, pagrįsta požymių reikšmių pasiskirstymo tankių įvertinimu, yra tiesiogiai susijusi su diskriminacinės analizės metodais. Bajeso požiūris į sprendimų priėmimą yra vienas iš labiausiai išplėtotų vadinamųjų parametrinių metodų šiuolaikinėje statistikoje, kuriam pasiskirstymo dėsnio (šiuo atveju normalaus dėsnio) analitinė išraiška laikoma žinoma ir tik nedidelis parametrų skaičius ( reikia įvertinti vidutinių verčių vektorius ir kovariacijos matricas).

Pagrindiniai sunkumai naudojant šiuos metodus yra būtinybė prisiminti visą mokymo imtį, kad būtų galima apskaičiuoti vietinio tikimybių pasiskirstymo tankio įverčius ir didelį jautrumą mokymo imties nereprezentatyvumui.

Metodai, pagrįsti prielaidomis apie sprendimo funkcijų klasę

Šioje metodų grupėje bendra sprendimo funkcijos forma laikoma žinoma ir nurodoma jos kokybės funkcionalumas. Remiantis šia funkcija, geriausias sprendimo funkcijos aproksimavimas randamas naudojant mokymo seką. Labiausiai paplitę yra sprendimų funkcijų atvaizdavimas tiesinių ir apibendrintų netiesinių daugianarių pavidalu. Sprendimo taisyklės kokybės funkcija paprastai siejama su klasifikavimo klaida.

Pagrindinis metodų, pagrįstų prielaidomis apie sprendimo funkcijų klasę, privalumas yra atpažinimo problemos, kaip ekstremumo paieškos problemos, matematinės formuluotės aiškumas. Šios grupės metodų įvairovė paaiškinama plačiu sprendimų taisyklių kokybės funkcinių ir naudojamų ekstremalių paieškos algoritmų spektru. Nagrinėjamų algoritmų, kurie visų pirma apima Niutono algoritmą, perceptrono tipo algoritmus ir kt., apibendrinimas yra stochastinės aproksimacijos metodas.

Gradiento ekstremumo paieškos algoritmų galimybės, ypač linijinių sprendimų taisyklių grupėje, buvo gana gerai ištirtos. Šių algoritmų konvergencija įrodyta tik tuo atveju, kai atpažintų objektų klasės objektų erdvėje atvaizduojamos kompaktiškomis geometrinėmis struktūromis.

Pakankamai aukštą sprendimo taisyklės kokybę galima pasiekti naudojant algoritmus, kurie neturi griežto matematinio sprendimo konvergencijos į globalų ekstremumą įrodymo. Tokie algoritmai apima didelę euristinio programavimo procedūrų grupę, kuri atspindi evoliucinio modeliavimo kryptį. Evoliucinis modeliavimas yra bioninis metodas, pasiskolintas iš gamtos. Jis pagrįstas žinomų evoliucijos mechanizmų naudojimu, siekiant pakeisti sudėtingo objekto prasmingo modeliavimo procesą fenomenologiniu jo evoliucijos modeliavimu. Gerai žinomas modelių atpažinimo evoliucinio modeliavimo atstovas yra argumentų grupinės apskaitos (MGUA) metodas. GMDH pagrindas yra saviorganizacijos principas, o GMDH algoritmai atkuria masės atrankos schemą.

Tačiau praktinių tikslų pasiekimas šiuo atveju nėra lydimas naujų žinių apie atpažįstamų objektų prigimtį gavimo. Galimybę išgauti šias žinias, ypač žinias apie atributų (požymių) sąveikos mechanizmus, čia iš esmės riboja pateikta tokios sąveikos struktūra, fiksuota pasirinktoje sprendimo funkcijų formoje.

Būlio metodai

Loginiai modelio atpažinimo metodai yra pagrįsti loginės algebros aparatu ir leidžia operuoti su informacija, esančia ne tik atskiruose požymiuose, bet ir ypatybių reikšmių deriniuose. Taikant šiuos metodus, bet kurio atributo reikšmės laikomos elementariais įvykiais.

Bendriausia forma loginius metodus galima apibūdinti kaip paieškos tipą per mokomąjį loginių šablonų pavyzdį ir tam tikros loginių sprendimų taisyklių sistemos formavimą (pavyzdžiui, elementarių įvykių jungčių pavidalu), kiekvienas iš kuris turi savo svorį. Loginių metodų grupė yra įvairi ir apima įvairaus sudėtingumo ir analizės gilumo metodus. Dichotominėms (Bulio) ypatybėms populiarūs vadinamieji medžių klasifikatoriai, aklavietės bandymo metodas, „žievės“ algoritmas ir kt.

„Kora“ algoritmas, kaip ir kiti loginiai modelio atpažinimo metodai, yra gana daug skaičiavimo reikalaujantis, nes pasirenkant jungtis reikia atlikti pilną paiešką. Todėl naudojant loginius metodus keliami aukšti reikalavimai efektyviam skaičiavimo proceso organizavimui, o šie metodai puikiai veikia esant santykinai nedideliems funkcijų erdvės matmenims ir tik galinguose kompiuteriuose.

Kalbiniai (struktūriniai) metodai

Lingvistiniai modelio atpažinimo metodai yra pagrįsti specialių gramatikų, kurios generuoja kalbas, kurios gali būti naudojamos atpažintų objektų savybių rinkiniui apibūdinti, naudojimu.

Įvairių klasių objektams nustatomi neišvestiniai (atominiai) elementai (pavaizdžiai, atributai) ir galimi ryšiai tarp jų. Gramatika reiškia objektų konstravimo iš šių neišvestinių elementų taisykles.

Taigi kiekvienas objektas yra neišvestinių elementų rinkinys, vienaip ar kitaip „sujungtas“ vienas su kitu arba, kitaip tariant, kokios nors „kalbos“ „sakiniu“. Norėčiau ypač pabrėžti labai reikšmingą idėjinę šios minties vertę.

Sintaksiškai analizuojant „sakinį“ nustatomas jo sintaksinis „teisingumas“ arba, lygiaverčiai, ar kokia nors fiksuota klasę apibūdinanti gramatika gali sukurti esamą objekto aprašymą.

Tačiau užduotis rekonstruoti (apibūdinti) gramatikas iš tam tikro teiginių (sakinių – objektų aprašymų), generuojančių duotą kalbą, yra sunkiai formalizuojama.

Išplėtimo metodai

Šios grupės metodais, priešingai nei intensyvios krypties, kiekvienam tiriamam objektui didesniu ar mažesniu mastu suteikiama nepriklausoma diagnostinė reikšmė. Iš esmės šie metodai yra artimi klinikiniam požiūriui, kai žmonės vertinami ne kaip objektų, surūšiuotų pagal vieną ar kitą rodiklį, grandine, o kaip vientisomis sistemomis, kurių kiekviena yra individuali ir turi ypatingą diagnostinę vertę. Toks kruopštus požiūris į tiriamus objektus neleidžia atmesti ar prarasti informacijos apie kiekvieną atskirą objektą, o tai atsitinka naudojant intensyvios krypties metodus, kurie naudoja objektus tik jų atributų elgesio modeliams aptikti ir fiksuoti.

Pagrindinės modelių atpažinimo operacijos taikant aptartus metodus yra objektų panašumų ir skirtumų nustatymo operacijos. Objektai, esantys nurodytoje metodų grupėje, atlieka diagnostikos precedentų vaidmenį. Be to, priklausomai nuo konkrečios užduoties sąlygų, individualaus precedento vaidmuo gali skirtis plačiausiose ribose: nuo pagrindinio ir lemiančio iki labai netiesioginio dalyvavimo pripažinimo procese. Savo ruožtu dėl problemos sąlygų sėkmingam sprendimui gali prireikti skirtingo diagnostinių precedentų skaičiaus: nuo vieno kiekvienoje pripažintoje klasėje iki visos imties dydžio, taip pat skirtingų objektų panašumo ir skirtumo matavimo metodų. . Šie reikalavimai paaiškina tolesnį išplėstinių metodų skirstymą į poklasius.

Palyginimo su prototipu metodas

Tai paprasčiausias išplėstinio atpažinimo būdas. Jis naudojamas, pavyzdžiui, tuo atveju, kai atpažintos klasės objektų erdvėje atvaizduojamos kompaktiškomis geometrinėmis grupėmis. Šiuo atveju paprastai prototipo tašku pasirenkamas klasės geometrinės grupavimo centras (arba arčiausiai centro esantis objektas).

Norint klasifikuoti nežinomą objektą, randamas artimiausias prototipas ir objektas priklauso tai pačiai klasei kaip ir šis prototipas. Akivaizdu, kad naudojant šį metodą negeneruojami apibendrinti klasės vaizdai.

Įvairūs atstumai gali būti naudojami kaip artumo matas. Dažnai dichotominiams požymiams naudojamas Hamingo atstumas, kuris šiuo atveju yra lygus Euklido atstumo kvadratui. Šiuo atveju objektų klasifikavimo sprendimo taisyklė yra lygiavertė tiesinio sprendimo funkcijai.

Į šį faktą reikėtų ypač atkreipti dėmesį. Tai aiškiai parodo ryšį tarp prototipo ir informacijos apie duomenų struktūrą atributo vaizdavimo. Pavyzdžiui, naudojant aukščiau pateiktą vaizdą, bet kurią tradicinę matavimo skalę, kuri yra tiesinė dichotominių charakteristikų reikšmių funkcija, galima laikyti hipotetiniu diagnostikos prototipu. Savo ruožtu, jei pripažintų klasių erdvinės struktūros analizė leidžia padaryti išvadą apie jų geometrinį kompaktiškumą, pakanka kiekvieną iš šių klasių pakeisti vienu prototipu, kuris iš tikrųjų yra lygiavertis tiesiniam diagnostikos modeliui.

Praktikoje, žinoma, situacija dažnai skiriasi nuo aprašyto idealizuoto pavyzdžio. Tyrėjas, ketinantis taikyti atpažinimo metodą, pagrįstą palyginimu su prototipų diagnostikos klasėmis, susiduria su sudėtingomis problemomis.

Pirma, tai yra artumo matavimo (metrikos) pasirinkimas, kuris gali žymiai pakeisti objektų pasiskirstymo erdvinę konfigūraciją. Antra, savarankiška problema yra daugiamačių eksperimentinių duomenų struktūrų analizė. Abi šios problemos ypač aktualios tyrėjui esant didelėms ypatybių erdvės matmenims, būdingoms tikroms problemoms.

k artimiausių kaimynų metodas

K-arčiausio kaimyno metodas diskriminacinės analizės problemoms spręsti pirmą kartą buvo pasiūlytas dar 1952 m. Tai yra taip.

Klasifikuojant nežinomą objektą, kitų objektų (artimiausių kaimynų), turinčių jau žinomą priklausymą pripažintoms klasėms, požymių erdvėje randamas tam tikras skaičius (k) geometriškai artimiausio jam. Sprendimas priskirti nežinomą objektą tam tikrai diagnostikos klasei priimamas analizuojant informaciją apie šį žinomą artimiausių kaimynų priklausomybę, pavyzdžiui, naudojant paprastą balsų skaičiavimą.

Iš pradžių k-arčiausių kaimynų metodas buvo laikomas neparametriniu tikimybių santykio įvertinimo metodu. Taikant šį metodą, buvo gauti teoriniai jo efektyvumo įverčiai, palyginti su optimaliu Bajeso klasifikatoriumi. Įrodyta, kad k-arčiausių kaimynų metodo asimptotinės paklaidos tikimybės ne daugiau kaip du kartus viršija Bajeso taisyklės paklaidas.

Naudodamas k-arčiausių kaimynų metodą modelio atpažinimui, tyrėjas turi išspręsti sudėtingą metrikos parinkimo diagnozuotų objektų artumui nustatyti problemą. Ši problema esant dideliam objektų erdvės matmeniui labai apsunkina dėl šio metodo pakankamo sudėtingumo, kuris tampa reikšmingas net ir didelio našumo kompiuteriams. Todėl čia, kaip ir palyginimo su prototipu metodu, būtina išspręsti kūrybinę eksperimentinių duomenų daugiamatės struktūros analizės problemą, kad būtų sumažintas diagnostines klases reprezentuojančių objektų skaičius.

Poreikis sumažinti objektų skaičių mokomojoje imtyje (diagnostikos precedentai) yra šio metodo trūkumas, nes sumažina mokymo imties reprezentatyvumą.

Reitingų skaičiavimo („balsavimo“) algoritmai

Vertinimo skaičiavimo algoritmų (ABO) veikimo principas yra skaičiuoti prioritetus (panašumo balus), apibūdinančius atpažintų ir atskaitos objektų „artimumą“ pagal savybių ansamblių sistemą, kuri yra tam tikro savybių rinkinio poaibių sistema. .

Skirtingai nuo visų anksčiau aptartų metodų, įverčių skaičiavimo algoritmai su objektų aprašymais veikia iš esmės nauju būdu. Šiems algoritmams objektai vienu metu egzistuoja labai skirtingose ypatybių erdvės poerdėse. ABO klasė perkelia idėją naudoti ypatybes iki logiškos išvados: kadangi ne visada žinoma, kurios požymių kombinacijos yra informatyviausios, tai ABO objektų panašumo laipsnis apskaičiuojamas lyginant visus galimus ar konkrečius derinius. požymius, įtrauktus į objektų aprašymus.

Naudojamus ypatybių (poerdvių) derinius autoriai vadina paramos rinkiniais arba dalinių objektų aprašymų rinkiniais. Supažindinama su apibendrinto artumo tarp atpažinto objekto ir mokomojo pavyzdžio objektų (su žinoma klasifikacija), kurie vadinami atskaitos objektais, samprata. Šis artumas parodomas atpažinto objekto artumo su atskaitos objektais deriniu, apskaičiuotu pagal dalinių aprašymų rinkinius. Taigi, ABO yra k-arčiausių kaimynų metodo, kuriame objektų artumas atsižvelgiama tik į vieną duotąją ypatybių erdvę, išplėtimas.

Kitas ABO išplėtimas yra tas, kad šiuose algoritmuose objektų panašumo ir skirtumo nustatymo užduotis suformuluota kaip parametrinė ir paryškinamas ABO nustatymo etapas pagal mokymo rinkinį, kuriame įvestos optimalios vertės. parametrai pasirenkami. Kokybės kriterijus yra atpažinimo klaida, o pažodžiui viskas yra parametrizuota:

objektų artumo skaičiavimo taisyklės pagal individualias savybes;
objektų artumo objektų poerdėse skaičiavimo taisyklės;
konkretaus pamatinio objekto, kaip diagnostinio precedento, svarbos laipsnį;
kiekvienos pamatinių požymių rinkinio indėlio į galutinį atpažinto objekto panašumo į bet kurią diagnostinę klasę įvertinimą.

ABO parametrai nurodomi kaip slenkstinės vertės ir (arba) kaip nurodytų komponentų svoris.

Teorinės AVO galimybės yra bent jau ne mažesnės nei bet kurio kito modelio atpažinimo algoritmo, nes AVO pagalba galima įgyvendinti visas įmanomas operacijas su tiriamais objektais.

Tačiau, kaip dažniausiai būna, potencialių galimybių išplėtimas susiduria su dideliais sunkumais juos praktiškai įgyvendinant, ypač tokio tipo algoritmų konstravimo (derinimo) stadijoje.

Kai kurie sunkumai buvo pastebėti anksčiau, aptariant k-artimiausių kaimynų metodą, kuris gali būti interpretuojamas kaip sutrumpinta ABO versija. Jis taip pat gali būti svarstomas parametrine forma ir sumažinamas iki pasirinkto tipo svertinės metrikos radimo. Tuo pačiu, jau čia, didelėms problemoms spręsti, iškyla sudėtingi teoriniai klausimai ir problemos, susijusios su efektyvaus skaičiavimo proceso organizavimu.

AVO atveju, jei bandote išnaudoti šių algoritmų galimybes iki galo, šie sunkumai išaugs daug kartų.

Pažymėtos problemos paaiškina, kad praktikoje ABO naudojimas sprendžiant didelės apimties problemas yra susijęs su kai kurių euristinių apribojimų ir prielaidų įvedimu. Visų pirma, yra žinomas ABO naudojimo psichodiagnostikoje pavyzdys, kai buvo išbandytas ABO tipas, kuris iš tikrųjų yra lygiavertis k-artimiausių kaimynų metodui.

Sprendimų taisyklės kolektyvai

Norėdami užbaigti modelio atpažinimo metodų apžvalgą, sutelksime dėmesį į dar vieną metodą. Tai yra vadinamieji sprendimų taisyklių kolektyvai (DRR).

Kadangi skirtingi atpažinimo algoritmai toje pačioje objektų pavyzdyje pasireiškia skirtingai, natūraliai kyla klausimas dėl sintetinės sprendimo taisyklės, kuri adaptyviai naudoja šių algoritmų stipriąsias puses. Sintetinio sprendimo taisyklė naudoja dviejų lygių atpažinimo schemą. Pirmajame lygyje veikia privatūs atpažinimo algoritmai, kurių rezultatai sujungiami antrame lygyje sintezės bloke. Dažniausiai pasitaikantys tokio unifikavimo metodai yra pagrįsti konkretaus algoritmo kompetencijos sričių nustatymu. Paprasčiausias būdas rasti kompetencijos sritis yra a priori padalinti atributų erdvę remiantis profesiniais konkretaus mokslo sumetimais (pavyzdžiui, suskirstyti imtį pagal tam tikrą požymį). Tada kiekvienai pasirinktai sričiai sukuriamas atskiras atpažinimo algoritmas. Kitas metodas yra pagrįstas formalios analizės naudojimu, siekiant nustatyti vietines objektų erdvės sritis kaip atpažintų objektų apylinkes, kurioms buvo įrodyta bet kurio konkretaus atpažinimo algoritmo sėkmė.

Bendriausias požiūris į sintezės bloko konstravimą laikomi tam tikrų algoritmų rodikliais kaip pradinėmis charakteristikomis kuriant naują apibendrintą sprendimo taisyklę. Šiuo atveju galima naudoti visus aukščiau išvardintus įtempimo ir išplėtimo krypčių modelio atpažinimo metodus. Veiksmingi sprendimo taisyklių rinkinio sukūrimo problemai išspręsti yra „Kora“ tipo loginiai algoritmai ir įverčių skaičiavimo (ABO) algoritmai, kurie sudaro vadinamojo algebrinio metodo, kuriame pateikiamas tyrimas ir konstruktyvus aprašymas. atpažinimo algoritmai, kurių rėmuose telpa visi esami algoritmų tipai.

Modelių atpažinimo metodų lyginamoji analizė

Palyginkime aukščiau aprašytus modelių atpažinimo būdus ir įvertinkime jų tinkamumo laipsnį 3.3.3 skirsnyje suformuluotiems reikalavimams, taikomiems sudėtingų sistemų adaptyvių automatizuotų valdymo sistemų SDA modeliams.

Sprendžiant realias problemas iš intencionalinės krypties metodų grupės, praktinę reikšmę turi parametriniai metodai ir metodai, pagrįsti pasiūlymais apie sprendimo funkcijų formą. Parametriniai metodai sudaro tradicinės rodiklių konstravimo metodikos pagrindą. Šių metodų taikymas realiose problemose yra susijęs su stiprių duomenų struktūros apribojimų taikymu, dėl kurio sukuriami tiesiniai diagnostikos modeliai su labai apytiksliais jų parametrų įverčiais. Taikant metodus, pagrįstus prielaidomis apie sprendimo funkcijų formą, tyrėjas taip pat yra priverstas atsigręžti į tiesinius modelius. Taip yra dėl didelio ypatybių erdvės matmens, būdingo tikroms problemoms, o tai, didėjant daugianario sprendimo funkcijos laipsniui, labai padidina jos narių skaičių ir kartu problemiškai pakyla atpažinimo kokybė. Taigi, projektuojant potencialaus intensyvaus atpažinimo metodų taikymo sritį į realias problemas, gauname vaizdą, atitinkantį gerai išvystytą tradicinę linijinės diagnostikos modelių metodiką.

Linijinių diagnostinių modelių, kuriuose diagnostinis rodiklis atvaizduojamas svertine pradinių charakteristikų suma, savybės buvo gerai ištirtos. Šių modelių rezultatai (su atitinkamu normalizavimu) interpretuojami kaip atstumai nuo tiriamų objektų iki tam tikros hiperplokštumos objektų erdvėje arba, lygiaverčiai, kaip objektų projekcijos į kokią nors tiesią liniją šioje erdvėje. Todėl linijiniai modeliai yra tinkami tik paprastoms geometrinėms objektų erdvės sričių konfigūracijoms, į kurias atvaizduojami skirtingų diagnostinių klasių objektai. Su sudėtingesniu paskirstymu šie modeliai iš esmės negali atspindėti daugelio eksperimentinių duomenų struktūros ypatybių. Tuo pačiu metu tokios funkcijos gali suteikti vertingos diagnostinės informacijos.

Tuo pačiu metu paprastų daugiamačių struktūrų (ypač daugiamačių normaliųjų skirstinių) atsiradimas bet kurioje tikroje problemoje turėtų būti laikomas išimtimi, o ne taisykle. Diagnostinės klasės dažnai formuojamos remiantis sudėtingais išoriniais kriterijais, o tai automatiškai lemia šių klasių geometrinį nevienalytiškumą objektų erdvėje. Tai ypač pasakytina apie „gyvybiškai svarbius“ kriterijus, su kuriais dažniausiai susiduriama praktikoje. Esant tokioms sąlygoms, linijinių modelių naudojimas užfiksuoja tik „grubiausius“ eksperimentinės informacijos modelius.

Išplėstinių metodų naudojimas nėra susijęs su prielaidomis apie eksperimentinės informacijos struktūrą, išskyrus tai, kad atpažįstamose klasėse turėtų būti viena ar kelios šiek tiek panašių objektų grupės, o skirtingų klasių objektai turėtų šiek tiek skirtis vienas nuo kito. Akivaizdu, kad bet kokiam baigtiniam mokymo imties dydžiui (ir negali būti jokio kito), šis reikalavimas visada tenkinamas vien dėl to, kad tarp objektų yra atsitiktinių skirtumų. Kaip panašumo matai naudojami įvairūs objektų artumo (atstumo) matai požymio erdvėje. Todėl efektyvus išplėtimo modelio atpažinimo metodų panaudojimas priklauso nuo to, kaip tiksliai nustatomos nurodytos artumo priemonės, taip pat nuo to, kurie mokomosios imties objektai (objektai su žinoma klasifikacija) yra diagnostiniai precedentai. Sėkmingas šių problemų sprendimas duoda rezultatų, artėjančių prie teoriškai pasiekiamų atpažinimo efektyvumo ribų.

Išplėstinių modelių atpažinimo metodų pranašumus pirmiausia atsveria didelis techninis jų praktinio įgyvendinimo sudėtingumas. Didelių matmenų objektų erdvėms iš pažiūros paprasta užduotis surasti artimiausių taškų poras tampa rimta problema. Be to, daugelis autorių kaip problemą pažymi poreikį atsiminti pakankamai daug objektų, atstovaujančių pripažintoms klasėms.

Tai savaime nėra problema, tačiau ji suvokiama kaip problema (pavyzdžiui, taikant k-artimiausių kaimynų metodą) dėl to, kad atpažįstant kiekvieną objektą, įvyksta pilna visų mokymo rinkinio objektų paieška.

Todėl patartina taikyti atpažinimo sistemos modelį, kuriame pašalinama visiško objektų surašymo pratybų pavyzdyje problema atpažinimo metu, nes generuojant apibendrintus atpažinimo klasių vaizdus, tai atliekama tik vieną kartą. Pačio atpažinimo metu identifikuotas objektas lyginamas tik su apibendrintais atpažinimo klasių vaizdais, kurių skaičius yra fiksuotas ir visiškai nepriklausomas nuo mokomosios imties dydžio. Šis metodas leidžia padidinti mokomosios imties dydį, kol bus pasiekta reikiama aukšta apibendrintų vaizdų kokybė, nesibaiminant, kad dėl to gali nepriimtinai pailgėti atpažinimo laikas (nes atpažinimo laikas šiame modelyje nepriklauso nuo mokymo imties dydis).

Teorinės išplėstinio atpažinimo metodų naudojimo problemos siejamos su informacinių požymių grupių paieškos, optimalių objektų panašumų ir skirtumų matavimo metrikų radimo bei eksperimentinės informacijos struktūros analizės problemomis. Kartu sėkmingas šių problemų sprendimas leidžia ne tik sukonstruoti efektyvius atpažinimo algoritmus, bet ir pereiti nuo išplėstinių empirinių faktų žinojimo prie intencionalių žinių apie jų struktūros modelius.

Perėjimas nuo išplėstinių prie intencionalių žinių įvyksta tada, kai jau yra sukurtas formalus atpažinimo algoritmas ir įrodytas jo efektyvumas. Tada tiriami mechanizmai, kuriais pasiekiamas gaunamas efektyvumas. Toks tyrimas, siejamas su geometrinės duomenų struktūros analize, gali, pavyzdžiui, leisti daryti išvadą, kad pakanka tam tikrą diagnostinę klasę reprezentuojančius objektus pakeisti vienu tipišku atstovu (prototipu). Tai atitinka tradicinės tiesinės diagnostikos skalės nustatymą, kaip minėta aukščiau. Taip pat gali būti, kad užtenka kiekvieną diagnostinę klasę pakeisti keliais objektais, konceptualizuotais kaip tipiniai kai kurių poklasių atstovai, o tai prilygsta tiesinių mastelių ventiliatoriaus konstravimui. Yra ir kitų variantų, kurie bus aptarti toliau.

Taigi, atpažinimo metodų apžvalga rodo, kad dabar teoriškai sukurta nemažai skirtingų modelių atpažinimo metodų. Literatūroje pateikiama išsami jų klasifikacija. Tačiau daugumai šių metodų nėra programinės įrangos įdiegimo, ir tai yra labai natūralu, netgi galima sakyti, „nulemta“ pačių atpažinimo metodų savybių. Tai galima spręsti iš to, kad tokios sistemos retai minimos specializuotoje literatūroje ir kituose informacijos šaltiniuose.

Vadinasi, klausimas dėl tam tikrų teorinių atpažinimo metodų praktinio pritaikymo sprendžiant praktines problemas su realiais (t.y. gana reikšmingais) duomenų matmenimis ir realiuose šiuolaikiniuose kompiuteriuose lieka nepakankamai išplėtotas.

Aukščiau minėtą aplinkybę galima suprasti, jei prisiminsime, kad matematinio modelio sudėtingumas eksponentiškai padidina sistemos programinio diegimo sudėtingumą ir tuo pačiu sumažina tikimybę, kad ši sistema praktiškai veiks. Tai reiškia, kad realiai rinkoje gali būti įdiegtos tik gana paprastais ir „skaidriais“ matematiniais modeliais pagrįstos programinės įrangos sistemos. Todėl kūrėjas, suinteresuotas atkartoti savo programinės įrangos produktą, matematinio modelio pasirinkimo klausimą sprendžia ne grynai moksliniu požiūriu, o kaip pragmatikas, atsižvelgdamas į programinės įrangos diegimo galimybes. Jis mano, kad modelis turi būti kuo paprastesnis, vadinasi, diegiamas mažesnėmis sąnaudomis ir kokybiškiau, be to, turi veikti (būti praktiškai efektyvus).

Šiuo atžvilgiu ypač aktualus atrodo uždavinys atpažinimo sistemose įdiegti tai pačiai klasei priklausančių objektų aprašymų apibendrinimo mechanizmą, t.y. kompaktiškų apibendrintų vaizdų formavimo mechanizmas. Akivaizdu, kad toks apibendrinimo mechanizmas leis „suspausti“ bet kokio matmens mokymo pavyzdį į apibendrintų vaizdų, iš anksto žinomų pagal matmenis, duomenų bazę. Tai taip pat leis kelti ir išspręsti daugybę problemų, kurių net neįmanoma suformuluoti tokiuose atpažinimo metoduose kaip palyginimo su prototipu metodas, k-artimiausių kaimynų metodas ir ABO.

Tai yra užduotys:

ypatybių informacinio indėlio į apibendrinto vaizdo informacinį portretą nustatymas;
Klasterinė apibendrintų vaizdų analizė;
ypatybės semantinės apkrovos nustatymas;
semantinė klasterinė-konstruktyvi požymių analizė;
prasmingas apibendrintų klasių vaizdų tarpusavyje ir charakteristikų palyginimas (kognityvinės diagramos, įskaitant Merlin diagramas).

Metodas, kuris leido išspręsti šias problemas, taip pat išskiria ja pagrįstą perspektyvią sistemą iš kitų sistemų, kaip ir kompiliatoriai skiriasi nuo interpretatorių, nes dėl apibendrintų vaizdų formavimo šioje perspektyvioje sistemoje atpažinimo laikas nepriklauso nuo kitų sistemų. pasiekiamas mokomosios imties dydis. Yra žinoma, kad būtent šios priklausomybės buvimas lemia praktiškai nepriimtinas kompiuterinio laiko sąnaudas atpažinimui naudojant tokius metodus kaip k-artimiausių kaimynų metodas, ABO ir KRP, esant tokiems mokymo imties matmenims, kai galime kalbėti apie pakankamą statistiką. .

Baigdami trumpą atpažinimo metodų apžvalgą, pateiksime aukščiau paminėtų dalykų esmę suvestinėje lentelėje (3.1 lentelė), kurioje trumpai aprašomi įvairūs modelio atpažinimo metodai pagal šiuos parametrus:

atpažinimo metodų klasifikacija;
atpažinimo metodų taikymo sritys;
atpažinimo metodų apribojimų klasifikacija.

Atpažinimo metodų klasifikacija		Taikymo sritis	Apribojimai (trūkumai)
Intensyvūs atpažinimo metodai	Metodai, pagrįsti bruožų reikšmių (arba objektų panašumų ir skirtumų) pasiskirstymo tankio įvertinimu	Žinomo pasiskirstymo problemos, paprastai normalios, reikalauja didelio statistikos rinkinio	Poreikis surašyti visą mokymo pavyzdį atpažinimo metu, didelis jautrumas mokymo pavyzdžio nereprezentatyvumui ir artefaktams
	Metodai, pagrįsti prielaidomis apie sprendimo funkcijų klasę	Klasės turi būti gerai atskiriamos, požymių sistema turi būti ortonormali	Sprendimo funkcijos tipas turi būti žinomas iš anksto. Nesugebėjimas atsižvelgti į naujas žinias apie bruožų sąsajas
	Būlio metodai		Renkantis loginio sprendimo taisykles (jungtukus), būtina pilna paieška. Didelis skaičiavimo sudėtingumas
	Kalbiniai (struktūriniai) metodai	Mažo objekto erdvės matmenų problemos	Užduotis rekonstruoti (apibūdinti) gramatiką iš tam tikro teiginių (objektų aprašymų) rinkinio yra sunkiai formalizuojama. Neišspręstos teorinės problemos
Išplėstinio atpažinimo metodai	Palyginimo su prototipu metodas	Mažo objekto erdvės matmenų problemos	Didelė klasifikavimo rezultatų priklausomybė nuo atstumo matavimo (metrikos). Nežinoma optimali metrika
	k artimiausių kaimynų metodas		Didelė klasifikavimo rezultatų priklausomybė nuo atstumo matavimo (metrikos). Pripažinimo metu reikia išsamiai surašyti mokymo pavyzdį. Skaičiavimo pastangos
	AVO reitingų (balsavimo) skaičiavimo algoritmai	Mažo matmens problemos klasių ir savybių atžvilgiu	Klasifikavimo rezultatų priklausomybė nuo atstumo matavimo (metrikos). Pripažinimo metu reikia išsamiai surašyti mokymo pavyzdį. Didelis techninis metodo sudėtingumas
	Sprendimų taisyklių kolektyvai (DRC)	Mažo matmens problemos klasių ir savybių atžvilgiu	Labai didelis metodo techninis sudėtingumas, neišspręstas teorinių problemų skaičius tiek nustatant privačių metodų kompetencijos sritis, tiek pačiuose privačiuose metoduose

3.1 lentelė. Suvestinė atpažinimo metodų klasifikavimo lentelė, jų taikymo sričių ir apribojimų palyginimas

Modelių atpažinimo vaidmuo ir vieta sudėtingų sistemų valdymo automatizavime

Automatizuota valdymo sistema susideda iš dviejų pagrindinių dalių: valdymo objekto ir valdymo sistemos.

Valdymo sistema atlieka šias funkcijas:

valdymo objekto būklės identifikavimas;
valdymo veiksmo kūrimas remiantis valdymo tikslais, atsižvelgiant į valdymo objekto ir aplinkos būklę;
suteikdamas valdymo įtaką valdymo objektui.

Modelio atpažinimas yra ne kas kita, kaip kokio nors objekto būsenos nustatymas.

Vadinasi, galimybė naudoti modelio atpažinimo sistemą valdymo objekto būsenos nustatymo etape atrodo gana akivaizdi ir natūrali. Tačiau tai gali būti nereikalinga. Todėl kyla klausimas, kokiais atvejais atpažinimo sistemą patartina naudoti automatizuotoje valdymo sistemoje, o kokiais – ne.

Literatūros duomenimis, daugelis anksčiau sukurtų ir modernių automatizuotų valdymo sistemų valdymo objekto būklei nustatyti ir valdymo veiksmams kurti naudoja deterministinius matematinius „tiesioginio skaičiavimo“ modelius, kurie vienareikšmiškai ir gana paprastai nustato, ką daryti su valdikliu. objektą, jei jis turi tam tikrus išorinius parametrus.

Tuo pačiu nekeliamas ir neišspręstas klausimas, kaip šie parametrai yra susiję su tam tikromis valdymo objekto būsenomis. Ši pozicija atitinka požiūrį, kad „pagal nutylėjimą“ jų santykiai vienas su vienu yra priimtini. Todėl sąvokos „valdymo objekto parametrai“ ir „valdymo objekto būsena“ laikomos sinonimais, o sąvoka „valdymo objekto būsena“ apskritai nėra aiškiai įvedama. Tačiau akivaizdu, kad bendruoju atveju ryšys tarp stebimų valdymo objekto parametrų ir jo būsenos yra dinaminio ir tikimybinio pobūdžio.

Taigi tradicinės automatizuotos valdymo sistemos iš esmės yra parametrinės valdymo sistemos, t.y. sistemos, valdančios ne valdymo objekto būsenas, o tik stebimus jo parametrus. Sprendimas dėl valdymo veiksmo tokiose sistemose priimamas tarsi „aklai“, t.y. nesudarant holistinio valdymo objekto ir aplinkos dabartinės būsenos vaizdo, taip pat neprognozuojant aplinkos raidos ir valdymo objekto reakcijos į tam tikrus valdymo poveikius jai, veikiant kartu su numatoma aplinkos įtaka. .

Žvelgiant iš šio darbo perspektyvos, sąvoka „sprendimų priėmimas“ šiuolaikine prasme vargu ar visiškai tinka tradicinėms automatizuotoms valdymo sistemoms. Faktas yra tas, kad „sprendimų priėmimas“ bent jau suponuoja holistinę objekto viziją aplinkoje, ne tik dabartinės būsenos, bet ir dinamikos, o sąveikoje tiek tarpusavyje, tiek su valdymo sistema. svarstyti įvairius alternatyvius visos šios sistemos kūrimo variantus, taip pat susiaurinti šių alternatyvų įvairovę (sumažinimą), remiantis tam tikrais tiksliniais kriterijais. Akivaizdu, kad to nėra tradicinėse automatizuotose valdymo sistemose arba ji egzistuoja, bet supaprastinta forma.

Žinoma, tradicinis metodas yra adekvatus ir jo naudojimas yra gana teisingas ir pagrįstas tais atvejais, kai valdymo objektas tikrai yra stabili ir griežtai nustatyta sistema, o aplinkos įtaka jai gali būti nepaisoma.

Tačiau kitais atvejais šis metodas yra neveiksmingas.

Jei valdymo objektas yra dinamiškas, tai valdymo algoritmais grindžiami modeliai greitai tampa neadekvatūs, nes kinta įvesties ir išvesties parametrų ryšiai bei pati esminių parametrų rinkinys. Iš esmės tai reiškia, kad tradicinės automatizuotos valdymo sistemos yra pajėgios valdyti valdymo objekto būseną tik šalia pusiausvyros taško per silpnus valdymo veiksmus jame, t.y. mažų perturbacijų metodu. Toli nuo pusiausvyros būsenos, tradiciniu požiūriu, valdymo objekto elgesys atrodo nenuspėjamas ir nekontroliuojamas.

Jei nėra vienareikšmio ryšio tarp valdymo objekto įvesties ir išvesties parametrų (t. y. tarp įvesties parametrų ir objekto būsenos), kitaip tariant, jei šis ryšys turi ryškų tikimybinį pobūdį, tada deterministiniai modeliai, kuriuose jis yra Daroma prielaida, kad tam tikro parametro matavimo rezultatas yra tiesiog skaičius, iš pradžių netaikomi. Be to, šio ryšio tipas gali būti tiesiog nežinomas, ir tuomet reikia vadovautis pačia bendriausia prielaida: kad jis yra tikimybinis arba visai nenustatytas.

Tradiciniais principais sukurta automatizuota valdymo sistema gali veikti tik remiantis parametrais, kurių jungčių schemos jau žinomos, ištirtos ir atspindėtos matematiniame modelyje Šiame darbe keliamas uždavinys sukurti tokius automatizuoto projektavimo metodus valdymo sistemos, kurios leis sukurti sistemas, gebančias identifikuoti ir reikšmingiausius parametrus bei nustatyti ryšių tarp jų ir valdymo objekto būsenų pobūdį.

Tokiu atveju būtina naudoti labiau išvystytus matavimo metodus, atitinkančius realią situaciją:

vaizdų klasifikavimas ar atpažinimas (mokymasis pagal mokymo pavyzdį, atpažinimo algoritmų pritaikomumas, tiriamų klasių ir parametrų rinkinių pritaikomumas, reikšmingiausių parametrų parinkimas ir aprašo dimensijos sumažinimas išlaikant duotą pertekliškumą ir kt.);
statistiniai matavimai, kai tam tikro parametro matavimo rezultatas yra ne atskiras skaičius, o tikimybių skirstinys: statistinio kintamojo pokytis reiškia ne jo vertės pasikeitimą savaime, o tikimybių skirstinio charakteristikų pasikeitimą. jos vertybes.

Dėl to automatizuotos valdymo sistemos, pagrįstos tradiciniu deterministiniu požiūriu, praktiškai neveikia su sudėtingais dinaminiais kelių parametrų silpnai apibrėžtais valdymo objektais, tokiais kaip, pavyzdžiui, makro ir mikrosocialinės ekonominės sistemos dinamiškoje pasaulio ekonomikoje. pereinamasis laikotarpis“, hierarchinis elitas ir etninės grupės, visuomenė ir elektoratas, žmogaus fiziologija ir psichika, natūralios ir dirbtinės ekosistemos ir daugelis kitų.

Labai reikšminga, kad devintojo dešimtmečio viduryje I. Prigogine'o mokykla sukūrė požiūrį, pagal kurį bet kurios sistemos (taip pat ir žmonių) raida keičia periodus, per kuriuos sistema elgiasi arba kaip „daugiausia deterministinė“, arba „daugiausia atsitiktinė“. Natūralu, kad tikra valdymo sistema turi stabiliai valdyti valdymo objektą ne tik „deterministinėse“ savo istorijos dalyse, bet ir tais momentais, kai tolesnis jo elgesys tampa labai neapibrėžtas. Jau vien tai reiškia, kad būtina sukurti požiūrį į valdymo sistemas, kurių elgesys turi didelį atsitiktinumo elementą (arba tai, kas šiuo metu matematiškai apibūdinama kaip „atsitiktinumas“).

Todėl perspektyvios automatizuotos valdymo sistemos, užtikrinančios sudėtingų dinaminių kelių parametrų silpnai deterministinių sistemų valdymą, kaip esminės funkcinės jungtys, matyt, apims posistemes, skirtas aplinkos ir valdymo objekto būsenoms nustatyti ir nuspėti, remiantis dirbtinio intelekto metodais (pirmiausia modeliu). atpažinimas), sprendimų priėmimo pagalbos metodai ir informacijos teorija.

Trumpai apsvarstykime vaizdų atpažinimo sistemų panaudojimo priimant sprendimus dėl valdymo veiksmų klausimą (šis klausimas bus išsamiau aptartas vėliau, nes tai yra esminis dalykas šiame darbe). Jei kaip atpažinimo klases imsime taikinį ir kitas valdymo objekto būsenas, o kaip požymius – veiksnius, įtakojančius jį, tai modelio atpažinimo modelyje gali susidaryti veiksnių ir būsenų santykio matas. Tai leidžia tam tikrai valdymo objekto būsenai gauti informaciją apie veiksnius, skatinančius arba trukdančius jo perėjimui į šią būseną, ir tuo remiantis parengti sprendimą dėl valdymo veiksmo.

Veiksnius galima suskirstyti į šias grupes:

charakterizuojant valdymo objekto foną;
apibūdinti esamą valdymo objekto būseną;
aplinkos veiksniai;
technologiniai (valdomi) veiksniai.

Taigi modelio atpažinimo sistemos gali būti naudojamos kaip automatizuotų valdymo sistemų dalis: valdymo objekto būklei nustatyti ir valdymo veiksmams kurti posistemėse.

Tai tinka, kai valdymo objektas yra sudėtinga sistema.

Sprendimo dėl valdymo veiksmo priėmimas automatizuotoje valdymo sistemoje

Šiame darbe nagrinėjamas adaptyvių automatizuotų valdymo sistemų sintezavimo sudėtingomis sistemomis problemos sprendimas, atsižvelgiant į daugybę ir gilių modelių atpažinimo ir sprendimų priėmimo metodų analogijų.

Viena vertus, modelio atpažinimo problema yra priimti sprendimą, ar atpažintas objektas priklauso tam tikrai atpažinimo klasei.

Kita vertus, autoriai siūlo sprendimų priėmimo problemą vertinti kaip atvirkštinio dekodavimo problemą arba atvirkštinio modelio atpažinimo problemą (žr. 2.2.2 skyrių).

Pagrindinių idėjų, kuriomis grindžiami modelių atpažinimo ir sprendimų priėmimo metodai, bendrumas ypač išryškėja nagrinėjant juos informacijos teorijos požiūriu.

Įvairios sprendimų priėmimo problemos

Sprendimų priėmimas kaip tikslo įgyvendinimas

Apibrėžimas: sprendimo priėmimas („pasirinkimas“) – tai veiksmas prieš aibę alternatyvų, dėl kurio susiaurinamas pradinis alternatyvų rinkinys, t.y. įvyksta jo sumažinimas.

Pasirinkimas yra veiksmas, kuris suteikia tikslą visoms veikloms. Būtent pasirinkimo aktais realizuojamas visos veiklos pajungimas konkrečiam tikslui arba tarpusavyje susijusių tikslų rinkiniui.

Taigi, kad pasirinkimo veiksmas taptų įmanomas, būtina:

alternatyvų rinkinio, dėl kurio reikia pasirinkti, sukūrimas arba atradimas;
tikslų, dėl kurių renkamasi, nustatymas;
alternatyvų tarpusavio palyginimo metodo sukūrimas ir taikymas, t.y. Pirmenybės įvertinimas kiekvienai alternatyvai pagal tam tikrus kriterijus, leidžiančius netiesiogiai įvertinti, kaip kiekviena alternatyva atitinka tikslą.

Šiuolaikinis darbas sprendimų palaikymo srityje atskleidė būdingą situaciją, kad visiškas geriausio (tam tikra prasme) sprendimo suradimo formalizavimas įmanomas tik gerai išnagrinėtoms, gana paprastoms problemoms, o praktikoje silpnai struktūrizuotos problemos. dažniau susiduriama, kuriai nėra sukurti visiškai formalizuoti algoritmai (išskyrus išsamią paiešką ir bandymus bei klaidas). Tačiau patyrę, kompetentingi ir pajėgūs specialistai dažnai pasirenka, kas pasirodo visai neblogai. Todėl šiuolaikinė tendencija sprendimų priėmimo natūraliose situacijose praktikoje yra derinti žmogaus gebėjimą spręsti neformalias problemas su formalių metodų ir kompiuterinio modeliavimo galimybėmis: interaktyviomis sprendimų palaikymo sistemomis, ekspertinėmis sistemomis, adaptyviomis žmogaus ir mašinos automatizuoto valdymo sistemomis, neuroniniai tinklai ir pažintinės sistemos.

Sprendimų priėmimas kaip netikrumo pašalinimas (informacinis metodas)

Informacijos gavimo procesas gali būti vertinamas kaip neapibrėžtumo sumažėjimas dėl signalo priėmimo, o informacijos kiekis gali būti laikomas kiekybiniu neapibrėžtumo pašalinimo laipsnio matu.

Bet dėl to, kad iš rinkinio pasirenkamas tam tikras alternatyvų poaibis, t.y. dėl sprendimų priėmimo vyksta tas pats (mažinamas neapibrėžtumas). Tai reiškia, kad kiekvienas pasirinkimas, kiekvienas sprendimas generuoja tam tikrą informacijos kiekį, todėl gali būti apibūdintas informacijos teorija.

Sprendimų priėmimo problemų klasifikacija

Sprendimų priėmimo užduočių įvairovė atsiranda dėl to, kad kiekvienas situacijos, kurioje priimami sprendimai, komponentas gali būti įgyvendintas kokybiškai skirtingais variantais.

Išvardykime tik keletą iš šių parinkčių:

alternatyvų rinkinys, viena vertus, gali būti baigtinis, skaičiuojamas arba tęstinis, kita vertus, uždaras (t. y. visiškai žinomas) arba atviras (įskaitant nežinomus elementus);
alternatyvų vertinimas gali būti atliekamas pagal vieną ar kelis kriterijus, kurie savo ruožtu gali būti kiekybinio arba kokybinio pobūdžio;
Pasirinkimo režimas gali būti vienkartinis (vienkartinis), arba daugkartinis, pasikartojantis, įskaitant grįžtamąjį ryšį apie pasirinkimo rezultatus, t.y. leidžiant apmokyti sprendimų priėmimo algoritmus, atsižvelgiant į ankstesnių rinkimų pasekmes;
kiekvienos alternatyvos pasirinkimo pasekmės gali būti tiksliai žinomos iš anksto (pasirinkimas tikrumo sąlygomis), turi tikimybinį pobūdį, kai žinomos galimų pasekmių tikimybė po pasirinkimo (pasirinkimas rizikos sąlygomis) arba turi dviprasmišką rezultatą su nežinomu tikimybės (pasirinkimas neapibrėžtumo sąlygomis);
atsakomybės už pasirinkimą gali nebūti, ji gali būti individuali arba grupinė;
grupės pasirinkimo tikslų nuoseklumo laipsnis gali skirtis nuo visiško šalių interesų sutapimo (bendradarbiaujantis pasirinkimas) iki jų priešingybės (pasirinkimas konfliktinėje situacijoje). Galimi ir tarpiniai variantai: kompromisas, koalicija, augantis ar blėstantis konfliktas.

Įvairūs šių variantų deriniai sukelia daugybę sprendimų priėmimo problemų, kurios buvo ištirtos skirtingu laipsniu.

Kalbos, skirtos apibūdinti sprendimų priėmimo metodus

Apie vieną ir tą patį reiškinį galima kalbėti skirtingomis kalbomis su skirtingu bendrumo ir adekvatumo laipsniu. Iki šiol atsirado trys pagrindinės kalbos, apibūdinančios pasirinkimą.

Paprasčiausia, labiausiai išvystyta ir populiariausia yra kriterijų kalba.

Kriterijų kalba

Šios kalbos pavadinimas siejamas su pagrindine prielaida, kad kiekviena atskira alternatyva gali būti įvertinta kokiu nors konkrečiu (vienu) skaičiumi, po kurio alternatyvų palyginimas redukuojamas į atitinkamų skaičių palyginimą.

Tegu, pavyzdžiui, (X) yra alternatyvų aibė, o x – kokia nors specifinė alternatyva, priklausanti šiai aibei: x∈X. Tada manoma, kad visiems x galima nurodyti funkciją q(x), kuri vadinama kriterijumi (kokybės kriterijumi, tikslo funkcija, pirmenybės funkcija, naudingumo funkcija ir kt.), kuri turi savybę, kad jei alternatyva x 1 yra pageidautina. iki x 2 (žymimas: x 1 > x 2), tada q(x 1) > q(x 2).

Šiuo atveju pasirenkama surasti alternatyvą, kurios kriterijaus funkcijos vertė yra didžiausia.

Tačiau praktikoje alternatyvų pirmenybės laipsnio palyginimui naudojant tik vieną kriterijų, pasirodo, yra nepagrįstas supaprastinimas, nes detalesnis alternatyvų svarstymas lemia poreikį jas vertinti ne pagal vieną, o pagal daugybę kriterijų, kurie gali būti skirtingo pobūdžio ir kokybiškai skirtis vienas nuo kito.

Pavyzdžiui, renkantis keleiviams priimtiniausią orlaivių tipą ir skrydžių organizavimą tam tikro tipo maršrutuose, lyginimai atliekami vienu metu pagal daugybę kriterijų grupių: techninius, technologinius, ekonominius, socialinius, ergonominius ir kt.

Daugiakriterinės problemos neturi unikalaus bendro sprendimo. Todėl siūloma daug būdų, kaip daugiakriterinei problemai suteikti tam tikrą formą, leidžiančią priimti vieną bendrą sprendimą. Žinoma, šie sprendimai skirtingiems metodams paprastai skiriasi. Todėl bene svarbiausias dalykas sprendžiant daugiakriterinę problemą yra tokio tipo formuluotės pagrindimas.

Norint supaprastinti daugiakriterinio pasirinkimo problemą, naudojamos įvairios parinktys. Išvardinkime kai kuriuos iš jų.

Sąlyginis maksimizavimas (randamas ne integralinio kriterijaus globalinis ekstremumas, o pagrindinio kriterijaus lokalus ekstremumas).
Ieškokite alternatyvos su nurodytomis savybėmis.
Pareto rinkinio radimas.
Kelių kriterijų problemos redukavimas į vieno kriterijų problemą, įvedant integralų kriterijų.

Išsamiau panagrinėkime formalią daugiakriterinės problemos sumažinimo iki vieno kriterijaus metodo formuluotę.

Įveskime integralo kriterijų q 0 (x) kaip vektoriaus argumento skaliarinę funkciją:

q 0 (x) = q 0 ((q 1 (x), q 2 (x), ..., q n (x)).

Integralinis kriterijus leidžia surikiuoti alternatyvas pagal q 0 reikšmę, taip išryškinant geriausias (šio kriterijaus prasme). Funkcijos q 0 formą lemia tai, kaip konkrečiai įsivaizduojame kiekvieno kriterijaus indėlį į integralinį kriterijų. Paprastai naudojamos adityvinės ir dauginamosios funkcijos:

q 0 = ∑a i ⋅q i /s i

1 – q 0 = ∏(1 – b i ⋅q i /s i)

Pateikiu koeficientus:

Skaičiaus a i ⋅q i /s i bedimensiškumas arba vienas matmuo (skirtingi daliniai kriterijai gali turėti skirtingus matmenis, tada su jais negalima atlikti aritmetinių operacijų ir redukuoti į integralų kriterijų).
Normalizavimas, t.y. užtikrinančios sąlygą: b i ⋅q i /s i<1.

Koeficientai a i ir b i atspindi dalinių kriterijų q i santykinį indėlį į integralinį kriterijų.

Taigi, daugiakriterinėje formuluotėje sprendimo dėl vienos iš alternatyvų pasirinkimo problema kyla dėl integralaus kriterijaus maksimizavimo:

x * = arg max(q 0 (q 1 (x), q 2 (x), ..., q n (x)))

Pagrindinė daugiakriterinio sprendimo priėmimo problemos formulavimo problema yra ta, kad būtina rasti tokią analitinę koeficientų a i ir b i formą, kuri suteiktų tokias modelio savybes:

aukšto lygio atitikimas dalykinei sričiai ir ekspertų požiūriui;
minimalūs skaičiavimo sunkumai maksimizuojant integralo kriterijų, t.y. jo apskaičiavimas skirtingoms alternatyvoms;
integralo kriterijaus maksimizavimo rezultatų stabilumas nuo nedidelių pradinių duomenų trikdžių.
Sprendimo stabilumas reiškia, kad nedidelis pradinių duomenų pakeitimas turėtų lemti nedidelį integralo kriterijaus vertės pokytį ir atitinkamai nedidelį priimto sprendimo pasikeitimą. Taigi, jei pradiniai duomenys praktiškai sutampa, tuomet sprendimas turėtų būti toks pat arba labai artimas.

Nuosekliojo dvejetainio pasirinkimo kalba

Dvejetainių santykių kalba yra daugiakriterinės kalbos apibendrinimas ir remiasi atsižvelgimu į tai, kad kai vertiname alternatyvą, šis vertinimas visada yra santykinis, t.y. aiškiai arba dažniau netiesiogiai, kaip palyginimo pagrindas arba atskaitos sistema yra naudojamos kitos tiriamojo rinkinio arba bendros populiacijos alternatyvos. Žmogaus mąstymas paremtas priešybių (konstrukcijų) paieška ir analize, todėl mums visada lengviau pasirinkti vieną iš dviejų priešingų variantų nei vieną variantą iš didelio ir niekaip nesutvarkyto rinkinio.

Taigi pagrindinės šios kalbos prielaidos yra šios:

nevertinama atskira alternatyva, t.y. kriterijaus funkcija neįvesta;
kiekvienai alternatyvų porai galima kokiu nors būdu nustatyti, kad viena iš jų yra geresnė už kitą arba kad jos yra lygiavertės arba nepalyginamos;
pirmenybės santykis bet kurioje alternatyvų poroje nepriklauso nuo likusių pasirinkimui pateiktų alternatyvų.

Dvejetainius ryšius galima nurodyti įvairiais būdais: tiesioginis, matricinis, naudojant pirmenybių grafikus, sekcijos metodą ir kt.

Santykiai tarp vienos poros alternatyvų išreiškiami lygiavertiškumo, tvarkos ir dominavimo sąvokomis.

Apibendrinta pasirinkimo funkcijos kalba

Pasirinkimo funkcijos kalba yra pagrįsta aibių teorija ir leidžia dirbti su atvaizdais iš aibių į jų poaibius, atitinkančius skirtingus pasirinkimus, neišvardijant elementų. Ši kalba yra labai bendra ir gali apibūdinti bet kokį pasirinkimą. Tačiau apibendrintų atrankos funkcijų matematinis aparatas šiuo metu vis dar kuriamas ir išbandomas daugiausia su problemomis, kurios jau buvo išspręstos taikant kriterijų arba dvejetainius metodus.

Grupės pasirinkimas

Tegul atsiranda grupė žmonių, kurie turi teisę dalyvauti priimant kolektyvinius sprendimus. Tarkime, kad ši grupė svarsto tam tikrą alternatyvų rinkinį ir kiekvienas grupės narys pasirenka savo pasirinkimą. Keliamas uždavinys sukurti sprendimą, kuris tam tikru būdu derina individualius pasirinkimus ir tam tikra prasme išreiškia „bendrą grupės nuomonę“, t.y. priimtas kaip grupės pasirinkimas.

Natūralu, kad skirtingi individualių sprendimų derinimo principai atitiks skirtingus grupės sprendimus.

Individualių sprendimų derinimo grupinio pasirinkimo metu taisyklės vadinamos balsavimo taisyklėmis. Labiausiai paplitusi yra „daugumos taisyklė“, kai daugiausiai balsų surinkusi alternatyva priimama kaip grupės sprendimas.

Reikia suprasti, kad toks sprendimas atspindi tik skirtingų požiūrių paplitimą grupėje, o ne tikrai optimalų variantą, už kurį apskritai niekas negali balsuoti. „Balsuojant tiesa nenusprendžiama“.

Be to, yra vadinamųjų „balsavimo paradoksų“, iš kurių garsiausias yra Arrow paradoksas.

Šie paradoksai gali lemti, o kartais ir lemia labai nemalonius balsavimo procedūros bruožus: pavyzdžiui, būna atvejų, kai grupė apskritai negali priimti vieno sprendimo (nėra kvorumo arba kiekvienas balsuoja už savo unikalų variantą ir pan. .), o kartais (balsuojant keliais etapais) mažuma gali primesti savo valią daugumai.

Pasirinkimas neapibrėžtumo sąlygomis

Tikrumas yra ypatingas neapibrėžtumo atvejis, būtent: tai netikrumas, artimas nuliui.

Šiuolaikinėje pasirinkimo teorijoje manoma, kad sprendimų priėmimo problemose yra trys pagrindiniai neapibrėžtumo tipai:

Informacinis (statistinis) įvesties duomenų neapibrėžtis sprendimams priimti.
Sprendimo priėmimo (pasirinkimo) pasekmių neapibrėžtumas.
Sprendimų priėmimo proceso komponentų aprašymo neapibrėžtumas.

Pažvelkime į juos eilės tvarka.

Informacijos (statistinis) neapibrėžtumas šaltinio duomenyse

Duomenys, gauti apie dalykinę sritį, negali būti laikomi visiškai tiksliais. Be to, akivaizdu, kad šie duomenys mus domina ne patys, o tik kaip signalai, galintys nešti tam tikrą informaciją apie tai, kas mus iš tikrųjų domina. Taigi realiau manyti, kad kalbame su duomenimis, kurie yra ne tik triukšmingi ir netikslūs, bet ir netiesioginiai, o gal ir neišsamūs. Be to, šie duomenys liečia ne visą tiriamą populiaciją, o tik tam tikrą jos pogrupį, apie kurį iš tikrųjų galėjome surinkti duomenis, tačiau tuo pačiu norime padaryti išvadas apie visą populiaciją, o taip pat nori sužinoti šių išvadų patikimumo laipsnį.

Esant tokioms sąlygoms, naudojama statistinių sprendimų teorija.

Šioje teorijoje yra du pagrindiniai neapibrėžtumo šaltiniai. Pirma, nežinoma, kokiu paskirstymu vadovaujasi pirminiai duomenys. Antra, nežinoma, kokį pasiskirstymą turi aibė (bendra populiacija), apie kurią norime padaryti išvadas iš jos poaibio, sudarančio pradinius duomenis.

Statistinės procedūros yra sprendimų priėmimo procedūros, kurios pašalina abu šiuos neapibrėžtumo tipus.

Reikėtų pažymėti, kad yra keletas priežasčių, dėl kurių netinkamai taikomi statistiniai metodai:

Statistinės išvados, kaip ir bet kurios kitos, visada turi tam tikrą patikimumą ar pagrįstumą. Tačiau, skirtingai nuo daugelio kitų atvejų, statistinių išvadų patikimumas yra žinomas ir nustatomas atliekant statistinį tyrimą;
taikant statistinę procedūrą gauto sprendimo kokybė priklauso nuo pirminių duomenų kokybės;
duomenys, kurie nėra statistinio pobūdžio, neturėtų būti statistiškai tvarkomi;
turėtų būti naudojamos statistinės procedūros, atitinkančios a priori informacijos apie tiriamą populiaciją lygį (pavyzdžiui, ANOVA metodai neturėtų būti taikomi ne Gauso duomenims). Jei pradinių duomenų pasiskirstymas nežinomas, reikia arba jį nustatyti, arba naudoti kelis skirtingus metodus ir palyginti rezultatus. Jei jos labai skiriasi, tai rodo kai kurių naudojamų procedūrų nepritaikymą.

Pasekmių neapibrėžtumas

Kai vienos ar kitos alternatyvos pasirinkimo pasekmes vienareikšmiškai lemia pati alternatyva, tada negalime atskirti alternatyvos ir jos pasekmių, nes savaime suprantama, kad pasirinkdami alternatyvą, iš tikrųjų renkamės jos pasekmes.

Tačiau realioje praktikoje dažnai tenka susidurti su sudėtingesne situacija, kai vienos ar kitos alternatyvos pasirinkimas nevienareikšmiškai nulemia pasirinkto pasirinkimo pasekmes.

Diskrečios alternatyvų ir jų pasirinktų rezultatų rinkinio atveju, su sąlyga, kad pati galimų rezultatų rinkinys yra bendras visoms alternatyvoms, galime daryti prielaidą, kad skirtingos alternatyvos skiriasi viena nuo kitos rezultatų tikimybių pasiskirstymu. Šie tikimybių pasiskirstymai bendruoju atveju gali priklausyti nuo alternatyvų pasirinkimo rezultatų ir faktinių rezultatų. Paprasčiausiu atveju rezultatai yra vienodai tikėtini. Patys rezultatai paprastai turi pelno arba nuostolių reikšmę ir yra išreiškiami kiekybiškai.

Jei visų alternatyvų rezultatai yra vienodi, nėra ko rinktis. Jei jie skiriasi, galite palyginti alternatyvas, įvesdami tam tikrus kiekybinius jų įvertinimus. Žaidimų teorijos problemų įvairovė yra susijusi su skirtingais nuostolių ir pelno skaitinių charakteristikų pasirinkimais dėl alternatyvų pasirinkimo, skirtingu konflikto laipsniu tarp šalių, pasirenkančių alternatyvas, ir kt.

Apsvarstykite tokio tipo neapibrėžtumą kaip miglotą neapibrėžtumą

Bet kokia pasirinkimo užduotis yra tikslingai susiaurinti alternatyvų rinkinį. Tiek formalus alternatyvų aprašymas (pats jų sąrašas, ypatybių ar parametrų sąrašas), tiek palyginimo taisyklių (kriterijų, ryšių) aprašymas visada pateikiami pagal vieną ar kitą matavimo skalę (net ir tada, kai kas tai daro, to nežino).

Yra žinoma, kad visos skalės yra neryškios, tačiau skirtingu laipsniu. Sąvoka „blurring“ reiškia mastelių savybę, kuri susideda iš to, kad visada galima pateikti dvi skirtingas alternatyvas, t.y. skirtingos to paties masto ir nesiskiriančios, t.y. identiški, kitoje – labiau neryškūs. Kuo mažiau gradacijų tam tikroje skalėje, tuo jis neryškesnis.

Taigi aiškiai matome alternatyvas ir kartu miglotai jas klasifikuoti, t.y. neaišku, kurioms klasėms jie priklauso.

Jau pirmajame savo darbe apie sprendimų priėmimą neaiškiose situacijose Bellmanas ir Zadehas iškėlė idėją, kad tikslai ir apribojimai turėtų būti pateikiami kaip neaiški rinkiniai alternatyvų rinkinyje.

Apie kai kuriuos optimizavimo metodo apribojimus

Visose aukščiau aptartose atrankos problemose ir sprendimų priėmimo metoduose iškilo problema, kad pateiktomis sąlygomis pirminiame rinkinyje būtų rasti geriausi, t.y. tam tikra prasme optimalios alternatyvos.

Optimalumo idėja yra pagrindinė kibernetikos idėja ir tvirtai įsitvirtino techninių sistemų projektavimo ir eksploatavimo praktikoje. Kartu ši idėja reikalauja kruopštaus požiūrio, kai bandome ją perkelti į sudėtingų, didelių ir silpnai apibrėžtų sistemų, tokių kaip, pavyzdžiui, socialinių ir ekonominių, valdymo sritį.

Šiai išvadai yra gana rimtų priežasčių. Pažvelkime į kai kuriuos iš jų:

Optimalus sprendimas dažnai pasirodo esantis nestabilus, t.y. nedideli probleminių sąlygų, įvesties ar suvaržymų pakeitimai gali lemti labai skirtingų alternatyvų pasirinkimą.
Optimizavimo modeliai buvo sukurti tik siauroms gana paprastų problemų klasėms, kurios ne visada adekvačiai ir sistemingai atspindi tikrus valdymo objektus. Dažniausiai optimizavimo metodai leidžia optimizuoti tik gana paprastas ir gerai formaliai aprašytas kai kurių didelių ir sudėtingų sistemų posistemes, t.y. leisti tik vietinį optimizavimą. Tačiau jei kiekviena didelės sistemos posistemė veikia optimaliai, tai visai nereiškia, kad visa sistema veiks optimaliai. Todėl posistemio optimizavimas nebūtinai lemia elgesį, kurio iš jo reikalaujama optimizuojant visą sistemą. Be to, kartais vietinis optimizavimas gali turėti neigiamų pasekmių visai sistemai. Todėl optimizuojant posistemes ir visą sistemą, būtina nustatyti tikslų ir potikslių medį bei jų prioritetą.
Dažnai optimizavimo kriterijaus maksimizavimas pagal kokį nors matematinį modelį laikomas optimizavimo tikslu, tačiau iš tikrųjų tikslas yra optimizuoti valdymo objektą. Optimizavimo kriterijai ir matematiniai modeliai visada yra susiję su tikslu tik netiesiogiai, t.y. daugiau ar mažiau adekvačiai, bet visada apytiksliai.

Taigi optimalumo idėją, kuri yra itin vaisinga sistemoms, kurias galima tinkamai formalizuoti matematiškai, reikia atsargiai perkelti į sudėtingas sistemas. Žinoma, matematinius modelius, kuriuos kartais galima pasiūlyti tokioms sistemoms, galima optimizuoti. Tačiau visada reikia atsižvelgti į didelį šių modelių supaprastinimą, kurio sudėtingų sistemų atveju nebegalima pamiršti, taip pat į tai, kad šių modelių tinkamumo laipsnis sudėtingų sistemų atveju praktiškai nežinomas. . Todėl nežinoma, kokią grynai praktinę šio optimizavimo reikšmę turi. Didelis techninių sistemų optimizavimo praktiškumas neturėtų sukelti iliuzijų, kad optimizuojant sudėtingas sistemas jis bus toks pat efektyvus. Prasmingas matematinis sudėtingų sistemų modeliavimas yra labai sunkus, apytikslis ir netikslus. Kuo sudėtingesnė sistema, tuo atidžiau turėtumėte ją optimizuoti.

Todėl, kurdami sudėtingų, didelių, silpnai deterministinių sistemų valdymo metodus, autoriai svarbiausiu dalyku laiko ne tik pasirinkto požiūrio optimalumą formaliuoju matematiniu požiūriu, bet ir jo tinkamumą tikslui bei pačią sistemos prigimtį. valdymo objektas.

Ekspertų atrankos metodai

Tiriant sudėtingas sistemas dažnai iškyla problemų, kurių dėl įvairių priežasčių neįmanoma griežtai suformuluoti ir išspręsti naudojant šiuo metu sukurtą matematinį aparatą. Tokiais atvejais pasitelkiamos ekspertų (sistemų analitikų) paslaugos, kurių patirtis ir intuicija padeda sumažinti problemos sudėtingumą.

Tačiau reikia atsižvelgti į tai, kad patys ekspertai yra labai sudėtingos sistemos, o jų veikla taip pat priklauso nuo daugelio išorinių ir vidinių sąlygų. Todėl ekspertinių vertinimų organizavimo metoduose daug dėmesio skiriama palankių išorinių ir psichologinių sąlygų ekspertų darbui sudarymui.

Eksperto darbui įtakos turi šie veiksniai:

atsakomybė už tyrimo rezultatų panaudojimą;
žinojimas, kad dalyvauja ir kiti ekspertai;
informacijos kontakto tarp ekspertų prieinamumas;
ekspertų tarpusavio santykiai (jei tarp jų yra informacinis kontaktas);
asmeninis eksperto susidomėjimas vertinimo rezultatais;
asmeninės ekspertų savybės (pasipuikavimas, konformizmas, valia ir kt.)

Sąveika tarp ekspertų gali ir paskatinti, ir slopinti jų veiklą. Todėl skirtingais atvejais naudojami įvairūs tyrimo metodai, besiskiriantys ekspertų tarpusavio sąveikos pobūdžiu: anoniminės ir atviros apklausos bei anketos, susitikimai, diskusijos, dalykiniai žaidimai, minčių šturmas ir kt.

Yra įvairių ekspertų išvadų matematinio apdorojimo metodų. Ekspertų prašoma įvertinti įvairias alternatyvas naudojant vieną arba rodiklių sistemą. Be to, jų prašoma įvertinti kiekvieno rodiklio svarbą (jo „svorį“ ar „indėlį“). Patiems ekspertams taip pat priskiriamas kompetencijos lygis, atitinkantis kiekvieno iš jų indėlį formuojant grupės nuomonę.

Sukurta darbo su ekspertais metodika yra Delphi metodas. Pagrindinė šio metodo mintis yra ta, kad kritika ir argumentavimas turi teigiamą poveikį ekspertui, jei nepažeidžiamas jo pasididžiavimas ir sudaromos sąlygos, neleidžiančios asmeniniam susipriešimui.

Ypač reikia pabrėžti, kad iš esmės skiriasi ekspertinių metodų naudojimo ekspertinėse sistemose ir sprendimų palaikymo pobūdis. Jei pirmuoju atveju ekspertai privalo formalizuoti sprendimų priėmimo būdus, tai antruoju – tik patį sprendimą, kaip tokį.

Kadangi ekspertai dalyvauja įgyvendinant būtent tas funkcijas, kurių šiuo metu arba visiškai neteikia automatizuotos sistemos, arba jos atlieka prasčiau nei žmogus, perspektyvi automatizuotų sistemų kūrimo kryptis yra maksimalus šių funkcijų automatizavimas.

Automatizuotos sprendimų palaikymo sistemos

Priimdamas sprendimus žmogus visada naudodavosi asistentais: tai tiesiog informacijos apie valdymo objektą teikėjai ir konsultantai (patarėjai), siūlantys sprendimų variantus ir analizuojantys jų pasekmes. Žmogus, priimantis sprendimus, visada juos priimdavo tam tikroje informacinėje aplinkoje: kariniam vadovui – štabas, rektoriui – akademinė taryba, ministrui – kolegija.

Šiais laikais informacinė sprendimų priėmimo infrastruktūra neįsivaizduojama be automatizuotų interaktyvaus sprendimų vertinimo sistemų ir ypač sprendimų paramos sistemų (DDS – Decision Support Systems), t.y. automatizuotos sistemos, kurios yra specialiai sukurtos tam, kad paruoštų informaciją, reikalingą žmogui priimti sprendimą. Sprendimų paramos sistemų kūrimas visų pirma vykdomas pagal tarptautinį projektą, vykdomą pagal Tarptautinį taikomųjų sistemų analizės institutą Laxenburge (Austrija).

Norint priimti sprendimus realiose situacijose, reikia atlikti daugybę operacijų, kai kurias iš jų efektyviau atlieka žmonės, o kitas – mašinos. Veiksmingas jų pranašumų derinys kompensuojant trūkumus yra įkūnytas automatizuotose sprendimų palaikymo sistemose.

Žmogus sprendimus neapibrėžtumo sąlygomis priima geriau nei mašina, tačiau tam, kad priimtų teisingą sprendimą, jam reikia ir adekvačios (išsamios ir patikimos) dalykinę sritį apibūdinančios informacijos. Tačiau žinoma, kad žmonės blogai susidoroja su dideliais kiekiais „neapdorotos“ informacijos. Todėl mašinos vaidmuo palaikant sprendimus gali būti išankstinis informacijos apie valdymo objektą ir nekontroliuojamus veiksnius (aplinką) parengimas, padėti apžvelgti tam tikrų sprendimų priėmimo pasekmes, taip pat visą šią informaciją pateikti vaizdiniu pavidalu. ir patogus sprendimų priėmimo būdas.

Taigi automatizuotos sprendimų palaikymo sistemos kompensuoja žmogaus silpnąsias vietas, išlaisvindamos jį nuo įprastinio išankstinio informacijos apdorojimo ir suteikia jam patogią informacinę aplinką, kurioje jis gali geriau pademonstruoti savo stipriąsias puses. Šiomis sistemomis siekiama ne automatizuoti sprendimus priimančio asmens funkcijas (ir dėl to šias funkcijas atstumti nuo jo, taigi ir atsakomybę už priimtus sprendimus, o tai dažniausiai yra nepriimtina), o padėti jam rasti prekę. sprendimas.

Gyvos sistemos, įskaitant žmones, nuo pat jų atsiradimo nuolat susiduria su modelio atpažinimo problema. Visų pirma, informaciją, gaunamą iš jutimo organų, apdoroja smegenys, kurios savo ruožtu rūšiuoja informaciją, užtikrina sprendimų priėmimą, o vėliau, naudodamos elektrocheminius impulsus, perduoda reikiamą signalą toliau, pavyzdžiui, į judėjimo organus, kurie įgyvendina. būtinus veiksmus. Tada aplinka pasikeičia, ir minėti reiškiniai vėl pasikartoja. O jei pasižiūri, kiekvieną etapą lydi pripažinimas.

Tobulėjant kompiuterinėms technologijoms, atsirado galimybė išspręsti daugybę gyvenimo procese kylančių problemų, palengvinti, pagreitinti, pagerinti rezultato kokybę. Pavyzdžiui, įvairių gyvybę palaikančių sistemų veikimas, žmogaus sąveika su kompiuteriu, robotizuotų sistemų atsiradimas ir kt. Tačiau pastebime, kad šiuo metu neįmanoma užtikrinti patenkinamo rezultato atliekant kai kurias užduotis (greitai judančių panašių atpažinimas). objektai, ranka rašytas tekstas).

Darbo tikslas: ištirti vaizdų atpažinimo sistemų istoriją.

Nurodykite modelio atpažinimo srityje įvykusius kokybinius pokyčius tiek teorinius, tiek techninius, nurodant priežastis;

Aptarti skaičiavime taikomus metodus ir principus;

Pateikite artimiausioje ateityje laukiamų perspektyvų pavyzdžių.

1. Kas yra modelio atpažinimas?

Pirmosios studijos su kompiuterinėmis technologijomis daugiausia vyko pagal klasikinę matematinio modeliavimo schemą – matematinį modelį, algoritmą ir skaičiavimą. Tai buvo atominių bombų sprogimų metu vykstančių procesų modeliavimo, balistinių trajektorijų skaičiavimo, ekonominių ir kitų pritaikymų uždaviniai. Tačiau, be klasikinių šios serijos idėjų, atsirado visiškai kitokio pobūdžio metodai, kurie, kaip parodė kai kurių uždavinių sprendimo praktika, dažnai duoda geresnių rezultatų nei sprendimai, pagrįsti pernelyg sudėtingais matematiniais modeliais. Jų idėja buvo atsisakyti noro sukurti išsamų matematinį tiriamo objekto modelį (be to, dažnai buvo beveik neįmanoma sukurti adekvačių modelių), o tenkintis atsakymu tik į konkrečius mus dominančius klausimus ir ieškoti šių atsakymų iš svarstymų, bendrų daugeliui problemų. Tokio pobūdžio tyrimai apėmė vaizdinių vaizdų atpažinimą, pasėlių derliaus, upių lygio prognozavimą, užduotį pagal netiesioginius geofizinius duomenis atskirti naftą turinčius ir vandeninguosius sluoksnius ir kt. Šiose užduotyse buvo reikalingas konkretus atsakymas gana paprasta forma, pvz. , pavyzdžiui, ar objektas priklauso vienai iš iš anksto nustatytų klasių. Ir pradiniai šių užduočių duomenys, kaip taisyklė, buvo pateikiami fragmentiškos informacijos apie tiriamus objektus forma, pavyzdžiui, iš anksto klasifikuotų objektų rinkinio forma. Matematiniu požiūriu tai reiškia, kad modelio atpažinimas (ir ši problemų klasė mūsų šalyje buvo vadinama) yra platus funkcijų ekstrapoliacijos idėjos apibendrinimas.

Tokio teiginio svarba technikos mokslams nekelia abejonių, ir tai jau savaime pateisina daugybę šios srities tyrimų. Tačiau modelių atpažinimo problema gamtos mokslui turi ir platesnį aspektą (tačiau būtų keista, jei kažkas tokio svarbaus dirbtinėms kibernetinėms sistemoms neturėtų reikšmės natūralioms). Šio mokslo kontekste taip pat organiškai buvo įtraukti senovės filosofų keliami klausimai apie mūsų žinių pobūdį, gebėjimą atpažinti vaizdinius, modelius ir situacijas suptame pasaulyje. Tiesą sakant, beveik nekyla abejonių, kad paprasčiausių vaizdinių, pavyzdžiui, artėjančio pavojingo plėšrūno ar maisto atvaizdų, atpažinimo mechanizmai susiformavo daug anksčiau nei atsirado elementari kalba ir formalus loginis aparatas. Ir neabejotina, kad tokie mechanizmai yra gana išvystyti aukštesniuosiuose gyvūnuose, kuriems taip pat jų gyvenimo veikloje skubiai reikia gebėjimo atskirti gana sudėtingą gamtos ženklų sistemą. Taigi gamtoje matome, kad mąstymo ir sąmonės fenomenas aiškiai remiasi gebėjimu atpažinti vaizdinius, o tolesnė intelekto mokslo pažanga tiesiogiai susijusi su pagrindinių atpažinimo dėsnių suvokimo gilumu. Suvokiant tai, kad aukščiau išvardyti klausimai gerokai peržengia standartinį modelio atpažinimo apibrėžimą (anglų kalba literatūroje dažniau vartojamas terminas prižiūrimas mokymasis), taip pat būtina suprasti, kad jie turi gilių sąsajų su šiuo gana siauru (bet vis tiek toli gražu neišnaudota) kryptimi.

Jau dabar modelių atpažinimas tapo neatsiejama kasdienio gyvenimo dalimi ir yra viena svarbiausių šiuolaikinio inžinieriaus žinių. Medicinoje modelių atpažinimas padeda gydytojams nustatyti tikslesnes diagnozes gamyklose, jis naudojamas prekių partijų defektams prognozuoti. Biometrinės asmens identifikavimo sistemos, kaip jų algoritminis branduolys, taip pat yra pagrįstos šios disciplinos rezultatais. Tolesnis dirbtinio intelekto vystymas, ypač penktosios kartos kompiuterių, galinčių tiesiogiai bendrauti su žmonėmis žmonėms natūraliomis kalbomis ir kalba, projektavimas neįsivaizduojamas be atpažinimo. Tai tik akmuo nuo robotikos ir dirbtinių valdymo sistemų, kuriose atpažinimo sistemos yra gyvybiškai svarbios posistemės.

Būtent todėl modelių atpažinimo kūrimas nuo pat pradžių sulaukė didelio dėmesio iš įvairaus profilio specialistų – kibernetikos, neurofiziologų, psichologų, matematikų, ekonomistų ir kt. Iš esmės dėl šios priežasties šiuolaikinį modelio atpažinimą skatina šių disciplinų idėjos. Nepretenduodami į išsamumą (ir to neįmanoma tvirtinti trumpame rašinyje), apibūdinsime modelių atpažinimo istoriją ir pagrindines idėjas.

Apibrėžimai

Prieš pereidami prie pagrindinių modelio atpažinimo metodų, pateikiame keletą būtinų apibrėžimų.

Rašto atpažinimas (objektų, signalų, situacijų, reiškinių ar procesų) yra užduotis identifikuoti objektą arba nustatyti bet kokias jo savybes pagal jo vaizdą (optinis atpažinimas) arba garso įrašą (akustinis atpažinimas) ir kitas charakteristikas.

Viena iš pagrindinių yra aibės samprata, kuri neturi konkrečios formuluotės. Kompiuteryje aibė vaizduojama kaip to paties tipo nesikartojančių elementų rinkinys. Žodis „nepasikartojantis“ reiškia, kad tam tikras rinkinio elementas arba yra, arba jo nėra. Universalus rinkinys apima visus įmanomus sprendžiamos problemos elementus.

Vaizdas – tai klasifikacinė grupuotė klasifikavimo sistemoje, jungianti (išryškinanti) tam tikrą objektų grupę pagal tam tikrą kriterijų. Vaizdai turi būdingą savybę, kuri pasireiškia tuo, kad susipažinus su baigtiniu reiškinių skaičiumi iš tos pačios aibės galima atpažinti savavališkai didelį skaičių jos atstovų. Vaizdai turi būdingų objektyvių savybių ta prasme, kad skirtingi žmonės, išmokyti pagal skirtingą stebėjimo medžiagą, dažniausiai klasifikuoja tuos pačius objektus vienodai ir nepriklausomai vienas nuo kito. Klasikinėje atpažinimo problemos formuluotėje universalus rinkinys suskirstytas į vaizdo dalis. Kiekvienas objekto susiejimas su atpažinimo sistemos suvokimo organais, nepaisant jo padėties šių organų atžvilgiu, paprastai vadinamas objekto atvaizdu, o tokių vaizdų rinkiniai, kuriuos vienija kai kurios bendros savybės, yra vaizdai.

Elemento priskyrimo bet kuriam vaizdui metodas vadinamas lemiama taisykle. Kita svarbi sąvoka yra metrika, atstumo tarp universalaus rinkinio elementų nustatymo būdas. Kuo šis atstumas mažesnis, tuo panašesni objektai (simboliai, garsai ir pan.) – tai, ką atpažįstame. Paprastai elementai nurodomi kaip skaičių rinkinys, o metrika nurodoma kaip funkcija. Programos efektyvumas priklauso nuo vaizdo vaizdavimo pasirinkimo ir metrikos įgyvendinimo vieno atpažinimo algoritmo su skirtinga metrika padarys klaidų su skirtingais dažniais.

Mokymu paprastai vadinamas procesas, kai tam tikroje sistemoje susidaro vienokia ar kitokia reakcija į išorinių vienodų signalų grupes, pakartotinai veikiant išorinių koregavimo sistemą. Tokie išoriniai koregavimai treniruotėse paprastai vadinami „atlygiais“ ir „bausmėmis“. Šio koregavimo generavimo mechanizmas beveik visiškai lemia mokymosi algoritmą. Savarankiškas mokymasis nuo mokymo skiriasi tuo, kad čia nepateikiama papildomos informacijos apie reakcijos į sistemą teisingumą.

Adaptacija – tai sistemos parametrų ir struktūros, o galbūt ir valdymo veiksmų keitimo procesas, paremtas esama informacija, siekiant pasiekti tam tikrą sistemos būseną esant pradinei neapibrėžčiai ir kintant darbo sąlygoms.

Mokymasis – tai procesas, kurio metu sistema palaipsniui įgyja gebėjimą reaguoti reikiamomis reakcijomis į tam tikrus išorinių poveikių rinkinius, o adaptacija – tai sistemos parametrų ir struktūros koregavimas, siekiant reikiamos valdymo kokybės. nuolat besikeičiant išorinėms sąlygoms.

Šablonų atpažinimo užduočių pavyzdžiai: - Raidžių atpažinimas;

Šiame straipsnyje siekiu pabrėžti kai kuriuos pagrindinius mašininio mokymosi teorijos rezultatus taip, kad šios sąvokos būtų aiškios skaitytojams, turintiems šiek tiek žinių apie klasifikavimo ir regresijos problemas. Mintis parašyti tokį straipsnį vis labiau ryškėjo mano galvoje su kiekviena perskaityta knyga, kurioje tarsi iš vidurio buvo pasakojamos mašinos mokymo atpažinti idėjos ir buvo visiškai neaišku, ką šios ar tuo metodu rėmėsi jį kuriant. Kita vertus, yra nemažai knygų, skirtų pagrindinėms mašininio mokymosi sąvokoms, tačiau jose pateikta medžiaga gali pasirodyti per sudėtinga pirmajam skaitymui.

Motyvacija

Panagrinėkime šią problemą. Turime dviejų klasių obuolių – skanių ir neskanių, 1 ir 0. Obuoliai turi savybes – spalvą ir dydį. Spalva nuolat keisis nuo 0 iki 1, t.y. 0 - visiškai žalias obuolys, 1 - visiškai raudonas. Dydis gali keistis taip pat, 0 - mažas obuolys, 1 - didelis. Norėtume sukurti algoritmą, kuris gautų spalvą ir dydį kaip įvestį ir išvestų obuolio klasę – ar jis skanus, ar ne. Labai pageidautina, kad kuo mažiau klaidų, tuo geriau. Tuo pačiu metu turime galutinį sąrašą, kuriame yra istoriniai duomenys apie obuolių spalvą, dydį ir klasę. Kaip galėtume išspręsti tokią problemą?

Logiškas požiūris

Sprendžiant problemą, pirmasis būdas, kuris gali ateiti į galvą, gali būti toks: rankiniu būdu sukurkime taisykles, pvz., if-else ir, priklausomai nuo spalvos ir dydžio reikšmių, obuoliui priskirsime tam tikrą klasę. Tie. turime prielaidas – spalvą ir dydį, ir yra pasekmė – obuolio skonis. Visiškai pagrįsta, kai ženklų yra nedaug ir palyginimui galite įvertinti slenksčius akimis. Bet gali atsitikti taip, kad neįmanoma sugalvoti aiškių sąlygų, o iš duomenų neaišku, kokius slenksčius imti, o ateityje ženklų gali daugėti. O jeigu mūsų sąraše su istoriniais duomenimis aptiktume du vienodos spalvos ir dydžio obuolius, bet vienas pažymėtas kaip skanus, o kitas – ne? Taigi pirmasis mūsų metodas nėra toks lankstus ir keičiamas, kaip norėtume.

Pavadinimai

Įveskime tokį užrašą. Tąjį obuolį pažymėsime kaip . Savo ruožtu kiekvienas susideda iš dviejų skaičių – spalvos ir dydžio. Šį faktą pažymėsime skaičių pora: . Kiekvieno -ojo obuolio klasę pažymime kaip . Sąrašas su istoriniais duomenimis bus pažymėtas raide , šio sąrašo ilgis yra . Šio sąrašo elementas yra obuolio atributų ir jo klasės reikšmė. Tie. . Taip pat vadinsime pavyzdžiu. Mes naudojame didžiąsias raides, kad žymėtume kintamuosius, kurie gali įgyti konkretaus atributo ir klasės reikšmes. Pristatome naują koncepciją – sprendimo taisyklė yra funkcija, kuri kaip įvestį paima spalvą ir dydį, o kaip išvestį grąžina klasės etiketę:

Tikimybinis požiūris

Plėtodami loginio metodo su prielaidomis ir pasekmėmis idėją, užduokime sau klausimą – kokia tikimybė, kad mūsų pavyzdžiui nepriklausantis obuolys bus skanus, atsižvelgiant į išmatuotas spalvos ir dydžio vertes? Tikimybių teorijos žymėjime šis klausimas gali būti parašytas taip:

Šią išraišką galima interpretuoti kaip prielaidą, kaip pasekmę, tačiau perėjimas nuo prielaidos prie pasekmės paklus tikimybiniams dėsniams, o ne loginiams. Tie. Vietoj tiesos lentelės su Būlio reikšmėmis 0 ir 1 klasei, bus tikimybės reikšmės, kurios svyruoja nuo 0 iki 1. Taikykite Bayes formulę ir gaukite tokią išraišką:

Pažvelkime į dešinę šios išraiškos pusę išsamiau. Daugiklis vadinamas išankstine tikimybe ir reiškia tikimybę rasti skanų obuolį tarp visų galimų obuolių. Yra a priori tikimybė susidurti su neskaniu obuoliu. Ši tikimybė gali atspindėti mūsų asmenines žinias apie tai, kaip gamtoje pasiskirsto skanūs ir neskanūs obuoliai. Pavyzdžiui, iš savo praeities patirties žinome, kad 80% visų obuolių yra skanūs. Arba galime įvertinti šią vertę tiesiog apskaičiuodami skanių obuolių dalį mūsų sąraše su istoriniais duomenimis S. Kitas veiksnys parodo, kokia tikimybė gauti tam tikrą 1 klasės obuolio spalvą ir dydį. Ši išraiška taip pat vadinama tikimybės funkcija ir gali atrodyti taip: koks nors specifinis skirstinys, pavyzdžiui, normalus. Vardiklį naudojame kaip normalizavimo konstantą, kad norima tikimybė svyruotų nuo 0 iki 1. Mūsų pagrindinis tikslas yra ne ieškoti tikimybių, o ieškoti lemiamos taisyklės, kuri iš karto suteiktų mums klasę. Galutinė sprendimo taisyklės forma priklauso nuo to, kokios reikšmės ir parametrai mums žinomi. Pavyzdžiui, mes galime žinoti tik ankstesnės tikimybės reikšmes, o likusios reikšmės negali būti įvertintos. Tada lemiama taisyklė bus tokia: priskirkite visiems obuoliams tos klasės vertę, kurios a priori tikimybė yra didžiausia. Tie. jei žinome, kad 80% obuolių gamtoje yra skanūs, tai kiekvienam obuoliui suteikiame 1 klasę. Tada mūsų paklaida bus 20%. Jei taip pat galime įvertinti tikimybės funkcijos $p(X=x_m | Y=1)$ reikšmes, tada norimos tikimybės reikšmę galime rasti naudodami Bayes formulę, kaip parašyta aukščiau. Čia bus lemiama taisyklė: pažymėkite klasę, kurios tikimybė yra didžiausia:

Pavadinkime šią taisyklę Bajeso klasifikatoriumi. Kadangi kalbame apie tikimybes, net didelė tikimybės reikšmė negarantuoja, kad obuolys nepriklauso 0 klasei. Įvertinkime obuolio klaidos tikimybę taip: jei sprendimo taisyklė grąžino klasės reikšmę, lygią 1 , tada klaidos tikimybė bus ir atvirkščiai:

Mus domina klasifikatoriaus klaidos tikimybė ne tik šiame konkrečiame pavyzdyje, bet ir apskritai visiems įmanomiems obuoliams:

Ši išraiška yra numatoma klaidos reikšmė. Taigi, išspręsdami pradinę problemą, priėjome prie Bajeso klasifikatoriaus, bet kokie jo trūkumai? Pagrindinė problema yra įvertinti sąlyginę tikimybę iš duomenų. Mūsų atveju objektą vaizduojame skaičių pora – spalva ir dydis, tačiau sudėtingesnėse problemose funkcijų matmenys gali būti daug kartų didesni, o stebėjimų iš mūsų sąrašo su istoriniais duomenimis gali nepakakti, kad būtų galima įvertinti daugiamačio atsitiktinio dydžio tikimybė. Toliau pabandysime apibendrinti savo klasifikatoriaus klaidos sampratą ir taip pat pažiūrėsime, ar problemai išspręsti galima pasirinkti bet kurį kitą klasifikatorių.

Klasifikatoriaus klaidų nuostoliai

Tarkime, kad jau turime tam tikrą sprendimo taisyklę. Tada jis gali padaryti dviejų tipų klaidas – pirmoji yra priskirti objektą 0 klasei, kurios tikroji klasė yra 1, ir atvirkščiai, priskirti objektą 1 klasei, kurios tikroji klasė yra 0. Kai kuriose problemose tai svarbu. atskirti šiuos atvejus. Pavyzdžiui, labiau kenčiame, kai obuolys, pažymėtas kaip skanus, pasirodo neskanus ir atvirkščiai. Savo diskomforto laipsnį įforminame dėl nusivylusių lūkesčių sąvokoje. Apskritai, mes turime praradimo funkciją, kuri grąžina kiekvienos klasifikatoriaus klaidos skaičių. Tebūnie tikra klasės etiketė. Tada praradimo funkcija grąžina tikrosios klasės etiketės praradimo vertę ir mūsų sprendimo taisyklės vertę. Šios funkcijos naudojimo pavyzdys – paimame iš obuolio su žinoma klase, perduodame obuolį kaip įvestį į mūsų sprendimo taisyklę, gauname klasės įvertinimą iš sprendimo taisyklės, jei reikšmės sutampa, darome prielaidą kad klasifikatorius neklydo ir nėra nuostolių, jei reikšmės nesutampa, tada mūsų funkcija pasakys nuostolių dydį

Sąlyginė ir Bajeso rizika

Dabar, kai turime nuostolių funkciją ir žinome, kiek prarandame dėl netinkamo objekto klasifikavimo, būtų malonu suprasti, kiek vidutiniškai prarandame daugelyje objektų. Jei žinome vertę - tikimybė, kad obuolys bus skanus, atsižvelgiant į išmatuotas spalvos ir dydžio vertes, taip pat tikrąją klasės vertę (pavyzdžiui, paimkite obuolį iš S mėginio, žr. straipsnio pradžioje), tada galime pristatyti sąlyginės rizikos sąvoką. Sąlyginė rizika yra vidutinė objekto nuostolių vertė pagal lemiamą taisyklę:

Mūsų dvejetainės klasifikacijos atveju, kai paaiškėja:

Aukščiau aprašėme sprendimo taisyklę, kuri priskiria objektą klasei, kuri turi didžiausią tikimybės reikšmę. Ši taisyklė užtikrina mūsų vidutinius nuostolius (Bayeso riziką), todėl Bajeso klasifikatorius yra optimalus rizikos požiūriu. funkcionalus, kurį pristatėme. Tai reiškia, kad Bajeso klasifikatorius turi mažiausią įmanomą klasifikavimo paklaidą.

Kai kurios tipiškos praradimo funkcijos

Viena iš labiausiai paplitusių nuostolių funkcijų yra simetrinė funkcija, kai nuostoliai dėl pirmojo ir antrojo tipo klaidų yra lygiaverčiai. Pavyzdžiui, nuostolių funkcija 1-0 (nulis-vienas nuostolis) apibrėžiama taip:

Tada sąlyginė rizika a(x) = 1 bus tiesiog tikimybės gauti 0 klasę objektui reikšmė:

Panašiai, jei a(x) = 0:

1-0 praradimo funkcija įgauna reikšmę 1, jei klasifikatorius padaro klaidą objekte, ir 0, jei ne. Dabar įsitikinkime, kad klaidos reikšmė yra ne 1, o kitai funkcijai Q, priklausomai nuo sprendimo taisyklės ir tikrosios klasės etiketės:

Tada sąlyginę riziką galima parašyti taip:

Pastabos dėl žymėjimo

Ankstesnis tekstas buvo parašytas pagal Dudos ir Harto knygoje priimtą užrašą. Originalioje knygoje V.N. Vapnikas svarstė tokį procesą: gamta pasirenka objektą pagal pasiskirstymą $p(x)$, o tada priskiria jam klasės etiketę pagal sąlyginį skirstymą $p(y|x)$. Tada rizika (nuostolių tikėjimasis) apibrėžiama kaip

Kur yra funkcija, su kuria mes bandome aproksimuoti nežinomą priklausomybę, yra tikrosios vertės praradimo funkcija ir mūsų funkcijos vertė. Šis žymėjimas yra aiškesnis, norint įvesti kitą sąvoką – empirinę riziką.

Empirinė rizika

Šiame etape jau išsiaiškinome, kad loginis metodas mums netinka, nes jis nėra pakankamai lankstus ir negalime naudoti Bajeso klasifikatoriaus, kai yra daug funkcijų, tačiau yra ribotas treniruočių duomenų skaičius ir mes negali atkurti tikimybės. Taip pat žinome, kad Bajeso klasifikatorius turi mažiausią įmanomą klasifikavimo paklaidą. Kadangi negalime naudoti Bajeso klasifikatoriaus, naudokite ką nors paprastesnio. Pataisykime kokią nors parametrinę funkcijų šeimą H ir iš šios šeimos parinksime klasifikatorių.

Pavyzdys: tegul yra visų formos funkcijų rinkinys

Visos šios aibės funkcijos viena nuo kitos skirsis tik koeficientais. Pasirinkę tokią šeimą, darėme prielaidą, kad spalvų dydžio koordinatėse tarp 1 klasės taškų ir 0 klasės taškų galime nubrėžti tiesią liniją su koeficientais. taip, kad skirtingų klasių taškai yra skirtingose tiesės pusėse. Yra žinoma, kad tokio tipo tiesei koeficiento vektorius yra normalus tiesei. Dabar darome taip – paimame savo obuolį, išmatuojame jo spalvą bei dydį ir tašką su gautomis koordinatėmis nubrėžiame grafike spalvų dydžio ašimis. Toliau išmatuojame kampą tarp šio taško ir vektoriaus $w$. Pastebime, kad mūsų taškas gali būti tiek vienoje, tiek kitoje tiesės pusėje. Tada kampas tarp ir taško bus ūmus arba bukas, o skaliarinė sandauga bus teigiama arba neigiama. Tai veda prie lemiamos taisyklės:

Užfiksavus funkcijų klasę $H$, kyla klausimas – kaip iš jos parinkti funkciją su reikalingais koeficientais? Atsakymas yra toks – pasirinkime funkciją, kuri sumažina mūsų Bajeso riziką $R()$. Vėlgi, bėda ta, kad norint apskaičiuoti Bajeso rizikos reikšmes, reikia žinoti skirstinį $p(x,y)$, tačiau jis mums nėra duotas, ir ne visada įmanoma jį atkurti. Kita idėja yra sumažinti riziką ne visuose įmanomuose objektuose, o tik pavyzdyje. Tie. sumažinti funkciją:

Ši funkcija vadinama empirine rizika. Kitas klausimas, kodėl nusprendėme, kad sumažindami empirinę riziką, sumažiname ir Bajeso riziką? Priminsiu, kad mūsų praktinė užduotis – padaryti kuo mažiau klasifikavimo klaidų. Kuo mažiau klaidų, tuo mažesnė Bajeso rizika. Empirinės rizikos konvergencijos prie Bajeso rizikos, didėjant duomenų kiekiui, pagrindimą 70-aisiais gavo du mokslininkai - V. N. Vapnikas ir A. Chervonenkis.

Konvergencijos garantijos. Paprasčiausias atvejis

Taigi, priėjome išvados, kad Bajeso klasifikatorius pateikia mažiausią įmanomą paklaidą, tačiau daugeliu atvejų mes negalime jos išmokyti ir taip pat negalime apskaičiuoti paklaidos (rizikos). Tačiau galime apskaičiuoti aproksimaciją prie Bajeso rizikos, kuri vadinama empirine rizika, ir, žinodami empirinę riziką, pasirinkti aproksimuojančią funkciją, kuri sumažintų empirinę riziką. Pažvelkime į paprasčiausią situaciją, kai empirinės rizikos sumažinimas sukuria klasifikatorių, kuris taip pat sumažina Bajeso riziką. Paprasčiausiu atveju turėsime daryti prielaidą, kuri retai tenkinama praktiškai, bet kurią vėliau galima sušvelninti. Nustatykime baigtinę funkcijų klasę, iš kurios pasirinksime savo klasifikatorių, ir manykime, kad tikroji funkcija, kurią gamta naudoja mūsų obuoliams suskirstyti į skonį, yra šioje baigtinėje hipotezių rinkinyje: . Taip pat turime pavyzdį, gautą iš paskirstymo per objektus. Laikome, kad visi imties objektai yra vienodai nepriklausomai paskirstyti (iid). Tada tai bus tiesa

Teorema

Pasirinkę funkciją iš klasės, kurioje naudojamas empirinis rizikos mažinimas, garantuojame, kad rasime tokią, kurios Bajeso rizikos vertė būtų nedidelė, jei imtis, kurioje atliekame sumažinimą, yra pakankamo dydžio.

Ką reiškia „maža vertė“ ir „pakankamas dydis“, skaitykite toliau pateiktoje literatūroje.

Įrodinėjimo idėja

Pagal teoremos sąlygas iš skirstinio gauname imtį, t.y. objektų atrankos iš gamtos procesas yra atsitiktinis. Kiekvieną kartą, kai renkame pavyzdį, jis bus iš to paties platinimo, tačiau patys objektai gali skirtis. Pagrindinė įrodymo mintis yra ta, kad galime gauti tokią blogą pavyzdį, kad algoritmas, kurį pasirenkame sumažindami šios imties empirinę riziką, bus blogai sumažinant Bajeso riziką, tačiau tuo pat metu jis bus geras sumažinant empirinę riziką, tačiau tikimybė gauti tokią imtį yra maža ir didėjant imties dydžiui, ši tikimybė mažėja. Panašios teoremos egzistuoja realistiškesnėms prielaidoms, tačiau čia jų nenagrinėsime.

Praktiniai rezultatai

Turėdami įrodymų, kad funkcija, rasta sumažinus empirinę riziką, neturės didelės paklaidos anksčiau nepastebėtuose duomenims esant pakankamam mokymo imties dydžiui, šį principą galime naudoti praktikoje, pavyzdžiui, taip – imame išraišką:

Ir mes pakeičiame įvairias praradimo funkcijas, priklausomai nuo sprendžiamos problemos. Tiesinei regresijai:

Logistinei regresijai:

Nors atramos vektorių mašinos pirmiausia turi geometrinę motyvaciją, jos taip pat gali būti laikomos empirine rizikos mažinimo problema.

Išvada

Daugelis prižiūrimų mokymosi metodų, be kita ko, gali būti laikomi ypatingais V. N. Vapniko ir A. Červonenkio sukurtos teorijos atvejais. Ši teorija suteikia garantijas dėl bandymo rinkinio klaidos, jei yra pakankamas mokymo imties dydis ir tam tikri reikalavimai hipotezių erdvei, kurioje ieškome savo algoritmo.

Naudota literatūra

Statistinio mokymosi teorijos prigimtis, Vladimiras N. Vapnikas
Šablonų klasifikacija, 2 leidimas, Richard O. Duda, Peter E. Hart, David G. Stork
Mašininio mokymosi supratimas: nuo teorijos iki algoritmų, Shai Shalev-Shwartz, Shai Ben-David

P.S. Dėl netikslumų ir rašybos klaidų rašykite asmenine žinute.

Žymos: pridėti žymų

Asmens identifikavimas naudojant modelio atpažinimo metodus. Keletas žodžių apie modelio atpažinimą