Identifikimi i një personi duke përdorur metodat e njohjes së modelit. Disa fjalë për njohjen e modelit

  • Tutorial

Prej kohësh kam dashur të shkruaj një artikull të përgjithshëm që përmban bazat e Njohjes së Imazhit, një lloj udhëzuesi mbi metodat bazë, duke treguar se kur duhet t'i përdorim ato, çfarë problemesh zgjidhin, çfarë mund të bëhet në mbrëmje në gjunjë dhe çfarë është më mirë të mos mendosh pa pasur një ekip njerëzish në 20.

Unë kam shkruar disa artikuj mbi Njohjen Optike për një kohë të gjatë, kështu që njerëzit më shkruajnë disa herë në muaj njerëz të ndryshëm me pyetje për këtë temë. Ndonjëherë ndjen se jeton me ta botë të ndryshme. Nga njëra anë, ju e kuptoni se personi ka shumë të ngjarë të jetë profesionist në një temë të lidhur, por di shumë pak për metodat e njohjes optike. Dhe gjëja më e bezdisshme është se ai po përpiqet të aplikojë një metodë nga një fushë e afërt e njohurive, e cila është logjike, por nuk funksionon plotësisht në Njohjen e Imazhit, por nuk e kupton këtë dhe ofendohet shumë nëse filloni t'i tregoni diçka nga shumë bazat. Dhe duke marrë parasysh që të tregosh nga bazat kërkon shumë kohë, e cila shpesh nuk është e disponueshme, bëhet edhe më e trishtuar.

Ky artikull synon që një person që nuk ka punuar kurrë me metodat e njohjes së imazhit, brenda 10-15 minutash, të krijojë në kokën e tij një pamje të caktuar themelore të botës që korrespondon me temën dhe të kuptojë se në cilin drejtim të gërmojë. Shumë nga teknikat e përshkruara këtu janë të zbatueshme për përpunimin e radarit dhe audios.
Do të filloj me disa parime që ne gjithmonë fillojmë t'i tregojmë një klienti të mundshëm ose një personi që dëshiron të fillojë të bëjë Njohjen Optike:

  • Kur zgjidhni një problem, shkoni gjithmonë nga më e thjeshta. Është shumë më e lehtë të vendosësh një etiketë mbi një person ngjyrë portokalli sesa të ndjekësh një person, duke e nxjerrë në pah atë në kaskada. Është shumë më e lehtë të marrësh një aparat fotografik me rezolucion më të lartë sesa të zhvillosh një algoritëm me super-rezolucion.
  • Një formulim i rreptë i problemit në metodat e njohjes optike është urdhra të përmasave më të rëndësishme sesa në problemet programimi i sistemit: një fjalë e tepërt mund të shtojë 50% të punës në specifikimet teknike.
  • Nuk ka zgjidhje universale për problemet e njohjes. Ju nuk mund të bëni një algoritëm që thjesht do të "njohë çdo mbishkrim". Një shenjë në rrugë dhe një fletë teksti janë thelbësore objekte të ndryshme. Ndoshta është e mundur të krijohet një algoritëm i përgjithshëm (këtu është një shembull i mirë nga Google), por do të kërkojë shumë punë nga një ekip i madh dhe do të përbëhet nga dhjetëra nënprograme të ndryshme.
  • OpenCV është një bibël që ka shumë metoda dhe mund të zgjidhë 50% të pothuajse çdo problemi, por OpenCV është vetëm një pjesë e vogël e asaj që mund të bëhet në të vërtetë. Në një studim, përfundimet u shkruan: "Problemi nuk mund të zgjidhet duke përdorur metoda OpenCV, prandaj është i pazgjidhshëm." Mundohuni ta shmangni këtë, mos u bëni dembel dhe vlerësoni me maturi detyrën aktuale nga e para çdo herë, pa përdorur shabllone OpenCV.
Është shumë e vështirë të japësh ndonjë këshillë universale, ose të thuash se si të krijosh një lloj strukture rreth së cilës mund të ndërtosh një zgjidhje për problemet arbitrare të vizionit kompjuterik. Qëllimi i këtij artikulli është të strukturojë atë që mund të përdoret. Do të përpiqem ta thyej metodat ekzistuese në tre grupe. Grupi i parë është filtrimi paraprak dhe përgatitja e imazhit. Grupi i dytë është përpunimi logjik i rezultateve të filtrimit. Grupi i tretë janë algoritmet e vendimmarrjes të bazuara në përpunimin logjik. Kufijtë midis grupeve janë shumë arbitrare. Për të zgjidhur një problem, nuk është gjithmonë e nevojshme të përdoren metoda nga të gjitha grupet, ndonjëherë mjaftojnë dy, dhe ndonjëherë edhe një.

Lista e metodave të dhëna këtu nuk është e plotë. Unë sugjeroj të shtoni në komente metodat kritike, që nuk i kam shkruar dhe i atribuoj 2-3 fjalë shoqëruese secilit.

Pjesa 1. Filtrimi

Në këtë grup vendosa metoda që ju lejojnë të zgjidhni zonat me interes në imazhe pa i analizuar ato. Shumica nga këto metoda zbatohet një lloj transformimi i vetëm në të gjitha pikat e imazhit. Në nivelin e filtrimit, analiza e imazhit nuk kryhet, por pikat që i nënshtrohen filtrimit mund të konsiderohen si zona me karakteristika të veçanta.
Binarizimi sipas pragut, përzgjedhja e zonës së histogramit
Transformimi më i thjeshtë është binarizimi i imazhit sipas pragut. Për imazhet RGB dhe gri, pragu është vlera e ngjyrës. Takohen probleme ideale, në të cilën një transformim i tillë është i mjaftueshëm. Supozoni se dëshironi të zgjidhni automatikisht objektet në një fletë të bardhë letre:




Zgjedhja e pragut në të cilin ndodh binarizimi përcakton kryesisht vetë procesin e binarizimit. NË në këtë rast, imazhi u binarizuar nga ngjyra mesatare. Në mënyrë tipike, binarizimi kryhet duke përdorur një algoritëm që zgjedh në mënyrë adaptive një prag. Një algoritëm i tillë mund të jetë zgjedhja e pritjes ose mënyrës. Ose mund të zgjidhni majën më të madhe në histogram.

Binarizimi mund të sigurojë shumë rezultate interesante kur punoni me histograme, përfshirë në situatën kur ne e konsiderojmë një imazh jo në RGB, por në HSV. Për shembull, ngjyrat e segmentit me interes. Mbi këtë parim, ju mund të ndërtoni një detektor tag dhe një detektor të lëkurës njerëzore.
Filtrim klasik: Fourier, filtër me kalim të ulët, filtër me kalim të lartë
Metodat klasike të filtrimit të radarit dhe përpunimit të sinjalit mund të zbatohen me sukses në një sërë detyrash të Njohjes së Modeleve. Metoda tradicionale në radar, i cili pothuajse kurrë nuk përdoret në formë të pastër në imazhe, është transformimi Fourier (më konkretisht, FFT). Një nga përjashtimet e pakta në të cilat përdoret transformimi Furier njëdimensional është kompresimi i imazhit. Për analizën e imazhit, një transformim njëdimensional zakonisht nuk është i mjaftueshëm, ju duhet të përdorni një transformim dydimensional shumë më intensiv.

Pak njerëz e llogarisin atë zakonisht, është shumë më e shpejtë dhe më e lehtë për të përdorur konvolucionin e zonës së interesit me një filtër të gatshëm, të akorduar për frekuenca të larta (HPF) ose të ulëta (LPF). Kjo metodë, natyrisht, nuk lejon analizën e spektrit, por në detyrë specifike Përpunimi i videos zakonisht nuk kërkon analiza, por rezultate.


Më së shumti shembuj të thjeshtë filtra që theksojnë frekuencat e ulëta (filtri Gaussian) dhe frekuencave të larta(filtri Gabor).
Për çdo pikë imazhi, zgjidhet një dritare dhe shumëzohet me një filtër të së njëjtës madhësi. Rezultati i një konvolucioni të tillë është një vlerë e re pikë. Kur zbatoni filtra me kalim të ulët dhe filtra me kalim të lartë, merren imazhe të llojit të mëposhtëm:



Valët e valëve
Por, çka nëse përdorni ndonjë sinjal arbitrar për konvolucionin? funksioni karakteristik? Atëherë do të quhet "Transformimi i valëve". Ky përkufizim i valëve nuk është i saktë, por tradicionalisht, në shumë ekipe, analiza e valëve është kërkimi i një modeli arbitrar në një imazh duke përdorur konvolucionin me një model të këtij modeli. Ekziston një grup funksionesh klasike që përdoren në analizën e valëve. Këto përfshijnë valëzimin Haar, valëzimin Morlet, valën e kapelës meksikane, etj. Primitivët Haar, për të cilët kishte disa nga artikujt e mi të mëparshëm (,), lidhen me funksione të tilla për hapësirën dy-dimensionale.


Më sipër janë 4 shembuj të valëve klasike. Wavelet 3-dimensionale Haar, valëzimi 2-dimensional Meyer, valëzimi meksikan Hat, valëzimi Daubechies. Një shembull i mirë Përdorimi i një interpretimi të zgjeruar të valëve është problemi i gjetjes së një shkëlqimi verbues në sy, për të cilin valëzimi është vetë shkëlqimi:

Valët klasike zakonisht përdoren për kompresimin e imazhit, ose për klasifikimin e imazhit (që do të përshkruhet më poshtë).
Korrelacioni
Pas një interpretimi kaq të lirë të valëve nga ana ime, vlen të përmendet korrelacioni aktual që qëndron në themel të tyre. Ky është një mjet i domosdoshëm kur filtroni imazhe. Aplikim klasik- korrelacioni i transmetimit të videos për të gjetur ndërrime ose flukse optike. Detektori më i thjeshtë i zhvendosjes është gjithashtu, në një farë kuptimi, një korrelator i ndryshimit. Aty ku imazhet nuk lidheshin, kishte lëvizje.

Funksionet e filtrimit
Një klasë interesante e filtrave është filtrimi i funksioneve. Këto janë filtra thjesht matematikorë që ju lejojnë të zbuloni të thjeshtë funksioni matematik në imazh (vijë e drejtë, parabolë, rreth). Ndërtohet një imazh akumulues në të cilin për çdo pikë imazh origjinal vizatohen shumë funksione që e gjenerojnë atë. Transformimi më klasik është transformimi Hough për linjat. Në këtë transformim, për secilën pikë (x;y), vizatohet një grup pikash (a;b) të drejtëzës y=ax+b për të cilat barazia është e vërtetë. Ju merrni foto të bukura:


(plusi i parë është për atë që është i pari që ka gjetur një kapje në foto dhe këtë përkufizim dhe e shpjegon atë, plusi i dytë është për atë që është i pari që thotë atë që tregohet këtu)
Transformimi Hough ju lejon të gjeni çdo funksion të parametrizueshëm. Për shembull rrathët. Ekziston një transformim i modifikuar që ju lejon të kërkoni për çdo formë. Matematikanët janë jashtëzakonisht të dhënë pas këtij transformimi. Por kur përpunoni imazhe, për fat të keq, nuk funksionon gjithmonë. Shpejtësi shumë e ngadaltë e funksionimit, ndjeshmëri shumë e lartë ndaj cilësisë së binarizimit. Edhe në situata ideale, preferoja të mjaftohesha me metoda të tjera.
Një analog i transformimit Hough për vijat e drejta është transformimi i Radonit. Ai llogaritet përmes FFT, i cili jep një fitim të performancës në një situatë ku ka shumë pikë. Përveç kësaj, mund të aplikohet në një imazh jo-binar.
Filtrimi i konturit
Një klasë e veçantë e filtrave është filtrimi i kufirit dhe konturit. Skicat janë shumë të dobishme kur duam të kalojmë nga puna me një imazh në punën me objektet në atë imazh. Kur një objekt është mjaft kompleks, por i dalluar mirë, atëherë shpesh e vetmja mënyrë të punosh me të është të nxjerrësh në pah konturet e tij. Ka një sërë algoritmesh zgjidhjen e problemit qarqet e filtrimit:

Më shpesh përdoret Canny, i cili funksionon mirë dhe zbatimi i të cilit është në OpenCV (aty është edhe Sobel, por kërkon konturet më keq).



Filtra të tjerë
Më sipër janë filtra, modifikimet e të cilëve ndihmojnë në zgjidhjen e 80-90% të problemeve. Por përveç tyre, përdoren filtra më të rrallë detyrat lokale. Ka dhjetëra filtra të tillë, nuk do t'i rendis të gjithë. Interesante janë filtrat iterativë (për shembull, një model i pamjes aktive), si dhe transformimet ridgelet dhe curvlet, të cilat janë një bashkim i filtrimit dhe analizës klasike të valëve në fushën e transformimit të radonit. Transformimi beamlet funksionon bukur në kufirin e transformimit të valëzimit dhe analiza logjike, duke ju lejuar të zgjidhni konturet:

Por këto transformime janë shumë specifike dhe të përshtatura për detyra të rralla.

Pjesa 2. Përpunimi logjik i rezultateve të filtrimit

Filtrimi siguron një grup të dhënash të përshtatshme për përpunim. Por shpesh nuk mund t'i marrësh dhe t'i përdorësh këto të dhëna pa i përpunuar ato. Do të ketë disa në këtë seksion metodat klasike, duke ju lejuar të lëvizni nga imazhi te vetitë e objekteve ose te vetë objektet.
Morfologjia
Kalimi nga filtrimi në logjikë, për mendimin tim, është metoda morfologjia matematikore( , , ). Në thelb, këto janë operacionet më të thjeshta të rritjes dhe gërryerjes së imazheve binare. Këto metoda ju lejojnë të hiqni zhurmën nga një imazh binar duke rritur ose ulur elementët ekzistues. Ekzistojnë algoritme konturuese të bazuara në morfologjinë matematikore, por zakonisht përdoren disa lloj algoritmesh hibride ose algoritme në kombinim.
Analiza e konturit
Algoritmet për marrjen e kufijve janë përmendur tashmë në seksionin mbi filtrimin. Kufijtë që rezultojnë shndërrohen thjesht në konture. Për algoritmin Canny kjo ndodh automatikisht për algoritme të tjera kërkohet binarizimi shtesë. Ju mund të merrni një kontur për një algoritëm binar, për shembull, duke përdorur algoritmin e brumbullit.
Një skicë është një karakteristikë unike e një objekti. Kjo shpesh ju lejon të identifikoni një objekt nga skica e tij. Ekziston një aparat i fuqishëm matematikor që ju lejon ta bëni këtë. Pajisja quhet analiza e konturit (,).

Për të qenë i sinqertë, kurrë nuk kam qenë në gjendje të aplikoj analizën e konturit probleme reale. Kërkohen kushte shumë ideale. Ose nuk ka kufi, ose ka shumë zhurmë. Por, nëse duhet të njohësh diçka në kushte ideale- atëherë analiza e konturit është një opsion i mrekullueshëm. Punon shumë shpejt, matematikë e bukur dhe logjikë e qartë.
Pika të veçanta
Pikat singulare janë karakteristika unike të një objekti që lejojnë që objekti të krahasohet me vetveten ose me klasa të ngjashme objektesh. Ka disa dhjetëra mënyra për të identifikuar pika të tilla. Disa metoda theksojnë pika njëjës në korniza ngjitur, disa përmes hendek i madh koha dhe kur ndryshon ndriçimi, disa ju lejojnë të gjeni pika të veçanta që mbeten të tilla edhe kur objekti rrotullohet. Le të fillojmë me metoda që na lejojnë të gjejmë pika të veçanta, të cilat nuk janë aq të qëndrueshme, por llogariten shpejt, dhe më pas do të shkojmë në kompleksitet në rritje:
Klasa e parë. Pika të veçanta që janë të qëndrueshme për një periudhë sekondash. Pika të tilla përdoren për të drejtuar një objekt midis kornizave ngjitur të videos ose për të kombinuar imazhe nga kamerat fqinje. Pika të tilla përfshijnë maksimumin lokal të imazhit, qoshet në imazh (më i miri nga detektorët është, ndoshta, detektori Charis), pikat në të cilat arrihet shpërndarja maksimale, gradientë të caktuar, etj.
Klasa e dyte. Pika të veçanta që janë të qëndrueshme kur ndriçimi ndryshon dhe lëvizjet e vogla të objektit. Pika të tilla shërbejnë kryesisht për trajnimin dhe klasifikimin pasues të llojeve të objekteve. Për shembull, një klasifikues i këmbësorëve ose një klasifikues i fytyrës është produkt i një sistemi të ndërtuar pikërisht në pika të tilla. Disa nga valët e përmendura më parë mund të jenë baza për pika të tilla. Për shembull, Haar primitives, kërkimi për pikat kryesore, kërkimi për funksione të tjera specifike. Këto pika përfshijnë ato të gjetura me metodën e histogramit të gradientëve të drejtimit (HOG).
Klasa e tretë. Pika të qëndrueshme. Unë di vetëm për dy metoda që ofrojnë stabilitet të plotë dhe për modifikimet e tyre. Këto janë SURF dhe SIFT. Ato ju lejojnë të gjeni pika të veçanta edhe kur rrotulloni imazhin. Llogaritja e pikave të tilla zgjat më shumë në krahasim me metodat e tjera, por është e mjaftueshme kohe e Kufizuar. Fatkeqësisht, këto metoda janë të patentuara. Edhe pse, në Rusi është e pamundur të patentohen algoritmet, prandaj përdorni atë për tregun e brendshëm.

Pjesa 3. Trajnimi

Pjesa e tretë e tregimit do t'i kushtohet metodave që nuk funksionojnë drejtpërdrejt me imazhin, por që ju lejojnë të merrni vendime. Kryesisht metoda të ndryshme mësimi i makinës dhe vendimmarrje. Kohët e fundit Yandyx postoi një kurs për këtë temë në Habr, është shumë përzgjedhje e mirë. Këtu është në versionin tekst. Për një studim serioz të temës, unë rekomandoj shumë t'i shikoni ato. Këtu do të përpiqem të përshkruaj disa metoda kryesore të përdorura posaçërisht në njohjen e modeleve.
Në 80% të situatave, thelbi i të mësuarit në detyrën e njohjes është si më poshtë:
Ekziston një mostër provë që përmban disa klasa objektesh. Le të jetë prania/mungesa e një personi në foto. Për çdo imazh ka një grup karakteristikash që janë theksuar nga ndonjë veçori, qoftë Haar, HOG, SURF ose ndonjë valë valësh. Algoritmi i të mësuarit duhet të ndërtojë një model në mënyrë që të mund të analizojë një imazh të ri dhe të vendosë se cili objekt është në imazh.
Si është bërë? Secila nga imazhet e testimit është një pikë në hapësirën e veçorive. Koordinatat e tij janë pesha e secilës prej veçorive në imazh. Le të jenë shenjat tona: “Prania e syve”, “Prania e një hunde”, “Prania e dy duarve”, “Prania e veshëve” etj... Të gjitha këto shenja do t’i nxjerrim në pah duke përdorur detektorët tanë ekzistues, të cilët janë trajnuar mbi pjesë të trupit të ngjashme me ato të njeriut Për një person në një hapësirë ​​të tillë, pika e saktë do të ishte . Për majmunin, pikë për kalin. Klasifikuesi trajnohet duke përdorur një mostër shembujsh. Por jo të gjitha fotografitë tregonin duar, të tjerat nuk kishin sy, dhe në të tretën, majmuni kishte një hundë njeriu për shkak të një gabimi klasifikues. Një klasifikues i trajnuar njerëzor ndan automatikisht hapësirën e veçorive në atë mënyrë që të thotë: nëse tipari i parë shtrihet në intervalin 0.5 Në thelb, qëllimi i klasifikuesit është të vizatojë zona në hapësirën e veçorive që janë karakteristike për objektet e klasifikimit. Kështu do të duket një përafrim vijues i përgjigjes për një nga klasifikuesit (AdaBoost) në hapësirën dy-dimensionale:


Ka shumë klasifikues. Secili prej tyre funksionon më mirë në një detyrë të veçantë. Detyra e zgjedhjes së një klasifikuesi për një detyrë specifike është kryesisht një art. Këtu janë disa foto të bukura mbi këtë temë.
Rast i thjeshtë, ndarje njëdimensionale
Le të shohim një shembull të rastit më të thjeshtë të klasifikimit, kur hapësira e veçorive është njëdimensionale dhe duhet të ndajmë 2 klasa. Situata ndodh më shpesh sesa mund të mendoni: për shembull, kur duhet të dalloni dy sinjale ose të krahasoni një model me një mostër. Le të kemi një mostër trajnimi. Kjo prodhon një imazh ku boshti X është masa e ngjashmërisë dhe boshti Y është numri i ngjarjeve me një masë të tillë. Kur objekti i dëshiruar është i ngjashëm me vetveten, fitohet një Gaussian i majtë. Kur nuk duket, është e duhura. Vlera e X=0.4 i ndan mostrat në mënyrë që një vendim i gabuar të minimizojë mundësinë e marrjes së ndonjë vendimi të gabuar. Kërkimi për një ndarës të tillë është detyrë e klasifikimit.


Një shënim i vogël. Kriteri që minimizon gabimin nuk do të jetë gjithmonë optimal. Grafiku i mëposhtëm është një grafik i një sistemi të vërtetë të njohjes së irisit. Për një sistem të tillë, zgjidhet kriteri për të minimizuar probabilitetin e pranimit të rremë të një personi të paautorizuar në objekt. Ky probabilitet quhet "gabim i tipit I", "probabilitet i alarmit të rremë", "pozitiv i rremë". Në literaturën në gjuhën angleze “False Access Rate”.
) AdaBusta është një nga klasifikuesit më të zakonshëm. Për shembull, kaskada Haar është ndërtuar mbi të. Zakonisht përdoret kur nevojitet klasifikimi binar, por asgjë nuk e pengon trajnimin për një numër më të madh klasash.
SVM ( , , , ) Një nga klasifikuesit më të fuqishëm, i cili ka shumë zbatime. Në thelb, në detyrat e të mësuarit që kam hasur, funksionoi në mënyrë të ngjashme me Adabusta. Konsiderohet mjaft i shpejtë, por trajnimi i tij është më i vështirë se ai i Adabusta dhe kërkon zgjedhjen e bërthamës së duhur.

Ekzistojnë gjithashtu rrjete nervore dhe regresion. Por për t'i klasifikuar shkurtimisht dhe për të treguar se si ndryshojnë, na duhet një artikull shumë më i gjatë se ky.
________________________________________________
Shpresoj se kam qenë në gjendje të jap një pasqyrë të shpejtë të metodave të përdorura pa u zhytur në matematikë dhe përshkrim. Ndoshta kjo do të ndihmojë dikë. Megjithëse, natyrisht, artikulli është i paplotë dhe nuk ka asnjë fjalë për punën me imazhe stereo, as për LSM me një filtër Kalman, as për qasjen adaptive Bayes.
Nëse ju pëlqen artikulli, do të përpiqem të bëj një pjesë të dytë me një përzgjedhje shembujsh se si zgjidhen problemet ekzistuese të Njohjes së Imazhit.

Dhe së fundi

Çfarë duhet lexuar?
1) Dikur më pëlqeu shumë libri "Përpunimi i imazhit dixhital" nga B. Yane, i cili është shkruar thjesht dhe qartë, por në të njëjtën kohë jepet pothuajse e gjithë matematika. Mirë për t'u njohur me metodat ekzistuese.
2) Një klasik i zhanrit është R. Gonzalez, R. Woods “Digital Image Processing”. Për disa arsye ishte më e vështirë për mua se e para. Shumë më pak matematikë, por më shumë metoda dhe fotografi.
3) "Përpunimi dhe analiza e imazhit në problemet e shikimit kompjuterik" - shkruar në bazë të një kursi të dhënë në një nga departamentet e Fizikës dhe Teknologjisë. Ka shumë metoda dhe përshkrime të hollësishme të tyre. Por për mendimin tim, libri ka dy disavantazhe të mëdha: libri është i fokusuar fort në paketën softuerike që vjen me të në libër, shumë shpesh përshkrimi i një metode të thjeshtë kthehet në një xhungël matematikore, nga e cila është e vështirë; nxjerrin diagramin strukturor të metodës. Por autorët kanë krijuar një faqe interneti të përshtatshme ku është paraqitur pothuajse e gjithë përmbajtja - wiki.technicalvision.ru Shtoni etiketa

Die, 29 Mars 2015

Aktualisht, ka shumë detyra në të cilat është e nevojshme të merret një vendim në varësi të pranisë së një objekti në imazh ose ta klasifikoni atë. Aftësia për të "njohur" konsiderohet vetia kryesore e qenieve biologjike, ndërsa sistemet kompjuterike nuk e zotërojnë plotësisht këtë pronë.

Le të shohim elementet e përgjithshme të modelit të klasifikimit.

Klasa- një grup objektesh me veti të përbashkëta. Për objektet e së njëjtës klasë, supozohet prania e "ngjashmërisë". Për një detyrë njohjeje, mund të përcaktohet një numër arbitrar klasash, më i madh se 1. Numri i klasave shënohet me numrin S. Çdo klasë ka etiketën e saj identifikuese.

Klasifikimi- procesi i caktimit të etiketave të klasave për objektet, sipas disa përshkrimeve të vetive të këtyre objekteve. Një klasifikues është një pajisje që merr një grup atributesh objekti si të dhëna hyrëse dhe prodhon një etiketë klase si rezultat.

Verifikimi- procesi i hartës së një shembulli objekti në një model të vetëm objekti ose përshkrim klase.

Nën mënyrë emrin e zonës do ta kuptojmë në hapësirën e veçorive në të cilën shfaqen shumë objekte apo dukuri të botës materiale. Shenjë- një përshkrim sasior i një vetie të caktuar të objektit ose fenomenit që studiohet.

Hapësira e veçorive kjo është një hapësirë ​​N-dimensionale e përcaktuar për një detyrë të caktuar njohjeje, ku N është një numër fiks i veçorive të matura për çdo objekt. Një vektor nga hapësira e veçorive x që korrespondon me objektin e detyrës së njohjes është një vektor N-dimensional me komponentë (x_1,x_2,…,x_N), të cilat janë vlerat e veçorive për këtë objekt.

Me fjalë të tjera, njohja e modelit mund të përkufizohet si caktimi i të dhënave burimore në një klasë të caktuar duke identifikuar veçori ose veçori të rëndësishme që karakterizojnë këto të dhëna nga masa totale e detajeve të parëndësishme.

Shembuj të problemeve të klasifikimit janë:

  • njohja e personazheve;
  • njohja e të folurit;
  • vendosja e një diagnoze mjekësore;
  • Parashikimi i Motit;
  • njohja e fytyrës
  • klasifikimi i dokumenteve etj.

Më shpesh, materiali burimor është imazhi i marrë nga kamera. Problemi mund të formulohet si marrja e vektorëve të veçorive për secilën klasë në imazhin në shqyrtim. Procesi mund të shihet si një proces kodimi që përfshin caktimin e një vlere për çdo veçori nga hapësira e veçorive për secilën klasë.

Nëse marrim parasysh 2 klasa objektesh: të rriturit dhe fëmijët. Ju mund të zgjidhni lartësinë dhe peshën si shenja. Siç shihet nga figura, këto dy klasa formojnë dy grupe të ndara, të cilat mund të shpjegohen nga veçoritë e zgjedhura. Megjithatë, nuk është gjithmonë e mundur të zgjidhen parametrat e saktë të matur si veçori të klasës. Për shembull, parametrat e zgjedhur nuk janë të përshtatshëm për krijimin e klasave të ndara të futbollistëve dhe basketbollistëve.

Detyra e dytë e njohjes është nxjerrja e tipareve ose vetive karakteristike nga imazhet burimore. Kjo detyrë mund të klasifikohet si parapërpunim. Nëse marrim parasysh detyrën e njohjes së të folurit, mund të dallojmë veçori të tilla si zanoret dhe bashkëtingëlloret. Atributi duhet të jetë një veti karakteristike e një klase të caktuar, dhe në të njëjtën kohë e përbashkët për këtë klasë. Veçoritë që karakterizojnë dallimet ndërmjet - veçorive ndërklasore. Karakteristikat e zakonshme për të gjitha klasat nuk përmbajnë informacion të dobishëm dhe nuk konsiderohen si veçori në detyrën e njohjes. Zgjedhja e veçorive është një nga detyrat e rëndësishme që lidhet me ndërtimin e një sistemi njohjeje.

Pasi të jenë përcaktuar veçoritë, duhet të përcaktohet procedura optimale e vendimit për klasifikim. Le të shqyrtojmë një sistem njohjeje modeli të krijuar për të njohur klasa të ndryshme M, të shënuara si m_1,m_2,…,m 3. Atëherë mund të supozojmë se hapësira e imazhit përbëhet nga rajone M, secila përmban pika që korrespondojnë me një imazh nga një klasë. Atëherë problemi i njohjes mund të konsiderohet si ndërtimi i kufijve që ndajnë klasat M bazuar në vektorët e matjes të miratuar.

Zgjidhja e problemit të parapërpunimit të imazhit, nxjerrja e veçorive dhe problemi i marrjes së një zgjidhjeje dhe klasifikimi optimal zakonisht shoqërohet me nevojën për të vlerësuar një numër parametrash. Kjo çon në problemin e vlerësimit të parametrave. Përveç kësaj, është e qartë se nxjerrja e veçorive mund të përdorë informacion shtesë bazuar në natyrën e klasave.

Objektet mund të krahasohen bazuar në paraqitjen e tyre si vektorë matës. Është i përshtatshëm për të paraqitur të dhënat e matjes në formën e numrave realë. Pastaj ngjashmëria e vektorëve të veçorive të dy objekteve mund të përshkruhet duke përdorur distancën Euklidiane.

ku d është dimensioni i vektorit të tipareve.

Ekzistojnë 3 grupe të metodave të njohjes së modelit:

  • Krahasimi me mostrën. Ky grup përfshin klasifikimin sipas mesatares më të afërt, klasifikimin sipas distancës me fqinjin më të afërt. Në grupin e krahasimit me kampionin mund të përfshihen edhe metodat e njohjes strukturore.
  • Metodat statistikore. Siç sugjeron emri, metodat statistikore përdorin disa informacione statistikore kur zgjidhin një problem njohjeje. Metoda përcakton nëse një objekt i përket një klase specifike në bazë të probabilitetit Në disa raste, kjo zbret në përcaktimin e probabilitetit të pasëm të një objekti që i përket një klase specifike, me kusht që karakteristikat e këtij objekti të kenë marrë vlerat e duhura. Një shembull është metoda e bazuar në rregullin e vendimit Bayesian.
  • Rrjetet nervore. Një klasë e veçantë e metodave të njohjes. Një tipar dallues nga të tjerët është aftësia për të mësuar.

Klasifikimi sipas mesatares më të afërt

Në qasjen klasike të njohjes së modelit, në të cilën një objekt i panjohur për klasifikim përfaqësohet si një vektor i veçorive elementare. Një sistem njohjeje i bazuar në veçori mund të zhvillohet në mënyra të ndryshme. Këta vektorë mund t'i njihen sistemit paraprakisht si rezultat i trajnimit ose të parashikohen në kohë reale bazuar në disa modele.

Një algoritëm i thjeshtë klasifikimi është grupimi i të dhënave të referencës së klasës duke përdorur vektorin e pritjes së klasës (mesatarja).

ku x(i,j) është tipari i j-të referues i klasës i, n_j është numri i vektorëve referencë të klasës i.

Atëherë një objekt i panjohur do t'i përkasë klasës i nëse është dukshëm më afër vektorit të pritjes matematikore të klasës i sesa me vektorët e pritjeve matematikore të klasave të tjera. Kjo metodë është e përshtatshme për problemet në të cilat pikat e secilës klasë janë të vendosura në mënyrë kompakte dhe larg pikave të klasave të tjera.

Vështirësitë do të shfaqen nëse klasat kanë një strukturë pak më komplekse, për shembull, si në figurë. Në këtë rast, klasa 2 ndahet në dy seksione të ndara që përshkruhen dobët nga një vlerë mesatare e vetme. Gjithashtu, klasa 3 është shumë e zgjatur, mostrat e klasës 3 me vlera të mëdha të koordinatave x_2 janë më afër vlerës mesatare të klasës 1 sesa klasa 3.

Problemi i përshkruar në disa raste mund të zgjidhet duke ndryshuar llogaritjen e distancës.

Ne do të marrim parasysh karakteristikën e "shpërndarjes" së vlerave të klasës - σ_i, përgjatë çdo drejtimi koordinativ i. Devijimi standard është i barabartë me rrënjën katrore të variancës. Distanca Euklidiane e shkallëzuar ndërmjet vektorit x dhe vektorit të pritjes x_c është

Kjo formulë e distancës do të zvogëlojë numrin e gabimeve të klasifikimit, por në realitet shumica e problemeve nuk mund të përfaqësohen nga një klasë kaq e thjeshtë.

Klasifikimi sipas distancës nga fqinji më i afërt

Një qasje tjetër ndaj klasifikimit është caktimi i një vektori të panjohur të tipareve x klasës me të cilën mostra individuale ky vektor është më i ngjashëm. Ky rregull quhet rregulli i fqinjit më të afërt. Klasifikimi i fqinjëve më të afërt mund të jetë më efikas edhe kur klasat kanë struktura komplekse ose kur klasat mbivendosen.

Kjo qasje nuk kërkon supozime rreth modeleve të shpërndarjes së vektorëve të veçorive në hapësirë. Algoritmi përdor vetëm informacione rreth mostrave të njohura të referencës. Metoda e zgjidhjes bazohet në llogaritjen e distancës x për çdo mostër në bazën e të dhënave dhe gjetjen e distancës minimale. Përparësitë e kësaj qasjeje janë të dukshme:

  • ju mund të shtoni mostra të reja në bazën e të dhënave në çdo kohë;
  • Strukturat e të dhënave të pemës dhe rrjetit reduktojnë numrin e distancave të llogaritura.

Për më tepër, zgjidhja do të jetë më e mirë nëse kërkojmë në bazën e të dhënave jo për një fqinj më të afërt, por për k. Më pas, për k > 1, ai siguron kampionimin më të mirë të shpërndarjes së vektorëve në hapësirën d-dimensionale. Sidoqoftë, përdorimi efikas i vlerave k varet nëse ka numra të mjaftueshëm në çdo rajon të hapësirës. Nëse ka më shumë se dy klasa, bëhet më e vështirë të merret vendimi i duhur.

Letërsia

  • M. Castrillon,. O. Deniz,. D. Hernández dhe J. Lorenzo, "Një krahasim i detektorëve të tipareve të fytyrës dhe fytyrës bazuar në kornizën e përgjithshme të zbulimit të objekteve të Viola-Jones", International Journal of Computer Vision, nr. 22, f. 481-494, 2011.
  • Y.-Q. Wang, "Një analizë e algoritmit të zbulimit të fytyrës Viola-Jones", Journal IPOL, 2013.
  • L. Shapiro dhe D. Stockman, Computer Vision, Binom. Laboratori i Dijes, 2006.
  • Z. N. G., Metodat e njohjes dhe aplikimi i tyre, Radio Sovjetike, 1972.
  • J. Tu, R. Gonzalez, Parimet matematikore të njohjes së modelit, Moskë: "Mir" Moskë, 1974.
  • Khan, H. Abdullah dhe M. Shamian Bin Zainal, "Algoritmi efikas i zbulimit të syve dhe gojës duke përdorur kombinimin e viola jones dhe zbulimin e pikselit të ngjyrës së lëkurës", International Journal of Engineering and Applied Sciences, Nr. Vol. 3 Nr. 4, 2013.
  • V. Gaede dhe O. Gunther, "Multidimensional Access Methods", ACM Computing Surveys, f. 170-231, 1998.

Kapitulli 3: Rishikimi analitik i metodave të njohjes së modelit dhe vendimmarrjes

Teoria e njohjes së modelit dhe automatizimi i kontrollit

Detyrat kryesore të njohjes së modeleve adaptive

Njohja është një proces informacioni i zbatuar nga disa konvertues informacioni (kanali inteligjent informacioni, sistemi i njohjes) që ka një hyrje dhe një dalje. Hyrja e sistemit është informacion se cilat karakteristika kanë objektet e paraqitura. Dalja e sistemit shfaq informacion se cilat klasa (imazhe të përgjithësuara) i përkasin objektet e njohura.

Kur krijoni dhe përdorni një sistem të automatizuar të njohjes së modelit, zgjidhen një sërë problemesh. Le t'i shqyrtojmë shkurtimisht dhe thjesht këto detyra. Vini re se autorë të ndryshëm kanë të njëjtat formulime të këtyre problemeve, dhe vetë grupi nuk përkon, pasi në një masë të caktuar varet nga modeli specifik matematik në të cilin bazohet ky apo ai sistem njohjeje. Për më tepër, disa probleme në modele të caktuara njohjeje nuk kanë zgjidhje dhe, në përputhje me rrethanat, nuk parashtrohen.

Detyra e formalizimit të fushës lëndore

Në thelb kjo detyrë është një detyrë kodimi. Përpilohet një listë e klasave të përgjithësuara të cilave mund t'i përkasin zbatimet specifike të objekteve, si dhe një listë e karakteristikave që këto objekte, në parim, mund të kenë.

Detyra e formimit të një kampioni trajnimi

Kompleti i trajnimit është një bazë të dhënash që përmban përshkrime të zbatimeve të objekteve specifike në gjuhën e veçorive, të plotësuar me informacione për përkatësinë e këtyre objekteve në klasa të caktuara njohjeje.

Detyra e trajnimit të sistemit të njohjes

Mostra e trajnimit përdoret për të formuar imazhe të përgjithësuara të klasave të njohjes bazuar në përgjithësimin e informacionit se cilat veçori kanë objektet e kampionit të trajnimit që i përkasin kësaj klase dhe klasave të tjera.

Problemi i zvogëlimit të dimensionit të hapësirës së veçorive

Pas trajnimit të sistemit të njohjes (marrja e statistikave për shpërndarjen e frekuencës së veçorive sipas klasës), bëhet e mundur të përcaktohet për secilën veçori vlera e tij për zgjidhjen e problemit të njohjes. Pas kësaj, funksionet më pak të vlefshme mund të hiqen nga sistemi i veçorive. Pastaj sistemi i njohjes duhet të trajnohet përsëri, pasi si rezultat i heqjes së disa veçorive, statistikat e shpërndarjes së veçorive të mbetura sipas klasave ndryshojnë. Ky proces mund të përsëritet, d.m.th. të jetë përsëritës.

Detyrë njohjeje

Njihen objektet e mostrës së njohur, të cilat, në veçanti, mund të përbëhen nga një objekt. Mostra e njohjes është formuar në mënyrë të ngjashme me atë të trajnimit, por nuk përmban informacione për përkatësinë e objekteve në klasa, pasi kjo është pikërisht ajo që përcaktohet gjatë procesit të njohjes. Rezultati i njohjes së secilit objekt është një shpërndarje ose listë e të gjitha klasave të njohjes në rend zbritës të shkallës së ngjashmërisë së objektit të njohur me to.

Problemi i kontrollit të cilësisë së njohjes

Pas njohjes, mund të përcaktohet përshtatshmëria e tij. Për objektet e kampionit të trajnimit, kjo mund të bëhet menjëherë, pasi për ta thjesht dihet se cilës klasa i përkasin. Për objekte të tjera ky informacion mund të merret më vonë. Në çdo rast, probabiliteti mesatar aktual i gabimit për të gjitha klasat e njohjes mund të përcaktohet, si dhe probabiliteti i gabimit kur caktohet një objekt i njohur në një klasë specifike.

Rezultatet e njohjes duhet të interpretohen duke marrë parasysh informacionin e disponueshëm për cilësinë e njohjes.

Problemi i përshtatjes

Nëse, si rezultat i procedurës së kontrollit të cilësisë, konstatohet se është e pakënaqshme, atëherë përshkrimet e objekteve të njohura gabimisht mund të kopjohen nga mostra e njohjes në atë të trajnimit, të plotësohen me informacion të përshtatshëm klasifikimi dhe të përdoren për të riformatuar rregullat e vendimit. , d.m.th. duke marrë parasysh. Për më tepër, nëse këto objekte nuk i përkasin klasave ekzistuese të njohjes, gjë që mund të jetë arsyeja e njohjes së gabuar të tyre, atëherë kjo listë mund të zgjerohet. Si rezultat, sistemi i njohjes përshtatet dhe fillon t'i klasifikojë në mënyrë adekuate këto objekte.

Problemi i njohjes së kundërt

Detyra e njohjes është që për një objekt të caktuar, bazuar në karakteristikat e tij të njohura, sistemi përcakton përkatësinë e tij në një klasë të panjohur më parë. Në problemin e njohjes së kundërt, përkundrazi, për një klasë të caktuar njohjeje, sistemi përcakton se cilat veçori janë më karakteristike për objektet e kësaj klase dhe cilat jo (ose cilat objekte të mostrës së trajnimit i përkasin kësaj klase).

Probleme të analizës klaster dhe konstruktive

Grupet janë grupe të tilla objektesh, klasash ose veçorish që brenda çdo grupi ato janë sa më të ngjashme, dhe midis grupimeve të ndryshme ato janë sa më të ndryshme.

Një konstrukt (në kontekstin e diskutuar në këtë seksion) është një sistem grupimesh kundërshtare. Kështu, në një kuptim të caktuar, konstruktet janë rezultat i analizës së grupimeve të grupimeve.

Në analizën e grupimeve, shkalla e ngjashmërisë dhe ndryshimit midis objekteve (klasave, veçorive) matet në mënyrë sasiore dhe ky informacion përdoret për klasifikim. Rezultati i analizës së grupimeve është klasifikimi i objekteve në grupime. Ky klasifikim mund të përfaqësohet në formën e rrjeteve semantike.

Detyra e analizës njohëse

Në analizën kognitive, informacioni për ngjashmëritë dhe ndryshimet midis klasave ose karakteristikave është në vetvete me interes për studiuesin, dhe jo për ta përdorur atë për klasifikim, si në analizën grupore dhe konstruktive.

Nëse e njëjta veçori është karakteristikë e dy klasave të njohjes, atëherë kjo kontribuon në ngjashmërinë e këtyre dy klasave. Nëse për njërën nga klasat kjo veçori nuk është karakteristike, atëherë kjo kontribuon në ndryshimin.

Nëse dy tipare lidhen me njëra-tjetrën, atëherë në një farë kuptimi ato mund të konsiderohen si një veçori, dhe nëse janë antikorrelative, atëherë si të ndryshme. Duke marrë parasysh këtë rrethanë, në ngjashmërinë dhe ndryshimin e tyre një kontribut të caktuar jep edhe prania e karakteristikave të ndryshme në klasa të ndryshme.

Rezultatet e analizës kognitive mund të paraqiten në formën e diagrameve njohëse.

Metodat e njohjes së modeleve dhe karakteristikat e tyre

Parimet e klasifikimit të metodave të njohjes së modeleve

Njohja e modelit i referohet problemit të ndërtimit dhe aplikimit të operacioneve formale mbi paraqitjet numerike ose simbolike të objekteve në botën reale ose ideale, rezultatet e të cilave pasqyrojnë marrëdhëniet ekuivalente midis këtyre objekteve. Marrëdhëniet ekuivalente shprehin përkatësinë e objekteve të vlerësuara në çdo klasë, të konsideruar si njësi semantike të pavarura.

Gjatë ndërtimit të algoritmeve të njohjes, klasat e ekuivalencës mund të specifikohen nga një studiues i cili përdor idetë e tij kuptimplota ose përdor informacion shtesë të jashtëm për ngjashmëritë dhe dallimet e objekteve në kontekstin e problemit që zgjidhet. Pastaj ata flasin për "njohjen me një mësues". Përndryshe, d.m.th. Kur një sistem i automatizuar zgjidh një problem klasifikimi pa përdorimin e informacionit të jashtëm të trajnimit, ne flasim për klasifikim automatik ose "njohje të pambikëqyrur". Shumica e algoritmeve të njohjes së modeleve kërkojnë përdorimin e fuqisë llogaritëse shumë të rëndësishme, e cila mund të sigurohet vetëm nga teknologjia kompjuterike me performancë të lartë.

Autorë të ndryshëm (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, F.E. Temnikov, J. Tu, R. Gonzalez, P. K. Fu, Ya.Z. Tsypkin, etj.) japin një tipologji të ndryshme të metodave të njohjes së modeleve. Disa autorë bëjnë dallimin midis metodave parametrike, joparametrike dhe heuristike, të tjerë identifikojnë grupe metodash bazuar në shkollat ​​dhe tendencat e krijuara historikisht në këtë fushë. Për shembull, në veprën, e cila ofron një pasqyrë akademike të metodave të njohjes, përdoret tipologjia e mëposhtme e metodave të njohjes së modeleve:

  • metodat e bazuara në parimin e ndarjes;
  • metodat statistikore;
  • metodat e ndërtuara mbi bazën e "funksioneve të mundshme";
  • metodat për llogaritjen e vlerësimeve (votim);
  • metodat e bazuara në llogaritjen propozicionale, veçanërisht në aparatin e algjebrës logjike.

Ky klasifikim bazohet në ndryshimin në metodat formale të njohjes së modelit dhe për këtë arsye nuk merret parasysh qasja heuristike e njohjes, e cila ka marrë zhvillim të plotë dhe adekuat në sistemet e ekspertëve. Qasja heuristike bazohet në njohuritë dhe intuitën e vështirë për t'u formalizuar të studiuesit. Në këtë rast, vetë studiuesi përcakton se çfarë informacioni dhe si duhet të përdorë sistemi për të arritur efektin e kërkuar të njohjes.

Një tipologji e ngjashme e metodave të njohjes me shkallë të ndryshme detajesh gjendet në shumë vepra mbi njohjen. Në të njëjtën kohë, tipologjitë e njohura nuk marrin parasysh një karakteristikë shumë domethënëse, e cila pasqyron specifikën e mënyrës së përfaqësimit të njohurive për një fushë lëndore duke përdorur çdo algoritëm formal të njohjes së modelit.

D.A. Pospelov (1990) identifikon dy mënyra kryesore të paraqitjes së njohurive:

  • intensional, në formën e një diagrami të lidhjeve ndërmjet atributeve (veçorive).
  • shtrirë, me ndihmën e fakteve specifike (objekte, shembuj).

Paraqitja intensive kap modelet dhe lidhjet që shpjegojnë strukturën e të dhënave. Në lidhje me detyrat diagnostike, një fiksim i tillë konsiston në përcaktimin e operacioneve mbi atributet (veçoritë) e objekteve që çojnë në rezultatin e kërkuar diagnostik. Paraqitjet intensive zbatohen përmes operacioneve mbi vlerat e atributeve dhe nuk nënkuptojnë operacione mbi fakte specifike informacioni (objekte).

Nga ana tjetër, paraqitjet shtrirëse të njohurive shoqërohen me përshkrimin dhe fiksimin e objekteve specifike nga fusha lëndore dhe zbatohen në operacione, elementët e të cilave janë objekte si sisteme integrale.

Një analogji mund të tërhiqet midis paraqitjeve intensive dhe zgjeruese të njohurive dhe mekanizmave që qëndrojnë në themel të aktivitetit të hemisferës së majtë dhe të djathtë të trurit të njeriut. Nëse hemisfera e djathtë karakterizohet nga një përfaqësim holistik prototip i botës përreth, atëherë hemisfera e majtë funksionon me modele që pasqyrojnë lidhjet midis atributeve të kësaj bote.

Dy mënyrat themelore të përfaqësimit të njohurive të përshkruara më sipër na lejojnë të propozojmë klasifikimin e mëposhtëm të metodave të njohjes së modelit:

  • metodat intensive të bazuara në operacione me veçori.
  • metodat zgjeruese të bazuara në operacionet me objekte.

Duhet theksuar veçanërisht se ekzistenca e pikërisht këtyre dy (dhe vetëm dy) grupeve të metodave të njohjes: ato që veprojnë me shenja dhe ato që veprojnë me objekte, është thellësisht e natyrshme. Nga ky këndvështrim, asnjë nga këto metoda, të marra veçmas nga tjetra, nuk na lejon të formojmë një pasqyrim adekuat të fushës së temës. Sipas autorëve, ekziston një marrëdhënie plotësuese midis këtyre metodave në kuptimin e N. Bohr-it, prandaj, sistemet premtuese të njohjes duhet të ofrojnë zbatimin e të dyja këtyre metodave dhe jo të njërës prej tyre.

Kështu, klasifikimi i metodave të njohjes së propozuar nga D. A. Pospelov bazohet në modelet themelore që qëndrojnë në themel të mënyrës njerëzore të njohjes në përgjithësi, gjë që e vendos atë në një pozicion krejtësisht të veçantë (të privilegjuar) në krahasim me klasifikimet e tjera, të cilat në këtë sfond duken më të lehta dhe artificiale.

Metodat intensive

Një tipar dallues i metodave intensive është se ato përdorin karakteristika të ndryshme të veçorive dhe lidhjet e tyre si elemente të operacioneve gjatë ndërtimit dhe aplikimit të algoritmeve të njohjes së modeleve. Elementë të tillë mund të jenë vlera individuale ose intervale të vlerave të veçorive, vlerat mesatare dhe variancat, matricat e marrëdhënieve të veçorive, etj., mbi të cilat kryhen veprimet, të shprehura në formë analitike ose konstruktive. Në të njëjtën kohë, objektet në këto metoda nuk konsiderohen si njësi informacioni integrale, por veprojnë si tregues për vlerësimin e ndërveprimit dhe sjelljes së atributeve të tyre.

Grupi i metodave intensive për njohjen e modelit është i gjerë dhe ndarja e tij në nënklasa është deri në një masë e kushtëzuar.

Metodat e bazuara në vlerësimet e densitetit të shpërndarjes së vlerave të veçorive

Këto metoda të njohjes së modelit janë huazuar nga teoria klasike e vendimeve statistikore, në të cilën objektet e studimit konsiderohen si realizime të një ndryshoreje të rastësishme shumëdimensionale të shpërndarë në hapësirën e veçorive sipas disa ligjeve. Ato bazohen në një skemë vendimmarrëse Bayesian që apelon në probabilitete a priori të objekteve që i përkasin një klase të caktuar të njohur dhe dendësi të shpërndarjes së kushtëzuar të vlerave të vektorit të veçorive. Këto metoda bazohen në përcaktimin e raportit të gjasave në zona të ndryshme të hapësirës së veçorive shumëdimensionale.

Një grup metodash të bazuara në vlerësimin e densitetit të shpërndarjes së vlerave të veçorive lidhet drejtpërdrejt me metodat e analizës diskriminuese. Qasja Bayesiane ndaj vendimmarrjes është një nga të ashtuquajturat metoda parametrike më të zhvilluara në statistikat moderne, për të cilën shprehja analitike e ligjit të shpërndarjes (në këtë rast, ligji normal) konsiderohet i njohur dhe vetëm një numër i vogël parametrash ( kërkohet që të vlerësohen vektorët e vlerave mesatare dhe matricat e kovariancës.

Vështirësitë kryesore në përdorimin e këtyre metodave janë nevoja për të mbajtur mend të gjithë kampionin e trajnimit për të llogaritur vlerësimet e densitetit lokal të shpërndarjes së probabilitetit dhe ndjeshmërinë e lartë ndaj mospërfaqësimit të kampionit të trajnimit.

Metodat e bazuara në supozimet për klasën e funksioneve të vendimit

Në këtë grup metodash, forma e përgjithshme e funksionit të vendimit konsiderohet e njohur dhe specifikohet cilësia e tij funksionale. Bazuar në këtë funksional, përafrimi më i mirë i funksionit të vendimit gjendet duke përdorur sekuencën e trajnimit. Më të zakonshmet janë paraqitjet e funksioneve të vendimit në formën e polinomeve jolineare lineare dhe të përgjithësuara. Rregulli i vendimit për cilësinë funksionale zakonisht shoqërohet me gabim klasifikimi.

Avantazhi kryesor i metodave të bazuara në supozimet për klasën e funksioneve të vendimit është qartësia e formulimit matematikor të problemit të njohjes si një problem i kërkimit të një ekstremi. Shumëllojshmëria e metodave në këtë grup shpjegohet me gamën e gjerë të funksioneve të cilësisë së rregullave të vendimit dhe algoritmeve të kërkimit ekstrem të përdorur. Një përgjithësim i algoritmeve në shqyrtim, të cilat përfshijnë, në veçanti, algoritmin e Njutonit, algoritmet e tipit perceptron, etj., është metoda e përafrimit stokastik.

Aftësitë e algoritmeve të kërkimit të ekstremumeve të gradientit, veçanërisht në grupin e rregullave lineare të vendimit, janë studiuar mjaft mirë. Konvergjenca e këtyre algoritmeve është vërtetuar vetëm për rastin kur klasat e njohura të objekteve shfaqen në hapësirën e veçorive nga struktura kompakte gjeometrike.

Një cilësi mjaft e lartë e rregullit të vendimit mund të arrihet duke përdorur algoritme që nuk kanë prova të rrepta matematikore të konvergjencës së zgjidhjes me ekstremin global. Algoritme të tilla përfshijnë një grup të madh procedurash programimi heuristik që përfaqësojnë drejtimin e modelimit evolucionar. Modelimi evolucionar është një metodë bionike e huazuar nga natyra. Ai bazohet në përdorimin e mekanizmave të njohur të evolucionit për të zëvendësuar procesin e modelimit kuptimplotë të një objekti kompleks me modelimin fenomenologjik të evolucionit të tij. Një përfaqësues i njohur i modelimit evolucionar në njohjen e modelit është metoda e kontabilitetit në grup të argumenteve (MGUA). Baza e GMDH është parimi i vetë-organizimit, dhe algoritmet GMDH riprodhojnë skemën e përzgjedhjes masive.

Megjithatë, arritja e qëllimeve praktike në këtë rast nuk shoqërohet me nxjerrjen e njohurive të reja për natyrën e objekteve që njihen. Mundësia e nxjerrjes së kësaj njohurie, veçanërisht njohurive për mekanizmat e ndërveprimit të atributeve (veçorive), këtu kufizohet thelbësisht nga struktura e dhënë e një ndërveprimi të tillë, e fiksuar në formën e zgjedhur të funksioneve të vendimit.

Metodat Boolean

Metodat logjike të njohjes së modelit bazohen në aparatin e algjebrës logjike dhe lejojnë që dikush të operojë me informacionin që përmbahet jo vetëm në veçori individuale, por edhe në kombinime të vlerave të veçorive. Në këto metoda, vlerat e çdo atributi konsiderohen si ngjarje elementare.

Në formën më të përgjithshme, metodat logjike mund të karakterizohen si një lloj kërkimi përmes një kampioni trajnimi të modeleve logjike dhe formimit të një sistemi të caktuar rregullash vendimesh logjike (për shembull, në formën e lidhjeve të ngjarjeve elementare), secila prej që ka peshën e vet. Grupi i metodave logjike është i larmishëm dhe përfshin metoda me kompleksitet dhe thellësi të ndryshme analize. Për veçoritë dikotomike (Boolean), janë të njohura të ashtuquajturit klasifikues të ngjashëm me pemën, metoda e testimit në fund të fundit, algoritmi "Bark" etj.

Algoritmi "Kora", ashtu si metodat e tjera logjike të njohjes së modelit, është mjaft intensiv nga pikëpamja llogaritëse, pasi kërkohet një kërkim i plotë kur zgjidhni lidhjet. Prandaj, gjatë përdorimit të metodave logjike, vendosen kërkesa të larta për organizimin efikas të procesit llogaritës dhe këto metoda funksionojnë mirë me dimensione relativisht të vogla të hapësirës së veçorive dhe vetëm në kompjuterë të fuqishëm.

Metodat gjuhësore (strukturore).

Metodat gjuhësore të njohjes së modeleve bazohen në përdorimin e gramatikave speciale që gjenerojnë gjuhë që mund të përdoren për të përshkruar grupin e vetive të objekteve të njohura.

Për klasa të ndryshme objektesh, identifikohen elementë të paarritshëm (atomikë) (nënimazhe, atribute) dhe marrëdhënie të mundshme ndërmjet tyre. Gramatika i referohet rregullave për ndërtimin e objekteve nga këta elementë jo të prejardhur.

Pra, çdo objekt është një përmbledhje elementesh jo-derivative, të “lidhura” me njëri-tjetrin në një mënyrë ose në një tjetër ose, me fjalë të tjera, me një “fjali” të ndonjë “gjuhe”. Do të doja të theksoja veçanërisht vlerën shumë domethënëse ideologjike të këtij mendimi.

Duke analizuar në mënyrë sintaksore (analizimin gramatikor) të një "fjalie" përcaktohet "korrektësia" e saj sintaksore ose, në mënyrë ekuivalente, nëse një gramatikë fikse që përshkruan një klasë mund të gjenerojë përshkrimin ekzistues të një objekti.

Sidoqoftë, detyra e rindërtimit (përcaktimit) të gramatikave nga një grup i caktuar pohimesh (fjalish - përshkrimesh të objekteve) që gjenerojnë një gjuhë të caktuar është e vështirë të zyrtarizohet.

Metodat e zgjeruara

Në metodat e këtij grupi, në ndryshim nga drejtimi intensiv, çdo objekti të studiuar, në një masë më të madhe ose më të vogël, i jepet rëndësi diagnostike e pavarur. Në thelbin e tyre, këto metoda janë afër qasjes klinike, e cila i konsideron njerëzit jo si një zinxhir objektesh të renditura nga një tregues ose një tjetër, por si sisteme integrale, secila prej të cilave është individuale dhe ka një vlerë të veçantë diagnostikuese. Një qëndrim i tillë i kujdesshëm ndaj objekteve të kërkimit nuk lejon përjashtimin ose humbjen e informacionit për secilin objekt individual, gjë që ndodh kur përdoren metoda të drejtimit intensiv që përdorin objekte vetëm për të zbuluar dhe regjistruar modele të sjelljes së atributeve të tyre.

Operacionet kryesore në njohjen e modeleve duke përdorur metodat e diskutuara janë operacionet e përcaktimit të ngjashmërive dhe dallimeve të objekteve. Objektet në grupin e specifikuar të metodave luajnë rolin e precedentëve diagnostikues. Për më tepër, në varësi të kushteve të një detyre specifike, roli i një precedenti individual mund të ndryshojë brenda kufijve më të gjerë: nga ai kryesor dhe përcaktues deri te pjesëmarrja shumë indirekte në procesin e njohjes. Nga ana tjetër, kushtet e problemit mund të kërkojnë pjesëmarrjen e një numri të ndryshëm precedentësh diagnostikues për një zgjidhje të suksesshme: nga një në secilën klasë të njohur deri në madhësinë e plotë të kampionit, si dhe metoda të ndryshme për llogaritjen e masave të ngjashmërisë dhe ndryshimit të objekteve. . Këto kërkesa shpjegojnë ndarjen e mëtejshme të metodave zgjeruese në nënklasa.

Metoda e krahasimit me një prototip

Kjo është metoda më e thjeshtë e njohjes zgjatuese. Përdoret, për shembull, në rastin kur klasat e njohura shfaqen në hapësirën e veçorive nga grupime kompakte gjeometrike. Në këtë rast, zakonisht qendra e grupimit gjeometrik të klasës (ose objekti më afër qendrës) zgjidhet si pikë prototip.

Për të klasifikuar një objekt të panjohur, gjendet prototipi më i afërt me të dhe objekti i përket së njëjtës klasë si ky prototip. Natyrisht, në këtë metodë nuk krijohen imazhe të përgjithësuara të klasës.

Lloje të ndryshme distancash mund të përdoren si masë e afërsisë. Shpesh, për tipare dikotomike, përdoret distanca Hamming, e cila në këtë rast është e barabartë me katrorin e distancës Euklidiane. Në këtë rast, rregulli i vendimit për klasifikimin e objekteve është i barabartë me një funksion vendimi linear.

Ky fakt duhet theksuar veçanërisht. Ai tregon qartë lidhjen midis prototipit dhe paraqitjes së atributeve të informacionit në lidhje me strukturën e të dhënave. Duke përdorur paraqitjen e mësipërme, mund të konsiderohet, për shembull, çdo shkallë matëse tradicionale, e cila është një funksion linear i vlerave të karakteristikave dikotomike, si një prototip hipotetik diagnostik. Nga ana tjetër, nëse një analizë e strukturës hapësinore të klasave të njohura na lejon të nxjerrim një përfundim rreth kompaktësisë së tyre gjeometrike, atëherë mjafton të zëvendësojmë secilën prej këtyre klasave me një prototip, i cili në fakt është i barabartë me një model diagnostik linear.

Në praktikë, sigurisht, situata është shpesh e ndryshme nga shembulli i idealizuar i përshkruar. Një studiues që synon të aplikojë një metodë njohjeje të bazuar në krahasimin me klasat diagnostike prototipe përballet me probleme të vështira.

Së pari, kjo është zgjedhja e masës së afërsisë (metrike), e cila mund të ndryshojë ndjeshëm konfigurimin hapësinor të shpërndarjes së objekteve. Së dyti, një problem i pavarur është analiza e strukturave shumëdimensionale të të dhënave eksperimentale. Të dyja këto probleme janë veçanërisht të mprehta për studiuesin në kushte të dimensionalitetit të lartë të hapësirës së tipareve, karakteristikë e problemeve reale.

k metoda e fqinjëve më të afërt

Metoda e k-fqinjës më të afërt për zgjidhjen e problemeve të analizës diskriminuese u propozua për herë të parë në vitin 1952. Është si më poshtë.

Kur klasifikoni një objekt të panjohur, gjendet një numër i caktuar (k) i gjeometrikisht më i afërt me të në hapësirën e veçorive të objekteve të tjera (fqinjët më të afërt) me anëtarësim tashmë të njohur në klasa të njohura. Vendimi për të caktuar një objekt të panjohur në një klasë të caktuar diagnostikuese merret duke analizuar informacionin rreth kësaj përkatësie të njohur të fqinjëve të tij më të afërt, për shembull, duke përdorur një numërim të thjeshtë votash.

Fillimisht, metoda k-fqinjët më të afërt u konsiderua si një metodë joparametrike për vlerësimin e raportit të gjasave. Për këtë metodë, u morën vlerësime teorike të efektivitetit të saj në krahasim me klasifikuesin optimal Bayesian. Është vërtetuar se probabilitetet e gabimit asimptotik për metodën k-fqinjët më të afërt tejkalojnë gabimet e rregullit të Bayes jo më shumë se dy herë.

Kur përdor metodën k-fqinjët më të afërt për njohjen e modelit, studiuesi duhet të zgjidhë problemin e vështirë të zgjedhjes së një metrike për të përcaktuar afërsinë e objekteve të diagnostikuar. Ky problem në kushtet e dimensionalitetit të lartë të hapësirës së veçorive rëndohet jashtëzakonisht shumë për shkak të kompleksitetit të mjaftueshëm të kësaj metode, e cila bëhet e rëndësishme edhe për kompjuterët me performancë të lartë. Prandaj, këtu, ashtu si në metodën e krahasimit me një prototip, është e nevojshme të zgjidhet problemi krijues i analizimit të strukturës shumëdimensionale të të dhënave eksperimentale për të minimizuar numrin e objekteve që përfaqësojnë klasa diagnostikuese.

Nevoja për të zvogëluar numrin e objekteve në kampionin e trajnimit (precedentë diagnostikues) është një disavantazh i kësaj metode, pasi zvogëlon përfaqësimin e kampionit të trajnimit.

Algoritme për llogaritjen e vlerësimeve (“votim”)

Parimi i funksionimit të algoritmeve të llogaritjes së vlerësimit (ABO) është llogaritja e përparësive (pikat e ngjashmërisë) që karakterizojnë "afërsinë" e objekteve të njohura dhe referuese sipas një sistemi të ansambleve të veçorive, i cili është një sistem nëngrupesh të një grupi të caktuar karakteristikash. .

Ndryshe nga të gjitha metodat e diskutuara më parë, algoritmet për llogaritjen e vlerësimeve funksionojnë me përshkrimet e objekteve në një mënyrë thelbësisht të re. Për këto algoritme, objektet ekzistojnë njëkohësisht në nënhapësira shumë të ndryshme të hapësirës së veçorive. Klasa ABO e merr idenë e përdorimit të veçorive në përfundimin e saj logjik: meqenëse nuk dihet gjithmonë se cilat kombinime të veçorive janë më informuese, atëherë në ABO shkalla e ngjashmërisë së objekteve llogaritet duke krahasuar të gjitha kombinimet e mundshme ose specifike të veçoritë e përfshira në përshkrimet e objekteve.

Autorët i quajnë kombinimet e përdorura të veçorive (nënhapësira) grupe mbështetëse ose grupe përshkrimesh të pjesshme të objekteve. Prezantohet koncepti i afërsisë së përgjithësuar midis objektit të njohur dhe objekteve të mostrës së trajnimit (me një klasifikim të njohur), të cilat quhen objekte referencë. Kjo afërsi përfaqësohet nga një kombinim i afërsisë së objektit të njohur me objektet e referencës, të llogaritur në grupe përshkrimesh të pjesshme. Kështu, ABO është një shtrirje e metodës k-fqinjët më të afërt, në të cilën afërsia e objekteve konsiderohet vetëm në një hapësirë ​​të caktuar të veçorive.

Një shtrirje tjetër e ABO është se në këto algoritme detyra e përcaktimit të ngjashmërisë dhe ndryshimit të objekteve formulohet si parametrike dhe theksohet faza e vendosjes së ABO bazuar në grupin e trajnimit, në të cilën vlerat optimale të futura. zgjidhen parametrat. Kriteri i cilësisë është gabimi i njohjes, dhe fjalë për fjalë gjithçka është e parametrizuar:

  • rregullat për llogaritjen e afërsisë së objekteve bazuar në karakteristikat individuale;
  • rregullat për llogaritjen e afërsisë së objekteve në nënhapësirat e veçorive;
  • shkalla e rëndësisë së një objekti të caktuar referimi si precedent diagnostik;
  • rëndësia e kontributit të çdo grupi referencë karakteristikash në vlerësimin përfundimtar të ngjashmërisë së objektit të njohur me çdo klasë diagnostike.

Parametrat ABO specifikohen në formën e vlerave të pragut dhe (ose) si pesha të përbërësve të specifikuar.

Aftësitë teorike të AVO nuk janë të paktën jo më të ulëta se ato të çdo algoritmi tjetër të njohjes së modelit, pasi me ndihmën e AVO mund të zbatohen të gjitha operacionet e mundshme me objektet në studim.

Por, siç ndodh zakonisht, zgjerimi i aftësive potenciale has në vështirësi të mëdha në zbatimin praktik të tyre, veçanërisht në fazën e ndërtimit (akordimit) të algoritmeve të këtij lloji.

Disa vështirësi u vunë re më herët kur diskutuam metodën k-fqinjët më të afërt, e cila mund të interpretohet si një version i cunguar i ABO. Mund të konsiderohet gjithashtu në formë parametrike dhe ta zvogëlojë problemin në gjetjen e një metrike të ponderuar të llojit të zgjedhur. Në të njëjtën kohë, tashmë këtu, për problemet me dimensione të larta, lindin pyetje dhe probleme komplekse teorike që lidhen me organizimin e një procesi efektiv llogaritës.

Për AVO, nëse përpiqeni të përdorni aftësitë e këtyre algoritmeve në masën më të plotë, këto vështirësi rriten shumë herë.

Problemet e vërejtura shpjegojnë se në praktikë, përdorimi i ABO për zgjidhjen e problemeve me dimensione të larta shoqërohet me futjen e disa kufizimeve dhe supozimeve heuristike. Në veçanti, ekziston një shembull i njohur i përdorimit të ABO në psikodiagnostikë, në të cilin u testua një lloj ABO, i cili në fakt është ekuivalent me metodën k-fqinjët më të afërt.

Rregullat e vendimit Kolektive

Për të përfunduar rishikimin e metodave të njohjes së modelit, le të ndalemi në një qasje më shumë. Këto janë të ashtuquajturat kolektivë të rregullave të vendimit (DRG).

Meqenëse algoritme të ndryshme njohjeje manifestohen ndryshe në të njëjtin mostër objektesh, natyrshëm lind pyetja për një rregull vendimi sintetik që përdor në mënyrë adaptive pikat e forta të këtyre algoritmeve. Rregulli i vendimit sintetik përdor një skemë njohjeje me dy nivele. Në nivelin e parë, funksionojnë algoritmet e njohjes private, rezultatet e të cilave kombinohen në nivelin e dytë në bllokun e sintezës. Metodat më të zakonshme të një bashkimi të tillë bazohen në identifikimin e fushave të kompetencës së një algoritmi të veçantë. Mënyra më e thjeshtë për të gjetur fushat e kompetencës është ndarja a priori e hapësirës së atributeve bazuar në konsideratat profesionale të një shkence të caktuar (për shembull, shtresimi i kampionit sipas një atributi të caktuar). Më pas, për secilën nga zonat e zgjedhura, ndërtohet algoritmi i tij i njohjes. Një metodë tjetër bazohet në përdorimin e analizës formale për të përcaktuar zonat lokale të hapësirës së veçorive si lagje të objekteve të njohura për të cilat është vërtetuar suksesi i çdo algoritmi të veçantë njohjeje.

Qasja më e përgjithshme për ndërtimin e një blloku sintezë konsideron treguesit rezultues të algoritmeve të veçanta si karakteristikat fillestare për ndërtimin e një rregulli të ri të përgjithësuar të vendimit. Në këtë rast, mund të përdoren të gjitha metodat e mësipërme të drejtimeve intensive dhe zgjeruese në njohjen e modelit. Efektive për zgjidhjen e problemit të krijimit të një grupi rregullash vendimi janë algoritmet logjike të tipit “Kora” dhe algoritmet për llogaritjen e vlerësimeve (ABO), të cilat përbëjnë bazën e të ashtuquajturës qasje algjebrike, e cila ofron studimin dhe përshkrimin konstruktiv të algoritmet e njohjes, në kuadrin e të cilave përshtaten të gjitha llojet ekzistuese të algoritmeve.

Analiza krahasuese e metodave të njohjes së modeleve

Le të krahasojmë metodat e njohjes së modelit të përshkruara më sipër dhe të vlerësojmë shkallën e përshtatshmërisë së tyre me kërkesat e formuluara në seksionin 3.3.3 për modelet SDA për sistemet e kontrollit të automatizuar adaptues për sistemet komplekse.

Për zgjidhjen e problemeve reale nga grupi i metodave të drejtimit intensiv, kanë vlerë praktike metodat parametrike dhe metodat e bazuara në propozime për formën e funksioneve të vendimmarrjes. Metodat parametrike formojnë bazën e metodologjisë tradicionale për ndërtimin e treguesve. Aplikimi i këtyre metodave në problemet reale shoqërohet me vendosjen e kufizimeve të forta në strukturën e të dhënave, të cilat çojnë në modele diagnostike lineare me vlerësime shumë të përafërta të parametrave të tyre. Kur përdor metoda të bazuara në supozime për formën e funksioneve të vendimmarrjes, studiuesi detyrohet gjithashtu t'i drejtohet modeleve lineare. Kjo është për shkak të dimensionalitetit të lartë të hapësirës së veçorive, karakteristikë e problemeve reale, e cila, me rritjen e shkallës së funksionit të vendimmarrjes polinomiale, jep një rritje të madhe të numrit të anëtarëve të saj me një rritje problematike shoqëruese të cilësisë së njohjes. Kështu, duke projektuar zonën e aplikimit potencial të metodave të njohjes intensive në probleme reale, marrim një pamje që korrespondon me metodologjinë tradicionale të zhvilluar mirë të modeleve lineare të diagnostikimit.

Vetitë e modeleve diagnostike lineare, në të cilat treguesi diagnostikues përfaqësohet nga një shumë e ponderuar e karakteristikave fillestare, janë studiuar mirë. Rezultatet e këtyre modeleve (me normalizimin e duhur) interpretohen si distanca nga objektet në studim në një hiperplan në hapësirën e veçorive ose, në mënyrë ekuivalente, si projeksione të objekteve në një vijë të drejtë në këtë hapësirë. Prandaj, modelet lineare janë adekuate vetëm për konfigurime të thjeshta gjeometrike të zonave të hapësirës së veçorive në të cilat hartohen objekte të klasave të ndryshme diagnostikuese. Me shpërndarje më komplekse, këto modele në thelb nuk mund të pasqyrojnë shumë karakteristika të strukturës së të dhënave eksperimentale. Në të njëjtën kohë, karakteristika të tilla mund të ofrojnë informacion të vlefshëm diagnostikues.

Në të njëjtën kohë, shfaqja në çdo problem real të strukturave të thjeshta shumëdimensionale (në veçanti, shpërndarjet normale shumëdimensionale) duhet të konsiderohet si një përjashtim dhe jo si rregull. Shpesh klasat diagnostikuese formohen në bazë të kritereve komplekse të jashtme, gjë që automatikisht sjell heterogjenitet gjeometrik të këtyre klasave në hapësirën e veçorive. Kjo është veçanërisht e vërtetë për kriteret “jetike”, më të shpeshta që hasen në praktikë. Në kushte të tilla, përdorimi i modeleve lineare kap vetëm modelet më "të përafërta" të informacionit eksperimental.

Përdorimi i metodave zgjeruese nuk shoqërohet me ndonjë supozim për strukturën e informacionit eksperimental, përveç se brenda klasave të njohura duhet të ketë një ose më shumë grupe objektesh disi të ngjashme, dhe objektet e klasave të ndryshme duhet të jenë disi të ndryshëm nga njëri-tjetri. Natyrisht, për çdo madhësi të kufizuar të kampionit të trajnimit (dhe nuk mund të jetë ndonjë tjetër), kjo kërkesë plotësohet gjithmonë thjesht për arsyen se ka dallime të rastësishme midis objekteve. Si matje të ngjashmërisë, përdoren masa të ndryshme të afërsisë (largësisë) së objekteve në hapësirën e veçorive. Prandaj, përdorimi efektiv i metodave zgjeruese të njohjes së modelit varet nga sa mirë përcaktohen masat e specifikuara të afërsisë, si dhe nga cilat objekte të mostrës së trajnimit (objekte me një klasifikim të njohur) shërbejnë si precedentë diagnostikues. Zgjidhja e suksesshme e këtyre problemeve jep rezultate që i afrohen kufijve teorikisht të arritshëm të efikasitetit të njohjes.

Përparësitë e metodave zgjeruese të njohjes së modeleve kundërshtohen, para së gjithash, nga kompleksiteti i lartë teknik i zbatimit të tyre praktik. Për hapësirat e veçorive me dimensione të larta, detyra në dukje e thjeshtë për të gjetur çifte pikash më të afërta bëhet një problem serioz. Gjithashtu, shumë autorë vërejnë si problem nevojën për të mbajtur mend një numër mjaft të madh të objekteve që përfaqësojnë klasa të njohura.

Ky në vetvete nuk është problem, por perceptohet si problem (për shembull, në metodën k-fqinjët më të afërt) për arsye se kur njihet çdo objekt, ndodh një kërkim i plotë i të gjitha objekteve në grupin e trajnimit.

Prandaj, këshillohet të aplikohet një model i sistemit të njohjes në të cilin problemi i një numërimi të plotë të objekteve në kampionin e trajnimit gjatë njohjes hiqet, pasi kryhet vetëm një herë kur gjenerohen imazhe të përgjithësuara të klasave të njohjes. Gjatë vetë njohjes, objekti i identifikuar krahasohet vetëm me imazhe të përgjithësuara të klasave të njohjes, numri i të cilave është fiks dhe plotësisht i pavarur nga madhësia e kampionit të trajnimit. Kjo qasje ju lejon të rritni madhësinë e kampionit të trajnimit derisa të arrihet cilësia e lartë e kërkuar e imazheve të përgjithësuara, pa frikë se kjo mund të çojë në një rritje të papranueshme të kohës së njohjes (pasi koha e njohjes në këtë model nuk varet nga madhësia e mostrës së trajnimit fare).

Problemet teorike të përdorimit të metodave të njohjes zgjeruese shoqërohen me problemet e kërkimit të grupeve informative të veçorive, gjetjes së metrikës optimale për matjen e ngjashmërive dhe dallimeve të objekteve dhe analizimit të strukturës së informacionit eksperimental. Në të njëjtën kohë, zgjidhja e suksesshme e këtyre problemeve lejon jo vetëm ndërtimin e algoritmeve efektive të njohjes, por edhe kalimin nga njohuritë e zgjeruara të fakteve empirike në njohuritë intensive për modelet e strukturës së tyre.

Kalimi nga njohuritë e zgjeruara në ato intensive ndodh në fazën kur një algoritëm formal i njohjes tashmë është ndërtuar dhe efektiviteti i tij është demonstruar. Më pas studiohen mekanizmat me të cilët arrihet efikasiteti që rezulton. Një studim i tillë, i lidhur me analizën e strukturës gjeometrike të të dhënave, mund, për shembull, të çojë në përfundimin se mjafton të zëvendësohen objektet që përfaqësojnë një klasë të veçantë diagnostikuese me një përfaqësues tipik (prototip). Kjo është ekuivalente, siç u përmend më lart, me specifikimin e një shkalle tradicionale lineare diagnostike. Është gjithashtu e mundur që mjafton të zëvendësohet çdo klasë diagnostike me disa objekte, të konceptuara si përfaqësues tipik të disa nënklasave, gjë që është ekuivalente me ndërtimin e një tifozi të shkallëve lineare. Ka opsione të tjera që do të diskutohen më poshtë.

Kështu, një rishikim i metodave të njohjes tregon se një sërë metodash të ndryshme të njohjes së modeleve tani janë zhvilluar teorikisht. Literatura ofron një klasifikim të detajuar të tyre. Megjithatë, për shumicën e këtyre metodave nuk ka zbatim softuerësh dhe kjo është thellësisht e natyrshme, madje mund të thuhet "e paracaktuar" nga karakteristikat e vetë metodave të njohjes. Kjo mund të gjykohet nga fakti se sisteme të tilla përmenden rrallë në literaturën e specializuar dhe burime të tjera informacioni.

Rrjedhimisht, çështja e zbatueshmërisë praktike të metodave të caktuara teorike të njohjes për zgjidhjen e problemeve praktike me dimensione reale (d.m.th., mjaft domethënëse) të të dhënave dhe në kompjuterë realë modernë mbetet e zhvilluar në mënyrë të pamjaftueshme.

Rrethana e lartpërmendur mund të kuptohet nëse kujtojmë se kompleksiteti i modelit matematik rrit në mënyrë eksponenciale kompleksitetin e zbatimit të softuerit të sistemit dhe në të njëjtën masë zvogëlon shanset që ky sistem të funksionojë praktikisht. Kjo do të thotë se në realitet vetëm sistemet softuerike që bazohen në modele matematikore mjaft të thjeshta dhe “transparente” mund të zbatohen në treg. Prandaj, një zhvillues i interesuar për të riprodhuar produktin e tij softuerik i qaset çështjes së zgjedhjes së një modeli matematikor jo nga një këndvështrim thjesht shkencor, por si një pragmatist, duke marrë parasysh mundësitë e zbatimit të softuerit. Ai beson se modeli duhet të jetë sa më i thjeshtë, që do të thotë se duhet të zbatohet me kosto më të ulëta dhe me cilësi më të mirë dhe gjithashtu duhet të funksionojë (të jetë praktikisht efektiv).

Në këtë drejtim, detyra e zbatimit në sistemet e njohjes së një mekanizmi për përgjithësimin e përshkrimeve të objekteve që i përkasin të njëjtës klasë duket veçanërisht e rëndësishme, d.m.th. mekanizëm për formimin e imazheve kompakte të përgjithësuara. Natyrisht, një mekanizëm i tillë përgjithësimi do të bëjë të mundur "ngjeshjen" e një kampioni trajnimi të çdo dimensioni në një bazë të dhënash të imazheve të përgjithësuara të njohura paraprakisht sipas dimensionit. Kjo gjithashtu do të bëjë të mundur shtrimin dhe zgjidhjen e një sërë problemesh që nuk mund të formulohen as në metoda të tilla njohjeje si metoda e krahasimit me një prototip, metoda k-fqinjët më të afërt dhe ABO.

Këto janë detyrat:

  • përcaktimi i kontributit të informacionit të veçorive në portretin e informacionit të një imazhi të përgjithësuar;
  • analiza grupore-konstruktive e imazheve të përgjithësuara;
  • përcaktimi i ngarkesës semantike të një veçorie;
  • analiza semantike grupore-konstruktive e veçorive;
  • Krahasimi kuptimplotë i imazheve të përgjithësuara të klasave me njëra-tjetrën dhe karakteristikave me njëra-tjetrën (diagramet njohëse, përfshirë diagramet Merlin).

Metoda që bëri të mundur arritjen e zgjidhjes së këtyre problemeve dallon gjithashtu sistemin premtues të bazuar në të nga sistemet e tjera, ashtu siç ndryshojnë kompajlerët nga interpretuesit, pasi falë formimit të imazheve të përgjithësuara në këtë sistem premtues, pavarësia e kohës së njohjes nga arrihet madhësia e kampionit të trajnimit. Dihet se është ekzistenca e kësaj varësie që çon në kosto praktikisht të papranueshme të kohës kompjuterike për njohjen në metoda të tilla si metoda k-nearest nearest, ABO dhe KRP në dimensione të tilla të kampionit të trajnimit kur mund të flasim për statistika të mjaftueshme. .

Për të përfunduar një përmbledhje të shkurtër të metodave të njohjes, le të paraqesim thelbin e sa më sipër në një tabelë përmbledhëse (Tabela 3.1), që përmban një përshkrim të shkurtër të metodave të ndryshme të njohjes së modelit sipas parametrave të mëposhtëm:

  • klasifikimi i metodave të njohjes;
  • fushat e aplikimit të metodave të njohjes;
  • klasifikimi i kufizimeve të metodave të njohjes.
Klasifikimi i metodave të njohjes Zona e aplikimit Kufizimet (disvantazhet)
Metodat intensive të njohjes Metodat e bazuara në vlerësimet e densitetit të shpërndarjes së vlerave të veçorive (ose ngjashmërive dhe dallimeve të objekteve) Problemet me një shpërndarje të njohur, zakonisht normale, kërkojnë një koleksion të madh statistikash Nevoja për të numëruar të gjithë kampionin e trajnimit gjatë njohjes, ndjeshmëri e lartë ndaj mospërfaqësimit të mostrës së trajnimit dhe objekteve
Metodat e bazuara në supozimet për klasën e funksioneve të vendimit Klasat duhet të jenë të ndara mirë, sistemi i veçorive duhet të jetë ortonormal Lloji i funksionit të vendimmarrjes duhet të dihet paraprakisht. Pamundësia për të marrë parasysh njohuritë e reja në lidhje me korrelacionet midis tipareve
Metodat Boolean Kur zgjidhni rregullat e vendimit logjik (lidhëzat), kërkohet një kërkim i plotë. Kompleksitet i lartë llogaritës
Metodat gjuhësore (strukturore). Problemet e dimensionit të vogël të hapësirës së veçorive Detyra e rindërtimit (përcaktimit) të gramatikës nga një grup i caktuar deklaratash (përshkrime të objekteve) është e vështirë të zyrtarizohet. Probleme teorike të pazgjidhura
Metodat e njohjes së zgjeruar Metoda e krahasimit me një prototip Problemet e dimensionit të vogël të hapësirës së veçorive Varësia e lartë e rezultateve të klasifikimit në masën e distancës (metrike). Metrikë optimale e panjohur
k metoda e fqinjëve më të afërt Varësia e lartë e rezultateve të klasifikimit në masën e distancës (metrike). Nevoja për një numërim të plotë të kampionit të trajnimit gjatë njohjes. Përpjekje llogaritëse
Algoritme për llogaritjen e vlerësimeve (votimit) të AVO Probleme të dimensioneve të vogla për sa i përket numrit të klasave dhe veçorive Varësia e rezultateve të klasifikimit nga masa e distancës (metrike). Nevoja për një numërim të plotë të kampionit të trajnimit gjatë njohjes. Kompleksiteti i lartë teknik i metodës
Kolektivët e Rregullave të Vendimit (DRCs) Probleme të dimensioneve të vogla për sa i përket numrit të klasave dhe veçorive Kompleksitet teknik shumë i lartë i metodës, numër i pazgjidhur i problemeve teorike, si në përcaktimin e fushave të kompetencës së metodave private ashtu edhe në vetë metodat private.

Tabela 3.1 — Tabela përmbledhëse e klasifikimit të metodave të njohjes, krahasimi i fushave të tyre të zbatimit dhe kufizimeve

Roli dhe vendi i njohjes së modelit në automatizimin e kontrollit të sistemeve komplekse

Një sistem kontrolli i automatizuar përbëhet nga dy pjesë kryesore: një objekt kontrolli dhe një sistem kontrolli.

Sistemi i kontrollit kryen funksionet e mëposhtme:

  • identifikimi i gjendjes së objektit të kontrollit;
  • zhvillimi i veprimit të kontrollit bazuar në qëllimet e menaxhimit, duke marrë parasysh gjendjen e objektit të kontrollit dhe mjedisin;
  • sigurimi i ndikimit të kontrollit në objektin e kontrollit.

Njohja e modelit nuk është gjë tjetër veçse identifikimi i gjendjes së një objekti.

Rrjedhimisht, mundësia e përdorimit të një sistemi të njohjes së modelit në fazën e identifikimit të gjendjes së një objekti kontrolli duket mjaft e dukshme dhe e natyrshme. Megjithatë, kjo mund të mos jetë e nevojshme. Prandaj, lind pyetja në cilat raste këshillohet përdorimi i një sistemi njohjeje në një sistem kontrolli të automatizuar dhe në cilat jo.

Sipas literaturës, shumë sisteme kontrolli të automatizuara të zhvilluara më parë dhe moderne në nënsistemet për identifikimin e gjendjes së objektit të kontrollit dhe zhvillimin e veprimeve të kontrollit përdorin modele matematikore përcaktuese të "llogaritjes së drejtpërdrejtë", të cilat në mënyrë të paqartë dhe mjaft thjesht përcaktojnë se çfarë të bëjnë me kontrollin. objekt nëse ka disa parametra të jashtëm.

Në të njëjtën kohë, pyetja se si këto parametra lidhen me gjendje të caktuara të objektit të kontrollit nuk ngrihet ose zgjidhet. Ky pozicion korrespondon me këndvështrimin që "si parazgjedhje" pranohet marrëdhënia e tyre një me një. Prandaj, termat "parametrat e objektit të kontrollit" dhe "gjendja e objektit të kontrollit" konsiderohen si sinonime, dhe koncepti "gjendja e objektit të kontrollit" nuk është paraqitur fare në mënyrë eksplicite. Sidoqoftë, është e qartë se në rastin e përgjithshëm marrëdhënia midis parametrave të vëzhgueshëm të objektit të kontrollit dhe gjendjes së tij është dinamike dhe probabiliste në natyrë.

Kështu, sistemet tradicionale të kontrollit të automatizuara janë në thelb sisteme të kontrollit parametrik, d.m.th. sisteme që menaxhojnë jo gjendjet e objektit të kontrollit, por vetëm parametrat e tij të vëzhgueshëm. Vendimi për veprimin e kontrollit merret në sisteme të tilla sikur "verbërisht", d.m.th. pa formuar një imazh holistik të objektit të kontrollit dhe mjedisit në gjendjen e tyre aktuale, si dhe pa parashikuar zhvillimin e mjedisit dhe reagimin e objektit të kontrollit ndaj ndikimeve të caktuara të kontrollit mbi të, duke vepruar njëkohësisht me ndikimin e parashikuar të mjedisit. .

Nga këndvështrimi i zhvilluar në këtë punë, termi "vendimmarrje" në kuptimin modern vështirë se është plotësisht i zbatueshëm për sistemet tradicionale të automatizuara të kontrollit. Fakti është se "vendimmarrja", të paktën, presupozon një vizion holistik të një objekti në mjedis, jo vetëm në gjendjen e tij aktuale, por edhe në dinamikë dhe në ndërveprim si me njëri-tjetrin ashtu edhe me sistemin e kontrollit, përfshin shqyrtimi i opsioneve të ndryshme alternative për zhvillimin e të gjithë këtij sistemi, si dhe ngushtimi i diversitetit (reduktimit) të këtyre alternativave bazuar në disa kritere të synuara. Natyrisht, asnjë nga këto nuk gjendet në sistemet tradicionale të kontrollit të automatizuar, ose ekziston, por në një formë të thjeshtuar.

Natyrisht, metoda tradicionale është adekuate dhe përdorimi i saj është mjaft korrekt dhe i justifikuar në rastet kur objekti i kontrollit është vërtet një sistem i qëndrueshëm dhe rreptësisht i përcaktuar, dhe ndikimi i mjedisit në të mund të neglizhohet.

Megjithatë, në raste të tjera kjo metodë është e paefektshme.

Nëse objekti i kontrollit është dinamik, atëherë modelet që qëndrojnë në bazë të algoritmeve të kontrollit bëhen shpejt të papërshtatshëm, pasi marrëdhëniet midis parametrave hyrës dhe dalës, si dhe vetë grupi i parametrave thelbësorë, ndryshojnë. Në thelb, kjo do të thotë që sistemet tradicionale të automatizuara të kontrollit janë të afta të kontrollojnë gjendjen e objektit të kontrollit vetëm afër pikës së ekuilibrit përmes veprimeve të dobëta të kontrollit mbi të, d.m.th. me metodën e perturbimeve të vogla. Larg gjendjes së ekuilibrit, nga këndvështrimi tradicional, sjellja e objektit të kontrollit duket e paparashikueshme dhe e pakontrollueshme.

Nëse nuk ka lidhje të qartë midis parametrave hyrës dhe dalës të objektit të kontrollit (d.m.th. midis parametrave hyrës dhe gjendjes së objektit), me fjalë të tjera, nëse kjo lidhje ka një natyrë të theksuar probabiliste, atëherë modelet përcaktuese në të cilat është supozohet se rezultati i matjes së një parametri të caktuar është thjesht numër, fillimisht nuk janë të zbatueshëm. Për më tepër, lloji i kësaj lidhjeje thjesht mund të jetë i panjohur, dhe atëherë është e nevojshme të vazhdohet nga supozimi më i përgjithshëm: se është probabilist ose nuk përcaktohet fare.

Një sistem kontrolli i automatizuar i ndërtuar mbi parimet tradicionale mund të funksionojë vetëm në bazë të parametrave, modelet e lidhjeve të të cilave tashmë janë të njohura, të studiuara dhe të pasqyruara në një model matematikor sistemet e kontrollit që do të bëjnë të mundur krijimin e sistemeve të aftë për të identifikuar dhe parametrat më të rëndësishëm, dhe për të përcaktuar natyrën e lidhjeve midis tyre dhe gjendjeve të objektit të kontrollit.

Në këtë rast, është e nevojshme të përdoren metoda më të zhvilluara të matjes që janë adekuate për situatën reale:

  • klasifikimi ose njohja e imazheve (të mësuarit bazuar në një kampion trajnimi, përshtatshmëria e algoritmeve të njohjes, përshtatshmëria e grupeve të klasave dhe parametrave në studim, përzgjedhja e parametrave më domethënës dhe zvogëlimi i dimensionit të përshkrimit duke ruajtur një tepricë të caktuar, etj.);
  • matjet statistikore, kur rezultati i matjes së një parametri të caktuar nuk është një numër i veçantë, por një shpërndarje probabiliteti: një ndryshim në një variabël statistikor nuk do të thotë një ndryshim në vlerën e tij në vetvete, por një ndryshim në karakteristikat e shpërndarjes së probabilitetit të vlerat e saj.

Si rezultat, sistemet e kontrollit të automatizuar të bazuara në qasjen tradicionale përcaktuese praktikisht nuk funksionojnë me objekte kontrolli komplekse dinamike me shumë parametra të përcaktuar dobët, siç janë, për shembull, sistemet makro dhe mikro-socio-ekonomike në një ekonomi dinamike të " periudha e tranzicionit”, elita hierarkike dhe grupet etnike, shoqëria dhe elektorati, fiziologjia dhe psikika njerëzore, ekosistemet natyrore dhe artificiale dhe shumë të tjera.

Është shumë domethënëse që në mesin e viteve 80, shkolla e I. Prigogine zhvilloi një qasje sipas së cilës zhvillimi i çdo sistemi (përfshirë njerëzit) alternon periudhat gjatë të cilave sistemi sillet ose si "kryesisht përcaktues" ose si "kryesisht i rastësishëm". Natyrisht, një sistem i vërtetë kontrolli duhet të kontrollojë në mënyrë të qëndrueshme objektin e kontrollit jo vetëm në seksionet "përcaktuese" të historisë së tij, por edhe në pikat kur sjellja e tij e mëtejshme bëhet shumë e pasigurt. Vetëm kjo do të thotë se është e nevojshme të zhvillohen qasje ndaj sistemeve të kontrollit, sjellja e të cilave përmban një element të madh rastësie (ose atë që aktualisht përshkruhet matematikisht si "rastësia").

Prandaj, sistemet premtuese të kontrollit të automatizuar që sigurojnë kontrollin e sistemeve komplekse dinamike me shumë parametra me përcaktim të dobët, me sa duket do të përfshijnë, si lidhje thelbësore funksionale, nënsisteme për identifikimin dhe parashikimin e gjendjeve të mjedisit dhe objektit të kontrollit, bazuar në metodat e inteligjencës artificiale (kryesisht modeli njohja), metodat mbështetëse të vendimmarrjes dhe teorisë së informacionit.

Le të shqyrtojmë shkurtimisht çështjen e përdorimit të sistemeve të njohjes së imazhit për të marrë vendime në lidhje me veprimet e kontrollit (kjo çështje do të diskutohet më në detaje më vonë, pasi është thelbësore për këtë punë). Nëse marrim objektivin dhe gjendjet e tjera të objektit të kontrollit si klasa njohjeje, dhe faktorët që ndikojnë në të si veçori, atëherë një masë e marrëdhënies midis faktorëve dhe gjendjeve mund të formohet në modelin e njohjes së modelit. Kjo lejon, për një gjendje të caktuar të një objekti kontrolli, të marrë informacion në lidhje me faktorët që nxisin ose pengojnë kalimin e tij në këtë gjendje dhe, mbi këtë bazë, të hartohet një vendim për veprimin e kontrollit.

Faktorët mund të ndahen në grupet e mëposhtme:

  • karakterizimi i sfondit të objektit të kontrollit;
  • karakterizimi i gjendjes aktuale të objektit të kontrollit;
  • faktorët e mjedisit;
  • faktorët teknologjikë (të kontrollueshëm).

Kështu, sistemet e njohjes së modelit mund të përdoren si pjesë e sistemeve të kontrollit të automatizuar: në nënsistemet për identifikimin e gjendjes së një objekti kontrolli dhe zhvillimin e veprimeve të kontrollit.

Kjo është e përshtatshme kur objekti i kontrollit është një sistem kompleks.

Marrja e një vendimi për veprimin e kontrollit në sistemin e automatizuar të kontrollit

Zgjidhja e problemit të sintetizimit të sistemeve të kontrollit të automatizuar adaptive nga sisteme komplekse është konsideruar në këtë punë, duke marrë parasysh analogjitë e shumta dhe të thella midis metodave të njohjes së modelit dhe vendimmarrjes.

Nga njëra anë, problemi i njohjes së modelit është marrja e një vendimi nëse objekti i njohur i përket një klase të caktuar njohjeje.

Nga ana tjetër, autorët propozojnë që problemi i vendimmarrjes të konsiderohet si një problem i dekodimit të anasjelltë ose një problem i njohjes së modelit invers (shih seksionin 2.2.2).

Përbashkësia e ideve bazë që qëndrojnë në themel të metodave të njohjes së modeleve dhe marrjes së vendimeve bëhet veçanërisht e dukshme kur i konsiderojmë ato nga këndvështrimi i teorisë së informacionit.

Shumëllojshmëri problemesh vendimmarrëse

Vendimmarrja si realizim i qëllimit

Përkufizimi: vendimmarrja (“zgjedhja”) është një veprim mbi një grup alternativash, si rezultat i të cilit grupi fillestar i alternativave ngushtohet, d.m.th. ndodh zvogëlimi i tij.

Zgjedhja është veprimi që i jep qëllim të gjitha aktiviteteve. Është përmes akteve të zgjedhjes që realizohet nënshtrimi i të gjitha aktiviteteve ndaj një qëllimi specifik ose një grupi qëllimesh të ndërlidhura.

Kështu, në mënyrë që akti i zgjedhjes të bëhet i mundur, është e nevojshme si më poshtë:

  • gjenerimi ose zbulimi i një grupi alternativash mbi të cilat duhet bërë një zgjedhje;
  • përcaktimi i qëllimeve për hir të të cilave bëhet zgjedhja;
  • zhvillimi dhe aplikimi i një metode për krahasimin e alternativave me njëra-tjetrën, d.m.th. Përcaktimi i një vlerësimi të preferencës për secilën alternativë sipas kritereve të caktuara që i mundëson dikujt të vlerësojë në mënyrë indirekte se sa mirë përputhet çdo alternativë me qëllimin.

Puna moderne në fushën e mbështetjes së vendimeve ka zbuluar një situatë karakteristike, e cila është se formalizimi i plotë i gjetjes së zgjidhjes më të mirë (në një farë kuptimi) është i mundur vetëm për probleme të studiuara mirë, relativisht të thjeshta, ndërsa në praktikë, problemet e strukturuara dobët janë. hasen më shpesh, për të cilat nuk janë zhvilluar plotësisht algoritme të formalizuara (përveç kërkimit shterues dhe provave dhe gabimeve). Megjithatë, profesionistë me përvojë, kompetentë dhe të aftë shpesh bëjnë zgjedhje që rezultojnë mjaft të mira. Prandaj, tendenca moderne në praktikën e vendimmarrjes në situata natyrore është kombinimi i aftësisë njerëzore për të zgjidhur problemet joformale me aftësitë e metodave formale dhe modelimit kompjuterik: sistemet ndërvepruese të mbështetjes së vendimeve, sistemet e ekspertëve, sistemet adaptive të kontrollit të automatizuar njeri-makinë. , rrjetet nervore dhe sistemet njohëse.

Vendimmarrja si heqja e pasigurisë (qasja e informacionit)

Procesi i marrjes së informacionit mund të konsiderohet si një reduktim i pasigurisë si rezultat i marrjes së një sinjali, dhe sasia e informacionit mund të konsiderohet si një masë sasiore e shkallës së heqjes së pasigurisë.

Por si rezultat i zgjedhjes së një nëngrupi të caktuar alternativash nga grupi, d.m.th. si rezultat i vendimmarrjes ndodh e njëjta gjë (ulja e pasigurisë). Kjo do të thotë se çdo zgjedhje, çdo vendim gjeneron një sasi të caktuar informacioni, dhe për këtë arsye mund të përshkruhet në termat e teorisë së informacionit.

Klasifikimi i problemeve të vendimmarrjes

Shumëllojshmëria e detyrave vendimmarrëse është për faktin se çdo komponent i situatës në të cilën merren vendimet mund të zbatohet në opsione cilësisht të ndryshme.

Le të rendisim vetëm disa nga këto opsione:

  • grupi i alternativave, nga njëra anë, mund të jetë i fundëm, i numërueshëm ose i vazhdueshëm, dhe nga ana tjetër, i mbyllur (d.m.th. plotësisht i njohur) ose i hapur (përfshirë elementë të panjohur);
  • vlerësimi i alternativave mund të kryhet sipas një ose më shumë kritereve, të cilat, nga ana tjetër, mund të jenë të natyrës sasiore ose cilësore;
  • Mënyra e përzgjedhjes mund të jetë e vetme (një herë), ose e shumëfishtë, e përsëritur, duke përfshirë reagimet për rezultatet e zgjedhjes, d.m.th. duke lejuar që algoritmet e vendimmarrjes të trajnohen duke marrë parasysh pasojat e zgjedhjeve të mëparshme;
  • pasojat e zgjedhjes së secilës alternativë mund të njihen me saktësi paraprakisht (zgjedhja në kushte sigurie), të kenë natyrë probabiliste kur dihen probabilitetet e rezultateve të mundshme pas zgjedhjes së bërë (zgjedhja në kushte rreziku) ose të kenë një rezultat të paqartë me të panjohur probabilitetet (zgjedhja në kushtet e pasigurisë);
  • përgjegjësia për zgjedhje mund të mungojë, individuale ose grupore;
  • shkalla e konsistencës së qëllimeve në zgjedhjen e grupit mund të ndryshojë nga koincidenca e plotë e interesave të palëve (zgjedhja bashkëpunuese) në të kundërtën e tyre (zgjedhja në një situatë konflikti). Opsionet e ndërmjetme janë gjithashtu të mundshme: kompromis, koalicion, konflikt në rritje ose zbehje.

Kombinime të ndryshme të këtyre opsioneve çojnë në probleme të shumta vendimmarrëse që janë studiuar në shkallë të ndryshme.

Gjuhët për përshkrimin e metodave të vendimmarrjes

Për të njëjtin fenomen mund të flitet në gjuhë të ndryshme me shkallë të ndryshme të përgjithësisë dhe përshtatshmërisë. Deri më sot, janë shfaqur tre gjuhë kryesore për të përshkruar zgjedhjen.

Më e thjeshta, më e zhvilluara dhe më e njohura është gjuha kriter.

Gjuha e kritereve

Emri i kësaj gjuhe shoqërohet me supozimin bazë se çdo alternativë individuale mund të vlerësohet me një numër specifik (një), pas së cilës krahasimi i alternativave reduktohet në një krahasim të numrave përkatës.

Le të jetë, për shembull, (X) një grup alternativash dhe x një alternativë specifike që i përket kësaj bashkësie: x∈X. Atëherë besohet se për të gjitha x mund të specifikohet një funksion q(x), i cili quhet kriter (kriteri i cilësisë, funksioni objektiv, funksioni i preferencës, funksioni i dobisë etj.), i cili ka vetinë që nëse alternativa x 1 është e preferueshme. në x 2 (shënohet: x 1 > x 2), pastaj q(x 1) > q(x 2).

Në këtë rast, zgjedhja zbret në gjetjen e një alternative me vlerën më të lartë të funksionit të kriterit.

Megjithatë, në praktikë, përdorimi i vetëm një kriteri për të krahasuar shkallën e preferencës së alternativave rezulton të jetë një thjeshtësim i pajustifikuar, pasi një shqyrtim më i detajuar i alternativave çon në nevojën e vlerësimit të tyre jo me një, por me shumë kritere, të cilat mund të të jenë të një natyre të ndryshme dhe cilësisht të ndryshme nga njëra-tjetra.

Për shembull, kur zgjidhni llojin më të pranueshëm të avionit për pasagjerët dhe organizatën operuese në disa lloje të rrugëve, krahasimet bëhen njëkohësisht sipas shumë grupeve të kritereve: teknike, teknologjike, ekonomike, sociale, ergonomike, etj.

Problemet me shumë kritere nuk kanë një zgjidhje unike të përgjithshme. Prandaj, propozohen shumë mënyra për t'i dhënë një problemi me shumë kritere një formë të veçantë që lejon një zgjidhje të vetme të përgjithshme. Natyrisht, këto zgjidhje janë përgjithësisht të ndryshme për metoda të ndryshme. Prandaj, ndoshta gjëja më e rëndësishme në zgjidhjen e një problemi me shumë kritere është justifikimi i këtij lloj formulimi.

Opsione të ndryshme përdoren për të thjeshtuar problemin e përzgjedhjes me shumë kritere. Le të rendisim disa prej tyre.

  1. Maksimizimi i kushtëzuar (nuk gjendet ekstremi global i kriterit integral, por ekstremi lokal i kriterit kryesor).
  2. Kërkoni për një alternativë me vetitë e specifikuara.
  3. Gjetja e grupit Pareto.
  4. Reduktimi i një problemi me shumë kritere në një problem me një kriter duke futur një kriter integral.

Le të shqyrtojmë më në detaje formulimin formal të metodës për reduktimin e një problemi me shumë kritere në një me një kriter.

Le të prezantojmë kriterin integral q 0 (x) si një funksion skalar të argumentit vektor:

q 0 (x) = q 0 ((q 1 (x), q 2 (x), ..., q n (x)).

Kriteri integral ju lejon të porosisni alternativat sipas vlerës së q 0, duke nxjerrë në pah më të mirën (në kuptimin e këtij kriteri). Forma e funksionit q 0 përcaktohet nga sa konkretisht e imagjinojmë kontributin e secilit kriter në kriterin integral. Në mënyrë tipike përdoren funksionet shtuese dhe shumëzuese:

q 0 = ∑a i ⋅q i /s i

1 - q 0 = ∏(1 - b i ⋅q i /s i)

Koeficientët që jap:

  1. Padimensioni ose një dimension i vetëm i numrit a i ⋅q i /s i (kritere të ndryshme të pjesshme mund të kenë dimensione të ndryshme, dhe atëherë veprimet aritmetike nuk mund të kryhen mbi to dhe të reduktohen në një kriter integral).
  2. Normalizimi, d.m.th. duke siguruar kushtin: b i ⋅q i /s i<1.

Koeficientët a i dhe b i pasqyrojnë kontributin relativ të kriterit të pjesshëm q i në kriterin integral.

Pra, në një formulim me shumë kritere, problemi i marrjes së një vendimi për zgjedhjen e njërës prej alternativave zbret në maksimizimin e kriterit integral:

x * = arg max(q 0 (q 1 (x), q 2 (x), ..., q n (x)))

Problemi kryesor në formulimin me shumë kritere të problemit të vendimmarrjes është se është e nevojshme të gjendet një formë e tillë analitike e koeficientëve a i dhe b i që do të siguronte vetitë e mëposhtme të modelit:

  • shkallë e lartë e përshtatshmërisë ndaj fushës lëndore dhe këndvështrimit të ekspertëve;
  • vështirësi minimale llogaritëse në maksimizimin e kriterit integral, d.m.th. llogaritja e tij për alternativa të ndryshme;
  • qëndrueshmëria e rezultateve të maksimizimit të kriterit integral nga shqetësimet e vogla të të dhënave fillestare.
  • Stabiliteti i zgjidhjes do të thotë që një ndryshim i vogël në të dhënat fillestare duhet të çojë në një ndryshim të vogël në vlerën e kriterit integral dhe, në përputhje me rrethanat, në një ndryshim të vogël në vendimin e marrë. Kështu, nëse të dhënat fillestare janë praktikisht të njëjta, atëherë vendimi duhet të merret ose i njëjtë ose shumë afër.

Gjuha sekuenciale e zgjedhjes binare

Gjuha e marrëdhënieve binare është një përgjithësim i një gjuhe shumëkriterore dhe bazohet në marrjen parasysh të faktit se kur vlerësojmë një alternativë, ky vlerësim është gjithmonë relativ, d.m.th. në mënyrë eksplicite ose më shpesh në mënyrë implicite, alternativa të tjera nga grupi në studim ose nga popullata e përgjithshme përdoren si bazë ose kornizë referimi për krahasim. Mendimi njerëzor bazohet në kërkimin dhe analizën e të kundërtave (ndërtimeve), kështu që është gjithmonë më e lehtë për ne të zgjedhim një nga dy opsionet e kundërta sesa një opsion nga një grup i madh dhe në asnjë mënyrë të renditur.

Pra, supozimet bazë të kësaj gjuhe janë si më poshtë:

  • nuk vlerësohet një alternativë e veçantë, d.m.th. funksioni i kriterit nuk është futur;
  • për çdo palë alternativa, mund të përcaktohet në një farë mënyre se njëra prej tyre është e preferueshme nga tjetra ose se janë ekuivalente ose të pakrahasueshme;
  • relacioni i preferencës në asnjë çift alternativash nuk varet nga alternativat e mbetura të paraqitura për zgjedhje.

Ka mënyra të ndryshme për të specifikuar marrëdhëniet binare: direkte, matricë, duke përdorur grafikët e preferencës, metodën e seksionit, etj.

Marrëdhëniet midis alternativave të një çifti shprehen përmes koncepteve të ekuivalencës, rendit dhe mbizotërimit.

Gjuha e funksionit të përzgjedhjes së përgjithësuar

Gjuha e funksionit të zgjedhjes bazohet në teorinë e grupeve dhe ju lejon të operoni me hartëzimin nga grupet në nëngrupet e tyre që korrespondojnë me zgjedhje të ndryshme pa pasur nevojë të numëroni elementët. Kjo gjuhë është shumë e përgjithshme dhe ka potencialin për të përshkruar çdo zgjedhje. Megjithatë, aparati matematikor i funksioneve të përzgjedhjes së përgjithësuar aktualisht është ende duke u zhvilluar dhe testuar kryesisht mbi probleme që tashmë janë zgjidhur duke përdorur qasje të bazuara në kritere ose binar.

Zgjedhja e grupit

Le të ketë një grup njerëzish që kanë të drejtë të marrin pjesë në vendimmarrje kolektive. Le të supozojmë se ky grup po shqyrton një grup të caktuar alternativash dhe secili anëtar i grupit bën zgjedhjen e tij. Detyra është të zhvillohet një zgjidhje që në një mënyrë të caktuar koordinon zgjedhjet individuale dhe në një farë kuptimi shpreh "mendimin e përgjithshëm" të grupit, d.m.th. pranohet si zgjedhje në grup.

Natyrisht, parime të ndryshme për koordinimin e vendimeve individuale do të korrespondojnë me vendime të ndryshme grupore.

Rregullat për bashkërendimin e vendimeve individuale gjatë zgjedhjes në grup quhen rregulla votimi. Më i zakonshmi është “rregulli i shumicës”, në të cilin alternativa me më shumë vota pranohet si vendim i grupit.

Është e nevojshme të kuptohet se një vendim i tillë pasqyron vetëm mbizotërimin e këndvështrimeve të ndryshme në grup, dhe jo opsionin vërtetë optimal, për të cilin askush nuk mund të votojë fare. "E vërteta nuk përcaktohet me votim."

Përveç kësaj, ekzistojnë të ashtuquajturat "paradokse të votimit", më i famshmi prej të cilave është paradoksi i Arrow.

Këto paradokse mund të çojnë, dhe ndonjëherë çojnë, në karakteristika shumë të pakëndshme të procedurës së votimit: për shembull, ka raste kur grupi nuk mund të marrë fare një vendim të vetëm (nuk ka kuorum ose secili voton për opsionin e tij unik, etj. .), dhe nganjëherë (me votim me shumë faza), pakica mund të imponojë vullnetin e saj mbi shumicën.

Zgjedhja në kushte pasigurie

Siguria është një rast i veçantë i pasigurisë, përkatësisht: është pasiguri afër zeros.

Në teorinë moderne të zgjedhjes, besohet se ekzistojnë tre lloje kryesore të pasigurisë në problemet e vendimmarrjes:

  1. Pasiguria informative (statistikore) e të dhënave fillestare për vendimmarrje.
  2. Pasiguria e pasojave të vendimmarrjes (zgjedhja).
  3. Paqartësi në përshkrimin e komponentëve të procesit të vendimmarrjes.

Le t'i shikojmë ato me radhë.

Pasiguria e informacionit (statistikore) në të dhënat burimore

Të dhënat e marra në lidhje me fushën e lëndës nuk mund të konsiderohen absolutisht të sakta. Për më tepër, padyshim, këto të dhëna nuk janë me interes për ne në vetvete, por vetëm si sinjale që mund të mbajnë informacione të caktuara për atë që na intereson vërtet. Pra, është më realiste të konsiderojmë se kemi të bëjmë me të dhëna jo vetëm të zhurmshme dhe të pasakta, por edhe të tërthorta, ndoshta edhe të paplota. Përveç kësaj, këto të dhëna nuk kanë të bëjnë me të gjithë popullsinë në studim, por vetëm një nëngrup të caktuar të saj, për të cilin ne kemi mundur të mbledhim të dhëna, por në të njëjtën kohë duam të nxjerrim përfundime për të gjithë popullsinë, dhe gjithashtu duan të dinë shkallën e besueshmërisë së këtyre përfundimeve.

Në këto kushte përdoret teoria e vendimeve statistikore.

Ekzistojnë dy burime kryesore të pasigurisë në këtë teori. Së pari, nuk dihet se çfarë shpërndarjeje ndjekin të dhënat origjinale. Së dyti, nuk dihet se çfarë shpërndarjeje ka grupi (popullsia e përgjithshme) për të cilën duam të nxjerrim përfundime nga nëngrupi i tij që formon të dhënat fillestare.

Procedurat statistikore janë procedura vendimmarrëse që heqin të dyja këto lloje të pasigurisë.

Duhet të theksohet se ka një sërë arsyesh që çojnë në aplikimin e gabuar të metodave statistikore:

  • Përfundimet statistikore, si çdo tjetër, kanë gjithmonë njëfarë besueshmërie ose vlefshmërie. Por, ndryshe nga shumë raste të tjera, besueshmëria e përfundimeve statistikore dihet dhe përcaktohet gjatë studimit statistikor;
  • cilësia e zgjidhjes së marrë si rezultat i aplikimit të një procedure statistikore varet nga cilësia e të dhënave burimore;
  • të dhënat që nuk kanë natyrë statistikore nuk duhet t'i nënshtrohen përpunimit statistikor;
  • Duhet të përdoren procedura statistikore që janë të përshtatshme për nivelin e informacionit apriori për popullsinë që studiohet (për shembull, metodat ANOVA nuk duhet të zbatohen për të dhënat jo-gausiane). Nëse shpërndarja e të dhënave fillestare është e panjohur, atëherë është e nevojshme ose ta vendosni atë, ose të përdorni disa metoda të ndryshme dhe të krahasoni rezultatet. Nëse ato janë shumë të ndryshme, kjo tregon moszbatueshmërinë e disa prej procedurave të përdorura.

Pasiguria e pasojave

Kur pasojat e zgjedhjes së njërës ose tjetrës alternativë përcaktohen pa mëdyshje nga vetë alternativa, atëherë ne nuk mund të bëjmë dallimin midis alternativës dhe pasojave të saj, duke marrë të mirëqenë se duke zgjedhur një alternativë, ne në fakt po zgjedhim pasojat e saj.

Sidoqoftë, në praktikën reale shpesh duhet të përballemi me një situatë më komplekse, kur zgjedhja e një ose një tjetër alternativë përcakton në mënyrë të paqartë pasojat e zgjedhjes së bërë.

Në rastin e një grupi diskrete alternativash dhe rezultateve të zgjedhjes së tyre, me kusht që vetë grupi i rezultateve të mundshme të jetë i përbashkët për të gjitha alternativat, mund të supozojmë se alternativat e ndryshme ndryshojnë nga njëra-tjetra në shpërndarjen e probabilitetit të rezultateve. Këto shpërndarje probabiliteti në rastin e përgjithshëm mund të varen nga rezultatet e zgjedhjes së alternativave dhe nga rezultatet aktuale që rezultuan. Në rastin më të thjeshtë, rezultatet janë po aq të mundshme. Vetë rezultatet zakonisht kanë kuptimin e fitimeve ose humbjeve dhe shprehen në mënyrë sasiore.

Nëse rezultatet janë të barabarta për të gjitha alternativat, atëherë nuk ka asgjë për të zgjedhur. Nëse ato janë të ndryshme, atëherë mund të krahasoni alternativat duke prezantuar disa vlerësime sasiore për to. Shumëllojshmëria e problemeve në teorinë e lojës shoqërohet me zgjedhje të ndryshme të karakteristikave numerike të humbjeve dhe fitimeve si rezultat i zgjedhjes së alternativave, shkallë të ndryshme konflikti midis palëve që zgjedhin alternativat, etj.

Konsideroni këtë lloj pasigurie si pasiguri të paqartë

Çdo detyrë e zgjedhjes është një detyrë e ngushtimit të synuar të një grupi alternativash. Si përshkrimi zyrtar i alternativave (vetë lista e tyre, lista e veçorive ose parametrave të tyre), ashtu edhe përshkrimi i rregullave për krahasimin e tyre (kriteret, marrëdhëniet) jepen gjithmonë në terma të njërës ose tjetrës shkallë matjeje (edhe kur ajo kush e bën këtë nuk di për këtë).

Dihet që të gjitha shkallët janë të paqarta, por në shkallë të ndryshme. Termi “turbullim” i referohet vetive të peshores, e cila konsiston në faktin se është gjithmonë e mundur të paraqiten dy alternativa të dallueshme, d.m.th. të ndryshme në të njëjtën shkallë dhe të padallueshme, d.m.th. identike, në tjetrën - më e paqartë. Sa më pak gradime në një shkallë të caktuar, aq më e paqartë është.

Kështu, ne mund të shohim qartë alternativat dhe në të njëjtën kohë t'i klasifikojmë ato në mënyrë të paqartë, d.m.th. kanë pasiguri se cilat klasa i përkasin.

Tashmë në punën e tyre të parë mbi vendimmarrjen në situata të paqarta, Bellman dhe Zadeh parashtruan idenë se të dy qëllimet dhe kufizimet duhet të përfaqësohen si grupe të paqarta në grupin e alternativave.

Rreth disa kufizimeve të qasjes së optimizimit

Në të gjitha problemet e përzgjedhjes dhe metodat e vendimmarrjes të diskutuara më sipër, problemi ishte gjetja e më të mirëve në grupin origjinal në kushte të dhëna, d.m.th. alternativa që janë optimale në një kuptim të caktuar.

Ideja e optimizmit është ideja qendrore e kibernetikës dhe është vendosur fort në praktikën e projektimit dhe funksionimit të sistemeve teknike. Në të njëjtën kohë, kjo ide kërkon trajtim të kujdesshëm kur përpiqemi ta transferojmë në fushën e menaxhimit të sistemeve komplekse, të mëdha dhe të përcaktuara dobët, siç janë, për shembull, sistemet socio-ekonomike.

Ka arsye mjaft të mira për këtë përfundim. Le të shohim disa prej tyre:

  1. Zgjidhja optimale shpesh rezulton të jetë e paqëndrueshme, d.m.th. ndryshime të vogla në kushtet e problemit, inputet ose kufizimet mund të çojnë në zgjedhjen e alternativave dukshëm të ndryshme.
  2. Modelet e optimizimit janë zhvilluar vetëm për klasa të ngushta problemesh mjaft të thjeshta, të cilat jo gjithmonë pasqyrojnë në mënyrë adekuate dhe sistematike objekte reale të kontrollit. Më shpesh, metodat e optimizimit lejojnë optimizimin e vetëm nënsistemeve mjaft të thjeshta dhe të përshkruara mirë zyrtarisht të disa sistemeve të mëdha dhe komplekse, d.m.th. lejojnë vetëm optimizimin lokal. Megjithatë, nëse çdo nënsistem i një sistemi të madh funksionon në mënyrë optimale, kjo nuk do të thotë aspak se sistemi në tërësi do të funksionojë në mënyrë optimale. Prandaj, optimizimi i një nënsistemi nuk çon domosdoshmërisht në sjelljen që kërkohet prej tij kur optimizohet sistemi në tërësi. Për më tepër, ndonjëherë optimizimi lokal mund të çojë në pasoja negative për sistemin në tërësi. Prandaj, kur optimizoni nënsistemet dhe sistemin në tërësi, është e nevojshme të përcaktohet pema e qëllimeve dhe nënqëllimeve dhe përparësia e tyre.
  3. Shpesh, maksimizimi i një kriteri optimizimi sipas ndonjë modeli matematikor konsiderohet qëllimi i optimizimit, por në realitet qëllimi është optimizimi i objektit të kontrollit. Kriteret e optimizimit dhe modelet matematikore janë gjithmonë të lidhura me qëllimin vetëm në mënyrë indirekte, d.m.th. pak a shumë në mënyrë adekuate, por gjithmonë përafërsisht.

Pra, ideja e optimizmit, e cila është jashtëzakonisht e frytshme për sistemet që mund të formalizohen në mënyrë adekuate matematikisht, duhet të transferohet në sisteme komplekse me kujdes. Natyrisht, modelet matematikore që ndonjëherë mund të propozohen për sisteme të tilla mund të optimizohen. Megjithatë, duhet mbajtur gjithmonë parasysh thjeshtimi i fortë i këtyre modeleve, i cili në rastin e sistemeve komplekse nuk mund të neglizhohet më, si dhe fakti që shkalla e përshtatshmërisë së këtyre modeleve në rastin e sistemeve komplekse është praktikisht e panjohur. . Prandaj, nuk dihet se çfarë rëndësie thjesht praktike ka ky optimizim. Prakticiteti i lartë i optimizimit në sistemet teknike nuk duhet të krijojë iluzionin se do të jetë po aq efektiv kur optimizohen sisteme komplekse. Modelimi matematikor kuptimplotë i sistemeve komplekse është shumë i vështirë, i përafërt dhe i pasaktë. Sa më kompleks të jetë sistemi, aq më i kujdesshëm duhet të jeni në lidhje me idenë e optimizimit të tij.

Prandaj, kur zhvillojnë metoda për kontrollin e sistemeve komplekse, të mëdha, të dobëta përcaktuese, autorët e konsiderojnë gjënë kryesore jo vetëm optimalitetin e qasjes së zgjedhur nga një këndvështrim matematikor formal, por edhe përshtatshmërinë e tij me qëllimin dhe vetë natyrën e objekt kontrolli.

Metodat e përzgjedhjes së ekspertëve

Gjatë studimit të sistemeve komplekse, shpesh lindin probleme që, për arsye të ndryshme, nuk mund të formulohen dhe zgjidhen në mënyrë rigoroze duke përdorur aparatin matematikor të zhvilluar aktualisht. Në këto raste përdoren shërbimet e ekspertëve (analistët e sistemit), përvoja dhe intuita e të cilëve ndihmojnë në uljen e kompleksitetit të problemit.

Megjithatë, duhet të kihet parasysh se vetë ekspertët janë sisteme shumë komplekse dhe aktivitetet e tyre varen edhe nga shumë kushte të jashtme dhe të brendshme. Prandaj, në metodat e organizimit të vlerësimeve të ekspertëve, shumë vëmendje i kushtohet krijimit të kushteve të favorshme të jashtme dhe psikologjike për punën e ekspertëve.

Puna e ekspertit ndikohet nga faktorët e mëposhtëm:

  • përgjegjësia për përdorimin e rezultateve të ekzaminimit;
  • njohuri që janë përfshirë edhe ekspertë të tjerë;
  • disponueshmëria e kontaktit të informacionit ndërmjet ekspertëve;
  • marrëdhëniet ndërpersonale të ekspertëve (nëse ka kontakt informacioni midis tyre);
  • interesi personal i ekspertit në rezultatet e vlerësimit;
  • cilësitë personale të ekspertëve (marrëveshja, konformizmi, vullneti, etj.)

Ndërveprimi midis ekspertëve mund të stimulojë dhe të shtypë aktivitetet e tyre. Prandaj, në raste të ndryshme përdoren metoda të ndryshme ekzaminimi, të ndryshme në natyrën e ndërveprimit të ekspertëve me njëri-tjetrin: anketa dhe pyetësorë anonime dhe të hapura, takime, diskutime, lojëra biznesi, stuhi mendimesh, etj.

Ekzistojnë metoda të ndryshme për përpunimin matematikor të mendimeve të ekspertëve. Ekspertëve u kërkohet të vlerësojnë alternativa të ndryshme duke përdorur një ose një sistem treguesish. Përveç kësaj, atyre u kërkohet të vlerësojnë shkallën e rëndësisë së secilit tregues (“peshën” ose “kontributin” e tij). Vetë ekspertëve u caktohet gjithashtu një nivel kompetence që korrespondon me kontributin e secilit prej tyre në opinionin që rezulton nga grupi.

Një metodologji e zhvilluar për të punuar me ekspertë është metoda Delphi. Ideja kryesore e kësaj metode është që kritika dhe argumentimi të kenë një efekt të dobishëm te eksperti nëse nuk preket krenaria e tij dhe sigurohen kushte që përjashtojnë konfrontimin personal.

Veçanërisht duhet theksuar se ka një ndryshim thelbësor në natyrën e përdorimit të metodave të ekspertëve në sistemet e ekspertëve dhe në mbështetjen e vendimeve. Nëse në rastin e parë, ekspertëve u kërkohet të zyrtarizojnë metodat e vendimmarrjes, atëherë në të dytën - vetëm vetë vendimi, si i tillë.

Meqenëse ekspertët janë të përfshirë në zbatimin e pikërisht atyre funksioneve që aktualisht ose nuk ofrohen fare nga sistemet e automatizuara, ose kryhen prej tyre më keq se nga njerëzit, një drejtim premtues për zhvillimin e sistemeve të automatizuara është automatizimi maksimal i këtyre funksioneve.

Sisteme të automatizuara të mbështetjes së vendimeve

Njeriu gjithmonë ka përdorur asistentë gjatë marrjes së vendimeve: këta ishin thjesht ofrues të informacionit për objektin e menaxhimit dhe konsulentë (këshilltarë) që ofronin opsionet e vendimit dhe analizuan pasojat e tyre. Një person që merr vendime i ka marrë gjithmonë në një mjedis të caktuar informacioni: për një drejtues ushtarak është selia, për rektorin është këshilli akademik, për ministrin është kolegjiumi.

Në ditët e sotme, infrastruktura e informacionit për vendimmarrje është e paimagjinueshme pa sisteme të automatizuara për vlerësimin interaktiv të vendimeve dhe veçanërisht sistemet e mbështetjes së vendimeve (DDS - Decision Support Systems), d.m.th. sisteme të automatizuara që janë krijuar posaçërisht për të përgatitur informacionin që i nevojitet një personi për të marrë një vendim. Zhvillimi i sistemeve të mbështetjes së vendimeve kryhet, në veçanti, në kuadrin e një projekti ndërkombëtar të kryer nën kujdesin e Institutit Ndërkombëtar për Analizën e Sistemeve të Aplikuara në Laxenburg (Austri).

Bërja e zgjedhjeve në situata të jetës reale kërkon një sërë operacionesh, disa prej të cilave kryhen në mënyrë më efikase nga njerëzit dhe të tjerët nga makinat. Kombinimi efektiv i avantazheve të tyre duke kompensuar mangësitë e tyre është mishëruar në sistemet e automatizuara të mbështetjes së vendimeve.

Një person merr vendime në kushte pasigurie më mirë se një makinë, por për të marrë vendimin e duhur, ai gjithashtu ka nevojë për informacion adekuat (të plotë dhe të besueshëm) që karakterizon fushën e temës. Megjithatë, dihet se njerëzit nuk përballen mirë me sasi të mëdha informacioni "të papërpunuar" të papërpunuar. Prandaj, roli i një makinerie në mbështetjen e vendimeve mund të jetë të kryejë përgatitjen paraprake të informacionit në lidhje me objektin e kontrollit dhe faktorët e pakontrollueshëm (mjedisin), të ndihmojë në shikimin e pasojave të marrjes së vendimeve të caktuara dhe gjithashtu të paraqesë të gjithë këtë informacion në një pamje vizuale. dhe mënyrë e përshtatshme për vendimmarrje.

Kështu, sistemet e automatizuara të mbështetjes së vendimeve kompensojnë dobësitë e një personi, duke e çliruar atë nga përpunimi rutinë paraprak i informacionit dhe i ofrojnë atij një mjedis të rehatshëm informacioni në të cilin ai mund të demonstrojë më mirë pikat e tij të forta. Këto sisteme nuk kanë për qëllim automatizimin e funksioneve të vendimmarrësit (dhe, si rezultat, largimin e këtyre funksioneve prej tij, dhe rrjedhimisht përgjegjësinë për vendimet e marra, gjë që shpesh është përgjithësisht e papranueshme), por t'i ofrojnë atij ndihmë për të gjetur një të mirë. zgjidhje.

Sistemet e gjalla, duke përfshirë njerëzit, janë përballur vazhdimisht me problemin e njohjes së modeleve që nga shfaqja e tyre. Në veçanti, informacioni që vjen nga shqisat përpunohet nga truri, i cili nga ana tjetër rendit informacionin, siguron vendimmarrjen dhe më pas, duke përdorur impulse elektrokimike, transmeton sinjalin e nevojshëm më tej, për shembull, në organet e lëvizjes, të cilat zbatojnë veprimet e nevojshme. Pastaj mjedisi ndryshon dhe dukuritë e mësipërme përsëriten. Dhe nëse e shikoni, çdo fazë shoqërohet me njohje.

Me zhvillimin e teknologjisë kompjuterike, është bërë e mundur të zgjidhen një sërë problemesh që lindin në procesin e jetës, për të lehtësuar, përshpejtuar dhe përmirësuar cilësinë e rezultatit. Për shembull, funksionimi i sistemeve të ndryshme të mbështetjes së jetës, ndërveprimi i njeriut me një kompjuter, shfaqja e sistemeve robotike, etj. Megjithatë, vërejmë se aktualisht nuk është e mundur të sigurohet një rezultat i kënaqshëm në disa detyra (njohja e të ngjashme me lëvizje të shpejtë objekte, tekst i shkruar me dorë).

Qëllimi i punës: të studiojë historinë e sistemeve të njohjes së imazhit.

Tregoni ndryshimet cilësore që kanë ndodhur në fushën e njohjes së modeleve, si teorike ashtu edhe teknike, duke treguar arsyet;

Diskutoni metodat dhe parimet e përdorura në informatikë;

Jepni shembuj të perspektivave që priten në të ardhmen e afërt.

1. Çfarë është njohja e modelit?

Studimet e para me teknologjinë kompjuterike kryesisht ndoqën skemën klasike të modelimit matematik - modeli matematik, algoritmi dhe llogaritja. Këto ishin detyrat e modelimit të proceseve që ndodhin gjatë shpërthimeve të bombave atomike, llogaritja e trajektoreve balistike, aplikimet ekonomike dhe të tjera. Sidoqoftë, përveç ideve klasike të kësaj serie, u shfaqën metoda të bazuara në një natyrë krejtësisht të ndryshme dhe siç tregoi praktika e zgjidhjes së disa problemeve, ato shpesh jepnin rezultate më të mira sesa zgjidhjet e bazuara në modele matematikore tepër të ndërlikuara. Ideja e tyre ishte të braktisnin dëshirën për të krijuar një model matematikor shterues të objektit që studiohej (për më tepër, shpesh ishte pothuajse e pamundur të ndërtoheshin modele adekuate), dhe në vend të kësaj të mjaftoheshim me përgjigjen vetëm për pyetjet specifike që na interesojnë, dhe kërkoni këto përgjigje nga konsideratat e zakonshme për një klasë të gjerë problemesh. Kërkimet e këtij lloji përfshinin njohjen e imazheve vizuale, parashikimin e rendimenteve të të korrave, niveleve të lumenjve, detyrën e dallimit të naftëmbajtësve dhe akuiferëve bazuar në të dhënat gjeofizike indirekte etj. Në këto detyra kërkohej një përgjigje specifike në një formë mjaft të thjeshtë, si p.sh. , për shembull, nëse një objekt i përket njërës prej klasave të para-fiksuara. Dhe të dhënat fillestare të këtyre detyrave, si rregull, jepeshin në formën e informacionit fragmentar për objektet që studiohen, për shembull, në formën e një grupi objektesh të para-klasifikuara. Nga pikëpamja matematikore, kjo do të thotë se njohja e modelit (dhe kështu quhej kjo klasë problemesh në vendin tonë) është një përgjithësim i gjerë i idesë së ekstrapolimit të funksionit.

Rëndësia e një deklarate të tillë për shkencat teknike është e padiskutueshme dhe kjo në vetvete justifikon studime të shumta në këtë fushë. Sidoqoftë, problemi i njohjes së modeleve ka gjithashtu një aspekt më të gjerë për shkencën natyrore (megjithatë, do të ishte e çuditshme nëse diçka kaq e rëndësishme për sistemet artificiale kibernetike nuk do të kishte rëndësi për ato natyrore). Konteksti i kësaj shkence përfshinte gjithashtu në mënyrë organike pyetjet e parashtruara nga filozofët e lashtë në lidhje me natyrën e njohurive tona, aftësinë tonë për të njohur imazhet, modelet dhe situatat në botën përreth. Në fakt, ka pak dyshim se mekanizmat për njohjen e imazheve më të thjeshta, të tilla si imazhet e një grabitqari ose ushqimi të rrezikshëm që po afrohej, u formuan shumë më herët se shfaqja e gjuhës elementare dhe e aparatit logjik formal. Dhe nuk ka dyshim se mekanizma të tillë janë mjaft të zhvilluar në kafshët më të larta, të cilat gjithashtu në aktivitetet e tyre jetësore kanë nevojë urgjente për aftësinë për të dalluar një sistem mjaft kompleks të shenjave të natyrës. Kështu, në natyrë shohim se fenomeni i të menduarit dhe i vetëdijes bazohet qartë në aftësinë për të njohur imazhe dhe përparimi i mëtejshëm i shkencës së inteligjencës lidhet drejtpërdrejt me thellësinë e të kuptuarit të ligjeve themelore të njohjes. Duke kuptuar faktin se çështjet e mësipërme shkojnë shumë përtej përkufizimit standard të njohjes së modeleve (në literaturën në gjuhën angleze termi mësim i mbikëqyrur është më i zakonshëm), është gjithashtu e nevojshme të kuptohet se ato kanë lidhje të thella me këtë relativisht të ngushtë (por ende larg nga shterimi) drejtim.

Tashmë, njohja e modelit është bërë një pjesë integrale e jetës së përditshme dhe është një nga njohuritë më vitale të një inxhinieri modern. Në mjekësi, njohja e modelit i ndihmon mjekët të bëjnë diagnoza më të sakta në fabrika, përdoret për të parashikuar defekte në grupe mallrash. Sistemet biometrike të identifikimit personal si thelbi i tyre algoritmik bazohen gjithashtu në rezultatet e kësaj disipline. Zhvillimi i mëtejshëm i inteligjencës artificiale, veçanërisht dizajni i kompjuterëve të gjeneratës së pestë të aftë për komunikim më të drejtpërdrejtë me njerëzit në gjuhët natyrale për njerëzit dhe përmes të folurit, është i paimagjinueshëm pa njohje. Është vetëm një hedhje guri nga robotika dhe sistemet e kontrollit artificial që përmbajnë sisteme njohjeje si nënsisteme jetike.

Kjo është arsyeja pse zhvillimi i njohjes së modeleve që në fillim tërhoqi shumë vëmendje nga specialistë të profileve të ndryshme - kibernetikë, neurofiziologë, psikologë, matematikanë, ekonomistë, etj. Është kryesisht për këtë arsye që vetë njohja moderne e modeleve ushqehet nga idetë e këtyre disiplinave. Pa pretenduar plotësinë (dhe është e pamundur të pretendohet në një ese të shkurtër), ne do të përshkruajmë historinë e njohjes së modelit dhe idetë kryesore.

Përkufizimet

Para se të vazhdojmë me metodat kryesore të njohjes së modelit, ne paraqesim disa përkufizime të nevojshme.

Njohja e modelit (objektet, sinjalet, situatat, fenomenet ose proceset) është detyra e identifikimit të një objekti ose përcaktimit të ndonjë prej vetive të tij nga imazhi i tij (njohja optike) ose regjistrimi audio (njohja akustike) dhe karakteristika të tjera.

Një nga ato bazë është koncepti i grupit, i cili nuk ka një formulim specifik. Në një kompjuter, një grup përfaqësohet si një grup elementësh që nuk përsëriten të të njëjtit lloj. Fjala "jo-përsëritëse" do të thotë që një element në grup ose është aty ose nuk është aty. Një grup universal përfshin të gjithë elementët e mundshëm për problemin që zgjidhet, një grup bosh nuk përmban asnjë.

Një imazh është një grupim klasifikimi në një sistem klasifikimi që bashkon (thekson) një grup të caktuar objektesh sipas një kriteri të caktuar. Imazhet kanë një veti karakteristike, e cila manifestohet në faktin se njohja me një numër të kufizuar fenomenesh nga i njëjti grup bën të mundur njohjen e një numri të madh arbitrarisht të përfaqësuesve të tij. Imazhet kanë veti karakteristike objektive në kuptimin që njerëz të ndryshëm, të stërvitur në materiale të ndryshme vëzhguese, në pjesën më të madhe klasifikojnë të njëjtat objekte në të njëjtën mënyrë dhe në mënyrë të pavarur nga njëri-tjetri. Në formulimin klasik të problemit të njohjes, grupi universal ndahet në pjesë të imazhit. Çdo hartë e një objekti në organet perceptuese të sistemit të njohjes, pavarësisht nga pozicioni i tij në lidhje me këto organe, zakonisht quhet imazh i objektit, dhe grupet e imazheve të tilla, të bashkuara nga disa veti të përbashkëta, janë imazhe.

Metoda e caktimit të një elementi në çdo imazh quhet një rregull vendimtar. Një koncept tjetër i rëndësishëm është metrika, një mënyrë për të përcaktuar distancën midis elementeve të një grupi universal. Sa më e vogël të jetë kjo distancë, aq më të ngjashme janë objektet (simbolet, tingujt, etj.) - ato që ne njohim. Në mënyrë tipike, elementët specifikohen si një grup numrash, dhe metrika specifikohet si një funksion. Efektiviteti i programit varet nga zgjedhja e paraqitjes së imazhit dhe zbatimit metrikë, një algoritëm njohjeje me metrika të ndryshme do të bëjë gabime me frekuenca të ndryshme.

Mësimi zakonisht quhet procesi i zhvillimit në një sistem të caktuar një ose një reagim tjetër ndaj grupeve të sinjaleve të jashtme identike përmes ekspozimit të përsëritur ndaj sistemit të rregullimeve të jashtme. Rregullime të tilla të jashtme në trajnim zakonisht quhen "shpërblime" dhe "dënime". Mekanizmi për gjenerimin e këtij rregullimi përcakton pothuajse plotësisht algoritmin e të mësuarit. Vetë-mësimi ndryshon nga trajnimi në atë që këtu nuk jepet informacion shtesë në lidhje me korrektësinë e reagimit ndaj sistemit.

Përshtatja është procesi i ndryshimit të parametrave dhe strukturës së sistemit, dhe ndoshta veprimet e kontrollit, bazuar në informacionin aktual për të arritur një gjendje të caktuar të sistemit në pasigurinë fillestare dhe ndryshimin e kushteve të funksionimit.

Të mësuarit është një proces si rezultat i të cilit sistemi gradualisht fiton aftësinë për t'iu përgjigjur me reagimet e nevojshme grupeve të caktuara të ndikimeve të jashtme, dhe përshtatja është rregullimi i parametrave dhe strukturës së sistemit për të arritur cilësinë e kërkuar të kontrollit. përballë ndryshimeve të vazhdueshme në kushtet e jashtme.

Shembuj të detyrave të njohjes së modeleve: - Njohja e shkronjave;

Në këtë artikull, kam vendosur të nxjerr në pah disa nga rezultatet themelore të teorisë së mësimit të makinerive në një mënyrë që t'i bëjë konceptet të qarta për lexuesit me disa njohuri për problemet e klasifikimit dhe regresionit. Ideja për të shkruar një artikull të tillë bëhej gjithnjë e më e qartë në mendjen time me çdo libër që lexoja, në të cilin idetë e mësimit të makinave për të njohur thuheshin si nga mesi dhe ishte plotësisht e paqartë se çfarë autorët e këtij apo në atë metodë u mbështet gjatë zhvillimit të saj. Nga ana tjetër, ka një numër librash kushtuar koncepteve bazë në mësimin e makinerive, por prezantimi i materialit në to mund të duket shumë kompleks për leximin e parë.

Motivimi

Le të shqyrtojmë këtë problem. Ne kemi mollë të dy klasave - të shijshme dhe jo të shijshme, 1 dhe 0. Mollët kanë karakteristika - ngjyrën dhe madhësinë. Ngjyra do të ndryshojë vazhdimisht nga 0 në 1, d.m.th. 0 - mollë plotësisht jeshile, 1 - plotësisht e kuqe. Madhësia mund të ndryshojë në të njëjtën mënyrë, 0 - mollë e vogël, 1 - e madhe. Ne do të donim të zhvillonim një algoritëm që do të merrte ngjyrën dhe madhësinë si hyrje, dhe do të nxirrte klasën e mollës - pavarësisht nëse është e shijshme apo jo. Është shumë e dëshirueshme që sa më pak të jetë numri i gabimeve, aq më mirë. Në të njëjtën kohë, ne kemi një listë përfundimtare që përmban të dhëna historike për ngjyrën, madhësinë dhe klasën e mollëve. Si mund ta zgjidhnim një problem të tillë?

Qasje logjike

Kur zgjidhim problemin tonë, metoda e parë që mund të na vijë ndërmend mund të jetë kjo: le të krijojmë manualisht rregulla si if-else dhe, në varësi të vlerave të ngjyrës dhe madhësisë, do t'i caktojmë një klasë të caktuar mollës. ato. ne kemi parakushte - ngjyrën dhe madhësinë, dhe ka një pasojë - shijen e mollës. Është mjaft e arsyeshme kur ka pak shenja dhe pragjet mund të vlerësohen me sy për krahasim. Por mund të ndodhë që nuk është e mundur të krijohen kushte të qarta dhe nga të dhënat nuk është e qartë se cilat pragje duhet të merren dhe numri i shenjave mund të rritet në të ardhmen. Po sikur në listën tonë me të dhëna historike, të gjenim dy mollë me të njëjtën ngjyrë dhe madhësi, por njëra është e shënuar si e shijshme dhe tjetra jo? Kështu, metoda jonë e parë nuk është aq fleksibël dhe e shkallëzuar sa do të dëshironim.

Emërtimet

Le të prezantojmë shënimin e mëposhtëm. Mollën e th do ta shënojmë si . Nga ana tjetër, secili përbëhet nga dy numra - ngjyra dhe madhësia. Këtë fakt do ta shënojmë me një çift numrash: . Klasën e secilës mollë e shënojmë si . Lista me të dhënat historike do të shënohet me shkronjën, gjatësia e kësaj liste është . Elementi i th i kësaj liste është vlera e atributeve të mollës dhe klasa e saj. ato. . Ne do ta quajmë gjithashtu një mostër. Ne përdorim shkronja të mëdha për të treguar variabla që mund të marrin vlerat e një atributi dhe klase specifike. Le të prezantojmë një koncept të ri - një rregull vendimi është një funksion që merr ngjyrën dhe madhësinë si hyrje dhe kthen një etiketë klase si dalje:

Qasje probabiliste

Duke zhvilluar idenë e një metode logjike me premisa dhe pasoja, le t'i bëjmë vetes pyetjen - sa është probabiliteti që molla e tretë që nuk i përket kampionit tonë të jetë e shijshme, duke pasur parasysh vlerat e matura të ngjyrës dhe madhësisë. ? Në shënimin e teorisë së probabilitetit, kjo pyetje mund të shkruhet si më poshtë:

Kjo shprehje mund të interpretohet si një premisë, si pasojë, por kalimi nga premisa në pasojë do t'u bindet ligjeve probabiliste, jo atyre logjike. ato. Në vend të një tabele të vërtete me vlera Boolean 0 dhe 1 për një klasë, do të ketë vlera probabiliteti që variojnë nga 0 në 1. Aplikoni formulën e Bayes dhe merrni shprehjen e mëposhtme:

Le të shohim më në detaje anën e djathtë të kësaj shprehjeje. Shumëzuesi quhet probabiliteti i mëparshëm dhe nënkupton probabilitetin për të gjetur një mollë të shijshme midis të gjitha mollëve të mundshme. Ekziston një probabilitet apriori për të hasur në një mollë pa shije. Ky probabilitet mund të pasqyrojë njohuritë tona personale se si mollët e shijshme dhe të papëlqyeshme shpërndahen në natyrë. Për shembull, nga përvoja jonë e kaluar ne e dimë se 80% e të gjitha mollëve janë të shijshme. Ose mund ta vlerësojmë këtë vlerë thjesht duke llogaritur proporcionin e mollëve të shijshme në listën tonë me të dhënat historike S. Faktori tjetër tregon se sa gjasa ka për të marrë një vlerë specifike ngjyre dhe madhësie për një mollë të klasës 1. Kjo shprehje quhet gjithashtu funksioni i gjasave dhe mund të duket kështu: një shpërndarje specifike, për shembull, normale. Ne përdorim emëruesin si një konstante normalizuese në mënyrë që probabiliteti i dëshiruar të ndryshojë nga 0 në 1. Qëllimi ynë përfundimtar nuk është të kërkojmë probabilitete, por të kërkojmë një rregull vendimtar që do të na jepte menjëherë klasën. Forma përfundimtare e rregullit të vendimit varet nga ato vlera dhe parametra të njohur për ne. Për shembull, ne mund të dimë vetëm vlerat e probabilitetit të mëparshëm, dhe vlerat e mbetura nuk mund të vlerësohen. Atëherë rregulli vendimtar do të jetë ky - cakto të gjitha mollëve vlerën e klasës për të cilën probabiliteti apriori është më i madhi. ato. nëse e dimë se 80% e mollëve në natyrë janë të shijshme, atëherë secilës mollë i japim një klasë 1. Atëherë gabimi ynë do të jetë 20%. Nëse mund të vlerësojmë edhe vlerat e funksionit të gjasave $p(X=x_m | Y=1)$, atëherë mund të gjejmë vlerën e probabilitetit të dëshiruar duke përdorur formulën Bayes, siç është shkruar më sipër. Rregulli vendimtar këtu do të jetë ky: vendosni një etiketë për klasën për të cilën probabiliteti është maksimal:

Le ta quajmë këtë rregull klasifikues Bayesian. Meqenëse kemi të bëjmë me probabilitete, edhe një vlerë e madhe probabiliteti nuk garanton që molla nuk i përket klasës 0. Le të vlerësojmë probabilitetin e një gabimi në një mollë si më poshtë: nëse rregulli i vendimit kthen një vlerë klase të barabartë me 1 , atëherë probabiliteti i një gabimi do të jetë dhe anasjelltas:

Ne jemi të interesuar në probabilitetin e një gabimi klasifikues jo vetëm në këtë shembull specifik, por në përgjithësi për të gjitha mollët e mundshme:

Kjo shprehje është vlera e pritur e gabimit. Pra, duke zgjidhur problemin origjinal, arritëm te klasifikuesi Bayesian, por cilat janë disavantazhet e tij? Problemi kryesor është të vlerësohet probabiliteti i kushtëzuar nga të dhënat. Në rastin tonë, ne përfaqësojmë një objekt me një palë numrash - ngjyra dhe madhësia, por në problemet më komplekse dimensioni i veçorive mund të jetë shumë herë më i lartë dhe numri i vëzhgimeve nga lista jonë me të dhëna historike mund të mos jetë i mjaftueshëm për të vlerësuar probabiliteti i një ndryshoreje të rastësishme shumëdimensionale. Më pas, ne do të përpiqemi të përgjithësojmë konceptin tonë të gabimit të klasifikuesit, dhe gjithashtu të shohim nëse është e mundur të zgjedhim ndonjë klasifikues tjetër për të zgjidhur problemin.

Humbjet e gabimit të klasifikuesit

Le të supozojmë se tashmë kemi një rregull vendimi. Pastaj mund të bëjë dy lloje gabimesh - i pari është të caktojë një objekt në klasën 0, klasa reale e të cilit është 1, dhe anasjelltas, të caktojë një objekt në klasën 1, klasa reale e të cilit është 0. Në disa probleme është e rëndësishme për të dalluar këto raste. Për shembull, ne vuajmë më shumë kur një mollë e etiketuar si e shijshme rezulton pa shije dhe anasjelltas. Ne e zyrtarizojmë shkallën e shqetësimit tonë nga pritshmëritë e zhgënjyera në koncept Në përgjithësi, ne kemi një funksion humbjeje që kthen një numër për çdo gabim klasifikues. Le të jetë një etiketë e vërtetë e klasës. Funksioni i humbjes më pas kthen vlerën e humbjes për etiketën aktuale të klasës dhe vlerën e rregullit tonë të vendimit. Një shembull i përdorimit të këtij funksioni - marrim nga një mollë me një klasë të njohur, kalojmë mollën si hyrje në rregullin tonë të vendimit, marrim një vlerësim të klasës nga rregulli i vendimit, nëse vlerat përputhen, atëherë supozojmë se klasifikuesi nuk gaboi dhe nuk ka humbje, nëse vlerat nuk përputhen, atëherë sasia e humbjes do të thotë funksioni ynë

Rreziku i kushtëzuar dhe Bayesian

Tani që kemi një funksion humbjeje dhe e dimë se sa humbim nga klasifikimi i gabuar i objekteve, do të ishte mirë të kuptonim se sa humbim mesatarisht, në shumë objekte. Nëse e dimë vlerën - probabiliteti që molla e tretë të jetë e shijshme, duke pasur parasysh vlerat e matura të ngjyrës dhe madhësisë, si dhe vlerën reale të klasës (për shembull, merrni një mollë nga mostra S, shihni në fillimi i artikullit), atëherë mund të prezantojmë konceptin e rrezikut të kushtëzuar. Rreziku i kushtëzuar është vlera mesatare e humbjeve në objekt për rregullin vendimtar:

Në rastin tonë të klasifikimit binar kur rezulton:

Më sipër përshkruam rregullin e vendimit, i cili i cakton një objekt klasës që ka vlerën më të lartë të probabilitetit. kemi prezantuar. Kjo do të thotë se klasifikuesi Bayesian ka gabimin më të vogël të mundshëm të klasifikimit.

Disa funksione tipike të humbjes

Një nga funksionet më të zakonshme të humbjes është një funksion simetrik, kur humbjet nga lloji i parë dhe i dytë i gabimeve janë ekuivalente. Për shembull, funksioni i humbjes 1-0 (humbje zero-një) përcaktohet si më poshtë:

Atëherë rreziku i kushtëzuar për a(x) = 1 do të jetë thjesht vlera e probabilitetit për të marrë klasën 0 në objekt:

Në mënyrë të ngjashme për a(x) = 0:

Funksioni i humbjes 1-0 merr vlerën 1 nëse klasifikuesi bën një gabim në objekt dhe 0 nëse nuk e bën. Tani le të sigurohemi që vlera e gabimit të mos jetë e barabartë me 1, por me një funksion tjetër Q, në varësi të rregullit të vendimit dhe etiketës reale të klasës:

Atëherë rreziku i kushtëzuar mund të shkruhet si më poshtë:

Shënime mbi shënimin

Teksti i mëparshëm u shkrua sipas shënimit të miratuar në libër nga Duda dhe Hart. Në librin origjinal nga V.N. Vapnik mori në konsideratë procesin e mëposhtëm: natyra zgjedh një objekt sipas shpërndarjes $p(x)$, dhe më pas i cakton një etiketë klase sipas shpërndarjes së kushtëzuar $p(y|x)$. Pastaj rreziku (pritja e humbjeve) përcaktohet si

Ku është funksioni me të cilin po përpiqemi të përafrojmë varësinë e panjohur, është funksioni i humbjes për vlerën reale dhe vlerën e funksionit tonë. Ky shënim është më i qartë për të prezantuar konceptin tjetër - rrezikun empirik.

Rreziku empirik

Në këtë fazë, ne kemi zbuluar tashmë se metoda logjike nuk është e përshtatshme për ne, sepse nuk është mjaft fleksibël dhe nuk mund të përdorim klasifikuesin Bayesian kur ka shumë veçori, por ka një numër të kufizuar të dhënash trajnimi dhe ne nuk mund të rivendosë probabilitetin. Ne gjithashtu e dimë se klasifikuesi Bayesian ka gabimin më të vogël të mundshëm të klasifikimit. Meqenëse nuk mund të përdorim një klasifikues Bayesian, le të përdorim diçka më të thjeshtë. Le të rregullojmë disa familje parametrike të funksioneve H dhe të zgjedhim një klasifikues nga kjo familje.

Shembull: le bashkësinë e të gjitha funksioneve të formës

Të gjitha funksionet e këtij grupi do të ndryshojnë nga njëri-tjetri vetëm nga koeficientët Kur zgjodhëm një familje të tillë, supozuam se në koordinatat e madhësisë së ngjyrës midis pikave të klasës 1 dhe pikave të klasës 0 mund të vizatojmë një vijë të drejtë me koeficientë në një të tillë. mënyrë që pikat me klasa të ndryshme janë të vendosura përgjatë anëve të ndryshme të vijës së drejtë. Dihet se për një drejtëz të këtij lloji vektori i koeficientit është normal me drejtëzën. Tani e bëjmë këtë - marrim mollën tonë, matim ngjyrën dhe madhësinë e saj dhe vizatojmë pikën me koordinatat e marra në grafik në boshtet e madhësisë së ngjyrës. Më pas, matim këndin ndërmjet kësaj pike dhe vektorit $w$. Vëmë re se pika jonë mund të shtrihet ose në njërën ose në anën tjetër të vijës së drejtë. Atëherë këndi midis dhe pikës do të jetë ose akut ose i mpirë, dhe produkti skalar do të jetë ose pozitiv ose negativ. Kjo çon në rregullin vendimtar:

Pasi të kemi fiksuar klasën e funksioneve $H$, lind pyetja - si të zgjedhim një funksion prej tij me koeficientët e kërkuar? Përgjigja është - le të zgjedhim funksionin që minimizon rrezikun tonë Bayesian $R()$. Përsëri, problemi është se për të llogaritur vlerat e rrezikut Bayesian, duhet të dini shpërndarjen $p(x,y)$, por ajo nuk na është dhënë dhe nuk është gjithmonë e mundur ta rivendosni atë. Një ide tjetër është të minimizoni rrezikun jo në të gjitha objektet e mundshme, por vetëm në një mostër. ato. Minimizimi i funksionit:

Ky funksion quhet risk empirik. Pyetja tjetër është pse vendosëm që duke minimizuar rrezikun empirik, të minimizojmë edhe rrezikun Bayesian? Më lejoni t'ju kujtoj se detyra jonë praktike është të bëjmë sa më pak gabime klasifikimi. Sa më pak gabime, aq më i ulët është rreziku Bayesian. Arsyetimi për konvergjencën e rrezikut empirik me rrezikun Bayesian me rritjen e vëllimit të të dhënave u mor në vitet '70 nga dy shkencëtarë - V. N. Vapnik dhe A. Ya.

Garancitë e konvergjencës. Rasti më i thjeshtë

Pra, kemi arritur në përfundimin se klasifikuesi Bayesian jep gabimin më të vogël të mundshëm, por në të shumtën e rasteve nuk mund ta trajnojmë atë dhe gjithashtu nuk jemi në gjendje të llogarisim gabimin (riskun). Megjithatë, ne mund të llogarisim një përafrim me rrezikun Bayesian, i cili quhet rrezik empirik, dhe duke ditur rrezikun empirik, të zgjedhim një funksion të përafërt që do të minimizonte rrezikun empirik. Le të shohim situatën më të thjeshtë ku minimizimi i rrezikut empirik prodhon një klasifikues që gjithashtu minimizon rrezikun Bayesian. Për rastin më të thjeshtë, do të na duhet të bëjmë një supozim që rrallë kënaqet në praktikë, por që mund të qetësohet më vonë. Le të rregullojmë një klasë të fundme funksionesh nga e cila do të zgjedhim klasifikuesin tonë dhe të supozojmë se funksioni real që përdor natyra për të klasifikuar mollët tona në shije është në këtë grup të fundme hipotezash: . Kemi edhe një mostër të marrë nga shpërndarja mbi objekte. Ne i konsiderojmë të gjitha objektet e mostrës si të shpërndara në mënyrë të barabartë në mënyrë të pavarur (iid). Atëherë sa vijon do të jetë e vërtetë

Teorema

Duke zgjedhur një funksion nga një klasë duke përdorur minimizimin empirik të rrezikut, ne jemi të garantuar të gjejmë një të tillë që të ketë një vlerë të vogël rreziku Bayesian nëse kampioni mbi të cilin ne kryejmë minimizimin është me madhësi të mjaftueshme.

Çfarë do të thotë "vlerë e vogël" dhe "madhësi e mjaftueshme", shihni literaturën më poshtë.

Ideja e provës

Sipas kushteve të teoremës, marrim një mostër nga shpërndarja, d.m.th. procesi i përzgjedhjes së objekteve nga natyra është i rastësishëm. Sa herë që mbledhim një mostër, ajo do të jetë nga e njëjta shpërndarje, por vetë objektet mund të jenë të ndryshme. Ideja kryesore e provës është se ne mund të marrim një mostër kaq të keqe sa që algoritmi që zgjedhim duke minimizuar rrezikun empirik në këtë kampion do të jetë i keq në minimizimin e rrezikut Bayesian, por në të njëjtën kohë do të jetë i mirë në duke minimizuar rrezikun empirik, por probabiliteti për të marrë një kampion të tillë është i vogël dhe rritja e madhësisë së kampionit, kjo probabilitet zvogëlohet. Teorema të ngjashme ekzistojnë për supozime më realiste, por ne nuk do t'i shqyrtojmë ato këtu.

Rezultatet praktike

Duke pasur dëshmi se funksioni i gjetur duke minimizuar rrezikun empirik nuk do të ketë një gabim të madh në të dhënat e pavëzhguara më parë me një madhësi të mjaftueshme të kampionit të trajnimit, ne mund ta përdorim këtë parim në praktikë, për shembull, si më poshtë - marrim shprehjen:

Dhe ne zëvendësojmë funksione të ndryshme humbjeje, në varësi të problemit që zgjidhet. Për regresionin linear:

Për regresionin logjistik:

Megjithëse makinat me vektor mbështetës kanë një motivim kryesisht gjeometrik, ato gjithashtu mund të mendohen si një problem empirik i minimizimit të rrezikut.

konkluzioni

Shumë metoda mësimore të mbikëqyrura mund të konsiderohen, ndër të tjera, si raste të veçanta të teorisë së zhvilluar nga V. N. Vapnik dhe A. Ya. Kjo teori ofron garanci në lidhje me gabimin në kampionin e testimit, me kusht që të ketë një madhësi të mjaftueshme të kampionit të trajnimit dhe kërkesa të caktuara për hapësirën e hipotezës në të cilën ne kërkojmë për algoritmin tonë.

Libra të përdorur

  • Natyra e teorisë së të mësuarit statistikor, Vladimir N. Vapnik
  • Klasifikimi i modelit, Botimi i 2-të, Richard O. Duda, Peter E. Hart, David G. Stork
  • Kuptimi i mësimit të makinerive: Nga teoria te algoritmet, Shai Shalev-Shwartz, Shai Ben-David
P.S. Ju lutemi shkruani në një mesazh personal për çdo pasaktësi apo gabim shtypi.

Etiketa: Shtoni etiketa



Ju pëlqeu artikulli? Ndani me miqtë tuaj!