Prandaj, njohja e modelit është në teori. "Kontrolli adaptiv i sistemeve komplekse bazuar në teorinë e njohjes së modelit

Metoda e forcës brutale. Në këtë metodë bëhet krahasimi me një bazë të caktuar të dhënash, ku për çdo objekt paraqiten opsione të ndryshme për modifikimin e ekranit. Për shembull, për njohjen optike të modelit, mund të përdorni metodën e forcës brutale. kënde të ndryshme ose shkallët, zhvendosjet, deformimet, etj. Për shkronjat, mund të ndryshoni fontin ose vetitë e tij. Në rastin e njohjes së modelit të tingullit, bëhet një krahasim me disa modele të njohura (një fjalë e thënë nga shumë njerëz). Më pas, kryhet një analizë më e thellë e karakteristikave të imazhit. Në rastin e njohjes optike, ky mund të jetë përcaktimi i karakteristikave gjeometrike. Në këtë rast, kampioni i zërit i nënshtrohet analizës së frekuencës dhe amplitudës.

Metoda tjetër - përdorimi i rrjeteve nervore artificiale(INS). Kërkon ose një numër të madh shembujsh të një detyre njohjeje, ose një strukturë të veçantë të rrjetit nervor që merr parasysh specifikat e një detyre të caktuar. Por, megjithatë, kjo metodë është shumë efikase dhe produktive.

Metodat e bazuara në vlerësimet e densitetit të shpërndarjes së vlerave të veçorive. Huazuar nga teoria klasike zgjidhje statistikore, në të cilën objektet e studimit konsiderohen si realizime të një ndryshoreje të rastësishme shumëdimensionale të shpërndarë në hapësirën e veçorive sipas ndonjë ligji. Ato bazohen në një kornizë vendimmarrëse Bayesian që i përshtatet probabilitetet fillestare përkatësia e objekteve në një klasë të caktuar dhe dendësitë e kushtëzuara shpërndarja e veçorive.

Një grup metodash të bazuara në vlerësimin e densitetit të shpërndarjes së vlerave të veçorive lidhet drejtpërdrejt me metodat e analizës diskriminuese. Qasja Bayesian ndaj vendimmarrjes është një nga më të zhvilluarat në statistikat moderne metodat parametrike, për të cilat supozohet se dihet shprehja analitike e ligjit të shpërndarjes (ligji normal) dhe duhet të vlerësohen vetëm një numër i vogël parametrash (vektorë të vlerave mesatare dhe matrica të kovariancës). Vështirësitë kryesore në përdorimin e kësaj metode konsiderohen si nevoja për të mbajtur mend të gjithë kampionin e trajnimit për të llogaritur vlerësimet e densitetit dhe ndjeshmërinë e lartë ndaj kampionit të trajnimit.

Metodat e bazuara në supozimet e klasës funksionet vendimtare. Në këtë grup, lloji i funksionit të vendimit konsiderohet i njohur dhe specifikohet funksionaliteti i cilësisë së tij. Bazuar në këtë funksional, përafrimi optimal me funksionin e vendimit gjendet duke përdorur sekuencën e trajnimit. Rregulli i vendimit për cilësinë funksionale zakonisht shoqërohet me gabime. Avantazhi kryesor i metodës është qartësia e formulimit matematikor të problemit të njohjes. Mundësia e nxjerrjes së njohurive të reja për natyrën e një objekti, në veçanti njohuri për mekanizmat e ndërveprimit të atributeve, këtu kufizohet thelbësisht nga struktura e caktuar e ndërveprimit, e fiksuar në formën e zgjedhur të funksioneve të vendimit.

Metoda e krahasimit me prototipin. Kjo është metoda më e lehtë e njohjes zgjatuese në praktikë. Përdoret kur klasat e njohura tregohen si klasa gjeometrike kompakte. Pastaj qendra e grupimit gjeometrik (ose objekti më afër qendrës) zgjidhet si pika prototip.

Për të klasifikuar një objekt të papërcaktuar, gjendet prototipi më i afërt me të dhe objekti i përket të njëjtës klasë si ai. Natyrisht, në këtë metodë nuk formohen imazhe të përgjithësuara. Lloje të ndryshme distancash mund të përdoren si masë.

Metoda k fqinjët më të afërt. Metoda konsiston në faktin se gjatë klasifikimit të një objekti të panjohur, gjendet një numër i caktuar (k) i veçorive gjeometrikisht më të afërta në hapësirën e fqinjëve të tjerë më të afërt me anëtarësim tashmë të njohur në çdo klasë. Vendimi për të klasifikuar një objekt të panjohur merret duke analizuar informacionin për fqinjët e tij më të afërt. Nevoja për të zvogëluar numrin e objekteve në kampionin e trajnimit (precedentë diagnostikues) është një disavantazh i kësaj metode, pasi kjo zvogëlon përfaqësimin e kampionit të trajnimit.

Bazuar në faktin se algoritme të ndryshme njohjeje manifestohen ndryshe në të njëjtin mostër, lind pyetja për sintetikën rregull vendimtar, i cili do të përdorte pikat e forta të gjitha algoritmet. Ekziston një metodë ose ekipe sintetike për këtë rregulla vendimtare, të cilat kombinohen sa më shumë aspektet pozitive secila prej metodave.

Për të përfunduar rishikimin e metodave të njohjes, do të paraqesim thelbin e sa më sipër në një tabelë përmbledhëse, duke shtuar aty edhe disa metoda të tjera të përdorura në praktikë.

Tabela 1. Tabela e klasifikimit të metodave të njohjes, krahasimi i fushave të aplikimit dhe kufizimeve të tyre

Klasifikimi i metodave të njohjes

Fusha e zbatimit

Kufizimet (disvantazhet)

Metodat intensive të njohjes

Metodat e bazuara në vlerësimet e densitetit

Probleme me një shpërndarje të njohur (normale), nevoja për të mbledhur statistika të mëdha

Nevoja për të numëruar të gjithë kampionin e trajnimit gjatë njohjes, ndjeshmëri e lartë ndaj mospërfaqësimit të mostrës së trajnimit dhe objekteve

Metodat e bazuara në supozime

Klasat duhet të jenë të ndara mirë

Lloji i funksionit të vendimmarrjes duhet të dihet paraprakisht. Pamundësia për të marrë parasysh njohuritë e reja në lidhje me korrelacionet midis tipareve

Metodat Boolean

Probleme të vogla

Kur zgjidhni rregullat e vendimeve logjike, kërkohet kërkimi shterues. Intensitet i lartë i punës

Metodat gjuhësore

Detyra e përcaktimit të gramatikës nga një grup i caktuar deklaratash (përshkrime të objekteve) është e vështirë të zyrtarizohet. Probleme teorike të pazgjidhura

Metodat e njohjes së zgjeruar

Metoda e krahasimit me një prototip

Problemet e dimensionit të vogël të hapësirës së veçorive

Varësia e lartë e rezultateve të klasifikimit në metrikë. Metrikë optimale e panjohur

k metoda e fqinjëve më të afërt

Varësia e lartë e rezultateve të klasifikimit në metrikë. Nevoja për një numërim të plotë të kampionit të trajnimit gjatë njohjes. Përpjekje llogaritëse

Algoritmet për llogaritjen e vlerësimeve (ABO)

Probleme të dimensioneve të vogla për sa i përket numrit të klasave dhe veçorive

Varësia e rezultateve të klasifikimit nga metrikat. Nevoja për një numërim të plotë të kampionit të trajnimit gjatë njohjes. Kompleksiteti i lartë teknik i metodës

Kolektivët e Rregullave të Vendimit (DRC) janë një metodë sintetike.

Probleme të dimensioneve të vogla për sa i përket numrit të klasave dhe veçorive

Kompleksitet teknik shumë i lartë i metodës, numër i pazgjidhur i problemeve teorike, si në përcaktimin e fushave të kompetencës së metodave private ashtu edhe në vetë metodat private.

  • Tutorial

Prej kohësh kam dashur të shkruaj një artikull të përgjithshëm që përmban bazat e Njohjes së Imazhit, një lloj udhëzuesi mbi metodat bazë, duke treguar se kur duhet t'i përdorim ato, çfarë problemesh zgjidhin, çfarë mund të bëhet në mbrëmje në gjunjë dhe çfarë është më mirë të mos mendosh pa pasur një ekip njerëzish në moshën 20-vjeçare.

Unë kam shkruar disa artikuj mbi Njohjen Optike për një kohë të gjatë, kështu që disa herë në muaj njerëz të ndryshëm më shkruajnë me pyetje mbi këtë temë. Ndonjëherë të vjen ndjesia se jeton me ta në botë të ndryshme. Nga njëra anë, ju e kuptoni se personi ka shumë të ngjarë të jetë profesionist në një temë të lidhur, por di shumë pak për metodat e njohjes optike. Dhe gjëja më e bezdisshme është se ai po përpiqet të aplikojë një metodë nga një fushë e afërt e njohurive, e cila është logjike, por nuk funksionon plotësisht në Njohjen e Imazhit, por ai nuk e kupton këtë dhe ofendohet shumë nëse filloni t'i tregoni diçka. nga bazat. Dhe duke pasur parasysh që të tregosh nga bazat kërkon shumë kohë, e cila shpesh nuk është e disponueshme, bëhet edhe më e trishtuar.

Ky artikull synon që një person që nuk ka punuar kurrë me metodat e njohjes së imazhit, brenda 10-15 minutash, të krijojë në kokën e tij një pamje të caktuar themelore të botës që korrespondon me temën dhe të kuptojë se në cilin drejtim të gërmojë. Shumë nga teknikat e përshkruara këtu janë të zbatueshme për përpunimin e radarit dhe audios.
Do të filloj me disa parime që ne gjithmonë fillojmë t'i tregojmë një klienti të mundshëm ose një personi që dëshiron të fillojë të bëjë Njohjen Optike:

  • Kur zgjidhni një problem, shkoni gjithmonë nga më e thjeshta. Është shumë më e lehtë të vendosësh një etiketë portokalli mbi një person sesa të ndjekësh një person, duke e theksuar atë në kaskada. Është shumë më e lehtë të marrësh një aparat fotografik me rezolucion më të lartë sesa të zhvillosh një algoritëm super-rezolucion.
  • Një formulim i rreptë i problemit në metodat e njohjes optike është më i rëndësishëm se sa në problemet e programimit të sistemit: një fjalë shtesë mund të shtojë 50% të punës në specifikimet teknike.
  • Nuk ka zgjidhje universale për problemet e njohjes. Ju nuk mund të bëni një algoritëm që thjesht do të "njohë çdo mbishkrim". Një shenjë në rrugë dhe një fletë teksti janë objekte thelbësisht të ndryshme. Ndoshta është e mundur të krijohet një algoritëm i përgjithshëm (një shembull i mirë nga Google), por do të kërkojë shumë punë nga një ekip i madh dhe do të përbëhet nga dhjetëra nënprograme të ndryshme.
  • OpenCV është një bibël që ka shumë metoda dhe mund të zgjidhë 50% të pothuajse çdo problemi, por OpenCV është vetëm një pjesë e vogël e asaj që mund të bëhet në të vërtetë. Në një studim, përfundimet u shkruan: "Problemi nuk mund të zgjidhet duke përdorur metodat OpenCV, prandaj është i pazgjidhshëm." Mundohuni ta shmangni këtë, mos u bëni dembel dhe vlerësoni me maturi detyrën aktuale nga e para çdo herë, pa përdorur shabllone OpenCV.
Është shumë e vështirë të japësh ndonjë këshillë universale, ose të thuash se si të krijosh një lloj strukture rreth së cilës mund të ndërtosh një zgjidhje për problemet arbitrare të vizionit kompjuterik. Qëllimi i këtij artikulli është të strukturojë atë që mund të përdoret. Do të përpiqem t'i ndaj metodat ekzistuese në tre grupe. Grupi i parë është filtrimi paraprak dhe përgatitja e imazhit. Grupi i dytë është përpunimi logjik i rezultateve të filtrimit. Grupi i tretë janë algoritmet e vendimmarrjes të bazuara në përpunimin logjik. Kufijtë midis grupeve janë shumë arbitrare. Për të zgjidhur një problem, nuk është gjithmonë e nevojshme të përdoren metoda nga të gjitha grupet, ndonjëherë mjaftojnë dy, e ndonjëherë edhe një.

Lista e metodave të dhëna këtu nuk është e plotë. Unë sugjeroj që në komentet të shtohen metoda kritike që nuk i kam shkruar dhe t'i atribuohen secilës 2-3 fjalë shoqëruese.

Pjesa 1. Filtrimi

Në këtë grup vendosa metoda që ju lejojnë të zgjidhni zonat me interes në imazhe pa i analizuar ato. Shumica e këtyre metodave aplikojnë një lloj transformimi të vetëm në të gjitha pikat në imazh. Në nivelin e filtrimit, analiza e imazhit nuk kryhet, por pikat që i nënshtrohen filtrimit mund të konsiderohen si zona me karakteristika të veçanta.
Binarizimi sipas pragut, përzgjedhja e zonës së histogramit
Transformimi më i thjeshtë është binarizimi i imazhit sipas pragut. Për imazhet RGB dhe gri, pragu është vlera e ngjyrës. Takohen probleme ideale, në të cilën një transformim i tillë është i mjaftueshëm. Supozoni se dëshironi të zgjidhni automatikisht objektet në një fletë të bardhë letre:




Zgjedhja e pragut në të cilin ndodh binarizimi përcakton kryesisht vetë procesin e binarizimit. Në këtë rast, imazhi u binarizuar nga ngjyra mesatare. Në mënyrë tipike, binarizimi kryhet duke përdorur një algoritëm që zgjedh në mënyrë adaptive një prag. Një algoritëm i tillë mund të jetë zgjedhja e pritjes ose mënyrës. Ose mund të zgjidhni majën më të madhe në histogram.

Binarizimi mund të sigurojë shumë rezultate interesante kur punoni me histograme, përfshirë në situatën kur ne e konsiderojmë një imazh jo në RGB, por në HSV. Për shembull, ngjyrat e segmentit me interes. Mbi këtë parim, ju mund të ndërtoni një detektor tag dhe një detektor të lëkurës njerëzore.
Filtrim klasik: Fourier, filtër me kalim të ulët, filtër me kalim të lartë
Metodat klasike të filtrimit të radarit dhe përpunimit të sinjalit mund të zbatohen me sukses në një sërë detyrash të Njohjes së Modeleve. Metoda tradicionale në radar, i cili pothuajse kurrë nuk përdoret në formë të pastër në imazhe, është transformimi Fourier (më konkretisht, FFT). Një nga përjashtimet e pakta në të cilat përdoret transformimi Furier njëdimensional është kompresimi i imazhit. Për analizën e imazhit, një transformim njëdimensional zakonisht nuk është i mjaftueshëm, ju duhet të përdorni një transformim dydimensional shumë më intensiv.

Pak njerëz e llogarisin atë zakonisht, është shumë më e shpejtë dhe më e lehtë për të përdorur konvolucionin e zonës së interesit me një filtër të gatshëm, të akorduar për frekuenca të larta (HPF) ose të ulëta (LPF). Kjo metodë, natyrisht, nuk lejon analizën e spektrit, por në një detyrë specifike të përpunimit të videos, ajo që zakonisht nevojitet nuk është analiza, por rezultati.


Shembujt më të thjeshtë të filtrave që theksojnë frekuencat e ulëta (filtri Gaussian) dhe frekuencave të larta(filtri Gabor).
Për çdo pikë imazhi, zgjidhet një dritare dhe shumëzohet me një filtër të së njëjtës madhësi. Rezultati i një konvolucioni të tillë është një vlerë e re pikë. Kur zbatoni filtra me kalim të ulët dhe filtra me kalim të lartë, merren imazhe të llojit të mëposhtëm:



Valët e valëve
Por, çka nëse përdorim disa funksione karakteristike arbitrare për konvolucionin me sinjalin? Atëherë do të quhet "Transformimi i valëzimit". Ky përkufizim i valëve nuk është i saktë, por tradicionalisht, në shumë ekipe, analiza e valëve është kërkimi i një modeli arbitrar në një imazh duke përdorur konvolucionin me një model të këtij modeli. Ekziston një grup funksionesh klasike që përdoren në analizën e valëve. Këto përfshijnë valëzimin Haar, valëzimin Morlet, valën e kapelës meksikane, etj. Primitivët Haar, për të cilët kishte disa nga artikujt e mi të mëparshëm (,), lidhen me funksione të tilla për hapësirën dy-dimensionale.


Më sipër janë 4 shembuj të valëve klasike. Wavelet 3-dimensionale Haar, valëzimi 2-dimensional Meyer, valëzimi meksikan Hat, valëzimi Daubechies. Një shembull i mirë Përdorimi i një interpretimi të zgjeruar të valëve është problemi i gjetjes së një shkëlqimi verbues në sy, për të cilin valëzimi është vetë shkëlqimi:

Valët klasike zakonisht përdoren për, ose për klasifikimin e tyre (që do të përshkruhet më poshtë).
Korrelacioni
Pas një interpretimi kaq të lirë të valëve nga ana ime, vlen të përmendet korrelacioni aktual që qëndron në themel të tyre. Ky është një mjet i domosdoshëm kur filtroni imazhe. Një aplikacion klasik po lidh një transmetim video për të gjetur zhvendosje ose rrjedha optike. Detektori më i thjeshtë i zhvendosjes është gjithashtu, në një farë kuptimi, një korrelator i ndryshimit. Aty ku imazhet nuk lidheshin, kishte lëvizje.

Funksionet e filtrimit
Një klasë interesante e filtrave është filtrimi i funksioneve. Këto janë filtra thjesht matematikorë që ju lejojnë të zbuloni një funksion të thjeshtë matematikor në një imazh (vijë, parabolë, rreth). Ndërtohet një imazh akumulues, në të cilin për secilën pikë të imazhit origjinal vizatohen një grup funksionesh që e gjenerojnë atë. Transformimi më klasik është transformimi Hough për linjat. Në këtë transformim, për secilën pikë (x;y), vizatohet një grup pikash (a;b) të drejtëzës y=ax+b për të cilat barazia është e vërtetë. Ju merrni foto të bukura:


(plusi i parë është për atë që është i pari që ka gjetur një kapje në foto dhe këtë përkufizim dhe e shpjegon atë, plusi i dytë është për atë që është i pari që thotë atë që tregohet këtu)
Transformimi Hough ju lejon të gjeni çdo funksion të parametrizueshëm. Për shembull rrathët. Ekziston një transformim i modifikuar që ju lejon të kërkoni për ndonjë. Matematikanët janë jashtëzakonisht të dhënë pas këtij transformimi. Por kur përpunoni imazhe, për fat të keq, nuk funksionon gjithmonë. Shpejtësi shumë e ngadaltë e funksionimit, ndjeshmëri shumë e lartë ndaj cilësisë së binarizimit. Edhe në situata ideale, preferoja të mjaftohesha me metoda të tjera.
Një analog i transformimit Hough për vijat e drejta është transformimi i Radonit. Ai llogaritet përmes FFT, i cili jep një fitim të performancës në një situatë ku ka shumë pikë. Përveç kësaj, mund të aplikohet në një imazh jo-binar.
Filtrimi i konturit
Një klasë e veçantë e filtrave është filtrimi i kufirit dhe konturit. Skicat janë shumë të dobishme kur duam të kalojmë nga puna me një imazh në punën me objektet në atë imazh. Kur një objekt është mjaft kompleks, por i dalluar mirë, atëherë shpesh mënyra e vetme për të punuar me të është të zgjidhni konturet e tij. Ka një sërë algoritmesh zgjidhjen e problemit qarqet e filtrimit:

Më shpesh përdoret Canny, i cili funksionon mirë dhe zbatimi i të cilit është në OpenCV (aty është edhe Sobel, por kërkon konturet më keq).



Filtra të tjerë
Më sipër janë filtra, modifikimet e të cilëve ndihmojnë në zgjidhjen e 80-90% të problemeve. Por përveç tyre, përdoren filtra më të rrallë detyrat lokale. Ka dhjetëra filtra të tillë, nuk do t'i rendis të gjithë. Interesante janë filtrat iterativë (për shembull), si dhe transformimet ridgelet dhe curvlet, të cilat janë një bashkim i filtrimit dhe analizës klasike të valëve në fushën e transformimit të radonit. Transformimi beamlet funksionon bukur në kufirin e transformimit të valëzimit dhe analizës logjike, duke ju lejuar të nënvizoni konturet:

Por këto transformime janë shumë specifike dhe të përshtatura për detyra të rralla.

Pjesa 2. Përpunimi logjik i rezultateve të filtrimit

Filtrimi siguron një grup të dhënash të përshtatshme për përpunim. Por shpesh nuk mund t'i marrësh dhe t'i përdorësh këto të dhëna pa i përpunuar ato. Do të ketë disa në këtë seksion metodat klasike, duke ju lejuar të lëvizni nga imazhi te vetitë e objekteve ose te vetë objektet.
Morfologjia
Kalimi nga filtrimi në logjikë, për mendimin tim, është metoda e morfologjisë matematikore (,). Në thelb, këto janë operacionet më të thjeshta të rritjes dhe gërryerjes së imazheve binare. Këto metoda ju lejojnë të hiqni zhurmën nga një imazh binar duke rritur ose ulur elementët ekzistues. Ekzistojnë algoritme konturuese të bazuara në morfologjinë matematikore, por zakonisht përdoren disa lloj algoritmesh hibride ose algoritme në kombinim.
Analiza e konturit
Algoritmet për marrjen e kufijve janë përmendur tashmë në seksionin mbi filtrimin. Kufijtë që rezultojnë shndërrohen thjesht në konture. Për algoritmin Canny kjo ndodh automatikisht për algoritme të tjera kërkohet binarizimi shtesë. Ju mund të merrni një kontur për një algoritëm binar, për shembull, duke përdorur algoritmin e brumbullit.
Një skicë është një karakteristikë unike e një objekti. Kjo shpesh ju lejon të identifikoni një objekt nga skica e tij. Ekziston një aparat i fuqishëm matematikor që ju lejon ta bëni këtë. Pajisja quhet analiza e konturit (,).

Për të qenë i sinqertë, kurrë nuk kam qenë në gjendje të aplikoj analizën e konturit në probleme reale. Kërkohen kushte shumë ideale. Ose nuk ka kufi, ose ka shumë zhurmë. Por, nëse keni nevojë të njihni diçka në kushte ideale, atëherë analiza e konturit është një opsion i shkëlqyeshëm. Punon shumë shpejt, matematikë e bukur dhe logjikë e qartë.
Pika të veçanta
Pikat singulare janë karakteristika unike të një objekti që lejojnë që objekti të krahasohet me vetveten ose me klasa të ngjashme objektesh. Ka disa dhjetëra mënyra për të identifikuar pika të tilla. Disa metoda nxjerrin në pah pika të veçanta në kornizat ngjitur, disa përdorin hendek i madh koha dhe kur ndryshon ndriçimi, disa ju lejojnë të gjeni pika të veçanta që mbeten të tilla edhe kur objekti rrotullohet. Le të fillojmë me metoda që ju lejojnë të gjeni pika të veçanta, të cilat nuk janë aq të qëndrueshme, por llogariten shpejt, dhe më pas do të shkojmë në kompleksitet në rritje:
Klasa e parë. Pika të veçanta që janë të qëndrueshme për një periudhë sekondash. Pika të tilla përdoren për të drejtuar një objekt midis kornizave ngjitur të videos ose për të kombinuar imazhe nga kamerat fqinje. Pika të tilla përfshijnë maksimumin lokal të imazhit, qoshet në imazh (më i miri nga detektorët është, ndoshta, detektori Charis), pikat në të cilat arrihet shpërndarja maksimale, gradientë të caktuar, etj.
Klasa e dytë. Pika të veçanta që janë të qëndrueshme kur ndriçimi ndryshon dhe lëvizjet e vogla të objektit. Pika të tilla shërbejnë kryesisht për trajnimin dhe klasifikimin pasues të llojeve të objekteve. Për shembull, një klasifikues i këmbësorëve ose një klasifikues i fytyrës është produkt i një sistemi të ndërtuar pikërisht në pika të tilla. Disa nga valët e përmendura më parë mund të jenë baza për pika të tilla. Për shembull, Haar primitives, kërkimi për pikat kryesore, kërkimi për funksione të tjera specifike. Këto pika përfshijnë ato të gjetura me metodën e histogramit të gradientëve të drejtimit (HOG).
Klasa e tretë. Pika të qëndrueshme. Unë di vetëm për dy metoda që ofrojnë stabilitet të plotë dhe për modifikimet e tyre. Kjo dhe. Ato ju lejojnë të gjeni pika të veçanta edhe kur rrotulloni imazhin. Llogaritja e pikave të tilla zgjat më shumë në krahasim me metodat e tjera, por koha është mjaft e kufizuar. Fatkeqësisht, këto metoda janë të patentuara. Edhe pse, në Rusi është e pamundur të patentohen algoritmet, prandaj përdorni atë për tregun e brendshëm.

Pjesa 3. Trajnimi

Pjesa e tretë e tregimit do t'i kushtohet metodave që nuk funksionojnë drejtpërdrejt me imazhin, por që ju lejojnë të merrni vendime. Në thelb është metoda të ndryshme mësimi i makinës dhe vendimmarrje. Yandyx postoi së fundmi në Habr për këtë temë, ka një përzgjedhje shumë të mirë atje. Këtu është në versionin tekst. Për një studim serioz të temës, unë rekomandoj shumë t'i shikoni ato. Këtu do të përpiqem të përshkruaj disa metoda kryesore të përdorura posaçërisht në njohjen e modeleve.
Në 80% të situatave, thelbi i të mësuarit në detyrën e njohjes është si më poshtë:
Ekziston një mostër provë që përmban disa klasa objektesh. Le të jetë prania/mungesa e një personi në foto. Për çdo imazh ka një grup karakteristikash që janë theksuar nga ndonjë veçori, qoftë Haar, HOG, SURF ose ndonjë valë valësh. Algoritmi i të mësuarit duhet të ndërtojë një model në mënyrë që të mund të analizojë një imazh të ri dhe të vendosë se cili objekt është në imazh.
Si bëhet kjo? Secila prej imazheve të testimit është një pikë në hapësirën e veçorive. Koordinatat e tij janë pesha e secilës prej veçorive në imazh. Le të jenë shenjat tona: “Prania e syve”, “Prania e një hunde”, “Prania e dy duarve”, “Prania e veshëve” etj... Të gjitha këto shenja do t’i nxjerrim në pah duke përdorur detektorët tanë ekzistues, të cilët janë trajnuar mbi pjesë të trupit të ngjashme me ato të njeriut Për një person në një hapësirë ​​të tillë, pika e saktë do të ishte . Për majmunin, pikë për kalin. Klasifikuesi trajnohet duke përdorur një mostër shembujsh. Por jo të gjitha fotografitë tregonin duar, të tjerat nuk kishin sy, dhe në të tretën, majmuni kishte një hundë njeriu për shkak të një gabimi klasifikues. Një klasifikues i trajnuar njerëzor ndan automatikisht hapësirën e veçorive në atë mënyrë që të thotë: nëse tipari i parë shtrihet në intervalin 0.5 Në thelb, qëllimi i klasifikuesit është të vizatojë zona në hapësirën e veçorive që janë karakteristike për objektet e klasifikimit. Kështu do të duket një përafrim vijues i përgjigjes për një nga klasifikuesit (AdaBoost) në hapësirën dy-dimensionale:


Ka shumë klasifikues. Secili prej tyre funksionon më mirë në një detyrë të veçantë. Detyra e zgjedhjes së një klasifikuesi për një detyrë specifike është kryesisht një art. Këtu janë disa foto të bukura mbi këtë temë.
Rast i thjeshtë, ndarje njëdimensionale
Le të shohim një shembull të rastit më të thjeshtë të klasifikimit, kur hapësira e veçorive është njëdimensionale dhe duhet të ndajmë 2 klasa. Situata ndodh më shpesh sesa mund të mendoni: për shembull, kur duhet të dalloni dy sinjale ose të krahasoni një model me një mostër. Le të kemi një mostër trajnimi. Kjo prodhon një imazh ku boshti X është masa e ngjashmërisë dhe boshti Y është numri i ngjarjeve me një masë të tillë. Kur objekti i dëshiruar është i ngjashëm me vetveten, fitohet një Gaussian i majtë. Kur nuk duket, është e duhura. Vlera e X=0.4 i ndan mostrat në mënyrë që një vendim i gabuar të minimizojë mundësinë e marrjes së ndonjë vendimi të gabuar. Kërkimi për një ndarës të tillë është detyrë e klasifikimit.


Një shënim i vogël. Kriteri që minimizon gabimin nuk do të jetë gjithmonë optimal. Grafiku i mëposhtëm është një grafik i një sistemi të vërtetë të njohjes së irisit. Për një sistem të tillë, zgjidhet kriteri për të minimizuar probabilitetin e pranimit të rremë të një personi të paautorizuar në objekt. Ky probabilitet quhet "gabim i tipit I", "probabiliteti i alarmit të rremë", "pozitiv i rremë". Në literaturën në gjuhën angleze “False Access Rate”.
) AdaBusta është një nga klasifikuesit më të zakonshëm. Për shembull, kaskada Haar është ndërtuar mbi të. Zakonisht përdoret kur nevojitet klasifikimi binar, por asgjë nuk e pengon trajnimin për një numër më të madh klasash.
SVM ( , , , ) Një nga klasifikuesit më të fuqishëm, i cili ka shumë zbatime. Në thelb, në detyrat e të mësuarit që kam hasur, funksionoi në mënyrë të ngjashme me Adabusta. Konsiderohet mjaft i shpejtë, por trajnimi i tij është më i vështirë se ai i Adabusta dhe kërkon zgjedhjen e bërthamës së duhur.

Ka ende rrjetet nervore dhe regresioni. Por për t'i klasifikuar shkurtimisht dhe për të treguar se si ndryshojnë, na duhet një artikull shumë më i gjatë se ky.
________________________________________________
Shpresoj se kam qenë në gjendje të jap një pasqyrë të shpejtë të metodave të përdorura pa u zhytur në matematikë dhe përshkrim. Ndoshta kjo do të ndihmojë dikë. Megjithëse, natyrisht, artikulli është i paplotë dhe nuk ka asnjë fjalë për punën me imazhe stereo, as për LSM me një filtër Kalman, as për qasjen adaptive Bayes.
Nëse ju pëlqen artikulli, do të përpiqem të bëj një pjesë të dytë me një përzgjedhje shembujsh se si zgjidhen problemet ekzistuese të Njohjes së Imazhit.

Dhe së fundi

Çfarë duhet lexuar?
1) Dikur më pëlqeu shumë libri "Përpunimi i imazhit dixhital" nga B. Yane, i cili është shkruar thjesht dhe qartë, por në të njëjtën kohë jepet pothuajse e gjithë matematika. Mirë për t'u njohur me metodat ekzistuese.
2) Një klasik i zhanrit është R. Gonzalez, R. Woods “Digital Image Processing”. Për disa arsye ishte më e vështirë për mua se e para. Shumë më pak matematikë, por më shumë metoda dhe fotografi.
3) "Përpunimi dhe analiza e imazhit në problemet e shikimit kompjuterik" - shkruar në bazë të një kursi të dhënë në një nga departamentet e Fizikës dhe Teknologjisë. Ka shumë metoda dhe përshkrime të hollësishme të tyre. Por për mendimin tim, libri ka dy disavantazhe të mëdha: libri është i fokusuar fort në paketën softuerike që vjen me të në libër, shumë shpesh përshkrimi i një metode të thjeshtë kthehet në një xhungël matematikore, nga e cila është e vështirë; nxjerrin diagramin strukturor të metodës. Por autorët kanë krijuar një faqe interneti të përshtatshme ku është paraqitur pothuajse e gjithë përmbajtja - wiki.technicalvision.ru Shtoni etiketa

Në përgjithësi, mund të dallohen tre metoda të njohjes së modelit: Metoda e forcës brutale. Në këtë rast, bëhet një krahasim me një bazë të dhënash, ku për çdo lloj objekti paraqiten modifikime të ndryshme të ekranit. Për shembull, për njohjen optike të modelit, mund të përdorni metodën e numërimit të pamjes së një objekti në kënde të ndryshme, shkallë, zhvendosje, deformime, etj. Për shkronjat, duhet të numëroni fontin, vetitë e shkronjave, etj. për njohjen e imazhit të zërit, në përputhje me rrethanat, bëhet një krahasim me disa modele të njohura (për shembull, një fjalë e folur nga disa njerëz).

Qasja e dytë përfshin një analizë më të thellë të karakteristikave të imazhit. Në rastin e njohjes optike, ky mund të jetë përcaktimi i karakteristikave të ndryshme gjeometrike. Në këtë rast, mostra e zërit i nënshtrohet analizës së frekuencës, amplitudës, etj.

Metoda tjetër është përdorimi i rrjeteve nervore artificiale (ANN). Kjo metodë kërkon ose një numër të madh shembujsh të detyrës së njohjes gjatë trajnimit, ose një strukturë të veçantë të rrjetit nervor që merr parasysh specifikat e kësaj detyre. Megjithatë, ofron efikasitet dhe produktivitet më të lartë.

4. Historia e njohjes së modelit

Le të shqyrtojmë shkurtimisht formalizmin matematikor të njohjes së modelit. Një objekt në njohjen e modelit përshkruhet nga një grup karakteristikash bazë (veçori, veti). Karakteristikat kryesore mund të jenë të një natyre të ndryshme: ato mund të merren nga një grup i renditur i llojit real të linjës, ose nga një grup diskrete (i cili, megjithatë, mund të jetë i pajisur edhe me strukturë). Ky kuptim i një objekti është në përputhje si me nevojën për aplikime praktike të njohjes së modelit ashtu edhe me të kuptuarit tonë të mekanizmit të perceptimit të objektit njerëzor. Në të vërtetë, ne besojmë se kur një person vëzhgon (mat) një objekt, informacioni rreth tij arrin në tru përmes një numri të kufizuar sensorësh (kanalesh të analizuara) dhe çdo sensor mund të shoqërohet me një karakteristikë përkatëse të objektit. Përveç veçorive që korrespondojnë me matjet tona të objektit, ekziston edhe një veçori e zgjedhur, ose një grup tiparesh, të cilat ne i quajmë tipare klasifikuese, dhe zbulimi i vlerave të tyre për një vektor të caktuar X është detyra e kryer nga sistemet e njohjes natyrore dhe artificiale.

Është e qartë se për të përcaktuar vlerat e këtyre veçorive, është e nevojshme të kemi informacion se si lidhen tiparet e njohura me ato klasifikuese. Informacioni për këtë lidhje jepet në formën e precedentëve, domethënë një grup përshkrimesh të objekteve me vlera të njohura të karakteristikave klasifikuese. Dhe bazuar në këtë informacion precedent, është e nevojshme të ndërtohet një rregull vendimi që do t'i caktojë një përshkrimi arbitrar të një objekti vlerat e veçorive të tij klasifikuese.

Ky kuptim i problemit të njohjes së modeleve është vendosur në shkencë që nga vitet 50 të shekullit të kaluar. Dhe më pas u vu re se një prodhim i tillë nuk ishte aspak i ri. Ne kemi hasur në një formulim të ngjashëm dhe tashmë ka ekzistuar metoda mjaft të vërtetuara të analizës së të dhënave statistikore, të cilat janë përdorur në mënyrë aktive për shumë probleme praktike, siç është, për shembull, diagnostikimi teknik. Prandaj, hapat e parë të njohjes së modelit u zhvilluan nën shenjën e një përqasjeje statistikore, e cila diktoi problemet kryesore.

Qasja statistikore bazohet në idenë se hapësira origjinale e objekteve është një hapësirë ​​probabiliste dhe shenjat (karakteristikat) e objekteve janë variabla të rastësishme të specifikuara në të. Pastaj detyra e shkencëtarit të të dhënave ishte që, bazuar në konsiderata të caktuara, të parashtronte një hipotezë statistikore për shpërndarjen e veçorive, ose më saktë, për varësinë e veçorive klasifikuese nga të tjerat. Hipoteza statistikore, si rregull, ishte një grup i përcaktuar parametrikisht i funksioneve të shpërndarjes së veçorive. Një hipotezë statistikore tipike dhe klasike është hipoteza për normalitetin e kësaj shpërndarjeje (statisticienët kanë dalë me shumë lloje hipotezash të tilla). Pas formulimit të hipotezës, mbeti që kjo hipotezë të testohej mbi të dhënat precedente. Ky test konsistonte në zgjedhjen e një shpërndarjeje të caktuar nga një grup shpërndarjesh të specifikuara fillimisht (parametri i hipotezës së shpërndarjes) dhe vlerësimi i besueshmërisë (intervali i besimit) të kësaj zgjedhjeje. Në fakt, ky funksion i shpërndarjes ishte përgjigja e problemit, vetëm se objekti nuk ishte më i klasifikuar në mënyrë të qartë, por me probabilitete të caktuara për t'u përkthyer në klasa. Statisticienët kanë zhvilluar gjithashtu një justifikim asimptotik për metoda të tilla. Arsyetime të tilla u bënë sipas skemës së mëposhtme: u vendos një funksionalitet i caktuar për cilësinë e zgjedhjes së shpërndarjes (intervali i besimit) dhe u tregua se me një rritje të numrit të precedentëve, zgjedhja jonë me një probabilitet prirje në 1 u bë e saktë në kuptimi i këtij funksioni (intervali i besimit që priret në 0). Duke parë përpara, do të themi se pamja statistikore e problemit të njohjes doli të jetë shumë frytdhënëse jo vetëm në aspektin e algoritmeve të zhvilluara (të cilat përfshijnë metoda të analizës grupore dhe diskriminuese, regresion joparametrik, etj.), por edhe më pas udhëhoqi Vapnik. për krijimin e një teorie të thellë statistikore të njohjes.

Megjithatë, ekziston një argument i fortë që duhet bërë se problemet e njohjes së modelit nuk mund të reduktohen në statistika. Çdo problem i tillë, në parim, mund të konsiderohet nga pikëpamja statistikore dhe rezultatet e zgjidhjes së tij mund të interpretohen statistikisht. Për ta bërë këtë, është e nevojshme vetëm të supozohet se hapësira e objektit të problemit është probabiliste. Por nga pikëpamja e instrumentalizmit, kriteri për suksesin e një interpretimi statistikor të një metode të caktuar njohjeje mund të jetë vetëm prania e justifikimit të kësaj metode në gjuhën e statistikës si degë e matematikës. Arsyetimi këtu nënkupton zhvillimin e kërkesave bazë për detyrën që sigurojnë sukses në zbatimin e kësaj metode. Megjithatë, për momentin, për shumicën e metodave të njohjes, përfshirë ato që u ngritën drejtpërdrejt në kuadrin e qasjes statistikore, nuk janë gjetur justifikime të tilla të kënaqshme. Përveç kësaj, algoritmet statistikore më të përdorura për momentin, si diskriminuesi linear Fisher, dritarja Parzen, algoritmi EM, metoda e fqinjit më të afërt, për të mos përmendur rrjetet e besimit Bayesian, kanë një natyrë të fortë heuriste dhe mund të kenë interpretime që ndryshojnë nga ato statistikore. Dhe së fundi, për të gjitha sa më sipër, duhet shtuar se përveç sjelljes asimptotike të metodave të njohjes, që është çështja kryesore e statistikave, praktika e njohjes ngre pyetje për kompleksitetin llogaritës dhe strukturor të metodave që shkojnë shumë përtej. vetëm fushëveprimi i teorisë së probabilitetit.

Pra, në kundërshtim me aspiratat e statisticienëve për ta konsideruar njohjen e modelit si një degë të statistikës, ide krejtësisht të ndryshme u përfshinë në praktikën dhe ideologjinë e njohjes. Njëra prej tyre u shkaktua nga kërkimet në fushën e njohjes së modeleve vizuale dhe bazohet në analogjinë e mëposhtme.

Siç është përmendur tashmë, në jetën e përditshme njerëzit zgjidhin vazhdimisht (shpesh në mënyrë të pandërgjegjshme) problemet e njohjes së situatave të ndryshme, imazheve dëgjimore dhe vizuale. Një aftësi e tillë për kompjuterët është, në rastin më të mirë, një gjë e së ardhmes. Prandaj, disa pionierë të njohjes së modeleve arritën në përfundimin se zgjidhja e këtyre problemeve në një kompjuter duhet, në terma të përgjithshëm, të modelojë proceset e të menduarit njerëzor. Përpjekja më e famshme për t'iu qasur problemit nga ky kënd ishte studimi i famshëm i F. Rosenblatt mbi perceptronet.

Nga mesi i viteve 50, dukej se neurofiziologët kishin kuptuar parimet fizike të trurit (në librin "Mendja e re e mbretit", fizikani i famshëm teorik britanik R. Penrose vë në dyshim modelin e rrjetit nervor të trurit, duke justifikuar roli i rëndësishëm i efekteve mekanike kuantike në funksionimin e tij, megjithëse, megjithatë, ky model u vu në dyshim që në fillim, bazuar në këto zbulime, F. Rosenblatt zhvilloi një model për njohjen vizuale të imazhit, të cilin ai e quajti perceptron Rosenblatt. funksionin e mëposhtëm (Fig. 1):

Fig 1. Qarku perceptron

Në hyrje, perceptroni merr një vektor objekti, i cili në punën e Rosenblatt ishte një vektor binar që tregon se cili nga pikselët e ekranit është nxirë nga imazhi dhe cili jo. Më pas, secila prej shenjave ushqehet në hyrjen e një neuroni, veprimi i të cilit është një shumëzim i thjeshtë me një peshë të caktuar të neuronit. Rezultatet ushqehen në neuronin e fundit, i cili i mbledh ato dhe krahason sasinë totale me një prag të caktuar. Në varësi të rezultateve të krahasimit, objekti hyrës X njihet si i kërkuar ose jo. Më pas, detyra e mësimdhënies së njohjes së modelit ishte të zgjidhnin peshat e neuroneve dhe vlerat e pragut, në mënyrë që perceptroni të jepte përgjigje të sakta në imazhet vizuale të mëparshme. Rosenblatt besonte se funksioni që rezulton do të ishte i mirë në njohjen e imazhit të dëshiruar vizual edhe nëse objekti i hyrjes nuk ishte ndër precedentët. Për arsye bionike, ai doli edhe me një metodë për zgjedhjen e peshave dhe pragjeve, në të cilën nuk do të ndalemi. Le të themi vetëm se qasja e tij doli të jetë e suksesshme në një sërë problemesh njohjeje dhe dha shkas për një drejtim të tërë kërkimi në algoritmet e të mësuarit të bazuara në rrjetet nervore, një rast i veçantë i të cilit është perceptroni.

Më tej, u shpikën përgjithësime të ndryshme të perceptronit, funksioni i neuroneve ishte i ndërlikuar: neuronet tani jo vetëm që mund të shumëzonin numrat e hyrjes ose t'i shtonin ato dhe të krahasonin rezultatin me pragjet, por të aplikonin funksione më komplekse në lidhje me to. Figura 2 tregon një nga këto komplikime të neuroneve:

Oriz. 2 Diagrami i një rrjeti nervor.

Për më tepër, topologjia e rrjetit nervor mund të jetë shumë më komplekse se ajo e konsideruar nga Rosenblatt, për shembull kjo:

Oriz. 3. Diagrami i rrjetit nervor Rosenblatt.

Komplikimet çuan në një rritje të numrit të parametrave të rregullueshëm gjatë stërvitjes, por në të njëjtën kohë rritën aftësinë për t'u akorduar në modele shumë komplekse. Kërkimet në këtë fushë tani po vazhdojnë në dy drejtime të lidhura ngushtë - topologji të ndryshme të rrjetit dhe metoda të ndryshme konfigurimi janë duke u studiuar.

Rrjetet nervore aktualisht nuk janë vetëm një mjet për zgjidhjen e problemeve të njohjes së modeleve, por janë përdorur gjithashtu në kërkimet mbi kujtesën shoqëruese dhe kompresimin e imazhit. Megjithëse kjo fushë e kërkimit ndërthur fort me problemet e njohjes së modeleve, ajo përfaqëson një degë të veçantë të kibernetikës. Për një njohës për momentin, rrjetet nervore nuk janë gjë tjetër veçse një grup hartash të përcaktuara në mënyrë shumë specifike, të përcaktuar parametrikisht, i cili në këtë kuptim nuk ka ndonjë avantazh të rëndësishëm ndaj shumë modeleve të tjera të ngjashme të të mësuarit që do të renditen shkurtimisht më poshtë.

Në lidhje me këtë vlerësim të rolit të rrjeteve nervore për njohjen e vetvetes (domethënë jo për bionikën, për të cilën ato kanë një rëndësi të madhe tani), do të doja të shënoja sa vijon: rrjetet nervore, duke qenë një objekt jashtëzakonisht kompleks për matematikën. analiza, kur përdoret në mënyrë korrekte, bën të mundur gjetjen e ligjeve shumë jo të parëndësishme në të dhëna. Ato janë të vështira për t'u analizuar, në rast i përgjithshëm, shpjegohet me strukturën e tyre komplekse dhe, si pasojë, me mundësi praktikisht të pashtershme për të përgjithësuar një shumëllojshmëri të gjerë modelesh. Por këto avantazhe, siç ndodh shpesh, janë burim gabimesh të mundshme dhe mundësi rikualifikimi. Siç do të diskutohet më poshtë, një pamje e tillë e dyfishtë e perspektivave të çdo modeli mësimor është një nga parimet e mësimit të makinës.

Një drejtim tjetër popullor në njohje janë rregullat logjike dhe pemët e vendimeve. Në krahasim me metodat e mësipërme të njohjes, këto metoda përdorin në mënyrë më aktive idenë e shprehjes së njohurive tona për fushën e lëndës në formën e strukturave ndoshta më të natyrshme (në një nivel të ndërgjegjshëm) - rregulla logjike. Një rregull elementar logjik nënkupton një pohim si "nëse tiparet e paklasifikueshme janë në relacionin X, atëherë ato të klasifikuara janë në relacionin Y". Një shembull i një rregulli të tillë në diagnostikimin mjekësor është si vijon: nëse pacienti është mbi 60 vjeç dhe ka pësuar më parë një atak në zemër, atëherë mos e kryeni operacionin - rreziku i një rezultati negativ është i lartë.

Për të kërkuar rregulla logjike në të dhëna duhen dy gjëra: të përcaktohet masa e “informativitetit” të rregullit dhe hapësira e rregullave. Dhe detyra e kërkimit të rregullave kthehet më pas në një detyrë të numërimit të plotë ose të pjesshëm në hapësirën e rregullave për të gjetur më informuesen prej tyre. Përkufizimi i përmbajtjes së informacionit mund të prezantohet në mënyra të ndryshme dhe ne nuk do të ndalemi në këtë, duke pasur parasysh se edhe ky është një parametër i caktuar i modelit. Hapësira e kërkimit përcaktohet në mënyrë standarde.

Pas gjetjes së rregullave mjaft informuese, fillon faza e "montimit" të rregullave në klasifikuesin përfundimtar. Pa diskutuar në thellësi problemet që dalin këtu (dhe ka një numër të konsiderueshëm të tyre), do të rendisim 2 metoda kryesore të "montimit". Lloji i parë është një listë lineare. Lloji i dytë është votimi me peshë, kur çdo rregulli i caktohet një peshë e caktuar dhe objekti caktohet nga klasifikuesi në klasë për të cilën është votuar numri më i madh i rregullave.

Në fakt, faza e ndërtimit të rregullave dhe faza e "montimit" kryhen së bashku dhe, kur ndërtohet një votë ose listë e ponderuar, kërkimet e rregullave në pjesë të të dhënave të rastit thirren vazhdimisht për të siguruar një përshtatje më të mirë midis të dhënave dhe modelit. .

Leksioni nr 17.METODAT E NJOHJES SË MOTJEVE

Dallohen grupet e mëposhtme të metodave të njohjes:

Metodat e funksionit të afërsisë

Metodat e funksionit diskriminues

Metodat e njohjes statistikore.

Metodat gjuhësore

Metodat heuristike.

Tre grupet e para të metodave fokusohen në analizën e veçorive të shprehura si numra ose vektorë me komponentë numerikë.

Një grup metodash gjuhësore siguron njohjen e modelit bazuar në analizën e strukturës së tyre, të përshkruar nga veçoritë strukturore përkatëse dhe marrëdhëniet midis tyre.

Grupi i metodave heuristike kombinon teknikat karakteristike dhe procedurat logjike të përdorura nga njerëzit në njohjen e modeleve.

Metodat e funksionit të afërsisë

Metodat e këtij grupi bazohen në përdorimin e funksioneve që vlerësojnë masën e afërsisë midis imazhit të njohur dhe vektorit. x* = (x* 1 ,….,x*n), dhe imazhe referimi të klasave të ndryshme, të përfaqësuara nga vektorë x i = (x i 1 ,…, x i n), i= 1,…,N, Ku unë - numri i klasës së imazhit.

Procedura e njohjes sipas kësaj metode konsiston në llogaritjen e distancës ndërmjet pikës së figurës së njohur dhe secilës prej pikave që përfaqësojnë imazhin e referencës, d.m.th. në llogaritjen e të gjitha vlerave d i , i= 1,…,N. Imazhi i përket një klase për të cilën vlera d i ka rëndësinë më të vogël ndër të gjitha i= 1,…,N .

Një funksion që cakton çdo çift vektorësh x i, x* numri real si masë e afërsisë së tyre, d.m.th. përcaktimi i distancës ndërmjet tyre mund të jetë mjaft arbitrar. Në matematikë, një funksion i tillë quhet metrikë e hapësirës. Ai duhet të plotësojë aksiomat e mëposhtme:

r(x, y)=r(y, x);

r(x, y) > 0 nëse x jo të barabartë y Dhe r(x, y)=0 nëse x=y;

r(x, y) <=r(x,z)+r(z, y)

Aksiomat e listuara plotësohen, në veçanti, nga funksionet e mëposhtme

a i= 1/2 , j=1,2,…n.

b i= shuma j=1,2,…n.

c i= abs maksimale ( x ix j *), j=1,2,…n.

E para prej tyre quhet norma Euklidiane e një hapësire vektoriale. Prandaj, hapësirat në të cilat funksioni i specifikuar përdoret si metrikë quhen hapësirë ​​Euklidiane.

Shpesh, ndryshimi i rrënjës mesatare katrore në koordinatat e imazhit të njohur zgjidhet si funksion afërsie x* dhe standarde x i, d.m.th. funksionin

d i = (1/n) shuma ( x i jx j *) 2 , j=1,2,…n.

Madhësia d i interpretohet gjeometrikisht si katrori i distancës ndërmjet pikave në hapësirën e veçorive, që lidhet me dimensionin e hapësirës.

Shpesh rezulton se veçoritë e ndryshme nuk janë po aq të rëndësishme në njohjen. Për të marrë parasysh këtë rrethanë gjatë llogaritjes së funksioneve të afërsisë, ndryshimet e koordinatave që korrespondojnë me veçoritë më të rëndësishme shumëzohen me koeficientë të mëdhenj, dhe në ato më pak të rëndësishme - me ato më të vogla.

Në atë rast d i = (1/n) shuma w j (x i jx j *) 2 , j=1,2,…n,

Ku w j– koeficientët e peshimit.

Futja e koeficientëve të peshimit është e barabartë me shkallëzimin e boshteve të hapësirës së veçorive dhe, në përputhje me rrethanat, shtrirjen ose ngjeshjen e hapësirës në drejtime të caktuara.

Deformimet e treguara të hapësirës së veçorive ndjekin qëllimin e vendosjes së pikave të imazheve të referencës në atë mënyrë që të korrespondojë me njohjen më të besueshme në kushtet e një shpërndarjeje të konsiderueshme të imazheve të secilës klasë në afërsi të pikës së imazhit të referencës. .

Grupet e pikave të imazhit afër njëra-tjetrës (grupet e imazheve) në hapësirën e veçorive quhen grupe, dhe detyra e identifikimit të grupeve të tilla quhet problem grumbullimi.

Detyra e identifikimit të grupimeve klasifikohet si një detyrë e pambikëqyrur e njohjes së modelit, d.m.th. për problemet e njohjes në mungesë të një shembulli të njohjes së saktë.

Metodat e funksionit diskriminues

Ideja e metodave të këtij grupi është të ndërtojë funksione që përcaktojnë kufijtë në hapësirën e imazhit që e ndajnë hapësirën në zona që korrespondojnë me klasat e imazhit. Funksionet më të thjeshta dhe më të përdorura të këtij lloji janë funksione që varen në mënyrë lineare nga vlerat e veçorive. Në hapësirën e veçorive ato korrespondojnë me sipërfaqet ndarëse në formën e hiperplaneve. Në rastin e një hapësire tipare dydimensionale, një vijë e drejtë vepron si një funksion ndarës.

Forma e përgjithshme e funksionit të vendimmarrjes lineare jepet me formulë

d(x)=w 1 x 1 + w 2 x 2 +…+w n x n +w n +1 = Wx+w n

Ku x- vektor imazhi, w=(w 1 , w 2 ,…w n) – vektori i koeficientëve të peshimit.

Në rast të ndarjes në dy klasa X 1 dhe X 2 funksion diskriminues d(x) lejon njohjen në përputhje me rregullin:

x i takon X 1 nëse d(x)>0;

x i takon X 2 nëse d(x)<0.

Nëse d(x)=0, atëherë ka një rast pasigurie.

Në rastin e ndarjes në disa klasa, futen disa funksione. Në këtë rast, çdo klase imazhesh i caktohet një kombinim i caktuar i shenjave të funksionit diskriminues.

Për shembull, nëse futen tre funksione diskriminuese, atëherë opsioni i mëposhtëm për identifikimin e klasave të imazhit është i mundur:

x i takon X 1 nëse d 1 (x)>0,d 2 (x)<0,d 3 (x)<0;

x i takon X 2 nëse d(x)<0,d 2 (x)>0,d 3 (x)<0;

x i takon X 3 nëse d(x)<0,d 2 (x)<0,d 3 (x)>0.

Supozohet se për kombinime të tjera vlerash d 1 (x),d 2 (x),d 3 (x) ka një rast pasigurie.

Një variacion i metodës së funksionit diskriminues është metoda e funksionit të vendimit. Në të, nëse është e disponueshme m supozohet se ekzistojnë klasa m funksionet d i(x), quhet vendimtar, i tillë që nëse x i takon X i, Kjo d i(x) > dj(x) për të gjithë j të pabarabartë i, ato. funksioni vendimtar d i(x) ka vlera maksimale ndër të gjitha funksionet dj(x), j=1,...,n..

Një ilustrim i kësaj metode mund të jetë një klasifikues i bazuar në vlerësimin e distancës minimale Euklidiane në hapësirën e veçorive midis pikës së imazhit dhe standardit. Le ta tregojmë.

Distanca euklidiane ndërmjet vektorit të veçorive të imazhit të njohur x dhe vektori i imazhit të referencës përcaktohet me formulën || x ix|| = 1/2 , j=1,2,…n.

Vektor x do të caktohen në klasë i, për të cilën vlera || x ix*|| minimale.

Në vend të distancës, mund të krahasoni katrorin e distancës, d.m.th.

||x ix|| 2 = (x ix)(x ix) t = x x- 2x x i +x i x i

Që nga vlera x x njesoj per te gjithe i, funksioni minimal || x ix|| 2 do të përkojë me maksimumin e funksionit të vendimit

d i(x) = 2x x i -x i x i.

pra x i takon X i, Nëse d i(x) > dj(x) për të gjithë j të pabarabartë i.

Se. makina klasifikuese e distancës minimale bazohet në funksionet e vendimit linear. Struktura e përgjithshme e një makine të tillë përdor funksione vendimtare të formës

d i (x)=w i 1 x 1 + w i 2 x 2 +…+w në x n +w i n +1

Mund të përfaqësohet vizualisht nga bllok diagrami përkatës.

Për një makinë që kryen klasifikimin bazuar në distancën minimale, vlejnë barazitë e mëposhtme: w ij = -2x i j , w i n +1 = x i x i.

Njohja ekuivalente me metodën e funksionit diskriminues mund të kryhet duke përcaktuar funksionet diskriminuese si dallime d ij (x)=d i (x)‑dj (x).

Avantazhi i metodës së funksionit diskriminues është struktura e thjeshtë e makinës së njohjes, si dhe mundësia e zbatimit të saj kryesisht përmes blloqeve të vendimmarrjes kryesisht lineare.

Një avantazh tjetër i rëndësishëm i metodës së funksionit diskriminues është aftësia për të trajnuar automatikisht një makinë për njohjen e saktë bazuar në një mostër të caktuar (stërvitore) të imazheve.

Në të njëjtën kohë, algoritmi i mësimit automatik rezulton të jetë shumë i thjeshtë në krahasim me metodat e tjera të njohjes.

Për këto arsye, metoda e funksionit diskriminues ka fituar popullaritet të gjerë dhe përdoret shumë shpesh në praktikë.

Procedurat e vetë-trajnimit për njohjen e modelit

Le të shqyrtojmë metodat për ndërtimin e një funksioni diskriminues për një kampion të caktuar (stërvitor) në lidhje me problemin e ndarjes së imazheve në dy klasa. Nëse jepen dy grupe imazhesh që i përkasin përkatësisht klasave A dhe B, atëherë zgjidhja e problemit të ndërtimit të një funksioni diskriminues linear kërkohet në formën e një vektori të koeficientëve të peshimit. W=(w 1 ,w 2 ,...,w n,w n+1), i cili ka vetinë që për çdo imazh të plotësohen kushtet e mëposhtme:

x i përket klasës A nëse >0, j=1,2,…n.

x i përket klasës B nëse<0, j=1,2,…n.

Nëse grupi i trajnimit përbëhet nga N imazhet e të dyja klasave, detyra reduktohet në gjetjen e një vektori w që siguron vlefshmërinë e sistemit të pabarazive nëse kampioni i trajnimit përbëhet nga N imazhet e të dyja klasave, detyra zbret në gjetjen e vektorit w, duke siguruar vlefshmërinë e sistemit të pabarazive

x 1 1 w i+x 21 w 2 +...+x n 1 w n+w n +1 >0;

x 1 2 w i+x 22 w 2 +...+x n 2 w n+w n +1 <0;

x 1 iw i+x 2i w 2 +...+x ni w n+w n +1 >0;

................................................

x 1 Nw i +x 2N w 2 +...+x nN w n +w n + 1>0;

Këtu x i=(x i 1 , x i 2 ,...,x i n ,x i n+ 1 ) - vektori i vlerave të veçorive të imazhit nga kampioni i trajnimit, shenja > korrespondon me vektorët e imazhit x, që i përket klasës A, dhe shenjës< - векторам x, që i përket klasës B.

Vektori i kërkuar w ekziston nëse klasat A dhe B janë të ndashme dhe nuk ekziston ndryshe. Vlerat e komponentëve të vektorit w mund të gjendet ose paraprakisht, në fazën që paraprin zbatimin e harduerit të SRO, ose drejtpërdrejt nga vetë SRO gjatë funksionimit të tij. E fundit nga këto qasje ofron fleksibilitet dhe autonomi më të madhe të SRO. Le ta shqyrtojmë duke përdorur shembullin e një pajisjeje të quajtur përqindron. e shpikur në vitin 1957 nga shkencëtari amerikan Rosenblatt. Një paraqitje skematike e përqindronit, e cila siguron që një imazh t'i caktohet njërës nga dy klasat, është paraqitur në figurën e mëposhtme.

Retina S Retina A Retina R

oh oh x 1

oh oh x 2

oh oh x 3

o (shuma)-------> R(reagimi)

oh oh x i

oh oh x n

oh oh x n +1

Pajisja përbëhet nga elemente ndijore të retinës S, të cilat lidhen rastësisht me elementë shoqërues të retinës A. Secili element i retinës së dytë prodhon një sinjal dalës vetëm nëse një numër i mjaftueshëm i elementeve shqisore të lidhur me hyrjen e saj janë në gjendje të ngacmuar. Përgjigja e të gjithë sistemit Rështë proporcionale me shumën e reaksioneve të elementeve të retinës asociative të marra me pesha të caktuara.

I caktuar nga x i reagimi i th element asociativ dhe nëpërmjet w i- koeficienti i peshës së reagimit i elementi shoqërues, reagimi i sistemit mund të shkruhet si R= shuma( w j x j), j=1,..,n. Nëse R>0, atëherë imazhi i paraqitur në sistem i përket klasës A, dhe nëse R<0, то образ относится к классу B. Описание этой процедуры классификации соответствует рассмотренным нами раньше принципам классификации, и, очевидно, перцентронная модель распознавания образов представляет собой, за исключением сенсорной сетчатки, реализацию линейной дискриминантной функции. Принятый в перцентроне принцип формирования значений x 1 , x 2 ,...,x n korrespondon me disa algoritme për gjenerimin e veçorive të bazuara në sinjale nga sensorët parësorë.

Në përgjithësi mund të ketë disa elementë R, duke formuar reaksionin e perceptronit. Në këtë rast, ata flasin për praninë e një retinë në perceptron R elementet reaguese.

Skema e përqindronit mund të shtrihet në rastin kur numri i klasave është më shumë se dy, duke rritur numrin e elementeve të retinës. R deri në numrin e klasave të dallueshme dhe futjen e një blloku për përcaktimin e reaksionit maksimal në përputhje me diagramin e paraqitur në figurën e mësipërme. Në këtë rast, imazhi i caktohet klasës me numër i, Nëse R i>R j, për të gjithë j.

Procesi i trajnimit në përqindje konsiston në zgjedhjen e vlerave të koeficientëve të peshimit w j në mënyrë që sinjali i daljes t'i përgjigjet klasës së cilës i përket imazhi i njohur.

Le të shqyrtojmë algoritmin e veprimit të përqindronit duke përdorur shembullin e njohjes së objekteve të dy klasave: A dhe B. Objektet e klasës A duhet të korrespondojnë me vlerën R= +1, dhe klasa B - vlera R= -1.

Algoritmi i të mësuarit është si më poshtë.

Nëse imazhi tjetër x i përket klasës A, por R<0 (имеет место ошибка распознавания), тогда коэффициенты w j me indekset me të cilët korrespondojnë vlerat x j>0, rritet me një sasi dw, dhe koeficientët e mbetur w j reduktuar me dw. Në këtë rast, vlera e reagimit R merr një rritje drejt vlerave të saj pozitive, që korrespondon me klasifikimin e saktë.

Nëse x i përket klasës B, por R>0 (ka një gabim njohjeje), pastaj koeficientët w j me indekse që korrespondojnë me x j<0, увеличивают на dw, dhe koeficientët e mbetur w j reduktohet me të njëjtën shumë. Në këtë rast, vlera e reagimit R merr një rritje drejt vlerave negative që korrespondojnë me klasifikimin e saktë.

Kështu, algoritmi bën një ndryshim në vektorin e peshave w nëse dhe vetëm nëse imazhi i paraqitur në k-hapi i stërvitor, është klasifikuar gabimisht gjatë kryerjes së këtij hapi dhe largohet nga vektori i peshave w asnjë ndryshim nëse klasifikohet saktë. Vërtetimi i konvergjencës së këtij algoritmi është paraqitur në [Tu, Gonzalez]. Një trajnim i tillë do të bëhet përfundimisht (me përzgjedhjen e duhur dw dhe ndashmëria lineare e klasave të imazhit) çon në vektor w, duke siguruar klasifikimin e duhur.

Metodat e njohjes statistikore.

Metodat statistikore bazohen në minimizimin e probabilitetit të gabimit të klasifikimit. Probabiliteti P i klasifikimit të gabuar të një imazhi të paraqitur për njohje, i përshkruar nga një vektor tipar x, përcaktohet nga formula

P = shuma[ fq(i) problem ( D(x)+i | x klasës i)]

Ku m- numri i klasave,

fq(i) = sonda ( x i përket klasës i) - probabiliteti apriori për t'iu përkatur një imazhi arbitrar x te i klasa e th (frekuenca e shfaqjes së imazheve i- klasa e th),

D(x) - një funksion që merr një vendim klasifikimi (vektor i veçorive x përputhet me numrin e klasës i nga grupi (1,2,..., m}),

prob( D(x) nuk është e barabartë i| x i përket klasës i) - probabiliteti i ngjarjes " D(x) nuk është e barabartë i“ kur plotësohet kushti i anëtarësimit x klasës i, d.m.th. probabiliteti për të marrë një vendim të gabuar nga funksioni D(x) për një vlerë të caktuar x, në pronësi i- klasa e th.

Mund të tregohet se probabiliteti i keqklasifikimit arrin një minimum nëse D(x)=i nëse dhe vetëm nëse fq(x|ifq(i)>fq(x|jfq(j), për të gjithë i+j, Ku fq(x|i) - dendësia e shpërndarjes së imazhit i-klasa në hapësirën e veçorive.

Sipas rregullit të mësipërm, pika x i përket klasës së cilës i përgjigjet vlera maksimale fq(i) fq(x|i), d.m.th. produkt i probabilitetit (frekuencës) paraprake të shfaqjes së imazheve i-klasa dhe dendësia e shpërndarjes së imazhit i-klasa në hapësirën e veçorive. Rregulli i paraqitur i klasifikimit quhet Bayesian, sepse rrjedh nga formula e Bayes e njohur në teorinë e probabilitetit.

Shembull. Le të jetë e nevojshme të njihen sinjalet diskrete në dalje kanal informacioni të ekspozuar ndaj zhurmës.

Çdo sinjal hyrës përfaqëson një 0 ose 1. Si rezultat i transmetimit të sinjalit, vlera shfaqet në daljen e kanalit x, e cila mbivendoset me zhurmën Gaussian me zero mesatare dhe variancë b.

Për të sintetizuar një klasifikues që kryen njohjen e sinjalit, ne do të përdorim rregullin e klasifikimit Bayesian.

Ne do të kombinojmë sinjalet që përfaqësojnë një në klasën nr. 1 dhe sinjalet që përfaqësojnë zero në klasën nr. 2. Le të dihet paraprakisht se mesatarisht në çdo 1000 sinjale a sinjalet paraqesin njësi dhe b sinjale - zero. Atëherë vlerat e probabiliteteve a priori të shfaqjes së sinjaleve të klasave të 1-rë dhe të dytë (një dhe zero), përkatësisht, mund të merren të barabarta me

p(1)=a/1000, p(2)=b/1000.

Sepse zhurma është gausiane, d.m.th. i bindet ligjit të shpërndarjes normale (Gaussian), pastaj dendësisë së shpërndarjes së imazheve të klasës së parë në varësi të vlerës x, ose, që është e njëjta gjë, probabiliteti i marrjes së vlerës së prodhimit x kur një sinjal 1 aplikohet në hyrje, ai përcaktohet nga shprehja

fq(x¦1) =(2 pib) -1/2 exp(-( x-1) 2 /(2b 2)),

dhe dendësia e shpërndarjes në varësi të vlerës x imazhet e klasës së dytë, d.m.th. probabiliteti i marrjes së vlerës së prodhimit x kur një sinjal 0 aplikohet në hyrje, ai përcaktohet nga shprehja

fq(x¦2)= (2 pib) -1/2 exp(- x 2 /(2b 2)),

Zbatimi i rregullit të vendimit Bayesian çon në përfundimin se një sinjal i klasës 2 është transmetuar, d.m.th. null kalohet nëse

fq(2) fq(x¦2) > fq(1) fq(x¦1)

ose, më konkretisht, nëse

b exp(- x 2 /(2b 2)) > a exp(-( x-1) 2 /(2b 2)),

Duke e ndarë anën e majtë të pabarazisë me të djathtën, marrim

(b/a) exp((1-2 x)/(2b 2)) >1,

ku pas marrjes së logaritmeve gjejmë

1-2x> 2b 2 ln(a/b)

x< 0.5 - б 2 ln(a/b)

Nga pabarazia që rezulton rrjedh se kur a=b, d.m.th. me probabilitete të barabarta a priori të shfaqjes së sinjaleve 0 dhe 1, imazhit i caktohet vlera 0 kur x<0.5, а значение 1, когда x>0.5.

Nëse paraprakisht dihet se njëri nga sinjalet shfaqet më shpesh dhe tjetri më rrallë, d.m.th. në rast të vlerave të pabarabarta a Dhe b, pragu i përgjigjes së klasifikuesit zhvendoset në një drejtim ose në një tjetër.

Pra kur a/b=2.71 (që korrespondon me transmetimin 2.71 herë më të shpeshtë të njësive) dhe b 2 =0.1, imazhit i caktohet vlera 0 nëse x<0.4, и значение 1, если x>0.4. Nëse nuk ka informacion në lidhje me probabilitetet e shpërndarjes paraprake, atëherë mund të përdoren metodat e njohjes statistikore, të cilat bazohen në rregullat e klasifikimit të ndryshme nga Bayesian.

Megjithatë, në praktikë, metodat më të zakonshme janë ato të bazuara në rregullat e Bayes për shkak të efikasitetit të tyre më të madh, dhe gjithashtu për shkak të faktit se në shumicën e problemeve të njohjes së modeleve është e mundur të vendosen probabilitete apriori të shfaqjes së imazheve të secilës klasë. .

Metodat gjuhësore të njohjes së modeleve.

Metodat gjuhësore të njohjes së modelit bazohen në analizën e përshkrimit të një imazhi të idealizuar, të paraqitur në formën e një grafiku ose një zinxhiri karakteresh, që është një frazë ose fjali e një gjuhe të caktuar.

Konsideroni imazhet e idealizuara të shkronjave të marra si rezultat i fazës së parë të njohjes gjuhësore të përshkruar më sipër. Këto imazhe të idealizuara mund të specifikohen nga përshkrimet e grafikëve, të paraqitur, për shembull, në formën e matricave të lidhjes, siç u bë në shembullin e diskutuar më sipër. I njëjti përshkrim mund të përfaqësohet nga një frazë e një gjuhe (shprehje) formale.

Shembull. Le të jepen tre imazhe të shkronjës A, të marra si rezultat i përpunimit paraprak të imazhit. Le t'i shënojmë këto imazhe me identifikuesit A1, A2 dhe A3.

Për të përshkruar në mënyrë gjuhësore imazhet e paraqitura, do të përdorim PDL (Picture Description Language). Fjalori PDL përfshin simbolet e mëposhtme:

1. Emrat e imazheve më të thjeshta (primitive). Siç zbatohet për rastin në shqyrtim, primitivet dhe emrat e tyre përkatës janë si më poshtë.

Imazhet në formën e një linje të drejtuar:

lart dhe majtas (le F t), në veri (veri), lart dhe në të djathtë (djathtas), në lindje).

Emrat: L, N, R, E.

2. Simbolet e veprimeve binare. (+,*,-) Kuptimi i tyre korrespondon me lidhjen vijuese të primitivëve (+), lidhjen e fillimeve dhe mbarimeve të primitivëve (*), lidhjen e vetëm mbaresave të primitivëve (-).

3. Kllapa djathtas dhe majtas. ((,)) Kllapat ju lejojnë të përcaktoni sekuencën e veprimeve në një shprehje.

Imazhet e konsideruara A1, A2 dhe A3 përshkruhen në gjuhën PDL, përkatësisht, me shprehjet e mëposhtme.

T(1)=R+((R-(L+N))*E-L

T(2)=(R+N)+((N+R)-L)*E-L

T(3)=(N+R)+(R-L)*E-(L+N)

Pasi të jetë ndërtuar përshkrimi gjuhësor i figurës, është e nevojshme, duke përdorur një procedurë njohjeje, të analizohet nëse ky imazh i përket ose jo klasës së interesit për ne (klasa e shkronjave A), d.m.th. Pavarësisht nëse ky imazh ka një strukturë apo jo. Për ta bërë këtë, para së gjithash, është e nevojshme të përshkruhet klasa e imazheve që kanë strukturën që na intereson.

Natyrisht, shkronja A përmban gjithmonë sa vijon elementet strukturore: "këmba" e majtë, "këmba" e djathtë dhe pjesa e kokës. Le t'i quajmë këta elementë përkatësisht STL, STR, TR.

Pastaj në gjuhën PDL klasa e karakterit A - SIMB A përshkruhet me shprehjen

SIMB A = STL + TR - STR

"Këmba" e majtë e STL është gjithmonë një zinxhir elementësh R dhe N, të cilët mund të shkruhet kështu

STL ‑> R ¦ N ¦ (STL + R)¦ (STL + N)

(STL është karakteri R ose N, ose një varg i marrë duke shtuar karakteret R ose N në vargun burimor STL)

“Këmba” e djathtë e STR është gjithmonë një zinxhir elementësh L dhe N, të cilët mund të shkruhet kështu, d.m.th.

STR ‑> L¦N¦ (STR + L)¦(STR + N)

Pjesa e kokës së shkronjës - TR është një kontur i mbyllur i përbërë nga elementi E dhe zinxhirë si STL dhe STR.

Në PDL, struktura TR përshkruhet nga shprehja

TR ‑> (STL - STR) * E

Më në fund marrim përshkrimin e mëposhtëm të shkronjës së klasës A:

SIMB A ‑> (STL + TR - STR),

STL ‑> R¦N¦ (STL + R)¦(STL + N)

STR ‑> L¦N¦ (STR + L)¦(STR + N)

TR ‑> (STL - STR) * E

Procedura e njohjes në këtë rast mund të zbatohet si më poshtë.

1. Shprehja që korrespondon me imazhin krahasohet me strukturën e referencës STL + TR - STR.

2. Çdo element i strukturës STL, TR, STR, nëse është e mundur, d.m.th. nëse përshkrimi i imazhit është i krahasueshëm me standardin, disa nënshprehje nga shprehja T(A) përputhen. Për shembull,

për A1: STL=R, STR=L, TR=(R-(L+N))*E

për A2: STL = R + N, STR = L, TR = ((N + R) - L) * E

për A3: STL = N + R, STR = L + N, TR = (R - L) * E 3.

Shprehjet STL, STR, TR krahasohen me strukturat e tyre përkatëse të referencës.

4. Nëse struktura e secilës shprehje STL, STR, TR korrespondon me atë standarde, nxirret përfundimi se imazhi i përket klasës së shkronjave A. Nëse në ndonjë nga fazat 2, 3, 4 ka mospërputhje midis strukturës së shprehja e analizuar dhe zbulohet standardi, nxirret përfundimi se imazhi nuk i përket klasës SIMB A. Krahasimi i strukturave të shprehjes mund të kryhet duke përdorur gjuhët algoritmike LISP, PLANER, PROLOG dhe gjuhë të tjera të ngjashme të inteligjencës artificiale.

Në shembullin në shqyrtim, të gjithë zinxhirët STL përbëhen nga simbolet N dhe R, dhe zinxhirët STR përbëhen nga simbolet L dhe N, që korrespondon me strukturën e dhënë të këtyre zinxhirëve. Struktura e TR në imazhet në shqyrtim korrespondon gjithashtu me atë referencë, pasi përbëhet nga "ndryshimi" i zinxhirëve si STL, STR, "i shumëzuar" me simbolin E.

Kështu, arrijmë në përfundimin se imazhet në shqyrtim i përkasin klasës SIMB A.


Sinteza e një kontrolluesi fuzzy për një makinë elektrike DCnë mjedisin MatLab

Sinteza e një kontrolluesi fuzzy me një hyrje dhe dalje.

Sfida është marrja e makinës për të ndjekur me saktësi sinjalet e ndryshme hyrëse. Zhvillimi i veprimit të kontrollit kryhet nga një kontrollues fuzzy, në të cilin mund të dallohen strukturisht blloqet funksionale të mëposhtme: një fuzzifier, një bllok rregullash dhe një defuzifikues.

Fig.4 Diagrami funksional i përgjithësuar i një sistemi me dy ndryshore gjuhësore.

Fig.5 Diagrami skematik kontrollues fuzzy me dy ndryshore gjuhësore.

Algoritmi i kontrollit fuzzy në rastin e përgjithshëm është një transformim i variablave hyrëse të një kontrolluesi fuzzy në variablat e tij dalëse duke përdorur procedurat e mëposhtme të ndërlidhura:

1. transformimi i ndryshoreve fizike hyrëse të marra nga sensorët matës nga objekti i kontrollit në ndryshore gjuhësore hyrëse të një kontrolluesi fuzzy;

2. përpunimi i pohimeve logjike, të quajtura rregulla gjuhësore, në lidhje me variablat gjuhësore hyrëse dhe dalëse të kontrolluesit;

3. transformimi i ndryshoreve gjuhësore dalëse të kontrolluesit fuzzy në variabla të kontrollit fizik.

Le të shqyrtojmë fillimisht rastin më të thjeshtë, kur futen vetëm dy ndryshore gjuhësore për të kontrolluar servo drive:

"këndi" është një ndryshore hyrëse;

"Veprimi i kontrollit" është ndryshorja e daljes.

Ne do të sintetizojmë kontrolluesin në mjedisin MatLab duke përdorur kutinë e veglave " Logjika e paqartë" Kjo ju lejon të krijoni sisteme konkluzionesh fuzzy dhe klasifikimi fuzzy brenda mjedisit MatLab, me aftësinë për t'i integruar ato në Simulink. Koncepti bazë i Fuzzy Logic Toolbox është struktura FIS - Fuzzy Inference System. Struktura FIS përmban të gjitha të dhënat e nevojshme për të zbatuar "hyrje-daljet" e hartës funksionale bazuar në konkluzionet logjike fuzzy sipas diagramit të paraqitur në Fig. 6.


Figura 6. Përfundimi fuzzy.

X - vektor i qartë i hyrjes; - vektor grupe të paqarta, që korrespondon me vektorin hyrës X;
- rezultati i përfundimit logjik në formën e një vektori të grupeve fuzzy Y - vektori i qartë i daljes;

Moduli fuzzy ju lejon të ndërtoni sistemet fuzzy dy lloje - Mamdani dhe Sugeno. Në sisteme si Mamdani, baza e njohurive përbëhet nga rregullat e formës "Nëse x 1 = i ulët dhe x 2 = i mesëm, atëherë y = i lartë". Në sistemet e tipit Sugeno, baza e njohurive përbëhet nga rregullat e formës "Nëse x 1 = i ulët dhe x 2 = mesatar, atëherë y = a 0 +a 1 x 1 +a 2 x 2 ". Kështu, ndryshimi kryesor midis sistemeve Mamdani dhe Sugeno qëndron në mënyrat e ndryshme të specifikimit të vlerave të ndryshores së prodhimit në rregullat që formojnë bazën e njohurive. Në sistemet e tipit Mamdani, vlerat e ndryshores së daljes përcaktohen me terma fuzzy, në sistemet e tipit Sugeno - si një kombinim linear i ndryshoreve hyrëse. Në rastin tonë, ne do të përdorim sistemin Sugeno, sepse i jep vetes më mirë optimizimit.

Për të kontrolluar servo drive, futen dy variabla gjuhësorë: "gabim" (nga pozicioni) dhe "veprim kontrolli". E para prej tyre është hyrja, e dyta është dalja. Le të përcaktojmë një grup termash për variablat e specifikuar.

Komponentët bazë të konkluzionit logjik fuzzy. Fuzzifier.

Për çdo ndryshore gjuhësore, ne përcaktojmë një grup termash bazë të formës, i cili përfshin grupe fuzzy që mund të caktohen: negative e lartë, negative e ulët, zero, pozitive e ulët, pozitive e lartë.

Para së gjithash, le të përcaktojmë subjektivisht se çfarë nënkuptohet me termat " gabim i madh", "gabim i vogël", etj., duke përcaktuar funksionet e anëtarësimit për grupet përkatëse fuzzy. Këtu, për momentin, mund të udhëhiqeni vetëm nga saktësia e kërkuar, parametrat e njohur për klasën e sinjaleve hyrëse dhe sensi i përbashkët. Askush nuk ka qenë ende në gjendje të propozojë ndonjë algoritëm të rreptë për zgjedhjen e parametrave të funksioneve të anëtarësimit. Në rastin tonë, ndryshorja gjuhësore "gabim" do të duket kështu.

Fig.7. Variabli gjuhësor “gabim”.

Është më e përshtatshme të paraqitet ndryshorja gjuhësore "kontrolli" në formën e një tabele:

Tabela 1

Blloku i rregullave.

Le të shqyrtojmë sekuencën e përcaktimit të disa rregullave që përshkruajnë disa situata:

Supozoni, për shembull, që këndi i daljes është i barabartë me sinjalin hyrës (dmth., gabimi është zero). Natyrisht, kjo është situata e dëshiruar, dhe për këtë arsye nuk duhet të bëjmë asgjë (veprimi i kontrollit është zero).

Tani merrni parasysh një rast tjetër: gabimi i pozicionit është shumë më i madh se zero. Natyrisht, ne duhet ta kompensojmë atë duke gjeneruar një sinjal të madh kontrolli pozitiv.

Se. janë hartuar dy rregulla, të cilat zyrtarisht mund të përcaktohen si më poshtë:

Nëse gabim = null, Se veprimi i kontrollit = zero.

Nëse gabim = pozitiv i madh, Se ndikim kontrolli = i madh pozitiv.

Fig.8. Formimi i kontrollit me një gabim të vogël pozitiv në pozicion.

Fig.9. Formimi i kontrollit me gabim pozicioni zero.

Tabela e mëposhtme tregon të gjitha rregullat që korrespondojnë me të gjitha situatat për këtë rast të thjeshtë.

Tabela 2

Në total, për një kontrollues fuzzy me n hyrje dhe 1 dalje, mund të përcaktohen rregullat e kontrollit, ku është numri i grupeve fuzzy për hyrjen e i-të, por për funksionimin normal të kontrolluesit nuk është e nevojshme të përdoren të gjitha të mundshmet. rregulla, por ju mund t'ia dilni me më pak prej tyre. Në rastin tonë, të 5 rregullat e mundshme përdoren për të gjeneruar një sinjal kontrolli fuzzy.

Defuzifikues.

Kështu, ndikimi që rezulton U do të përcaktohet sipas përmbushjes së disa rregullave. Nëse lind një situatë kur disa rregulla ekzekutohen në të njëjtën kohë, atëherë ndikimi që rezulton U gjendet sipas marrëdhënies së mëposhtme:

, ku n është numri i rregullave të aktivizuara (defuzifikim me metodën e qendrës së rajonit), u n– vlera fizike e sinjalit të kontrollit që i korrespondon secilit prej grupeve fuzzy UBO, UMO, UZ, UMp, UBP. mUn(u)– shkalla e përkatësisë së sinjalit të kontrollit u në grupin fuzzy përkatës Un=( UBO, UMO, UZ, UMp, UBP). Ekzistojnë gjithashtu metoda të tjera të defuzifikimit ku ndryshorja gjuhësore e prodhimit është në përpjesëtim me rregullin "më i fortë" ose "më i dobët".

Le të modelojmë procesin e kontrollit të një disku elektrik duke përdorur kontrolluesin fuzzy të përshkruar më sipër.

Fig. 10. Diagrami i bllokut sistemet në mjedisMatlab.

Fig. 11. Bllok diagrami i një kontrolluesi fuzzy në një mjedisMatlab.

Fig. 12. Procesi kalimtar nën një veprim të vetëm.

Oriz. 13. Procesi kalimtar nën veprimin e hyrjes harmonike për një model me një kontrollues fuzzy që përmban një ndryshore gjuhësore hyrëse.

Analiza e karakteristikave të njësisë me një algoritëm kontrolli të sintetizuar tregon se ato janë larg nga optimale dhe më keq sesa kur sintetizohet kontrolli me metoda të tjera (koha e kontrollit është shumë e gjatë për një veprim të vetëm hapi dhe gabimi është harmonik). Kjo shpjegohet me faktin se parametrat e funksioneve të anëtarësimit janë zgjedhur në mënyrë arbitrare dhe vetëm vlera e gabimit të pozicionit është përdorur si hyrje e kontrolluesit. Natyrisht, nuk mund të flitet për ndonjë optimalitet të rregullatorit që rezulton. Prandaj, detyra e optimizimit të një kontrolluesi fuzzy bëhet e rëndësishme për të arritur treguesit më të lartë të mundshëm të cilësisë së kontrollit. ato. ekziston një detyrë optimizimi funksion objektiv f(a 1 ,a 2 …a n), ku a 1 ,a 2 …a n janë koeficientët që përcaktojnë llojin dhe karakteristikat e fuzzy rregullatori Për të optimizuar kontrolluesin fuzzy, ne do të përdorim bllokun ANFIS nga mjedisi Matlab. Gjithashtu, një nga mënyrat për të përmirësuar karakteristikat e kontrolluesit mund të jetë rritja e numrit të hyrjeve të tij. Kjo do ta bëjë rregullatorin më fleksibël dhe do të përmirësojë performancën e tij. Le të shtojmë edhe një ndryshore gjuhësore hyrëse - shpejtësinë e ndryshimit të sinjalit të hyrjes (derivati ​​i tij). Numri i rregullave do të rritet në përputhje me rrethanat. Atëherë diagrami i qarkut të rregullatorit do të marrë formën:

Fig. 14 Diagrami skematik i një kontrolluesi fuzzy me tre variabla gjuhësorë.

Le të jetë vlera e shpejtësisë së sinjalit të hyrjes. Ne përcaktojmë grupin e termave bazë Tn si:

Tn=("negativ (BO)", "zero (Z)", "pozitiv (BP)").

Vendndodhja e funksioneve të anëtarësimit për të gjitha variablat gjuhësore është paraqitur në figurë.

Fig. 15. Funksionet e anëtarësimit të ndryshores gjuhësore “gabim”.

Fig. 16. Funksionet e anëtarësimit të ndryshores gjuhësore "shpejtësia e sinjalit hyrës".

Për shkak të shtimit të një ndryshoreje gjuhësore, numri i rregullave do të rritet në 3x5=15. Parimi i përpilimit të tyre është plotësisht i ngjashëm me atë të diskutuar më sipër. Të gjitha ato janë paraqitur në tabelën e mëposhtme:

Tabela 3

Sinjali i paqartë

menaxhimi

Gabim pozicioni

Shpejtësia

Për shembull, nëse Nëse gabim = zero dhe derivati ​​i sinjalit hyrës = pozitiv i madh, Se ndikim kontrolli = i vogël negativ.

Fig. 17. Formimi i kontrollit nën tre variabla gjuhësorë.

Për shkak të rritjes së numrit të hyrjeve dhe, në përputhje me rrethanat, vetë rregullave, struktura e kontrolluesit fuzzy do të bëhet më komplekse.

Fig. 18. Bllok diagrami i një kontrolluesi fuzzy me dy hyrje.

Shtoni një foto

Fig.20. Procesi kalimtar nën veprimin e hyrjes harmonike për një model me një kontrollues fuzzy që përmban dy ndryshore gjuhësore hyrëse.

Oriz. 21. Sinjali i gabimit nën veprimin e hyrjes harmonike për një model me një kontrollues fuzzy që përmban dy ndryshore gjuhësore hyrëse.

Le të simulojmë funksionimin e një kontrolluesi fuzzy me dy hyrje në mjedisin Matlab. Diagrami bllok i modelit do të jetë saktësisht i njëjtë si në Fig. 19. Nga grafiku i procesit kalimtar për veprimin e hyrjes harmonike shihet se saktësia e sistemit është rritur ndjeshëm, por në të njëjtën kohë është rritur edhe lëkundja e tij, sidomos në vendet ku ka tendencë derivati ​​i koordinatës së daljes. në zero. Natyrisht, arsyet për këtë, siç u përmend më lart, janë zgjedhja jooptimale e parametrave të funksionit të anëtarësimit si për ndryshoret gjuhësore hyrëse ashtu edhe për ato dalëse. Prandaj, ne optimizojmë kontrolluesin fuzzy duke përdorur bllokun ANFISedit në mjedisin Matlab.

Optimizimi i një kontrolluesi fuzzy.

Le të shqyrtojmë përdorimin e algoritmeve gjenetike për të optimizuar një kontrollues fuzzy. Algoritmet gjenetike janë metoda kërkimore adaptive që kohët e fundit shpesh përdoret për të zgjidhur problemet e optimizimit funksional. Ato bazohen në ngjashmëri proceset gjenetike organizmat biologjikë: popullatat biologjike zhvillohen gjatë disa brezave, duke iu bindur ligjeve të seleksionimit natyror dhe sipas parimit të "mbijetesës së më të fortit", të zbuluar nga Charles Darwin. Duke imituar këtë proces, algoritmet gjenetike janë në gjendje të "evoluojnë" zgjidhjet e problemeve të botës reale nëse ato janë të koduara siç duhet.

Algoritmet gjenetike punojnë me një koleksion "individësh" - një popullsi - secila prej të cilave përfaqëson një zgjidhje të mundshme për një problem të caktuar. Çdo individ vlerësohet sipas masës së "përshtatshmërisë" së tij, sipas asaj se sa "e mirë" është zgjidhja e problemit që i përgjigjet. Individët më të aftë janë në gjendje të "riprodhojnë" pasardhës duke "kryqëzuar" me individë të tjerë në popullatë. Kjo çon në shfaqjen e individëve të rinj që kombinojnë disa nga karakteristikat që trashëgojnë nga prindërit e tyre. Individët më pak të përshtatshëm kanë më pak gjasa të riprodhohen, kështu që çfarëdo tipare që ata zotëronin do të zhduken gradualisht nga popullata.

Kështu riprodhohet e gjithë popullata e re e zgjidhjeve të realizueshme, duke zgjedhur përfaqësuesit më të mirë të gjeneratës së mëparshme, duke i kryqëzuar dhe duke marrë shumë individë të rinj. Ky brez i ri përmban një raport më të lartë të karakteristikave që zotërojnë anëtarët e mirë të gjeneratës së mëparshme. Kështu, brez pas brezi, karakteristika të mira përhapur në të gjithë popullsinë. Në fund të fundit, popullsia do të konvergojë drejt zgjidhjes optimale të problemit.

Ka shumë mënyra për të zbatuar një ide evolucioni biologjik në kuadër të algoritmeve gjenetike. Tradicionale, mund të përfaqësohet si bllok-diagrami i mëposhtëm i paraqitur në Figurën 22, ku:

1. Inicializimi i popullatës fillestare – gjenerimi i një numri të caktuar zgjidhjesh për problemin, me të cilin fillon procesi i optimizimit;

2. Aplikimi i operatorëve të kryqëzimit dhe mutacioneve;

3. Kushtet e ndalimit - zakonisht procesi i optimizimit vazhdon derisa të gjendet një zgjidhje për problemin me një saktësi të caktuar, ose derisa të përcaktohet se procesi ka konverguar (d.m.th., zgjidhja e problemit nuk është përmirësuar gjatë gjeneratave të fundit N).

Në mjedisin Matlab, algoritmet gjenetike përfaqësohen nga një kuti veglash të veçantë, si dhe nga paketa ANFIS. ANFIS është një shkurtim i Sistemit të Konkluzionit Fuzzy të Bazuar në Rrjet Adaptive - Rrjeti i Konkluzioneve fuzzy adaptive. ANFIS është një nga variantet e para të rrjeteve hibride neuro-fuzzy - rrjeti nervor feedforward lloj i veçantë. Arkitektura e një rrjeti neuro-fuzzy është izomorfike ndaj një baze njohurish fuzzy. Rrjetet neuro-fuzzy përdorin zbatime të diferencueshme të normave trekëndore (shumëzimi dhe OR probabilistik), si dhe funksione të anëtarësimit të qetë. Kjo ju lejon të përdorni algoritme të shpejta dhe gjenetike për trajnimin e rrjeteve nervore bazuar në metodën e përhapjes së pasme për vendosjen e rrjeteve neuro-fuzzy. Arkitektura dhe rregullat e funksionimit të çdo shtrese të rrjetit ANFIS janë përshkruar më poshtë.

ANFIS zbaton sistemin e konkluzionit fuzzy Sugeno si një rrjet nervor me pesë shtresa. Qëllimi i shtresave është si vijon: shtresa e parë janë termat e variablave hyrëse; shtresa e dytë - paraardhës (premisa) të rregullave fuzzy; shtresa e tretë është normalizimi i shkallëve të respektimit të rregullave; shtresa e katërt është përfundimi i rregullave; shtresa e pestë është grumbullimi i rezultatit të marrë sipas rregullave të ndryshme.

Inputet e rrjetit nuk ndahen në një shtresë të veçantë. Figura 23 tregon një rrjet ANFIS me një ndryshore hyrëse (“gabim”) dhe pesë rregulla fuzzy. Për vlerësimin gjuhësor të ndryshores hyrëse “gabim”, përdoren 5 terma.


Fig.23. StrukturaANFIS-rrjetet

Le të prezantojmë shënimin e mëposhtëm të nevojshëm për paraqitje të mëtejshme:

Le të jenë hyrjet e rrjetit;

y - prodhimi i rrjetit;

Rregulli fuzzy me numrin e sekuencës r;

m - numri i rregullave;

Një term fuzzy me një funksion anëtarësie që përdoret për vlerësimin gjuhësor të një ndryshoreje në rregullin r-të (,);

Numrat realë në përfundim të rregullit r-të (,).

Rrjeti ANFIS funksionon si më poshtë.

Shtresa 1.Çdo nyje në shtresën e parë përfaqëson një term me një funksion anëtarësimi në formë zile. Hyrjet e rrjetit lidhen vetëm me kushtet e tyre. Numri i nyjeve në shtresën e parë është i barabartë me shumën e kardinaliteteve të grupeve të termave të ndryshoreve hyrëse. Prodhimi i nyjës është shkalla në të cilën vlera e ndryshores hyrëse i përket termit fuzzy përkatës:

,

ku a, b dhe c janë parametra të konfigurueshëm të funksionit të anëtarësimit.

Shtresa 2. Numri i nyjeve në shtresën e dytë është m. Çdo nyje në këtë shtresë korrespondon me një rregull fuzzy. Nyja e shtresës së dytë lidhet me ato nyje të shtresës së parë që formojnë pararendësit e rregullit përkatës. Prandaj, çdo nyje në shtresën e dytë mund të marrë nga 1 deri në n sinjale hyrëse. Dalja e nyjës është shkalla e përmbushjes së rregullave, e cila llogaritet si produkt i sinjaleve hyrëse. Le t'i shënojmë daljet e nyjeve të kësaj shtrese me , .

Shtresa 3. Numri i nyjeve në shtresën e tretë është gjithashtu m. Çdo nyje e kësaj shtrese llogarit shkallën relative të përmbushjes së rregullit fuzzy:

Shtresa 4. Numri i nyjeve në shtresën e katërt është gjithashtu m. Çdo nyje lidhet me një nyje të shtresës së tretë si dhe me të gjitha hyrjet e rrjetit (lidhjet me hyrjet nuk janë paraqitur në Fig. 18). Nyja e shtresës së katërt llogarit kontributin e një rregulli fuzzy në daljen e rrjetit:

Shtresa 5. Një nyje e vetme në këtë shtresë përmbledh kontributet e të gjitha rregullave:

.

Procedurat tipike për trajnimin e rrjeteve nervore mund të përdoren për të konfiguruar rrjetin ANFIS pasi ai përdor vetëm funksione të diferencueshme. Zakonisht përdoret një kombinim zbritje gradient në formën e një algoritmi dhe metode të përhapjes së pasme katrorët më të vegjël. Algoritmi i përhapjes së pasme rregullon parametrat e paraardhësve të rregullave, d.m.th. funksionet e anëtarësimit. Koeficientët e konkluzioneve të rregullave vlerësohen duke përdorur metodën e katrorëve më të vegjël, pasi ato lidhen në mënyrë lineare me daljen e rrjetit. Çdo përsëritje e procedurës së konfigurimit kryhet në dy hapa. Në fazën e parë, një kampion trajnimi furnizohet në hyrje dhe bazuar në mospërputhjen midis sjelljes së dëshiruar dhe asaj aktuale të rrjetit, parametrat optimalë të nyjeve të shtresës së katërt gjenden duke përdorur metodën iterative të katrorëve më të vegjël. Në fazën e dytë, mbetja e mbetur transferohet nga dalja e rrjetit në hyrje, dhe parametrat e nyjeve të shtresës së parë modifikohen duke përdorur metodën e përhapjes së pasme. Në këtë rast, koeficientët e përfundimit të rregullave të gjetura në fazën e parë nuk ndryshojnë. Procedura e akordimit përsëritës vazhdon derisa mospërputhja të kalojë një vlerë të paracaktuar. Për të vendosur funksionet e anëtarësimit, përveç metodës së përhapjes së pasme, mund të përdoren algoritme të tjera optimizimi, për shembull, metoda Levenberg-Marquardt.

Fig.24. Zona e punës ANFISredakto.

Le të përpiqemi tani të optimizojmë kontrolluesin fuzzy për një veprim të vetëm. Procesi i dëshiruar kalimtar ka përafërsisht formën e mëposhtme:

Fig.25. Procesi i dëshiruar i tranzicionit.

Nga grafiku i paraqitur në Fig. rrjedh se shumica e kohë, motori duhet të funksionojë me fuqi të plotë për të siguruar performancën maksimale, dhe kur i afrohet vlerës së dëshiruar, duhet të frenojë pa probleme. Të udhëhequr nga këto argumente të thjeshta, ne do të marrim shembullin e mëposhtëm të vlerave, të paraqitur më poshtë në formën e tabelës, si një mostër trajnimi:

Tabela 4


Vlera e gabimit

Vlera e kontrollit

Vlera e gabimit

Vlera e kontrollit

Vlera e gabimit

Vlera e kontrollit


Fig.26. Lloji i mostrës së trajnimit.

Ne do të zhvillojmë trajnime në 100 hapa. Kjo është më se e mjaftueshme për konvergjencën e metodës së përdorur.

Fig.27. Procesi i trajnimit të një rrjeti nervor.

Gjatë procesit mësimor, parametrat e funksioneve të anëtarësimit formohen në atë mënyrë që për një vlerë të caktuar gabimi, kontrolluesi krijon kontrollin e nevojshëm. Në zonën ndërmjet pikave nodale, varësia e kontrollit nga gabimi është një ndërthurje e të dhënave të tabelës. Metoda e interpolimit varet nga mënyra se si është trajnuar rrjeti nervor. Në fakt, pas trajnimit, modeli i kontrolluesit fuzzy nuk mund të përfaqësohet funksion linear një variabël, grafiku i së cilës është paraqitur më poshtë.

Fig.28. Grafiku i kontrollit kundrejt gabimit të pozicionit brenda kontrolluesit.

Pasi kemi ruajtur parametrat e gjetur të funksioneve të anëtarësimit, ne simulojmë sistemin me një kontrollues fuzzy të optimizuar.


Oriz. 29. Procesi kalimtar nën veprimin e hyrjes harmonike për një model me një kontrollues fuzzy të optimizuar që përmban një ndryshore gjuhësore hyrëse.

Fig.30. Sinjali i gabimit nën veprimin e hyrjes harmonike për një model me një kontrollues fuzzy që përmban dy ndryshore gjuhësore hyrëse.


Nga grafikët rezulton se optimizimi i kontrolluesit fuzzy duke përdorur trajnimin e rrjetit nervor ishte i suksesshëm. Ndryshueshmëria dhe madhësia e gabimit u reduktuan ndjeshëm. Prandaj, përdorimi i një rrjeti nervor është mjaft i justifikuar për optimizimin e rregullatorëve, parimi i funksionimit të të cilëve bazohet në logjikën fuzzy. Sidoqoftë, edhe një kontrollues i optimizuar nuk mund të plotësojë kërkesat për saktësi, kështu që këshillohet të merret në konsideratë një metodë tjetër kontrolli kur kontrolluesi fuzzy nuk kontrollon drejtpërdrejt objektin, por kombinon disa ligje kontrolli në varësi të situatës aktuale.

Rishikimi metodat ekzistuese njohja e modelit

L.P. Popova , I.O. Datiev

Aftësia për të "njohur" konsiderohet si pronë kryesore e qenieve njerëzore, si dhe e organizmave të tjerë të gjallë. Njohja e modelit është një degë e kibernetikës që zhvillon parimet dhe metodat e klasifikimit, si dhe identifikimin e objekteve, fenomeneve, proceseve, sinjaleve, situatave - të gjitha ato objekte që mund të përshkruhen nga një grup i kufizuar i disa shenjave ose vetive që karakterizojnë objektin. .

Një imazh është një përshkrim i një objekti. Imazhet kanë një veti karakteristike, e cila manifestohet në faktin se njohja me një numër të kufizuar fenomenesh nga i njëjti grup bën të mundur njohjen e sa më shumë që dëshironi. numër i madh përfaqësuesit e saj.

Në teorinë e njohjes së modelit, mund të dallohen dy drejtime kryesore:

    studimi i aftësive njohëse që zotërojnë qeniet njerëzore dhe organizmat e tjerë të gjallë;

    zhvillimi i teorisë dhe metodave për ndërtimin e pajisjeve të dizajnuara për të zgjidhur problemet individuale të njohjes së modeleve në fusha të caktuara aplikimi.

Më tej, artikulli përshkruan problemet, parimet dhe metodat e zbatimit të sistemeve të njohjes së imazhit që lidhen me zhvillimin e drejtimit të dytë. Pjesa e dytë e artikullit diskuton metodat e rrjetit nervor të njohjes së modelit, të cilat mund t'i atribuohen drejtimit të parë të teorisë së njohjes së modelit.

Problemet e ndërtimit të sistemeve të njohjes së imazhit

Problemet që lindin gjatë ndërtimit të sistemeve automatike të njohjes së modeleve zakonisht mund të klasifikohen në disa fusha kryesore. E para prej tyre lidhet me paraqitjen e të dhënave fillestare të marra si rezultate të matjes për objektin që do të njihet problem ndjeshmërie. Çdo vlerë e matur është një "karakteristikë e një imazhi ose objekti", për shembull, që imazhet janë karaktere alfanumerike. Në këtë rast, një retinë matëse, e ngjashme me atë të paraqitur në Fig. përdoret në sensor Nëse retina përbëhet nga n-elemente, atëherë rezultatet e matjes mund të përfaqësohen si një vektor matjeje ose një vektor imazhi. ,

ku çdo element xi, merr, për shembull, vlerën 1 nëse përmes qeliza e i-të retina kalon imazhin e simbolit, dhe vlera është 0 ndryshe.

Le të shohim Fig. 2 (b). Në këtë rast, imazhet shërbejnë funksionet e vazhdueshme(lloji i sinjaleve zanore) variabli t. Nëse matja e vlerave të funksionit kryhet në pikat diskrete t1,t2, ..., tn, atëherë vektori i imazhit mund të formohet duke marrë x1= f(t1),x2=f(t2),... , xn = f(tn).

Figura 1. Matja e retinës

Problemi i dytë i njohjes së modelit lidhet me përzgjedhjen tipare karakteristike ose vetitë nga të dhënat e marra burimore dhe zvogëlimi i dimensionit të vektorëve të imazhit. Ky problem shpesh përkufizohet si problem parapërpunimi dhe përzgjedhja e veçorive.

Karakteristikat e një klase imazhesh janë veti karakteristike të përbashkëta për të gjitha imazhet të kësaj klase. Veçoritë që karakterizojnë dallimet ndërmjet klasave individuale mund të interpretohen si tipare ndërklasore. Karakteristikat brenda klasës të përbashkëta për të gjitha klasat në shqyrtim nuk mbartin informacione të dobishme nga pikëpamja e njohjes dhe mund të mos merret parasysh. Përzgjedhja e veçorive konsiderohet si një nga detyrat e rëndësishme që lidhet me ndërtimin e sistemeve të njohjes. Nëse rezultatet e matjes na lejojnë të marrim një grup të plotë karakteristikash dalluese për të gjitha klasat, njohja dhe klasifikimi aktual i imazheve nuk do të shkaktojë ndonjë vështirësi të veçantë. Njohja automatike më pas do të reduktohet në një proces të thjeshtë përputhjeje ose procedura të tilla si skanimi i tabelës. Megjithatë, në shumicën e problemeve praktike të njohjes, përcaktimi i grupit të plotë të veçorive dalluese rezulton të jetë jashtëzakonisht i vështirë, nëse jo i pamundur. Zakonisht është e mundur të nxirren disa nga veçoritë diskriminuese nga të dhënat origjinale dhe t'i përdorin ato për të thjeshtuar procesin e njohjes automatike të modelit. Në veçanti, dimensioni i vektorëve të matjes mund të reduktohet duke përdorur transformime që minimizojnë humbjen e informacionit.

Problemi i tretë që lidhet me ndërtimin e sistemeve të njohjes së modeleve është gjetja e procedurave optimale të vendimit të nevojshme për identifikimin dhe klasifikimin. Pasi të dhënat e mbledhura për imazhet që do të njihen përfaqësohen nga pikat ose vektorët e matjes në hapësirën e imazhit, ne e lëmë makinën të kuptojë se cilës klasë imazhesh korrespondojnë këto të dhëna. Lëreni makinën të projektohet për të dalluar klasat M, të shënuara w1, w2, ... ..., wm. Në këtë rast, hapësira e imazhit mund të konsiderohet se përbëhet nga rajone M, secila prej të cilave përmban pika që korrespondojnë me imazhet nga një klasë. Në këtë rast, detyra e njohjes mund të konsiderohet si ndërtimi i kufijve të zonave të vendimit që ndajnë klasat M bazuar në vektorët e regjistruar të matjes. Le të përcaktohen këto kufij, për shembull, nga funksionet e vendimit d1(x), d2(x),..., dm(x). Këto funksione, të quajtura edhe funksione diskriminuese, janë funksione skalare dhe me një vlerë të imazhit të x. Nëse di (x) > dj (x), atëherë imazhi x i përket klasës w1. Me fjalë të tjera, nëse i-të vendimtare funksioni di(x) ka vlerën më të madhe, atëherë në Fig. 2 (në diagramin "GR" është gjeneruesi i funksioneve të vendimit).

Figura 2. Skema automatike e klasifikimit.

Funksionet vendimtare mund të merren në disa mënyra. Në rastet kur ka informacion të plotë a priori për imazhet e njohura, funksionet e vendimit mund të përcaktohen pikërisht në bazë të këtij informacioni. Nëse disponohet vetëm informacion cilësor në lidhje me imazhet, mund të bëhen supozime të arsyeshme për formën e funksioneve vendimtare. Në rastin e fundit, kufijtë e zonave të zgjidhjes mund të devijojnë ndjeshëm nga ato të vërteta, dhe për këtë arsye është e nevojshme të krijohet një sistem i aftë për të arritur një rezultat të kënaqshëm nëpërmjet një sërë rregullimesh të njëpasnjëshme.

Objektet (imazhet) që do të njihen dhe klasifikohen duke përdorur një sistem automatik të njohjes së modelit duhet të kenë një sërë karakteristikash të matshme. Kur për një grup të tërë imazhesh rezultatet e matjeve përkatëse rezultojnë të ngjashme, këto objekte konsiderohen se i përkasin të njëjtës klasë. Qëllimi i sistemit të njohjes së modelit është që, bazuar në informacionin e mbledhur, të përcaktojë një klasë objektesh me karakteristika të ngjashme me ato të matura në objektet që njihen. Korrektësia e njohjes varet nga sasia e informacionit diskriminues që përmban karakteristikat e matura dhe efikasiteti i përdorimit të këtij informacioni.

      Metodat bazë për zbatimin e sistemeve të njohjes së modeleve

Njohja e modelit i referohet problemit të ndërtimit dhe aplikimit të operacioneve formale mbi paraqitjet numerike ose simbolike të objekteve në botën reale ose ideale, rezultatet e të cilave pasqyrojnë marrëdhëniet ekuivalente midis këtyre objekteve. Marrëdhëniet ekuivalente shprehin përkatësinë e objekteve të vlerësuara në çdo klasë, të konsideruar si njësi semantike të pavarura.

Gjatë ndërtimit të algoritmeve të njohjes, klasat e ekuivalencës mund të specifikohen nga një studiues i cili përdor idetë e tij kuptimplota ose përdor informacion shtesë të jashtëm për ngjashmëritë dhe dallimet e objekteve në kontekstin e problemit që zgjidhet. Pastaj ata flasin për "njohjen me një mësues". Përndryshe, d.m.th. Kur një sistem i automatizuar zgjidh një problem klasifikimi pa përdorimin e informacionit të jashtëm të trajnimit, ne flasim për klasifikim automatik ose "njohje të pambikëqyrur". Shumica e algoritmeve të njohjes së modeleve kërkojnë përdorimin e fuqisë llogaritëse shumë domethënëse, e cila mund të sigurohet vetëm nga teknologjia kompjuterike me performancë të lartë.

Autorë të ndryshëm (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, Temnikov F.E., Afonin V.A., R., Dmitriev. Gonzalez, P. Winston, K. Fu, Ya.Z., etj.) japin një tipologji të ndryshme të njohjes së modeleve. Disa autorë bëjnë dallimin midis metodave parametrike, joparametrike dhe heuristike, të tjerë identifikojnë grupe metodash bazuar në shkollat ​​dhe tendencat e krijuara historikisht në këtë fushë.

Në të njëjtën kohë, tipologjitë e njohura nuk marrin parasysh një karakteristikë shumë domethënëse, e cila pasqyron specifikën e mënyrës së paraqitjes së njohurive për fusha lëndore duke përdorur disa algoritme formale të njohjes së modelit. D.A. Pospelov identifikon dy mënyra kryesore të paraqitjes së njohurive:

    Paraqitja intensive - në formën e një diagrami të lidhjeve midis atributeve (veçorive).

    Përfaqësimi i zgjeruar - duke përdorur fakte specifike (objekte, shembuj).

Duhet theksuar se ekzistenca pikërisht e këtyre dy grupeve të metodave të njohjes: atyre që veprojnë me shenja dhe atyre që veprojnë me objekte, është thellësisht e natyrshme. Nga ky këndvështrim, asnjë nga këto metoda, të marra veçmas nga tjetra, nuk na lejon të formojmë një pasqyrim adekuat të fushës së temës. Midis këtyre metodave ekziston një lidhje plotësimi në kuptimin e N. Bohr, prandaj, sistemet premtuese të njohjes duhet të ofrojnë zbatimin e të dyja këtyre metodave dhe jo vetëm të njërës prej tyre.

Kështu, klasifikimi i metodave të njohjes së propozuar nga D.A. Pospelov bazohet në ligjet themelore që qëndrojnë në themel mënyrë njerëzore njohuritë në përgjithësi, gjë që e vendos atë në një pozicion krejtësisht të veçantë (të privilegjuar) krahasuar me klasifikimet e tjera, të cilat në këtë sfond duken më të lehta dhe artificiale.

Metodat intensive

Një tipar dallues i metodave intensive është se ato përdorin karakteristika të ndryshme shenjat dhe lidhjet e tyre. Elementë të tillë mund të jenë vlera individuale ose intervale të vlerave të veçorive, vlerat mesatare dhe variancat, matricat e marrëdhënieve të veçorive, etj., mbi të cilat kryhen veprimet, të shprehura në formë analitike ose konstruktive. Në të njëjtën kohë, objektet në këto metoda nuk konsiderohen si njësi informacioni integrale, por veprojnë si tregues për vlerësimin e ndërveprimit dhe sjelljes së atributeve të tyre.

Grupi i metodave intensive për njohjen e modelit është i gjerë, dhe ndarja e tij në nënklasa është deri në një masë e kushtëzuar:

– metodat e bazuara në vlerësimet e densitetit të shpërndarjes së vlerave të veçorive

– metodat e bazuara në supozimet për klasën e funksioneve të vendimit

– metodat logjike

– metodat gjuhësore (strukturore).

Metodat e bazuara në vlerësimet e densitetit të shpërndarjes së vlerave të veçorive. Këto metoda të njohjes së modelit janë huazuar nga teoria klasike e vendimeve statistikore, në të cilën objektet e studimit konsiderohen si realizime të një ndryshoreje të rastësishme shumëdimensionale të shpërndarë në hapësirën e veçorive sipas disa ligjeve. Ato bazohen në një kornizë vendimmarrëse Bayesian që i përshtatet probabilitetet e mëparshme përkatësia e objekteve në një ose një tjetër klasë të njohur dhe dendësi të shpërndarjes së kushtëzuar të vlerave të vektorit të veçorive. Këto metoda bazohen në përcaktimin e raportit të gjasave në zona të ndryshme të hapësirës së veçorive shumëdimensionale.

Një grup metodash të bazuara në vlerësimin e densitetit të shpërndarjes së vlerave të veçorive ka lidhje direkte tek metodat e analizës diskriminuese. Qasja Bayesiane ndaj vendimmarrjes është një nga të ashtuquajturat metoda parametrike më të zhvilluara në statistikat moderne, për të cilën shprehja analitike e ligjit të shpërndarjes (në këtë rast, ligji normal) konsiderohet i njohur dhe vetëm një numër i vogël parametrash ( kërkohet që të vlerësohen vektorët e vlerave mesatare dhe matricat e kovariancës.

Ky grup përfshin gjithashtu metodën e llogaritjes së raportit të gjasave për karakteristikat e pavarura. Kjo metodë, me përjashtim të supozimit të pavarësisë së shenjave (që në realitet pothuajse asnjëherë nuk është e kënaqur), nuk supozon njohuri. lloji funksional ligji i shpërndarjes. Mund të klasifikohet si një metodë joparametrike.

Metoda të tjera joparametrike, të përdorura kur forma e lakores së densitetit të shpërndarjes është e panjohur dhe nuk mund të bëhen fare supozime për natyrën e saj, zënë një pozicion të veçantë. Këto përfshijnë metodën e njohur të histogrameve shumëdimensionale, metodën k-fqinjët më të afërt, metodën e distancës Euklidiane, funksionet e mundshme dhe të tjera, përgjithësim i të cilave është metoda e quajtur “vlerësimet e Parzenit”. Këto metoda funksionojnë zyrtarisht në objekte si strukturat integrale, por në varësi të llojit të detyrës së njohjes, ato mund të veprojnë si në formë intensive ashtu edhe në formë zgjeruese.

Metodat joparametrike analizojnë numrin relativ të objekteve që bien në vëllime të dhëna shumëdimensionale dhe përdorim funksione të ndryshme distancat midis objekteve të kampionit të trajnimit dhe objekteve të njohura. Për karakteristikat sasiore, kur numri i tyre është shumë më i vogël se madhësia e kampionit, operacionet me objektet luajnë një rol të ndërmjetëm në vlerësimin e densitetit lokal të shpërndarjes probabilitete të kushtëzuara dhe objektet nuk mbajnë ngarkesën semantike të njësive të pavarura të informacionit. Në të njëjtën kohë, kur numri i shenjave është proporcional ose më shumë numër të objekteve në studim, dhe shenjat janë të natyrës cilësore ose dikotomike, atëherë nuk mund të flitet për ndonjë vlerësim lokal të densiteteve të shpërndarjes së probabilitetit. Në këtë rast, objektet në metodat joparametrike të specifikuara konsiderohen si njësi informacioni të pavarur (fakte empirike integrale) dhe këto metoda marrin kuptimin e vlerësimit të ngjashmërive dhe dallimeve të objekteve që studiohen.

Kështu, të njëjtat operacione teknologjike të metodave joparametrike, në varësi të kushteve të problemit, kanë kuptim ose të vlerësimeve lokale të densitetit të shpërndarjes së probabilitetit të vlerave të veçorive, ose të vlerësimeve të ngjashmërisë dhe ndryshimit të objekteve.

Në kontekstin e përfaqësimit intensiv të njohurive, këtu merret në konsideratë ana e parë e metodave joparametrike, si vlerësime të densitetit të shpërndarjes së probabilitetit. Shumë autorë vërejnë se në praktikë, metodat joparametrike siç janë vlerësuesit Parzen funksionojnë mirë. Vështirësitë kryesore në përdorimin e këtyre metodave janë nevoja për të mbajtur mend të gjithë kampionin e trajnimit për të llogaritur vlerësimet e densitetit lokal të shpërndarjes së probabilitetit dhe ndjeshmërinë e lartë ndaj mospërfaqësimit të kampionit të trajnimit.

Metodat e bazuara në supozimet për klasën e funksioneve të vendimit. Në këtë grup metodash, forma e përgjithshme e funksionit të vendimit konsiderohet e njohur dhe specifikohet cilësia e tij funksionale. Bazuar në këtë funksional, përafrimi më i mirë i funksionit të vendimit kërkohet në sekuencën e trajnimit. Më të zakonshmet janë paraqitjet e funksioneve të vendimit në formën e polinomeve jolineare lineare dhe të përgjithësuara. Rregulli i vendimit për cilësinë funksionale zakonisht shoqërohet me gabim klasifikimi.

Avantazhi kryesor i metodave të bazuara në supozimet për klasën e funksioneve të vendimit është qartësia e formulimit matematikor të problemit të njohjes si një problem i kërkimit të një ekstremi. Zgjidhja e këtij problemi shpesh arrihet duke përdorur disa algoritme gradient. Shumëllojshmëria e metodave në këtë grup shpjegohet me gamën e gjerë të funksioneve të cilësisë së rregullave të vendimit dhe algoritmeve të kërkimit ekstrem të përdorur. Një përgjithësim i algoritmeve në shqyrtim, të cilat përfshijnë, në veçanti, algoritmin e Njutonit, algoritmet e tipit perceptron, etj., është metoda e përafrimit stokastik. Në ndryshim nga metodat e njohjes parametrike, suksesi i përdorimit të këtij grupi metodash nuk varet aq shumë nga mospërputhja midis ideve teorike rreth ligjeve të shpërndarjes së objekteve në hapësirën e veçorive dhe realitetit empirik. Të gjitha operacionet i nënshtrohen një qëllimi kryesor - gjetja e ekstremit të cilësisë funksionale të rregullit të vendimit. Në të njëjtën kohë, rezultatet e metodave parametrike dhe të konsideruara mund të jenë të ngjashme. Siç u tregua më lart, metodat parametrike për rastin e shpërndarjeve normale të objekteve në klasa të ndryshme me matrica të barabarta të kovariancës çojnë në funksione të vendimit linear. Vëmë re gjithashtu se algoritmet për zgjedhjen e veçorive informative në modelet e diagnostikimit linear mund të interpretohen si versione speciale të algoritmeve gradient për kërkimin e ekstremeve.

Aftësitë e algoritmeve të kërkimit të ekstremumeve të gradientit, veçanërisht në grupin e rregullave lineare të vendimit, janë studiuar mjaft mirë. Konvergjenca e këtyre algoritmeve është vërtetuar vetëm për rastin kur klasat e njohura të objekteve shfaqen në hapësirën e veçorive nga struktura kompakte gjeometrike. Sidoqoftë, dëshira për të arritur cilësi të mjaftueshme të rregullit të vendimit shpesh mund të plotësohet me ndihmën e algoritmeve që nuk kanë prova të rrepta matematikore të konvergjencës së zgjidhjes me një ekstrem global.

Algoritme të tilla përfshijnë një grup të madh procedurash programimi heuristik që përfaqësojnë drejtimin e modelimit evolucionar. Modelimi evolucionar është një metodë bionike e huazuar nga natyra. Ai bazohet në përdorimin e mekanizmave të njohur të evolucionit për të zëvendësuar procesin e modelimit kuptimplotë të një objekti kompleks me modelimin fenomenologjik të evolucionit të tij.

Një përfaqësues i njohur i modelimit evolucionar në njohjen e modelit është metoda e kontabilitetit në grup të argumenteve (MGUA). Baza e GMDH është parimi i vetë-organizimit, dhe algoritmet GMDH riprodhojnë skemën e përzgjedhjes masive. Në algoritmet GMDH, anëtarët e një polinomi të përgjithësuar sintetizohen dhe zgjidhen në një mënyrë të veçantë, e cila shpesh quhet polinomi Kolmogorov-Gabor. Kjo sintezë dhe përzgjedhje kryhet me kompleksitet në rritje dhe është e pamundur të parashikohet paraprakisht se çfarë forme përfundimtare do të ketë polinomi i përgjithësuar. Së pari, zakonisht konsiderohen kombinime të thjeshta në çift të veçorive fillestare, nga të cilat përpilohen ekuacionet e funksioneve të vendimit, zakonisht jo më të larta se renditja e dytë. Çdo ekuacion analizohet si një funksion i pavarur vendimi, dhe vlerat e parametrave të ekuacioneve të përpiluara gjenden në një mënyrë ose në një tjetër duke përdorur mostrën e trajnimit. Më pas, nga grupi i funksioneve të vendimit që rezulton, përzgjidhen disa nga më të mirat. Cilësia e funksioneve individuale të vendimit kontrollohet në një mostër kontrolli (validimi), i cili nganjëherë quhet parimi i shtimit të jashtëm. Funksionet e zgjedhura të vendimit të pjesshëm konsiderohen më tej si variabla të ndërmjetëm që shërbejnë si argumente fillestare për një sintezë të ngjashme të funksioneve të reja të vendimit, etj. Procesi i sintezës së tillë hierarkike vazhdon derisa të arrihet ekstremi i kriterit të cilësisë së funksionit të vendimit, i cili në praktikë manifestohet në përkeqësimin e kësaj cilësie kur tentohet të rritet më tej renditja e termave polinomiale në raport me tiparet origjinale.

Parimi i vetëorganizimit që qëndron në themel të GMDH quhet vetëorganizim heuristik, pasi i gjithë procesi bazohet në futjen e shtesave të jashtme, të përzgjedhura në mënyrë heuristike. Rezultati i një vendimi mund të varet shumë nga këto heuristika. Modeli diagnostikues që rezulton varet nga mënyra se si ndahen objektet në mostra trajnimi dhe testimi, si përcaktohet kriteri i cilësisë së njohjes, sa variabla kalohen në rreshtin tjetër të përzgjedhjes, etj.

Karakteristikat e treguara të algoritmeve GMDH janë gjithashtu karakteristike për qasjet e tjera të modelimit evolucionar. Por le të vërejmë këtu një aspekt tjetër të metodave në shqyrtim. Ky është thelbi i tyre kuptimplotë. Duke përdorur metoda të bazuara në supozimet për klasën e funksioneve të vendimit (evolucionare dhe gradient), është e mundur të ndërtohen modele diagnostikuese kompleksiteti i lartë dhe të merrni rezultate praktikisht të pranueshme. Në të njëjtën kohë, arritja e qëllimeve praktike në këtë rast nuk shoqërohet me nxjerrjen e njohurive të reja për natyrën e objekteve të njohura. Mundësia e nxjerrjes së kësaj njohurie, veçanërisht njohurive për mekanizmat e ndërveprimit të atributeve (veçorive), këtu kufizohet thelbësisht nga struktura e dhënë e një ndërveprimi të tillë, e fiksuar në formën e zgjedhur të funksioneve të vendimit. Prandaj, gjëja më e madhe që mund të thuhet pas ndërtimit të një modeli të veçantë diagnostikues është të listohen kombinimet e veçorive dhe vetë veçorive të përfshira në modelin që rezulton. Por kuptimi i kombinimeve që pasqyrojnë natyrën dhe strukturën e shpërndarjeve të objekteve në studim shpesh mbetet i pazbuluar brenda kornizës së kësaj qasjeje.

Metodat Boolean. Metodat logjike të njohjes së modelit bazohen në aparatin e algjebrës logjike dhe lejojnë që dikush të operojë me informacionin që përmbahet jo vetëm në veçori individuale, por edhe në kombinime të vlerave të veçorive. Në këto metoda, vlerat e çdo atributi konsiderohen si ngjarje elementare.

Në formën më të përgjithshme, metodat logjike mund të karakterizohen si një lloj kërkimi përmes një kampioni trajnimi të modeleve logjike dhe formimit të një sistemi të caktuar rregullash vendimesh logjike (për shembull, në formën e lidhjeve të ngjarjeve elementare), secila prej që ka peshën e vet. Grupi i metodave logjike është i larmishëm dhe përfshin metoda me kompleksitet dhe thellësi të ndryshme analize. Për veçoritë dikotomike (Boolean), të ashtuquajturit klasifikues të ngjashëm me pemën, metoda e testimit në fund të fundit, algoritmi "Bark" dhe të tjerët janë të njohura. Më shumë metoda komplekse bazuar në formalizimin metodat induktive D.S.Mill. Formalizimi kryhet duke ndërtuar një teori thuajse-aksiomatike dhe bazohet në logjikën e shumëvlerësuar të shumëllojshme me kuantifikues mbi tupa me gjatësi të ndryshueshme.

Algoritmi "Kora", si metodat e tjera logjike të njohjes së modelit, është mjaft i mundimshëm, pasi kërkohet një kërkim i plotë kur zgjidhni lidhjet. Prandaj, gjatë përdorimit të metodave logjike, vendosen kërkesa të larta për organizimin efikas të procesit llogaritës dhe këto metoda funksionojnë mirë me dimensione relativisht të vogla të hapësirës së veçorive dhe vetëm në kompjuterë të fuqishëm.

Metodat gjuhësore (sintaksore ose strukturore). Metodat gjuhësore të njohjes së modeleve bazohen në përdorimin e gramatikave speciale që gjenerojnë gjuhë, me ndihmën e të cilave mund të përshkruhen një sërë vetive të objekteve të njohura. Gramatika i referohet rregullave për ndërtimin e objekteve nga këta elementë jo të prejardhur.

Nëse përshkrimi i imazheve bëhet duke përdorur elementë jo-derivativ (nënimazhe) dhe marrëdhëniet e tyre, atëherë një qasje gjuhësore ose sintaksore duke përdorur parimin e përgjithësimit të vetive përdoret për të ndërtuar sisteme njohjeje automatike. Imazhi mund të përshkruhet duke përdorur struktura hierarkike nënimazhe, të ngjashme me strukturën sintaksore të gjuhës. Kjo rrethanë bën të mundur zbatimin e teorisë së gjuhët formale. Gramatika e imazhit supozohet të përmbajë grupe të fundme elementë të quajtur variabla, elementë jo të prejardhur dhe rregulla zëvendësimi. Natyra e rregullave të zëvendësimit përcakton llojin e gramatikës. Ndër gramatikat më të studiuara mund të vëmë re gramatika të rregullta, pa kontekst dhe gramatika të përbërësve të drejtpërdrejtë. Pikat kryesore të kësaj qasjeje janë përzgjedhja e elementeve jo-derivative të imazhit, kombinimi i këtyre elementeve dhe marrëdhëniet që i lidhin në gramatikat e imazhit dhe, së fundi, zbatimi i proceseve të analizës dhe njohjes në gjuhën e duhur. Kjo qasje është veçanërisht e dobishme kur punoni me imazhe që ose nuk mund të përshkruhen me matje numerike ose janë aq komplekse sa që veçoritë e tyre lokale nuk mund të identifikohen dhe duhet t'i drejtoheni veçorive globale të objekteve.

Për shembull, E.A. Butakov, V.I. Ostrovsky, I.L. Fadeev propozon strukturën e mëposhtme të sistemit për përpunimin e imazhit (Fig. 3), duke përdorur një qasje gjuhësore, ku secili prej blloqeve funksionale është një kompleks (modul) softuer (mikroprogram) që zbaton funksionet përkatëse.

Figura 3. Bllok diagrami i pajisjes njohëse

Përpjekjet për të aplikuar metodat e gjuhësisë matematikore në problemin e analizës së imazhit çojnë në nevojën për të zgjidhur një numër problemesh që lidhen me hartimin e strukturës dydimensionale të një imazhi në zinxhirët njëdimensionale të një gjuhe formale.

Metodat e zgjeruara

Në metodat e këtij grupi, në ndryshim nga drejtimi intensiv, çdo objekti të studiuar, në një masë më të madhe ose më të vogël, i jepet rëndësi diagnostike e pavarur. Në thelbin e tyre, këto metoda janë afër qasjes klinike, e cila i konsideron njerëzit jo si një zinxhir objektesh të renditura nga një tregues ose një tjetër, por si sisteme integrale, secila prej të cilave është individuale dhe ka një vlerë të veçantë diagnostikuese. Një qëndrim i tillë i kujdesshëm ndaj objekteve të kërkimit nuk lejon përjashtimin ose humbjen e informacionit për secilin objekt individual, gjë që ndodh kur përdoren metoda të drejtimit intensiv që përdorin objekte vetëm për të zbuluar dhe regjistruar modele të sjelljes së atributeve të tyre.

Operacionet kryesore në njohjen e modeleve duke përdorur metodat e diskutuara janë operacionet e përcaktimit të ngjashmërive dhe dallimeve të objekteve. Objektet në grupin e specifikuar të metodave luajnë rolin e precedentëve diagnostikues. Megjithatë, në varësi të kushteve detyrë specifike roli i një precedenti individual mund të ndryshojë shumë: nga roli kryesor dhe përcaktues deri te pjesëmarrja shumë indirekte në procesin e njohjes. Nga ana tjetër, kushtet e problemit mund të kërkojnë pjesëmarrjen e sasive të ndryshme precedentë diagnostikues: nga një në secilën klasë të njohur deri në madhësinë e plotë të kampionit, si dhe mënyra të ndryshme llogaritja e masave të ngjashmërisë dhe ndryshimit midis objekteve. Këto kërkesa shpjegojnë ndarjen e mëtejshme të metodave zgjeruese në nënklasa:

    metoda e krahasimit me prototipin;

    k-metoda e fqinjëve më të afërt;

    kolektivat e rregullave të vendimit.

Metoda e krahasimit me prototipin. Kjo është metoda më e thjeshtë e njohjes zgjatuese. Përdoret, për shembull, kur klasat e njohura shfaqen në hapësirën e veçorive nga grupime kompakte gjeometrike. Në këtë rast, zakonisht qendra e grupimit gjeometrik të klasës (ose objekti më afër qendrës) zgjidhet si pikë prototip.

Për të klasifikuar një objekt të panjohur, gjendet prototipi më i afërt dhe objekti i përket së njëjtës klasë si ky prototip. Natyrisht, në këtë metodë nuk krijohen imazhe të përgjithësuara të klasës.

Lloje të ndryshme distancash mund të përdoren si masë e afërsisë. Shpesh, për tipare dikotomike, përdoret distanca Hamming, e cila në këtë rast është e barabartë me katrorin e distancës Euklidiane. Në këtë rast, rregulli i vendimit për klasifikimin e objekteve është i barabartë me një funksion vendimi linear.

Ky fakt duhet theksuar veçanërisht. Ai tregon qartë lidhjen midis prototipit dhe paraqitjes së atributeve të informacionit në lidhje me strukturën e të dhënave. Duke përdorur përfaqësimin e mësipërm, ju mund, për shembull, çdo tradicional shkallë matëse, i cili është një funksion linear i vlerave të karakteristikave dikotomike, duhet të konsiderohet si një prototip hipotetik diagnostik. Nga ana tjetër, nëse analiza e strukturës hapësinore të klasave të njohura na lejon të nxjerrim një përfundim rreth kompaktësisë së tyre gjeometrike, atëherë mjafton të zëvendësojmë secilën prej këtyre klasave me një prototip, i cili në fakt është ekuivalent me një model diagnostik linear.

Në praktikë, sigurisht, situata është shpesh e ndryshme nga shembulli i idealizuar i përshkruar. Një studiues që synon të aplikojë një metodë njohjeje të bazuar në krahasimin me klasat diagnostike prototipe përballet me probleme të vështira. Kjo është, para së gjithash, zgjedhja e masës së afërsisë (metrike), e cila mund të ndryshojë ndjeshëm konfigurimin hapësinor të shpërndarjes së objekteve. Dhe, së dyti, një problem i pavarur është analiza e strukturave shumëdimensionale të të dhënave eksperimentale. Të dyja këto probleme janë veçanërisht të mprehta për studiuesin në kushtet e dimensionalitetit të lartë të hapësirës së tipareve, karakteristikë e problemeve reale.

Metoda k-fqinjët më të afërt. Metoda e k-fqinjëve më të afërt për zgjidhjen e problemeve të analizës diskriminuese u propozua për herë të parë në vitin 1952. Është si më poshtë.

Kur klasifikoni një objekt të panjohur, gjendet një numër i caktuar (k) i gjeometrikisht më i afërt me të në hapësirën e veçorive të objekteve të tjera (fqinjët më të afërt) me anëtarësim tashmë të njohur në klasa të njohura. Vendimi për të caktuar një objekt të panjohur në një klasë të caktuar diagnostikuese merret duke analizuar informacionin rreth kësaj përkatësie të njohur të fqinjëve të tij më të afërt, për shembull, duke përdorur një numërim të thjeshtë votash.

Fillimisht, metoda k-fqinjët më të afërt u konsiderua si një metodë joparametrike për vlerësimin e raportit të gjasave. Për këtë metodë, u morën vlerësime teorike të efektivitetit të saj në krahasim me klasifikuesin optimal Bayesian. Është vërtetuar se probabilitetet e gabimit asimptotik për metodën k-fqinjët më të afërt tejkalojnë gabimet e rregullit të Bayes jo më shumë se dy herë.

Siç u përmend më lart, në problemet reale shpesh është e nevojshme të operohet me objektet që përshkruhen një numër i madh karakteristika cilësore (dikotomike). Në këtë rast, dimensioni i hapësirës së veçorive është në përpjesëtim me ose e tejkalon vëllimin e kampionit në studim. Në kushte të tilla, është e përshtatshme të interpretohet çdo objekt i mostrës së trajnimit si një klasifikues i veçantë linear. Atëherë kjo apo ajo klasë diagnostike përfaqësohet jo nga një prototip, por nga një grup klasifikuesish linearë. Ndërveprimi i kombinuar i klasifikuesve linearë përfundimisht rezulton në një sipërfaqe lineare pjesë-pjesë që ndan klasat e njohura në hapësirën e veçorive. Lloji i sipërfaqes ndarëse, i përbërë nga copa hiperplanesh, mund të jetë i ndryshëm dhe varet nga pozicioni relativ popullatat e klasifikuara.

Mund të përdoret gjithashtu një interpretim tjetër i mekanizmave të klasifikimit duke përdorur rregullin k-fqinjët më të afërt. Ai bazohet në idenë e ekzistencës së disa variablave latente, abstrakte ose të lidhura me ndonjë transformim në hapësirën origjinale të veçorive. Nëse në hapësirën e variablave latente distancat në çift midis objekteve janë të njëjta si në hapësirën e veçorive origjinale, dhe numri i këtyre variablave është i rëndësishëm. më pak numër objekte, atëherë interpretimi i metodës k-fqinjët më të afërt mund të konsiderohet nga pikëpamja e krahasimit të vlerësimeve joparametrike të densiteteve të shpërndarjes së probabiliteteve të kushtëzuara. Pamja e variablave latente të paraqitura këtu është e afërt në natyrë me pamjen e dimensionalitetit të vërtetë dhe pamjeve të tjera të përdorura në teknika të ndryshme të reduktimit të dimensionalitetit.

Kur përdorni metodën k-fqinjët më të afërt për njohjen e modelit, studiuesi duhet të vendosë problem kompleks zgjedhja e një metrike për të përcaktuar afërsinë e objekteve të diagnostikuara. Ky problem në kushtet e dimensionalitetit të lartë të hapësirës së veçorive rëndohet jashtëzakonisht shumë për shkak të kompleksitetit të mjaftueshëm të kësaj metode, e cila bëhet e rëndësishme edhe për kompjuterët me performancë të lartë. Prandaj, këtu, ashtu si në metodën e krahasimit me një prototip, është e nevojshme të zgjidhet problemi krijues i analizimit të strukturës shumëdimensionale të të dhënave eksperimentale për të minimizuar numrin e objekteve që përfaqësojnë klasa diagnostikuese.

Algoritme për llogaritjen e vlerësimeve (votim). Parimi i funksionimit të algoritmeve të llogaritjes së vlerësimit (ABO) është llogaritja e përparësisë (pikat e ngjashmërisë) që karakterizon "afërsinë" e objekteve të njohura dhe të referencës sipas një sistemi të ansambleve të veçorive, i cili është një sistem nëngrupesh të një grupi të caktuar karakteristikash. .

Ndryshe nga të gjitha metodat e diskutuara më parë, algoritmet për llogaritjen e vlerësimeve funksionojnë me përshkrimet e objekteve në një mënyrë thelbësisht të re. Për këto algoritme, objektet ekzistojnë njëkohësisht në nënhapësira shumë të ndryshme të hapësirës së veçorive. Klasa ABO e merr idenë e përdorimit të veçorive në përfundimin e saj logjik: meqenëse nuk dihet gjithmonë se cilat kombinime të veçorive janë më informuese, atëherë në ABO shkalla e ngjashmërisë së objekteve llogaritet duke krahasuar të gjitha kombinimet e mundshme ose specifike të veçoritë e përfshira në përshkrimet e objekteve.

Kolektivat e rregullave të vendimit. Rregulli i vendimit përdor një skemë njohjeje me dy nivele. Në nivelin e parë, funksionojnë algoritmet e njohjes private, rezultatet e të cilave kombinohen në nivelin e dytë në bllokun e sintezës. Metodat më të zakonshme të një bashkimi të tillë bazohen në identifikimin e fushave të kompetencës së një algoritmi të veçantë. Mënyra më e thjeshtë gjetja e fushave të kompetencës konsiston në ndarjen a priori të hapësirës së atributeve bazuar në konsideratat profesionale të një shkence të caktuar (për shembull, shtresimi i kampionit sipas një atributi të caktuar). Më pas, për secilën nga zonat e zgjedhura, ndërtohet algoritmi i tij i njohjes. Një metodë tjetër bazohet në përdorimin e analizës formale për të përcaktuar zonat lokale të hapësirës së veçorive si lagje të objekteve të njohura për të cilat është vërtetuar suksesi i çdo algoritmi të veçantë njohjeje.

Qasja më e përgjithshme për ndërtimin e një blloku sintezë konsideron treguesit rezultues të algoritmeve të veçanta si karakteristikat fillestare për ndërtimin e një rregulli të ri të përgjithësuar të vendimit. Në këtë rast, mund të përdoren të gjitha metodat e mësipërme të drejtimeve intensive dhe zgjeruese në njohjen e modelit. Efektive për zgjidhjen e problemit të krijimit të një grupi rregullash vendimi janë algoritmet logjike të tipit "Kora" dhe algoritmet për llogaritjen e vlerësimeve (AVO), të cilat përbëjnë bazën e të ashtuquajturës qasje algjebrike, e cila ofron studimin dhe përshkrimin konstruktiv të algoritmet e njohjes, në kuadër të të cilave të gjitha llojet ekzistuese algoritme

Metodat e rrjetit nervor

Metodat e rrjetit nervor janë metoda të bazuara në përdorimin e llojeve të ndryshme të rrjeteve nervore (NN). Fushat kryesore të aplikimit të rrjeteve të ndryshme nervore për njohjen e modeleve dhe imazheve:

    aplikacion për nxjerrjen e karakteristikave ose veçorive kryesore të imazheve të dhëna,

    klasifikimi i vetë imazheve ose karakteristikave të nxjerra tashmë prej tyre (në rastin e parë, nxjerrja e karakteristikave kryesore ndodh në mënyrë implicite brenda rrjetit),

    zgjidhjen e problemeve të optimizimit.

Rrjetet neurale me shumë shtresa. Arkitektura e një rrjeti nervor shumështresor (MNN) përbëhet nga shtresa të lidhura në mënyrë sekuenciale, ku neuroni i secilës shtresë është i lidhur me hyrjet e tij me të gjithë neuronet e shtresës së mëparshme dhe daljet e shtresës tjetër.

Aplikimi më i thjeshtë i një rrjeti nervor me një shtresë (i quajtur memorie auto-shoqëruese) është trajnimi i rrjetit për të rindërtuar imazhet e ushqyera. Duke ushqyer një imazh provë si hyrje dhe duke llogaritur cilësinë e imazhit të rindërtuar, mund të vlerësoni se sa mirë rrjeti e njohu imazhin hyrës. Karakteristikat pozitive të kësaj metode janë se rrjeti mund të rivendosë imazhe të shtrembëruara dhe të zhurmshme, por nuk është i përshtatshëm për qëllime më serioze.

MNN përdoret gjithashtu për klasifikimin e drejtpërdrejtë të imazhit - ose vetë imazhi në një formë ose një grup karakteristikash kryesore të nxjerra më parë të imazhit jepet si hyrje në dalje, neuroni me aktivitet maksimal tregon anëtarësimin në klasën e njohur (Fig. 4). Nëse ky aktivitet është nën një prag të caktuar, atëherë konsiderohet se imazhi i paraqitur nuk i përket asnjërës prej klasave të njohura. Procesi mësimor vendos korrespondencën e imazheve të dhëna në hyrje me përkatësinë në një klasë të caktuar. Ky quhet mësim i mbikëqyrur. Kjo qasje është e mirë për detyrat e kontrollit të aksesit të një grupi të vogël njerëzish. Kjo qasje siguron që rrjeti të krahasojë drejtpërdrejt vetë imazhet, por me një rritje të numrit të klasave, koha e trajnimit dhe funksionimit të rrjetit rritet në mënyrë eksponenciale. Prandaj, për detyra të tilla si kërkimi person i ngjashëm në një bazë të dhënash të madhe, kërkon nxjerrjen e një grupi kompakt karakteristikash kryesore mbi të cilat mund të kërkohet.

Një qasje ndaj klasifikimit duke përdorur karakteristikat e frekuencës së të gjithë imazhit është përshkruar në. Është përdorur një rrjet nervor me një shtresë të bazuar në neurone me shumë vlera.

Aplikimi i një rrjeti nervor për klasifikimin e imazheve shfaqet kur hyrja e rrjetit merr rezultatet e dekompozimit të imazhit duke përdorur metodën e komponentit kryesor.

Në MNN klasike, lidhjet nervore ndërshtresore janë plotësisht të lidhura, dhe imazhi përfaqësohet si një vektor njëdimensional, megjithëse është dydimensional. Arkitektura konvolucionale e rrjetit nervor synon të kapërcejë këto mangësi. Ai përdori fushat e receptorit lokal (sigurojnë lidhjen lokale dy-dimensionale të neuroneve), peshat e përbashkëta (sigurojnë zbulimin e veçorive të caktuara kudo në imazh) dhe organizimin hierarkik me nënmostrim hapësinor. Rrjeti nervor konvolucional (CNN) siguron rezistencë të pjesshme ndaj ndryshimeve të shkallës, zhvendosjeve, rrotullimeve dhe shtrembërimeve.

MNN përdoren gjithashtu për të zbuluar objekte të një lloji të caktuar. Përveç faktit që çdo MNN i trajnuar mund, në një farë mase, të përcaktojë nëse imazhet i përkasin klasave "të tyre", ai mund të trajnohet posaçërisht për zbulim të besueshëm. klasa të caktuara. Në këtë rast, klasat e daljes do të jenë klasa që i përkasin dhe nuk i përkasin llojit të dhënë të imazhit. Një detektor i rrjetit nervor u përdor për të zbuluar një imazh të fytyrës në imazhin hyrës. Imazhi u skanua nga një dritare prej 20x20 pikselësh, e cila u fut në hyrjen e rrjetit, e cila vendos nëse një zonë e caktuar i përket klasës së fytyrave. Trajnimi u krye duke përdorur të dyja shembuj pozitivë (imazhe të ndryshme fytyra) dhe negative (imazhe që nuk janë fytyra). Për të rritur besueshmërinë e zbulimit, u përdor një ekip rrjetesh nervore, të trajnuar me pesha të ndryshme fillestare, si rezultat i të cilave rrjetet nervore bënin gabime në mënyra të ndryshme dhe vendimi përfundimtar u mor me votim të të gjithë ekipit.

Figura 5. Komponentët kryesorë (eigenfaces) dhe zbërthimi i imazhit në komponentët kryesorë

Një rrjet nervor përdoret gjithashtu për të nxjerrë karakteristikat kryesore të imazhit, të cilat përdoren më pas për klasifikimin e mëvonshëm. Në , është treguar një metodë e zbatimit të rrjetit nervor të metodës së analizës së komponentit kryesor. Thelbi i metodës së analizës së komponentit kryesor është të përftohen koeficientët e dekoruar maksimalisht që karakterizojnë imazhet hyrëse. Këta koeficientë quhen komponentë kryesorë dhe përdoren për kompresimin statistikor të imazhit, në të cilin një numër i vogël koeficientësh përdoren për të përfaqësuar të gjithë imazhin. Një rrjet nervor me një shtresë të fshehur që përmban N neurone (i cili është shumë më i vogël se dimensioni i imazhit), i trajnuar duke përdorur metodën e përhapjes së pasme për të rivendosur imazhin dalës të futur në hyrje, gjeneron koeficientët e N komponentëve të parë kryesorë në dalje. të neuroneve të fshehura, të cilat përdoren për krahasim. Në mënyrë tipike, përdoren nga 10 deri në 200 përbërës kryesorë. Ndërsa numri i një komponenti rritet, përfaqësimi i tij zvogëlohet shumë dhe nuk ka kuptim të përdoren komponentë me numër të madh. Kur përdoren funksionet e aktivizimit jolinear të elementeve nervore, është i mundur zbërthimi jolinear në komponentët kryesorë. Jolineariteti lejon që ndryshimet në të dhënat hyrëse të pasqyrohen më saktë. Duke aplikuar analizën e komponentëve kryesorë në zbërthimin e imazheve të fytyrës, ne marrim përbërësit kryesorë, të quajtur fytyra të veçanta, të cilat gjithashtu kanë një veti të dobishme - ka komponentë që kryesisht pasqyrojnë karakteristika të tilla thelbësore të një fytyre si gjinia, raca, emocionet. Kur rindërtohen, komponentët kanë një pamje të ngjashme me fytyrën, ku e para pasqyron formën më të përgjithshme të fytyrës, e dyta përfaqëson dallime të ndryshme të vogla midis fytyrave (Fig. 5). Kjo metodë është e përshtatshme për gjetjen e imazheve të ngjashme të fytyrave në baza të të dhënave të mëdha. Gjithashtu tregohet mundësia e zvogëlimit të mëtejshëm të dimensionit të komponentëve kryesorë duke përdorur NN. Duke vlerësuar cilësinë e rindërtimit të imazhit të hyrjes, mund të përcaktoni me shumë saktësi anëtarësimin e tij në klasën e fytyrave.

Rrjetet nervore rendit të lartë. Rrjetet nervore të rendit të lartë (HANN) ndryshojnë nga MNN në atë që kanë vetëm një shtresë, por hyrjet e neuroneve marrin gjithashtu terma të rendit të lartë, të cilët janë produkt i dy ose më shumë komponentëve të vektorit hyrës. Rrjete të tilla mund të formojnë gjithashtu sipërfaqe ndarëse komplekse.

Rrjetet neurale Hopfield. Hopfield NN (HNS) është me një shtresë dhe plotësisht i lidhur (nuk ka lidhje midis neuroneve në vetvete), daljet e tij janë të lidhura me hyrjet. Ndryshe nga MNS, NSC është relaksim - d.m.th. duke u vendosur në gjendjen fillestare, ai funksionon derisa të arrijë një gjendje të qëndrueshme, e cila do të jetë vlera e tij dalëse. Për të kërkuar një minimum global në lidhje me problemet e optimizimit, përdoren modifikimet stokastike të NSC.

Përdorimi i NSH si një memorie shoqëruese ju lejon të rivendosni me saktësi imazhet për të cilat rrjeti është trajnuar kur një imazh i deformuar futet në hyrje. Në këtë rast, rrjeti do të "kujtojë" imazhin më të afërt (në kuptimin e një energjie minimale lokale) dhe kështu do ta njohë atë. Një funksionim i tillë mund të përfaqësohet gjithashtu si aplikimi sekuencial i memories auto-asociative të përshkruar më sipër. Ndryshe nga memoria auto-shoqëruese, NSC do të rivendosë në mënyrë ideale imazhin me saktësi. Për të shmangur minimumin e ndërhyrjeve dhe për të rritur kapacitetin e rrjetit, përdoren metoda të ndryshme.

Vetë-organizimi i rrjeteve nervore Kohonen. Rrjetet nervore Kohonen vetë-organizuese (KONN) ofrojnë renditje topologjike të hapësirës së imazhit hyrës. Ato lejojnë një hartë topologjikisht të vazhdueshme të një hapësire hyrëse n-dimensionale në një hapësirë ​​dalëse m-dimensionale, m<

Kognitron. Arkitektura e Cognitron është e ngjashme me strukturën e korteksit vizual, ai ka një organizim hierarkik shumështresor në të cilin neuronet ndërmjet shtresave janë të lidhura vetëm në nivel lokal. Mësohet me mësim konkurrues (pa mësues). Çdo shtresë e trurit zbaton nivele të ndryshme të përgjithësimit; shtresa e hyrjes është e ndjeshme ndaj modeleve të thjeshta, si linjat, dhe orientimit të tyre në zona të caktuara të domenit vizual, ndërsa përgjigja e shtresave të tjera është më komplekse, abstrakte dhe e pavarur nga pozicioni i modelit. Funksione të ngjashme zbatohen në kognitron duke modeluar organizimin e korteksit vizual.

Neocognitron është një zhvillim i mëtejshëm i idesë së kognitronit dhe pasqyron më saktë strukturën e sistemit vizual, ju lejon të njihni imazhet pavarësisht nga transformimet, rrotullimet, shtrembërimet dhe ndryshimet në shkallë të tyre.

Cognitron është një mjet i fuqishëm për njohjen e imazheve, por kërkon kosto të larta llogaritëse, të cilat aktualisht janë të paarritshme.

Metodat e konsideruara të rrjetit nervor ofrojnë njohje të shpejtë dhe të besueshme të imazhit, por kur përdoren këto metoda, lindin probleme në njohjen e objekteve tredimensionale. Megjithatë, kjo qasje ka shumë përparësi.

      konkluzioni

Aktualisht, ekziston një numër mjaft i madh i sistemeve automatike të njohjes së modeleve për detyra të ndryshme të aplikuara.

Njohja e modelit me metoda formale si drejtim themelor shkencor është i pashtershëm.

Metodat matematikore të përpunimit të imazhit kanë një gamë të gjerë aplikimesh: shkencë, teknologji, mjekësi, sferë sociale. Në të ardhmen, roli i njohjes së modeleve në jetën e njeriut do të rritet edhe më shumë.

Metodat e rrjetit nervor ofrojnë njohje të shpejtë dhe të besueshme të imazhit. Kjo qasje ka shumë përparësi dhe është një nga më premtueset.

Letërsia

    D.V. Brilyuk, V.V. Starovoitov. Metodat e rrjetit nervor për njohjen e imazhit // /

    Kuzin L.T. Bazat e kibernetikës: Bazat e modeleve kibernetike. T.2. - M.: Energjia, 1979. - 584 f.

    Peregudov F.I., Tarasenko F.P. Hyrje në analizën e sistemeve: Libër mësuesi. – M.: Shkolla e lartë, 1997. - 389 f.

    Temnikov F.E., Afonin V.A., Dmitriev V.I. Bazat teorike të teknologjisë së informacionit. - M.: Energjia, 1979. - 511 f.

    Tu J., Gonzalez R. Parimet e njohjes së modelit. /Trans. nga anglishtja - M.: Mir, 1978. - 410 f.

    Winston P. Inteligjenca artificiale. /Trans. nga anglishtja - M.: Mir, 1980. - 520 f.

    Fu K. Metodat strukturore në njohjen e modeleve: Përkthyer nga anglishtja. - M.: Mir, 1977. - 320 f.

    Tsypkin Ya.Z. Bazat e teorisë së informacionit të identifikimit. - M.: Nauka, 1984. - 520 f.

    Pospelov G.S. Inteligjenca artificiale është baza e teknologjisë së re të informacionit. - M.: Nauka, 1988. - 280 f.

    Yu. Lifshits, Metodat statistikore të njohjes së modelit ///modern/07modernnote.pdf.

    Bohr N. Fizika atomike dhe njohja njerëzore. /Përkthyer nga anglishtja - M.: Mir, 1961. - 151 f.

    Butakov E.A., Ostrovsky V.I., Fadeev I.L. Përpunimi i imazhit në kompjuter.1987.-236f.

    Duda R., Hart P. Njohja e modelit dhe analiza e skenës. /Përkthyer nga anglishtja - M.: Mir, 1978. - 510 f.

    Duka V.A. Psikodiagnostika kompjuterike. - Shën Petersburg: Vëllazëria, 1994. - 365 f.

    Aizenberg I. N., Aizenberg N. N. dhe Krivosheev G. A. Neuronet binare me shumë vlera dhe universale: Algoritmet e të mësuarit, aplikacionet në përpunimin dhe njohjen e imazhit. Shënime Leksioni në Inteligjencën Artificiale – Mësimi i Makinerisë dhe Minimi i të Dhënave në Njohjen e Modeleve, 1999, f. 21-35.

    Ranganath S. dhe Arun K. Njohja e fytyrës duke përdorur veçoritë e transformimit dhe rrjetet nervore. Njohja e modelit 1997, vëll. 30, fq. 1615-1622.

    Golovko V.A. Neurointeligjenca: Teoria dhe aplikimet. Libri 1. Organizimi dhe trajnimi i rrjeteve nervore me lidhje direkte dhe kthyese - Brest: BPI, 1999, - 260 pp.

    Vetter T. dhe Poggio T. Klasat e objekteve lineare dhe sinteza e imazhit nga një shembull i vetëm imazhi. IEEE Transactions on Pattern Analysis and Machine Intelligence 1997, Vol. 19, fq. 733-742.

    Golovko V.A. Neurointeligjenca: Teoria dhe aplikimet. Libri 2. Vetëorganizimi, toleranca ndaj gabimeve dhe aplikimi i rrjeteve nervore - Brest: BPI, 1999, - 228 f.

    Lawrence S., Giles C. L., Tsoi A. C. dhe Back A. D. Njohja e Fytyrës: Një Qasje Konvolutional Neural Network. IEEE Transactions on Neural Networks, Çështje Speciale për Rrjetet Neurale dhe Njohja e Modeleve, pp. 1-24.

    Wasserman F. Teknologjia neurokompjuterike: Teoria dhe praktika, 1992 – 184 f.

    Rowley, H. A., Baluja, S. dhe Kanade, T. Zbulimi i fytyrës i bazuar në rrjetin nervor. IEEE Transactions on Pattern Analysis and Machine Intelligence 1998, Vol. 20, fq. 23-37.

    Valentin D., Abdi H., O"Toole A. J. dhe Cottrell G. W. Modelet lidhëse të përpunimit të fytyrës: një sondazh. IN: Njohja e modelit 1994, Vol. 27, f. 1209-1230.

    Dokumenti

    Ata përbëjnë algoritme njohjeimazhe. Metodatnjohjeimazhe Siç u përmend më lart... realiteti nuk është ekziston"ekosistemeve në përgjithësi", dhe ekzistojnë vetëm individuale... përfundime nga kjo e detajuar rishikimmetodatnjohje kemi prezantuar në...

  1. Rishikimi i metodave për identifikimin e njerëzve bazuar në imazhet e fytyrës, duke marrë parasysh veçoritë e njohjes vizuale

    Rishikimi

    ... njohje nga një person i objekteve me kontrast të ulët, përfshirë. personat E dhënë rishikim e zakonshme metodat ... ekziston një seri e tërë metodat ... mënyrë, si rezultat i hulumtimit, një platformë për zhvillim metodënjohje ...

  2. Me emrin Glazkova Valentina Vladimirovna KËRKIM DHE ZHVILLIM I METODAVE PËR NDËRTIMIN E MJETEVE Softuerike PËR KLASIFIKIM TË DOKUMENTEVE TË HYPERTEKSTEVE SHUMË TEMAVE Specialiteti 05

    Abstrakt i disertacionit

    Dokumentet e hipertekstit. Kapitulli ofron rishikimekzistuesemetodat zgjidhjet e problemit në shqyrtim, përshkrimi... duke i prerë klasat më pak të rëndësishme // Matematikore metodatnjohjeimazhe: Konferenca e 13-të Gjith-Ruse. Rajoni i Leningradit...

  3. Slide 0 Rishikim i detyrave të bioinformatikës që lidhen me analizën dhe përpunimin e teksteve gjenetike

    Ligjërata

    Sekuencat e ADN-së dhe proteinave. Rishikimi detyrat e bioinformatikës si detyra... sinjalet kërkojnë përdorimin e modernes metodatnjohjeimazhe, qasje statistikore dhe... me densitet të ulët gjen. Ekzistuese Programet e parashikimit të gjeneve nuk janë...



Ju pëlqeu artikulli? Ndani me miqtë tuaj!