Metodat sekuenciale të njohjes së modeleve. "Kontrolli adaptiv i sistemeve komplekse bazuar në teorinë e njohjes së modelit

Sistemet e gjalla, duke përfshirë njerëzit, janë përballur vazhdimisht me problemin e njohjes së modeleve që nga shfaqja e tyre. Në veçanti, informacioni që vjen nga organet shqisore përpunohet nga truri, i cili nga ana tjetër rendit informacionin, siguron vendimmarrjen dhe më pas, duke përdorur impulse elektrokimike, transmeton sinjalin e nevojshëm më tej, për shembull, në organet e lëvizjes, të cilat zbatojnë veprimet e nevojshme. Pastaj mjedisi ndryshon, dhe dukuritë e mësipërme përsëriten. Dhe nëse e shikoni, çdo fazë shoqërohet me njohje.

Me zhvillimin teknologji kompjuterikeËshtë bërë e mundur të zgjidhen një sërë problemesh që lindin në procesin e jetës, për të lehtësuar, përshpejtuar dhe përmirësuar cilësinë e rezultatit. Për shembull, puna sisteme të ndryshme mbështetja e jetës, ndërveprimi njeri-kompjuter, shfaqja e sistemeve robotike, etj. Megjithatë, vërejmë se aktualisht nuk është e mundur të sigurohet një rezultat i kënaqshëm në disa detyra (njohja e objekteve të ngjashme me lëvizje të shpejtë, teksti i shkruar me dorë).

Qëllimi i punës: të studiojë historinë e sistemeve të njohjes së imazhit.

Përcaktoni ndryshimet cilësoreçfarë ndodhi në fushën e njohjes së modeleve, teorike dhe teknike, duke treguar arsyet;

Diskutoni metodat dhe parimet e përdorura në informatikë;

Jepni shembuj të perspektivave që priten në të ardhmen e afërt.

1. Çfarë është njohja e modelit?

Hulumtimet e hershme me informatikë u ndoqën kryesisht skema klasike modelimi matematik- modeli matematikor, algoritmi dhe llogaritja. Këto ishin detyrat e modelimit të proceseve që ndodhin gjatë shpërthimeve bombat atomike, llogaritja e trajektoreve balistike, aplikime ekonomike dhe të tjera. Sidoqoftë, përveç ideve klasike të kësaj serie, u shfaqën metoda të bazuara në një natyrë krejtësisht të ndryshme dhe siç tregoi praktika e zgjidhjes së disa problemeve, ato shpesh jepnin rezultate më të mira sesa zgjidhjet e bazuara në modele matematikore tepër të ndërlikuara. Ideja e tyre ishte të braktisnin dëshirën për të krijuar një gjithëpërfshirës modeli matematik të objektit që studiohej (për më tepër, shpesh ishte praktikisht e pamundur të ndërtoheshin modele adekuate), dhe në vend të kësaj të mjaftoheshim me përgjigjen vetëm për pyetjet specifike me interes për ne dhe t'i kërkojmë këto përgjigje nga konsideratat e zakonshme për një klasë të gjerë problemesh. Kërkimet e këtij lloji përfshinin njohjen e imazheve vizuale, parashikimin e rendimenteve të të korrave, niveleve të lumenjve, detyrën e dallimit të naftëmbajtësve dhe akuiferëve bazuar në të dhënat gjeofizike indirekte etj. Në këto detyra kërkohej një përgjigje specifike në një formë mjaft të thjeshtë, si p.sh. , për shembull, nëse një objekt i përket njërës prej klasave të para-fiksuara. Dhe të dhënat fillestare të këtyre detyrave, si rregull, jepeshin në formën e informacionit fragmentar për objektet që studiohen, për shembull, në formën e një grupi objektesh të para-klasifikuara. ME pikë matematikore Nga një këndvështrim, kjo do të thotë se njohja e modelit (dhe kështu u emërua kjo klasë problemesh në vendin tonë) është një përgjithësim i gjerë i idesë së ekstrapolimit të funksionit.

Rëndësia e një deklarate të tillë për shkencat teknike është e padiskutueshme dhe kjo në vetvete justifikon studime të shumta në këtë fushë. Sidoqoftë, problemi i njohjes së modeleve ka gjithashtu një aspekt më të gjerë për shkencën natyrore (megjithatë, do të ishte e çuditshme nëse diçka kaq e rëndësishme për sistemet artificiale kibernetike nuk do të kishte rëndësi për ato natyrore). Konteksti i kësaj shkence përfshinte gjithashtu në mënyrë organike pyetjet e parashtruara nga filozofët e lashtë në lidhje me natyrën e njohurive tona, aftësinë tonë për të njohur imazhet, modelet dhe situatat në botën përreth. Në fakt, ka pak dyshim se mekanizmat për njohjen e imazheve më të thjeshta, të tilla si imazhet e një grabitqari ose ushqimi të rrezikshëm që po afrohej, u formuan shumë më herët sesa shfaqja e gjuha elementare dhe aparate logjike formale. Dhe nuk ka dyshim se mekanizma të tillë janë mjaft të zhvilluar në kafshët më të larta, të cilat gjithashtu në aktivitetet e tyre jetësore kanë nevojë urgjente për aftësinë për të dalluar një sistem mjaft kompleks të shenjave të natyrës. Kështu, në natyrë shohim se fenomeni i të menduarit dhe i vetëdijes bazohet qartë në aftësinë për të njohur imazhe dhe përparimi i mëtejshëm i shkencës së inteligjencës lidhet drejtpërdrejt me thellësinë e të kuptuarit të ligjeve themelore të njohjes. Të kuptuarit e faktit se çështjet e mësipërme shkojnë shumë përtej përkufizim standard njohja e modelit (në literaturën në gjuhën angleze termi mësim i mbikqyrur është më i zakonshëm), është gjithashtu e nevojshme të kuptohet se ato kanë lidhje të thella me këtë drejtim relativisht të ngushtë (por ende larg nga shterimi).

Tashmë, njohja e modelit është vendosur fort në jetën e përditshme dhe është një nga njohuritë më vitale të inxhinierit modern. Në mjekësi, njohja e modelit i ndihmon mjekët të bëjnë diagnoza më të sakta në fabrika, përdoret për të parashikuar defekte në tufa mallrash. Sistemet biometrike të identifikimit personal si thelbi i tyre algoritmik bazohen gjithashtu në rezultatet e kësaj disipline. Zhvillimi i mëtejshëm inteligjencës artificiale, në veçanti dizajni i kompjuterëve të gjeneratës së pestë të aftë për më shumë komunikim direkt me një person në gjuhët e natyrshme për njerëzit dhe përmes të folurit, janë të paimagjinueshme pa njohje. Robotika është vetëm një hedhje guri këtu, sistemet artificiale kontrollet që përmbajnë sisteme njohjeje si nënsisteme jetike.

Kjo është arsyeja pse zhvillimi i njohjes së modeleve që në fillim tërhoqi shumë vëmendje nga specialistë të profileve të ndryshme - kibernetikë, neurofiziologë, psikologë, matematikanë, ekonomistë, etj. Është kryesisht për këtë arsye që vetë njohja moderne e modeleve ushqehet nga idetë e këtyre disiplinave. Pa pretenduar plotësinë (dhe është e pamundur të pretendohet në një ese të shkurtër), ne do të përshkruajmë historinë e njohjes së modelit, idetë kryesore.

Përkufizimet

Para se të vazhdojmë me metodat kryesore të njohjes së modelit, ne paraqesim disa përkufizime të nevojshme.

Njohja e modelit (objektet, sinjalet, situatat, fenomenet ose proceset) është detyra e identifikimit të një objekti ose përcaktimit të ndonjë prej vetive të tij nga imazhi i tij (njohja optike) ose regjistrimi audio (njohja akustike) dhe karakteristika të tjera.

Një nga ato bazë është koncepti i grupit, i cili nuk ka një formulim specifik. Në një kompjuter, një grup përfaqësohet si një grup elementësh që nuk përsëriten të të njëjtit lloj. Fjala "jo-përsëritëse" do të thotë që një element në grup ose është aty ose nuk është aty. Një grup universal përfshin të gjithë elementët e mundshëm për problemin që zgjidhet, një grup bosh nuk përmban asnjë.

Një imazh është një grupim klasifikimi në një sistem klasifikimi që bashkon (thekson) një grup të caktuar objektesh sipas një kriteri të caktuar. Imazhet kanë një veti karakteristike, e cila manifestohet në faktin se njohja me një numër të kufizuar fenomenesh nga i njëjti grup bën të mundur njohjen e sa më shumë që dëshironi. numër i madh përfaqësuesit e saj. Imazhet kanë veti karakteristike objektive në kuptimin që njerëz të ndryshëm, duke studiuar në materiale të ndryshme vëzhgimet, kryesisht klasifikojnë të njëjtat objekte në mënyrë të barabartë dhe të pavarur nga njëri-tjetri. Në formulimin klasik të problemit të njohjes, grupi universal ndahet në pjesë të imazhit. Çdo hartë e një objekti në organet perceptuese të sistemit të njohjes, pavarësisht nga pozicioni i tij në lidhje me këto organe, zakonisht quhet imazh i objektit, dhe grupet e imazheve të tilla, të bashkuara nga disa veti të përbashkëta, janë imazhe.

Metoda e caktimit të një elementi në çdo imazh quhet rregull vendimtar. Edhe një gjë koncept i rëndësishëm- metrikë, një metodë për përcaktimin e distancës midis elementeve të një grupi universal. Sa më e vogël të jetë kjo distancë, aq më të ngjashme janë objektet (simbolet, tingujt, etj.) - ato që ne njohim. Në mënyrë tipike, elementët specifikohen si një grup numrash, dhe metrika specifikohet si një funksion. Efektiviteti i programit varet nga zgjedhja e paraqitjes së imazhit dhe zbatimit metrikë, një algoritëm njohjeje me metrika të ndryshme do të bëjë gabime me frekuenca të ndryshme.

Mësimi zakonisht quhet procesi i zhvillimit në një sistem të caktuar një ose një reagim tjetër ndaj grupeve të sinjaleve të jashtme identike përmes ekspozimit të përsëritur ndaj sistemit të rregullimeve të jashtme. Rregullime të tilla të jashtme në trajnim zakonisht quhen "shpërblime" dhe "dënime". Mekanizmi për gjenerimin e këtij rregullimi përcakton pothuajse plotësisht algoritmin e të mësuarit. Vetë-mësimi ndryshon nga trajnimi në atë që këtu nuk jepet informacion shtesë në lidhje me korrektësinë e reagimit ndaj sistemit.

Përshtatja është procesi i ndryshimit të parametrave dhe strukturës së sistemit, dhe ndoshta veprimet e kontrollit, bazuar në informacionin aktual për të arritur një gjendje të caktuar të sistemit në pasigurinë fillestare dhe ndryshimin e kushteve të funksionimit.

Të mësuarit është procesi me të cilin një sistem gradualisht fiton aftësinë për t'u përgjigjur reagimet e nevojshme ndaj popullatave të caktuara ndikimet e jashtme, dhe përshtatja është rregullimi i parametrave dhe strukturës së sistemit për të arritur cilësinë e kërkuar të kontrollit në kushtet e ndryshimeve të vazhdueshme në kushtet e jashtme.

Shembuj të detyrave të njohjes së modeleve: - Njohja e shkronjave;

Die, 29 Mars 2015

Aktualisht, ka shumë detyra në të cilat është e nevojshme të merret një vendim në varësi të pranisë së një objekti në imazh ose ta klasifikoni atë. Aftësia për të "njohur" konsiderohet një pronë bazë krijesa biologjike, ndërsa sistemet kompjuterike nuk e posedojnë plotësisht këtë pronë.

Le të shqyrtojmë elemente të përbashkëta modelet e klasifikimit.

Klasa- një grup objektesh që kanë vetitë e përgjithshme. Për objektet e së njëjtës klasë, supozohet prania e "ngjashmërisë". Për një detyrë njohjeje, mund të përcaktohet një numër arbitrar klasash, më i madh se 1. Numri i klasave shënohet me numrin S. Çdo klasë ka etiketën e saj identifikuese.

Klasifikimi- procesi i caktimit të etiketave të klasave për objektet, sipas disa përshkrimeve të vetive të këtyre objekteve. Një klasifikues është një pajisje që merr një grup atributesh objekti si të dhëna hyrëse dhe prodhon një etiketë klase si rezultat.

Verifikimi- procesi i hartës së një shembulli objekti në një model të vetëm objekti ose përshkrim klase.

Nën mënyrë emrin e zonës do ta kuptojmë në hapësirën e veçorive në të cilën shfaqen shumë objekte ose dukuri bota materiale. Nënshkruani - përshkrim sasior një ose një veçori tjetër të objektit ose dukurisë që studiohet.

Hapësira e veçorive Kjo Hapësira N-dimensionale, e përcaktuar për një detyrë të caktuar njohjeje, ku N është një numër fiks i veçorive të matura për çdo objekt. Një vektor nga hapësira e veçorive x që korrespondon me objektin e detyrës së njohjes është një vektor N-dimensional me komponentë (x_1,x_2,…,x_N), të cilat janë vlerat e veçorive për këtë objekt.

Me fjalë të tjera, njohja e modelit mund të përkufizohet si caktimi i të dhënave burimore në një klasë specifike duke përdorur përzgjedhjen veçoritë thelbësore ose vetitë që karakterizojnë këto të dhëna, nga masë totale detaje të parëndësishme.

Shembuj të problemeve të klasifikimit janë:

  • njohja e personazheve;
  • njohja e të folurit;
  • vendosja e një diagnoze mjekësore;
  • parashikimi i motit;
  • njohja e fytyrës
  • klasifikimi i dokumenteve etj.

Më shpesh, materiali burimor është imazhi i marrë nga kamera. Problemi mund të formulohet si marrja e vektorëve të veçorive për secilën klasë në imazhin në shqyrtim. Procesi mund të shihet si një proces kodimi që përfshin caktimin e një vlere për çdo veçori nga hapësira e veçorive për secilën klasë.

Nëse marrim parasysh 2 klasa objektesh: të rriturit dhe fëmijët. Ju mund të zgjidhni lartësinë dhe peshën si shenja. Siç shihet nga figura, këto dy klasa formojnë dy grupe të ndara, të cilat mund të shpjegohen nga veçoritë e zgjedhura. Megjithatë, nuk është gjithmonë e mundur të zgjidhen parametrat e saktë të matur si veçori të klasës. Për shembull, parametrat e zgjedhur nuk janë të përshtatshëm për krijimin e klasave të ndara të futbollistëve dhe basketbollistëve.

Detyra e dytë e njohjes është përzgjedhja tipare karakteristike ose vetitë nga imazhet burimore. Kjo detyrë mund të klasifikohet si parapërpunim. Nëse marrim parasysh detyrën e njohjes së të folurit, mund të dallojmë veçori të tilla si zanoret dhe bashkëtingëlloret. Atributi duhet të jetë një veti karakteristike e një klase të caktuar, dhe në të njëjtën kohë e përbashkët për këtë klasë. Veçoritë që karakterizojnë dallimet ndërmjet - veçorive ndërklasore. Karakteristikat e zakonshme për të gjitha klasat nuk janë informacione të dobishme dhe nuk konsiderohen si veçori në detyrën e njohjes. Zgjedhja e veçorive është një nga detyrat e rëndësishme që lidhet me ndërtimin e një sistemi njohjeje.

Pasi të jenë përcaktuar veçoritë, duhet të përcaktohet procedura optimale e vendimit për klasifikim. Le të shqyrtojmë një sistem njohjeje modeli të krijuar për të njohur klasa të ndryshme M, të shënuara si m_1,m_2,…,m 3. Atëherë mund të supozojmë se hapësira e imazhit përbëhet nga rajone M, secila përmban pika që korrespondojnë me një imazh nga një klasë. Atëherë problemi i njohjes mund të konsiderohet si ndërtimi i kufijve që ndajnë klasat M bazuar në vektorët e matjeve të miratuara.

Zgjidhja e problemit të parapërpunimit të imazhit, nxjerrja e veçorive dhe problemi i marrjes së një zgjidhjeje dhe klasifikimi optimal zakonisht shoqërohet me nevojën për të vlerësuar një numër parametrash. Kjo çon në problemin e vlerësimit të parametrave. Përveç kësaj, është e qartë se nxjerrja e veçorive mund të përdoret informacione shtesë bazuar në natyrën e klasave.

Objektet mund të krahasohen bazuar në paraqitjen e tyre si vektorë matës. Është i përshtatshëm për të paraqitur të dhënat e matjes në formën e numrave realë. Pastaj ngjashmëria e vektorëve të veçorive të dy objekteve mund të përshkruhet duke përdorur distancën Euklidiane.

ku d është dimensioni i vektorit të tipareve.

Ekzistojnë 3 grupe të metodave të njohjes së modelit:

  • Krahasimi me mostrën. Ky grup përfshin klasifikimin sipas mesatares më të afërt, klasifikimin sipas distancës me fqinjin më të afërt. Në grupin e krahasimit me kampionin mund të përfshihen edhe metodat e njohjes strukturore.
  • Metodat statistikore. Siç sugjeron emri, metodat statistikore përdorin disa informacion statistikor kur zgjidh një problem njohjeje. Metoda përcakton nëse një objekt i përket një klase specifike në bazë të probabilitetit Në disa raste, kjo zbret në përcaktimin e probabilitetit të pasëm të një objekti që i përket një klase specifike, me kusht që karakteristikat e këtij objekti të kenë marrë vlerat e duhura. Një shembull është metoda e bazuar në rregullin e vendimit Bayesian.
  • Rrjetet nervore. Një klasë e veçantë e metodave të njohjes. Tipar dallues nga të tjerët është aftësia për të mësuar.

Klasifikimi sipas mesatares më të afërt

Në qasjen klasike të njohjes së modelit, në të cilën një objekt i panjohur për klasifikim përfaqësohet si një vektor i veçorive elementare. Mund të zhvillohet sistemi i njohjes së bazuar në veçori në mënyra të ndryshme. Këta vektorë mund t'i njihen sistemit paraprakisht si rezultat i trajnimit ose të parashikohen në kohë reale bazuar në disa modele.

Një algoritëm i thjeshtë klasifikimi është grupimi i të dhënave të referencës së klasës duke përdorur vektorin e pritjes së klasës (mesatarja).

ku x(i,j)- referencë j-të tipar i klasës i, n_j është numri i vektorëve referencë të klasës i.

Atëherë një objekt i panjohur do t'i përkasë klasës i nëse është dukshëm më afër vektorit të pritjes matematikore të klasës i sesa vektorëve të pritjeve matematikore të klasave të tjera. Kjo metodë është e përshtatshme për problemet në të cilat pikat e secilës klasë janë të vendosura në mënyrë kompakte dhe larg pikave të klasave të tjera.

Vështirësitë do të shfaqen nëse klasat kanë pak më shumë strukturë komplekse, për shembull, si në figurë. NË në këtë rast Klasa 2 është e ndarë në dy rajone të ndara që përshkruhen dobët nga një vlerë mesatare e vetme. Gjithashtu klasa 3 është shumë e zgjatur, mostrat e klasës 3 me vlera të mëdha koordinatat x_2 janë më afër vlerës mesatare të klasës së parë sesa e 3-të.

Problemi i përshkruar në disa raste mund të zgjidhet duke ndryshuar llogaritjen e distancës.

Ne do të marrim parasysh karakteristikën e "shpërndarjes" së vlerave të klasës - σ_i, përgjatë çdo drejtimi koordinativ i. Devijimi standard është i barabartë me rrënjën katrore të variancës. Distanca Euklidiane e shkallëzuar ndërmjet vektorit x dhe vektorit të pritjes x_c është

Kjo formulë e distancës do të zvogëlojë numrin e gabimeve të klasifikimit, por në realitet shumica e problemeve nuk mund të përfaqësohen nga një klasë kaq e thjeshtë.

Klasifikimi sipas distancës nga fqinji më i afërt

Një qasje tjetër ndaj klasifikimit është caktimi i vektorit të veçorisë së panjohur x klasës me të cilën mostra individuale ky vektor është më i ngjashëm. Ky rregull quhet rregulli i fqinjit më të afërt. Klasifikimi i fqinjëve më të afërt mund të jetë më efikas edhe kur klasat kanë struktura komplekse ose kur klasat mbivendosen.

Kjo qasje nuk kërkon supozime në lidhje me modelet e shpërndarjes së vektorëve të veçorive në hapësirë. Algoritmi përdor vetëm informacione rreth mostrave të njohura të referencës. Metoda e zgjidhjes bazohet në llogaritjen e distancës x për çdo mostër në bazën e të dhënave dhe gjetjen e distancës minimale. Përparësitë e kësaj qasjeje janë të dukshme:

  • ju mund të shtoni mostra të reja në bazën e të dhënave në çdo kohë;
  • Strukturat e të dhënave të pemës dhe rrjetit reduktojnë numrin e distancave të llogaritura.

Për më tepër, zgjidhja do të jetë më e mirë nëse kërkojmë në bazën e të dhënave jo për një fqinj më të afërt, por për k. Më pas, për k > 1, ai siguron kampionimin më të mirë të shpërndarjes së vektorëve në hapësirën d-dimensionale. Megjithatë përdorim efikas vlerat e k varet nëse ka sasi të mjaftueshme në çdo rajon të hapësirës. Nëse ka më shumë se dy klasa, atëherë pranoni vendim të drejtë rezulton të jetë më e vështirë.

Letërsia

  • M. Castrillon,. O. Deniz,. D. Hernández dhe J. Lorenzo, "Një krahasim i detektorëve të tipareve të fytyrës dhe fytyrës bazuar në kornizën e përgjithshme të zbulimit të objekteve të Viola-Jones", International Journal of Computer Vision, nr. 22, f. 481-494, 2011.
  • Y.-Q. Wang, "Një analizë e algoritmit të zbulimit të fytyrës Viola-Jones", Journal IPOL, 2013.
  • L. Shapiro dhe D. Stockman, Computer Vision, Binom. Laboratori i Dijes, 2006.
  • Z. N. G., Metodat e njohjes dhe aplikimi i tyre, Radio Sovjetike, 1972.
  • J. Tu, R. Gonzalez, Parimet matematikore të njohjes së modelit, Moskë: "Mir" Moskë, 1974.
  • Khan, H. Abdullah dhe M. Shamian Bin Zainal, "Algoritmi efikas i zbulimit të syve dhe gojës duke përdorur kombinimin e viola jones dhe zbulimin e pikselit të ngjyrës së lëkurës", International Journal of Engineering and Applied Sciences, Nr. Vol. 3 Nr. 4, 2013.
  • V. Gaede dhe O. Gunther, “Multidimensional Access Methods”, ACM Computing Surveys, f. 170-231, 1998.

Etj objekte që karakterizohen nga një grup i kufizuar i vetive dhe karakteristikave të caktuara. Probleme të tilla zgjidhen mjaft shpesh, për shembull, kur kaloni ose lëvizni nëpër një rrugë duke ndjekur semaforët. Njohja e ngjyrës së një semafori të ndezur dhe njohja e rregullave trafiku ju lejon të pranoni vendimi i duhur nëse mundeni apo nuk mund të kaloni rrugën.

Nevoja për një njohje të tillë lind më së shumti zona të ndryshme- nga çështjet ushtarake dhe sistemet e sigurisë deri te dixhitalizimi i sinjaleve analoge.

Problemi i njohjes së imazhit ka marrë një rëndësi të jashtëzakonshme në kushtet e mbingarkesës së informacionit, kur një person nuk mund të përballojë një kuptim linear-sekuencial të mesazheve që i vijnë, si rezultat i të cilit truri i tij kalon në mënyrën e perceptimit dhe të menduarit të njëkohshëm; që është karakteristikë e një njohjeje të tillë.

Prandaj, nuk është rastësi që problemi i njohjes së imazhit përfundoi në terren kërkimi ndërdisiplinor- përfshirë në lidhje me punën për krijimin e inteligjencës artificiale dhe krijimin e sistemeve teknike njohja e imazhit po tërheq gjithnjë e më shumë vëmendje.

YouTube enciklopedik

    1 / 4

    Hyrje në njohjen e modeleve

    R.V. Shamin. Leksioni nr. 6 Rrjetet Hopfield dhe Hamming në problemet e njohjes së modeleve

    [DDSh-2016]: Rrjetet nervore dhe vizioni kompjuterik modern

    Leksioni 9. Zbutja eksponenciale. Njohja e modelit: k-metoda e fqinjit më të afërt

    Titra

Udhëzime në njohjen e modelit

Mund të dallohen dy drejtime kryesore:

  • Studimi i aftësive njohëse që zotërojnë gjallesat, shpjegimi dhe modelimi i tyre;
  • Zhvillimi i teorisë dhe metodave për ndërtimin e pajisjeve të dizajnuara për të zgjidhur probleme individuale për qëllime të aplikuara.

Deklarata zyrtare e problemit

Njohja e modelit është caktimi i të dhënave burimore në një klasë të caktuar duke identifikuar veçori të rëndësishme që karakterizojnë këto të dhëna nga masa totale e të dhënave të parëndësishme.

Kur vendosin probleme të njohjes, ata përpiqen të përdorin gjuha matematikore, duke u përpjekur - në ndryshim nga teoria e rrjeteve nervore artificiale, ku baza është marrja e një rezultati përmes eksperimentit - për të zëvendësuar eksperimentin me arsyetimin logjik dhe prova matematikore.

Formulimi klasik i problemit të njohjes së modelit: Jepet një grup objektesh. Duhet bërë një klasifikim lidhur me to. Një grup përfaqësohet nga nënbashkësi të quajtura klasa. Janë dhënë: informacion rreth klasave, një përshkrim i të gjithë grupit dhe një përshkrim i informacionit për një objekt, anëtarësimi i të cilit në një klasë specifike është i panjohur. Në bazë të informacionit të disponueshëm për klasat dhe përshkrimin e objektit, kërkohet të përcaktohet se cilës klasë i përket ky objekt.

Imazhet pikturë njëngjyrëshe konsiderohen më shpesh në problemet e njohjes së modelit, gjë që bën të mundur që imazhi të konsiderohet si një funksion në një aeroplan. Nëse marrim parasysh një pikë të vendosur në rrafsh T (\displaystyle T), ku funksioni shpreh karakteristikat e tij në çdo pikë të imazhit - shkëlqim, transparencë, dendësia optike, atëherë një funksion i tillë është një regjistrim zyrtar i imazhit.

Kompleti i të gjitha funksioneve të mundshme f (x , y) (\stil ekrani f(x,y)) në aeroplan T (\displaystyle T)- ekziston një model i grupit të të gjitha imazheve X (\displaystyle X). Prezantimi i konceptit ngjashmëritë midis imazheve mund të bëni një detyrë njohjeje. Lloji specifik i një deklarate të tillë varet fuqishëm nga fazat pasuese të njohjes në përputhje me një qasje të veçantë.

Disa metoda të njohjes së modeleve grafike

Për njohjen optike të modelit, mund të përdorni metodën e numërimit të pamjes së një objekti në kënde të ndryshme, shkallë, zhvendosje, etj. Për shkronjat, duhet të numëroni fontin, vetitë e fontit, etj.

Qasja e dytë është gjetja e skicës së objektit dhe ekzaminimi i vetive të tij (lidhja, prania e qosheve, etj.)

Një qasje tjetër është përdorimi i rrjeteve nervore artificiale. Kjo metodë kërkon ose sasi e madhe shembuj të një detyre njohjeje (me përgjigje të sakta), ose një strukturë të veçantë rrjet nervor, duke marrë parasysh specifikat e kësaj detyre.

Perceptroni si një metodë e njohjes së modelit

F. Rosenblatt, duke prezantuar konceptin e një modeli të trurit, detyra e të cilit është të tregojë se si në disa sistemi fizik, struktura dhe vetitë funksionale të të cilave dihen, mund të lindin dukuritë psikologjike, përshkroi eksperimentet më të thjeshta të diskriminimit. Këto eksperimente janë tërësisht të lidhura me metodat e njohjes së modelit, por ndryshojnë në atë që algoritmi i zgjidhjes nuk është determinist.

Eksperimenti më i thjeshtë mbi bazën e të cilit mund të merrni psikologjikisht informacion kuptimplotë për disa sisteme, rrjedh në faktin se modeli paraqitet me dy stimuj të ndryshëm dhe kërkohet t'u përgjigjet atyre në mënyra të ndryshme. Qëllimi i një eksperimenti të tillë mund të jetë të studiojë mundësinë e diskriminimit të tyre spontan nga sistemi në mungesë të ndërhyrjes nga ana e eksperimentuesit, ose, anasjelltas, të studiojë diskriminimin e detyruar, në të cilin eksperimentuesi kërkon të trajnojë sistemin për të kryejnë klasifikimin e kërkuar.

Në një eksperiment me trajnimin e perceptronit, zakonisht paraqitet një sekuencë e caktuar imazhesh, e cila përfshin përfaqësues të secilës prej klasave që duhen dalluar. Sipas disa rregullave të modifikimit të kujtesës, zgjedhja e saktë e përgjigjes përforcohet. Më pas perceptroni paraqitet me një stimul kontrolli dhe probabilitet të marrjes reagimi i duhur për stimuj të kësaj klase. Në varësi të faktit nëse stimuli i zgjedhur i kontrollit përkon ose nuk përkon me një nga imazhet që janë përdorur në sekuencën e trajnimit, merren rezultate të ndryshme:

  1. Nëse stimuli i kontrollit nuk përkon me ndonjë nga stimujt e stërvitjes, atëherë eksperimenti shoqërohet jo vetëm me diskriminim i pastër, por përfshin edhe elemente përgjithësime.
  2. Nëse një stimul kontrolli ngacmon një grup të caktuar elementësh shqisor krejtësisht të ndryshëm nga ata elementë që janë aktivizuar nën ndikimin e stimujve të paraqitur më parë të së njëjtës klasë, atëherë eksperimenti është një studim. përgjithësim i pastër.

Perceptronet nuk kanë aftësinë për përgjithësim të pastër, por ato funksionojnë mjaft të kënaqshme në eksperimentet e diskriminimit, veçanërisht nëse stimuli i kontrollit përputhet mjaftueshëm me një nga imazhet me të cilat perceptroni tashmë ka grumbulluar njëfarë përvoje.

Shembuj të problemeve të njohjes së modelit

  • Njohja e barkodit
  • Njohja e targave
  • Njohja e imazhit
  • Njohja lokale e zonës kores së tokës, në të cilën ndodhen depozitat

Dhe shenja. Probleme të tilla zgjidhen mjaft shpesh, për shembull, kur kaloni ose kaloni një rrugë duke ndjekur semaforët. Njohja e ngjyrës së një semafori të ndezur dhe njohja e rregullave të rrugës ju lejon të merrni vendimin e duhur nëse mundeni apo nuk mund të kaloni rrugën në këtë moment.

Në procesin e evolucionit biologjik, shumë kafshë zgjidhën problemet me ndihmën e aparatit të tyre vizual dhe dëgjimor. njohja e modelit mjaft mirë. Krijimi i sistemeve artificiale njohja e modelit mbetet komplekse teorike dhe problem teknik. Nevoja për një njohje të tillë lind në një sërë fushash - nga çështjet ushtarake dhe sistemet e sigurisë deri te dixhitalizimi i të gjitha llojeve të sinjaleve analoge.

Tradicionalisht, detyrat e njohjes së modeleve përfshihen në gamën e detyrave të inteligjencës artificiale.

Udhëzime në njohjen e modelit

Mund të dallohen dy drejtime kryesore:

  • Studimi i aftësive njohëse që zotërojnë qeniet e gjalla, shpjegimi dhe modelimi i tyre;
  • Zhvillimi i teorisë dhe metodave për ndërtimin e pajisjeve të dizajnuara për të zgjidhur problemet individuale në aplikacionet e aplikuara.

Deklarata zyrtare e problemit

Njohja e modelit është caktimi i të dhënave burimore në një klasë të caktuar duke identifikuar veçori të rëndësishme që karakterizojnë këto të dhëna nga masa totale e të dhënave të parëndësishme.

Gjatë vendosjes së problemeve të njohjes, ata përpiqen të përdorin gjuhën matematikore, duke u përpjekur, ndryshe nga teoria e rrjeteve nervore artificiale, ku baza është marrja e një rezultati përmes eksperimentit, të zëvendësojnë eksperimentin me arsyetimin logjik dhe provën matematikore.

Imazhet pikturë njëngjyrëshe konsiderohen më shpesh në problemet e njohjes së modelit, gjë që bën të mundur që imazhi të konsiderohet si një funksion në një aeroplan. Nëse marrim parasysh një pikë të vendosur në rrafsh T, ku funksioni x(x,y) shpreh karakteristikat e tij në secilën pikë të figurës - shkëlqimin, transparencën, densitetin optik, atëherë një funksion i tillë është një regjistrim zyrtar i imazhit.

Kompleti i të gjitha funksioneve të mundshme x(x,y) në aeroplan T- ekziston një model i grupit të të gjitha imazheve X. Prezantimi i konceptit ngjashmëritë midis imazheve mund të bëni një detyrë njohjeje. Lloji specifik i një deklarate të tillë varet fuqishëm nga fazat pasuese të njohjes në përputhje me një ose një qasje tjetër.

Metodat e njohjes së modeleve

Për njohjen optike të modelit, mund të përdorni metodën e numërimit të pamjes së një objekti në kënde të ndryshme, shkallë, zhvendosje, etj. Për shkronjat, duhet të numëroni fontin, vetitë e fontit, etj.

Qasja e dytë është gjetja e skicës së objektit dhe ekzaminimi i vetive të tij (lidhja, prania e qosheve, etj.)

Një qasje tjetër është përdorimi i rrjeteve nervore artificiale. Kjo metodë kërkon ose një numër të madh shembujsh të detyrës së njohjes (me përgjigje të sakta), ose një strukturë të veçantë të rrjetit nervor që merr parasysh specifikat e kësaj detyre.

Perceptroni si një metodë e njohjes së modelit

F. Rosenblatt, duke prezantuar konceptin e një modeli të trurit, detyra e të cilit është të tregojë se si në një sistem fizik, struktura dhe vetitë funksionale të të cilit janë të njohura, mund të lindin fenomene psikologjike - ai përshkroi më të thjeshtën. eksperimentet e diskriminimit. Këto eksperimente janë tërësisht të lidhura me metodat e njohjes së modelit, por ndryshojnë në atë që algoritmi i zgjidhjes nuk është determinist.

Eksperimenti më i thjeshtë nga i cili mund të merret informacion psikologjikisht domethënës për një sistem të caktuar zbret në faktin se modeli paraqitet me dy stimuj të ndryshëm dhe kërkohet t'u përgjigjet atyre në mënyra të ndryshme. Qëllimi i një eksperimenti të tillë mund të jetë të studiojë mundësinë e diskriminimit të tyre spontan nga sistemi në mungesë të ndërhyrjes nga ana e eksperimentuesit, ose, anasjelltas, të studiojë diskriminimin e detyruar, në të cilin eksperimentuesi kërkon të trajnojë sistemin për të kryejnë klasifikimin e kërkuar.

Në një eksperiment me trajnimin e perceptronit, zakonisht paraqitet një sekuencë e caktuar imazhesh, e cila përfshin përfaqësues të secilës prej klasave që duhen dalluar. Sipas disa rregullave të modifikimit të kujtesës, zgjedhja e saktë e përgjigjes përforcohet. Perceptroni më pas paraqitet me një stimul kontrolli dhe përcaktohet probabiliteti i marrjes së përgjigjes së saktë për stimujt e një klase të caktuar. Në varësi të faktit nëse stimuli i zgjedhur i kontrollit përkon ose nuk përkon me një nga imazhet që janë përdorur në sekuencën e trajnimit, merren rezultate të ndryshme:

  • 1. Nëse stimuli i kontrollit nuk përkon me ndonjë nga stimujt e stërvitjes, atëherë eksperimenti shoqërohet jo vetëm me diskriminim i pastër, por përfshin edhe elemente përgjithësime.
  • 2. Nëse një stimul kontrolli eksiton një grup të caktuar elementesh shqisore krejtësisht të ndryshme nga ato elemente që janë aktivizuar nën ndikimin e stimujve të paraqitur më parë të së njëjtës klasë, atëherë eksperimenti është një studim. përgjithësim i pastër .

Perceptronet nuk kanë aftësinë për përgjithësim të pastër, por ato funksionojnë mjaft të kënaqshme në eksperimentet e diskriminimit, veçanërisht nëse stimuli i kontrollit përputhet mjaftueshëm me një nga imazhet me të cilat perceptroni tashmë ka grumbulluar njëfarë përvoje.

Shembuj të problemeve të njohjes së modelit

  • Njohja e shkronjave.
  • Njohja e barkodit.
  • Njohja e targave.
  • Njohja e fytyrës.
  • Njohja e të folurit.
  • Njohja e imazhit.
  • Njohja e zonave lokale të kores së tokës në të cilat ndodhen depozitat minerale.

Programet e njohjes së modeleve

Shihni gjithashtu

Shënime

Lidhjet

  • Yuri Lifshits. Lënda "Problemet moderne të shkencës teorike kompjuterike" - leksione mbi metodat statistikore njohja e imazhit, njohja e fytyrës, klasifikimi i tekstit
  • Journal of Pattern Recognition Research

Letërsia

  • David A. Forsythe, Jean Pons Vizioni kompjuterik. Qasje moderne= Vizioni kompjuterik: Një qasje moderne. - M.: "Williams", 2004. - F. 928. - ISBN 0-13-085198-1
  • George Stockman, Linda Shapiro Vizioni kompjuterik = Vizioni kompjuterik. - M.: Binom. Laboratori i njohurive, 2006. - F. 752. - ISBN 5947743841

Fondacioni Wikimedia.

2010. - shkencërisht në teknologji drejtim teknik të lidhura me zhvillimin e metodave dhe ndërtimin e sistemeve (përfshirë ato të bazuara në kompjuter) për të vërtetuar përkatësinë e një objekti të caktuar (objekt, proces, fenomen, situatë, sinjal) në një nga përparimet... ...

Fjalori i madh enciklopedik Një nga rajonet e reja kibernetikë. Përmbajtja e teorisë së R. o. është ekstrapolimi i vetive të objekteve (imazheve) që u përkasin disa klasave objekteve që janë afër tyre në njëfarë kuptimi. Zakonisht, kur stërvitni një automat R. o. ne dispozicion......

Enciklopedia gjeologjike anglisht njohja, imazhi; gjermane Gestalt alterkennung. Një degë e kibernetikës matematikore që zhvillon parime dhe metoda për klasifikimin dhe identifikimin e objekteve të përshkruara nga një grup i kufizuar karakteristikash që i karakterizojnë ato. Antinazi. Enciklopedia......

Enciklopedia e Sociologjisë Njohja e modelit - metoda e studimit të objekteve komplekse duke përdorur një kompjuter; konsiston në zgjedhjen e veçorive dhe zhvillimin e algoritmeve dhe programeve që lejojnë kompjuterët të klasifikojnë automatikisht objektet në bazë të këtyre veçorive. Për shembull, përcaktoni se cila ... ...

Fjalor ekonomik dhe matematikor - drejtim (teknik), shkencor dhe teknik që lidhet me zhvillimin e metodave dhe ndërtimin e sistemeve (përfshirë ato të bazuara në kompjuter) për të vërtetuar përkatësinë e një objekti të caktuar (objekt, proces, fenomen, situatë, sinjal) në një nga përparimet. ... ...

Fjalor Enciklopedik NJOHJA E MOTJEVE - një seksion i kibernetikës matematikore që zhvillon metodat e klasifikimit, si dhe identifikimin e objekteve, fenomeneve, proceseve, sinjaleve, situatave të të gjitha atyre objekteve që mund të përshkruhen nga një grup i kufizuar shenjash ose vetive të caktuara,... ...

Enciklopedia Sociologjike Ruse njohja e modelit

  • - 160 Njohja e modelit: Identifikimi i formave të paraqitjeve dhe konfigurimeve duke përdorur mjete automatike

Tutorial

Prej kohësh kam dashur të shkruaj një artikull të përgjithshëm që përmban bazat e Njohjes së Imazhit, një lloj udhëzuesi mbi metodat bazë, duke treguar se kur duhet t'i përdorim ato, çfarë problemesh zgjidhin, çfarë mund të bëhet në mbrëmje në gjunjë dhe çfarë është më mirë të mos mendosh pa pasur një ekip njerëzish në moshën 20-vjeçare. njerëz të ndryshëm me pyetje për këtë temë. Ndonjëherë ndjen se jeton me ta botë të ndryshme. Nga njëra anë, ju e kuptoni se personi ka shumë të ngjarë të jetë profesionist në një temë të lidhur, por di shumë pak për metodat e njohjes optike. Dhe gjëja më e bezdisshme është se ai po përpiqet të aplikojë një metodë nga një fushë e afërt e njohurive, e cila është logjike, por nuk funksionon plotësisht në Njohjen e Imazhit, por nuk e kupton këtë dhe ofendohet shumë nëse filloni t'i tregoni diçka nga shumë bazat. Dhe duke pasur parasysh që të tregosh nga bazat kërkon shumë kohë, e cila shpesh nuk është e disponueshme, bëhet edhe më e trishtuar.

Ky artikull synon që një person që nuk ka punuar kurrë me metodat e njohjes së imazhit, brenda 10-15 minutash, të krijojë në kokën e tij një pamje të caktuar themelore të botës që korrespondon me temën dhe të kuptojë se në cilin drejtim të gërmojë. Shumë nga teknikat e përshkruara këtu janë të zbatueshme për përpunimin e radarit dhe audios.
Do të filloj me disa parime që ne gjithmonë fillojmë t'i tregojmë një klienti të mundshëm ose një personi që dëshiron të fillojë të bëjë Njohjen Optike:

  • Kur zgjidhni një problem, shkoni gjithmonë nga më e thjeshta. Është shumë më e lehtë të vendosësh një etiketë mbi një person ngjyrë portokalli sesa të ndjekësh një person, duke e nxjerrë në pah në kaskada. Është shumë më e lehtë të marrësh një aparat fotografik me rezolucion më të lartë sesa të zhvillosh një algoritëm super-rezolucion.
  • Një formulim i rreptë i problemit në metodat e njohjes optike është urdhra të përmasave më të rëndësishme sesa në problemet programimi i sistemit: një fjalë shtesë mund të shtojë 50% të punës në specifikimet teknike.
  • Nuk ka zgjidhje universale për problemet e njohjes. Ju nuk mund të bëni një algoritëm që thjesht do të "njohë çdo mbishkrim". Një shenjë në rrugë dhe një fletë teksti janë thelbësore objekte të ndryshme. Ndoshta mund të bëhet algoritmi i përgjithshëm(një shembull i mirë nga Google), por kjo do të kërkojë shumë punë nga një ekip i madh dhe do të përbëhet nga dhjetëra nënprograme të ndryshme.
  • OpenCV është një bibël që ka shumë metoda dhe mund të zgjidhë 50% të pothuajse çdo problemi, por OpenCV është vetëm një pjesë e vogël e asaj që mund të bëhet në të vërtetë. Në një studim, përfundimet u shkruan: "Problemi nuk mund të zgjidhet duke përdorur metodat OpenCV, prandaj është i pazgjidhshëm." Mundohuni ta shmangni këtë, mos u bëni dembel dhe vlerësoni me maturi detyrën aktuale nga e para çdo herë, pa përdorur shabllone OpenCV.
Është shumë e vështirë të japësh ndonjë këshillë universale, ose të thuash se si të krijosh një lloj strukture rreth së cilës mund të ndërtosh një zgjidhje për problemet arbitrare të vizionit kompjuterik. Qëllimi i këtij artikulli është të strukturojë atë që mund të përdoret. Do të përpiqem ta thyej metodat ekzistuese në tre grupe. Grupi i parë është filtrimi paraprak dhe përgatitja e imazhit. Grupi i dytë është përpunimi logjik i rezultateve të filtrimit. Grupi i tretë janë algoritmet e vendimmarrjes të bazuara në përpunimin logjik. Kufijtë midis grupeve janë shumë arbitrare. Për të zgjidhur një problem, nuk është gjithmonë e nevojshme të përdoren metoda nga të gjitha grupet, ndonjëherë mjaftojnë dy, e ndonjëherë edhe një.

Lista e metodave të dhëna këtu nuk është e plotë. Unë sugjeroj të shtoni në komente metodat kritike, që nuk i kam shkruar dhe i atribuoj 2-3 fjalë shoqëruese secilit.

Pjesa 1. Filtrimi

Në këtë grup vendosa metoda që ju lejojnë të zgjidhni zonat me interes në imazhe pa i analizuar ato. Shumica nga këto metoda zbatohet një lloj transformimi i vetëm në të gjitha pikat e imazhit. Në nivelin e filtrimit, analiza e imazhit nuk kryhet, por pikat që i nënshtrohen filtrimit mund të konsiderohen si zona me karakteristika të veçanta.
Binarizimi sipas pragut, përzgjedhja e zonës së histogramit
Transformimi më i thjeshtë është binarizimi i imazhit sipas pragut. Për imazhet RGB dhe gri, pragu është vlera e ngjyrës. Takohen probleme ideale, në të cilën një transformim i tillë është i mjaftueshëm. Supozoni se dëshironi të zgjidhni automatikisht objektet në një fletë të bardhë letre:




Zgjedhja e pragut në të cilin ndodh binarizimi përcakton kryesisht vetë procesin e binarizimit. Në këtë rast, imazhi u binarizuar nga ngjyra mesatare. Në mënyrë tipike, binarizimi kryhet duke përdorur një algoritëm që zgjedh në mënyrë adaptive një prag. Një algoritëm i tillë mund të jetë zgjedhja e pritjes ose mënyrës. Ose mund të zgjidhni majën më të madhe në histogram.

Binarizimi mund të sigurojë shumë rezultate interesante kur punoni me histograme, përfshirë në situatën kur ne e konsiderojmë një imazh jo në RGB, por në HSV. Për shembull, ngjyrat e segmentit me interes. Mbi këtë parim, ju mund të ndërtoni një detektor tag dhe një detektor të lëkurës njerëzore.
Filtrim klasik: Fourier, filtër me kalim të ulët, filtër me kalim të lartë
Metodat klasike të filtrimit të radarit dhe përpunimit të sinjalit mund të zbatohen me sukses në një sërë detyrash të Njohjes së Modeleve. Metoda tradicionale në radar, i cili pothuajse kurrë nuk përdoret në formë të pastër në imazhe, është transformimi Fourier (më konkretisht, FFT). Një nga përjashtimet e pakta në të cilat përdoret transformimi Furier njëdimensional është kompresimi i imazhit. Për analizën e imazhit, një transformim njëdimensional zakonisht nuk është i mjaftueshëm, ju duhet të përdorni një transformim dydimensional shumë më intensiv.

Pak njerëz e llogarisin atë zakonisht, është shumë më e shpejtë dhe më e lehtë për të përdorur konvolucionin e zonës së interesit me një filtër të gatshëm, të akorduar për frekuenca të larta (HPF) ose të ulëta (LPF). Kjo metodë, natyrisht, nuk lejon analizën e spektrit, por në detyrë specifike Përpunimi i videos zakonisht nuk kërkon analiza, por rezultate.


Më së shumti shembuj të thjeshtë filtra që theksojnë frekuencat e ulëta (filtri Gaussian) dhe frekuencave të larta(filtri Gabor).
Për çdo pikë imazhi, zgjidhet një dritare dhe shumëzohet me një filtër të së njëjtës madhësi. Rezultati i një konvolucioni të tillë është një vlerë e re pikë. Kur zbatoni filtra me kalim të ulët dhe filtra me kalim të lartë, merren imazhe të llojit të mëposhtëm:



Valët e valëve
Por, çka nëse përdorim disa funksione karakteristike arbitrare për konvolucionin me sinjalin? Atëherë do të quhet "Transformimi i valëve". Ky përkufizim i valëve nuk është i saktë, por tradicionalisht, në shumë ekipe, analiza e valëve është kërkimi i një modeli arbitrar në një imazh duke përdorur konvolucionin me një model të këtij modeli. Ekziston një grup funksionesh klasike të përdorura në analizën e valëve. Këto përfshijnë valëzimin Haar, valëzimin Morlet, valëzimin e kapelave meksikane, etj. Primitivët Haar, për të cilët kishte disa nga artikujt e mi të mëparshëm (,), lidhen me funksione të tilla për hapësirën dy-dimensionale.


Më sipër janë 4 shembuj të valëve klasike. Wavelet 3-dimensionale Haar, valëzimi 2-dimensional Meyer, valëzimi meksikan Hat, valëzimi Daubechies. Një shembull i mirë Përdorimi i një interpretimi të zgjeruar të valëve është problemi i gjetjes së një shkëlqimi verbues në sy, për të cilin valëzimi është vetë shkëlqimi:

Valët klasike zakonisht përdoren për, ose për klasifikimin e tyre (që do të përshkruhet më poshtë).
Korrelacioni
Pas një interpretimi kaq të lirë të valëve nga ana ime, vlen të përmendet korrelacioni aktual që qëndron në themel të tyre. Ky është një mjet i domosdoshëm kur filtroni imazhe. Aplikim klasik- korrelacioni i transmetimit të videos për të gjetur ndërrime ose flukse optike. Detektori më i thjeshtë i zhvendosjes është gjithashtu, në një farë kuptimi, një korrelator i ndryshimit. Aty ku imazhet nuk lidheshin, kishte lëvizje.

Funksionet e filtrimit
Një klasë interesante e filtrave është filtrimi i funksioneve. Këto janë filtra thjesht matematikorë që ju lejojnë të zbuloni të thjeshtë funksioni matematikor në imazh (vijë e drejtë, parabolë, rreth). Ndërtohet një imazh akumulues në të cilin për çdo pikë imazh origjinal vizatohen shumë funksione që e gjenerojnë atë. Transformimi më klasik është transformimi Hough për linjat. Në këtë transformim, për secilën pikë (x;y), vizatohet një grup pikash (a;b) të drejtëzës y=ax+b për të cilat barazia është e vërtetë. Ju merrni foto të bukura:


(plusi i parë është për atë që është i pari që ka gjetur një kapje në foto dhe këtë përkufizim dhe e shpjegon atë, plusi i dytë është për atë që është i pari që thotë atë që tregohet këtu)
Transformimi Hough ju lejon të gjeni çdo funksion të parametrizueshëm. Për shembull rrathët. Ekziston një transformim i modifikuar që ju lejon të kërkoni për ndonjë. Matematikanët janë jashtëzakonisht të dhënë pas këtij transformimi. Por kur përpunoni imazhe, për fat të keq, nuk funksionon gjithmonë. Shpejtësi shumë e ngadaltë e funksionimit, ndjeshmëri shumë e lartë ndaj cilësisë së binarizimit. Edhe në situata ideale, preferoja të mjaftohesha me metoda të tjera.
Një analog i transformimit Hough për vijat e drejta është transformimi i Radonit. Ai llogaritet përmes FFT, i cili jep një fitim të performancës në një situatë ku ka shumë pikë. Përveç kësaj, mund të aplikohet në një imazh jo-binar.
Filtrimi i konturit
Një klasë e veçantë e filtrave është filtrimi i kufirit dhe konturit. Skicat janë shumë të dobishme kur duam të kalojmë nga puna me një imazh në punën me objektet në atë imazh. Kur një objekt është mjaft kompleks, por i dalluar mirë, atëherë shpesh mënyra e vetme të punosh me të është të nxjerrësh në pah konturet e tij. Ekzistojnë një numër algoritmesh që zgjidhin problemin e filtrimit të kontureve:

Më shpesh përdoret Canny, i cili funksionon mirë dhe zbatimi i të cilit është në OpenCV (aty është edhe Sobel, por kërkon konturet më keq).



Filtra të tjerë
Më sipër janë filtra, modifikimet e të cilëve ndihmojnë në zgjidhjen e 80-90% të problemeve. Por përveç tyre, përdoren filtra më të rrallë detyrat lokale. Ka dhjetëra filtra të tillë, nuk do t'i rendis të gjithë. Interesante janë filtrat iterativë (për shembull), si dhe transformimet ridgelet dhe curvlet, të cilat janë një bashkim i filtrimit dhe analizës klasike të valëve në fushën e transformimit të radonit. Transformimi beamlet funksionon bukur në kufirin e transformimit të valëzimit dhe analiza logjike, duke ju lejuar të zgjidhni konturet:

Por këto transformime janë shumë specifike dhe të përshtatura për detyra të rralla.

Pjesa 2. Përpunimi logjik i rezultateve të filtrimit

Filtrimi siguron një grup të dhënash të përshtatshme për përpunim. Por shpesh nuk mund t'i marrësh dhe t'i përdorësh këto të dhëna pa i përpunuar ato. Do të ketë disa në këtë seksion metodat klasike, duke ju lejuar të lëvizni nga imazhi te vetitë e objekteve ose te vetë objektet.
Morfologjia
Kalimi nga filtrimi në logjikë, për mendimin tim, është metoda morfologjia matematikore( , ). Në thelb, këto janë operacionet më të thjeshta të rritjes dhe gërryerjes së imazheve binare. Këto metoda ju lejojnë të hiqni zhurmën nga një imazh binar duke rritur ose ulur elementët ekzistues. Ekzistojnë algoritme konturuese të bazuara në morfologjinë matematikore, por zakonisht përdoren disa lloj algoritmesh hibride ose algoritme në kombinim.
Analiza e konturit
Algoritmet për marrjen e kufijve janë përmendur tashmë në seksionin mbi filtrimin. Kufijtë që rezultojnë shndërrohen thjesht në konture. Për algoritmin Canny kjo ndodh automatikisht për algoritme të tjera kërkohet binarizimi shtesë. Ju mund të merrni një kontur për një algoritëm binar, për shembull, duke përdorur algoritmin e brumbullit.
Një skicë është një karakteristikë unike e një objekti. Kjo shpesh ju lejon të identifikoni një objekt nga skica e tij. Ekziston një aparat i fuqishëm matematikor që ju lejon ta bëni këtë. Pajisja quhet analiza e konturit (,).

Për të qenë i sinqertë, kurrë nuk kam qenë në gjendje të aplikoj analizën e konturit probleme reale. Kërkohen kushte shumë ideale. Ose nuk ka kufi, ose ka shumë zhurmë. Por, nëse keni nevojë të njihni diçka në kushte ideale, atëherë analiza e konturit është një opsion i shkëlqyeshëm. Punon shumë shpejt, matematikë e bukur dhe logjikë e qartë.
Pika të veçanta
Pikat singulare janë karakteristika unike të një objekti që lejojnë që objekti të krahasohet me vetveten ose me klasa të ngjashme objektesh. Ka disa dhjetëra mënyra për të identifikuar pika të tilla. Disa metoda theksojnë pika njëjës në korniza ngjitur, disa përmes hendek i madh koha dhe kur ndryshon ndriçimi, disa ju lejojnë të gjeni pika të veçanta që mbeten të tilla edhe kur objekti rrotullohet. Le të fillojmë me metoda që na lejojnë të gjejmë pika të veçanta, të cilat nuk janë aq të qëndrueshme, por llogariten shpejt, dhe më pas do të shkojmë në kompleksitet në rritje:
Klasa e parë. Pika të veçanta që janë të qëndrueshme për një periudhë sekondash. Pika të tilla përdoren për të drejtuar një objekt midis kornizave ngjitur të videos ose për të kombinuar imazhe nga kamerat fqinje. Pika të tilla përfshijnë maksimumin lokal të imazhit, qoshet në imazh (më i miri nga detektorët është, ndoshta, detektori Charis), pikat në të cilat arrihet shpërndarja maksimale, gradientë të caktuar, etj.
Klasa e dytë. Pika të veçanta që janë të qëndrueshme kur ndriçimi ndryshon dhe lëvizjet e vogla të objektit. Pika të tilla shërbejnë kryesisht për trajnimin dhe klasifikimin pasues të llojeve të objekteve. Për shembull, një klasifikues i këmbësorëve ose një klasifikues i fytyrës është produkt i një sistemi të ndërtuar pikërisht në pika të tilla. Disa nga valët e përmendura më parë mund të jenë baza për pika të tilla. Për shembull, Haar primitives, kërkimi për pikat kryesore, kërkimi për funksione të tjera specifike. Këto pika përfshijnë ato të gjetura me metodën e histogramit të gradientëve të drejtimit (HOG).
Klasa e tretë. Pika të qëndrueshme. Unë di vetëm për dy metoda që ofrojnë stabilitet të plotë dhe për modifikimet e tyre. Kjo dhe. Ato ju lejojnë të gjeni pika të veçanta edhe kur rrotulloni imazhin. Llogaritja e pikave të tilla zgjat më shumë në krahasim me metodat e tjera, por është e mjaftueshme kohë të kufizuar. Fatkeqësisht, këto metoda janë të patentuara. Edhe pse, në Rusi është e pamundur të patentohen algoritmet, prandaj përdorni atë për tregun e brendshëm.

Pjesa 3. Trajnimi

Pjesa e tretë e tregimit do t'i kushtohet metodave që nuk funksionojnë drejtpërdrejt me imazhin, por që ju lejojnë të merrni vendime. Në thelb është metoda të ndryshme mësimi i makinës dhe vendimmarrje. Kohët e fundit Yandyx postoi në Habr për këtë temë, është shumë përzgjedhje e mirë. Këtu është në versionin tekst. Për një studim serioz të temës, unë rekomandoj shumë t'i shikoni ato. Këtu do të përpiqem të përshkruaj disa metoda kryesore të përdorura posaçërisht në njohjen e modeleve.
Në 80% të situatave, thelbi i të mësuarit në detyrën e njohjes është si më poshtë:
Ekziston një mostër provë që përmban disa klasa objektesh. Le të jetë prania/mungesa e një personi në foto. Për çdo imazh ka një grup karakteristikash që janë theksuar nga ndonjë veçori, qoftë Haar, HOG, SURF ose ndonjë valë valësh. Algoritmi i të mësuarit duhet të ndërtojë një model në mënyrë që të mund të analizojë një imazh të ri dhe të vendosë se cili objekt është në imazh.
Si bëhet kjo? Secila prej imazheve të testimit është një pikë në hapësirën e veçorive. Koordinatat e tij janë pesha e secilës prej veçorive në imazh. Shenjat tona le të jenë: “Prania e syve”, “Prania e një hunde”, “Prania e dy duarve”, “Prania e veshëve” etj... Të gjitha këto shenja do t’i theksojmë duke përdorur detektorët tanë ekzistues, të cilët janë trajnuar mbi pjesë të trupit të ngjashme me ato të njeriut Për një person në një hapësirë ​​të tillë, pika e saktë do të ishte . Për majmunin, pikë për kalin. Klasifikuesi trajnohet duke përdorur një mostër shembujsh. Por jo të gjitha fotografitë tregonin duar, të tjerat nuk kishin sy, dhe në të tretën, majmuni kishte një hundë njeriu për shkak të një gabimi klasifikues. Një klasifikues i trajnuar njerëzor ndan automatikisht hapësirën e veçorive në atë mënyrë që të thotë: nëse tipari i parë shtrihet në intervalin 0.5 Në thelb, qëllimi i klasifikuesit është të vizatojë zonat në hapësirën e veçorive që janë karakteristike për objektet e klasifikimit. Kështu do të duket një përafrim vijues i përgjigjes për një nga klasifikuesit (AdaBoost) në hapësirën dy-dimensionale:


Ka shumë klasifikues. Secila prej tyre funksionon më mirë në një detyrë të veçantë. Detyra e zgjedhjes së një klasifikuesi për një detyrë specifike është kryesisht një art. Këtu janë disa foto të bukura mbi këtë temë.
Rast i thjeshtë, ndarje njëdimensionale
Le të shohim një shembull të rastit më të thjeshtë të klasifikimit, kur hapësira e veçorive është njëdimensionale dhe duhet të ndajmë 2 klasa. Situata ndodh më shpesh sesa mund të mendoni: për shembull, kur duhet të dalloni dy sinjale, ose të krahasoni një model me një mostër. Le të kemi një mostër trajnimi. Kjo prodhon një imazh ku boshti X është masa e ngjashmërisë, dhe boshti Y është numri i ngjarjeve me një masë të tillë. Kur objekti i dëshiruar është i ngjashëm me vetveten, fitohet një Gaussian i majtë. Kur nuk duket si ajo - e duhura. Vlera e X=0.4 i ndan mostrat në mënyrë që një vendim i gabuar të minimizojë mundësinë e marrjes së ndonjë vendimi të gabuar. Kërkimi për një ndarës të tillë është detyrë e klasifikimit.


Një shënim i vogël. Kriteri që minimizon gabimin nuk do të jetë gjithmonë optimal. Grafiku i mëposhtëm është një grafik i një sistemi të vërtetë të njohjes së irisit. Për një sistem të tillë, zgjidhet kriteri për të minimizuar probabilitetin e pranimit të rremë të një personi të paautorizuar në objekt. Ky probabilitet quhet "gabim i tipit I", "probabilitet i alarmit të rremë", "pozitiv i rremë". Në literaturën në gjuhën angleze “False Access Rate”.
) AdaBusta është një nga klasifikuesit më të zakonshëm. Për shembull, kaskada Haar është ndërtuar mbi të. Zakonisht përdoret kur nevojitet klasifikimi binar, por asgjë nuk e pengon trajnimin për një numër më të madh klasash.
SVM ( , , , ) Një nga klasifikuesit më të fuqishëm, i cili ka shumë zbatime. Në thelb, në detyrat e të mësuarit që kam hasur, funksionoi në mënyrë të ngjashme me Adabusta. Konsiderohet mjaft i shpejtë, por trajnimi i tij është më i vështirë se ai i Adabusta dhe kërkon zgjedhjen e bërthamës së duhur.

Ekzistojnë gjithashtu rrjete nervore dhe regresion. Por për t'i klasifikuar shkurtimisht dhe për të treguar se si ndryshojnë, na duhet një artikull shumë më i gjatë se ky.
________________________________________________
Shpresoj se kam qenë në gjendje të jap një pasqyrë të shpejtë të metodave të përdorura pa u zhytur në matematikë dhe përshkrim. Ndoshta kjo do të ndihmojë dikë. Megjithëse, natyrisht, artikulli është i paplotë dhe nuk ka asnjë fjalë për punën me imazhe stereo, as për LSM me një filtër Kalman, as për qasjen adaptive Bayes.
Nëse ju pëlqen artikulli, do të përpiqem të bëj një pjesë të dytë me një përzgjedhje shembujsh se si zgjidhen problemet ekzistuese të Njohjes së Imazhit.

Dhe së fundi

Çfarë duhet lexuar?
1) Dikur më pëlqeu shumë libri "Përpunimi i imazhit dixhital" nga B. Yane, i cili është shkruar thjesht dhe qartë, por në të njëjtën kohë jepet pothuajse e gjithë matematika. Mirë për t'u njohur me metodat ekzistuese.
2) Një klasik i zhanrit është R. Gonzalez, R. Woods “Digital Image Processing”. Për disa arsye ishte më e vështirë për mua se e para. Shumë më pak matematikë, por më shumë metoda dhe fotografi.
3) "Përpunimi dhe analiza e imazhit në problemet e shikimit kompjuterik" - shkruar në bazë të një kursi të dhënë në një nga departamentet e Fizikës dhe Teknologjisë. Ka shumë metoda dhe përshkrime të hollësishme të tyre. Por për mendimin tim, libri ka dy disavantazhe të mëdha: libri është i fokusuar fort në paketën softuerike që vjen me të në libër, shumë shpesh përshkrimi i një metode të thjeshtë kthehet në një xhungël matematikore, nga e cila është e vështirë; nxjerrin diagramin strukturor të metodës. Por autorët kanë krijuar një faqe interneti të përshtatshme ku është paraqitur pothuajse e gjithë përmbajtja - wiki.technicalvision.ru Shtoni etiketa

Ju pëlqeu artikulli? Ndani me miqtë tuaj!