Pengenalan pola dilakukan berdasarkan proses. “Pengendalian adaptif sistem yang kompleks berdasarkan teori pengenalan pola

Metode kekerasan. Dalam metode ini, perbandingan dilakukan dengan database tertentu, di mana untuk setiap objek disajikan pilihan berbeda untuk memodifikasi tampilan. Misalnya untuk pengenalan pola optik, Anda dapat menggunakan metode brute force. sudut yang berbeda atau skala, offset, deformasi, dll. Untuk huruf, Anda dapat mengubah font atau propertinya. Dalam hal pengenalan pola bunyi, dilakukan perbandingan dengan beberapa pola yang diketahui (sebuah kata yang diucapkan oleh banyak orang). Lebih-lebih lagi analisis mendalam karakteristik gambar. Dalam kasus pengenalan optik, ini mungkin merupakan penentuan karakteristik geometris. Dalam hal ini, sampel suara dilakukan analisis frekuensi dan amplitudo.

Metode selanjutnya - penggunaan jaringan syaraf tiruan(IN). Hal ini memerlukan sejumlah besar contoh tugas pengenalan, atau struktur jaringan saraf khusus yang mempertimbangkan secara spesifik tugas yang diberikan. Namun, metode ini sangat efisien dan produktif.

Metode berdasarkan estimasi kepadatan distribusi nilai fitur. Dipinjam dari teori klasik keputusan statistik, dimana objek kajiannya dianggap sebagai implementasi multidimensi variabel acak, didistribusikan di ruang fitur menurut hukum tertentu. Hal ini didasarkan pada kerangka pengambilan keputusan Bayesian yang menarik probabilitas awal milik objek ke kelas tertentu dan kepadatan distribusi fitur bersyarat.

Sekelompok metode yang didasarkan pada estimasi kepadatan distribusi nilai fitur berhubungan langsung dengan metode analisis diskriminan. Pendekatan Bayesian dalam pengambilan keputusan adalah salah satu yang paling berkembang di dunia statistik modern metode parametrik yang dianggap diketahui ekspresi analitis hukum distribusi ( hukum biasa) dan Anda hanya perlu memperkirakan jumlah kecil parameter (vektor nilai rata-rata dan matriks kovarians). Kesulitan utama dalam menggunakan metode ini adalah kebutuhan untuk mengingat seluruh sampel pelatihan untuk menghitung perkiraan kepadatan dan sensitivitas yang tinggi terhadap sampel pelatihan.

Metode berdasarkan asumsi tentang kelas fungsi keputusan. Dalam kelompok ini, jenis fungsi keputusan dianggap diketahui dan fungsi kualitasnya ditentukan. Berdasarkan fungsi ini, perkiraan optimal terhadap fungsi keputusan ditemukan dengan menggunakan urutan pelatihan. Fungsionalitas berkualitas aturan yang menentukan biasanya dikaitkan dengan kesalahan. Keuntungan utama metode ini adalah kejelasan rumusan matematis dari masalah pengenalan. Kemungkinan mengekstraksi pengetahuan baru tentang sifat suatu objek, khususnya pengetahuan tentang mekanisme interaksi atribut, di sini pada dasarnya dibatasi oleh struktur interaksi tertentu, yang ditetapkan dalam bentuk fungsi keputusan yang dipilih.

Metode perbandingan dengan prototipe. Ini adalah metode pengenalan ekstensional yang paling mudah dalam praktiknya. Digunakan ketika kelas yang dikenali ditampilkan sebagai kelas geometri kompak. Kemudian pusat pengelompokan geometri (atau objek yang paling dekat dengan pusat) dipilih sebagai titik prototipe.

Untuk mengklasifikasikan objek yang tidak terdefinisi, prototipe terdekat ditemukan dan objek tersebut termasuk dalam kelas yang sama dengannya. Jelasnya, tidak ada gambaran umum yang terbentuk dalam metode ini. Sebagai ukuran, mereka bisa digunakan berbagai jenis jarak

Metode k-tetangga terdekat. Metode ini terdiri dari fakta bahwa ketika mengklasifikasikan objek yang tidak diketahui, ditemukan sejumlah (k) fitur terdekat secara geometris dalam ruang tetangga terdekat lainnya yang sudah diketahui keanggotaannya dalam kelas mana pun. Keputusan untuk mengklasifikasikan objek yang tidak diketahui dibuat dengan menganalisis informasi tentang tetangga terdekatnya. Kebutuhan untuk mengurangi jumlah objek dalam sampel pelatihan (preseden diagnostik) merupakan kelemahan metode ini, karena hal ini mengurangi keterwakilan sampel pelatihan.

Berdasarkan fakta bahwa algoritma pengenalan yang berbeda memanifestasikan dirinya secara berbeda pada sampel yang sama, muncul pertanyaan tentang sintetis aturan yang menentukan, yang akan digunakan kekuatan semua algoritma. Untuk tujuan ini, ada metode sintetik atau kelompok aturan pengambilan keputusan yang menggabungkan secara maksimal aspek positif masing-masing metode.

Untuk menyimpulkan tinjauan metode pengenalan, kami akan menyajikan intisari di atas dalam tabel ringkasan, menambahkan juga beberapa metode lain yang digunakan dalam praktik.

Tabel 1. Tabel klasifikasi metode pengenalan, perbandingan bidang penerapan dan keterbatasannya

Klasifikasi metode pengenalan

Lingkup aplikasi

Keterbatasan (kekurangan)

Metode pengenalan intensif

Metode berdasarkan perkiraan kepadatan

Masalah dengan distribusi yang diketahui (normal), kebutuhan untuk mengumpulkan statistik yang besar

Kebutuhan untuk menghitung seluruh sampel pelatihan selama pengenalan, sensitivitas tinggi terhadap non-representatif sampel pelatihan dan artefak

Metode Berbasis Asumsi

Kelas harus dapat dipisahkan dengan baik

Jenis fungsi keputusan harus diketahui terlebih dahulu. Ketidakmampuan untuk memperhitungkan pengetahuan baru tentang korelasi antar sifat

Metode Boolean

Masalah kecil

Ketika memilih aturan keputusan yang logis, pencarian yang mendalam diperlukan. Intensitas tenaga kerja yang tinggi

Metode linguistik

Tugas menentukan tata bahasa dari sekumpulan pernyataan (deskripsi objek) tertentu sulit untuk diformalkan. Masalah teoretis yang belum terpecahkan

Metode pengenalan ekstensional

Metode perbandingan dengan prototipe

Masalah dimensi ruang fitur yang kecil

Ketergantungan hasil klasifikasi yang tinggi pada metrik. Metrik optimal tidak diketahui

k metode tetangga terdekat

Ketergantungan hasil klasifikasi yang tinggi pada metrik. Perlunya pencacahan lengkap sampel pelatihan selama pengenalan. Upaya komputasi

Algoritma untuk menghitung perkiraan (ABO)

Masalah berdimensi kecil dari segi jumlah kelas dan fitur

Ketergantungan hasil klasifikasi pada metrik. Perlunya pencacahan lengkap sampel pelatihan selama pengenalan. Kompleksitas teknis yang tinggi dari metode ini

Decision Rule Collectives (DRCs) adalah metode sintetik.

Masalah berdimensi kecil dari segi jumlah kelas dan fitur

Kompleksitas teknis metode yang sangat tinggi, banyaknya permasalahan teoritis yang belum terpecahkan, baik dalam menentukan bidang kompetensi metode privat maupun dalam metode privat itu sendiri

Dan tanda-tanda. Masalah seperti itu cukup sering teratasi, misalnya saat menyeberang atau melewati jalan mengikuti lampu lalu lintas. Mengenali warna lampu lalu lintas yang menyala dan mengetahui aturannya lalu lintas memungkinkan Anda untuk menerima keputusan yang tepat tentang apakah mungkin atau tidak untuk menyeberang jalan saat ini.

Dalam proses evolusi biologis, banyak hewan memecahkan masalah dengan bantuan alat penglihatan dan pendengarannya. pengenalan pola cukup baik. Penciptaan sistem buatan pengenalan pola tetap kompleks secara teoritis dan masalah teknis. Kebutuhan akan pengakuan semacam itu muncul di berbagai bidang - mulai dari urusan militer dan sistem keamanan hingga digitalisasi semua jenis sinyal analog.

Secara tradisional, tugas pengenalan pola termasuk dalam rangkaian tugas kecerdasan buatan.

Petunjuk dalam pengenalan pola

Dua arah utama dapat dibedakan:

  • Mempelajari kemampuan pengenalan yang dimiliki makhluk hidup, menjelaskan dan memodelkannya;
  • Pengembangan teori dan metode untuk membangun perangkat yang dirancang untuk memecahkan masalah individu dalam aplikasi terapan.

Pernyataan formal tentang masalah

Pengenalan pola adalah penugasan data awal ke kelas tertentu menggunakan seleksi fitur-fitur penting, mengkarakterisasi data ini dari massa total data yang tidak relevan.

Ketika menetapkan masalah pengenalan, mereka mencoba menggunakan bahasa matematika, mencoba, tidak seperti teori jaringan saraf tiruan, yang dasarnya adalah memperoleh hasil melalui eksperimen, untuk menggantikan eksperimen dengan penalaran logis dan bukti matematis.

Gambar monokrom paling sering dipertimbangkan dalam masalah pengenalan pola, yang memungkinkan untuk mempertimbangkan gambar sebagai fungsi pada bidang. Jika kita mempertimbangkan suatu titik yang ditetapkan pada bidang T, dimana fungsinya X(X,kamu) mengekspresikan karakteristiknya di setiap titik gambar - kecerahan, transparansi, kepadatan optik, maka fungsi tersebut adalah rekaman formal gambar.

Himpunan semua fungsi yang mungkin X(X,kamu) di pesawat T- ada model kumpulan semua gambar X. Memperkenalkan konsepnya kesamaan di antara gambar Anda dapat mengajukan tugas pengenalan. Jenis spesifik dari pernyataan tersebut sangat bergantung pada tahap pengenalan selanjutnya sesuai dengan pendekatan tertentu.

Metode pengenalan pola

Untuk pengenalan pola optik, Anda dapat menggunakan metode enumerasi jenis objek di bawah ini sudut yang berbeda, skala, offset, dll. Untuk huruf, Anda perlu mengurutkan font, properti font, dll.

Pendekatan kedua adalah mencari garis besar suatu benda dan memeriksa sifat-sifatnya (konektivitas, keberadaan sudut, dll.)

Pendekatan lain adalah dengan menggunakan jaringan saraf tiruan. Metode ini memerlukan keduanya jumlah besar contoh tugas pengenalan (dengan jawaban yang benar), atau struktur jaringan saraf khusus yang mempertimbangkan kekhususan tugas ini.

Perceptron sebagai metode pengenalan pola

F. Rosenblatt, memperkenalkan konsep model otak, yang tugasnya adalah menunjukkan bagaimana dalam beberapa sistem fisik, yang struktur dan sifat fungsionalnya diketahui, fenomena psikologis dapat muncul - ia menggambarkan yang paling sederhana eksperimen diskriminasi. Eksperimen ini sepenuhnya terkait dengan metode pengenalan pola, namun berbeda karena algoritma solusinya tidak deterministik.

Eksperimen paling sederhana yang dapat Anda peroleh secara psikologis informasi yang berarti tentang suatu sistem, intinya adalah bahwa model tersebut disajikan dengan dua rangsangan yang berbeda dan diharuskan untuk meresponsnya dengan cara yang berbeda. Tujuan dari percobaan tersebut mungkin untuk mempelajari kemungkinan diskriminasi spontan oleh sistem tanpa adanya intervensi dari pihak pelaku eksperimen, atau, sebaliknya, untuk mempelajari diskriminasi yang dipaksakan, di mana pelaku eksperimen berusaha untuk melatih sistem untuk melakukan hal tersebut. melakukan klasifikasi yang diperlukan.

Dalam percobaan pelatihan perceptron, biasanya disajikan urutan gambar tertentu, yang mencakup perwakilan dari masing-masing kelas yang akan dibedakan. Menurut beberapa aturan modifikasi memori pilihan yang tepat reaksi diperkuat. Perceptron kemudian disajikan dengan stimulus kontrol dan kemungkinan memperoleh respons yang benar untuk rangsangan tersebut ditentukan dari kelas ini. Bergantung pada apakah stimulus kontrol yang dipilih cocok atau tidak dengan salah satu gambar yang digunakan dalam urutan pelatihan, hasil yang berbeda diperoleh:

  • 1. Jika stimulus kontrol tidak sesuai dengan salah satu stimulus pelatihan, maka eksperimen tidak hanya dikaitkan dengan diskriminasi murni, tetapi juga mencakup elemen generalisasi.
  • 2. Jika suatu stimulus kontrol menggairahkan sekumpulan elemen sensorik tertentu yang sama sekali berbeda dari elemen-elemen yang diaktifkan di bawah pengaruh rangsangan yang diberikan sebelumnya dari kelas yang sama, maka eksperimen tersebut adalah suatu penelitian. generalisasi murni .

Perceptron tidak mempunyai kapasitas untuk melakukan generalisasi murni, namun berfungsi cukup memuaskan dalam eksperimen diskriminasi, terutama jika stimulus kontrol cukup cocok dengan salah satu gambar yang telah diperoleh pengalaman oleh perceptron.

Contoh soal pengenalan pola

  • Pengenalan surat.
  • Pengenalan kode batang.
  • Pengenalan plat nomor.
  • Pengenalan wajah.
  • Pengenalan ucapan.
  • Pengenalan gambar.
  • Pengakuan wilayah lokal kerak bumi di mana terdapat endapan mineral.

Program pengenalan pola

Lihat juga

Catatan

Tautan

  • Yuri Lifshit. Kursus “Masalah modern ilmu komputer teoretis” - kuliah tentang metode statistik pengenalan pola, pengenalan wajah, klasifikasi teks
  • Jurnal Penelitian Pengenalan Pola

Literatur

  • David A. Forsythe, Jean Pons Visi komputer. Pendekatan modern = Visi Komputer: Pendekatan Modern. - M.: "Williams", 2004. - Hal. 928. - ISBN 0-13-085198-1
  • George Stockman, Linda Shapiro Visi komputer = Visi Komputer. - M.: Binom. Laboratorium Pengetahuan, 2006. - P. 752. - ISBN 5947743841
  • A.L.Gorelik, V.A.Skripkin, Metode pengenalan, M.: sekolah pascasarjana, 1989.
  • Sh.-K. Cheng, Prinsip perancangan sistem informasi visual, M.: Mir, 1994.

Yayasan Wikimedia.

2010. - dalam teknologi, arah ilmiah dan teknis yang terkait dengan pengembangan metode dan konstruksi sistem (termasuk berbasis komputer) untuk menetapkan kepemilikan suatu objek tertentu (objek, proses, fenomena, situasi, sinyal) ke salah satu kemajuan ... ...

Kamus Ensiklopedis Besar Salah satu daerah baru sibernetika. Isi teori R. o. adalah ekstrapolasi sifat-sifat objek (gambar) yang termasuk dalam beberapa kelas ke objek-objek yang dekat dengannya dalam arti tertentu. Biasanya, saat melatih robot R.o. tersedia... ...

Ensiklopedia Geologi Bahasa inggris pengakuan, gambar; Jerman Gestalt alternatif. Cabang sibernetika matematika yang mengembangkan prinsip dan metode untuk mengklasifikasikan dan mengidentifikasi objek yang dijelaskan oleh serangkaian fitur terbatas yang menjadi ciri objek tersebut. Antinazi. Ensiklopedia... ...

Ensiklopedia Sosiologi Pengenalan pola - metode mempelajari objek kompleks dengan menggunakan komputer; terdiri dari pemilihan fitur dan pengembangan algoritma dan program yang memungkinkan komputer secara otomatis mengklasifikasikan objek berdasarkan fitur-fitur tersebut. Misalnya, tentukan yang mana... ...

Kamus ekonomi-matematika - (teknis), arahan ilmiah dan teknis yang terkait dengan pengembangan metode dan konstruksi sistem (termasuk yang berbasis komputer) untuk menetapkan kepemilikan suatu objek tertentu (objek, proses, fenomena, situasi, sinyal) ke salah satu kemajuan ... ...

Kamus Ensiklopedis- bagian sibernetika matematika yang mengembangkan metode klasifikasi, serta identifikasi objek, fenomena, proses, sinyal, situasi semua objek yang dapat dijelaskan oleh serangkaian tanda atau properti tertentu yang terbatas,... ... Ensiklopedia Sosiologi Rusia

pengenalan pola- 160 pengenalan pola: Mengidentifikasi bentuk representasi dan konfigurasi menggunakan cara otomatis

Kuliah nomor 17.METODE PENGENALAN POLA

Kelompok metode pengenalan berikut ini dibedakan:

Metode Fungsi Kedekatan

Metode fungsi diskriminan

Metode pengenalan statistik.

Metode linguistik

Metode heuristik.

Tiga kelompok metode pertama difokuskan pada analisis fitur yang dinyatakan sebagai angka atau vektor dengan komponen numerik.

Sekelompok metode linguistik memberikan pengenalan pola berdasarkan analisis strukturnya, dijelaskan oleh fitur struktural yang sesuai dan hubungan di antara mereka.

Kelompok metode heuristik menggabungkan teknik karakteristik dan prosedur logis yang digunakan manusia dalam pengenalan pola.

Metode Fungsi Kedekatan

Metode kelompok ini didasarkan pada penggunaan fungsi yang memperkirakan ukuran kedekatan antara gambar yang dikenali dan vektor X* = (X* 1 ,….,x*n), dan gambar referensi dari berbagai kelas, diwakili oleh vektor x saya = (x saya 1 ,…, x aku n), saya= 1,…,N, Di mana Saya - nomor kelas gambar.

Prosedur pengenalan menurut metode ini terdiri dari penghitungan jarak antara titik gambar yang dikenali dan masing-masing titik yang mewakili gambar referensi, yaitu. dalam menghitung semua nilai d saya , saya= 1,…,N. Gambar milik kelas yang nilainya d saya memiliki kepentingan paling kecil di antara semuanya saya= 1,…,N .

Suatu fungsi yang menetapkan setiap pasangan vektor x saya, X* bilangan real sebagai ukuran kedekatannya, mis. menentukan jarak di antara keduanya bisa sangat sewenang-wenang. Dalam matematika, fungsi seperti ini disebut metrik ruang. Itu harus memenuhi aksioma berikut:

R(x, y)=R(kamu,x);

R(x, y) > 0 jika X tidak sama kamu Dan R(x, y)=0 jika x=kamu;

R(x, y) <=R(x,z)+R(z,y)

Aksioma-aksioma yang terdaftar dipenuhi, khususnya, oleh fungsi-fungsi berikut

sebuah saya= 1/2 , J=1,2,…N.

b saya=jumlah, J=1,2,…N.

c saya=perut maksimal ( x sayax j *), J=1,2,…N.

Yang pertama disebut norma Euclidean ruang vektor. Oleh karena itu, ruang di mana fungsi tertentu digunakan sebagai metrik disebut ruang Euclidean.

Seringkali, perbedaan akar rata-rata kuadrat dalam koordinat gambar yang dikenali dipilih sebagai fungsi kedekatan X* dan standar x saya, yaitu. fungsi

d saya = (1/N) jumlah( x saya jx j *) 2 , J=1,2,…N.

Besarnya d saya secara geometris diartikan sebagai kuadrat jarak antar titik pada fitur ruang, berkaitan dengan dimensi ruang.

Sering kali ternyata ciri-ciri yang berbeda tidak sama pentingnya dalam pengenalan. Untuk memperhitungkan keadaan ini ketika menghitung fungsi kedekatan, perbedaan koordinat yang sesuai dengan fitur yang lebih penting dikalikan dengan koefisien yang lebih besar, dan yang kurang penting - dengan koefisien yang lebih kecil.

Kalau begitu d saya = (1/N) jumlah wj (x saya jx j *) 2 , J=1,2,…N,

Di mana wj– koefisien pembobotan.

Pengenalan koefisien bobot setara dengan menskalakan sumbu ruang fitur dan, karenanya, meregangkan atau memampatkan ruang ke arah tertentu.

Deformasi ruang fitur yang ditunjukkan bertujuan untuk menempatkan titik-titik gambar referensi sedemikian rupa sehingga sesuai dengan pengenalan yang paling andal dalam kondisi penyebaran gambar yang signifikan dari setiap kelas di sekitar titik gambar referensi. .

Kelompok titik-titik gambar yang berdekatan satu sama lain (kelompok gambar) dalam ruang fitur disebut cluster, dan tugas mengidentifikasi kelompok tersebut disebut masalah clustering.

Tugas mengidentifikasi cluster diklasifikasikan sebagai tugas pengenalan pola tanpa pengawasan, yaitu. untuk masalah pengenalan tanpa adanya contoh pengenalan yang benar.

Metode fungsi diskriminan

Ide dari metode kelompok ini adalah untuk membangun fungsi-fungsi yang menentukan batas-batas ruang gambar yang membagi ruang menjadi area-area yang sesuai dengan kelas-kelas gambar. Fungsi yang paling sederhana dan paling sering digunakan dari jenis ini adalah fungsi yang bergantung secara linier pada nilai fitur. Di ruang fitur, mereka berhubungan dengan permukaan pemisah dalam bentuk bidang hiper. Dalam kasus ruang fitur dua dimensi, garis lurus bertindak sebagai fungsi pemisah.

Bentuk umum fungsi keputusan linier diberikan oleh rumus

D(X)=w 1 X 1 + w 2 X 2 +…+wnxn +tidak +1 = Wx+tidak

Di mana X- vektor gambar, w=(w 1 ,w 2 ,…tidak) – vektor koefisien bobot.

Dalam hal pemisahan menjadi dua kelas X 1 dan X 2 fungsi diskriminan D(x) memperbolehkan pengakuan sesuai dengan aturan:

X milik X 1 jika D(X)>0;

X milik X 2 jika D(X)<0.

Jika D(X)=0, maka terdapat kasus ketidakpastian.

Jika terjadi pemisahan menjadi beberapa kelas, beberapa fungsi diperkenalkan. Dalam hal ini, setiap kelas gambar diberi kombinasi tanda fungsi diskriminatif tertentu.

Misalnya, jika tiga fungsi diskriminan diperkenalkan, maka opsi berikut untuk mengidentifikasi kelas gambar dimungkinkan:

X milik X 1 jika D 1 (X)>0,D 2 (X)<0,D 3 (X)<0;

X milik X 2 jika D(X)<0,D 2 (X)>0,D 3 (X)<0;

X milik X 3 jika D(X)<0,D 2 (X)<0,D 3 (X)>0.

Diasumsikan demikian untuk kombinasi nilai lainnya D 1 (X),D 2 (X),D 3 (X) ada kasus ketidakpastian.

Variasi dari metode fungsi diskriminan adalah metode fungsi keputusan. Di dalamnya, jika tersedia M kelas diasumsikan ada M fungsi d saya(X), disebut tegas, sehingga jika X milik X saya, Itu d saya(X) > dj(X) untuk semua orang J tidak setara Saya,itu. fungsi yang menentukan d saya(X) memiliki nilai maksimum di antara semua fungsi dj(X), J=1,...,N..

Ilustrasi metode ini dapat berupa pengklasifikasian berdasarkan estimasi jarak Euclidean minimum pada ruang fitur antara titik citra dan standar. Mari kita tunjukkan.

Jarak euclidean antara vektor fitur dari gambar yang dikenali X dan vektor gambar acuan ditentukan dengan rumus || x sayaX|| = 1/2 , J=1,2,…N.

Vektor X akan ditugaskan ke kelas Saya, yang nilainya || x sayaX*|| minimal.

Alih-alih jarak, Anda dapat membandingkan kuadrat jarak, mis.

||x sayaX|| 2 = (x sayaX)(x sayaX) t = X X- 2X x saya +x saya x saya

Sejak nilainya X X sama untuk semua orang Saya, fungsi minimum || x sayaX|| 2 akan bertepatan dengan fungsi keputusan maksimum

d saya(X) = 2X x saya -x saya x saya.

yaitu X milik X saya, Jika d saya(X) > dj(X) untuk semua orang J tidak setara Saya.

Itu. mesin pengklasifikasi jarak minimum didasarkan pada fungsi keputusan linier. Struktur umum mesin semacam itu menggunakan fungsi-fungsi yang menentukan bentuk

d saya (X)=dengan saya 1 X 1 + dengan saya 2 X 2 +…+w dalam x n +di mana +1

Hal ini dapat direpresentasikan secara visual dengan diagram blok yang sesuai.

Untuk mesin yang melakukan klasifikasi berdasarkan jarak minimum, persamaan berikut berlaku: dengan ij = -2x saya j , di mana +1 = x saya x saya.

Pengakuan ekuivalen dengan metode fungsi diskriminan dapat dilakukan dengan mendefinisikan fungsi diskriminan sebagai perbedaan d ij (X)=d saya (X)‑dj (X).

Keuntungan dari metode fungsi diskriminan adalah struktur mesin pengenalan yang sederhana, serta kemungkinan implementasinya terutama melalui blok keputusan yang didominasi linier.

Keuntungan penting lainnya dari metode fungsi diskriminan adalah kemampuan untuk melatih mesin secara otomatis untuk pengenalan yang benar berdasarkan sampel gambar (pelatihan) yang diberikan.

Pada saat yang sama, algoritma pembelajaran otomatis ternyata sangat sederhana dibandingkan dengan metode pengenalan lainnya.

Karena alasan ini, metode fungsi diskriminan mendapatkan popularitas yang luas dan sangat sering digunakan dalam praktik.

Prosedur pelatihan mandiri untuk pengenalan pola

Mari kita pertimbangkan metode untuk membangun fungsi diskriminan untuk sampel (pelatihan) tertentu sehubungan dengan masalah membagi gambar menjadi dua kelas. Jika diberikan dua himpunan bayangan yang masing-masing termasuk dalam kelas A dan B, maka penyelesaian masalah membangun fungsi diskriminan linier dicari dalam bentuk vektor koefisien pembobotan. W=(w 1 ,w 2 ,...,tidak,tidak+1), yang memiliki properti bahwa kondisi berikut terpenuhi untuk gambar apa pun:

X termasuk kelas A jika >0, J=1,2,…N.

X termasuk dalam kelas B jika<0, J=1,2,…N.

Jika set pelatihan terdiri dari N gambar kedua kelas, tugasnya direduksi menjadi menemukan vektor w yang menjamin validitas sistem pertidaksamaan Jika sampel pelatihan terdiri dari N gambar kedua kelas, tugasnya adalah menemukan vektor w, memastikan validitas sistem ketidaksetaraan

X 1 1 dengan saya+X 21 w 2 +...+xn 1 tidak+tidak +1 >0;

X 1 2 dengan saya+X 22 w 2 +...+xn 2 tidak+tidak +1 <0;

X 1 Sayadengan saya+X 2Saya w 2 +...+x ni w n+tidak +1 >0;

................................................

X 1 Naku +x 2N w 2 +...+x nN w n +w n + 1>0;

Di Sini x saya=(x saya 1 ,x saya 2 ,...,x saya n ,x saya n+ 1 ) - vektor nilai fitur gambar dari sampel pelatihan, tanda > sesuai dengan vektor gambar X, milik kelas A, dan tandanya< - векторам X, milik kelas B.

Vektor yang diperlukan w ada jika kelas A dan B dapat dipisahkan dan tidak ada sebaliknya. Nilai komponen vektor w dapat ditemukan terlebih dahulu, pada tahap sebelum implementasi perangkat keras SRO, atau langsung oleh SRO itu sendiri selama pengoperasiannya. Pendekatan terakhir memberikan fleksibilitas dan otonomi yang lebih besar bagi SRO. Mari kita pertimbangkan menggunakan contoh perangkat yang disebut persenron. ditemukan pada tahun 1957 oleh ilmuwan Amerika Rosenblatt. Representasi skema persenron, yang memastikan bahwa suatu gambar ditetapkan ke salah satu dari dua kelas, disajikan pada gambar berikut.

Retina S Retina A Retina R

oh oh X 1

oh oh X 2

oh oh X 3

o (jumlah)-------> R(reaksi)

oh oh x saya

oh oh xn

oh oh xn +1

Perangkat ini terdiri dari elemen sensorik retina S, yang terhubung secara acak ke elemen asosiatif retina A. Setiap elemen retina kedua menghasilkan sinyal keluaran hanya jika jumlah elemen sensorik yang terhubung ke masukannya mencukupi dalam keadaan tereksitasi. Respon seluruh sistem R sebanding dengan jumlah reaksi unsur-unsur retina asosiatif yang diambil dengan bobot tertentu.

Ditunjuk oleh x saya reaksi Saya elemen asosiatif dan melalui dengan saya- koefisien berat reaksi Saya unsur asosiatif, reaksi sistem dapat dituliskan sebagai R=jumlah( wjxj), J=1,..,N. Jika R>0, maka gambar yang disajikan ke sistem termasuk kelas A, dan jika R<0, то образ относится к классу B. Описание этой процедуры классификации соответствует рассмотренным нами раньше принципам классификации, и, очевидно, перцентронная модель распознавания образов представляет собой, за исключением сенсорной сетчатки, реализацию линейной дискриминантной функции. Принятый в перцентроне принцип формирования значений X 1 , X 2 ,...,xn sesuai dengan beberapa algoritma untuk menghasilkan fitur berdasarkan sinyal dari sensor utama.

Secara umum bisa ada beberapa elemen R, membentuk reaksi perceptron. Dalam hal ini, mereka berbicara tentang keberadaan retina di perceptron R elemen yang bereaksi.

Skema persenron dapat diperluas pada kasus ketika jumlah kelas lebih dari dua, dengan meningkatkan jumlah elemen retina R hingga banyaknya kelas yang dapat dibedakan dan pengenalan blok untuk menentukan reaksi maksimum sesuai dengan diagram yang disajikan pada gambar di atas. Dalam hal ini, gambar ditugaskan ke kelas dengan nomor Saya, Jika R saya>Rj, untuk semua orang J.

Proses pelatihan persenron terdiri dari pemilihan nilai koefisien pembobotan wj sehingga sinyal keluaran sesuai dengan kelas gambar yang dikenali.

Mari kita perhatikan algoritma aksi persenron menggunakan contoh pengenalan objek dari dua kelas: A dan B. Objek kelas A harus memiliki nilai yang sesuai R= +1, dan kelas B - nilainya R= -1.

Algoritma pembelajarannya adalah sebagai berikut.

Jika gambar berikutnya X milik kelas A, tapi R<0 (имеет место ошибка распознавания), тогда коэффициенты wj dengan indeks yang nilainya sesuai xj>0, meningkat sejumlah tertentu dw, dan koefisien sisanya wj dikurangi sebesar dw. Dalam hal ini, nilai reaksinya R menerima peningkatan ke arah itu nilai-nilai positif, sesuai dengan klasifikasi yang benar.

Jika X milik kelas B, tapi R>0 (ada kesalahan pengenalan), lalu koefisiennya wj dengan indeks yang sesuai xj<0, увеличивают на dw, dan koefisien sisanya wj dikurangi dengan jumlah yang sama. Dalam hal ini, nilai reaksinya R menerima kenaikan menuju nilai negatif sesuai dengan klasifikasi yang benar.

Algoritme kemudian membuat perubahan pada vektor bobot w jika dan hanya jika gambar ditampilkan k-langkah pelatihan, salah diklasifikasikan saat melakukan langkah ini, dan meninggalkan vektor bobot w tidak ada perubahan jika diklasifikasikan dengan benar. Bukti konvergensi algoritma ini disajikan dalam [Tu, Gonzalez]. Pelatihan seperti itu pada akhirnya akan (dengan seleksi yang tepat dw dan keterpisahan linier kelas gambar) mengarah ke vektor w, memastikan klasifikasi yang benar.

Metode pengenalan statistik.

Metode statistik didasarkan pada meminimalkan kemungkinan kesalahan klasifikasi. Probabilitas P klasifikasi yang salah dari suatu gambar yang dikirimkan untuk dikenali, dijelaskan oleh vektor fitur X, ditentukan oleh rumus

P = jumlah[ P(Saya)masalah( D(X)+Saya | X kelas Saya)]

Di mana M- jumlah kelas,

P(Saya) = penyelidikan ( X milik kelas Saya) - probabilitas apriori untuk menjadi bagian dari gambar arbitrer X Ke Saya kelas th (frekuensi kemunculan gambar Saya kelas -th),

D(X) - fungsi yang membuat keputusan klasifikasi (vektor fitur X cocok dengan nomor kelas Saya dari himpunan (1,2,..., M}),

masalah( D(X) tidak sama Saya| X milik kelas Saya) - kemungkinan kejadian " D(X) tidak sama Saya" ketika syarat keanggotaan terpenuhi X kelas Saya, yaitu. kemungkinan membuat keputusan yang salah berdasarkan fungsi tersebut D(X) untuk nilai tertentu X, dimiliki Saya kelas -th.

Dapat ditunjukkan bahwa kemungkinan kesalahan klasifikasi mencapai minimum jika D(X)=Saya jika dan hanya jika P(X|SayaP(Saya)>P(x|jP(J), untuk semua orang saya+j, Di mana P(x|saya) - kepadatan distribusi gambar Saya-kelas di ruang fitur.

Menurut aturan di atas, intinya X milik kelas yang sesuai dengan nilai maksimum P(Saya) P(x|saya), yaitu produk dari probabilitas sebelumnya (frekuensi) kemunculan gambar Saya-kelas dan kepadatan distribusi gambar Saya-kelas di ruang fitur. Aturan klasifikasi yang disajikan disebut Bayesian, karena ini mengikuti rumus Bayes yang dikenal dalam teori probabilitas.

Contoh. Misalkan perlu dilakukan pengakuan sinyal diskrit di pintu keluar saluran informasi terkena kebisingan.

Setiap sinyal masukan mewakili 0 atau 1. Sebagai hasil transmisi sinyal, nilai tersebut muncul pada keluaran saluran X, yang ditumpangkan dengan noise Gaussian dengan mean dan varians nol b.

Untuk mensintesis pengklasifikasi yang melakukan pengenalan sinyal, kita akan menggunakan aturan klasifikasi Bayesian.

Kami akan menggabungkan sinyal yang mewakili satu ke dalam kelas No. 1, dan sinyal yang mewakili nol ke dalam kelas No. 2. Perlu diketahui sebelumnya bahwa rata-rata dari setiap 1000 sinyal A sinyal mewakili satuan dan B sinyal - nol. Maka nilai probabilitas apriori munculnya sinyal kelas 1 dan 2 (satu dan nol), masing-masing, dapat diambil sama

p(1)=a/1000, p(2)=b/1000.

Karena kebisingannya Gaussian, mis. mematuhi hukum distribusi normal (Gaussian), maka kepadatan distribusi gambar kelas satu tergantung pada nilainya X, atau, yang sama, probabilitas memperoleh nilai keluaran X ketika sinyal 1 diterapkan pada input, itu ditentukan oleh ekspresi

P(X¦1) =(2pib) -1/2 exp(-( X-1) 2 /(2b 2)),

dan kepadatan distribusi tergantung pada nilainya X gambar kelas kedua, yaitu. kemungkinan memperoleh nilai keluaran X ketika sinyal 0 diterapkan pada input, itu ditentukan oleh ekspresi

P(X¦2)= (2pib) -1/2 exp(- X 2 /(2b 2)),

Penerapan aturan keputusan Bayesian mengarah pada kesimpulan bahwa sinyal kelas 2 telah ditransmisikan, yaitu. null dilewatkan jika

P(2) P(X¦2) > P(1) P(X¦1)

atau, lebih khusus lagi, jika

B pengalaman(- X 2 /(2b 2)) > A pengalaman(-( X-1) 2 /(2b 2)),

Dengan membagi sisi kiri ketidaksetaraan di sebelah kanan, kita dapatkan

(B/A) pengalaman((1-2 X)/(2b 2)) >1,

dimana setelah mengambil logaritma kita temukan

1-2X> 2b 2 ln(a/b)

X< 0.5 - б 2 ln(a/b)

Dari pertidaksamaan yang dihasilkan maka kapan Sebuah=b, yaitu. dengan probabilitas apriori yang sama untuk terjadinya sinyal 0 dan 1, gambar diberi nilai 0 ketika X<0.5, а значение 1, когда X>0.5.

Jika diketahui sebelumnya bahwa salah satu sinyal lebih sering muncul dan sinyal lainnya lebih jarang, yaitu. dalam kasus nilai yang tidak sama A Dan B, ambang respons pengklasifikasi bergeser ke satu arah atau lainnya.

Jadi kapan a/b=2,71 (yang berhubungan dengan transmisi unit 2,71 kali lebih sering) dan b 2 =0,1, gambar diberi nilai 0 jika X<0.4, и значение 1, если X>0,4. Jika informasi tentang probabilitas distribusi sebelumnya tidak tersedia, maka metode statistik pengakuan, yang didasarkan pada aturan klasifikasi selain Bayesian.

Namun, dalam praktiknya, metode yang paling umum adalah metode yang didasarkan pada aturan Bayes karena efisiensinya yang lebih besar, dan juga karena fakta bahwa dalam sebagian besar masalah pengenalan pola, dimungkinkan untuk menetapkan probabilitas sebelumnya tampilan gambar masing-masing kelas.

Metode linguistik pengenalan pola.

Metode linguistik pengenalan pola didasarkan pada analisis deskripsi suatu gambar yang diidealkan, disajikan dalam bentuk grafik atau rangkaian karakter, yaitu frasa atau kalimat dalam bahasa tertentu.

Perhatikan gambaran ideal huruf yang diperoleh sebagai hasil tahap pertama pengenalan linguistik yang dijelaskan di atas. Gambar ideal ini dapat ditentukan dengan deskripsi grafik, yang disajikan, misalnya, dalam bentuk matriks koneksi, seperti yang dilakukan pada contoh yang dibahas di atas. Deskripsi yang sama dapat diwakili oleh frasa tersebut bahasa formal(ekspresi).

Contoh. Misalkan diberikan tiga gambar huruf A, yang diperoleh sebagai hasil pengolahan gambar awal. Mari kita nyatakan gambar-gambar ini dengan pengidentifikasi A1, A2 dan A3.

Untuk mendeskripsikan gambar yang disajikan secara linguistik, kita akan menggunakan PDL (Picture Description Language). Kosakata PDL mencakup simbol-simbol berikut:

1. Nama-nama gambar paling sederhana (primitif). Sebagaimana diterapkan pada kasus yang sedang dipertimbangkan, primitif dan nama terkaitnya adalah sebagai berikut.

Gambar berbentuk garis berarah :

atas dan kiri (le F t), utara (utara), atas dan ke kanan (kanan), timur).

Nama: L, N, R, E.

2. Simbol operasi biner. (+,*,-) Maknanya sesuai dengan hubungan berurutan dari primitif (+), hubungan awal dan akhir dari primitif (*), hubungan hanya akhir dari primitif (-).

3. Tanda kurung kanan dan kiri. ((,)) Tanda kurung memungkinkan Anda menentukan urutan operasi dalam sebuah ekspresi.

Gambar A1, A2 dan A3 yang dipertimbangkan masing-masing dijelaskan dalam bahasa PDL dengan ekspresi berikut.

T(1)=R+((R-(L+N))*EL

T(2)=(R+N)+((N+R)-L)*EL

T(3)=(N+R)+(RL)*E-(L+N)

Setelah deskripsi linguistik dari suatu gambar dibuat, dengan menggunakan beberapa prosedur pengenalan, perlu dilakukan analisis apakah gambar tersebut termasuk dalam kelas yang kita minati (kelas huruf A), yaitu. Apakah gambar ini memiliki struktur tertentu atau tidak. Untuk melakukan ini, pertama-tama, perlu dijelaskan kelas gambar yang memiliki struktur yang menarik minat kita.

Tentunya huruf A selalu memuat unsur struktur sebagai berikut: kaki kiri, kaki kanan, dan kepala. Sebut saja elemen-elemen ini STL, STR, TR.

Kemudian dalam bahasa PDL karakter kelas A – SIMB A digambarkan dengan ekspresi

SIMB A = STL + TR - STR

"Kaki" kiri STL selalu berupa rangkaian elemen R dan N, yang dapat ditulis seperti ini

STL ‑> R ¦ N ¦ (STL + R)¦ (STL + N)

(STL adalah karakter R atau N, atau string yang diperoleh dengan menambahkan karakter R atau N ke string STL sumber)

“Kaki” kanan STR selalu berupa rangkaian elemen L dan N, yang dapat ditulis seperti ini, yaitu.

STR ‑> L¦N¦ (STR + L)¦(STR + N)

Bagian kepala huruf – TR merupakan kontur tertutup yang terdiri dari elemen E dan rantai seperti STL dan STR.

Dalam PDL, struktur TR digambarkan dengan ekspresi

TR ‑> (STL - STR) * E

Akhirnya kita mendapatkan gambaran huruf kelas A sebagai berikut:

SIMB A ‑> (STL + TR - STR),

STL ‑> R¦N¦ (STL + R)¦(STL + N)

STR ‑> L¦N¦ (STR + L)¦(STR + N)

TR ‑> (STL - STR) * E

Tata cara pengakuan dalam hal ini dapat dilaksanakan sebagai berikut.

1. Ekspresi yang sesuai dengan gambar dibandingkan dengan struktur referensi STL + TR - STR.

2. Setiap elemen struktur STL, TR, STR, jika memungkinkan, mis. jika deskripsi gambar sebanding dengan standar, beberapa subekspresi dari ekspresi T(A) cocok. Misalnya,

untuk A1: STL=R, STR=L, TR=(R-(L+N))*E

untuk A2: STL = R + N, STR = L, TR = ((N + R) - L) * E

untuk A3 : STL = N + R, STR = L + N, TR = (R - L) * E 3.

Ekspresi STL, STR, TR dibandingkan dengan struktur referensi yang sesuai.

4. Jika struktur setiap ekspresi STL, STR, TR sesuai dengan standar, maka diambil kesimpulan bahwa gambar tersebut termasuk kelas huruf A. Jika pada salah satu tahap 2, 3, 4 terdapat ketidaksesuaian antara struktur yang dianalisis. ekspresi dan standar terdeteksi, diambil kesimpulan bahwa gambar tersebut bukan milik SIMB kelas A. Perbandingan struktur ekspresi dapat dilakukan dengan menggunakan bahasa algoritmik LISP, PLANER, PROLOG dan bahasa sejenis lainnya kecerdasan buatan.

Dalam contoh yang sedang dipertimbangkan, semua rantai STL terdiri dari simbol N dan R, dan rantai STR terdiri dari simbol L dan N, yang sesuai dengan struktur rantai ini. Struktur TR pada gambar yang dipertimbangkan juga sesuai dengan referensi, karena terdiri dari “selisih” rantai seperti STL, STR, “dikalikan” dengan simbol E.

Jadi, kami sampai pada kesimpulan bahwa gambar yang dimaksud adalah milik kelas SIMB A.


Sintesis pengontrol fuzzy untuk penggerak listrik DCdi lingkungan MatLab

Sintesis pengontrol fuzzy dengan satu input dan output.

Tantangannya adalah mendapatkan dorongan untuk mengikuti sinyal masukan yang berbeda secara akurat. Pengembangan tindakan kontrol dilakukan oleh pengontrol fuzzy, di mana blok fungsional berikut dapat dibedakan secara struktural: fuzzifier, blok aturan, dan defuzzifier.

Gambar.4 Diagram fungsional umum dari suatu sistem dengan dua variabel linguistik.

Gambar.5 Diagram skema pengontrol fuzzy dengan dua variabel linguistik.

Algoritma kendali fuzzy pada umumnya adalah transformasi variabel masukan suatu pengontrol fuzzy menjadi variabel keluarannya dengan menggunakan prosedur yang saling berhubungan sebagai berikut:

1. transformasi variabel masukan fisik yang diterima dari sensor pengukur dari objek kendali menjadi variabel masukan linguistik pengontrol fuzzy;

2. pengolahan pernyataan logis, disebut aturan linguistik, mengenai variabel linguistik masukan dan keluaran pengontrol;

3. transformasi variabel linguistik keluaran pengontrol fuzzy menjadi variabel kendali fisik.

Mari kita pertimbangkan kasus paling sederhana, ketika hanya dua variabel linguistik yang dimasukkan untuk mengontrol penggerak servo:

“sudut” adalah variabel masukan;

"tindakan kontrol" adalah variabel keluaran.

Kami akan mensintesis pengontrol di lingkungan MatLab menggunakan kotak peralatan " Logika Fuzzy" Ini memungkinkan Anda membuat sistem inferensi fuzzy dan klasifikasi fuzzy dalam lingkungan MatLab, dengan kemampuan untuk mengintegrasikannya ke dalam Simulink. Konsep dasar Fuzzy Logic Toolbox adalah struktur FIS - sistem inferensi fuzzy (Fuzzy Inference System). Struktur FIS berisi semua data yang diperlukan untuk mengimplementasikan pemetaan fungsional “input-output” berdasarkan inferensi logis fuzzy sesuai dengan diagram yang ditunjukkan pada Gambar. 6.


Gambar 6. Inferensi fuzzy.

X - masukan vektor tajam; - vektor himpunan kabur, sesuai dengan vektor masukan X;
- hasil inferensi logis berupa vektor himpunan fuzzy; Y - keluaran vektor jelas.

Modul fuzzy memungkinkan Anda membangun dua jenis sistem fuzzy - Mamdani dan Sugeno. Dalam sistem seperti Mamdani, basis pengetahuan terdiri dari aturan-aturan bentuk “Jika x 1 = rendah dan x 2 = sedang, maka y = tinggi”. Dalam sistem tipe Sugeno, basis pengetahuan terdiri dari aturan-aturan bentuk “Jika x 1 = rendah dan x 2 = sedang, maka y = a 0 +a 1 x 1 +a 2 x 2 ". Jadi, perbedaan utama antara sistem Mamdani dan Sugeno adalah dengan cara yang berbeda menetapkan nilai variabel keluaran dalam aturan yang membentuk basis pengetahuan. Dalam sistem tipe Mamdani, nilai variabel keluaran ditentukan oleh istilah fuzzy, dalam sistem tipe Sugeno - sebagai kombinasi linier dari variabel masukan. Dalam kasus kami, kami akan menggunakan sistem Sugeno, karena ini lebih cocok untuk pengoptimalan.

Untuk mengontrol penggerak servo, dua variabel linguistik diperkenalkan: “kesalahan” (berdasarkan posisi) dan “tindakan kontrol”. Yang pertama adalah masukan, yang kedua adalah keluaran. Mari kita definisikan kumpulan istilah untuk variabel tertentu.

Komponen dasar inferensi logis fuzzy. Penghalus.

Untuk setiap variabel linguistik, kami mendefinisikan bentuk himpunan istilah dasar, yang mencakup himpunan fuzzy yang dapat ditetapkan: negatif tinggi, negatif rendah, nol, positif rendah, positif tinggi.

Pertama-tama, mari kita definisikan secara subjektif apa yang dimaksud dengan istilah "kesalahan besar", "kesalahan kecil", dll., dengan mendefinisikan fungsi keanggotaan untuk himpunan fuzzy yang bersesuaian. Di sini, untuk saat ini, Anda hanya dapat dipandu oleh akurasi yang diperlukan, parameter kelas sinyal input yang diketahui, dan akal sehat. Belum ada yang mampu mengusulkan algoritma ketat untuk memilih parameter fungsi keanggotaan. Dalam kasus kami, variabel linguistik “kesalahan” akan terlihat seperti ini.

Gambar.7. Variabel linguistik "kesalahan".

Akan lebih mudah untuk menyajikan variabel linguistik “kontrol” dalam bentuk tabel:

Tabel 1

Blok aturan.

Mari kita pertimbangkan urutan pendefinisian beberapa aturan yang menggambarkan beberapa situasi:

Misalkan, misalnya, sudut keluaran sama dengan sinyal masukan (yaitu, kesalahannya nol). Jelas, ini adalah situasi yang diinginkan, dan oleh karena itu kita tidak perlu melakukan apa pun (aksi kontrolnya nol).

Sekarang pertimbangkan kasus lain: kesalahan posisi jauh lebih besar dari nol. Tentu saja, kita harus mengimbanginya dengan menghasilkan sinyal kontrol positif yang besar.

Itu. telah disusun dua aturan, yang secara formal dapat didefinisikan sebagai berikut:

Jika kesalahan = nol, Itu tindakan kontrol = nol.

Jika kesalahan = positif besar, Itu pengaruh kontrol = positif besar.

Gambar.8. Pembentukan kendali dengan kesalahan positif kecil pada posisinya.

Gambar.9. Pembentukan kendali dengan kesalahan posisi nol.

Tabel di bawah ini menunjukkan semua aturan yang sesuai dengan semua situasi untuk ini kasus sederhana.

Tabel 2

Secara total, untuk pengontrol fuzzy dengan n input dan 1 output, aturan kontrol dapat didefinisikan, di mana adalah jumlah himpunan fuzzy untuk input ke-i, tetapi agar pengontrol berfungsi normal tidak perlu menggunakan semua kemungkinan aturan, tapi Anda bisa bertahan dengan aturan yang lebih sedikit. Dalam kasus kami, kelima aturan yang mungkin digunakan untuk menghasilkan sinyal kontrol fuzzy.

Defuzzifier.

Dengan demikian, dampak yang ditimbulkan U akan ditentukan menurut pemenuhan beberapa aturan. Jika timbul situasi ketika beberapa aturan dijalankan sekaligus, maka dampak yang dihasilkan U ditemukan menurut hubungan berikut:

, di mana n adalah jumlah aturan yang dipicu (defuzzifikasi dengan metode pusat wilayah), kamu narti fisik sinyal kontrol yang sesuai dengan masing-masing himpunan fuzzy UBO, UMo, kamuZ, UMp, Universitas BrawijayaP. MTidak (kamu)– tingkat kepemilikan sinyal kontrol u pada himpunan fuzzy yang sesuai Un=( UBO, UMo, kamuZ, UMp, Universitas BrawijayaP). Ada juga metode defuzzifikasi lain yang variabel linguistik keluarannya sebanding dengan aturan “terkuat” atau “terlemah”.

Mari kita memodelkan proses pengendalian penggerak listrik menggunakan pengontrol fuzzy yang dijelaskan di atas.

Gambar 10. Diagram blok sistem di lingkunganMatlab.

Gambar 11. Diagram blok pengontrol fuzzy di suatu lingkunganMatlab.

Gambar 12. Proses sementara dalam tindakan satu langkah.

Beras. 13. Proses sementara di bawah aksi masukan harmonik untuk model dengan pengontrol fuzzy yang berisi satu variabel linguistik masukan.

Analisis karakteristik penggerak dengan algoritma kontrol yang disintesis menunjukkan bahwa mereka jauh dari optimal dan lebih buruk dibandingkan ketika mensintesis kontrol dengan metode lain (waktu kontrol terlalu lama untuk tindakan satu langkah dan kesalahannya harmonis). Hal ini dijelaskan oleh fakta bahwa parameter fungsi keanggotaan dipilih secara sewenang-wenang, dan hanya nilai kesalahan posisi yang digunakan sebagai input pengontrol. Tentu saja, tidak ada pembicaraan tentang optimalitas regulator yang dihasilkan. Oleh karena itu, tugas mengoptimalkan pengontrol fuzzy menjadi relevan untuk mencapai indikator kualitas kontrol setinggi mungkin. Itu. Tugasnya adalah mengoptimalkan fungsi tujuan f(a 1 ,a 2 …an n), dimana a 1 ,a 2 …an adalah koefisien yang menentukan tipe dan karakteristik pengontrol fuzzy. Untuk mengoptimalkan pengontrol fuzzy, kita akan menggunakan blok ANFIS dari lingkungan Matlab. Selain itu, salah satu cara untuk meningkatkan karakteristik pengontrol adalah dengan meningkatkan jumlah inputnya. Hal ini akan membuat regulator lebih fleksibel dan meningkatkan kinerjanya. Mari kita tambahkan satu lagi variabel linguistik masukan - laju perubahan sinyal masukan (turunannya). Jumlah peraturan akan bertambah. Maka diagram rangkaian regulatornya akan berbentuk :

Gambar 14 Diagram skema pengontrol fuzzy dengan tiga variabel linguistik.

Misalkan menjadi nilai kecepatan sinyal masukan. Kami mendefinisikan himpunan suku dasar Tn sebagai:

Tn=("negatif (BO)", "nol (Z)", "positif (BP)").

Letak fungsi keanggotaan seluruh variabel kebahasaan ditunjukkan pada gambar.

Gambar 15. Fungsi keanggotaan variabel linguistik “kesalahan”.

Gambar 16. Fungsi keanggotaan variabel linguistik “kecepatan sinyal input”.

Karena penambahan satu variabel linguistik lagi, jumlah aturan akan bertambah menjadi 3x5=15. Prinsip kompilasinya sangat mirip dengan yang dibahas di atas. Semuanya ditunjukkan pada tabel berikut:

Tabel 3

Sinyal kabur

pengelolaan

Kesalahan posisi

Kecepatan

Misalnya jika Jika error = nol dan turunan sinyal input = positif besar, Itu pengaruh kontrol = negatif kecil.

Gambar 17. Pembentukan kontrol di bawah tiga variabel linguistik.

Karena peningkatan jumlah input dan aturan itu sendiri, struktur pengontrol fuzzy akan menjadi lebih kompleks.

Gambar 18. Diagram blok pengontrol fuzzy dengan dua masukan.

Tambahkan gambar

Gambar.20. Proses sementara di bawah aksi masukan harmonik untuk model dengan pengontrol fuzzy yang berisi dua variabel linguistik masukan.

Beras. 21. Sinyal kesalahan pada aksi masukan harmonik untuk model dengan pengontrol fuzzy yang berisi dua variabel linguistik masukan.

Mari kita simulasikan pengoperasian pengontrol fuzzy dengan dua input di lingkungan Matlab. Diagram blok model akan persis sama seperti pada Gambar. 19. Dari grafik proses transien aksi masukan harmonik terlihat bahwa keakuratan sistem meningkat secara signifikan, namun pada saat yang sama osilasinya meningkat, terutama pada tempat-tempat yang cenderung turunan koordinat keluarannya. ke nol. Tentu saja, alasannya, sebagaimana disebutkan di atas, adalah pilihan parameter fungsi keanggotaan yang kurang optimal untuk variabel linguistik masukan dan keluaran. Oleh karena itu, kami mengoptimalkan pengontrol fuzzy menggunakan blok ANFISedit di lingkungan Matlab.

Optimalisasi pengontrol fuzzy.

Mari kita pertimbangkan penggunaan algoritma genetika untuk mengoptimalkan pengontrol fuzzy. Algoritma genetika – metode adaptif pencarian yang masuk akhir-akhir ini sering digunakan untuk memecahkan masalah optimasi fungsional. Mereka didasarkan pada kesamaan proses genetik organisme biologis: populasi biologis berkembang selama beberapa generasi, mematuhi hukum seleksi alam dan sesuai dengan prinsip “survival of the fittest”, dibuka oleh Charles Darwin. Meniru proses ini algoritma genetika mampu “mengembangkan” solusi masalah nyata, jika dikodekan dengan tepat.

Algoritma genetika bekerja dengan kumpulan “individu”—sebuah populasi—yang masing-masing mewakili solusi yang mungkin untuk suatu masalah tertentu. Setiap individu dinilai berdasarkan ukuran “kemampuan beradaptasi”-nya berdasarkan seberapa “baik” solusi terhadap masalah yang terkait dengannya. Individu yang paling kuat mampu “mereproduksi” keturunan melalui “kawin silang” dengan individu lain dalam populasi. Hal ini menyebabkan munculnya individu-individu baru yang menggabungkan beberapa sifat yang diwarisi dari orang tuanya. Individu yang paling tidak fit cenderung kecil kemungkinannya untuk bereproduksi, sehingga sifat apa pun yang mereka miliki secara bertahap akan hilang dari populasi.

Ini adalah bagaimana seluruh populasi baru dari solusi yang layak direproduksi, memilih perwakilan terbaik dari generasi sebelumnya, menyilangkannya dan memperoleh banyak individu baru. Generasi baru ini memiliki rasio karakteristik yang dimiliki lebih tinggi penis yang bagus generasi sebelumnya. Oleh karena itu, dari generasi ke generasi, karakteristik yang baik menyebar ke seluruh populasi. Pada akhirnya, populasi akan berkumpul untuk menemukan solusi optimal terhadap masalah tersebut.

Ada banyak cara untuk mengimplementasikan gagasan evolusi biologis dalam kerangka algoritma genetika. Tradisional, dapat direpresentasikan sebagai diagram blok berikut yang ditunjukkan pada Gambar 22, dimana:

1. Inisialisasi populasi awal – generasi nomor yang diberikan solusi atas masalah yang menjadi awal proses optimasi;

2. Penerapan operator crossover dan mutasi;

3. Kondisi berhenti - biasanya proses optimasi berlanjut hingga solusi masalah dengan akurasi tertentu ditemukan, atau hingga ditentukan bahwa proses telah konvergen (yaitu, solusi masalah belum membaik selama N generasi terakhir).

Di lingkungan Matlab, algoritma genetika diwakili oleh toolbox terpisah, serta oleh paket ANFIS. ANFIS adalah singkatan dari Adaptive-Network-Based Fuzzy Inference System - jaringan inferensi fuzzy adaptif. ANFIS adalah salah satu varian pertama dari jaringan neuro-fuzzy hybrid - jenis jaringan saraf feed-forward khusus. Arsitektur jaringan neuro-fuzzy bersifat isomorfik terhadap basis pengetahuan fuzzy. Jaringan neuro-fuzzy menggunakan implementasi yang dapat dibedakan norma segitiga(perkalian dan probabilistik OR), serta fungsi keanggotaan mulus. Hal ini memungkinkan penggunaan algoritme cepat dan genetik untuk melatih jaringan saraf berdasarkan metode pengaturan jaringan neuro-fuzzy propagasi mundur kesalahan. Arsitektur dan aturan pengoperasian setiap lapisan jaringan ANFIS dijelaskan di bawah ini.

ANFIS mengimplementasikan sistem inferensi fuzzy Sugeno sebagai jaringan saraf feedforward lima lapis. Tujuan dari lapisan-lapisan tersebut adalah sebagai berikut: lapisan pertama adalah syarat-syarat variabel masukan; lapisan kedua - anteseden (premis) dari aturan fuzzy; lapisan ketiga adalah normalisasi derajat kepatuhan terhadap aturan; lapisan keempat adalah kesimpulan dari aturan; lapisan kelima - agregasi hasil yang diperoleh berbagai aturan.

Input jaringan tidak dialokasikan ke lapisan terpisah. Gambar 23 menunjukkan jaringan ANFIS dengan satu variabel masukan (“kesalahan”) dan lima aturan fuzzy. Untuk evaluasi linguistik dari variabel masukan “kesalahan”, 5 istilah digunakan.


Gambar 23. StrukturANFIS-jaringan

Mari kita perkenalkan notasi berikut yang diperlukan untuk presentasi lebih lanjut:

Biarlah menjadi input jaringan;

y - keluaran jaringan;

Aturan fuzzy dengan nomor seri R;

m - jumlah aturan;

Suku fuzzy dengan fungsi keanggotaan yang digunakan untuk evaluasi linguistik suatu variabel dalam aturan ke-r (,);

Bilangan nyata di akhir aturan ke-r (,).

Jaringan ANFIS beroperasi sebagai berikut.

Lapisan 1. Setiap node pada lapisan pertama mewakili satu term dengan fungsi keanggotaan berbentuk lonceng. Input jaringan hanya terhubung ke persyaratannya. Jumlah node pada lapisan pertama sama dengan jumlah kardinalitas himpunan suku variabel masukan. Output dari node adalah sejauh mana nilai variabel input termasuk dalam suku fuzzy yang bersangkutan:

,

di mana a, b dan c adalah parameter fungsi keanggotaan yang dapat dikonfigurasi.

Lapisan 2. Jumlah node pada lapisan kedua adalah m. Setiap node pada lapisan ini berhubungan dengan satu aturan fuzzy. Node pada lapisan kedua dihubungkan ke node pada lapisan pertama yang membentuk anteseden dari aturan terkait. Oleh karena itu, setiap node pada lapisan kedua dapat menerima 1 hingga n sinyal masukan. Output dari node adalah tingkat pemenuhan aturan, yang dihitung sebagai produk dari sinyal input. Mari kita nyatakan output dari node pada lapisan ini dengan , .

Lapisan 3. Jumlah node pada lapisan ketiga juga m. Setiap node pada lapisan ini menghitung tingkat relatif pemenuhan aturan fuzzy:

Lapisan 4. Jumlah node pada lapisan keempat juga m. Setiap node terhubung ke satu node pada lapisan ketiga serta ke semua input jaringan (koneksi dengan input tidak ditunjukkan pada Gambar 18). Node lapisan keempat menghitung kontribusi satu aturan fuzzy terhadap keluaran jaringan:

Lapisan 5. Sebuah node di lapisan ini merangkum kontribusi dari semua aturan:

.

Prosedur umum untuk melatih jaringan saraf dapat digunakan untuk mengonfigurasi jaringan ANFIS karena hanya menggunakan fungsi yang dapat dibedakan. Biasanya, kombinasi penurunan gradien dalam bentuk backpropagation dan kuadrat terkecil digunakan. Algoritma backpropagation menyesuaikan parameter anteseden aturan, yaitu fungsi keanggotaan. Koefisien kesimpulan aturan diperkirakan menggunakan metode kuadrat terkecil, karena koefisien tersebut berhubungan secara linier dengan keluaran jaringan. Setiap iterasi prosedur pengaturan dilakukan dalam dua langkah. Pada tahap pertama, sampel pelatihan dipasok ke input, dan sesuai dengan perbedaan antara perilaku jaringan yang diinginkan dan aktual. metode berulang kuadrat terkecil adalah parameter optimal node dari lapisan keempat. Pada tahap kedua, sisa sisa ditransfer dari keluaran jaringan ke masukan, dan parameter node lapisan pertama dimodifikasi menggunakan metode propagasi mundur. Dalam hal ini, koefisien kesimpulan aturan yang ditemukan pada tahap pertama tidak berubah. Prosedur penyetelan berulang berlanjut hingga perbedaan melebihi nilai yang telah ditentukan. Untuk mengatur fungsi keanggotaan, selain metode backpropagation, dapat digunakan algoritma optimasi lainnya, misalnya metode Levenberg-Marquardt.

Gambar 24. Wilayah kerja ANFIS sunting.

Sekarang mari kita coba mengoptimalkan pengontrol fuzzy untuk tindakan satu langkah. Proses sementara yang diinginkan kira-kira berbentuk sebagai berikut:

Gambar 25. Proses transisi yang diinginkan.

Dari grafik yang ditunjukkan pada Gambar. itu mengikuti itu sebagian besar waktu, mesin harus bekerja dengan tenaga penuh untuk memastikannya kinerja maksimal, dan ketika mendekati nilai yang diinginkan, kecepatannya akan melambat dengan lancar. Dipandu oleh argumen sederhana ini, kami akan mengambil contoh nilai berikut, yang disajikan di bawah ini dalam bentuk tabel, sebagai contoh pelatihan:

Tabel 4


Nilai kesalahan

Nilai kontrol

Nilai kesalahan

Nilai kontrol

Nilai kesalahan

Nilai kontrol


Gambar 26. Jenis sampel pelatihan.

Kami akan melakukan pelatihan dalam 100 langkah. Ini lebih dari cukup untuk konvergensi metode yang digunakan.

Gambar 27. Proses pelatihan jaringan saraf.

Selama proses pembelajaran, parameter fungsi keanggotaan dibentuk sedemikian rupa sehingga kapan nilai yang diberikan kesalahan, regulator menciptakan kontrol yang diperlukan. Di area antara titik nodal, ketergantungan kontrol pada kesalahan merupakan interpolasi data tabel. Metode interpolasi bergantung pada bagaimana jaringan saraf dilatih. Faktanya, setelah pelatihan, model pengontrol fuzzy dapat direpresentasikan fungsi nonlinier satu variabel, grafiknya disajikan di bawah ini.

Gambar 28. Grafik kontrol versus kesalahan posisi di dalam pengontrol.

Setelah menyimpan parameter fungsi keanggotaan yang ditemukan, kami mensimulasikan sistem dengan pengontrol fuzzy yang dioptimalkan.


Beras. 29. Proses sementara di bawah aksi masukan harmonik untuk model dengan pengontrol fuzzy yang dioptimalkan yang berisi satu variabel linguistik masukan.

Gambar.30. Sinyal kesalahan dalam aksi masukan harmonik untuk model dengan pengontrol fuzzy yang berisi dua variabel linguistik masukan.


Dari grafik berikut bahwa optimasi pengontrol fuzzy menggunakan pelatihan jaringan saraf berhasil. Variabilitas dan besarnya kesalahan berkurang secara signifikan. Oleh karena itu, penggunaan jaringan syaraf tiruan cukup dibenarkan untuk mengoptimalkan regulator yang prinsip operasinya didasarkan pada logika fuzzy. Namun, pengontrol yang dioptimalkan pun tidak dapat memenuhi persyaratan akurasi, jadi disarankan untuk mempertimbangkan metode kontrol lain ketika pengontrol fuzzy tidak mengontrol objek secara langsung, tetapi menggabungkan beberapa hukum kontrol tergantung pada situasi saat ini.

Dan tanda-tanda. Masalah seperti itu cukup sering teratasi, misalnya saat menyeberang atau melewati jalan mengikuti lampu lalu lintas. Mengenali warna lampu lalu lintas yang menyala dan mengetahui peraturan lalu lintas memungkinkan Anda membuat keputusan yang tepat tentang apakah Anda boleh atau tidak bisa menyeberang jalan saat ini.

Penciptaan sistem buatan pengenalan pola masih merupakan masalah teoritis dan teknis yang kompleks. Kebutuhan akan pengakuan semacam itu muncul di berbagai bidang - mulai dari urusan militer dan sistem keamanan hingga digitalisasi semua jenis sinyal analog.

Secara tradisional, tugas pengenalan pola termasuk dalam rangkaian tugas kecerdasan buatan.

Petunjuk dalam pengenalan pola

Dua arah utama dapat dibedakan:

  • Ilmu yang mempelajari kemampuan pengenalan yang dimiliki makhluk hidup, penjelasan dan pemodelannya;
  • Pengembangan teori dan metode untuk membangun perangkat yang dirancang untuk memecahkan masalah individu untuk tujuan terapan.

Pernyataan formal tentang masalah

Pengenalan pola adalah penugasan data awal ke kelas tertentu dengan mengidentifikasi fitur-fitur penting yang menjadi ciri data ini dari total massa data yang tidak penting.

Ketika menetapkan masalah pengenalan, mereka mencoba menggunakan bahasa matematika, mencoba, berbeda dengan teori jaringan saraf tiruan, yang dasarnya adalah memperoleh hasil melalui eksperimen, untuk menggantikan eksperimen dengan penalaran logis dan pembuktian matematis.

Rumusan klasik dari masalah pengenalan pola: Diberikan sekumpulan objek. Klasifikasi perlu dibuat mengenai mereka. Suatu himpunan diwakili oleh himpunan bagian yang disebut kelas. Diberikan: informasi tentang kelas, deskripsi keseluruhan himpunan, dan deskripsi informasi tentang suatu objek yang keanggotaannya dalam kelas tertentu tidak diketahui. Berdasarkan informasi yang tersedia tentang kelas dan deskripsi objek, diperlukan untuk menentukan kelas mana yang termasuk dalam objek tersebut.

Gambar monokrom paling sering dipertimbangkan dalam masalah pengenalan pola, yang memungkinkan untuk mempertimbangkan gambar sebagai fungsi pada bidang. Jika kita mempertimbangkan suatu titik yang ditetapkan pada bidang, di mana fungsinya menyatakan karakteristiknya pada setiap titik gambar - kecerahan, transparansi, kepadatan optik, maka fungsi tersebut adalah rekaman formal gambar.

Himpunan semua fungsi yang mungkin pada bidang adalah model himpunan semua gambar. Memperkenalkan konsepnya kesamaan di antara gambar Anda dapat mengajukan tugas pengenalan. Jenis spesifik dari pernyataan tersebut sangat bergantung pada tahapan pengakuan selanjutnya sesuai dengan pendekatan tertentu.

Beberapa metode pengenalan pola grafis

Untuk pengenalan pola optik, Anda dapat menggunakan metode menghitung tampilan suatu objek pada berbagai sudut, skala, offset, dll. Untuk huruf, Anda perlu menghitung font, properti font, dll.

Pendekatan kedua adalah mencari garis besar suatu benda dan memeriksa sifat-sifatnya (konektivitas, keberadaan sudut, dll.)

Pendekatan lain adalah dengan menggunakan jaringan saraf tiruan. Metode ini memerlukan sejumlah besar contoh tugas pengenalan (dengan jawaban yang benar), atau struktur jaringan saraf khusus yang mempertimbangkan spesifikasi tugas ini.

Perceptron sebagai metode pengenalan pola

F. Rosenblatt, memperkenalkan konsep model otak, yang tugasnya menunjukkan bagaimana fenomena psikologis dapat muncul dalam sistem fisik tertentu, yang struktur dan sifat fungsionalnya diketahui, menggambarkan eksperimen diskriminasi yang paling sederhana. Eksperimen ini sepenuhnya terkait dengan metode pengenalan pola, namun berbeda karena algoritma solusinya tidak deterministik.

Eksperimen paling sederhana yang dengannya seseorang dapat memperoleh informasi yang signifikan secara psikologis tentang suatu sistem tertentu bermuara pada fakta bahwa model tersebut disajikan dengan dua rangsangan yang berbeda dan diharuskan untuk meresponsnya dengan cara yang berbeda. Tujuan dari percobaan tersebut mungkin untuk mempelajari kemungkinan diskriminasi spontan oleh sistem tanpa adanya intervensi dari pihak pelaku eksperimen, atau, sebaliknya, untuk mempelajari diskriminasi yang dipaksakan, di mana pelaku eksperimen berusaha untuk melatih sistem untuk melakukan hal tersebut. melakukan klasifikasi yang diperlukan.

Dalam percobaan pelatihan perceptron, biasanya disajikan urutan gambar tertentu, yang mencakup perwakilan dari masing-masing kelas yang akan dibedakan. Menurut beberapa aturan modifikasi memori, pilihan respons yang benar diperkuat. Perceptron kemudian disajikan dengan stimulus kontrol dan kemungkinan memperoleh respon yang benar untuk rangsangan dari kelas tertentu ditentukan. Bergantung pada apakah stimulus kontrol yang dipilih cocok atau tidak dengan salah satu gambar yang digunakan dalam urutan pelatihan, hasil yang berbeda diperoleh:

  1. Jika stimulus kontrol tidak sesuai dengan stimulus pelatihan mana pun, maka eksperimen tidak hanya dikaitkan dengan diskriminasi murni, tetapi juga mencakup elemen generalisasi.
  2. Jika suatu stimulus kontrol menggairahkan sekumpulan elemen sensorik tertentu yang sama sekali berbeda dari elemen-elemen yang diaktifkan di bawah pengaruh rangsangan yang diberikan sebelumnya dari kelas yang sama, maka eksperimen tersebut adalah suatu penelitian. generalisasi murni.

Perceptron tidak mempunyai kapasitas untuk melakukan generalisasi murni, namun berfungsi cukup memuaskan dalam eksperimen diskriminasi, terutama jika stimulus kontrol cukup cocok dengan salah satu gambar yang telah diperoleh pengalaman oleh perceptron.

Contoh soal pengenalan pola

  • Pengenalan kode batang
  • Pengenalan plat nomor
  • Pengenalan gambar
  • Pengakuan wilayah lokal kerak bumi di mana terdapat endapan mineral

Lihat juga

Catatan

Literatur

  • Gorelik A.L., Skripkin V.A. Metode pengenalan. - edisi ke-4. - M.: Sekolah Tinggi, 1984, 2004. - 262 hal.
  • Vapnik V.N., Chervonenkis A.Ya. Teori pengenalan pola. - M.: Nauka, 1974. - 416 hal.
  • Vasiliev V.I. Sistem pengakuan. Direktori. - edisi ke-2. - K.: Naukova Dumka, 1983. - 424 hal.
  • George Stockman, Linda Shapiro. Visi komputer = Visi Komputer. - M.: Binom. Laboratorium Pengetahuan, 2006. - 752 hal. - ISBN 5-947-74384-1
  • Forsythe David A., Pons Jean. Visi komputer. Pendekatan modern = Visi Komputer: Pendekatan Modern. - M.: Williams, 2004. - 928 hal. - ISBN 0-13-085198-1
  • Cheng S.-K. Prinsip desain untuk sistem informasi visual. - M.: Mir, 1994. - 408 hal.

Tautan

  • Yuri Lifshit. Kursus “Masalah modern ilmu komputer teoretis” - kuliah tentang metode statistik pengenalan pola, pengenalan wajah, klasifikasi teks
  • Jurnal Penelitian Pengenalan Pola

Yayasan Wikimedia.

  • Bahasa yang dikenali
  • Raspopa

Lihat apa itu “Teori Pengenalan Pola” di kamus lain:

    teori pengenalan pola- arahan ilmiah berdasarkan data psikologi dan fisiologi, teori probabilitas dan terkait dengan pengembangan prinsip dan konstruksi sistem (termasuk berbasis komputer) yang dirancang untuk menentukan apakah suatu objek tertentu milik salah satu... ... Kamus Ensiklopedis Psikologi dan Pedagogi

    Ensiklopedia Sosiologi- arah ilmiah yang terkait dengan pengembangan prinsip dan konstruksi sistem yang dirancang untuk menentukan apakah suatu objek tertentu termasuk dalam salah satu kelas objek yang telah ditentukan sebelumnya. Di bawah objek di R. o. memahami berbagai itemEnsiklopedia Besar Soviet

    Kamus Ensiklopedis- bagian matematika. sibernetika, mengembangkan prinsip dan metode klasifikasi, serta identifikasi objek, fenomena, proses, sinyal, situasi dari semua objek yang dapat dijelaskan oleh sekumpulan tanda atau properti tertentu yang terbatas,... ... Ensiklopedia Matematika

    Ensiklopedia Sosiologi

    Pengenalan pola (sibernetika) - Pengenalan otomatis orang program khusus. Teori pengenalan pola merupakan salah satu cabang sibernetika yang berkembang landasan teori dan metode klasifikasi dan identifikasi objek, fenomena, proses, sinyal, situasi, dll. objek,... ... Wikipedia

    TEORI INFORMASI- bagian matematika terapan dan sibernetika yang berkaitan dengan matematika. deskripsi dan penilaian kualitas transmisi, penyimpanan, pengambilan dan klasifikasi informasi. Istilah I. t., yang muncul pada tahun 50-an. Abad ke-20, masih (pada tahun 1978) tidak memiliki satu pun... ... Ensiklopedia Matematika

    Pembelajaran tanpa pengawasan- (Bahasa Inggris: Pembelajaran tanpa pengawasan, pembelajaran mandiri, pembelajaran spontan) salah satu caranya pembelajaran mesin, ketika memecahkan sistem yang diuji secara spontan belajar untuk melakukan tugas yang diberikan, tanpa intervensi dari luar... ... Wikipedia

    Jaringan saraf tiruan- Istilah ini memiliki arti lain, lihat Jaringan saraf (arti). Skema jaringan saraf sederhana. Hijau menunjukkan neuron masukan, neuron tersembunyi berwarna biru, neuron keluaran berwarna kuning... Wikipedia

Minggu, 29 Maret 2015

Saat ini, ada banyak tugas yang memerlukan pengambilan keputusan tergantung pada keberadaan suatu objek dalam gambar atau untuk mengklasifikasikannya. Kemampuan untuk “mengenali” dianggap sebagai sifat dasar makhluk biologis, sedangkan sistem komputer tidak sepenuhnya memiliki properti ini.

Mari kita pertimbangkan elemen umum model klasifikasi.

Kelas- sekumpulan benda yang memiliki sifat umum. Untuk objek dari kelas yang sama, diasumsikan adanya “kesamaan”. Untuk tugas pengenalan, jumlah kelas yang berubah-ubah, lebih besar dari 1, dapat ditentukan. Jumlah kelas dilambangkan dengan angka S. Setiap kelas memiliki label kelas pengenalnya sendiri.

Klasifikasi- proses pemberian label kelas pada objek, sesuai dengan beberapa deskripsi properti objek tersebut. Pengklasifikasi adalah perangkat yang menerima sekumpulan atribut objek sebagai data masukan dan menghasilkan label kelas sebagai hasilnya.

Verifikasi- proses pemetaan sebuah instance objek ke model objek tunggal atau deskripsi kelas.

Di bawah jalan kita akan memahami nama area dalam ruang fitur yang banyak menampilkan objek atau fenomena dunia materi. Tanda - deskripsi kuantitatif satu atau beberapa properti dari objek atau fenomena yang sedang dipelajari.

Ruang fitur Ini Ruang berdimensi-n, ditentukan untuk tugas pengenalan tertentu, dengan N adalah sejumlah fitur terukur yang tetap untuk objek apa pun. Vektor dari ruang fitur x yang sesuai dengan objek tugas pengenalan adalah vektor berdimensi N dengan komponen (x_1,x_2,…,x_N), yang merupakan nilai fitur objek tersebut.

Dengan kata lain, pengenalan pola dapat didefinisikan sebagai penugasan data awal ke kelas tertentu dengan mengidentifikasi fitur atau properti penting yang menjadi ciri data ini dari kumpulan detail yang tidak penting.

Contoh masalah klasifikasi adalah:

  • pengenalan karakter;
  • pengenalan suara;
  • menegakkan diagnosis medis;
  • ramalan cuaca;
  • pengenalan wajah
  • klasifikasi dokumen, dll.

Paling sering, materi sumbernya adalah gambar yang diterima dari kamera. Masalahnya dapat dirumuskan sebagai perolehan vektor fitur untuk setiap kelas pada gambar yang ditinjau. Prosesnya dapat dilihat sebagai proses pengkodean yang melibatkan pemberian nilai pada setiap fitur dari ruang fitur untuk setiap kelas.

Jika kita mempertimbangkan 2 kelas objek: dewasa dan anak-anak. Anda dapat memilih tinggi dan berat badan sebagai tanda. Berdasarkan gambar berikut, kedua kelas ini membentuk dua himpunan yang saling lepas, yang dapat dijelaskan dengan ciri-ciri yang dipilih. Namun, tidak selalu mungkin untuk memilih parameter terukur yang benar sebagai fitur kelas. Misalnya, parameter yang dipilih tidak cocok untuk menciptakan kelas pemain sepak bola dan pemain bola basket yang terpisah.

Tugas pengenalan yang kedua adalah mengekstrak ciri atau properti karakteristik dari gambar sumber. Tugas ini dapat diklasifikasikan sebagai prapemrosesan. Jika kita mempertimbangkan tugas pengenalan ucapan, kita dapat membedakan fitur-fitur seperti vokal dan konsonan. Atribut harus merupakan properti karakteristik dari kelas tertentu, dan sekaligus umum untuk kelas tersebut. Ciri-ciri yang menjadi ciri perbedaan antar – ciri antarkelas. Fitur umum pada semua kelas tidak membawa informasi berguna dan tidak dianggap sebagai fitur dalam tugas pengenalan. Pemilihan fitur adalah salah satu tugas penting yang terkait dengan pembangunan sistem pengenalan.

Setelah fitur ditentukan, prosedur pengambilan keputusan optimal untuk klasifikasi harus ditentukan. Mari kita pertimbangkan sistem pengenalan pola yang dirancang untuk mengenali kelas M yang berbeda, dilambangkan sebagai m_1,m_2,…,m 3. Kemudian kita dapat berasumsi bahwa ruang gambar terdiri dari M daerah, yang masing-masing berisi titik-titik yang bersesuaian dengan gambar dari satu kelas. Kemudian masalah pengenalan dapat dianggap sebagai membangun batas-batas yang memisahkan kelas-kelas M berdasarkan pada vektor pengukuran yang diadopsi.

Pemecahan masalah preprocessing citra, ekstraksi fitur dan masalah mendapatkan solusi dan klasifikasi yang optimal biasanya dikaitkan dengan kebutuhan untuk memperkirakan sejumlah parameter. Hal ini menyebabkan masalah estimasi parameter. Selain itu, jelas bahwa ekstraksi fitur dapat digunakan informasi tambahan berdasarkan sifat kelasnya.

Objek dapat dibandingkan berdasarkan representasinya sebagai vektor pengukuran. Lebih mudah untuk merepresentasikan data pengukuran dalam bentuk bilangan real. Kemudian persamaan vektor ciri dua benda dapat digambarkan dengan menggunakan jarak Euclidean.

dimana d adalah dimensi vektor fitur.

Ada 3 kelompok metode pengenalan pola:

  • Perbandingan dengan sampel. Kelompok ini meliputi klasifikasi menurut rata-rata terdekat, klasifikasi menurut jarak tetangga terdekat. Metode pengenalan struktural juga dapat dimasukkan dalam kelompok perbandingan dengan sampel.
  • Metode statistik. Seperti namanya, metode statistik menggunakan beberapa informasi statistik saat memecahkan masalah pengenalan. Metode menentukan apakah suatu objek termasuk dalam kelas tertentu berdasarkan probabilitas. Dalam beberapa kasus, hal ini dilakukan untuk menentukan probabilitas posterior suatu objek termasuk dalam kelas tertentu, asalkan karakteristik objek tersebut telah mengambil nilai yang sesuai. Contohnya adalah metode yang didasarkan pada aturan keputusan Bayesian.
  • Jaringan saraf. Kelas metode pengenalan yang terpisah. Ciri khas dari orang lain adalah kemampuan belajar.

Klasifikasi berdasarkan mean terdekat

Dalam pendekatan pengenalan pola klasik, di mana objek yang tidak diketahui untuk klasifikasi direpresentasikan sebagai vektor fitur dasar. Sistem pengenalan berbasis fitur dapat dikembangkan dengan berbagai cara. Vektor-vektor ini dapat diketahui sistem terlebih dahulu melalui pelatihan atau diprediksi secara real-time berdasarkan beberapa model.

Algoritma klasifikasi sederhana adalah mengelompokkan data referensi kelas menggunakan vektor harapan matematis kelas (nilai rata-rata).

dimana x(i,j) adalah fitur referensi ke-j dari kelas i, n_j adalah jumlah vektor referensi dari kelas i.

Maka suatu benda yang tidak diketahui akan termasuk dalam kelas i jika jaraknya secara signifikan lebih dekat dengan vektor ekspektasi matematis kelas i dibandingkan dengan vektor ekspektasi matematis kelas lain. Metode ini cocok untuk permasalahan yang titik-titik tiap kelas letaknya berdekatan dan jauh dari titik-titik kelas lainnya.

Kesulitan akan muncul jika jumlah kelas sedikit lebih banyak struktur yang kompleks, misalnya seperti pada gambar. Dalam hal ini, kelas 2 dibagi menjadi dua bagian terpisah yang sulit dijelaskan oleh satu nilai rata-rata. Selain itu, kelas 3 terlalu memanjang, sampel kelas 3 dengan nilai koordinat besar x_2 lebih mendekati nilai rata-rata kelas 1 dibandingkan kelas 3.

Masalah yang dijelaskan dalam beberapa kasus dapat diselesaikan dengan mengubah perhitungan jarak.

Kami akan memperhitungkan karakteristik "sebaran" nilai kelas - σ_i, sepanjang setiap arah koordinat i. Simpangan bakunya adalah akar kuadrat dari dispersi. Jarak Euclidean berskala antara vektor x dan vektor ekspektasi x_c adalah

Rumus jarak ini akan mengurangi jumlah kesalahan klasifikasi, namun kenyataannya sebagian besar permasalahan tidak dapat direpresentasikan oleh kelas yang sederhana.

Klasifikasi berdasarkan jarak ke tetangga terdekat

Pendekatan lain untuk klasifikasi adalah dengan menetapkan vektor fitur x yang tidak diketahui ke kelas yang sampel individunya paling mirip dengan vektor ini. Aturan ini disebut aturan tetangga terdekat. Klasifikasi tetangga terdekat bisa lebih efisien bahkan ketika kelas memiliki struktur yang kompleks atau ketika kelas tumpang tindih.

Pendekatan ini tidak memerlukan asumsi tentang model distribusi vektor fitur dalam ruang. Algoritme hanya menggunakan informasi tentang sampel referensi yang diketahui. Metode penyelesaiannya didasarkan pada penghitungan jarak x ke setiap sampel dalam database dan mencari jarak minimum. Keuntungan dari pendekatan ini sangat jelas:

  • Anda dapat menambahkan sampel baru ke database kapan saja;
  • struktur data pohon dan grid mengurangi jumlah jarak yang dihitung.

Selain itu, solusinya akan lebih baik jika kita mencari database bukan untuk satu tetangga terdekat, tapi untuk k. Kemudian, untuk k > 1, ini memberikan pengambilan sampel terbaik dari sebaran vektor di ruang dimensi-d. Namun, efisiensi penggunaan nilai k bergantung pada apakah terdapat cukup angka di setiap wilayah ruang. Jika ada lebih dari dua kelas, akan lebih sulit mengambil keputusan yang tepat.

Literatur

  • M. Castrillon, . O.Deniz, . D. Hernández dan J. Lorenzo, “Perbandingan detektor wajah dan fitur wajah berdasarkan kerangka deteksi objek umum Viola-Jones,” International Journal of Computer Vision, no. 481-494, 2011.
  • Y.-Q. Wang, “Analisis Algoritma Deteksi Wajah Viola-Jones,” Jurnal IPOL, 2013.
  • L. Shapiro dan D. Stockman, Visi Komputer, Binom. Laboratorium Pengetahuan, 2006.
  • Z.N.G., Metode pengenalan dan penerapannya, Radio Soviet, 1972.
  • J. Tu, R. Gonzalez, Prinsip matematika pengenalan pola, Moskow: “Mir” Moskow, 1974.
  • Khan, H. Abdullah dan M. Shamian Bin Zainal, “Algoritma deteksi mata dan mulut yang efisien menggunakan kombinasi viola jones dan deteksi piksel warna kulit,” International Journal of Engineering and Applied Sciences, No. Vol. 3 Nomor 4, 2013.
  • V. Gaede dan O. Gunther, “Metode Akses Multidimensi,” Survei Komputasi ACM, hal. 170-231, 1998.


Apakah Anda menyukai artikelnya? Bagikan dengan teman Anda!