Kas yra automatinio kainų modelių atpažinimo sistema. Kalbos atpažinimo sistemų taikymas

1964 m. Niujorko kompiuterių mugėje buvo pristatyta IBM Shoebox.

Dešimtojo dešimtmečio pradžioje pasirodė komercinės kalbos atpažinimo programos. Dažniausiai jas naudoja žmonės, kurie dėl rankos traumos negali įvesti didelio teksto kiekio. Šios programos (pavyzdžiui, „Dragon NaturallySpeaking“, „VoiceNavigator“) paverčia vartotojo balsą tekstu, taip atleidžiant jo rankas. Tokių programų vertimo patikimumas nėra labai didelis, tačiau bėgant metams jis pamažu gerėjo.

Padidinta skaičiavimo galia mobiliuosius įrenginius leido sukurti jiems programas su kalbos atpažinimo funkcijomis. Tarp tokių programų verta paminėti Microsoft programa Balso komanda, leidžianti balsu valdyti daugelį programų. Pavyzdžiui, grotuve galite leisti muziką arba sukurti naują dokumentą.

Sumanūs kalbos sprendimai, kurie automatiškai sintezuoja ir atpažįsta žmogaus kalbą, yra kitas žingsnis kuriant interaktyviąsias balso sistemas (IVR). Naudotis interaktyvia telefono programa šiuo metu nėra mados tendencija, bet gyvybinė būtinybė. Kontaktų centrų operatorių ir sekretorių darbo krūvio mažinimas, darbo sąnaudų mažinimas ir paslaugų sistemų produktyvumo didinimas – tai tik dalis privalumų, įrodančių tokių sprendimų pagrįstumą.

Tačiau pažanga nestovi vietoje ir neseniai telefonu interaktyvios programos Vis dažniau naudojamos automatinės kalbos atpažinimo ir sintezės sistemos. Tokiu atveju bendravimas su balso portalu tampa natūralesnis, nes jame galima rinktis ne tik toniniu rinkimu, bet ir balso komandomis. Tuo pačiu metu atpažinimo sistemos yra nepriklausomos nuo garsiakalbių, tai yra, atpažįsta bet kurio žmogaus balsą.

Kitu žingsniu kalbos atpažinimo technologijose galima laikyti vadinamųjų tyliųjų kalbų sąsajų (SSI – Silent Speech Interfaces) sukūrimą. Šios kalbos apdorojimo sistemos yra pagrįstos kalbos signalų priėmimu ir apdorojimu ankstyvoje artikuliacijos stadijoje. Šį kalbos atpažinimo vystymosi etapą lemia du reikšmingi trūkumai modernios sistemos atpažinimas: per didelis jautrumas triukšmui, taip pat aiškios ir aiškios kalbos poreikis prisijungiant prie atpažinimo sistemos. SSI metodas yra naudoti naujus jutiklius be paveiktas triukšmas kaip apdorotų akustinių signalų papildymas.

Sistemų tipai

Šiandien yra dviejų tipų kalbos atpažinimo sistemos – veikiančios „kliento pagrindu“ ir veikiančios „kliento-serverio“ principu. Naudojant kliento-serverio technologiją, kalbos komanda įvedama vartotojo įrenginyje ir internetu perduodama į nuotolinį serverį, kur ji apdorojama ir komandos forma grąžinama į įrenginį (Google Voice, Vlingo ir kt.) ; Dėl didelio serverio vartotojų skaičiaus atpažinimo sistema gauna didelę mokymo bazę. Pirmasis variantas tinka kitiems matematiniai algoritmai ir yra reta („Speereo Software“) – tokiu atveju komanda įvedama vartotojo įrenginyje ir ten apdorojama. Apdorojimo „ant kliento“ pranašumas yra mobilumas, nepriklausomybė nuo ryšio ir nuotolinės įrangos veikimo. Taigi sistema, veikianti „kliente“, atrodo patikimesnė, tačiau kartais ją riboja vartotojo pusėje esančio įrenginio galia.

Dabar taip pat naudojamos technologijos SIND(be nuorodos į konkretaus asmens balsą).

Taikymas

Pagrindinis balsu pagrįstų sistemų privalumas yra tai, kad jos yra patogios vartotojui – nereikia braidyti sudėtingais ir painiais balsu įjungiamų meniu labirintais. Dabar užtenka pasakyti skambučio tikslą, po kurio balso sistema automatiškai perkels skambinantįjį į norimą meniu punktą.

  • Skambinimas balsu įvairios technikos(mobilieji telefonai, kompiuteriai ir kt.)
  • Teksto žinučių įvestis balsu išmaniuosiuose telefonuose ir kituose mobiliuosiuose kompiuteriuose

Taip pat žr

  • Skaitmeninis signalų apdorojimas

Pastabos

Nuorodos

Kategorijos:

  • Kalbos atpažinimas
  • Kalbos bendravimas
  • Dirbtinio intelekto taikymas
  • Reabilitacijos produktai žmonėms, turintiems raumenų ir kaulų sistemos sutrikimų
  • Reabilitacijos priemonės žmonėms su regėjimo negalia

Wikimedia fondas.

Pažiūrėkite, kas yra „Kalbos atpažinimas“ kituose žodynuose:

    Kalbos pavertimo tekstu procesas. Kalbos atpažinimo sistemoms būdinga: suprantamų žodžių žodyno apimtis; priimtinas kalbos sklandumas; priklausomybės nuo tinktūros laipsnis nuo konkretaus asmens kalbos. Anglų kalba: Kalbos atpažinimas Taip pat žiūrėkite:… … Finansų žodynas

    kalbos atpažinimas- - Telekomunikacijų temos, pagrindinės sąvokos EN kalbos atpažinimas...

    kalbos atpažinimas- kalbos atpažinimo statusas T sritis automatika atitikmenys: engl. kalbos suvokimas; kalbos atpažinimas; balso atpažinimas vok. Spracherkennung, f rus. kalbos atpažinimas, n pranc. reconnaissance de parole, f; reconnaissance vocale, f … Automatikos terminų žodynas

    kalbos atpažinimas pagal balso savybes- Atpažinimo procedūra, pagrįsta kalbėtojo balso ypatybėmis. Atpažintas kalbos signalas paprastai skirstomas į trumpus fragmentus, kurių kiekvienas lyginamas su atmintyje saugomais kalbos pavyzdžiais. Ta, su kuria...... Techninis vertėjo vadovas

    kalbos atpažinimas, nepriklausomas nuo balso savybių- Kalbos pavertimo prasminga metodas tekstinė informacija nesiderinant prie konkretaus abonento balso tembro. [L.M. Nevdiajevas. Telekomunikacijų technologijos. Anglų rusų aiškinamasis žodynas katalogas. Redagavo Yu.M. Gornostajeva. Maskva,…… Techninis vertėjo vadovas

    automatinis kalbos atpažinimas- Procesas arba technologija, kuri kaip įvestį priima įprastą kalbos signalą ir kaip išvestį sukuria užkoduotą to, kas pasakyta (žodžio, komandos, posakio, sakinio ir kt.) versiją (ITU T Y.2271, ITU T P.10). / G.100).… … Techninis vertėjo vadovas

    Šablonai Optinis simbolių atpažinimas Rašysenos atpažinimas Kalbos atpažinimas... Vikipedija

    Automatinis veido atpažinimas speciali programa. Modelių atpažinimo teorija – kibernetikos šaka, kurianti objektų, reiškinių, procesų, signalų, situacijų ir tt objektų klasifikavimo ir identifikavimo teorinius pagrindus ir metodus,... ... Vikipedija

    Automatinis veido atpažinimas su specialia programa. Modelių atpažinimo teorija – kibernetikos šaka, kurianti objektų, reiškinių, procesų, signalų, situacijų ir tt objektų klasifikavimo ir identifikavimo teorinius pagrindus ir metodus,... ... Vikipedija

Knygos

  • Kalbos reikšmės triukšme atpažinimas ir supratimas remiantis stochastika, V.V. Stochastinis yra stochastinis informacinės technologijos, sukurta Rusijoje. Tai leidžia jums sukurti efektyvų intelektualios sistemos, dirba realiu laiku ir neįskaitant...

Enciklopedinis „YouTube“.

    1 / 5

    Įvadas į kalbos atpažinimą

    LANGMaster kalbos atpažinimas

    Subtitrai

Istorija

Pirmasis kalbos atpažinimo įrenginys pasirodė 1952 m., galintis atpažinti žmogaus ištartus skaičius. 1962 m. Niujorko kompiuterių mugėje buvo pristatyta IBM Shoebox.

Dešimtojo dešimtmečio pradžioje pasirodė komercinės kalbos atpažinimo programos. Dažniausiai jas naudoja žmonės, kurie dėl rankos traumos negali įvesti didelio teksto kiekio. Šios programos (pvz., Dragon NaturallySpeaking (anglų kalba) rusų,VoiceNavigator (anglų kalba) rusų) išversti vartotojo balsą į tekstą, taip atleidžiant jo rankas. Tokių programų vertimo patikimumas nėra labai didelis, tačiau bėgant metams jis pamažu gerėjo.

Padidėjusi mobiliųjų įrenginių skaičiavimo galia leido sukurti jiems programas su kalbos atpažinimo funkcijomis. Tarp tokių programų verta paminėti „Microsoft Voice Command“ programą, kuri leidžia dirbti su daugeliu programų naudojant balsą. Pavyzdžiui, grotuve galite leisti muziką arba sukurti naują dokumentą.

Kalbos atpažinimo naudojimas tampa vis populiaresnis įvairiose verslo srityse, pavyzdžiui, gydytojas klinikoje gali ištarti diagnozes, kurios iš karto bus įrašytos į elektroninę kortelę. Arba kitas pavyzdys. Tikrai kiekvienas bent kartą gyvenime svajojo balsu išjungti šviesą ar atidaryti langą. Pastaruoju metu interaktyviosiose telefono programose vis dažniau naudojamos automatinės kalbos atpažinimo ir sintezės sistemos. Tokiu atveju bendravimas su balso portalu tampa natūralesnis, nes jame galima rinktis ne tik toniniu rinkimu, bet ir balso komandomis. Tuo pačiu metu atpažinimo sistemos yra nepriklausomos nuo garsiakalbių, tai yra, jos atpažįsta bet kurio žmogaus balsą.

Kitu žingsniu kalbos atpažinimo technologijose galima laikyti vadinamųjų tyliųjų kalbų sąsajų (SSI) sukūrimą. Šios kalbos apdorojimo sistemos yra pagrįstos kalbos signalų priėmimu ir apdorojimu ankstyvoje artikuliacijos stadijoje. Šį kalbos atpažinimo vystymosi etapą lemia du reikšmingi šiuolaikinių atpažinimo sistemų trūkumai: per didelis jautrumas triukšmui, taip pat aiškios ir aiškios kalbos poreikis prisijungiant prie atpažinimo sistemos. SSI metodas yra naudoti naujus jutiklius, kuriems nedaro įtakos triukšmas, papildydami apdorotus akustinius signalus.

Kalbos atpažinimo sistemų klasifikacija

Kalbos atpažinimo sistemos skirstomos į:

  • pagal žodyno dydį (ribotas žodžių rinkinys, žodynas didelio dydžio);
  • priklausomai nuo garsiakalbio (nuo garsiakalbio priklausomos ir nuo garsiakalbio nepriklausomos sistemos);
  • pagal kalbos tipą (ištisinė arba atskira kalba);
  • pagal paskirtį (diktavimo sistemos, komandų sistemos);
  • pagal naudojamą algoritmą (neuronų tinklai, paslėpti Markovo modeliai, dinaminis programavimas);
  • pagal struktūrinio vieneto tipą (frazės, žodžiai, fonemos, dvifonai, alofonai);
  • pagal paskirstymo principą struktūriniai padaliniai(modelio atpažinimas, leksinių elementų parinkimas).

Automatinės kalbos atpažinimo sistemose atsparumas triukšmui pirmiausia užtikrinamas naudojant du mechanizmus:

  • Kelių lygiagrečių darbo metodų naudojimas tiems patiems kalbos signalo elementams identifikuoti remiantis akustinio signalo analize;
  • Lygiagretus savarankiškas segmentinio (foneminio) ir holistinio žodžių suvokimo vartojimas kalbos sraute.

Kalbos atpažinimo metodai ir algoritmai

"... akivaizdu, kad kalbos signalų apdorojimo algoritmai kalbos suvokimo modelyje turi naudoti tą pačią sąvokų ir santykių sistemą, kurią naudoja žmogus."

Šiandien kalbos atpažinimo sistemos yra sukurtos remiantis atpažinimo principais [ kieno?] pripažinimo formos [nežinomas terminas ] . Iki šiol naudotus metodus ir algoritmus galima suskirstyti į šiuos didelės klasės:

Kalbos atpažinimo metodų klasifikavimas remiantis palyginimu su standartu.

  • Dinaminis programavimas – laikini dinaminiai algoritmai (Dynamic Time Warping).

Kontekstui jautri klasifikacija. Ją įgyvendinant iš kalbos srauto išskiriami atskiri leksiniai elementai – fonemos ir alofonai, kurie vėliau sujungiami į skiemenis ir morfemas.

  • Diskriminacinės analizės metodai, pagrįsti Bajeso diskriminacija;
  • Paslėptas Markovo modelis;
  • Neuroniniai tinklai.

Atpažinimo sistemų architektūra

Tipiškas [ ] architektūra statistinės sistemos automatinis apdorojimas kalba.

  • Triukšmo mažinimo modulis ir naudingo signalo atskyrimas.
  • Akustinis modelis – leidžia įvertinti kalbos segmento atpažinimą pagal panašumą garso lygiu. Kiekvienam garsui iš pradžių sukuriamas sudėtingas statistinis modelis, apibūdinantis šio garso tarimą kalboje.
  • Kalbos modelis – leidžia nustatyti labiausiai tikėtinas žodines sekas. Kalbos modelio kūrimo sudėtingumas labai priklauso nuo konkrečia kalba. Taip, už anglų kalba, pakanka naudoti statistinius modelius (vadinamuosius N-gramus). Labai linksniuotoms kalboms (kalboms, kuriose yra daug to paties žodžio formų), įskaitant rusų kalbą, kalbos modeliai, sukurti tik naudojant statistiką, nebeduoda tokio efekto – reikia per daug duomenų, kad būtų galima patikimai įvertinti statistinius ryšius. tarp žodžių. Todėl naudojami hibridiniai kalbos modeliai, kuriuose naudojamos rusų kalbos taisyklės, informacija apie kalbos dalį ir žodžio formą bei klasikinis statistinis modelis.
  • Dekoderis – atpažinimo sistemos programinė dalis, kuri sujungia duomenis, gautus atpažinimo metu iš akustinių ir kalbos modelių, ir pagal jų derinį nustato labiausiai tikėtiną žodžių seką, kuri yra galutinis nuolatinio kalbos atpažinimo rezultatas.
  1. Kalbos apdorojimas prasideda nuo kalbos signalo kokybės įvertinimo. Šiame etape nustatomas trukdžių ir iškraipymo lygis.
  2. Vertinimo rezultatas patenka į akustinio pritaikymo modulį, kuris valdo atpažinimui reikalingų kalbos parametrų skaičiavimo modulį.
  3. Signate identifikuojamos kalbos turinčios sritys ir įvertinami kalbos parametrai. Yra fonetinis ir prozodinis atskyrimas tikimybinės charakteristikos sintaksinei, semantinei ir pragmatinei analizei. (Įvertinkite informaciją apie kalbos dalį, žodžių formą ir statistinius ryšius tarp žodžių.)
  4. Toliau kalbos parametrai patenka į pagrindinį atpažinimo sistemos bloką – dekoderį. Tai komponentas, kuris suderina įvesties kalbos srautą su informacija, saugoma akustiniuose ir kalbos modeliuose, ir nustato labiausiai tikėtiną žodžių seką, kuri yra galutinis atpažinimo rezultatas.

Emociškai įkrautos kalbos požymiai atpažinimo sistemose

Spektrinės-laikinės savybės

Spektrinės savybės:

  • Vidutinė analizuojamo kalbos signalo spektro reikšmė;
  • Normalizuoti spektro vidurkiai;
  • Santykinė signalo buvimo trukmė spektro juostose;
  • Normalizuota signalo buvimo trukmė spektro juostose;
  • Vidutinė kalbos spektro reikšmė juostose;
  • Santykinė kalbos spektro galia juostose;
  • Kalbos spektro vokų keitimas;
  • Normalizuotos kalbos spektro gaubtų kitimo reikšmės;
  • Spektrinių gaubtuvių kryžminės koreliacijos koeficientai tarp spektrinių juostų.

Laikini ženklai:

  • Segmento trukmė, fonemos;
  • Segmento aukštis;
  • Segmento formos faktorius.

Spektrinės ir laiko savybės apibūdina kalbos signalą jo fizine ir matematine esme, remiantis trijų tipų komponentų buvimu:

  1. periodinės (toninės) atkarpos garso banga;
  2. neperiodinės garso bangos atkarpos (triukšmas, sprogmuo);
  3. sritis, kuriose nėra kalbos pauzių.

Spektrinės-laikinės savybės leidžia atspindėti skirtingų asmenų balso impulsų laiko eilučių formos ir spektro originalumą bei jų balso takų filtravimo funkcijų ypatybes. Apibūdinkite kalbos srauto ypatybes, susijusias su restruktūrizavimo dinamika artikuliaciniai organai kalbėtojo kalba, ir yra neatsiejamos kalbos eigos charakteristikos, atspindinčios kalbėtojo artikuliacinių organų santykio ar judesių sinchroniškumą.

Cepstraliniai ženklai

  • Mel-dažnio cepstralių koeficientai;
  • Tiesiniai prognozavimo koeficientai, pakoreguoti atsižvelgiant į netolygų žmogaus ausies jautrumą;
  • Įrašymo dažnio galios koeficientai;
  • Tiesinio numatymo spektro koeficientai;
  • Tiesinės prognozės cepstrum koeficientai.

Dauguma šiuolaikinių automatinio kalbos atpažinimo sistemų sutelkia dėmesį į žmogaus balso trakto dažnio atsako išgavimą, tuo pačiu atmetant sužadinimo signalo charakteristikas. Tai paaiškinama tuo, kad pirmojo modelio koeficientai užtikrina geresnį garso atskyrimą. Norint atskirti sužadinimo signalą nuo balso trakto signalo, naudojama cepstralinė analizė.

Amplitudės-dažnio savybės

  • Intensyvumas, amplitudė
  • Energija
  • Tono dažnis (FFR)
  • Formanto dažniai
  • Jitter – pagrindinio tono (triukšmo parametro) virpėjimo dažnio moduliavimas;
  • Shimmer - pagrindinio tono amplitudės moduliavimas (triukšmo parametras);
  • Radialinio pagrindo branduolio funkcija
  • Netiesinis operatorius Tiger

Amplitudės-dažnio ypatybės leidžia gauti įverčius, kurių reikšmės gali skirtis priklausomai nuo diskrečios Furjė transformacijos parametrų (lango tipo ir pločio), taip pat su nedideliais lango poslinkiais visame mėginyje. Kalbos signalas paskirstomas akustiškai oro aplinka sudėtingos struktūros garso vibracijos, kurios charakterizuojamos pagal jų dažnį (svyravimų skaičių per sekundę), intensyvumą (svyravimų amplitudę) ir trukmę. Amplitudės-dažnio ypatybės neša žmogui reikalingą ir pakankamą informaciją iš kalbos signalo su minimaliu suvokimo laiku. Tačiau šių funkcijų naudojimas neleidžia jas visapusiškai panaudoti kaip emociškai įkrautos kalbos nustatymo įrankį.

Netiesinės dinamikos požymiai

Netiesinės dinamikos požymių grupei kalbos signalas laikomas skaliariniu dydžiu, stebimu žmogaus balso takų sistemoje. Kalbos kūrimo procesą galima laikyti netiesiniu ir analizuoti netiesinės dinamikos metodais. Netiesinės dinamikos užduotis yra rasti ir išsamiai ištirti pagrindinius matematinius modelius ir realias sistemas, kurios kyla iš tipiškiausių savybių pasiūlymų. atskiri elementai, sistemos komponentai ir jų tarpusavio sąveikos dėsniai. Šiuo metu netiesinės dinamikos metodai yra pagrįsti fundamentalia matematine teorija, kuri remiasi Takenso teorema. (anglų kalba) rusų, kuri neatitinka griežtų matematinis pagrindas pagal netiesinės autoregresijos idėjas ir įrodo galimybę atkurti atraktoriaus fazinį portretą iš laiko eilutės arba iš vienos iš jos koordinačių. (Atraktorius suprantamas kaip taškų rinkinys arba poerdvė fazinė erdvė kuri artėja fazės trajektorija susilpnėjus pereinamiesiems veiksniams.) Signalų charakteristikų įverčiai iš rekonstruotų kalbos trajektorijų naudojami kuriant stebimų laiko eilučių netiesinius deterministinius fazinius-erdvinius modelius. Nustatyti atraktorių formos skirtumai gali būti naudojami diagnostikos taisyklėms ir ženklams, kurie leidžia atpažinti ir teisingai identifikuoti įvairias emocijas emociškai įkrautame kalbos signale.

Kalbos kokybės parinktys

Kalbos kokybės parametrai skaitmeniniais kanalais:

  • Skiemens kalbos suprantamumas;
  • Kalbos frazės suprantamumas;
  • Kalbos kokybė, palyginti su atskaitos kelio kalbos kokybe;
  • Kalbos kokybė realiomis darbo sąlygomis.

Pagrindinės sąvokos

  • Kalbos suprantamumas yra santykinis teisingai priimtų kalbos elementų (garsų, skiemenų, žodžių, frazių) skaičius, išreikštas procentais bendras skaičius perkelti elementai.
  • Kalbos kokybė – tai parametras, apibūdinantis subjektyvų kalbos garso įvertinimą bandomoje kalbos perdavimo sistemoje.
  • Normalus kalbos greitis – tai kalbėjimas greičiu, kai vidutinė kontrolinės frazės trukmė yra 2,4 s.
  • Pagreitintas kalbos greitis – kalbėjimas tokiu greičiu, kuriuo vidutinė kontrolinės frazės trukmė yra 1,5-1,6 s.
  • Kalbėjo balso atpažįstamumas – tai klausytojų gebėjimas atpažinti balso skambesį su konkrečiu anksčiau klausytojui žinomu asmeniu.
  • Semantinis suprantamumas yra teisingo reprodukcijos laipsnio rodiklis informacijos turinys kalba.
  • Integruota kokybė yra rodiklis, apibūdinantis bendrą klausytojo įspūdį apie gautą kalbą.

Taikymas

Pagrindiniu balso sistemų pranašumu buvo paskelbtas patogumas vartotojui. Kalbos komandos buvo skirtos tam, kad galutiniam vartotojui nereikėtų naudoti lietimo ir kitų įvesties metodų bei komandų.

  • Balso komandos
  • Teksto įvestis balsu

Sėkmingi kalbos atpažinimo technologijos naudojimo pavyzdžiai mobiliosios programos yra: adreso įvedimas balsu „Yandex.Navigator“, paieška balsu „Google“ dabar.

Be mobiliųjų įrenginių, kalbos atpažinimo technologija plačiai naudojama įvairiose verslo srityse:

  • Telefonija: įeinančių ir išeinančių skambučių apdorojimo automatizavimas sukuriant savitarnos balso sistemas, ypač skirtas: priimti informacinė informacija ir konsultavimas, paslaugų/produktų užsakymas, esamų paslaugų parametrų keitimas, apklausų, anketų vykdymas, informacijos rinkimas, informavimas ir bet kokie kiti scenarijai;
  • „Smart Home“ sprendimai: balso sąsaja, skirta „Smart Home“ sistemoms valdyti;
  • Buitinė technika ir robotai: elektroninių robotų balso sąsaja; buitinės technikos valdymas balsu ir kt.;
  • Staliniai ir nešiojamieji kompiuteriai: balso įvestis kompiuteriniai žaidimai ir programos;
  • Automobiliai: balso valdymas automobilio salone – pavyzdžiui, navigacijos sistema;
  • Socialinės paslaugos žmonėms su negalia.

Taip pat žr

  • Skaitmeninis signalo apdorojimas

Pastabos

  1. Davies, K.H., Biddulph, R. ir Balashek, S. (1952) Automatinis ištartų skaitmenų kalbos atpažinimas, J. Akustas. Soc. Am. 24 (6) p. 637-642
  2. Paskyra laikinai sustabdyta
  3. Šiuolaikinės kalbos atpažinimo problemos. 
  4. http://phonoscopic.rf/articles_and_publications/Lobanova_Search_of_identical_fragments.pdf
  5. http://booksshare.net/books/med/chistovich-la/1976/files/fizrech1976.djvu
  6. http://revistaie.ase.ro/content/46/s%20-%20furtuna.pdf
  7. http://www.ccas.ru/frc/papers/mestetskii04course.pdf
  8. Kalbos atpažinimas| 
  9. Kalbėjimo technologijų centras | 
  10. TVT. Gauta 2013 m. balandžio 20 d. Suarchyvuota 2013 m. balandžio 28 d.
  11. http://pawlin.ru/materials/neiro/sistemy_raspoznavaniya.pdf
  12. http://intsys.msu.ru/magazine/archive/v3(1-2)/mazurenko.pdf
  13. http://eprints.tstu.tver.ru/69/1/3.pdf
  14. http://www.terrahumana.ru/arhiv/10_04/10_04_25.pdf

Nuorodos

  • Aukštosios atestacijos komisijos specialybės disertacijos tema „Asmens psichofiziologinės būklės tyrimai pagal emocinius kalbos požymius“ santrauka 05.11.17, 05.13.01 - Prietaisas…
  • GOST R 51061-97.  KALBOS KOKYBĖS PARAMETRAI. 
  • MAŽOS GREITIES KALBOS PERDAVIMO SISTEMOS SKAITMENINIAIS KANALAIS. . Suarchyvuota nuo originalo 2013 m. balandžio 30 d.
  • Kalbos atpažinimo technologijos, www.xakep.ru

Garsinio pranešimo kalbos nustatymo technologijų būklės ir plėtros perspektyvų analizė. Kaip veikia „Yandex“ kalbos atpažinimo technologija „SpeechKit“ iš „Yandex“ |  Habrahabr

Kalbos atpažinimo technologija Yandex SpeechKit iš Yandex

Bendrieji apibrėžimai

  • · pagal žodyno dydį (ribotas žodžių rinkinys, didelis žodynas);
  • · priklausomai nuo garsiakalbio (nuo garsiakalbio priklausomos ir nuo garsiakalbio nepriklausomos sistemos);
  • · pagal kalbos tipą (ištisinė arba atskira kalba);
  • · pagal paskirtį (diktavimo sistemos, komandų sistemos);
  • · pagal naudojamą algoritmą (neuronų tinklai, paslėpti Markovo modeliai, dinaminis programavimas);
  • · pagal struktūrinio vieneto tipą (frazės, žodžiai, fonemos, dvifonai, alofonai);
  • · remiantis struktūrinių vienetų identifikavimo principu (atpažinimas pagal šabloną, leksinių elementų parinkimas).

Automatinės kalbos atpažinimo sistemose atsparumas triukšmui pirmiausia užtikrinamas naudojant du mechanizmus:

  • · Kelių, lygiagrečiai veikiančių, tų pačių kalbos signalo elementų izoliavimo metodų panaudojimas remiantis akustinio signalo analize;
  • · Lygiagretus savarankiškas segmentinio (foneminio) ir holistinio žodžių suvokimo vartojimas kalbos sraute.

Atpažinimo sistemų architektūra

Tipiška automatinio kalbos apdorojimo statistinių sistemų architektūra.

  • · Triukšmo mažinimo modulis ir naudingo signalo atskyrimas.
  • · Akustinis modelis – leidžia įvertinti kalbos segmento atpažinimą pagal panašumą garso lygiu. Kiekvienam garsui iš pradžių sukuriamas sudėtingas statistinis modelis, apibūdinantis šio garso tarimą kalboje.
  • · Kalbos modelis – leidžia nustatyti labiausiai tikėtinas žodines sekas. Kalbos modelio kūrimo sudėtingumas labai priklauso nuo konkrečios kalbos. Taigi anglų kalbai pakanka naudoti statistinius modelius (vadinamuosius N-gramus). Labai linksniuotoms kalboms (kalboms, kuriose yra daug to paties žodžio formų), įskaitant rusų kalbą, kalbos modeliai, sukurti tik naudojant statistiką, nebeduoda tokio efekto – reikia per daug duomenų, kad būtų galima patikimai įvertinti statistinius ryšius tarp žodžius. Todėl naudojami hibridiniai kalbos modeliai, kuriuose naudojamos rusų kalbos taisyklės, informacija apie kalbos dalį ir žodžio formą bei klasikinis statistinis modelis.
  • · Dekoderis yra programinė atpažinimo sistemos dalis, kuri sujungia duomenis, gautus atpažinimo metu iš akustinių ir kalbos modelių, ir pagal jų derinį nustato labiausiai tikėtiną žodžių seką, kuri yra galutinis tęstinio kalbos atpažinimo rezultatas.

Atpažinimo etapai:

  • 1. Kalbos apdorojimas pradedamas nuo kalbos signalo kokybės įvertinimo. Šiame etape nustatomas trukdžių ir iškraipymo lygis.
  • 2. Įvertinimo rezultatas patenka į akustinio pritaikymo modulį, kuris valdo atpažinimui reikalingų kalbos parametrų skaičiavimo modulį.
  • 3. Signate identifikuojamos kalbos turinčios sritys, įvertinami kalbos parametrai. Fonetinės ir prozodinės tikimybinės charakteristikos nustatomos sintaksinei, semantinei ir pragmatikai analizei. (Įvertinkite informaciją apie kalbos dalį, žodžių formą ir statistinius ryšius tarp žodžių.)
  • 4. Toliau kalbos parametrai patenka į pagrindinį atpažinimo sistemos bloką – dekoderį. Tai komponentas, kuris suderina įvesties kalbos srautą su informacija, saugoma akustiniuose ir kalbos modeliuose, ir nustato labiausiai tikėtiną žodžių seką, kuri yra galutinis atpažinimo rezultatas.
  • · Valdymas balsu
  • · Balso komandos
  • · Teksto įvestis balsu
  • · Paieška balsu

Sėkmingi kalbos atpažinimo technologijos naudojimo mobiliosiose programose pavyzdžiai: adreso įvedimas balsu „Yandex Navigator“, „Google“ dabar balso paieška.

Be mobiliųjų įrenginių, kalbos atpažinimo technologija plačiai naudojama įvairiose verslo srityse:

  • · Telefonija: įeinančių ir išeinančių skambučių apdorojimo automatizavimas, sukuriant savitarnos balso sistemas, ypač skirta: informacinės informacijos gavimui ir konsultavimui, paslaugų/produktų užsakymui, esamų paslaugų parametrų keitimui, apklausų, anketų vykdymui, informacijos rinkimui, informavimui ir bet kokie kiti scenarijai;
  • · Išmaniojo namo sprendimai: balso sąsaja išmaniųjų namų sistemoms valdyti;
  • · Buitinė technika ir robotai: elektroninių robotų balso sąsaja; buitinės technikos valdymas balsu ir kt.;
  • · Staliniai ir nešiojamieji kompiuteriai: balso įvestis kompiuteriniuose žaidimuose ir programose;
  • · Automobiliai: balso valdymas automobilio salone – pavyzdžiui, navigacijos sistema;
  • · Socialinės paslaugos žmonėms su negalia.

programinės įrangos automatizavimo įvesties atpažinimas

  • 9. Fonologinės pozicijos. Stiprios ir silpnos fonemos.
  • 10. Balsių fonemų pozicinės kaitos. Kiekybinis ir kokybinis balsių fonemų redukavimas.
  • 11. Priebalsių fonemų pozicinės kaitos. Asimiliacija ir disimiliacija pagal kurtumą/balsą ir kietumą/minkštumą.
  • 12. Istorinės fonemų kaitos.
  • 13. Redukuotų balsių fonemų kritimas ir šio reiškinio pasekmės.
  • 14. Kaitos, susijusios su nosies garsų istorija senojoje rusų kalboje.
  • 15. Užpakalinių kalbų palatalizacija.
  • 17. Fonetinė transkripcija. Fonemine transkripcija
  • 18. Skiemuo. Skiemenų skirstymas. Skiemenų tipai.
  • 19. Fonetinis žodis. Akcentas
  • 20. Kalbos taktiškumas. Intonacija
  • 21. Kirčiavimas. Intonacijos struktūros
  • 21. Frazė. Intonacija
  • 22. Ortopijos samprata
  • 23. Pagrindinės rusų literatūrinio tarimo taisyklės.
  • 24. Balsių tarimas kirčiuojant. Nekirčiuotų balsių tarimas.
  • 25. Atskirų priebalsių garsų tarimas.
  • 26. Priebalsių grupių tarimas.
  • 27. Kai kurių gramatinių formų tarimas.
  • 28. Kai kurių santrumpų tarimas. Svetimžodžių tarimo ypatybės.
  • 29. Sunkūs streso įvaldymo atvejai rusų kalba.
  • 30. Rusų literatūrinio tarimo raida.
  • 31. Gramatikos kodavimas
  • 32. Semantinis kodavimas. Dviejų argumentų (laikinų ženklų): priežastingumas.
  • 33. Semantinis kodavimas. Dviejų argumentų (laikinieji ženklai): pasekmė, rezultatas, tikslas.
  • 34. Semantinis kodavimas. Dviejų argumentų (laikinieji ženklai): transformacija, kaita
  • 35. Semantinis kodavimas. Dviejų argumentų (laikinieji ženklai): sąveika, grupavimas, bendruomenė, asociacija
  • 36. Semantinis kodavimas. Dviejų argumentų (laikinieji ženklai): atsiskyrimas, įtaka, sąlyga, įvykis.
  • 37. Semantinis kodavimas. Dviejų argumentų (laikinai ženklai): atitiktis, kontrolė, pavaldumas, priklausomybė.
  • 38. Semantinis kodavimas. Vieno argumento (pastovūs ženklai): savybė, būtinybė, galimybė, tikimybė, taip, ne.
  • 39. Semantinis kodavimas. Vienas argumentas (pastovūs ženklai): tiesa, melas.
  • Semantinis kodas. Jo tikslai. Tikslas. Konstravimo principas. Galimybės.
  • Semantinio kodo paskirtis. Sąvoka „prasmė“.
  • Semantinio kodo paskirtis. Tekstas. Informacija. Hipertekstas kuriant informaciją.
  • 43. Gramatinė ir semantinė analizė semantinio kodavimo metu.
  • 44. Rusų kalbos semantinis suderinamumo žodynas ir asociatyvinis semantinio kodavimo žodynas.
  • Semantinio kodo paskirtis. Sistemos izomorfizmas.
  • Semantinio kodo paskirtis. Būtinumo ir pakankamumo principas.
  • Semantinio kodo paskirtis. Klasių ir poklasių jungiamumas
  • 48. Semantinio kodo paskirtis. Hierarchijos/nehierarchijos principas.
  • 49. Semantinio kodo paskirtis. Sisteminė metafora.
  • 50. Situacinis (situacinis) semantinis kodas.
  • 51. Semantinis kodavimas. Lygiavimo-interpretacinis kodas. Matryoshka kodas.
  • 52. Pagrindinės kalbos sąsajos užduotys ir pagrindinės sąvokos.
  • 53. Kalbos atpažinimo ir sintezės problemos istorinė apžvalga.
  • 54. Automatinės kalbos sintezės sistemos. Praktiniai kalbos sąsajos pritaikymai.
  • 55. Automatinės kalbos atpažinimo sistemos. Praktiniai kalbos sąsajos pritaikymai.
  • 56. Kalbos sąsajos kalbiniai pagrindai. Lingvistikos panaudojimas diegiant kalbos sistemas.
  • 57. Kalbos signalo sandara. Analizė ir sintezė. Spektrinės-laikinės kalbos signalo charakteristikos.
  • 58. Kalbos signalo informacinė ir moduliacinė struktūra.
  • 59. Kalbos signalų sintezės metodai. Apibendrinti matematiniai modeliai, skirti apibūdinti kalbos signalus.
  • 60. Kalbos signalų sintezės metodai. Geometrinis balso trakto modelis.
  • 61. Kalbos signalų sintezės metodai. Formanto modelis.
  • 62. Kalbos signalų sintezės kompiliavimo metodai.
  • 63. Kalbos signalų analizės metodai.
  • 64. Kalbos signalo skaitmeninio filtravimo būdas. Spektrinė analizė naudojant FFT algoritmus. Skaitmeninio filtravimo metodas
  • Spektrinė analizė naudojant FFT algoritmus
  • 65. Spektrinė analizė, pagrįsta tiesiniu numatymu. Formantinis-parametrinis kalbos signalo aprašymas. Spektrinė analizė, pagrįsta tiesiniu numatymu
  • Formantinis-parametrinis kalbos signalo aprašymas
  • 66. Cepstralių koeficientų metodas. Kalbos suvokimo ypatumai. Žmogaus imlaus kalbos suvokimo savybės. Cepstralinio koeficiento metodas
  • 67. Receptinio kalbos signalų suvokimo savybės. Garsinių (fonetinių) kalbos signalo ypatybių pobūdis. Receptinio kalbos signalų suvokimo savybės
  • Garsinių (fonetinių) kalbos signalo ypatybių pobūdis
  • 68. Minimalių semantinių skiriamųjų kalbos elementų suvokimo ypatybės
  • 69. Kalbos sintezė iš teksto. Tekstinio kalbos sintezatoriaus struktūra.
  • Tekstinio kalbos sintezatoriaus struktūra Pagrindinės sąvokos:
  • 70. Kalbinis procesorius. Preliminarus teksto apdorojimas. Teksto apdorojimas po frazės.
  • Išankstinis teksto apdorojimas
  • Teksto apdorojimas po frazės
  • 71. Testo apdorojimas po žodžio. Pavyzdys, kaip veikia kalbinis procesorius. Žodis po žodžio teksto apdorojimas
  • Pavyzdys, kaip veikia kalbinis procesorius
  • 72. Prozodinis procesorius
  • 73. Fonetinis procesorius. Artikuliacinis-fonetinis procesorius. Formant fonetinis procesorius.
  • 74. Allophone fonetinis procesorius. Akustinis procesorius.
  • 75. Kalbos takto geometrijos priartinimas. Akustinis procesorius, pagrįstas kompiliacinės kalbos sintezės metodais.
  • 76. Automatinių kalbos atpažinimo sistemų klasifikacija. Automatiniai kalbos atpažinimo metodai.
  • 77. Kalbos atpažinimo metodų klasifikacija.
  • 78. Dinaminio programavimo metodas.
  • 79. Paslėptų Markovo modelių metodas.
  • Automatinės kalbos atpažinimo sistemos (ASRR) yra sistemos, kurios paverčia įvestą kalbą (kalbos signalą) į atpažintą pranešimą. Tokiu atveju atpažintas pranešimas gali būti pateiktas tiek šio pranešimo teksto forma, tiek

    nedelsiant konvertuojama į formą, patogią tolesniam apdorojimui, kad būtų suformuotas sistemos atsakymas. Iš pradžių automatinei kalbos atpažinimo sistemai pavesta tekstą paversti kalba. Todėl į Anglų literatūrašios sistemos vadinamos Speech To Text sistema. Dažnai automatinės kalbos atpažinimo sistemos dar vadinamos tiesiog kalbos atpažinimo sistemomis (SRR).

    Supaprastinta automatinės kalbos atpažinimo sistemos blokinė schema parodyta fig.

    Pagal kalbos signalų analizės modelį suprasti bloką, kurio užduotis apima įvesties signalo analizę, pirma, siekiant jį klasifikuoti kaip kalbos signalą, ir, antra, atskirti gaunamo signalo komponentus, kurie yra pagrindiniai

    gauto pranešimo atpažinimas. Tokie komponentai apima parametrus, apibūdinančius kalbą, panašius į tuos, kurie susidaro kalbos sintezės procese. Nurodytų parametrų rinkinys priklauso nuo pasirinkto atpažinimo būdo.

    Kalbos atpažinimo ir sprendimų priėmimo modelis– tai blokas, kuriame, remiantis parametrų sekos analize, gauta iš pirmojo bloko, generuojamas atpažintas pranešimas. Pavyzdžiui, jei kalbai apibūdinti naudojamas formanto modelis, tada, remiantis pirmajame bloke gautais formanto dažniais, sukuriama atpažintų fonemų, sudarančių įvesties pranešimą, seka. Tokiu atveju priimamas sprendimas, ar įvesties pranešimas atpažįstamas teisingai. Priimant sprendimą visų pirma galimi šie sprendimai: žinutė atpažįstama teisingai (to patvirtinimas yra natūralios kalbos normas atitinkantis tekstas) arba

    pranešimas nebuvo atpažintas arba buvo atpažintas neteisingai (toks sprendimas priimamas, jei atpažintame pranešime yra akivaizdžių klaidų, kurias sunku automatiškai ištaisyti arba yra visiškai nesąmonė).

    Šie juos apibūdinantys parametrai gali būti nurodyti kaip CAPP taikomi apribojimai:

    Pripažintos kalbos tipas (tarimas po žodžio su pauzėmis kalbos komandų stiliaus; aiškus tarimas be pauzių „diktavimo“ stiliumi; spontaniška kalba);

    Žodyno apimtis (ribota iki 100, 200 ir kt. žodžių; neribota);

    Priklausomybės nuo kalbėtojo laipsnis (priklauso nuo kalbėtojo; nuo kalbėtojo nepriklausomas);

    Sintaksiniai apribojimai ( atskirus žodžius; tipinės frazės; dirbtinė kalba; natūrali kalba);

    Kalbos signalų priėmimo sąlygos (kontaktiniai mikrofonai; mikrofonai, esantys didesniu kaip 1 m atstumu);

    SRR naudojimo sąlygos (silpni arba stiprūs trukdžiai);

    Atpažinimo patikimumas.

    Praktinės kalbos sąsajos programos

    Prieš pereinant prie pavyzdžių praktinis naudojimas kalbos sąsają, palyginkime ją su šiuo metu įprasčiausiomis vartotojo sąveikos su kompiuteriu priemonėmis: klaviatūra ir ekranu. Reikėtų pažymėti bent tris esminių skirtumų

    kalbos sąsaja: 1) akivaizdus klaviatūros ir ekrano trūkumas yra tas, kad norint bendrauti su kompiuteriu žmogus turi būti specialiai apmokytas. Tuo pačiu metu kalba yra natūrali sąsaja bet kam, net ir nemokytam žmogui. Kalba smarkiai sumažina psichologinį atstumą tarp žmogaus ir kompiuterio. Jei pasirodo kalbos sąsaja

    , tuomet kompiuterių vartotojų ratas gali tapti neribotas;

    2) pati kalba niekaip nėra mechaniškai susieta su kompiuteriu ir gali būti prijungta prie jo per ryšio sistemas, pavyzdžiui, telefoną. Kalbos sąsaja sumažina fizinį atstumą tarp žmogaus ir kompiuterio. Tai dar labiau išplečia potencialių kompiuterių vartotojų ratą, o kalbos sąsaja tampa idealia priemone kuriant masinės informacijos paslaugų sistemas; 3) galite tvarkyti kompiuterį visiškoje tamsoje, su užmerktos akys , kai rankos užimtos valdymo svirtimis, surištomis rankomis ir kitose ekstremaliose situacijose. Ši savybė suteikia komunikacijos efektyvumą ir mobilumą, atlaisvina rankas ir iškrauna vizualinį suvokimo kanalą priimant informaciją. Tai nepaprastai svarbu, pavyzdžiui, didelės energijos sistemos valdytojui arba lėktuvo pilotui ir automobilio vairuotojui. Be to, kompiuterių sistemos

    tapti prieinamesni žmonėms su regėjimo negalia.

  • Finansų rinkos turi tendenciją kurti modelius, kurie dažnai numato būsimą judėjimo kryptį. Kainų modeliai formuojami iš nuoseklių smailių ir duburių derinių, o kiekvienas modelis turi savo formavimo mechanizmą ir specifinę grafinę formą. Sandorių apimties dinamika veikia kaip tam tikro modelio egzistavimą patvirtinantis veiksnys. Visi modeliai paaiškinti rinkos dalyvių psichologijos požiūriu.
    Grafinis metodas yra vienas iš pagrindinių kainų modelių atpažinimo metodų. Atkreipkite dėmesį, kad tos ar kitos figūros nustatymo kriterijai yra neaiškūs, visi signalai suvokiami subjektyviai, klasikiniai metodai yra chaotiški, o už jų nėra griežtos sistemos. Nepaisant trūkumų, grafiniai metodai naudingas praktinis pritaikymas ir yra rimtos techninės analizės pagrindas.
    Grafinių raštų atpažinimas ir jų analizė – daug darbo reikalaujantis darbas, atimantis iš prekybininko daug laiko. Net labiausiai patyręs investicijų analitikas, turintis geriausią programinę įrangą, gali stebėti nuo 50 iki 75 vertybinių popierių per dieną. Tai per maža, atsižvelgiant į pasaulinių akcijų rinkų mastą.
    Neturėdamas išsamios informacijos apie kainų modelius, techninis analitikas ir toliau praleis daugybę prekybos galimybių. Investuotojams reikia greitos, paprastos ir savalaikės prieigos prie informacijos apie nusistovėjusius grafinius modelius daugelyje finansines priemones siekiant pagerinti prekybos efektyvumą. Pastaruoju metu viskas didesnis paskirstymas gauti
    automatinės diagramų atpažinimo programos – CPR (Chart Pattern Recognition).
    Atpažinimo sistema. Galingą diagramų raštų atpažinimo sistemą prekybininkui teikia Kanados įmonė Recognia Inc. Sukurta technologija leidžia analizuoti kelias vertybinių popierių rinkas. Specialistui tereikia nustatyti paieškos parametrus (pagal finansinę priemonę, pagal tam tikrą kainos modelį ir pan.) Programa „nuskaito“ diagramas ir identifikuoja priemones, kuriomis galima atlikti finansines operacijas. šiuo metu pats racionaliausias dalykas. Kanados įmonė Recognia Inc. teikia internetiniams brokeriams, fondų valdytojams ir finansinės informacijos teikėjams paslaugą, kuri automatiškai identifikuoja įvykius ir modelius naudojant patentuotą technologiją.
    „Recognia Service“ pagalba investuotojas turi galimybę:
    įvertinti konkrečios finansinės priemonės perspektyvas, peržiūrint naujausius techninius įvykius;
    rasti naujų galimybių atidaryti pozicijas peržiūrint vertybinius popierius, kuriems Recognia aptiko specifinį kainų modelį;
    nustatyti, ar nustatytas įvykis jam reikšmingas, ištyręs jo charakteristikas ir peržiūrėdamas grafiką;
    nustatyti įspėjimus apie konkrečius vertybinius popierius ar prekybos platformas (pasirūpinti, kad būtų generuojami įspėjamieji signalai, jei diagramose aptinkami pasirinkti vertybiniai popieriai);
    daugiau sužinoti apie techninę analizę iš pateiktos mokomosios medžiagos.
    „Recognia Service“ darbe yra keturi etapai (6.1 pav.).
    1) duomenys apie viešai parduodamas finansines priemones, įskaitant akcijas, obligacijas, žaliavas, valiutas ir indeksus, automatiškai siunčiami į Recognia pasibaigus prekybai. Šiuo metu „Recognia“ kiekvieną dieną analizuoja daugiau nei 20 000 vertybinių popierių, kuriais prekiaujama Šiaurės Amerikos biržose, ir planuoja įtraukti šimtus finansinių priemonių iš kitų pasaulinių rinkų;
    2) Naudodama patentuotus modelių atpažinimo algoritmus ir neuroninių tinklų technologijas, Recognia reguliariai analizuoja šių finansinių priemonių kainų duomenis, automatiškai aptikdama esamus ir istorinius kainų modelius diagramose. Kuriant šią technologiją dalyvavo techninės analizės srities ekspertai;
    3) analizės rezultatus gauna įmonės klientai, kurie savo interneto svetainėse sukuria atitinkamas skiltis;
    4) investuotojai, brokeriai ir portfelio valdytojai naudojasi modeliais, kad atrastų naujas prekybos galimybes ir patvirtintų kitais būdais gautus signalus. Klientai gali nemokamai pateikti informaciją apie nustatytus kainų modelius arba organizuoti mokamą paslaugą. Galutiniai vartotojai sukuria užklausą identifikuoti šablonus naudodami bet kokius turimus parametrus (apsaugos pavadinimą, biržą, sektorių, modelio tipą ir kt.). Svetainėje https://example.recognia.com/demo pateikiama demonstracinė „Recognia On-Line Broker“ produkto versija. , kuri suteikia prieigą prie visų įmanomų funkcijų, tačiau su ribotu finansinių priemonių rinkiniu ir informacijos apie kainas gavimu su vėlavimais.
    „Recognia On-Line Broker Product“ investuotojams suteikia šiuos įrankius:
    Techninio įvykio atsargos Scrccner (6.2 pav.) sudaro finansinių priemonių, atitinkančių vartotojo įvestus kriterijus, sąrašą. Investuotojas turi nustatyti paieškos parametrus, apibūdinančius norimą techninės analizės įvykį: tipą, datą, trukmę, meškų ar didėjimo signalus ir kt. Vartotojas gali įvesti ir kitus paieškos kriterijus; birža, pramonės šaka, priemonės tipas, prekybos apimtys ir kainų lygis. Pavyzdžiui, naftos ir dujų sektoriuje reikia rasti akcijų, kurios pastaruoju metu demonstravo kainų pasikeitimo modelį – „dvigubą dugną“. Tikimasi, kad tokių vertybinių popierių kaina kils aukštyn;
    Techninių įvykių paieška. Ši funkcija leidžia gauti visų naujausių konkrečios saugos ar indekso techninės analizės įvykių sąrašą. Visi pasirinkto darbo įvykiai sugrupuoti į keturias skirtingas klases:
    a) klasikiniai raštai (Classic Pattern) - tradiciniai grafiniai raštai, pavyzdžiui, „dvi viršus“ arba „galva ir pečiai“;
    b) trumpalaikiai raštai arba žvakidžių raštai;
    c) rodikliai (Indicator) – įvykiai, pagrįsti slankiaisiais vidurkiais;
    d) osciliatoriai (Osciliatorius), pavyzdžiui, MACD arba RSI.
    Atpažinimo rezultatų vizualizavimas. Fig. 6.3 paveiksle pateiktas Recognia grafinio modelio identifikavimo pavyzdys. Investuotojas gauna šią informaciją: trumpas aprašymasįvykis (modelis), įvykio data ir tikėtinas jenos tikslinis diapazonas. Diagramoje yra linijos, sudarančios šabloną, piktograma, nurodanti įvykio datą, ir tendencijų linijos.
    Q Recognita Inc. ZOOd
    „Chart Pattem Recognition for MetaStock“ (CPR) yra papildoma „MetaStock“ ekspertų programa, leidžianti automatiškai atpažinti šešis klasikinius tendencijų pasikeitimo modelius (galvos ir pečių viršuje ir apačioje, trigubai viršuje, trigubai apačioje, dvigubai viršuje) ir tris tęsinius. tendencijų modeliai
    („simetriškas trikampis“, „didėjantis trikampis“ ir „mažėjantis trikampis“). Šie diagramų modeliai yra patikimiausi.
    Kai programa identifikuoja šabloną, ekspertų komentarų blokas, atsakingas už rekomendacijų teikimą prekybininkui, kai diagramoje aptinkami šablonai, informuoja, kur geriausia pateikti apsauginius sustabdymo orderius ir kokia yra numatoma turto kaina. Programa pažymi identifikuotą nenaują šabloną diagramoje ir generuoja signalus įvesti ir išeiti iš pozicijos. CPR leidžia greitai nuskaityti kelias diagramas ieškant kainų modelių.
    1. Galvos ir pečių modelio atpažinimas. Pagrindinės šio modelio taisyklės:
    1) ankstesnė pakilimo tendencija: trys ar daugiau smailių iš eilės;
    2) kairysis petys seka po korekcinio nuosmukio;
    3) pakilti į naują lygį virš kairiojo peties;
    4) jena nukrenta iki ankstesnio minimumo lygio;
    5) trečias įkopimas nepasiekia vidurinės smailės viršaus;
    6) uždarymas žemiau iškirptės.
    Kai tik kaina nukrenta žemiau kaklo lygio, CPR programa duoda signalą įvesti trumpąją poziciją kitos operacijos pradžioje. prekybos sesija. Minimali tikslinė kaina nustatoma brėžiant atstumą nuo „kaklo“ linijos išsiveržimo taško nuo „galvos“ viršutinio taško iki kitos įdubos lygio. Maksimali tikslinė kaina yra minimali pirmosios ankstesnės kilimo tendencijos juostos kaina. Informacija apie tikslines kainas atsispindi Eksperto komentare.
    Jei minimali tikslinė kaina nepasiekiama per tam tikrą laikotarpį arba kaina pakyla virš iškirptės, modelis atšaukiamas. Maksimalus laikotarpis minimaliai tikslinei kainai pasiekti yra lygus atstumui nuo kairiojo „peties“ iki dešinės.
    2. „Trigubo viršaus“ rašto atpažinimas. Pagrindinės šio modelio taisyklės:
    Ankstesnė pakilimo tendencija: trys ar daugiau smailių iš eilės;


    4) kainos sumažinimas iki ankstesnio minimumo lygio;
    5) trečiasis pakilimas pasiekia ankstesnių dviejų viršūnių lygį;
    6) uždarymas žemiau atramos linijos.
    Kai tik kaina nukrenta žemiau palaikymo lygio, SRY duoda signalą įvesti trumpąją poziciją kitos prekybos sesijos pradžioje. Minimali tikslinė kaina nustatoma atidedant vidutinio ūgio trys viršūnės iki atramos linijos žemyn nuo išsiveržimo taško. Maksimali tikslinė kaina yra minimali pirmosios ankstesnės kilimo tendencijos juostos kaina.

    3. „Dvigubo viršaus“ modelio atpažinimas. Pagrindinės šio modelio taisyklės:

    2) kairėje viršuje seka korekcinis nuosmukis;
    3) naujas pakilimas iki kairiojo piko lygio;
    4) uždarymas žemiau ankstesnės depresijos lygio.
    Kai tik kaina nukrenta žemiau palaikymo lygio, SRY duoda signalą įvesti trumpąją poziciją kitos prekybos sesijos pradžioje. Minimali tikslinė kaina nustatoma brėžiant pirmosios smailės aukštį iki atramos linijos žemyn nuo išsiveržimo taško. Maksimali tikslinė kaina yra minimali pirmosios ankstesnės kilimo tendencijos juostos kaina.
    Jei minimali tikslinė kaina nepasiekiama per tam tikrą laikotarpį arba kaina pakyla virš palaikymo linijos, modelis atšaukiamas. Maksimalus laikotarpis minimaliai tikslinei kainai pasiekti yra lygus atstumui nuo kairiojo piko iki dešiniojo.
    4. „Kylančio trikampio“ modelio atpažinimas. Pagrindinės šio modelio taisyklės:
    1) ankstesnė augimo tendencija: dvi ar daugiau smailių iš eilės;
    2) kairėje viršuje seka korekcinis nuosmukis;
    3) naujas pakilimas iki kairiojo piko lygio;
    4) korekcija sudaro antrą aukštesnę nei ankstesnę įdubą;
    5) pakilti virš ankstesnės smailės – išsiveržimo taško.
    Tendencijos linijos, nubrėžtos išilgai trikampio viršūnių ir dugno, susilieja. Horizontaliai pajudėjus 2/3 ar 3/4 trikampio ilgio, kaina dažniausiai jį sulaužo ankstesnės tendencijos kryptimi. Jei išsiveržimas neįvyksta prieš įveikiant 75% trikampio ilgio atstumą, modelis atšaukiamas.
    Kai tik kaina pakyla virš pasipriešinimo lygio, SRY pateikia pirkimo signalą kitos prekybos sesijos pradžioje. Minimalus laikotarpis, per kurį reikia pasiekti tikslinę kainą, yra lygus atstumui nuo pirmos viršaus/apačios iki antrojo viršaus/apačios. Tikslinė kaina nustatoma pratęsiant pusę trikampio pagrindo ilgio į viršų nuo išsiveržimo taško.
    5. „Nusileidžiančio trikampio“ modelio atpažinimas. Pagrindinės šio modelio taisyklės:
    ankstesnė nuosmukio tendencija: dvi ar daugiau depresijų iš eilės;
    2) kairioji įduba seka korekcinį pakilimą;
    3) naujas sumažėjimas iki kairiosios ertmės lygio;
    4) pakilimas sudaro antrą viršūnę žemiau ankstesnės;
    5) kritimas žemiau ankstesnės depresijos lygio yra prasiveržimo taškas.
    Kai tik flail nukrenta žemiau palaikymo lygio, SRY duoda signalą įvesti trumpąją poziciją kitos prekybos sesijos pradžioje (6.4 pav.). Jei proveržis neįvyksta prieš įveikiant 75% trikampio ilgio atstumą, modelis atšaukiamas. Minimalus laikotarpis, per kurį reikia pasiekti tikslinę kainą, yra lygus atstumui nuo pirmos viršaus/apačios iki antrojo viršaus/apačios. Tikslinė kaina nustatoma pratęsiant pusę trikampio pagrindo ilgio žemyn nuo išsiveržimo taško.
    6. „Simetrinio trikampio“ modelio atpažinimas. Pagrindinės šio modelio taisyklės:
    1) ankstesnė didėjimo arba mažėjimo tendencija: dvi ar daugiau iš eilės smailių;
    2) kairioji smailė (lovis) seka korekcinį nuosmukį (kilimą);
    3) pakilti (sumažėti) žemiau (aukščiau) ankstesnės smailės (lovio) lygio;
    4) nuosmukis (kilimas) sudaro antrą įdubimą (viršuje) virš (žemiau) ankstesnio;
    5) tendencijos linijos proveržis.
    Kai kaina pakyla virš pasipriešinimo lygio, CPR pateikia pirkimo signalą kitos prekybos sesijos pradžioje. Kai kaina nukrenta žemiau palaikymo lygio, kitos prekybos sesijos pradžioje CPR duos signalą įvesti trumpąją poziciją. Jei išsiveržimas neįvyksta prieš įveikiant 75% trikampio ilgio atstumą, modelis atšaukiamas. Minimalus laikotarpis tikslinei kainai pasiekti yra lygus atstumui nuo pirmos viršaus/apačios iki antrojo viršaus/apačios. Tikslinė kaina nustatoma brėžiant trikampio pagrindo dalinį ilgį nuo išsiveržimo taško.
    CPR turi įrankius duomenims analizuoti ir klasifikuoti kaip papildomą programinę įrangą Excel paketui: AnalyzerXL, DownioaderXL, RTQuotesXL, PredictorXL, BulkQuotesXL, ClassifierXL, PortfolioXL, OptionsXL, jų galimybės pateiktos lentelėje. 6.1.
    Pastaruoju metu atsirado naujos programinės įrangos sistemos, skirtos atpažinti diagramų šablonus, pavyzdžiui: Pattem z – Pattem Recognition Software (http://www.thepattemsite.com); Ramp-chart Pattern Recognition Scanner (http; // www.newadawn.com); Omni prekybininkų diagramos modelio atpažinimo modulis 2 (http://www.onmitrader.com); IBFX – PRS – modelio atpažinimo sistema (http://www.ibfx.com)



    Ar jums patiko straipsnis? Pasidalinkite su draugais!