Үнийн хэв маягийг автоматаар таних систем гэж юу вэ. Яриа таних системийн хэрэглээ

1964 онд Нью-Йоркийн компьютерийн үзэсгэлэнд IBM Shoebox-ыг танилцуулсан.

Арилжааны яриа таних хөтөлбөрүүд ерээд оны эхээр гарч ирэв. Тэдгээрийг ихэвчлэн гар гэмтлийн улмаас их хэмжээний текст бичиж чаддаггүй хүмүүс ашигладаг. Эдгээр програмууд (жишээлбэл, Dragon NaturallySpeaking, VoiceNavigator) нь хэрэглэгчийн дуу хоолойг текст болгон хөрвүүлж, улмаар түүний гарыг хөнгөвчлөх болно. Ийм хөтөлбөрүүдийн орчуулгын найдвартай байдал тийм ч өндөр биш боловч олон жилийн туршид аажмаар сайжирсан.

Тооцоолох чадвар нэмэгдсэн хөдөлгөөнт төхөөрөмжүүдяриа таних функц бүхий тэдэнд зориулсан программ зохиох боломжтой болгосон. Ийм хөтөлбөрүүдийн дунд үүнийг тэмдэглэх нь зүйтэй Microsoft програмДуу хоолойгоо ашиглан олон програмыг ажиллуулах боломжийг олгодог дуут команд. Жишээлбэл, та тоглуулагчдаа хөгжим тоглуулах эсвэл шинэ баримт бичиг үүсгэх боломжтой.

Хүний яриаг автоматаар нэгтгэж, таних ухаалаг ярианы шийдэл нь интерактив дуут системийг (IVR) хөгжүүлэх дараагийн алхам юм. Интерактив утасны програм ашиглах нь одоогоор загварын чиг хандлага биш, харин амин чухал хэрэгцээ. Холбоо барих төвийн операторууд болон нарийн бичгийн дарга нарын ажлын ачааллыг бууруулж, хөдөлмөрийн зардлыг бууруулж, үйлчилгээний системийн бүтээмжийг нэмэгдүүлэх нь ийм шийдлүүдийг хэрэгжүүлэх боломжтойг нотлох ашиг тусын зөвхөн нэг хэсэг юм.

Гэсэн хэдий ч ахиц дэвшил зогсохгүй байгаа бөгөөд саяхан утсаар ярьж байна интерактив програмуудЯриа таних, нэгтгэх автомат систем улам бүр ашиглагдаж байна. Энэ тохиолдолд дуут порталтай харилцах нь илүү байгалийн болж хувирдаг, учир нь түүний доторх сонголтыг зөвхөн аялгуугаар залгахаас гадна дуут командыг ашиглан хийж болно. Үүний зэрэгцээ таних систем нь чанга яригчаас хамааралгүй, өөрөөр хэлбэл ямар ч хүний ​​дуу хоолойг хүлээн зөвшөөрдөг.

Яриа таних технологийн дараагийн алхам бол Чимээгүй ярианы интерфэйс (SSI) гэж нэрлэгддэг хөгжүүлэлт гэж үзэж болно. Эдгээр яриа боловсруулах системүүд нь ярианы дохиог үе мөчний эхний үе шатанд хүлээн авах, боловсруулахад суурилдаг. Яриа таних хөгжлийн энэ үе шат нь хоёр чухал сул талуудаас үүдэлтэй орчин үеийн системүүдтаних: дуу чимээнд хэт мэдрэмтгий байх, түүнчлэн таних системд нэвтрэх үед тодорхой, тодорхой ярих хэрэгцээ. SSI арга нь шинэ мэдрэгчгүйгээр ашиглах явдал юм нөлөөлсөнболовсруулсан акустик дохионы нэмэлт болгон дуу чимээ.

Системийн төрлүүд

Өнөөдөр яриа таних хоёр төрлийн систем байдаг - "үйлчлүүлэгчид суурилсан" болон "үйлчлүүлэгч-сервер" зарчмаар ажилладаг. Үйлчлүүлэгч-серверийн технологийг ашиглах үед ярианы командыг хэрэглэгчийн төхөөрөмжид оруулж, интернетээр алсын сервер рүү дамжуулж, түүнийг боловсруулж, команд хэлбэрээр төхөөрөмж рүү буцаана (Google Voice, Vlingo гэх мэт). ; Серверийн хэрэглэгчдийн тоо олон байдаг тул таних систем нь сургалтанд хамрагдах томоохон суурийг хүлээн авдаг. Эхний сонголт нь бусад дээр ажилладаг математикийн алгоритмуудховор тохиолддог (Speereo програм хангамж) - энэ тохиолдолд командыг хэрэглэгчийн төхөөрөмжид оруулж, тэнд боловсруулдаг. "Үйлчлүүлэгч дээр" боловсруулалтын давуу тал нь хөдөлгөөнт байдал, харилцаа холбооны хүртээмжээс хараат бус байдал, алсын төхөөрөмж ажиллуулах явдал юм. Тиймээс "үйлчлүүлэгч дээр" ажиллаж байгаа систем нь илүү найдвартай мэт боловч заримдаа хэрэглэгчийн талд байгаа төхөөрөмжийн хүчээр хязгаарлагддаг.

Технологийг ч одоо ашиглаж байна SIND(тодорхой хүний ​​дуу хоолойг лавлахгүйгээр).

Өргөдөл

Дуут системүүдийн гол давуу тал нь хэрэглэгчдэд ээлтэй байдаг - дуу хоолойгоор идэвхжүүлдэг цэсүүдийн төвөгтэй, төөрөгдүүлсэн төөрөгдөлд орох хэрэгцээг арилгадаг. Одоо дуудлагын зорилгыг хэлэхэд хангалттай бөгөөд үүний дараа дуут систем нь залгагчийг хүссэн цэс рүү автоматаар шилжүүлэх болно.

  • Дуут залгах янз бүрийн техник(гар утас, компьютер гэх мэт)
  • Ухаалаг утас болон бусад гар утасны компьютерт дуут мессеж бичих

Мөн үзнэ үү

  • Дижитал дохио боловсруулах

Тэмдэглэл

Холбоосууд

Ангилал:

  • Яриа таних
  • Ярианы харилцаа холбоо
  • Хиймэл оюун ухааны хэрэглээ
  • Яс-булчингийн эмгэгтэй хүмүүст зориулсан нөхөн сэргээх бүтээгдэхүүн
  • Харааны бэрхшээлтэй хүмүүст зориулсан нөхөн сэргээх арга хэрэгсэл

Викимедиа сан.

Бусад толь бичгүүдээс "Яриа таних" гэж юу болохыг харна уу.

    Яриаг текст болгон хувиргах үйл явц. Яриа таних системүүд нь дараахь байдлаар тодорхойлогддог: ойлгосон үгсийн толь бичгийн хэмжээ; хүлээн зөвшөөрөгдсөн ярианы чадвар; тодорхой хүний ​​ярианаас хандмалаас хамаарах хамаарлын зэрэг. Англи хэлээр: Яриа таних Мөн үзнэ үү:… … Санхүүгийн толь бичиг

    яриа таних- - Харилцаа холбооны сэдэв, үндсэн ойлголтууд EN яриа таних...

    яриа таних- kalbos atpažinimas statusas T sritis automatika atitikmenys: engl. ярианы ойлголт; яриа таних; дуу хоолой таних vok. Spracherkennung, f rus. яриа таних, n pranc. reconnaissance de parole, f; тагнуулын дуу хоолой, f … Automatikos terminų žodynas

    дуу хоолойн шинж чанарт суурилсан яриа таних- Илтгэгчийн дуу хоолойны онцлогийг харгалзан үзэхэд үндэслэсэн таних журам. Хүлээн зөвшөөрөгдсөн ярианы дохио нь ихэвчлэн богино хэсгүүдэд хуваагддаг бөгөөд тус бүрийг санах ойд хадгалагдсан ярианы дээжтэй харьцуулдаг. Хамт байгаа нэг нь...... Техникийн орчуулагчийн гарын авлага

    дуу хоолойн шинж чанараас үл хамааран яриа таних- Яриаг утга агуулга болгон хувиргах арга текст мэдээлэлтодорхой захиалагчийн дуу хоолойны тембрийг тохируулахгүйгээр. [Л.М. Невдяев. Харилцаа холбооны технологи. Англи Орос тайлбар толь бичиглавлах. Ю.М. Горностаева. Москва, …… Техникийн орчуулагчийн гарын авлага

    яриаг автоматаар таних- Хэвийн ярианы дохиог оролт болгон авч, хэлсэн зүйлийн кодлогдсон хувилбарыг (үг, тушаал, илэрхийлэл, өгүүлбэр гэх мэт) гаралт болгон гаргадаг процесс буюу технологи (ITU T Y.2271, ITU T P.10). / G.100).… … Техникийн орчуулагчийн гарын авлага

    Загвар Оптик тэмдэгт таних Гар бичмэлийг таних Яриа таних ... Википедиа

    Автомат царай таних тусгай хөтөлбөр. Загвар таних онол нь объект, үзэгдэл, үйл явц, дохио, нөхцөл байдал гэх мэт объектуудыг ангилах, таних онолын үндэс, аргуудыг боловсруулдаг кибернетикийн салбар юм. ... ... Википедиа

    Тусгай программтай нүүр царайг автоматаар таних. Загвар таних онол нь объект, үзэгдэл, үйл явц, дохио, нөхцөл байдал гэх мэт объектуудыг ангилах, таних онолын үндэс, аргуудыг боловсруулдаг кибернетикийн салбар юм. ... ... Википедиа

Номууд

  • Стохастик дээр үндэслэсэн шуугиан дахь ярианы утгыг таних, ойлгох, В.В.Насыпный. Стохастик нь стохастик юм мэдээллийн технологи, Орос улсад боловсруулсан. Энэ нь үр дүнтэй бүтээх боломжийг танд олгоно ухаалаг системүүд, бодит цаг хугацаанд ажиллах ба...

Нэвтэрхий толь бичиг YouTube

    1 / 5

    Яриа таних тухай танилцуулга

    LANGMaster яриа таних

    Хадмал орчуулга

Өгүүллэг

Анхны яриа таних төхөөрөмж 1952 онд гарч ирсэн бөгөөд энэ нь хүний ​​ярьж буй тоог таньж чаддаг байв. 1962 онд Нью-Йоркийн компьютерийн үзэсгэлэн дээр IBM Shoebox-ыг танилцуулав.

Арилжааны яриа таних хөтөлбөрүүд ерээд оны эхээр гарч ирэв. Тэдгээрийг ихэвчлэн гар гэмтлийн улмаас их хэмжээний текст бичиж чаддаггүй хүмүүс ашигладаг. Эдгээр програмууд (жишээлбэл, Dragon NaturalySpeaking (Англи)орос, VoiceNavigator (Англи)орос) хэрэглэгчийн дуу хоолойг текст болгон хөрвүүлэх, ингэснээр түүний гарыг хөнгөвчлөх. Ийм хөтөлбөрүүдийн орчуулгын найдвартай байдал тийм ч өндөр биш боловч олон жилийн туршид аажмаар сайжирсан.

Хөдөлгөөнт төхөөрөмжүүдийн тооцоолох хүчин чадал нэмэгдэж байгаа нь тэдэнд яриа таних функц бүхий програмуудыг бий болгох боломжийг олгосон. Ийм программуудын дунд дуу хоолойгоо ашиглан олон програмтай ажиллах боломжийг олгодог Microsoft Voice Command програмыг тэмдэглэх нь зүйтэй. Жишээлбэл, та тоглуулагчдаа хөгжим тоглуулах эсвэл шинэ баримт бичиг үүсгэх боломжтой.

Яриа таних аргыг бизнесийн янз бүрийн салбарт ашиглах нь улам бүр түгээмэл болж байна, жишээлбэл, эмнэлгийн эмч оношийг хэлж чаддаг бөгөөд үүнийг шууд цахим картанд оруулах болно. Эсвэл өөр жишээ. Хүн бүр амьдралдаа ядаж нэг удаа дуу хоолойгоо ашиглан гэрлээ унтраах эсвэл цонх нээхийг мөрөөддөг нь лавтай. Сүүлийн үед яриа таних болон синтезийн автомат системийг интерактив утасны хэрэглээнд улам ихээр ашиглах болсон. Энэ тохиолдолд дуут порталтай харилцах нь илүү байгалийн болж хувирдаг, учир нь түүний сонголтыг зөвхөн аялгуугаар залгахаас гадна дуут командыг ашиглан хийж болно. Үүний зэрэгцээ таних систем нь чанга яригчаас хамааралгүй, өөрөөр хэлбэл ямар ч хүний ​​дуу хоолойг хүлээн зөвшөөрдөг.

Яриа таних технологийн дараагийн алхам бол чимээгүй ярианы интерфейс (SSI) гэж нэрлэгддэг хөгжүүлэлт гэж үзэж болно. Эдгээр яриа боловсруулах системүүд нь ярианы дохиог үе мөчний эхэн үед хүлээн авах, боловсруулахад суурилдаг. Яриа таних хөгжлийн энэ үе шат нь орчин үеийн таних системийн хоёр чухал сул талуудаас үүдэлтэй: дуу чимээнд хэт мэдрэмтгий байх, түүнчлэн таних системд нэвтрэх үед тодорхой, тодорхой яриа хийх хэрэгцээ. SSI арга нь дуу чимээнд өртөөгүй шинэ мэдрэгчийг боловсруулсан акустик дохионы нэмэлт болгон ашиглах явдал юм.

Яриа таних системийн ангилал

Яриа таних системийг дараахь байдлаар ангилдаг.

  • толь бичгийн хэмжээгээр (хязгаарлагдмал багц үг, толь бичиг том хэмжээтэй);
  • чанга яригчаас хамааран (чанга яригчаас хамааралтай ба чанга яригчаас хамааралгүй систем);
  • ярианы төрлөөр (тасралтгүй эсвэл тусдаа яриа);
  • зориулалтын дагуу (диктантын систем, тушаалын систем);
  • ашигласан алгоритмын дагуу (мэдрэлийн сүлжээ, Марковын далд загвар, динамик програмчлал);
  • бүтцийн нэгжийн төрлөөр (үг хэллэг, үг, фонем, дифон, аллофон);
  • хуваарилах зарчмын дагуу бүтцийн нэгжүүд(загвар таних, лексик элементүүдийг сонгох).

Яриа таних автомат системийн хувьд дуу чимээний дархлааг үндсэндээ хоёр механизмаар хангадаг.

  • Акустик дохионы шинжилгээнд үндэслэн ярианы дохионы ижил элементүүдийг тодорхойлох хэд хэдэн зэрэгцээ ажлын аргыг ашиглах;
  • Хэл ярианы урсгал дахь үгсийн сегментчилсэн (фонемик) болон цогц ойлголтыг зэрэгцээ бие даасан хэрэглээ.

Яриа таних арга, алгоритмууд

"... ярианы дохионы боловсруулалтын алгоритмууд нь тухайн хүний ​​ашигладаг ижил ойлголт, харилцааны системийг ашиглах ёстой нь ойлгомжтой."

Өнөөдөр яриа таних системүүд нь таних зарчим дээр суурилдаг. хэнээр?] таних хэлбэрүүд [үл мэдэгдэх нэр томъёо ] . Өнөөг хүртэл ашиглагдаж ирсэн арга, алгоритмуудыг дараах байдлаар хувааж болно том ангиуд:

Стандарттай харьцуулах үндсэн дээр яриа таних аргуудын ангилал.

  • Динамик програмчлал - түр зуурын динамик алгоритмууд (Dynamic Time Warping).

Контекст мэдрэмтгий ангилал. Үүнийг хэрэгжүүлэх үед бие даасан лексик элементүүд нь ярианы урсгалаас тусгаарлагддаг - фонем ба аллофонууд, дараа нь үе, морфем болгон нэгтгэдэг.

  • Байесийн ялгаварлал дээр суурилсан ялгаварлан гадуурхах шинжилгээний аргууд;
  • Марковын далд загвар;
  • Мэдрэлийн сүлжээнүүд.

Таних системийн архитектур

Ердийн [ ] архитектур статистикийн системүүд автомат боловсруулалтяриа.

  • Дуу чимээг бууруулах модуль ба ашигтай дохиог салгах.
  • Акустик загвар - дууны түвшний ижил төстэй байдлын үүднээс ярианы сегментийг таних чадварыг үнэлэх боломжийг танд олгоно. Дуу бүрийн хувьд энэ дууны ярианы дуудлагыг дүрсэлсэн статистикийн нарийн төвөгтэй загварыг анх бүтээдэг.
  • Хэлний загвар - хамгийн их магадлалтай үгийн дарааллыг тодорхойлох боломжийг танд олгоно. Хэлний загварыг бий болгох нарийн төвөгтэй байдал нь үүнээс ихээхэн хамаардаг тодорхой хэл. Тийм, төлөө Англи хэл, статистик загваруудыг (N-грам гэж нэрлэдэг) ашиглахад хангалттай. Орос хэлийг багтаасан өндөр урсацтай хэлүүдэд (ижил үгийн олон хэлбэр байдаг хэлүүд) зөвхөн статистикийг ашиглан бүтээсэн хэлний загварууд ийм нөлөө үзүүлэхээ больсон - статистикийн харилцааг найдвартай үнэлэхийн тулд хэт их мэдээлэл шаардлагатай болно. үгсийн хооронд. Тиймээс орос хэлний дүрэм, ярианы хэсэг, үгийн хэлбэрийн талаархи мэдээлэл, статистикийн сонгодог загварыг ашигладаг эрлийз хэлний загваруудыг ашигладаг.
  • Декодер нь таних системийн програм хангамжийн бүрэлдэхүүн хэсэг бөгөөд акустик болон хэлний загвараас таних явцад олж авсан өгөгдлийг нэгтгэж, тэдгээрийн хослолд үндэслэн яриаг тасралтгүй таних эцсийн үр дүн болох үгсийн хамгийн их магадлалтай дарааллыг тодорхойлдог.
  1. Яриа боловсруулах нь ярианы дохионы чанарыг үнэлэхээс эхэлдэг. Энэ үе шатанд хөндлөнгийн оролцоо, гажуудлын түвшинг тодорхойлно.
  2. Үнэлгээний үр дүн нь танихад шаардлагатай ярианы параметрүүдийг тооцоолох модулийг хянадаг акустик дасан зохицох модульд очдог.
  3. Яриа агуулсан хэсгүүдийг дохиогоор тодорхойлж, ярианы параметрүүдийг үнэлдэг. Фонетик ба просодик гэж ялгадаг магадлалын шинж чанаруудсинтакс, семантик, прагматик шинжилгээнд зориулагдсан. (Ярианы хэсэг, үгийн хэлбэр, үг хоорондын статистик харилцааны талаархи мэдээллийг үнэл.)
  4. Дараа нь ярианы параметрүүд нь таних системийн үндсэн блок - декодер руу ордог. Энэ нь оролтын ярианы урсгалыг акустик болон хэлний загварт хадгалагдсан мэдээлэлтэй нийцүүлэх бүрэлдэхүүн хэсэг бөгөөд хамгийн их магадлалтай үгсийн дарааллыг тодорхойлдог бөгөөд энэ нь хүлээн зөвшөөрөх эцсийн үр дүн юм.

Таних систем дэх сэтгэл хөдлөлийн ярианы шинж тэмдэг

Спектрийн цаг хугацааны шинж чанарууд

Спектрийн шинж чанарууд:

  • Шинжилсэн ярианы дохионы спектрийн дундаж утга;
  • Спектрийн дундаж утгыг хэвийн болгох;
  • Спектрийн зурвас дахь дохионы харьцангуй оршин суух хугацаа;
  • Спектрийн зурвас дахь дохионы хэвийн оршин суух хугацаа;
  • Хамтлаг дахь ярианы спектрийн дундаж утга;
  • Хамтлаг дахь харьцангуй ярианы спектрийн хүч;
  • Ярианы спектрийн дугтуйны өөрчлөлт;
  • Ярианы спектрийн дугтуйны өөрчлөлтийн хэвийн утгууд;
  • Спектрийн зурвасын хоорондох спектрийн дугтуйнуудын харилцан хамаарлын коэффициентүүд.

Түр зуурын шинж тэмдэг:

  • Сегментийн үргэлжлэх хугацаа, фонем;
  • Сегментийн өндөр;
  • Сегмент хэлбэрийн хүчин зүйл.

Спектрийн-цаг хугацааны шинж чанарууд нь ярианы дохиог физик-математикийн мөн чанарт нь гурван төрлийн бүрэлдэхүүн хэсэг байгаа эсэхийг тодорхойлдог.

  1. үечилсэн (тональ) хэсгүүд дууны долгион;
  2. дууны долгионы үечилсэн бус хэсгүүд (дуу чимээ, тэсрэх бодис);
  3. ярианы завсарлага агуулаагүй газрууд.

Спектрийн-цаг хугацааны шинж чанарууд нь янз бүрийн хүмүүсийн дууны импульсийн цаг хугацааны цувааны хэлбэр, спектрийн өвөрмөц байдал, тэдний дууны замын шүүлтүүрийн функцүүдийн онцлогийг тусгах боломжийг олгодог. Бүтцийн өөрчлөлтийн динамиктай холбоотой ярианы урсгалын онцлогийг тодорхойлох үе мөчний эрхтнүүдИлтгэгчийн яриа бөгөөд ярианы урсгалын салшгүй шинж чанар бөгөөд илтгэгчийн үе мөчний эрхтнүүдийн харилцааны өвөрмөц байдал эсвэл синхрончлолыг илэрхийлдэг.

Цепстрын тэмдгүүд

  • Мел давтамжийн cepstral коэффициентүүд;
  • Хүний чихний мэдрэмтгий байдлын тэгш бус байдлыг зассан шугаман таамаглалын коэффициентүүд;
  • Давтамжийн чадлын хүчин зүйлийг бүртгэх;
  • Шугаман таамаглах спектрийн коэффициентүүд;
  • Шугаман таамаглах цепструмын коэффициентүүд.

Ихэнх орчин үеийн автомат яриа таних системүүд нь өдөөх дохионы шинж чанарыг үгүйсгэхийн зэрэгцээ хүний ​​дууны замын давтамжийн хариу урвалыг задлахад чиглэдэг. Энэ нь эхний загварын коэффициентууд нь дуу чимээг илүү сайн салгах боломжийг олгодогтой холбон тайлбарлаж байна. Дууны замын дохионоос өдөөх дохиог салгахын тулд cepstral шинжилгээг ашигладаг.

Далайн давтамжийн шинж чанарууд

  • Эрчим хүч, далайц
  • Эрчим хүч
  • Дууны давтамж (FFR)
  • Форматын давтамжууд
  • Jitter - үндсэн аялгууны давтамжийн модуляц (дуу чимээний параметр);
  • Гялалзсан - гол аялгуу дээрх далайцын модуляц (дуу чимээний параметр);
  • Радиал үндсэн цөмийн функц
  • Шугаман бус оператор Tiger

Далайц-давтамжийн шинж чанарууд нь Фурьегийн салангид хувиргалт (цонхны төрөл ба өргөн) параметрүүдээс хамаарч өөр өөр байж болох, мөн дээжийн дагуу цонхны бага зэрэг шилжилттэй байж болох тооцоолол хийх боломжийг олгодог. Ярианы дохио нь акустик байдлаар тархдаг агаарын орчинбүтцийн хувьд нарийн төвөгтэй дууны чичиргээ, тэдгээрийн давтамж (секундэд хэлбэлзлийн тоо), эрчим (хэлбэлзлийн далайц) болон үргэлжлэх хугацаагаар тодорхойлогддог. Далайн давтамжийн шинж чанарууд нь хамгийн бага ойлголттой байх хугацаатай ярианы дохионоос хүнд шаардлагатай бөгөөд хангалттай мэдээллийг агуулдаг. Гэхдээ эдгээр шинж чанаруудыг ашиглах нь тэднийг сэтгэл хөдлөлийн яриаг тодорхойлох хэрэгсэл болгон бүрэн ашиглах боломжийг олгодоггүй.

Шугаман бус динамикийн шинж тэмдэг

Шугаман бус динамик шинж тэмдгийн бүлгийн хувьд ярианы дохио нь хүний ​​дууны замын системд ажиглагдсан скаляр хэмжигдэхүүн гэж тооцогддог. Яриа үүсгэх үйл явцыг шугаман бус гэж үзэж, шугаман бус динамикийн аргаар дүн шинжилгээ хийж болно. Шугаман бус динамикийн даалгавар бол хамгийн ердийн үл хөдлөх хөрөнгийн саналаас үүссэн математикийн үндсэн загвар, бодит системийг олж, нарийвчлан судлах явдал юм. бие даасан элементүүд, системийн бүрэлдэхүүн хэсгүүд, тэдгээрийн хоорондын харилцан үйлчлэлийн хуулиуд. Одоогийн байдлаар шугаман бус динамикийн аргууд нь Такенсийн теорем дээр үндэслэсэн математикийн суурь онол дээр суурилдаг. (Англи)орос, энэ нь хатуу чанд амжилтгүй математик үндэсШугаман бус авторегрессийн санаануудын дагуу цаг хугацааны цуваа эсвэл түүний координатуудын аль нэгээс аттракторын фазын хөрөг зургийг дахин бүтээх боломжийг нотолж байна. (Татлагч гэдэг нь цэгүүдийн багц эсвэл дэд орон зай гэж ойлгогддог фазын орон зайойртож байна фазын замналшилжилтийн үеийг сулруулсаны дараа.) Сэргээгдсэн ярианы траекторийн дохионы шинж чанарын тооцоог ажигласан хугацааны цувааны шугаман бус детерминистик фаз-орон зайн загварыг бүтээхэд ашигладаг. Татуулагчдын хэлбэрийн ялгааг оношлох дүрэм, шинж тэмдгүүдэд ашиглаж болох бөгөөд энэ нь сэтгэл хөдлөлийн цэнэгтэй ярианы дохионы янз бүрийн сэтгэл хөдлөлийг таньж, зөв ​​тодорхойлох боломжийг олгодог.

Ярианы чанарын сонголтууд

Дижитал сувгууд дээрх ярианы чанарын үзүүлэлтүүд:

  • Үг хэллэгийн ойлгомжтой байдал;
  • Хэл ярианы ойлгомжтой байдал;
  • Лавлах замын ярианы чанартай харьцуулахад ярианы чанар;
  • Бодит ажлын нөхцөлд ярианы чанар.

Үндсэн ойлголтууд

  • Ярианы ойлгомжтой байдал гэдэг нь зөв хүлээн зөвшөөрөгдсөн ярианы элементүүдийн харьцангуй тоо (дуу, үе, үг, хэллэг) -ийн хувиар илэрхийлэгддэг. нийт тоошилжүүлсэн элементүүд.
  • Ярианы чанар нь ярианы дамжуулалтын систем дэх ярианы дууны субьектив үнэлгээг тодорхойлдог параметр юм.
  • Хэвийн ярианы хурд гэдэг нь хяналтын хэллэгийн дундаж үргэлжлэх хугацаа 2.4 секунд байх хурдтай ярих явдал юм.
  • Ярианы хурдыг хурдасгасан - хяналтын хэллэгийн дундаж үргэлжлэх хугацаа 1.5-1.6 секундын хурдаар ярих.
  • Илтгэгчийн дуу хоолойг таних чадвар гэдэг нь сонсогчдод урьд өмнө нь мэдэгдэж байсан тодорхой хүнтэй дуу хоолойны дууг таних чадвар юм.
  • Семантик ойлгомжтой байдал нь зөв нөхөн үржихүйн түвшний үзүүлэлт юм мэдээллийн агуулгаяриа.
  • Интеграл чанар нь сонсогчдод хүлээн авсан ярианы талаархи ерөнхий сэтгэгдлийг тодорхойлдог үзүүлэлт юм.

Өргөдөл

Дуут системийн гол давуу тал нь хэрэглэгчдэд ээлтэй байдал гэж тунхаглагдсан. Ярианы командууд нь эцсийн хэрэглэгч мэдрэгчтэй болон бусад оруулах арга, командыг ашиглах хэрэгцээг арилгах зорилготой байв.

  • Дуут тушаалууд
  • Дуут текст оруулах

Яриа таних технологийг ашиглах амжилттай жишээнүүд гар утасны програмуудҮүнд: Yandex.Navigator дээр дуу хоолойгоор хаяг оруулах, Google Now-д дуут хайлт хийх.

Хөдөлгөөнт төхөөрөмжөөс гадна яриа таних технологи нь бизнесийн янз бүрийн салбарт өргөн хэрэглэгддэг.

  • Утас: Өөртөө үйлчлэх дуут системийг бий болгосноор ирж буй болон гарч буй дуудлагыг боловсруулах автоматжуулалт, ялангуяа: хүлээн авах. лавлагаа мэдээлэлзөвлөгөө өгөх, үйлчилгээ/бүтээгдэхүүн захиалах, одоо байгаа үйлчилгээний параметрүүдийг өөрчлөх, судалгаа, асуулга явуулах, мэдээлэл цуглуулах, мэдээлэл өгөх болон бусад хувилбарууд;
  • Ухаалаг гэрийн шийдлүүд: Ухаалаг гэрийн системийг удирдах дуут интерфейс;
  • Гэр ахуйн цахилгаан хэрэгсэл ба роботууд: электрон роботуудын дуут интерфейс; гэр ахуйн цахилгаан хэрэгслийн дуут удирдлага гэх мэт;
  • Ширээний компьютер болон зөөврийн компьютер: дуут оролт компьютерийн тоглоомуудболон програмууд;
  • Машинууд: машины дотоод засал дахь дуут удирдлага - жишээлбэл, навигацийн систем;
  • Хөгжлийн бэрхшээлтэй хүмүүст зориулсан нийгмийн үйлчилгээ.

Мөн үзнэ үү

  • Дижитал дохионы боловсруулалт

Тэмдэглэл

  1. Davies, K.H., Biddulph, R. and Balashek, S. (1952) Ярианы цифрүүдийн яриаг автоматаар таних, Ж.Акуст. Соц. Ам. 24 (6) х. 637-642
  2. Бүртгэлийг түдгэлзүүлсэн
  3. Яриа танин мэдэхүйн орчин үеийн асуудлууд. 
  4. http://phonoscopic.rf/articles_and_publications/Lobanova_Search_of_identical_fragments.pdf
  5. http://booksshare.net/books/med/chistovich-la/1976/files/fizrech1976.djvu
  6. http://revistaie.ase.ro/content/46/s%20-%20furtuna.pdf
  7. http://www.ccas.ru/frc/papers/mestetskii04course.pdf
  8. Яриа таних| 
  9. Хэл ярианы технологийн төв | 
  10. МХЗ. 2013 оны 4-р сарын 20-нд авсан. 2013 оны 4-р сарын 28-ны өдөр архивлагдсан.
  11. http://pawlin.ru/materials/neiro/sistemy_raspoznavaniya.pdf
  12. http://intsys.msu.ru/magazine/archive/v3(1-2)/mazurenko.pdf
  13. http://eprints.tstu.tver.ru/69/1/3.pdf
  14. http://www.terrahumana.ru/arhiv/10_04/10_04_25.pdf

Холбоосууд

  • Дээд аттестатчиллын комиссын 05.11.17, 05.13.01 - Төхөөрөмжийн ...
  • ГОСТ R 51061-97. ЯРИАНЫ ЧАНАРЫН ҮЗҮҮЛЭЛТҮҮД. 
  • ТООН СУВАГ ДЭЭР БАГА ХУРДТАЙ ЯРИА ДАМЖУУЛАХ СИСТЕМ. . 2013 оны 4-р сарын 30-нд эх сурвалжаас архивлагдсан.
  • Яриа таних технологи, www.xakep.ru

Аудио мессежийн хэлийг тодорхойлох технологийг хөгжүүлэх төлөв байдал, хэтийн төлөвийн дүн шинжилгээ. Yandex-ийн Яриа таних технологи Yandex SpeechKit хэрхэн ажилладаг вэ | Хабрахабр

Yandex-аас яриа таних технологи  Яндекс

Ерөнхий тодорхойлолтууд

  • · толь бичгийн хэмжээгээр (хязгаарлагдмал багц үг, том толь бичиг);
  • · чанга яригчаас хамааран (яригчаас хамааралтай ба илтгэгчээс хамааралгүй систем);
  • · ярианы төрлөөр (тасралтгүй эсвэл тусдаа яриа);
  • · зориулалтын дагуу (диктантын систем, командын систем);
  • · ашигласан алгоритмын дагуу (мэдрэлийн сүлжээ, Марковын далд загвар, динамик програмчлал);
  • · бүтцийн нэгжийн төрлөөр (хэлбэр, үг, фонем, дифон, аллофон);
  • · бүтцийн нэгжийг тодорхойлох зарчимд үндэслэсэн (загвараар таних, лексик элементүүдийг сонгох).

Яриа таних автомат системийн хувьд дуу чимээний дархлааг үндсэндээ хоёр механизмаар хангадаг.

  • · Акустик дохионы шинжилгээнд үндэслэн ярианы дохионы ижил элементүүдийг тусгаарлах хэд хэдэн зэрэгцээ ажиллах аргыг ашиглах;
  • · Хэл ярианы урсгал дахь үгсийн сегментчилсэн (фонемик) болон цогц ойлголтыг зэрэгцээ бие даасан хэрэглээ.

Таних системийн архитектур

Яриа автоматаар боловсруулах статистикийн системийн ердийн архитектур.

  • · Дуу чимээг бууруулах модуль ба ашигтай дохио тусгаарлах.
  • · Акустик загвар - дууны түвшний ижил төстэй байдлын хувьд ярианы сегментийг таних чадварыг үнэлэх боломжийг танд олгоно. Дуу бүрийн хувьд энэ дууны ярианы дуудлагыг дүрсэлсэн статистикийн нарийн төвөгтэй загварыг анх бүтээдэг.
  • · Хэлний загвар - хамгийн их магадлалтай үгийн дарааллыг тодорхойлох боломжийг танд олгоно. Хэлний загварыг бий болгох нарийн төвөгтэй байдал нь тухайн хэлнээс ихээхэн хамаардаг. Тиймээс англи хэлний хувьд статистик загваруудыг (N-грам гэж нэрлэдэг) ашиглахад хангалттай. Орос хэлийг багтаасан өндөр урсацтай хэлүүдэд (ижил үгийн олон хэлбэр байдаг хэлүүд) зөвхөн статистикийг ашиглан бүтээсэн хэлний загварууд ийм нөлөө үзүүлэхээ больсон - статистикийн харилцааг найдвартай үнэлэхийн тулд хэт их мэдээлэл шаардлагатай болно. үгс. Тиймээс орос хэлний дүрэм, ярианы хэсэг, үгийн хэлбэрийн талаархи мэдээлэл, статистикийн сонгодог загварыг ашигладаг эрлийз хэлний загваруудыг ашигладаг.
  • · Декодер нь таних системийн програм хангамжийн бүрэлдэхүүн хэсэг бөгөөд акустик болон хэлний загвараас таних явцад олж авсан өгөгдлийг нэгтгэж, тэдгээрийн хослолд тулгуурлан яриаг тасралтгүй таних эцсийн үр дүн болох үгсийн хамгийн их магадлалтай дарааллыг тодорхойлдог.

Хүлээн зөвшөөрөх үе шатууд:

  • 1. Яриа боловсруулах нь ярианы дохионы чанарыг үнэлэхээс эхэлдэг. Энэ үе шатанд хөндлөнгийн оролцоо, гажуудлын түвшинг тодорхойлно.
  • 2. Үнэлгээний үр дүн нь танихад шаардлагатай ярианы параметрүүдийг тооцоолох модулийг хянадаг акустик дасан зохицох модульд очно.
  • 3. Яриа агуулсан хэсгүүдийг дохиогоор тодорхойлж, ярианы параметрүүдийг үнэлдэг. Синтакс, семантик, прагматик шинжилгээнд фонетик болон просодик магадлалын шинж чанаруудыг тодорхойлсон. (Ярианы хэсэг, үгийн хэлбэр, үг хоорондын статистик харилцааны талаархи мэдээллийг үнэл.)
  • 4. Дараа нь ярианы параметрүүд нь таних системийн үндсэн блок - декодер руу ордог. Энэ нь оролтын ярианы урсгалыг акустик болон хэлний загварт хадгалагдсан мэдээлэлтэй нийцүүлэх бүрэлдэхүүн хэсэг бөгөөд хамгийн их магадлалтай үгсийн дарааллыг тодорхойлдог бөгөөд энэ нь хүлээн зөвшөөрөх эцсийн үр дүн юм.
  • · Дуут удирдлага
  • · Дуут тушаал
  • · Дуут текст оруулах
  • · Дуут хайлт

Хөдөлгөөнт програмуудад яриа таних технологийг ашиглах амжилттай жишээ бол: Yandex Navigator дээр дуу хоолойгоор хаяг оруулах, Google Now дуут хайлт.

Хөдөлгөөнт төхөөрөмжөөс гадна яриа таних технологи нь бизнесийн янз бүрийн салбарт өргөн хэрэглэгддэг.

  • · Телефон утас: Өөртөө үйлчлэх дуут системийг бий болгох замаар ирж буй болон гарч буй дуудлагыг боловсруулах автоматжуулалт, тухайлбал: лавлагаа мэдээлэл авах, зөвлөгөө авах, үйлчилгээ/бүтээгдэхүүн захиалах, одоо байгаа үйлчилгээний параметрүүдийг өөрчлөх, судалгаа, санал асуулга явуулах, мэдээлэл цуглуулах, мэдээлэх, бусад хувилбарууд;
  • · Ухаалаг гэрийн шийдлүүд: Ухаалаг гэрийн системийг удирдах дуут интерфейс;
  • · Гэр ахуйн цахилгаан хэрэгсэл, робот: электрон роботуудын дуут интерфейс; гэр ахуйн цахилгаан хэрэгслийн дуут удирдлага гэх мэт;
  • · Ширээний компьютер, зөөврийн компьютер: компьютерийн тоглоом, программ дахь дуу хоолойгоор оруулах;
  • · Машинууд: машины салон дахь дуут удирдлага - жишээлбэл, навигацийн систем;
  • · Хөгжлийн бэрхшээлтэй иргэдэд үзүүлэх нийгмийн үйлчилгээ.

програм хангамжийн автоматжуулалтын оролтыг таних

  • 9. Фонологийн байрлал. Хүчтэй ба сул фонем.
  • 10. Эгшиг авианы байрлал солигдох. Эгшиг авианы тоон болон чанарын бууралт.
  • 11. Эгшигт авианы байрлал солигдох. Дүлий/дуу хоолой болон хатуулаг/зөөлөн байдлаар уусгах, ялгах.
  • 12. Фонемуудын түүхэн ээлжлэл.
  • 13. Багассан эгшгийн авианы уналт ба энэ үзэгдлийн үр дагавар.
  • 14. Хуучин орос хэл дээрх хамрын дуу чимээний түүхтэй холбоотой өөрчлөлтүүд.
  • 15. Хэлний арын хэсгийн палатализаци.
  • 17. Фонетик транскрипци. Фонемик транскрипци
  • 18. Үг. Үгийн хуваагдал. Үгийн төрлүүд.
  • 19. Дуу авианы үг. Өргөлт
  • 20. Ярианы тактик. Интонац
  • 21. Онцлох. Интонацын бүтэц
  • 21. Үг хэллэг. Интонац
  • 22. Орфоэпийн тухай ойлголт
  • 23. Оросын уран зохиолын дуудлагын үндсэн дүрэм.
  • 24. Стресст орсон эгшгийн дуудлага. Өргөлтгүй эгшгийн дуудлага.
  • 25. Бие даасан гийгүүлэгч авианы дуудлага.
  • 26. Гийгүүлэгчийн бүлгүүдийн дуудлага.
  • 27. Хэл зүйн зарим хэлбэрийн дуудлага.
  • 28. Зарим товчлолын дуудлага. Гадаад үгсийн дуудлагын онцлог.
  • 29. Орос хэл дээрх стрессийг эзэмшихэд хүндрэлтэй тохиолдлууд.
  • 30. Оросын уран зохиолын дуудлагын хөгжил.
  • 31. Дүрмийн кодчилол
  • 32. Семантик кодчилол. Хоёр аргумент (түр зуурын шинж тэмдэг): учир шалтгааны холбоо.
  • 33. Семантик кодчилол. Хоёр аргумент (түр зуурын шинж тэмдэг): үр дагавар, үр дүн, зорилго.
  • 34. Семантик кодчилол. Хоёр аргумент (түр зуурын шинж тэмдэг): хувиргалт, өөрчлөлт
  • 35. Семантик кодчилол. Хоёр аргумент (түр зуурын шинж тэмдэг): харилцан үйлчлэл, бүлэглэл, нийгэмлэг, холбоо
  • 36. Семантик кодчилол. Хоёр аргумент (түр зуурын шинж тэмдэг): салалт, нөлөөлөл, нөхцөл байдал, тохиолдох.
  • 37. Семантик кодчилол. Хоёр аргумент (түр зуурын шинж тэмдэг): дагаж мөрдөх, хяналт тавих, захирах, хамаарал.
  • 38. Семантик кодчилол. Нэг аргумент (тогтмол шинж тэмдэг): өмч, хэрэгцээ, боломж, магадлал, тийм, үгүй.
  • 39. Семантик кодчилол. Нэг аргумент (тогтмол шинж тэмдэг): үнэн, худал.
  • Семантик код. Түүний зорилго. Зорилго. Барилгын зарчим. Боломжууд.
  • Семантик кодын зорилго. "Утга" гэсэн нэр томъёо.
  • Семантик кодын зорилго. Текст. Мэдээлэл. Мэдээллийн хөгжилд гипертекст.
  • 43. Утга зүйн кодчилол хийх явцад дүрмийн болон утгын шинжилгээ.
  • 44. Утгын кодчилолд зориулсан орос хэлний утга зүйн нийцлийн толь ба ассоциатив толь бичиг.
  • Семантик кодын зорилго. Системийн изоморфизм.
  • Семантик кодын зорилго. Шаардлагатай ба хангалттай гэсэн зарчим.
  • Семантик кодын зорилго. Анги болон дэд ангиудын холболт
  • 48. Семантик кодын зорилго. Шатлал/шатлалгүй байх зарчим.
  • 49. Семантик кодын зорилго. Системчилсэн зүйрлэл.
  • 50. Нөхцөл байдлын (нөхцөл байдлын) семантик код.
  • 51. Семантик кодчилол. Alignment-тайлбарлах код. Матрешка код.
  • 52. Ярианы интерфейсийн үндсэн үүрэг, үндсэн ойлголтууд.
  • 53. Яриа таних, нэгтгэх асуудлын түүхэн тойм.
  • 54. Автомат яриа синтезийн систем. Ярианы интерфейсийн практик хэрэглээ.
  • 55. Яриа таних автомат систем. Ярианы интерфейсийн практик хэрэглээ.
  • 56. Ярианы интерфейсийн хэл шинжлэлийн үндэс. Ярианы системийг хэрэгжүүлэхэд хэл шинжлэлийн хэрэглээ.
  • 57. Ярианы дохионы бүтэц. Анализ ба синтез. Ярианы дохионы спектр-цаг хугацааны шинж чанар.
  • 58. Ярианы дохионы мэдээлэл ба модуляцийн бүтэц.
  • 59. Ярианы дохионы синтезийн аргууд. Ярианы дохиог дүрслэх ерөнхий математик загварууд.
  • 60. Ярианы дохионы синтезийн аргууд. Дууны замын геометрийн загвар.
  • 61. Ярианы дохионы синтезийн аргууд. Форматын загвар.
  • 62. Ярианы дохионы синтезийн эмхэтгэлийн аргууд.
  • 63. Ярианы дохионы шинжилгээний аргууд.
  • 64. Ярианы дохиог тоон шүүх арга. FFT алгоритм ашиглан спектрийн шинжилгээ. Дижитал шүүлтүүрийн арга
  • FFT алгоритм ашиглан спектрийн шинжилгээ
  • 65. Шугаман таамаглалд суурилсан спектрийн шинжилгээ. Ярианы дохионы формат-параметрийн тодорхойлолт. Шугаман таамаглал дээр суурилсан спектрийн шинжилгээ
  • Ярианы дохионы формат-параметрийн тодорхойлолт
  • 66. Цепстрал коэффициентийн арга. Хэл ярианы ойлголтын онцлог. Хүний хүлээн авах ярианы ойлголтын шинж чанарууд. Цепстраль коэффициентийн арга
  • 67. Ярианы дохиог хүлээн авах чадвар. Ярианы дохионы сонсголын (фонетик) шинж чанар. Ярианы дохиог хүлээн авах чадвар
  • Ярианы дохионы сонсголын (фонетик) шинж чанар
  • 68. Ярианы хамгийн бага семантик өвөрмөц элементүүдийн ойлголтын шинж чанарууд
  • 69. Текстээс ярианы синтез. Текст дээр суурилсан ярианы синтезаторын бүтэц.
  • Текстэд суурилсан ярианы синтезаторын бүтэц Гол ойлголтууд:
  • 70. Хэл шинжлэлийн процессор. Текстийн урьдчилсан боловсруулалт. Үг хэллэгээр текст боловсруулах.
  • Текстийг урьдчилан боловсруулах
  • Үг хэллэгээр текст боловсруулах
  • 71. Тестийг үг бүрээр нь боловсруулах. Хэл шинжлэлийн процессор хэрхэн ажилладаг тухай жишээ. Үгээр текст боловсруулах
  • Хэл шинжлэлийн процессор хэрхэн ажилладаг тухай жишээ
  • 72. Просодик процессор
  • 73. Фонетик процессор. Артикуляция-фонетик процессор. Фонетик процессор.
  • 74. Аллофон фонетик процессор. Акустик процессор.
  • 75. Ярианы тактикийн геометрийн ойролцоо байдал. Эмхэтгэлийн ярианы синтезийн аргууд дээр суурилсан акустик процессор.
  • 76. Яриа таних автомат системийн ангилал. Автомат яриа таних аргууд.
  • 77. Яриа таних аргуудын ангилал.
  • 78. Динамик програмчлалын арга.
  • 79. Марковын далд загваруудын арга.
  • Автомат яриа таних систем (ASRR) нь оролтын яриаг (ярианы дохио) хүлээн зөвшөөрөгдсөн мессеж болгон хувиргадаг систем гэж ойлгогддог. Энэ тохиолдолд хүлээн зөвшөөрөгдсөн мессежийг энэ мессежийн текст хэлбэрээр болон хоёуланг нь танилцуулж болно

    системээс хариу өгөхийн тулд түүнийг цаашид боловсруулахад тохиромжтой хэлбэрт нэн даруй хөрвүүлсэн. Эхний ээлжинд яриа таних автомат систем нь текстийг яриа болгон хувиргах үүрэгтэй. Тиймээс in Английн уран зохиолЭдгээр системийг Speech to Text систем гэж нэрлэдэг. Ихэнхдээ яриа таних автомат системийг энгийн яриа таних систем (SRR) гэж нэрлэдэг.

    Автомат яриа таних системийн хялбаршуулсан блок диаграммыг Зураг дээр үзүүлэв.

    Ярианы дохионы шинжилгээний загвар дорОролтын дохиог шинжлэх, нэгдүгээрт, ярианы дохио гэж ангилах, хоёрдугаарт, хүлээн авсан дохионы үндсэн бүрэлдэхүүн хэсгүүдийг тусгаарлах үүрэгтэй блокийг ойлгох.

    хүлээн авсан мессежийг хүлээн зөвшөөрөх. Ийм бүрэлдэхүүн хэсгүүд нь ярианы синтезийн явцад үүсдэгтэй төстэй яриаг дүрсэлсэн параметрүүдийг агуулдаг. Заасан параметрүүдийн багц нь сонгосон таних аргаас хамаарна.

    Яриа таних, шийдвэр гаргах загвар- энэ нь эхний блокоос олж авсан параметрүүдийн дарааллын дүн шинжилгээнд үндэслэн хүлээн зөвшөөрөгдсөн мессежийг үүсгэдэг блок юм. Жишээлбэл, хэрэв яриаг дүрслэх формант загварыг ашигладаг бол эхний блок дээр олж авсан форматын давтамж дээр үндэслэн оролтын мессежийг бүрдүүлдэг хүлээн зөвшөөрөгдсөн фонемуудын дарааллыг байгуулна. Энэ тохиолдолд оролтын мэдээг зөв хүлээн зөвшөөрсөн эсэх талаар шийдвэр гаргана. Шийдвэр гаргахдаа, ялангуяа дараахь шийдвэрийг гаргах боломжтой: мессежийг зөв хүлээн зөвшөөрсөн (үүнийг батлах нь байгалийн хэлний хэм хэмжээнд нийцсэн текст юм) эсвэл

    мессежийг хүлээн зөвшөөрөөгүй эсвэл буруу хүлээн зөвшөөрсөн (хэрэв хүлээн зөвшөөрөгдсөн мессеж нь автоматаар засахад хэцүү илэрхий алдаа, эсвэл бүр утгагүй зүйл агуулсан бол энэ шийдвэрийг гаргадаг).

    Тэдгээрийг тодорхойлсон дараах параметрүүдийг CAPP-д тавьсан хязгаарлалт гэж нэрлэж болно.

    Хүлээн зөвшөөрөгдсөн ярианы төрөл (ярианы командын хэв маягийн завсарлагатай үг бүрээр дуудлага; "диктант" хэв маягаар завсарлагагүйгээр тодорхой дуудлага; аяндаа яриа);

    Толь бичгийн хэмжээ (100, 200 гэх мэт үгээр хязгаарлагдах; хязгааргүй);

    Илтгэгчээс хамаарах хамаарлын зэрэг (яригчаас хамааралтай; илтгэгчээс хараат бус);

    Үг хэллэгийн хязгаарлалт ( бие даасан үгс; ердийн хэллэг; хиймэл хэл; байгалийн хэл);

    Ярианы дохиог хүлээн авах нөхцөл (холбоо барих микрофон; 1 м-ээс дээш зайд байрлах микрофон);

    SRR ашиглах нөхцөл (сул эсвэл хүчтэй хөндлөнгийн оролцоо);

    Хүлээн зөвшөөрөх найдвартай байдал.

    Практик ярианы интерфейсийн програмууд

    Жишээнүүд рүү шилжихээс өмнө практик хэрэглээярианы интерфейсийн хувьд үүнийг хэрэглэгчийн компьютертэй харилцах хамгийн түгээмэл хэрэгсэл болох гар ба дэлгэцтэй харьцуулж үзье. Дор хаяж гурвыг нь тэмдэглэх нь зүйтэйүндсэн ялгаа

    ярианы интерфейс: 1) гар, дэлгэцийн илэрхий сул тал бол компьютертэй харилцахын тулд хүн тусгай сургалтанд хамрагдах шаардлагатай байдаг. Үүний зэрэгцээ, яриа бол хэн ч, тэр байтугай сургалтанд хамрагдаагүй хүн ч гэсэн байгалийн интерфейс юм. Яриа нь хүн болон компьютер хоорондын сэтгэл зүйн зайг эрс багасгадаг. Хэрэв гарч ирвэлярианы интерфейс

    , дараа нь компьютер хэрэглэгчдийн хүрээ хязгааргүй болж чадна;

    2) яриа нь өөрөө компьютерт ямар ч байдлаар механик холбоогүй бөгөөд харилцаа холбооны систем, жишээлбэл, утсаар холбогдож болно. Ярианы интерфэйс нь хүн болон компьютер хоорондын зайг багасгадаг. Энэ нь компьютерийн боломжит хэрэглэгчдийн хүрээг улам өргөжүүлж, ярианы интерфейсийг мэдээллийн үйлчилгээний системийг бий болгоход тохиромжтой хэрэгсэл болгодог; 3) та компьютерийг бүрэн харанхуйд удирдах боломжтойнүдээ анилаа , таны гар хяналтын хөшүүргээр завгүй байх, гараа зангидах болон бусад онцгой нөхцөл байдалд байх үед. Энэхүү өмч нь харилцааны үр ашиг, хөдөлгөөнийг хангаж, гарыг чөлөөлж, мэдээлэл хүлээн авах үед ойлголтын харааны сувгийг буулгаж өгдөг. Энэ нь жишээлбэл, том эрчим хүчний системийн хянагч эсвэл онгоцны нисгэгч, машины жолоочийн хувьд маш чухал юм. Үүнээс гадна,компьютерийн системүүд

    харааны бэрхшээлтэй хүмүүст илүү хүртээмжтэй болно.

  • Санхүүгийн зах зээл нь ирээдүйн чиг хандлагыг илэрхийлдэг хэв маягийг бий болгох хандлагатай байдаг. Үнийн хэв маяг нь дараалсан оргил ба тэвшүүдийн хослолоос бүрддэг бөгөөд загвар бүр өөрийн гэсэн үүсэх механизм, тодорхой график хэлбэртэй байдаг. Гүйлгээний эзлэхүүний динамик нь тодорхой загвар байгаа эсэхийг баталгаажуулах хүчин зүйл болдог. Бүх загварыг зах зээлд оролцогчдын сэтгэлзүйн үүднээс тайлбарласан болно.
    График арга нь үнийн хэв маягийг таних гол аргуудын нэг юм. Энэ болон бусад үзүүлэлтийг тодорхойлох шалгуур нь тодорхой бус, бүх дохио нь субьектив байдлаар хүлээн зөвшөөрөгддөг, сонгодог аргууд эмх замбараагүй, тэдний ард ямар ч хатуу тогтолцоо байдаггүй гэдгийг анхаарна уу. Алдаа дутагдалтай байсан ч, график аргуудхувьд ашигтай практик хэрэглээтехникийн ноцтой дүн шинжилгээ хийх үндэс суурь болдог.
    График хэв маягийг таних, дүн шинжилгээ хийх нь худалдаачинд маш их цаг зарцуулдаг хөдөлмөр их шаарддаг ажил юм. Хамгийн сайн программ хангамжтай хөрөнгө оруулалтын хамгийн туршлагатай шинжээч хүртэл өдөрт 50-75 үнэт цаасыг хянаж чаддаг. Энэ нь дэлхийн хөрөнгийн зах зээлийн цар хүрээг бодоход хэтэрхий бага байна.
    Үнийн хэв маягийн талаар бүрэн мэдээлэлгүй бол техникийн шинжээч олон арилжааны боломжийг алдах болно. Хөрөнгө оруулагчид олон тооны график хэв маягийн талаархи мэдээллийг хурдан, энгийн бөгөөд цаг алдалгүй авах шаардлагатай байдаг санхүүгийн хэрэгсэлхудалдааны үр ашгийг дээшлүүлэх зорилгоор . Сүүлийн үед бүх зүйл илүү их хуваарилалтавах
    графикийг автоматаар таних програмууд - CPR (Chart Pattern Recognition).
    Таних систем. Канадын Recognia Inc компани графикийн хэв маягийг таних хүчирхэг системийг худалдаачинд өгдөг. Боловсруулсан технологи нь үнэт цаасны хэд хэдэн зах зээлд дүн шинжилгээ хийх боломжийг олгодог. Мэргэжилтэн зөвхөн хайлтын параметрүүдийг (санхүүгийн хэрэгслээр, тодорхой үнийн загвараар гэх мэт) тохируулах шаардлагатай. Програм нь графикуудыг "сканнердаж", санхүүгийн гүйлгээ хийх хэрэгслийг тодорхойлдог. одоогоорхамгийн оновчтой зүйл. Канадын компани Recognia Inc. нь онлайн брокерууд, сангийн менежерүүд болон санхүүгийн мэдээллийн үйлчилгээ үзүүлэгчдийг өмчийн технологийг ашиглан үйл явдал, хэв маягийг автоматаар тодорхойлох үйлчилгээгээр хангадаг.
    Recognia Service-ийн тусламжтайгаар хөрөнгө оруулагч дараахь зүйлийг хийх боломжтой.
    сүүлийн үеийн техникийн үйл явдлуудыг үзэх замаар тодорхой санхүүгийн хэрэгслийн хэтийн төлөвийг үнэлэх;
    Recognia тодорхой үнийн хэв маягийг илрүүлсэн үнэт цаасыг шалгаж, позиц нээх шинэ боломжуудыг олох;
    тодорхойлсон үйл явдал нь түүний шинж чанарыг судалж, графикийг үзэх замаар түүний хувьд ач холбогдолтой эсэхийг тодорхойлох;
    тодорхой үнэт цаас эсвэл арилжааны платформд сэрэмжлүүлэг тавих (хэрэв сонгосон үнэт цаасыг график дээр илрүүлсэн тохиолдолд анхааруулах дохиог бий болгох);
    танилцуулсан боловсролын материалаас техникийн шинжилгээний талаар илүү ихийг олж мэдэх.
    Recognia үйлчилгээний ажлын дөрвөн үе шат байдаг (Зураг 6.1).
    1) хувьцаа, бонд, бараа бүтээгдэхүүн, валют, индекс зэрэг нийтэд арилжаалагддаг санхүүгийн хэрэгслүүдийн талаарх мэдээллийг арилжаа хаагдсаны дараа автоматаар Recognia руу илгээдэг. Recognia одоогоор Хойд Америкийн бирж дээр өдөр бүр арилжаалагддаг 20,000 гаруй үнэт цаасанд дүн шинжилгээ хийж, дэлхийн бусад зах зээлээс олон зуун санхүүгийн хэрэгслийг оруулахаар төлөвлөж байна;
    2) Патентлагдсан хэв маягийг таних алгоритмууд болон мэдрэлийн сүлжээний технологийг ашиглан Recognia нь эдгээр санхүүгийн хэрэгслийн үнийн мэдээлэлд тогтмол дүн шинжилгээ хийж, график дээрх одоогийн болон түүхэн үнийн загварыг автоматаар илрүүлдэг. Энэ технологийг боловсруулахад техникийн шинжилгээний салбарын мэргэжилтнүүд оролцсон;
    3) шинжилгээний үр дүнг компанийн үйлчлүүлэгчид хүлээн авч, вэбсайт дээрээ зохих хэсгүүдийг бий болгодог;
    4) хөрөнгө оруулагчид, брокерууд болон багцын менежерүүд арилжааны шинэ боломжуудыг олж илрүүлэх, бусад аргаар хүлээн авсан дохиог баталгаажуулахын тулд хэв маягийг ашигладаг. Үйлчлүүлэгчид тодорхойлсон үнийн хэв маягийн талаарх мэдээллийг үнэ төлбөргүй өгөх эсвэл төлбөртэй үйлчилгээг зохион байгуулах боломжтой. Эцсийн хэрэглэгчид боломжтой параметрүүдийг (аюулгүй байдлын нэр, солилцоо, салбар, загварын төрөл гэх мэт) ашиглан загвар тодорхойлох хүсэлтийг үүсгэдэг. , энэ нь боломжит бүх функцэд нэвтрэх боломжийг олгодог боловч санхүүгийн хэрэгслийн хязгаарлагдмал багц, үнийн мэдээллийг сааталтайгаар хүлээн авдаг.
    Recognia On-Line Broker Product нь хөрөнгө оруулагчдад дараах хэрэгслүүдээр хангадаг.
    Technical Event Stock Scrccner (Зураг 6.2.) нь хэрэглэгчийн оруулсан шалгуурыг хангасан санхүүгийн хэрэгслийн жагсаалтыг гаргадаг. Хөрөнгө оруулагч нь хүссэн техникийн шинжилгээний үйл явдлыг тодорхойлох хайлтын параметрүүдийг тохируулах шаардлагатай: төрөл, огноо, үргэлжлэх хугацаа, бууралт эсвэл өсөлтийн дохио гэх мэт. Хэрэглэгч хайлтын бусад шалгуурыг оруулах боломжтой; бирж, салбар, хэрэгслийн төрөл, арилжааны хэмжээ, үнийн түвшин. Жишээлбэл, газрын тос, байгалийн хийн салбарт саяхан үнийн өөрчлөлтийн хэв маягийг харуулсан хувьцааг олох хэрэгтэй - "давхар ёроол". Ийм үнэт цаасны хувьд үнэ өсөх төлөвтэй байна;
    Техникийн үйл явдлын хайлт. Энэ функцнь тодорхой нууцлал эсвэл индексийн сүүлийн үеийн техникийн шинжилгээний бүх үйл явдлын жагсаалтыг авах боломжийг танд олгоно. Сонгосон нийтлэлийн бүх үйл явдлуудыг дөрвөн өөр ангилалд хуваасан:
    a) сонгодог хэв маяг (Сонгодог хэв маяг) - уламжлалт график хэв маяг, жишээлбэл, "давхар орой" эсвэл "толгой ба мөр";
    б) богино хугацааны хэв маяг буюу лааны суурь;
    в) үзүүлэлтүүд (Үзүүлэлт) - хөдөлгөөнт дундаж дээр суурилсан үйл явдлууд;
    d) осциллятор (Oscillator), жишээлбэл, MACD эсвэл RSI.
    Хүлээн зөвшөөрөх үр дүнгийн дүрслэл. Зураг дээр. Зураг 6.3-т Recognia график загварыг тодорхойлох жишээг үзүүлэв. Хөрөнгө оруулагч дараахь мэдээллийг хүлээн авна. товч тайлбарүйл явдал (загвар), үйл явдлын огноо болон иений зорилтот хүрээ. График нь хэв маягийг бүрдүүлдэг шугамууд, үйл явдлын огноог харуулсан дүрс, чиг хандлагын шугамуудыг агуулдаг.
    Q Recognita Inc. ZOOd
    MetaStock-д зориулсан Chart Pattem Recognition (CPR) нь MetaStock-ийн нэмэлт шинжээч програм бөгөөд танд зургаан сонгодог трендийн урвуу загвар (толгой ба мөрний дээд ба доод, гурвалсан дээд, гурвалсан доод, давхар дээд) болон давхар доод) болон гурван үргэлжлэлийг автоматаар таних боломжийг олгодог. чиг хандлагын загварууд
    ("тэгш хэмтэй гурвалжин", "өсөх гурвалжин", "буурах гурвалжин"). Эдгээр график загварууд нь хамгийн найдвартай.
    Хөтөлбөр нь хэв маягийг тодорхойлох үед график дээр хэв маяг илэрсэн үед худалдаачинд зөвлөмж өгөх үүрэгтэй Expert Commentary блок нь хамгаалалтын зогсоох захиалга хаана байрлуулах нь хамгийн тохиромжтой, хөрөнгийн хүлээгдэж буй үнэ ямар байхыг мэдээлдэг. Хөтөлбөр нь тодорхойлогдсон шинэ бус хэв маягийг диаграм дээр тэмдэглэж, байрлал руу орох, гарах дохиог үүсгэдэг. CPR нь үнийн хэв маягийг олон графикаар хурдан сканнердах боломжийг олгодог.
    1. Толгой ба мөрний хэв маягийг таних. Энэ загварын үндсэн дүрмүүд:
    1) өмнөх өсөлтийн хандлага: гурав ба түүнээс дээш дараалсан оргилууд;
    2) зүүн мөрзасч залруулах бууралтын дараа;
    3) зүүн мөрнөөс дээш шинэ түвшинд хүрэх;
    4) иен өмнөх доод түвшний түвшинд хүртэл буурдаг;
    5) гурав дахь авиралт нь дунд оргилын оройд хүрэхгүй;
    6) хүзүүний шугамын доор хаагдах.
    Үнэ хүзүүний түвшнээс доош унамагц CPR програм дараагийн нээлтийн үед богино позиц руу орох дохио өгдөг. арилжааны сесс. Зорилтот доод үнийг "хүзүүний" шугамын тасрах цэгээс "толгой"-ын дээд цэгээс дараагийн хонхорын түвшин хүртэлх зайг буулгах замаар тодорхойлно. Зорилтот дээд үнэ нь өмнөх өсөлтийн загварын эхний барын доод үнэ юм. Зорилтот үнийн талаархи мэдээллийг шинжээчийн тайлбарт тусгасан болно.
    Хэрэв хамгийн бага зорилтот үнэ нь тодорхой хугацаанд хүрч чадаагүй эсвэл үнэ нь хүзүүний шугамаас дээш гарсан бол загварыг цуцална. Хамгийн бага зорилтот үнэд хүрэх хамгийн их хугацаа нь зүүн "мөрөн" -өөс баруун тийш хүртэлх зайтай тэнцүү байна.
    2. "Гурвалсан дээд" загварыг таних. Энэ загварын үндсэн дүрмүүд:
    Өмнөх өсөлтийн хандлага: гурав ба түүнээс дээш дараалсан оргилууд;


    4) үнийг өмнөх доод түвшинд хүртэл бууруулах;
    5) гурав дахь өсөлт нь өмнөх хоёр оргилын түвшинд хүрсэн;
    6) дэмжих шугамын доор хаах.
    Үнэ дэмжлэгийн түвшнээс доош унамагц SRY дараагийн арилжааны нээлтэд богино позиц руу орох дохио өгдөг. Хамгийн бага зорилтот үнийг хойшлуулах замаар тодорхойлно дунд зэргийн өндөртаслах цэгээс доош тулгуур шугам хүртэл гурван орой. Зорилтот дээд үнэ нь өмнөх өсөлтийн загварын эхний барын доод үнэ юм.

    3. "Давхар дээд" загварыг таних. Энэ загварын үндсэн дүрмүүд:

    2) зүүн дээд хэсэг нь залруулах бууралтыг дагаж;
    3) зүүн оргилын түвшинд шинэ өсөлт;
    4) өмнөх сэтгэлийн хямралын түвшнээс доогуур хаагдах.
    Үнэ дэмжлэгийн түвшнээс доош унамагц SRY дараагийн арилжааны нээлтэд богино позиц руу орох дохио өгдөг. Хамгийн бага зорилтот үнийг эхний оргилын өндрийг хагарлын цэгээс доош дэмжих шугам хүртэлх графикаар тодорхойлно. Зорилтот дээд үнэ нь өмнөх өсөлтийн загварын эхний барын доод үнэ юм.
    Хэрэв хамгийн бага зорилтот үнэд тодорхой хугацаанд хүрч чадаагүй эсвэл үнэ нь дэмжлэг үзүүлэх шугамаас дээш өсвөл загвар цуцлагдана. Хамгийн бага зорилтот үнэд хүрэх хамгийн их хугацаа нь зүүн оргилоос баруун тийш хүрэх зайтай тэнцүү байна.
    4. “Өсөх гурвалжин” хэв маягийг таних. Энэ загварын үндсэн дүрмүүд:
    1) өмнөх өсөлтийн хандлага: хоёр ба түүнээс дээш дараалсан оргилууд;
    2) зүүн дээд хэсэг нь залруулах бууралтыг дагаж;
    3) зүүн оргилын түвшинд шинэ өсөлт;
    4) залруулга нь өмнөхөөсөө өндөр хоёр дахь хотгор үүсгэдэг;
    5) өмнөх оргил цэгээс дээш гарах - хагарах цэг.
    Гурвалжны оргил ба ховилын дагуу зурсан чиг хандлагын шугамууд нийлдэг. Гурвалжингийн уртын 2/3 эсвэл 3/4-ийг хэвтээ байдлаар хөдөлгөсний дараа үнэ нь ихэвчлэн өмнөх чиг хандлагын чиглэлд үүнийг эвддэг. Хэрэв гурвалжны уртын 75% -ийг туулахаас өмнө эвдрэл гарахгүй бол хэв маягийг цуцална.
    Үнэ эсэргүүцлийн түвшнээс дээш гарсан даруйд SRY дараагийн арилжааны нээлтэд худалдан авах дохио өгдөг. Зорилтот үнэд хүрэх хамгийн бага хугацаа нь эхний дээд/доод хэсгээс хоёр дахь дээд/доод хүртэлх зайтай тэнцүү байна. Зорилтот үнийг гурвалжингийн суурийн уртын хагасыг таслах цэгээс дээш сунгах замаар тодорхойлно.
    5. "Буурах гурвалжин" загварыг таних. Энэ загварын үндсэн дүрмүүд:
    өмнөх уналтын хандлага: хоёр ба түүнээс дээш дараалсан хямрал;
    2) зүүн талын хотгор нь засч залруулах өсөлтийг дагадаг;
    3) зүүн хөндийн түвшинд шинэ бууралт;
    4) өсөлт нь өмнөхөөсөө доогуур хоёр дахь оргилыг үүсгэдэг;
    5) өмнөх сэтгэлийн хямралын түвшнээс доош унах нь эвдрэлийн цэг юм.
    Флайл дэмжлэгийн түвшнээс доош унамагц SRY дараагийн арилжааны нээлтэд богино позиц руу орох дохио өгдөг (Зураг 6.4). Хэрэв гурвалжны уртын 75% -ийг туулахаас өмнө амжилт гарахгүй бол загварыг цуцална. Зорилтот үнэд хүрэх хамгийн бага хугацаа нь эхний дээд/доод хэсгээс хоёр дахь дээд/доод хүртэлх зайтай тэнцүү байна. Зорилтот үнийг гурвалжингийн суурийн уртын хагасыг таслах цэгээс доош сунгах замаар тодорхойлно.
    6. “Тэгш хэмтэй гурвалжин” загварыг таних. Энэ загварын үндсэн дүрмүүд:
    1) өмнөх өсөх эсвэл буурах хандлага: хоёр ба түүнээс дээш дараалсан оргилууд;
    2) зүүн оргил (тэвш) нь залруулах бууралт (өсөлт) дагалддаг;
    3) өмнөх оргил (тэвш) -ийн түвшнээс доогуур (дээш) өсөх (буурах);
    4) бууралт (өсөлт) нь өмнөхөөс дээш (доод) хоёр дахь хотгорыг (дээд) үүсгэдэг;
    5) чиг хандлагын шугамын нээлт.
    Үнэ эсэргүүцлийн түвшнээс дээш гарсны дараа CPR дараагийн арилжааны нээлтэд худалдан авах дохио өгдөг. Хэрэв үнэ нь дэмжих түвшнээс доогуур байвал CPR дараагийн арилжааны нээлтэд богино позиц руу орох дохио өгдөг. Хэрэв гурвалжны уртын 75% -ийг туулахаас өмнө эвдрэл гарахгүй бол хэв маягийг цуцална. Зорилтот үнэд хүрэх хамгийн бага хугацаа нь эхний дээд/доод хэсгээс хоёр дахь дээд/доод хүртэлх зайтай тэнцүү байна. Зорилтот үнийг гурвалжингийн суурийн дэд уртыг таслах цэгээс зурах замаар тодорхойлно.
    CPR нь Excel багцад зориулсан нэмэлт програм хангамжийн хэлбэрээр өгөгдлийг задлан шинжлэх, ангилах хэрэгслүүдтэй: AnalyzerXL, DownioaderXL, RTQuotesXL, PredictorXL, BulkQuotesXL, ClassifierXL, PortfolioXL, OptionsXL, тэдгээрийн чадварыг хүснэгтэд үзүүлэв. 6.1.
    Саяхан диаграмын хэв маягийг таних шинэ програм хангамжийн системүүд гарч ирэв, тухайлбал: Pattem z - Pattem Recognition Software (http://www.thepattemsite.com); Налуу диаграмын хэв маягийг таних сканнер (http; // www.newadawn.com); Omni худалдаачин графикийн загвар таних модуль 2 (http://www.onmitrader.com); IBFX - PRS - Хээ таних систем (http://www.ibfx.com)



    Танд нийтлэл таалагдсан уу? Найзуудтайгаа хуваалцаарай!