Зипфийн хууль ба нийгэм, эдийн засгийн үзэгдлийн фрактал шинж чанар. Zipf-ийн хууль гэж юу вэ

байгалийн хэлний үгс: хэрэв тухайн хэлний бүх үгсийг (эсвэл хангалттай урт текст) хэрэглэх давтамжийн буурах дарааллаар эрэмбэлсэн бол давтамж nИйм жагсаалтын 1-р үг нь түүний серийн дугаартай ойролцоогоор урвуу пропорциональ байна n(гэж нэрлэдэг зэрэглэлЭнэ үг, захиалгын хуваарийг харна уу). Жишээлбэл, хамгийн их хэрэглэгддэг хоёр дахь үг нь эхнийхээс хоёр дахин бага, гурав дахь нь эхнийхээс гурав дахин бага, гэх мэт.

Бүтээлийн түүх[ | ]

Загварын нээлтийн зохиогч нь Францын стенографич (фр. Жан-Батист Эступ), үүнийг 1908 онд "The Range of Shorthand" хэмээх бүтээлдээ дүрсэлсэн байдаг. Энэ хуулийг анх 1913 онд Германы физикч Феликс Ауэрбах "Хүн амын төвлөрлийн хууль" бүтээлдээ хотын хэмжээсийн хуваарилалтыг тодорхойлоход ашигласан бөгөөд 1949 онд энэ хэв маягийг идэвхтэй сурталчилж, анх санал болгож байсан Америкийн хэл шинжлэлийн эрдэмтэн Жорж Зипфийн нэрээр нэрлэсэн. эдийн засгийн хүчний хуваарилалт, нийгмийн байдлыг тодорхойлоход ашиглах.

Марковын нэмэлт гинжин хэлхээний корреляцийн шинж чанарт үндэслэсэн Zipf-ийн хуулийн тайлбарыг (алхам санах ойн функцтэй) 2005 онд өгсөн.

Zipf-ийн хуулийг Паретогийн тархалтаар математикийн хувьд тайлбарладаг. Энэ нь инфометрикт хэрэглэгддэг үндсэн хуулиудын нэг юм.

Хуулийн хэрэглээ[ | ]

1949 онд Жорж Зипф хүмүүсийн орлогыг хэмжээгээр нь хуваарилж байгааг анх харуулсан: хамгийн баян хүн дараагийн хамгийн баян хүнээс хоёр дахин их мөнгөтэй байдаг гэх мэт. Энэ мэдэгдэл нь 1926-1936 оны хооронд хэд хэдэн улс оронд (Англи, Франц, Дани, Голланд, Финлянд, Герман, АНУ) үнэн байв.

Энэ хууль нь хотын тогтолцооны хуваарилалттай холбоотой ажилладаг: аль ч улсын хамгийн олон хүн амтай хот нь дараагийн том хотоос хоёр дахин том гэх мэт. Хэрэв та тодорхой улс орны бүх хотыг хүн амын тоо буурах дарааллаар жагсаавал хот бүрт тодорхой зэрэглэл, өөрөөр хэлбэл энэ жагсаалтад орсон тоогоор оноож болно. Энэ тохиолдолд хүн амын тоо, зэрэглэл нь дараах томъёогоор илэрхийлэгдсэн энгийн хэв маягт захирагдана.

P n = P 1 / n (\displaystyle P_(n)=P_(1)/n),

Хаана P n (\displaystyle P_(n))- хотын хүн ам n-р зэрэг; P 1 (\displaystyle P_(1))- улсын гол хотын хүн ам (1-р зэрэг).

Эмпирик судалгаа энэ мэдэгдлийг баталж байна.

1999 онд эдийн засагч Ксавьер Габет Zipf-ийн хуулийг эрчим хүчний хуулийн жишээ гэж тодорхойлсон: хэрвээ хотууд ижил стандарт хазайлттай санамсаргүй байдлаар ургадаг бол хязгаарт тархалт нь Zipf-ийн хуультай нийлнэ.

ОХУ-ын хот суурингийн талаархи судлаачдын дүгнэлтээр Zipf-ийн хуулийн дагуу:

  • Оросын ихэнх хотууд хамгийн тохиромжтой Zipf муруйгаас дээгүүр байрладаг тул томоохон хотууд руу шилжин суурьшсаны улмаас дунд болон жижиг хотуудын тоо, хүн амын тоо тасралтгүй буурах хандлагатай байна;
  • үүний дагуу 7 сая гаруй хотууд (Санкт-Петербург, Новосибирск, Екатеринбург, Нижний Новгород, Казань, Челябинск, Омск) хамгийн тохиромжтой Zipf муруйгаас доогуур байрладаг, хүн амын өсөлтөд ихээхэн нөөцтэй бөгөөд хүн амын өсөлтийг хүлээж байна;
  • Хоёр дахь хот (Санкт-Петербург) болон дараагийн томоохон хотууд нь ажиллах хүчний эрэлт буурч, үүний зэрэгцээ хөдөлмөрийн эрэлт буурч байгаагаас хамгийн тохиромжтой Zipf муруйгаас хол хоцорч байгаа тул зэрэглэлийн эхний хот (Москва) хүн ам цөөрөх эрсдэлтэй. амьжиргааны өртөг, үүнд юуны түрүүнд орон сууц худалдан авах, түрээслэх зардал орно.

Шүүмжлэл [ | ]

Америкийн био мэдээлэл зүйн мэргэжилтэн Тэмдэгтүүдийн санамсаргүй дараалал ч энэ хуульд захирагддаг болохыг нотолсон Zipf-ийн хуулийн статистик тайлбарыг санал болгов. Зохиогч Zipf-ийн хууль нь бичвэрийн утга зүйтэй ямар ч холбоогүй, хэл шинжлэлтэй өнгөцхөн холбоотой цэвэр статистик үзэгдэл мэт харагдаж байна гэж дүгнэжээ.

Орос улсад Zipf-ийн хууль яагаад ажилладаггүй вэ? 2017 оны гуравдугаар сарын 11

"Зипфийн хууль"-ийг анх 1913 онд Германы физикч Феликс Ауэрбах "Хүн амын төвлөрлийн хууль" бүтээлдээ хотын хэмжээсийн тархалтыг тодорхойлоход ашигласан. Энэ нь 1949 онд энэхүү хэв маягийг идэвхтэй дэлгэрүүлж, эдийн засгийн хүч, нийгмийн статусын хуваарилалтыг тодорхойлоход ашиглахыг анх санал болгосон Америкийн хэл шинжлэлийн эрдэмтэн Жорж Зипфийн нэрээр нэрлэгдсэн юм.

Орос улсад энэ хууль үйлчилдэггүй.


1949 он руу буцъя. Хэл шинжлэлийн эрдэмтэн Жорж Зипф (Zipf) хүмүүсийн хэлээр зарим үгийг хэрэглэх хачирхалтай хандлагыг анзаарчээ. Цөөн тооны үг байнга хэрэглэгддэг ба дийлэнх нь маш ховор хэрэглэгддэг болохыг олж мэдсэн. Хэрэв та үгсийг алдар нэрээр нь үнэлвэл гайхалтай зүйл илчлэгддэг: нэгдүгээр ангиллын үг нь хоёрдугаар ангиллын үгнээс хоёр дахин, гуравдугаар ангиллын үгнээс гурав дахин их хэрэглэгддэг.

Zipf тухайн улс орны хүмүүсийн орлогын хуваарилалтад ижил дүрэм үйлчилдэг болохыг олж мэдсэн: хамгийн баян хүн дараагийн хамгийн баян хүнээс хоёр дахин их мөнгөтэй байдаг гэх мэт.

Хотын хэмжээнд ч энэ хууль үйлчлэх нь хожим тодорхой болсон. Аль ч улсын хамгийн олон хүн амтай хот нь дараагийн том хотоос хоёр дахин том гэх мэт. Гайхалтай нь Zipf-ийн хууль өнгөрсөн зуунд дэлхийн бүх улс оронд хэрэгжиж байсан.

АНУ-ын хамгийн том хотуудын жагсаалтыг хар л даа. Тиймээс 2010 оны хүн амын тооллогоор АНУ-ын хамгийн том хот болох Нью-Йоркийн хүн ам 8,175,133 хүн байна. Хоёрдугаарт 3,792,621 хүн амтай Лос Анжелес ордог. Дараагийн гурван хот болох Чикаго, Хьюстон, Филадельфи нь тус бүр 2,695,598, 2,100,263, 1,526,006 хүн амтай. Мэдээжийн хэрэг, эдгээр тоо нь тодорхой бус боловч Zipf-ийн хуультай гайхалтай нийцэж байна.

Пол Кругман Zipf-ийн хуулийг хотуудад хэрэглэх тухай бичихдээ маш сайн санааг хэлсэн: эдийн засгийн онолыг ихэвчлэн төвөгтэй, эмх замбараагүй бодит байдлын энгийн хялбаршуулсан загваруудыг бий болгосон гэж буруутгадаг. Zipf-ийн хууль нь эсрэгээрээ гэдгийг харуулж байна: бид хэтэрхий төвөгтэй, замбараагүй загваруудыг ашигладаг боловч бодит байдал нь гайхалтай цэвэр, энгийн байдаг.

Хүчний хууль

1999 онд эдийн засагч Ксавье Габет шинжлэх ухааны бүтээл бичиж, Зипфийн хуулийг “хүчний хууль” гэж тодорхойлсон байдаг.

Габе хэлэхдээ, хотууд эмх замбараагүй өссөн ч энэ хууль хэвээр байна. Гэвч энэ гөлгөр бүтэц нь нийслэлээс бусад хот руу шилжсэн даруйдаа эвдэрч эхэлдэг. Зуун мянга орчим хүн амтай жижиг хотууд өөр хуулийг дагаж мөрдөж, илүү тодорхой хэмжээний хуваарилалтыг харуулдаг.

"Хот" гэсэн нэр томъёо нь юу гэсэн үг вэ гэж гайхаж магадгүй юм. Эцсийн эцэст, жишээлбэл, Бостон, Кембриж хоёрыг Сан Франциско, Окленд хоёр шиг усаар тусгаарласан хоёр өөр хот гэж үздэг. Шведийн хоёр газарзүйчид ч гэсэн ийм асуулт тавьсан бөгөөд тэд улс төрийн зорилгоор бус хүн ам, зам харилцаагаар нэгдсэн "байгалийн" хотуудыг авч үзэх болсон. Ийм "байгалийн" хотууд хүртэл Зипфийн хуулийг дагаж мөрддөг болохыг тэд олж мэдэв.


Zipf-ийн хууль яагаад хотод ажилладаг вэ?

Хотуудын хүн амын тоог урьдчилан таамаглахуйц байх шалтгаан юу вэ? Үүнийг хэн ч баттай тайлбарлаж чадахгүй. Цагаачлалын улмаас хотууд өргөжин тэлж, цагаачид томоохон хотууд руу хошуурч байгааг бид мэднэ, учир нь тэнд илүү их боломж бий. Гэвч энэ хуулийг тайлбарлахад цагаачлал хангалтгүй.

Том хотууд маш их мөнгө олдог тул Zipf-ийн хууль нь орлогын хуваарилалтад бас ажилладаг тул эдийн засгийн шалтгаанууд бас байдаг. Гэсэн хэдий ч энэ нь асуултанд тодорхой хариулт өгөхгүй хэвээр байна.

Өнгөрсөн жил хэсэг судлаачид Zipf-ийн хуульд үл хамаарах зүйлүүд байдгийг олж мэдсэн: хууль зөвхөн тухайн хотууд эдийн засгийн хувьд холбогдсон тохиолдолд л ажилладаг. Энэ нь хууль яагаад жишээлбэл, Европын аль нэг улсад хамаарахгүй, харин Европын Холбоог бүхэлд нь хамардаггүй болохыг тайлбарлаж байна.

Хотууд хэрхэн өсдөг вэ?

Хотуудад хамаарах өөр нэг хачирхалтай дүрэм байдаг бөгөөд энэ нь хотууд хөгжихийн хэрээр нөөцийг хэрхэн зарцуулдагтай холбоотой юм. Хотууд томрох тусам тэд илүү тогтвортой болдог. Жишээлбэл, хот хоёр дахин томрох юм бол шатахуун түгээх станцын тоо хоёр дахин нэмэгдэхгүй.

ШТС-ын тоог 77 орчим хувиар нэмэгдүүлбэл хот амьдрахад нэлээд тав тухтай байх болно. Zipf-ийн хууль нь нийгмийн тодорхой хуулийг дагаж мөрддөг бол энэ хууль нь амьтад нас ахих тусам эрчим хүч зарцуулдаг гэх мэт байгалийн хуулиудад илүү ойр байдаг.

Математикч Стивен Строгац үүнийг дараах байдлаар тайлбарлав.

Заантай харьцуулахад хулгана өдөрт хэдэн калори хэрэгтэй вэ? Тэд хоёулаа хөхтөн амьтад тул эсийн түвшинд тийм ч их ялгаатай байх ёсгүй гэж үзэж болно. Үнэн хэрэгтээ, хэрэв та арван өөр хөхтөн амьтдын эсийг лабораторид өсгөх юм бол эдгээр бүх эсүүд ижил бодисын солилцооны хурдтай байх болно, тэд генетикийн түвшинд эзэн нь ямар хэмжээтэй болохыг санахгүй байна.

Гэхдээ хэрэв та заан эсвэл хулгана хоёр тэрбум эсийн үйл ажиллагааны хуримтлалыг бүрэн эрхт амьтан гэж үзвэл зааны эсүүд хулганы эсээс хамаагүй бага энерги зарцуулдаг. Клейберийн хууль гэж нэрлэгддэг бодисын солилцооны хууль нь хөхтөн амьтны бодисын солилцооны хэрэгцээ нь түүний биеийн жинтэй пропорциональ хэмжээгээр 0.74 дахин нэмэгддэг гэж заасан байдаг.

Энэ 0.74 нь хотын шатахуун түгээх станцын тоог зохицуулдаг хуулийн 0.77-той тун ойролцоо байна. Тохиолдол уу? Магадгүй, гэхдээ тийм биш байх магадлалтай.

ОХУ-д хамгийн том хот болох Москвагийн хүн ам албан ёсоор 11.5 сая орчим хүн байна. Хоёр дахь хот болох Санкт-Петербург хотын хүн ам 5.2 сая хүн амтай, бидний харж байгаагаар хоёр хотын хүн амын харьцаа нь Зипфийн хуультай ойролцоо байна. Үүний дагуу Оросын гурав дахь том хот нь 4 сая орчим хүн амтай байх ёстой бөгөөд дөрөв дэх нь 3 сая орчим хүн амтай байх ёстой Гэсэн хэдий ч Орост ийм хот байдаггүй. Бодит байдал дээр Оросын гурав дахь хот Новосибирск 1.6 сая хүн амтай (нормоос 2.5 дахин бага), дөрөвдүгээрт Екатеринбургт 1.4 сая хүн амьдардаг нь Zipf-ийн нормоос 2 дахин бага байна.

Орос улсад яагаад Zipf-ийн хууль ажиллахгүй байна вэ? Америкийн социологич Ричард Флорида "Бүтээлч анги" номондоо энэ асуултад хариулжээ. Тэрээр "Зипфийн хууль" нь эзэнт гүрнүүд (эсвэл эзэнт гүрнүүд дахин сэргэсэн улсууд) болон төлөвлөгөөт эдийн засагт ажилладаггүй гэж бичжээ. Тэрээр ийм үл хамаарах гурван орныг нэрлэв: Англи (Лондонгийн дараа хүн амын тал хувьтай хоёр дахь хот ч байдаггүй), Орос, Хятад.

ОХУ-ын Засгийн газрын дэргэдэх Санхүүгийн их сургуулиас "Зипфийн хууль"-ийн судалгааг мөн хийсэн. Үүний дүгнэлт нь:

"Оросын хотуудын хүн амын бодит хуваарилалт нь хөгжингүй болон хөгжиж буй орнуудын аль алинд нь Zipf муруйтай бүрэн нийцэхгүй байна. ОХУ-ын хувьд жинхэнэ Zipf муруйны нэг хэсэг нь хөгжингүй орнуудын хотуудын тархалттай тохирч байгаа хамгийн тохиромжтой цэгээс дээгүүр байрласан бөгөөд доорх хэсэг нь хөгжиж буй орнуудын хотуудын тархалттай тохирч байна. Тиймээс, Zipf-ийн дүрмийн дагуу Орост хамгийн том хотууд, сая гаруй хотууд давамгайлах үүрэг гүйцэтгэдэг. Бодит муруйн идеалаас хазайсан нь тус улсын өргөн уудам нутаг дэвсгэр, нийгэм-эдийн засаг, байгаль цаг уурын янз бүрийн хүчин зүйлээс шалтгаална."

Хоёр мега хот, жижиг дунд хотууд (250 мянга хүртэл хүн амтай) барууны хотжилтын төрөлд сайн тохирдог. Гэхдээ сая гаруй хүн амтай томоохон хотууд, хотууд - үгүй.

Өөр нэг судалгаанаас гарсан дүгнэлт:

"Тодорхойлсон чиг хандлага нь Орос улс Zipf хуулиас хазайсан шалтгаан нь ЗХУ-ын үед дунд болон жижиг хотуудын дэмжлэгийг багтаасан орон зайн хөгжлийн төвлөрсөн төлөвлөлт байсан гэсэн уран зохиолын таамаглалтай нийцэхгүй байна. Зах зээлд шилжих нь эдгээр гажуудлыг арилгаж, зэрэглэлийн харьцааг каноник хэлбэрт ойртуулах ёстой байсан ч эдийн засгийн үйл ажиллагааны орон зайг бүрдүүлэхэд зах зээлийн механизмыг холбосон ч үүнээс цааш хазайлт ажиглагдаж байна. улс.”


(Тойрог нь Оросын бүс нутгийн хүн амыг заана)

Тэдгээр. ОХУ-д "Зипфийн хууль"-аас хазайх нь төлөвлөгөөт эдийн засгийн үр дүн биш (Хятад дахь шиг), харин тус улсын эзэнт гүрний мөн чанарын үр дагавар юм (нэг эсвэл хоёр хот метрополисын үүрэг гүйцэтгэдэг).

Эдгээр чиг хандлагыг үндэслэн ОХУ-ын хотжилтын хөгжил / регрессийн магадлал дараах байдалтай байна.

— Оросын ихэнх хотууд хамгийн тохиромжтой Zipf муруйгаас дээгүүр байрладаг тул томоохон хотууд руу шилжин суурьшсанаар дунд болон жижиг хотуудын тоо, хүн амын тоо тасралтгүй буурах хандлагатай байна.

- 7 сая гаруй хотууд (Санкт-Петербург, Новосибирск, Екатеринбург, Нижний Новгород, Казань, Челябинск, Омск) хамгийн тохиромжтой Zipf муруйгаас доогуур байрладаг бөгөөд хүн амын өсөлтөд ихээхэн нөөцтэй бөгөөд хүн амын өсөлтийг хүлээж байна.

- Хоёр дахь хот (Санкт-Петербург) болон дараагийн томоохон хотууд нь ажиллах хүчний эрэлт буурч, хөдөлмөрийн эрэлт буурч байгаатай зэрэгцээд хамгийн тохиромжтой Zipf муруйгаас хол хоцорч байгаа тул зэрэглэлийн эхний хот (Москва) хүн ам цөөрөх эрсдэлтэй. амьжиргааны өртөг, үүнд юуны түрүүнд орон сууц худалдан авах, түрээслэх зардал."

(ЗХУ-д "Zipf-ийн хууль" бас ажиллахгүй байсан - хотууд байх ёстой байсан Zipf муруйгаас хазайж байгааг харж болно)

Ричард Флорида "Бүтээлч анги" номондоо Америк, Оросын хотуудын өөр нэг ялгааг анзаарчээ. АНУ-д бүтээлч ангийн төвлөрөл нь улс даяар тархсан дунд хэмжээний хотуудад байдаг. Тиймээс бүтээлч ангийн хамгийн өндөр хувь нь Сан Хосе, Боулдер (Колорадо), Хантсвилл (Алабама), Корваллис (Орегон) гэх мэт хотуудад байдаг. - тэдний дотор энэ хувь 40-48% байна. Харин АНУ-ын хамгийн том хот болох Нью-Йорк нь бүтээлч ангийн эзлэх хувийн жингээр дунд тариачдын тоонд ордог - нийт ажилчдын 35%, чансааны 34-р байр, тус улсын хоёр дахь хот Лос Анжелес. - ерөнхийдөө 60-р байр. Үүнтэй төстэй хандлага "Zipf-ийн хууль" ажилладаг бусад орнуудад (Герман, Франц, Итали, Швед гэх мэт) ажиглагдаж байна.

Орос улсад тус улсын бараг бүх бүтээлч анги Москвад төвлөрч, үлдсэн хотууд нь 20-р зууны дунд үеийн үйлдвэрлэлийн бүсүүд хэвээр байна.

Энэ бүхэн үнэхээр сэтгэл хөдөлгөм, гэхдээ магадгүй Zipf-ийн хуулиас бага нууцлаг юм. Хүмүүсийн бүтээсэн ч гэсэн үндсэндээ экосистем болсон хот яагаад байгалийн жам ёсны хуулийг дагаж мөрдөх ёстойг ойлгоход тийм ч хэцүү биш юм. Гэхдээ Zipf-ийн хууль нь мөн чанартаа ижил төстэй зүйлгүй юм. Энэ бол нийгмийн үзэгдэл бөгөөд сүүлийн зуун жилд л тохиолдсон.

Бидний мэдэж байгаа зүйл бол Zipf-ийн хууль нь бусад нийгмийн тогтолцоо, түүний дотор эдийн засаг, хэл шинжлэлийн системд ч хамаатай. Тэгэхээр энэ хачирхалтай хуулийг бий болгож буй нийгмийн ерөнхий дүрмүүд байдаг юм болов уу, хэзээ нэгэн цагт бид үүнийг ойлгох байх. Энэ оньсого тааварласан хүн хотуудын өсөлтөөс хамаагүй илүү чухал зүйлийг урьдчилан таамаглах түлхүүрийг олж чадна. Zipf-ийн хууль нь бидний харилцах, худалдаа наймаа хийх, олон нийтийг байгуулах гэх мэт олон зүйлийг тодорхойлдог нийгмийн динамикийн дэлхийн дүрмийн жижиг хэсэг байж болох юм.

P.S. Би хувьдаа ийм тооны ойролцоо таамаглал, үл хамаарах зүйл бүхий хуулийг ерөнхийд нь хууль гэж нэрлэхэд хэцүү юм шиг санагддаг. Зүгээр л санамсаргүй тохиолдол.

Чи юу гэж бодож байна?

эх сурвалжууд

Сайн байна уу, эрхэм уншигчид! Zipf-ийн хууль нь текстийн байгалийн байдлыг шалгахад тусална. Тиймээс, наад зах нь үүнд итгэдэг. Энэ бидний толгой дээрх ямар “байгалийн” шинж вэ? Энэ үзүүлэлтийг хянах шаардлагатай юу, энэ нь вэбсайтыг сурталчлахад хэр чухал вэ? Үүнийг онлайн үйлчилгээ зөв илрүүлсэн үү? Энэ бүх асуултыг цэгцлэх нь зүйтэй байх. Интернетэд энэ талаар янз бүрийн, заримдаа маш зөрчилтэй санал бодол байдаг. Би хоёр центээ оруулаад энэ Zipf-д хандах өөрийн хандлагыг тоймлон хэлье.

Яагаад гэнэт хуулийн талаар - эмэгтэйлэг хүйсийн хувьд? Тийм ээ, би хэл шинжлэлийн эрдэмтэн, филологич Жорж Кингсли Зипфийн бүтээлийг манай "баст овоохой" буюу дэгээгээр нэвтэрч, тэндээс эрхийг татаж авдаг зальтай үнэгтэй харьцуулахыг үнэхээр хүсч байна. Гэхдээ эхлээд математик, статистикийн талаар бага зэрэг мэдээлэл. Гэхдээ битгий ай, найзууд аа, би өөрөө тийм ч хүчтэй тооцоологч биш болохоор чамайг ч, өөрийгөө ч тамлахгүй.

Zipf-ийн хууль ба дэлхийн хэв маяг

Ж.К.Зипф өөрийгөө статистикийн нийгмийн ... экологийн мэргэжилтэн гэж нэрлэжээ. Сонирхолтой хослол, тийм үү? Тэрээр нийгмийн үзэгдлийн зүй тогтлыг статистик болон олон тооны математикийн үүднээс судлахыг оролдсон. Тэгээд тодорхой хэмжээгээр амжилтанд хүрсэн. Ийнхүү англи хэл дээрх үгсийн хэрэглээний давтамжийг "зэрэглэлийн хүснэгт" дэх тоотой харьцуулах жишээг ашиглан урвуу пропорциональ хамаарал ажиглагдаж байгааг олж мэдэв. Ойролцоогоор, хэрэглээний давтамжийн хувьд жагсаалтын хоёрдугаарт бичигдсэн үг нь эхнийхээс хагас дахин их хэрэглэгддэг; гурав дахь нь - гурван удаа гэх мэт. Математикийн үүднээс авч үзвэл энэ функциональ хамаарлыг Паретогийн тархалтаар тодорхойлдог. Хэл бүрийн хувьд мэдээжийн хэрэг өөрийн гэсэн тогтмол, коэффициентийг нэвтрүүлсэн.

Үүнтэй ижил хэв маягийг эдийн засгийн зарим ангилалд ажиглаж болно, жишээлбэл, дэлхийн хамгийн баян хүмүүсийн орлогын хуваарилалт. Нэмж дурдахад дэлхийн ихэнх улс орнуудын хамгийн том хотуудын хүн амыг ижил Zipf-ээр тодорхойлсон шугамаар байрлуулдаг. Бүх төрлийн саад учруулж буй хүчин зүйлийг харгалзан зарим хазайлттай боловч хууль нь ямар нэгэн ойлгомжгүй байдлаар ажилладаг. Би энэ үзэгдлийн талаар удаан ярихыг хүсэхгүй байна. Бид Zipf-ийн нууцлаг араатныг хэл шинжлэлийн үүднээс ч биш, харин бидний нийтлэл гэх мэт жижиг үгсийн түүвэрт хэрэглэх боломжийн үүднээс сонирхсоор байна.

Zipf-ийн хуулийг ашиглан текстийг шалгах нь зүйтэй болов уу?

Найзууд аа, өмнөх хэсэгт бид мега хотууд эсвэл баячуудын нийслэлийг өсөн нэмэгдэж буй, давуу талыг ашиглан ярьсан гэдгийг анхаарна уу. Нэг сайтаас би Zipf-ийн тооцоо дундаж хүн амтай хотуудад ч тохирохгүй гэсэн мэдээллийг олж мэдсэн. Эдийн засгийн хувьд ч мөн адил: жилд 10 сая доллараас бага орлоготой пүүсүүдийн хувьд зэрэглэл/давтамжийн хууль бас ажиллахгүй. Хэл шинжлэлийн судалгааны хувьд бүхэл бүтэн хэлний бүлэг нь маш сайн сонголт юм. Жишээлбэл, англи хэл сая орчим үгтэй. Тэнд тийм ээ, эдгээр үгсийн давтамж, хэрэглээний харьцаа нь гиперболыг бий болгодог. Гэхдээ би жижиг үгийн жишээнүүдэд Zipf хэрэглэхэд ямар ч хязгаарлалт олсонгүй.

Гэсэн хэдий ч логикийн энгийн ойлголтоос харахад дунд хэмжээний хотууд (хэдэн зуун мянган хүн амтай) эсвэл 10 саяас доош орлоготой пүүсүүд (ядуу хүмүүс!) Zipof-ийн тооцоололд уучлал гуйж чадахгүй бол яагаад бидний бичвэрүүдийг эрүүдэн шүүж байна вэ гэдгийг харуулж байна. . Эцсийн эцэст, тэдгээр нь мянга мянган үг агуулдаггүй. Тэгэхээр дунджаар 3 мянган тэмдэгттэй нийтлэл нь ойролцоогоор 400-500 үг агуулдаг. Ийм бүлгийн дунд бид ямар хэв маягийг олохыг хичээж байна вэ?

Үгүй ээ, Zipf-ийн хуулийн дагуу текстийг шалгах онлайн үйлчилгээг хөгжүүлэгчид манай нийтлэлийг семантик мега дээж гэж нэрлэх боломжгүй гэдгийг ямар нэгэн байдлаар анхаарч үзэхийг оролдсон байж магадгүй юм. Гэхдээ хэрэв тэд амжилтанд хүрвэл энэ асуудал Нобелийн шагнал шиг үнэртэх болно! Алдарт эрдэмтний нээлтэд ийм нэмэлт өөрчлөлт оруулахын тулд ядаж Зипф-Пупкины хууль гэх мэт гайхалтай хүүхдийн овгийг нэмэх шаардлагатай болно. Сайхан сонсогдож байна? Гэхдээ бид сүр дуулиантай дууг сонссонгүй.

Дахин хэлэхэд, логик, амьдралын туршлагатай хослуулан: хайлтын эрэмбийн алгоритмыг хөгжүүлэгчид бага зэрэг хатуу тоглосон. Би тэдний хэцүү даалгаврыг ойлгож байна: багийн гишүүн бүр үр дүнтэй, бүтээлч байдлаа байнга баталж, санаа бодлоор дүүрэн байх ёстой. Ингээд тэд бидний толгой дээр асгарсаар ирсэн.

Хичээл зүтгэлтэй оновчлогчдын туршилтууд

За, манай бор шувууны нийтлэлүүд рүү их буугаар буудах шаардлагагүй: манай бүтээлүүд Zipf-тэй хийсэн туршилтуудад тохирохгүй байна, эрхэм хөгжүүлэгчид. Жижиг дээжүүдэд эдгээр хэв маяг нь хол байдаг. Энэ нь мэдээжийн хэрэг цэвэр миний бодол юм. Би интернетээс эсрэгээр нь олж мэдсэн: Zipf-ийн хууль нь хайлтын үр дүнд сайтын байр суурийг сайжруулж, текстүүд нь мэдэгдэхүйц илүү сонирхолтой болсон гэх мэт. Олон хүмүүс TOP-ийг Zipf түгээлттэй нийцэж байгаа эсэхийг шинжлэхийг хичээдэг бөгөөд үүний үндсэн дээр зарим дүгнэлтийг гаргадаг. Зогс, ноёд оо! Хайлтын системүүд эрэмблэхдээ найман зуу орчим хүчин зүйлийг харгалзан үздэг тул та аль нэгийн нөлөөллийг хянахыг оролдож байна уу? За, энэ сайн зүйл биш! Судалгааг ийм байдлаар хийдэггүй бөгөөд түүний үр дүнг зөв гэж үзэх боломжгүй юм.

Zipf-д биш (би шинжлэх ухааныг хүндэлдэг), харин алгебрийн зохицолд дахин итгэх гэсэн үндэслэлгүй оролдлогын эсрэг бүх сөрөг хандлагатай байгаа тул би онлайн үйлчилгээн дэх байгалийн байдлын талаар нэгээс олон удаа дүн шинжилгээ хийж байсан. Мэдээжийн хэрэг үйлчлүүлэгчдийн хүсэлтээр. Бичиг баримт, клише, тавтологигүй амьд хүний ​​хэл нь Зипофийн саад бэрхшээлийг даван туулахад маш амархан тусалдаг гэж би хэлж чадна. Текстийн 70-80% байгалийн байдалд хүрэх нь тийм ч хэцүү биш юм. Жишээлбэл, хүссэн хүмүүс текстээ шалгаж болно. Үүнийг байнга хийх шаардлагагүй гэж би бодож байна. Түүнээс гадна та Zipf үнэгэнд найдах ёсгүй. Үнэнийг хэлэхэд, найзууд аа, шинжлэх ухааны үндэслэлгүй туршилтуудад цаг хугацаа, хүч чадлаа бүү үр.

Энэ текст нь 87% байгалийн юм. Хангалттай. Би 98% хүртэл барьж чадсан ч энэ нь хайлтын үр дүнгийн байрлалд огт нөлөөлөхгүй гэж би бодож байна. Миний таамаглаж байгаагаар энэ нийтлэл ТОП-д орохгүй. За яахав, гэхдээ тэр хүссэнээ хэлсэн.

Баяртай найзуудаа.

Таны улс орны гарын авлага Хуулбар бичих GALANT.

SEO-ийн ертөнц байнга хувьсан өөрчлөгдөж байдаг бөгөөд оновчлол нь зогсонги байдалд ордоггүй. Текст бичих, тэдгээрийг илүү сайн индексжүүлэхэд бэлтгэх шинэ аргууд гарч ирж байна. Оновчлогчдын анхаарал хандуулдаг параметрүүдийн нэг бол Zipf-ийн хуулийн дагуу текстийн байгалийн байдал юм. Zipf-ийн хууль, түүний SEO сурталчилгаанд гүйцэтгэх үүрэг юу вэ?

Томъёоны дагуу Zipf-ийн хууль нь текст дэх үгийн давтамжийн туршилтаар тогтоогдсон загвар юм. Хуулийн дагуу бичвэр дэх үгийн давтамж нь жагсаалтад байгаа байртай бараг урвуу хамааралтай байдаг. Өөрөөр хэлбэл, хуульд үндэслэн текстэд хамгийн их дурдсан хоёр дахь үгийг эхнийхээс хоёр дахин бага, гурав дахь нь гурав дахин бага гэх мэтээр ашиглах ёстой.

Энэ хэв маягийг ойлгоход хялбар болгохын тулд та компьютерийн гар дээрх үсгүүдийн байрлалд анхаарлаа хандуулах хэрэгтэй. Энэ нь санамсаргүй биш юм: аль ч хэлний хамгийн их хэрэглэгддэг үсгүүд нь бага ашиглагддаг үсгүүдээс илүү тохиромжтой байдаг. Үгсийн нөхцөл байдал ижил байна: текстийн сэдвийг тодорхойлдог байнга хэрэглэгддэг, ховор хэрэглэгддэг үгс байдаг.

Хайлтын системийн алгоритм дахь сайтуудыг эрэмбэлэхдээ үгийн ач холбогдлоор тусгаарлах аргыг бас ашигладаг. Үүнийг харгалзан үзвэл үгийн утга, хэрэглээний давтамжийн ялгаа нь SEO текстийг бичихдээ үгсийг 3 бүлэгт хуваахад тусалдаг.

  • Туслах. Энэ бүлэгт бие даасан семантик ачаалал өгдөггүй үгс, жишээлбэл холболт, угтвар үг, төлөөний үг, тоосонцор орно. Бүх туслах үгсийг хайлтын системүүд мэдээллийн шуугиан гэж хүлээн зөвшөөрдөг бөгөөд эрэмбэлэхдээ үл тоомсорлодог.
  • Чухал. Ийм үгс нь бичвэрт бага түгээмэл байдаг бөгөөд чухал ач холбогдолтой семантик ачааллыг агуулдаг. Хайлтын системүүд энэ бүлгийн үгсийг түлхүүр үг гэж ойлгодог.
  • Санамсаргүй. Энэ бүлгийн үгс нь тодорхой сэдвээр текст бичихэд ховор хэрэглэгддэг бөгөөд хайлтын зэрэглэлд бараг ямар ч нөлөө үзүүлэхгүй.

SEO мэргэжилтнүүдийн үзэж байгаагаар Америкийн хэл шинжлэлийн мэргэжилтэн Жорж Зипф хайлтын системд ашигласан үгсийн давтамж дээр үндэслэн текстийн байгалийн байдал, өвөрмөц байдлыг тодорхойлохын тулд ашиглаж эхэлсэн хуулиудыг тодорхойлсон.

Оновчлогчид ихэвчлэн өвөрмөц, хамааралтай текстийг сурталчлахад бэрхшээлтэй тулгардаг. Өөрөөр хэлбэл, текст нь 100% өвөрмөц байж болох бөгөөд өндөр ач холбогдолтой түлхүүр асуулгад зориулж оновчтой болгохын зэрэгцээ дээд цэгт хүрэхгүй, эсвэл хамгийн муу нь албан тушаалд дүн шинжилгээ хийх програмын харагдацаас гадуур байх болно.

Zipf-ийн хууль нь хайлтын үр дүнд хэр их нөлөөлдөгийг тодорхойлох нь тийм ч хялбар биш юм. Хайлтын системүүд олон хүчин зүйлийн хослолыг харгалзан үздэг бөгөөд үүнд байгалийн байдлын Zipf тест байдаг. Өнөөдөр контент нь хайлтын системийг сурталчлахад хамгийн чухал үүрэг гүйцэтгэдэг тул SEO текстийг бүтээхдээ өвөрмөц байдал, байгалийн байдлын үзүүлэлтүүдийг сайтар хянаж байхыг зөвлөж байна. Текстийг шалгах олон үйлчилгээ байдаг. Хамгийн алдартай, батлагдсан хоёр сайт дээр анхаарлаа хандуулцгаая - 1y.ru болон pr-cy.ru.

Үйлчилгээ 1y.ru

Энэ сайт нь танд бие даасан вэб хуудас, бүхэл бүтэн сайт эсвэл 100-аас 5000 үгтэй текстийг агуулгын байгалийн байдлыг шалгах боломжийг олгодог. Нэргүй хэрэглэгчдэд зориулсан хязгаарлалт нь өдөрт 2000 хүртэлх текстийг шалгах боломжийг олгодог. Сайтын сул тал нь вэб хуудсыг үр дүнг гажуудуулахгүйгээр шалгах боломжгүй юм, учир нь энэ үйлчилгээ нь категори, виджет, цэс болон бусад төрлийн туслах текст зэрэг олдсон бүх текст мэдээллийг сканнердаж байна.

Текстийг шалгасны дараа 1y.ru сайт нь дахин давтагдах үгсийг багасгах зөвлөмж бүхий агуулгын статистик мэдээллийг өгч, шалгаж буй текстийн утгын муруй, санал болгож буй утгын муруй, хамгийн тохиромжтой утгын муруй гэсэн гурван муруй бүхий графикийг өгдөг.

Үйлчилгээ pr-cy.ru

Энэхүү эх сурвалж нь текст болон вэб хуудасны байгалийн байдлыг үнэлэх боломжийг олгодог. Энэ үйлчилгээ нь зогсоох үгсийг шүүж, текст дотор муухайрах хувийг тооцдог бөгөөд Zipf-ийн хуулийн дагуу тохиолдлын тоог бууруулах эсвэл нэмэгдүүлэх зөвлөмжийг өгдөг.


Дүгнэлт

Өөр өөр үйлчилгээнүүдэд ижил текстийг шалгах үед үр дүнгийн ялгаа нь мэдэгдэхүйц байж болно. Тэгэхээр таны уншиж буй текстийн эхний гурван догол мөр нь 1y.ru сайтад 59%, pr-cy.ru сайтад 88% -ийг харуулсан байна. Зөвхөн нэг дүгнэлт бий: текст бичихдээ та өгүүллийн үндсэн хэсэгт гол оруулгуудыг оруулахад хэт их анхаарал хандуулах ёсгүй. Та сонирхолтой, хүртээмжтэй байдлаар бичих хэрэгтэй бөгөөд хэрэв та текстэнд түлхүүр үгс оруулах шаардлагатай хэвээр байвал Zipf аргыг ашиглан текстийг шалгах нь зүйтэй.

Сайн уу! Сүүлийн үед би Zipf-ийн хуулийн дагуу текстийн чанарыг үнэлэх техникийн тодорхойлолтод тавигдах шаардлагын талаар хамтран ажиллагсдаасаа илүү олон удаа сонсох болсон. Мөн энэ хуулийг дагаж мөрдөхийн тулд текстийг хэрхэн засварлахыг хүн бүр ойлгодоггүй. Өнөөдрийн нийтлэлд би параметрийг хэрхэн яаж сайжруулахыг танд хэлэхийг хичээх болно, мөн сайн зохиолчдод яагаад энэ нь хэрэггүй болохыг тодруулах болно.

Та хэд хэдэн үйлчилгээг ашиглан Zipf-ийн хуулийн дагуу текстийн чанарыг тодорхойлж болно. Гэхдээ PR-CY бол хамгийн тохиромжтой, зөв ​​томъёог энгийн бөгөөд ойлгомжтой интерфейстэй хослуулсан гэж би бодож байна. Энэ материалыг бэлтгэхдээ яг үүнийг ашигласан.

Zipf-ийн хууль гэж юу вэ

Эхлээд та энэ нь юу болохыг олж мэдэх хэрэгтэй. Хэрэв та Wikipedia-д итгэдэг бол Жан-Батист Эстоу энэ загварыг 1908 онд анхлан товчилсон үгэнд хэрэглэсэн; Олон нийтэд танигдсан хэв маягийн анхны хэрэглээ нь хүн ам зүй, бүр тодруулбал Феликс Ауэрбахын хэрэглэж байсан хотуудын хүн амын тархалттай холбоотой юм.

Энэ загвар нь 1949 онд хэл шинжлэлийн мэргэжилтэн Жорж Зипфийн ачаар орчин үеийн нэрээ авсан. Үүний тусламжтайгаар тэрээр хүн амын дунд баялгийн хуваарилалтын шатлалыг харуулсан. Зөвхөн дараа нь текстийн унших чадварыг тодорхойлохын тулд хуулийг ашиглаж эхэлсэн.

Үүнийг хэрхэн тооцдог вэ

Энэ хуулийг зөв ашиглахын тулд хэрхэн ажилладагийг ойлгох хэрэгтэй. Тооцооллын томъёог авч үзье.

  • F - үгийн хэрэглээний давтамж;
  • R - серийн дугаар;
  • C нь тогтмол утга (хамгийн олон давталттай үгийг харуулсан тоо).

Практикт өөр нэг томъёо нь илүү тохиромжтой болж хувирдаг;

Бидэнд хамгийн түгээмэл үгийн давталтын тоо байгаа тул энэ арга нь илүү тохиромжтой. Энэ тооноос л тэд эхэлдэг.

Хялбаршуулахын тулд бидний бичвэрт хамгийн их давтагдсан хоёр дахь үг нь эхнийхээс хагас дахин олон удаа гарч ирэх ёстой. Гуравдугаар байр, гурван удаа гэх мэт.

Текст тохируулгын жишээ

Бид онолыг бага зэрэг цэгцэлсэн. Үлдсэн зүйл бол практикийг тодорхойлох явдал юм. Туршилтын текст болгон би T-J-ээс нийтлэл авсан. Яагаад тэндээс? Энэ бол энгийн. Одоогийн байдлаар энэ нь олон хүмүүсийн дуртай мэдээллийн хэв маягийн хамгийн сайн жишээнүүдийн нэг юм. Максим Ильяховын удирдлаган дор бичсэн зохиол юу харуулах нь сонирхолтой байв. Энэ үзүүлэлт дээрх бичвэрүүд ижил түвшинд байгааг би шууд хэлэх болно, гэхдээ 40 гаруй сайтыг хайж олоход би байгалийн шинж чанар муутай нэг ч нийтлэл олж чадаагүй байна. Түүнчлэн, би урагш үсэрч, туршилтын текст тохируулсны дараа илүү муу болсон гэж хэлье, хэдийгээр Zipf-ийн оноо сайжирсан ч та хэт их байгалийн байдлыг анхаарч үзэх хэрэггүй.

Туршилтын дараа анализатор бидэнд үүнийг харуулсан.

Тэнд юу гэж бичсэнийг харцгаая. Таны харж байгаагаар үг, түүнчлэн үл ойлгогдох тоонуудтай багана байдаг. "Үйлдэл" багана (1) нь текстэд үгийн хэлбэрүүд хэдэн удаа тохиолдож байгааг заана. Zipf багана (2) нь санал болгож буй тохиолдлын тоог харуулна. 3 ба 4-р тэмдэглэгээ нь хоёр, гурав дахь байрлалын хамгийн тохиромжтой үзүүлэлтүүдийг тэмдэглэдэг. Зөвлөмжүүдэд анхаарлаа хандуулах нь зүйтэй бөгөөд энэ нь хамгийн тохиромжтой хослолд хүрэхийн тулд хэдэн үг хасах шаардлагатайг харуулж байна.

Илүү сайн ойлгохын тулд анализатор юу гэж тооцсоныг харцгаая. 39 (C) тоог үндэс болгон авч үзье, бидэнд серийн дугаар хэрэгтэй болно, 2 (F) байрлалд анхаарлаа хандуулаарай. Томьёог авч үзье.

Орлуулж үзье.

F=39/2=19.5

Бид бөөрөнхийлж, 20-ыг авна, энэ нь шаардлагатай тохиолдлын тоо байх болно. Үүнийг анализатор баталж байна. Манай улсад хамгийн алдартай хоёр дахь үгийг 28 удаа ашигладаг бөгөөд 8 давталтыг арилгах эсвэл солих шаардлагатай болно.

Хуулийн зарчмыг ойлгосны дараа бид засварлаж эхэлдэг. Үүнийг хийхийн тулд бид Zipf-ийн шаардсанаас илүү олон тохиолдолтой үгсийг устгаж эсвэл ижил утгатай үгээр сольдог. Үүний үр дүнд бид энэ зургийг олж авдаг.

Таны харж байгаагаар би 83% -иас 88% хүртэл өсгөж чадсан. Гэхдээ үүнтэй зэрэгцэн текстийн чанар мэдэгдэхүйц доройтсон. Та энэ үзүүлэлтийг 100% хүртэл нэмэгдүүлэхийг хичээх ёсгүй. Үнэн хэрэгтээ, хэрэв та аль хэдийн 75% -тай бол энэ нь гайхалтай бөгөөд үүнийг цаашид гуйвуулах шаардлагагүй болно.

Хэрэгтэй зөвлөгөө

Зөвхөн эхний мөрүүдэд анхаарлаа хандуулаарай. Жагсаалтын хамгийн сүүлийн байрлалаас эхлэн тохируулж эхэл, тэдгээр нь эхний арван үгнээс илүү ерөнхий үзүүлэлтэд илүү их нөлөө үзүүлдэг.

Zipf ба SEO

Одоо хуулбар зохиогч яагаад энэ хэв маягийн талаархи мэдлэг хэрэгтэй вэ гэдгийг үргэлжлүүлье. SEO мэргэжилтнүүд текст захиалахдаа тэдгээрийг хайлтын системд хамгийн тохиромжтой болгохыг хичээдэг. Zipf-ийн хуулийг хайлтын алгоритмууд идэвхтэй ашигладаг гэж (хэдийгээр хэн гэдэг нь тодорхойгүй байна) гэж үздэг. Энэ мэдэгдлийг батлах эсвэл үгүйсгэх нь хэцүү байдаг. Би энэ сэдвээр ямар ч эрүүл саруул судалгаа, туршилт олж чадсангүй.

Би өөрөө шалгахаар шийдсэн. Үүнийг хийхийн тулд би "хуванцар цонх" гэх мэт өрсөлдөөнт хүсэлтийн хайлтын үр дүнг авч, Yandex Москвагийн хайлтын үр дүнг авч, би Google-д ид шид хийх шаардлагатай болсон бөгөөд энэ нь намайг нийслэлийн оршин суугч гэж тодорхойлсон юм шиг санагдав ( наад зах нь Москвагийн газарзүйн байршилтай зар сурталчилгааг харуулсан). Би хайлтын үр дүнгийн эхний хуудсыг, дээр нь 49-р байрыг авсан. Үр дүн нь ийм шинж тэмдэг юм.

Хэрэв та илүү анхааралтай ажиглавал бидний судалж буй загварыг харвал Yandex-ийн үр дүн илүү жигд байгааг анзаарах болно. Гэхдээ үүнтэй зэрэгцэн өндөр үзүүлэлт нь тэргүүн байрын төлөөх тэмцэлд ялалт байгуулах баталгаа болохгүй.

Үүн дээр үндэслэн хайлтын системүүд энэ хуулийг хэрэглэж байгаа бол энэ нь зөвхөн нэг хүчин зүйл гэж хэлж болно. Мөн гол нь биш.

дүгнэлт

За одоо бүх зүйл дууслаа. Одоо та Zipf-ийн хуулийн дагуу текстийн чанар гэж юу болохыг мэдэж байгаа бөгөөд энэ үзүүлэлтийг тохируулах боломжтой. Үнэндээ энд ямар ч төвөгтэй зүйл байхгүй, бүх зүйл маш энгийн. Энэ хэв маягийн үйл ажиллагааны зарчмыг нэг удаа ойлгоход хангалттай.



Танд нийтлэл таалагдсан уу? Найзуудтайгаа хуваалцаарай!