ОпенМН баримтжуулалт
 

MONGOLIZATION

Монгол бичиг компьютерт, Зохиогч: Мятавын Эрдэнэчимэг


Үүсгэсэн огноо: 2003-12-24 02:13:42 Уншигдсан: 2111

Монгол бичиг бол Монголчуудын оюуны соёлын эрхэм дээд бүтээл. Өнөөдөр дэлхий дээр олон зуун хэлийг хүмүүс харилцаандаа хэрэглэж байгаа ба үүний зэрэгцээ одоо хэрэглэхгүй түүх болон хоцорсон олон хэл байдгийг ном судар, баримт бичгүүд харуулж байна. Энэ их өвийг хадгалах, хамгаалах, сэргээх, судлах ажилд компьютерийг өргөн ашиглаж баримт бичиг, ном сонин сэтгүүлийг компьютерт оруулах, хэвлэх ажлыг хийж байна. Бид ч үүний адил монгол бичгээ компьютерт оруулах ажлыг дэмжин ажиллаж байна.

Орчин үеийн мэдээллийн технологид мэдээлэл хадгалах, дамжуулахад хэрэглэж байгаа олон улсын стандарт "ISO/IEC 10646" болон Юникодод монгол бичгийн үсгээ (2000 онд) The Unicode Standard, Version 5 оруулснаар монгол бичгээр компьютер дээр ажиллах, мэдээлэл боловсруулах суурь кодтой болсон. Энд би монгол бичгийн үсгийн кодыг яаж ашиглах талаар тайлбарлаж та бүхний ажилд тус болохыг хичээе. Өөрөөр хэлбэл монгол бичгээр ажиллах программыг боловсруулах, монгол бичгийн үсгийн фонт зохиох, бэлэн байгаа программуудыг ашиглан юникодоор кодлогдсон монгол бичгийн файлыг дэлгэц дээр харах, хэвлэхэд ямар боломж байна гэдгийг ойлгоход тань тус болох байх гэж найдаж байна.

Та өөрийн бичсэн бичвэр файлаа "Моngоl_sсriрt.ttf" гэсэн миний хийсэн монгол үсгийн фонтоор (Linux/MAC/Windows 98, 2000, ХР)-ийн орчинд харах боломжтой бөгөөд цаашид өөр төрлийн үйлдлийн систем дээр болон бусад системд оруулах, монгол бичгээр ажиллах төрөл бүрийн программ хангамжийг боловсруулахдаа фонтыг http://www.openmn.org Вэб хуудаснаас татаж аваад ашиглаарай.

Монгол бичгийг компьютерт оруулахад анхаарах зүйлд үсгийн хооронд нуруугаар залгаж бичигддэг, ихэнх үсэг үгийн эхэн, дунд, адагт ордог хэлбэртэй, нум хэлбэртэй гийгүүлэгч үсгийн араас эгшиг үсгийг бичихэд холбоотой дүрсээр (ligature) бичигддэг, зарим гийгүүлэгч эм эсвэл эр эгшигээр амилахдаа өөр, өөр дүрсээр бичигддэг нөхцөлийг анхаарах шаардлагатай. Жишээ нь га, гэ гээд кирилл үсгээр бичвэл г үсгийн дараа а эсвэл э үсгийг араас нь залгаад төвөггүй бичнэ, харин монгол бичгээр бичихэд эгшиг үсгээс хамаараад өмнө нь бичсэн г үсгийн хэлбэр (га), (гэ) гэж өөрчлөгдөхийг хаана яаж зохицуулах талаар энэ зөвлөмжийн цувралаас олж мэдэж болно.

Стандартад монгол бичгийн үсэг гэсэн ерөнхий нэр доор монгол бичгийн үсэг, тод бичгийн үсэг мөн манж, шивээ бичгийн үсэг, төвд бичгийг монгол бичгээр галиглахад хэрэглэдэг тэмдэгтийг кодолж оруулсан бөгөөд цаашид би монгол бичгийн үсэг гэсэн нэрээр тайлбарыг хийнэ. Стандартад монгол бичгийн үсэг бүр нэг кодоор илэрхийлэгдэх ба үсгийн дүрслэх хэлбэр дүрсийг нэг утгатай ялгаж тодорхойлох боломж тусгагдсан байгаа.

Кодын хүснэгтийг үзэхээс өмнө тухайн хүснэгтэнд үсгийн харагдах дүрсийг яаж сонгосон талаар товч тайлбарыг хийвэл цаашид нилээд ойлгомжтой болно гэж бодож байна. Жишээ нь хүснэгт 1-д (А), (Ө) , (Л) үсгийн дүрслэгдэх бүх хэлбэр нь энд байна.




Хүснэгт 1

Юникодод (А) үсэг U1820 тоогоор кодлогдсон. Кодын хүснэгтэнд үсгээ аль нэг дүрсээр нь харуулах шаардлагатай тул хүснэгтэнд монгол бичгийн А үсгийг дүрсээр харуулсан. Энэ нь А үсгийн бие дааж бичигддэг хэлбэр юм. Хэрэв тухайн үсэг бие дааж бичигдэх хэлбэргүй бол үгийн эхэнд орсон хэлбэрээр нь мөн энэ хэлбэр нь байхгүй бол үгийн дунд орсон хэлбэрээр, хэрэв энэ хэлбэр нь байхгүй бол ганц байдаг хэлбэрээр нь кодын хүснэгтэнд үсгүүдээ дүрслэн харуулна. Хэрэв үсгийн дүрслэх. бусад хэлбэрийг өөр үсгийн кодыг дүрслэх хэлбэр болгон хэрэглээгүй бол тэр хэлбэрүүдийг юникодын хувийн хэрэглээ (private use) талбарт байрлуулж өгсөн. Жишээ нь (А) үсгийн гэж бичигдэх хэлбэрүүд хувийн хэрэглээ талбарт байрлана. Хүснэгт 1-д харуулсан (Ө) үсгийн код нь U1825 кодтой ба кодын хүснэгтэнд бие дааж бичигдэх хэлбэрээр дүрслэгдэнэ. Харин (Ө) болон (Ү) үсэг нь монгол бичигт бичигдэхдээ ижил дүрсээр бичигдэх. тул (Ү) үсгийн U1826 гэсэн кодыг үгийн эхэнд орсон хэлбэрээр дүрслэн харуулсан. (Л) үсэг үгийн эхэнд орох хэлбэрээрээ кодын хүснэгтэнд дүрслэгдсэн.

Монгол бичгийн үсэг нэг бүр, тоо, таслал, цэг, нуруу, монгол бичигт хэрэглэгдэх. тэмдэгтүүд, үсгийн бичигдэх хэлбэр сонгогчид, эгшиг тусгаарлагч гэсэн кодуудыг монгол бичгийн үндсэн код (Basic character Set) гэж нэрлээд юникодын U1800-U18AF талбарт байрлуулсан. Үндсэн кодын үсгийн хүснэгтэнд харагдах дүрсийг дээр тайлбарласан зарчимаар дүрслэн харуулсан.

Монгол бичигт шаардагдах "Glyphs" буюу дүрсүүдийг монгол бичгийн үндсэн кодыг дүрслэх үндсэн дүрс, үндсэн дүрсээс ялгаатай дан дүрсүүд ба нумтай гийгүүлэгчийг эгшгээр амилуулсан үе гэж үндсэн гурван хэсэгт хувааж тэдгээрийг үсгийн фонтонд харгалзан U1800, UFЗОО,  UF400 дугаараас эхлүүлэн байрлуулсан. Дүрсийн бүх хэлбэрийг байрлалын хамт бүрэн хэмжээгээр нь монгол бичгийн үсгийн код зөвлөмжөөс харж болно.

Энэ монгол үсгийн кодыг ашиглаад монгол бичгийн текстийг компьютерт оруулах, хадгалах, харуулах, хэвлэх ажиллагаа яаж хийгдэхийг тодорхой жишээн дээр тайлбарлая. Одоогоор компьютерийн гар дээр үсгийн тогтсон байрлал байхгүй байгаа тул би кирилл эсвэл латин үсгээр галиглаад бичлээ. Жишээ нь "аврага" гэсэн үгийг монгол бичгээр компьютерт оруулахад товчлуур дээрээс түүний кирилл "АБУРГУ" эсвэл латин "ABURGU" гэсэн үсгийн товчлуурыг цохиж бичиж орууллаа гэж бод.

Компьютерт ямарч хэл дээр бичигдсэн мэдээллийг оруулахад товчлуурын товчыг дарснаар товчлуураас тухайн товчны "scan code" скэн код гэж нэрлэгдэх товчны кодыг үйлдлийн систем хүлээн авч "language support"- ын тусламжтайгаар бичигдэж байгаа хэлний үсгийн кодыг гарган фонтын тусламжтайгаар дэлгэцэнд харуулах бөгөөд тэр кодоо цаашид хэрэглэнэ.
Жишээлбэл бидний мэдэх кирилл бичгийн гарын драйверууд нь кирилл үсгийн кодуудыг гаргахаар үйлдлийн системд үйлчилж байна гэсэн үг.

Үүний адил монгол бичгийн үсгийн юникодыг гаргаж, энэ кодоор мэдээллээ хадгалсан байхад компьютерийн аль ч систем дээр монгол бичгээр бичигдсэн мэдээллийг авч унших,
хэвлэх, ажиллах бололцоотой болно. Өөрөөр хэлбэл U1820 код нь аль ч үйлдлийн системд үсгийг илэрхийлэх бололцоотой. Дээр өгүүлж байгаа жишээгээр бол "АБУРГУ" гээд
бичихэд товчноос "ABURGU " эсвэл эсвэл "АБУРГУ" гээд аль ч үсэгт харгалзсан товчноос оруулсан энэ үгийг U1820,U182A,U1824,U1837,U182D,U1824 гэсэн кодоор гаргаад
хадгалах хэрэгтэй. Үйлдлийн аль ч систем дээр монгол бичгээр бичигдсэн аврага гэсэн үг байна гэж танина. Харин энэ үгээ дэлгэцэнд харуулахдаа "Монгол бичгээр харуулах дүрэм"-ийг ашиглан "*.TTF" фонтноос харгалзах дүрсүүдээ сонгож харуулна.

Бид монгол бичгээр бичсэн текстээ харах, хэвлэхдээ монгол бичгийн бүх (glyphs) дүрсийн тусламжтайгаар харах, хэвлэх шаардлагатай бөгөөд үүнийг би харуулах код гээд энд нэрлэлээ. Жишээ
нь UF306,UF404,U1837,UF31A,UFЗ0E нь гэсэн үгийг харуулах эсвэл хэвлэх код болно. 

Ингэхээр бид мэдээллээ хадгалахдаа монгол бичгийн үндсэн кодоор, дэлгэц дээр харуулах, хэвлэхдээ үндсэн код дээрээ юникодын хувийн талбарт байрлуулсан дүрсүүдээ ашиглаж байж монгол бичгийн текстээ бодит дүрс болгоно. Одоогоор энэ нь аль нэг үйлдлийн системд гарын драйвер шинээр бичиж ашигласнаар шууд шийдэгдэх боломжгүй байна.

Хэрэв бид дээр дурдсан хэвлэх, харуулахад зориулсан кодоор бичвэр файлаа хадгалбал дараа тэр файлыг зөвхөн хэвлэх боломжтой бөгөөд дараа тэр файлыг засварлах, өөрчлөх зэргээр ашиглах боломж алдагдана. Учир нь бидний мэдэх фонтын нэг хэлбэр болох "outline font"-ын форматууд жишээ нь "*.TTF" (TrueТуре Font) фонт дүрсийг дэлгэцэнд харуулах болон хэвлэхдээ фонтонд зурагдсан нэг дүрсийг нэг л кодонд эсвэл хэд хэдэн дүрсийг давхарлан нэг дүрс болгон нэг кодонд харгалзуулан дүрслэх чадвартай. Гэтэл монгол үсгийн нэг кодод харгалзан хэд хэдэн дүрс байгаа. Харин одоогоор хэрэглэж эхлээд байгаа "Open Type font"-д юникодын нэг кодыг хэд хэдэн дүрсээр илэрхийлэх алгоритм бүхий төрөл бүрийн мэдээллийг өөртөө агуулах тул монгол бичгээр харуулах дүрмийн хэсгийг түүнд тусгах боломжтой.

Үсэг болон тэмдэгтийн бүх дүрсүүд нэгэн утгатай фонтод байрлах ба ямар төрлийн фонтыг ашиглах гэж байгаагаас хамааран монгол бичгээр харуулах дүрмийн зарим мэдээллийг фонтонд байрлуулж өгнө.

Хэрэв та монгол бичгээр ажиллах программыг боловсруулж байгаа бол монгол бичгээр харуулах дүрмийг боловсруулахад хэрэг болох бүрэн хэмжээний мэдээллийг http://www.iist.unu.edu/newrh/III/1/page.html вэб хуудаснаас "UNU/IIST Technical Report No. 170 - Traditional Mongolian Script
in the ISO/Unicode Standards; Myatav Erdenechimeg, Richard Moore and Yumbayar Namsrai" гэсэн нэртэй 170 гэсэн дугаартай репортыг бүрэн хэмжээгээр татаж аваад хэрэглээрэй. Энд үндсэн кодын дүрслэгдэх бүх хэлбэр дүрсийг хүснэгтээр өгсөн байгаа.

Хэрэв та монгол бичгийн төрөл бүрийн хэв бүхий фонтыг боловсруулахыг хүсвэл монгол бичгийн фонт зөвлөмж 3-ийг энэ вэб хуудаснаас авч уншаарай.

Хэрэв та латин үсгээр галиглан бичсэн ямар ч форматгүй бичвэр файлаа монгол бичгийн юникодоор мөн харагдах кодоор нь файлаа үүсгэж ямар нэг бичвэр боловсруулагч програмаар "Mongol_script.ttf" фонтын тусламжтайгаар оруулж харах, хэвлэх гэвэл ойрын үед бэлэн болох монгол бичгийн юникод үүсгэгч зөвлөмж 4-ийг энэ хуудаснаас татаж аваад ашиглаарай.

Үүний зэрэгцээ монгол бичгийн гарын байрлал зөвлөмжид компьютерын гарын товчны байрлалд үсгийг байрлуулах хувилбарууд монгол бичгийг компьютерт оруулахаар аргалсан аргууд гээд олон санаа оноог цаашид өгнө.


0.040