ലോകഭാഷകളിലെ ലിപികളുടെ കമ്പ്യൂട്ടറുകളിലുള്ള
ആവിഷ്കാരത്തിനായി നിര്മ്മിച്ചിരിക്കുന്ന
ഒരു മാനദണ്ഡമാണ്
യൂണികോഡ്. ഇംഗ്ലീഷ് അറിയുന്നവര്ക്കുള്ളതാണ് കമ്പ്യൂട്ടറെന്ന
അബദ്ധധാരണ പൊളിച്ചെഴുതിയതാണ് യൂണീകോഡിന്റെ
നേട്ടം. പുതിയ
പല ഓപ്പറേറ്റിങ്ങ്
സിസ്റ്റങ്ങളും, എക്സ്.എംഎല്., ജാവാ
തുടങ്ങിയ സാങ്കേതിക വിദ്യകളും യൂണീകോഡിനെ പിന്തുണക്കുന്നുണ്ട്.
ലോകത്ത് നിലനില്ക്കുന്ന എല്ലാഭാഷകളേയും
ഒരുമിച്ചവതരിപ്പിക്കുക എന്നതാണ് ഇതിന്റെ
പ്രഖ്യാപിത ലക്ഷ്യം. എല്ലാ പ്രാദേശിക ഭാഷാ
ഉപയോക്താക്കള്ക്കും അവരവരുടെ ഭാഷകളില് കമ്പ്യൂട്ടര്
ഉപയോഗിക്കാനുള്ള അവസരം സൃഷ്ടിച്ചതാണ്
യൂണീകോഡിന് പിന്നില് പ്രവര്ത്തിക്കുന്ന യൂണീകോഡിന്റെ
സംഭാവന. ഈ
സംഘടനയുടെ ഔദ്യോഗിക സൈറ്റാണ് യൂണീകോഡ് ഡോട്ട്
ഓആര്ജി.
അക്ഷരങ്ങളും അക്കങ്ങളും ചിഹ്നങ്ങളും പൂജ്യത്തിന്റേയും ഒന്നിന്റേയും കൂട്ടങ്ങളായി മാറ്റിയാണ് കമ്പ്യൂട്ടറില് ശേഖരിച്ചു വയ്ക്കുന്നത്. ഇങ്ങനെ ശേഖരിക്കുന്നതിന് ഓരോന്നിനും അതിന്റേതായ കോഡുകള് ഉണ്ടായിരിക്കണം.
ലോകമാസകലം കമ്പ്യുട്ടറുകള് വരുകയും അവയെയെല്ലാം ബന്ധിപ്പിക്കുന്ന ഇന്റര്നെറ്റ് സംജാതമാകുകയും ചെയ്തതോടെ ലോകഭാഷകള് എല്ലാം അടങ്ങുന്ന ഒരു കോഡിംഗ് സിസ്റ്റം ആവശ്യമായിവന്നു.
ഇന്റര്നാഷണല് സ്റ്റാന്റേര്ഡ് ഓര്ഗനൈസേഷനും യുണിക്കോഡും ചേര്ന്ന് 1992ല് യൂണിക്കോഡ് വേര്ഷന് 1.0 പുറത്തിറക്കി. ഇതു പരിഷ്കരിച്ച് 2.0യും 2000 ഫെബ്രുവരിയില് 3.0യും പുറത്തിറങ്ങി. 16 സ്ഥാനങ്ങളിലായി ഒന്നും പൂജ്യവും നിരത്തി 65000ല് പരം അക്ഷരാദികളുടെ കോഡുകള് നിര്മ്മിക്കാം. ഇവ 500 ഓളം ഭാഷകള്ക്കു മതിയാകും. പുരാതന ലിപികളും ഭാവിയില് ഉണ്ടാകുന്ന ലിപികളും ഇതില് ഉള്ക്കൊള്ളിക്കാന് തക്കവിധത്തില് ഇതിനെ വിപുലപ്പെടുത്താനും സാധിക്കുന്നതാണ് . പ്രധാനപ്പെട്ട ലോകഭാഷകള് മിക്കവാറും എല്ലാം തന്നെ ഉള്പ്പെടുത്തി 49194 അക്ഷരാദികള്ക്ക് ഇതിനകം കോഡുകള് നല്കിക്കഴിഞ്ഞു. ഇതില് ചൈനീസും ജാപ്പനീസും ഉള്പ്പെടും.
ആഗോളമായി നടക്കുന്ന സകല ഭാഷാ കമ്പ്യൂട്ടിംഗ് പ്രവര്ത്തനങ്ങളുടെയും മൂലക്കല്ലാണ് യൂണീകോഡ്. പ്രാദേശിക ഭാഷകളിലേക്ക് വിവിധ സോഫ്റ്റ്വെയറുകള് പ്രാദേശികവല്ക്കരിക്കാന് (ലോക്കലൈസ് ചെയ്യാന്) ഇതല്ലാതെ മറ്റൊരു ഉത്തരമില്ലതന്നെ.
യൂണിക്കോഡ് ഭാഷയിലെ അക്ഷരങ്ങള്ക്ക് കോഡുകള് നല്കിയെങ്കിലും അവ എങ്ങനെ സ്ക്രീനില് കാണണമെന്ന് ഹാര്ഡ്വേറും സോഫ്റ്റ്വേറും ഇറക്കുന്നവരാണ് തീരുമാനിക്കുന്നത്. ലോക ഭാഷകള് ഒരേ സ്ക്രീനില് പ്രത്യക്ഷപ്പെടേണ്ടി വരുമ്പോള് ലോക പ്രശസ്തരായ മൈക്രോസോഫ്റ്റ്, ഒറാക്കിള്, ആപ്പിള് എന്നിത്യാദി വമ്പന്മാരെല്ലാം യൂണിക്കോഡിനെ സ്വീകരിക്കുന്നതില് അത്ഭുതപ്പെടാനില്ല. ഇന്റര്നെറ്റിന്റ ലോകവ്യാപകമായ പ്രചാരത്തോടുകൂടി യൂണിക്കോഡും ഒരു ആഗോളലിപികളുടെ കോഡായിമാറിക്കഴിഞ്ഞു.
ഇത്ര നാളും ആംഗലേയമായിരുന്നു കമ്പ്യൂട്ടര് രംഗത്ത് എല്ലാ കാര്യങ്ങള്ക്കും ഉപയോഗിച്ചിരുന്നത്. പ്രോഗ്രാമുകളും ,പ്രമാണങ്ങളും, ഇന്റര്നെറ്റിലെ വിവിധ ആവശ്യങ്ങള്ക്കുമെല്ലാം ആംഗലേയ ഭാഷയാണ് ഉപയോഗിച്ചിരുന്നത്.
അടിസ്ഥാനപരമായി കമ്പ്യൂട്ടറുകള് സംഖ്യകളാണ് എല്ലാ കാര്യങ്ങള്ക്കും ഉപയോഗിക്കുന്നത്. അക്ഷരങ്ങളും, അക്കങ്ങളും, ചിഹ്നങ്ങളുമൊക്കെ സംഖ്യകളായിട്ടാണ് കമ്പ്യൂട്ടര് ശേഖരിച്ചുവക്കുന്നത്. അക്ഷരങ്ങള് സംഖ്യാരീതിയിലാക്കാന് വിവിധ എന്കോഡിങ്ങ് രീതികള് നിലവിലുണ്ട്. ആസ്കി , എബ്സിഡിക്,യൂണിക്കോഡ് എന്നിങ്ങനെ വിവിധ എന്കോഡിങ്ങ് രീതികള്. അക്കങ്ങളും, ഭാഷാചിഹ്നങ്ങളുമൊക്കെ സംഖ്യകളായാണ് കമ്പ്യൂട്ടറിനുള്ളില് ഇരിക്കുന്നതെങ്കിലും, ഇത്തരം സംഖ്യകള് സാധാരണ സംഖ്യകള് പോലെയല്ല കൈകാര്യം ചെയ്യപ്പെടുന്നത്.
ആദ്യകാലത്ത് കമ്പ്യൂട്ടറുകള് കൂടുതലും സംഖ്യാസംബന്ധമായ കണക്കുകൂട്ടലുകള്ക്കാണ് കൂടുതലും ഉപയോഗിച്ചിരുന്നത്, എന്നിരുന്നാലും അക്കങ്ങളും അക്ഷരങ്ങളും രേഖപ്പെടുത്തേണ്ട അവസരങ്ങള് അക്കാലത്തും ഉണ്ടായിരുന്നു. ടൈപ്പ്റൈറ്ററുകളായിരുന്നു ലിഖിതങ്ങളായ പ്രമാണങ്ങളും മറ്റും ഉണ്ടാക്കാന് അധികം ഉപയോഗിച്ചിരുന്നത്. പതുക്കെ കമ്പ്യൂട്ടറുകള് ടൈപ്പ്റൈറ്ററുകളെ പിന്തള്ളി. ലിഖിതങ്ങളും അല്ലാത്തതുമായ പ്രമാണങ്ങള്, ചിത്രങ്ങള് എന്നിവ സൃഷ്ടിക്കാനുള്ള കമ്പ്യൂട്ടറിന്റെ കഴിവ് വര്ദ്ധിച്ചു വന്നുകൊണ്ടിരുന്നതാണ് ഇതിനു കാരണം. അച്ചടിക്കുന്നതിനു മുമ്പ് തിരുത്താനുള്ള സൗകര്യവും കമ്പ്യൂട്ടര് സൃഷ്ടിതമായ പ്രമാണങ്ങള്ക്കുണ്ടായിരുന്നു. പക്ഷെ വളരെ ചുരുക്കം അക്ഷരങ്ങളും , ചിഹ്നങ്ങളും മറ്റും ഉപയോഗിക്കാന് പറ്റുമായിരുന്നുള്ളൂ. ശരിക്കും പറഞ്ഞാല് സംഖ്യകളും, സാധാരണ ഉപയോഗിക്കുന്ന ആംഗലേയ അക്ഷരങ്ങളും ചിഹ്നങ്ങളും മാത്രമേ ശരിയായി കമ്പ്യൂട്ടറില് പ്രയോഗിക്കാന് സാധിക്കുമായിരുന്നുള്ളൂ അക്കാലത്ത്. ലോകത്ത് മനുഷ്യര് എഴുതാനും വായിക്കാനും ഉപയോഗിക്കുന്ന പതിനായിരക്കണക്കിനു അക്ഷരങ്ങളും ചിഹ്നങ്ങളും കൈകാര്യം ചെയ്യുവാന് കമ്പ്യൂട്ടറുകള്ക്ക് സാധിച്ചിരുന്നില്ല. എന്നു പറഞ്ഞാല് വിവിധപ്രദേശങ്ങളില് ജീവിക്കുന്ന മനുഷ്യര്ക്ക് അവരുടെ ഭാഷയില് പ്രമാണങ്ങള് ലോകഭാഷകളിലെ ലിപികളുടെ കമ്പ്യൂട്ടറുകളിലുള്ള ആവിഷ്കാരത്തിനായി നിര്മ്മിച്ചിരിക്കുന്ന ഒരു മാനദണ്ഡമാണ് യൂണികോഡ്.
അക്ഷരങ്ങളും അക്കങ്ങളും ചിഹ്നങ്ങളും പൂജ്യത്തിന്റേയും ഒന്നിന്റേയും കൂട്ടങ്ങളായി മാറ്റിയാണ് കമ്പ്യൂട്ടറില് ശേഖരിച്ചു വയ്ക്കുന്നത്. ഇങ്ങനെ ശേഖരിക്കുന്നതിന് ഓരോന്നിനും അതിന്റേതായ കോഡുകള് ഉണ്ടായിരിക്കണം.
ലോകമാസകലം കമ്പ്യുട്ടറുകള് വരുകയും അവയെയെല്ലാം ബന്ധിപ്പിക്കുന്ന ഇന്റര്നെറ്റ് സംജാതമാകുകയും ചെയ്തതോടെ ലോകഭാഷകള് എല്ലാം അടങ്ങുന്ന ഒരു കോഡിംഗ് സിസ്റ്റം ആവശ്യമായിവന്നു.
ഇന്റര്നാഷണല് സ്റ്റാന്റേര്ഡ് ഓര്ഗനൈസേഷനും യുണിക്കോഡും ചേര്ന്ന് 1992ല് യൂണിക്കോഡ് വേര്ഷന് 1.0 പുറത്തിറക്കി. ഇതു പരിഷ്കരിച്ച് 2.0യും 2000 ഫെബ്രുവരിയില് 3.0യും പുറത്തിറങ്ങി. 16 സ്ഥാനങ്ങളിലായി ഒന്നും പൂജ്യവും നിരത്തി 65000ല് പരം അക്ഷരാദികളുടെ കോഡുകള് നിര്മ്മിക്കാം. ഇവ 500 ഓളം ഭാഷകള്ക്കു മതിയാകും. പുരാതന ലിപികളും ഭാവിയില് ഉണ്ടാകുന്ന ലിപികളും ഇതില് ഉള്ക്കൊള്ളിക്കാന് തക്കവിധത്തില് ഇതിനെ വിപുലപ്പെടുത്താനും സാധിക്കുന്നതാണ് . പ്രധാനപ്പെട്ട ലോകഭാഷകള് മിക്കവാറും എല്ലാം തന്നെ ഉള്പ്പെടുത്തി 49194 അക്ഷരാദികള്ക്ക് ഇതിനകം കോഡുകള് നല്കിക്കഴിഞ്ഞു. ഇതില് ചൈനീസും ജാപ്പനീസും ഉള്പ്പെടും.
ആഗോളമായി നടക്കുന്ന സകല ഭാഷാ കമ്പ്യൂട്ടിംഗ് പ്രവര്ത്തനങ്ങളുടെയും മൂലക്കല്ലാണ് യൂണീകോഡ്. പ്രാദേശിക ഭാഷകളിലേക്ക് വിവിധ സോഫ്റ്റ്വെയറുകള് പ്രാദേശികവല്ക്കരിക്കാന് (ലോക്കലൈസ് ചെയ്യാന്) ഇതല്ലാതെ മറ്റൊരു ഉത്തരമില്ലതന്നെ.
യൂണിക്കോഡ് ഭാഷയിലെ അക്ഷരങ്ങള്ക്ക് കോഡുകള് നല്കിയെങ്കിലും അവ എങ്ങനെ സ്ക്രീനില് കാണണമെന്ന് ഹാര്ഡ്വേറും സോഫ്റ്റ്വേറും ഇറക്കുന്നവരാണ് തീരുമാനിക്കുന്നത്. ലോക ഭാഷകള് ഒരേ സ്ക്രീനില് പ്രത്യക്ഷപ്പെടേണ്ടി വരുമ്പോള് ലോക പ്രശസ്തരായ മൈക്രോസോഫ്റ്റ്, ഒറാക്കിള്, ആപ്പിള് എന്നിത്യാദി വമ്പന്മാരെല്ലാം യൂണിക്കോഡിനെ സ്വീകരിക്കുന്നതില് അത്ഭുതപ്പെടാനില്ല. ഇന്റര്നെറ്റിന്റ ലോകവ്യാപകമായ പ്രചാരത്തോടുകൂടി യൂണിക്കോഡും ഒരു ആഗോളലിപികളുടെ കോഡായിമാറിക്കഴിഞ്ഞു.
ഇത്ര നാളും ആംഗലേയമായിരുന്നു കമ്പ്യൂട്ടര് രംഗത്ത് എല്ലാ കാര്യങ്ങള്ക്കും ഉപയോഗിച്ചിരുന്നത്. പ്രോഗ്രാമുകളും ,പ്രമാണങ്ങളും, ഇന്റര്നെറ്റിലെ വിവിധ ആവശ്യങ്ങള്ക്കുമെല്ലാം ആംഗലേയ ഭാഷയാണ് ഉപയോഗിച്ചിരുന്നത്.
അടിസ്ഥാനപരമായി കമ്പ്യൂട്ടറുകള് സംഖ്യകളാണ് എല്ലാ കാര്യങ്ങള്ക്കും ഉപയോഗിക്കുന്നത്. അക്ഷരങ്ങളും, അക്കങ്ങളും, ചിഹ്നങ്ങളുമൊക്കെ സംഖ്യകളായിട്ടാണ് കമ്പ്യൂട്ടര് ശേഖരിച്ചുവക്കുന്നത്. അക്ഷരങ്ങള് സംഖ്യാരീതിയിലാക്കാന് വിവിധ എന്കോഡിങ്ങ് രീതികള് നിലവിലുണ്ട്. ആസ്കി , എബ്സിഡിക്,യൂണിക്കോഡ് എന്നിങ്ങനെ വിവിധ എന്കോഡിങ്ങ് രീതികള്. അക്കങ്ങളും, ഭാഷാചിഹ്നങ്ങളുമൊക്കെ സംഖ്യകളായാണ് കമ്പ്യൂട്ടറിനുള്ളില് ഇരിക്കുന്നതെങ്കിലും, ഇത്തരം സംഖ്യകള് സാധാരണ സംഖ്യകള് പോലെയല്ല കൈകാര്യം ചെയ്യപ്പെടുന്നത്.
ആദ്യകാലത്ത് കമ്പ്യൂട്ടറുകള് കൂടുതലും സംഖ്യാസംബന്ധമായ കണക്കുകൂട്ടലുകള്ക്കാണ് കൂടുതലും ഉപയോഗിച്ചിരുന്നത്, എന്നിരുന്നാലും അക്കങ്ങളും അക്ഷരങ്ങളും രേഖപ്പെടുത്തേണ്ട അവസരങ്ങള് അക്കാലത്തും ഉണ്ടായിരുന്നു. ടൈപ്പ്റൈറ്ററുകളായിരുന്നു ലിഖിതങ്ങളായ പ്രമാണങ്ങളും മറ്റും ഉണ്ടാക്കാന് അധികം ഉപയോഗിച്ചിരുന്നത്. പതുക്കെ കമ്പ്യൂട്ടറുകള് ടൈപ്പ്റൈറ്ററുകളെ പിന്തള്ളി. ലിഖിതങ്ങളും അല്ലാത്തതുമായ പ്രമാണങ്ങള്, ചിത്രങ്ങള് എന്നിവ സൃഷ്ടിക്കാനുള്ള കമ്പ്യൂട്ടറിന്റെ കഴിവ് വര്ദ്ധിച്ചു വന്നുകൊണ്ടിരുന്നതാണ് ഇതിനു കാരണം. അച്ചടിക്കുന്നതിനു മുമ്പ് തിരുത്താനുള്ള സൗകര്യവും കമ്പ്യൂട്ടര് സൃഷ്ടിതമായ പ്രമാണങ്ങള്ക്കുണ്ടായിരുന്നു. പക്ഷെ വളരെ ചുരുക്കം അക്ഷരങ്ങളും , ചിഹ്നങ്ങളും മറ്റും ഉപയോഗിക്കാന് പറ്റുമായിരുന്നുള്ളൂ. ശരിക്കും പറഞ്ഞാല് സംഖ്യകളും, സാധാരണ ഉപയോഗിക്കുന്ന ആംഗലേയ അക്ഷരങ്ങളും ചിഹ്നങ്ങളും മാത്രമേ ശരിയായി കമ്പ്യൂട്ടറില് പ്രയോഗിക്കാന് സാധിക്കുമായിരുന്നുള്ളൂ അക്കാലത്ത്. ലോകത്ത് മനുഷ്യര് എഴുതാനും വായിക്കാനും ഉപയോഗിക്കുന്ന പതിനായിരക്കണക്കിനു അക്ഷരങ്ങളും ചിഹ്നങ്ങളും കൈകാര്യം ചെയ്യുവാന് കമ്പ്യൂട്ടറുകള്ക്ക് സാധിച്ചിരുന്നില്ല. എന്നു പറഞ്ഞാല് വിവിധപ്രദേശങ്ങളില് ജീവിക്കുന്ന മനുഷ്യര്ക്ക് അവരുടെ ഭാഷയില് പ്രമാണങ്ങള് ലോകഭാഷകളിലെ ലിപികളുടെ കമ്പ്യൂട്ടറുകളിലുള്ള ആവിഷ്കാരത്തിനായി നിര്മ്മിച്ചിരിക്കുന്ന ഒരു മാനദണ്ഡമാണ് യൂണികോഡ്.
0 comments:
Post a Comment