हिंदी दिवस पर
Prashant Shukla |
परिचय:
हिन्दी भाषाओं के कुटुम्ब में एक नवीन भाषा है। यह विश्व की एक महत्वपूर्ण भाषा बन गई है। यद्यपि इसे एक अभिव्यंजक भाषा के रूप में इंटरनेट पर प्रोत्साहन व सुविधाजनक तकनकी विकास की आवश्यकता है। जिससे इसे लिखने,पढ़ने व इंटरनेट पर खोजने में आसानी हो।
हिन्दी आज न केवल भारतीयों द्वारा अपितु विदेशों में भी बोली जाने वाली भाषा है। भारत में बहुत से लोग हिन्दी के अलावा किसी अन्य भाषा को न समझ सकते हैं और न ही बोल सकते है, अतः हिन्दी भारत मे एक व्यापक सम्पर्क भाषा के रूप में स्थापित हो चुकी है। वर्तमान में गूगल व कई अन्य प्लेटफॉर्म हिंदी सर्च (खोज) इंजन की सुविधा प्रदान करते हैं, लेकिन यह केवल अक्षरों के मिलान तक ही सीमित है। बहुभाषी विश्व में भाषा से सम्बंधित तकनीकी विकास की असीमित संभावनाएँ हैं, जहाँ पाठक की भाषा की सटीक समझ आवश्यक है। हिंदी में सामान्यतः तेरह स्वर व तैंतीस व्यंजन होते हैं। अंग्रेज़ी भाषा के विपरीत हिंदी एक ध्वन्यात्मक लिपि है।
भारत में भाषाओं को चार वर्गों में विभाजित किया गया है। प्रथम आस्ट्रो-एशियाटिक- इसको पूर्वी वर्ग भी कहा जाता है, द्वितीय चाइनीज़-तिब्बती वर्ग, तृतीय द्रविड़ियन वर्ग एवं चतुर्थ इंडो-यूपोपियन वर्ग है। हिंदी विश्व में अंग्रेज़ी व चीनी भाषा के बाद लोगों द्वारा सबसे अधिक बोली जाने वाली भाषा है। यह संस्कृत से प्राकृतिक रूप से विकसित भाषा है। हिंदी पर द्रविड़,फ़ारसी, अरबी, तुर्की, उर्दू, पुर्तगाली, व अंग्रेज़ी भाषाओं का भी प्रभाव है। यह देवनागरी लिपि में लिखी जाती है। वर्तमान में युवाओं द्वारा हिंग्लिश का भी प्रयोग किया जाता है। अतः हिंदी भाषा में अन्य भाषाओं के समावेश व स्वीकार्यता की अद्भुत क्षमता है। भारत में हिन्दी भाषा में व्यापक अनुसंधान भारत की स्वतंत्रता के बाद प्रारम्भ हुए। हालाँकि यह अनुसंधान मूलतः भाषाओं के अनुवाद पर ही केंद्रित थे।
हिन्दी तथा इंटरनेट:
इंटरनेट पर हिन्दी के व्यापक प्रयोग के लिए एक सुविधाजनक प्लेटफॉर्म की आवश्यकता पड़ती है। इसके लिए सरल हिन्दी सम्पादन, सरल अक्षर यूटिलिटी तथा बहु-आयामी कोड जिससे सभी प्रचलित लिपियों के लिए एक वैश्विक मानक स्थापित हों। यूनिकोड की इंडिक स्क्रिप्ट टेबल-इंडियन स्क्रिप्ट कोड फ़ॉर इन्फॉर्मेशन इंटरचेंज (ISCII) पर बनी है। यह वन-बाईट कोड है। इसमें प्रत्येक वर्ण को दर्शाया गया है। वर्तमान में नोट पैड, माइक्रोसॉफ्ट ऑफ़िस तथा गूगल प्लेटफॉर्म पर बिना प्रारूप वाले अक्षर बनाने के लिए कई टूल्स उपलब्ध हैं। हालाँकि यह उतना सरल नहीं है जितना कि अंग्रेज़ी या अन्य भाषाओं के लिए है। सॉर्ट प्रोग्राम कैरेक्टर को यूनिकोड की वैल्यू के आधार पर छाँटता है। दुर्भाग्य से हिन्दी के लिए कैरेक्टर को वैल्यू के साथ रेंडर नहीं किया जा सकता है। कई कोड यूनिकोड तालिका में विभिन्न स्थानों पर रखे गए हैं । ये वर्ण यूनिकोड से व्युत्पन्न होते हैं, इससे वर्ण गणना में में कठिनाई होती है।
हिंदी के साथ शब्दों के निर्माण के लिए नियमों का होना काफी जटिलता प्रदान करता है। ऐसा कोई नियम नहीं हैं जो स्पष्टता से बताता हो कि विशिष्ट शब्द पुल्लिंग या स्त्रीलिंग रूप है। अतिरिक्त शब्दों की विलक्षणता और बहुलता को पहचानना भी चुनौतीपूर्ण है। हालांकि इनका अक्सर उल्लंघन भी किया जाता है, तथा इनको कम्प्यूटेशन सिस्टम में समायोजित करना अत्यंत कठिन है। लड़की, खड़क स्त्रीलिंग है। किताब, वॉक, कमीज भी स्त्रीलिंग है। इनको लिंग रूपों में वर्गीकृत करना कठिन होता है।
वर्ल्ड वाइड वेब डब्ल्यूडब्ल्यूडब्ल्यू को भाषा के प्रयोग व विकास के लिए महती आवश्यकता है। वर्तमान समय में सर्च इंजन के बिना इंटरनेट की कल्पना व भाषा का विकास अकल्पनीय है। आज, इंटरनेट पर अनुमानित आह 72% उपयोगकर्ता गैर अंग्रेजी भाषी है। बहुभाषी इंटरनेट उपयोगकर्ताओं को, संत। बहुभाषी इंटरनेट सर्च इंजन प्रदान करना एक चुनौती है।
अंग्रेजी के विपरीत। हिंदी में व्याकरण नियम लचीले और ध्वन्यात्मक है। अतः सर्च इंजन को कोडीकृत करना कठिन है। अंग्रेजी सर्च में साउंडएक्स का उपयोग शामिल है। इसे मेटा फ़ोन एल्गोरिदम द्वारा और अच्छा बनाया गया है। साउंडएक्स एल्गोरिदम का प्रयोग सामान उच्चारण वाले शब्दों को खोजने में किया जाता है। अंग्रेजी के लिए मेटाफ़ोन एल्गोरिदम लगभग 99% की सटीकता के साथ काम करती है। जबकि हिंदी के लिए इसे प्रभावी बनाने की आवश्यकता है।
खोज.कॉम14, रफ्तार.इन 15 वह गुरु जी 16 तथा गूगल, याहू और बिंग हिंदी को सर्च करते हैं, पर ये। बेसिक सर्च तक ही सीमित है। हिन्दी ने विभिन्न भाषाओं के शब्दों को स्वीकारा है, अतः उन भाषाओं में शब्द निर्माण के लिए अलग-अलग भाषाओं के नियमों का पालन होता है। इसलिए हिन्दी भाषा में शब्द निर्माण के लिए नियमों का बनाना कठिन है।
निष्कर्ष:
भारत में बाईस मान्यता प्राप्त भाषाएँ हैं। हिन्दी सहित सभी भाषाओं के प्रयोग तथा उनके तकनीकी विकास के लिए असीमित सम्भावनाएँ हैं। भारत कंप्यूटर सॉफ्टवेयर निर्मित करने वाला अग्रणी राष्ट्र है, अतः हिन्दी सहित विभिन्न भारतीय भाषाओं एवं लिपियों को एक क्रमबद्ध आई सी टी नीति द्वारा इंटरनेट को अत्यधिक भाषा सुलभ बनाने की आवश्यकता है।
भारत मे सीडीएफ़सी ने सराहनीय कार्य किया है, लेकिन विभिन्न संस्थान जो इस दिशा में योगदान दे सकते हैं, उनकी पहचान कर उनको भाषा अनुसंधान में सम्मिलित किया जाना चाहिए, तथा समयबद्ध अनुसन्धान परियोजनाओं को वित्त पोषित भी किया जाना चाहिए। भाषा अनुसंधान में भाग लेने के लिए दूसरों को प्रोत्साहित करने के लिए अनुसंधान परियोजनाओं के लिए धन आवंटित करने की दिशा में एक सहयोगी और समान दृष्टिकोण अपनाया जाना चाहिए। भारत सरकार को हिन्दी दिवस के वार्षिक समारोहों के साथ-साथ हिन्दी के लिए खोज एल्गोरिदम विकसित करने, कंप्यूटिंग उपकरण विकसित करने, सरल वर्ड प्रॉसेसिंग टूल्स तथा अनुवाद टूल में सुधार के लिए समयबद्ध परियोजनाओं को मूर्तरूप देना अतिआवश्यक है ।
----------------
Comments