हिंदी दिवस पर

Prashant Shukla 
 विश्व में हिंदी के लिए अवसर व चुनौतियां

परिचय:

हिन्दी भाषाओं के कुटुम्ब में एक नवीन भाषा है। यह विश्व की एक महत्वपूर्ण भाषा बन गई है। यद्यपि इसे एक अभिव्यंजक भाषा के रूप में इंटरनेट पर प्रोत्साहन व सुविधाजनक तकनकी विकास की आवश्यकता है। जिससे इसे लिखने,पढ़ने व इंटरनेट पर खोजने में आसानी हो।

 

हिन्दी आज न केवल भारतीयों द्वारा अपितु विदेशों में भी बोली जाने वाली भाषा है। भारत में बहुत से लोग हिन्दी के अलावा किसी अन्य भाषा को न समझ सकते हैं और न ही बोल सकते है, अतः हिन्दी भारत मे एक व्यापक सम्पर्क भाषा के रूप में स्थापित हो चुकी है। वर्तमान में गूगल व कई अन्य प्लेटफॉर्म हिंदी सर्च (खोज) इंजन की सुविधा प्रदान करते हैं, लेकिन यह केवल अक्षरों के मिलान तक ही सीमित है। बहुभाषी विश्व में भाषा से सम्बंधित तकनीकी विकास की असीमित संभावनाएँ हैं, जहाँ पाठक की भाषा की सटीक समझ आवश्यक है। हिंदी में सामान्यतः तेरह स्वर व तैंतीस व्यंजन होते हैं। अंग्रेज़ी भाषा के विपरीत हिंदी एक ध्वन्यात्मक लिपि है।

 

भारत में भाषाओं को चार वर्गों में विभाजित किया गया है। प्रथम आस्ट्रो-एशियाटिक- इसको पूर्वी वर्ग भी कहा जाता है, द्वितीय चाइनीज़-तिब्बती वर्ग, तृतीय द्रविड़ियन वर्ग एवं चतुर्थ इंडो-यूपोपियन वर्ग  है। हिंदी विश्व में अंग्रेज़ी व चीनी भाषा के बाद लोगों द्वारा सबसे अधिक बोली जाने वाली भाषा है। यह संस्कृत से प्राकृतिक रूप से विकसित भाषा है। हिंदी पर द्रविड़,फ़ारसी, अरबी, तुर्की, उर्दू, पुर्तगाली, व अंग्रेज़ी भाषाओं का भी प्रभाव है। यह देवनागरी लिपि में लिखी जाती है। वर्तमान में युवाओं द्वारा हिंग्लिश का भी प्रयोग किया जाता है। अतः हिंदी भाषा में अन्य भाषाओं के समावेश व स्वीकार्यता की अद्भुत क्षमता है। भारत में हिन्दी भाषा में व्यापक अनुसंधान भारत की स्वतंत्रता के बाद प्रारम्भ हुए। हालाँकि यह अनुसंधान मूलतः भाषाओं के अनुवाद पर ही केंद्रित थे।


हिन्दी तथा इंटरनेट:

इंटरनेट पर हिन्दी के व्यापक प्रयोग के लिए एक सुविधाजनक प्लेटफॉर्म की आवश्यकता पड़ती है। इसके लिए सरल हिन्दी सम्पादन, सरल अक्षर यूटिलिटी तथा बहु-आयामी कोड जिससे सभी प्रचलित लिपियों के लिए एक वैश्विक मानक स्थापित हों। यूनिकोड की इंडिक स्क्रिप्ट टेबल-इंडियन स्क्रिप्ट कोड फ़ॉर इन्फॉर्मेशन इंटरचेंज (ISCII) पर बनी है। यह वन-बाईट कोड है।  इसमें प्रत्येक वर्ण को दर्शाया गया है। वर्तमान में नोट पैड, माइक्रोसॉफ्ट ऑफ़िस तथा गूगल प्लेटफॉर्म पर बिना प्रारूप वाले अक्षर बनाने के लिए कई टूल्स उपलब्ध हैं। हालाँकि यह उतना सरल नहीं है जितना कि अंग्रेज़ी या अन्य भाषाओं के लिए है। सॉर्ट प्रोग्राम कैरेक्टर को यूनिकोड की वैल्यू के आधार पर छाँटता है। दुर्भाग्य से हिन्दी के लिए कैरेक्टर को वैल्यू के साथ रेंडर नहीं किया जा सकता है। कई कोड यूनिकोड तालिका में विभिन्न स्थानों पर रखे गए हैं । ये वर्ण यूनिकोड से व्युत्पन्न होते हैं, इससे वर्ण गणना में में कठिनाई होती है।

 

हिंदी के साथ शब्दों के निर्माण के लिए नियमों का होना काफी जटिलता प्रदान करता है। ऐसा कोई नियम नहीं हैं जो स्पष्टता से बताता हो कि विशिष्ट शब्द पुल्लिंग या स्त्रीलिंग रूप है। अतिरिक्त शब्दों की विलक्षणता और बहुलता को पहचानना भी चुनौतीपूर्ण है। हालांकि इनका अक्सर उल्लंघन भी किया जाता है, तथा इनको कम्प्यूटेशन सिस्टम में समायोजित करना अत्यंत कठिन है। लड़की, खड़क स्त्रीलिंग है। किताब, वॉक, कमीज भी स्त्रीलिंग है। इनको लिंग रूपों में वर्गीकृत करना कठिन होता है।

 

वर्ल्ड वाइड वेब डब्ल्यूडब्ल्यूडब्ल्यू को भाषा के प्रयोग व विकास के लिए महती आवश्यकता है। वर्तमान समय में सर्च इंजन के बिना इंटरनेट की कल्पना व भाषा का विकास अकल्पनीय है। आज, इंटरनेट पर अनुमानित आह 72% उपयोगकर्ता गैर अंग्रेजी भाषी है। बहुभाषी इंटरनेट उपयोगकर्ताओं को, संत। बहुभाषी इंटरनेट सर्च इंजन प्रदान करना एक चुनौती है।

 

अंग्रेजी के विपरीत। हिंदी में व्याकरण नियम लचीले और ध्वन्यात्मक है। अतः सर्च इंजन को कोडीकृत करना कठिन है। अंग्रेजी सर्च में साउंडएक्स का उपयोग शामिल है। इसे मेटा फ़ोन एल्गोरिदम द्वारा और अच्छा बनाया गया है। साउंडएक्स एल्गोरिदम का प्रयोग सामान उच्चारण वाले शब्दों को खोजने में किया जाता है। अंग्रेजी के लिए मेटाफ़ोन एल्गोरिदम लगभग 99% की सटीकता के साथ काम करती है। जबकि हिंदी के लिए इसे प्रभावी बनाने की आवश्यकता है।

 

खोज.कॉम14, रफ्तार.इन 15 वह गुरु जी 16 तथा गूगल, याहू और बिंग हिंदी को सर्च करते हैं, पर ये। बेसिक सर्च तक ही सीमित है। हिन्दी ने विभिन्न भाषाओं के शब्दों को स्वीकारा है, अतः उन भाषाओं में शब्द निर्माण के लिए अलग-अलग भाषाओं के नियमों का पालन होता है। इसलिए हिन्दी भाषा में शब्द निर्माण के लिए नियमों का बनाना कठिन है।


निष्कर्ष:

भारत में बाईस मान्यता प्राप्त भाषाएँ हैं। हिन्दी सहित सभी भाषाओं के प्रयोग तथा उनके तकनीकी विकास के लिए  असीमित सम्भावनाएँ हैं। भारत कंप्यूटर सॉफ्टवेयर निर्मित करने वाला अग्रणी राष्ट्र है, अतः हिन्दी सहित विभिन्न भारतीय भाषाओं एवं लिपियों को एक क्रमबद्ध आई सी टी नीति द्वारा इंटरनेट को अत्यधिक भाषा सुलभ बनाने की आवश्यकता है। 

 

भारत मे सीडीएफ़सी ने सराहनीय कार्य किया है, लेकिन विभिन्न संस्थान जो इस दिशा में योगदान दे सकते हैं, उनकी पहचान कर उनको भाषा अनुसंधान में सम्मिलित किया जाना चाहिए, तथा समयबद्ध अनुसन्धान परियोजनाओं को वित्त पोषित भी किया जाना चाहिए। भाषा अनुसंधान में भाग लेने के लिए दूसरों को प्रोत्साहित करने के लिए अनुसंधान परियोजनाओं के लिए धन आवंटित करने की दिशा में एक सहयोगी और समान दृष्टिकोण अपनाया जाना चाहिए। भारत सरकार को हिन्दी दिवस के वार्षिक समारोहों के साथ-साथ हिन्दी के लिए खोज एल्गोरिदम विकसित करने, कंप्यूटिंग उपकरण विकसित करने, सरल वर्ड प्रॉसेसिंग टूल्स तथा अनुवाद टूल में सुधार के लिए समयबद्ध परियोजनाओं को मूर्तरूप देना अतिआवश्यक है । 


----------------

 

 

 

 

Comments

Popular posts from this blog

Indian Independence 15th August: Sixty Seven Years Journey

Telephone Consumers in Ireland are Vulnerable for Cramming (Unauthorized, Misleading, or Deceptive Charges Placed on Your Telephone Bill)

Secrets Impacts Relations