रोज़गार समाचार
सदस्य बनें @ 530 रु में और प्रिंट संस्करण के साथ पाएं ई- संस्करण बिल्कुल मुफ्त ।। केवल ई- संस्करण @ 400 रु || विज्ञापनदाता ध्यान दें !! विज्ञापनदाताओं से अनुरोध है कि रिक्तियों का पूर्ण विवरण दें। छोटे विज्ञापनों का न्यूनतम आकार अब 200 वर्ग सेमी होगा || || नई विज्ञापन नीति ||

संपादकीय लेख


Issue no 03, 17-23 April 2021

कानूनी दस्तावेजों का डिजिटीकरण

डॉ. नकुल पराशर

कल्पना करें कि आपको बीस लाख से अधिक अदालती फैसलों का एक विशाल भंडार दिया गया हो, और बाद में इनमें से प्रत्येक मामले का सारांश लिखने को कहा गया हो. आप क्या करेंगे? क्या आप उन्हें एक-एक करके पढ़ना शुरू नहीं करेंगे और फिर उनमें से प्रत्येक का सारांश तैयार नहीं करेंगे. विभिन्न अदालतों से कानूनी मामलों के फैसले, और वह भी विशाल डेटा के रूप में, पढ़ना और विश्लेषण करना, क्या  यह एक श्रमसाध्य और समय खपाऊ काम नहीं है. इस कार्य को पूरा करने के लिए बड़ी संख्या में विधि-स्नातकों और स्नातकोत्तरों की भर्ती करनी होगी. फिर उन्हें इन मामलों का अध्ययन करने और जांचने-परखने के लिए तैनात किया जाएगा. इन मामलों के कथित सारांश का एक अनूठा प्रारूप है, जो हेड नोट्स के रूप में लोकप्रिय है. शोध पत्रों में सारांश की तरह, हेड नोट एक तरह का सार-संक्षेपण है, जो पाठकों को किसी कानूनी मुद्दे के विभिन्न महत्वपूर्ण बिंदुओं की जानकारी प्राप्त करने में सहायता करता है. हेड नोट शब्द से, ऐसा प्रतीत होता है कि यह किसी प्रकाशित और रिपोर्ट किए गए अदालती मामले का प्राक्कथन है. इस प्रकार, हेड नोट किसी शोध पत्र की भूमिका की तरह किसी अदालती मामले का सारांश है.

बहरहाल, चुनौती अभी भी बनी हुई है. किसी विशाल भंडार से मैन्युअल रूप से हेडनोट लिखना और अधिक कठिन हो जाता है क्योंकि प्रकाशित मामलों के फैसलों की संख्या रोज बढ़ती रहती है. मैन्युअल रूप से किसी हेडनोट को पढ़ने और प्रस्तुत करने में यह पाया गया है कि मामले के निर्णय की लंबाई के आधार पर, औसतन प्रति व्यक्ति, प्रति दिन, पांच हेडनोट्स की रिपोर्ट तैयार किए जा सकते हैं. निचली अदालतों के मामलों का आकार छोटा होता है और उच्च न्यायालयों के मामले बड़े होते हैं. संक्षेप में, मैन्युअल रूप से हेडनोट्स लिखना एक कठिन कार्य होगा, एक बेहद कठिन कार्य! कोई भी आसानी से यह गणना कर सकता है और सहज रूप से अनुमान लगा सकते हैं कि एक वर्ष में 20 लाख मामलों का भंडार पूरा करने के लिए, कितनी संख्या में प्रशिक्षित मानव संसाधन तैनात करने होंगे.

क्या इस प्रक्रिया का डिजिटीकरण हो सकता है?

इसका जवाब है हां. टीमों का गठन करने और एक विशेषज्ञ प्रणाली विकसित करने के लिए पिछले एक दशक में कई कानूनी डोमेन विशेषज्ञ और डेटा वैज्ञानिक साथ आए. यह विशेषज्ञ प्रणाली मामले के फैसले को पढ़ सकती है और उन क्षेत्रों की पहचान कर सकती है जो एक हेडनोट के कुछ क्षेत्रों से संबंधित हैं. एक बार संबंधित क्षेत्रों का सारांश तैयार करने और मुख्य प्रारूप के अनुसार विधिवत रूप से मिलान कर लेने के बाद, कार्यक्रमों का एक और सेट हेडनोट के अंतिम ढांचे को पूरा करता है.

इस विशेषज्ञ प्रणाली के विकास प्रक्रिया अभी भी चल रहा है क्योंकि स्रोत सामग्री की प्रकृति अत्यधिक भिन्न है, जिसका अर्थ है कि कोई भी दो मामले पूरी तरह से समान नहीं हैं. इसके अतिरिक्त, प्रत्येक निर्णय की सामग्री का स्वरूप अत्यधिक व्यक्तिपरक है. यह किसी भी गुंजाइश और आशा से परे पैटर्न मान्यता के माध्यम से प्रक्रिया के डिजिटीकरण की संभावना बनाता है. इस प्रकार, कार्यप्रवाह मशीन प्रशिक्षण मार्ग हासिल करता है, जहां सभी व्याख्यानों  को किसी भी प्रकार से शुद्ध व्याख्यान प्रारूप में उच्चतम सटीकता के साथ परिवर्तित किया जाता है. इसका मतलब है कि व्याख्यान प्रारूप में डेटा रूपांतरण को चरित्र सटीकता के उच्चतम स्तर के लिए एकदम सही होना चाहिए. जब एक बार परिवर्तित पाठ तैयार हो जाता है, तो एआई टूल की मदद से यह पाठ स्वत: एक्सएमएल प्रारुप में परिवर्तित हो जाता है.

किसी समूह में आंकड़ों के उच्चतम स्तर वाला यह एक्सएमएल प्रारूप हासिल किए जाने वाले परिणामों की सटीकता का आधार है. इसका मतलब है कि मशीन को कोडिड टेक्स्ट को पढ़ने और वांछित सारांश/सार या इस मामले में तथाकथित हेडनोट निकालने के लिए प्रशिक्षित किया गया है. मशीन को यह प्रशिक्षण आर-लैंग्विज जैसे विभिन्न सॉफ्टवेयर टूल्स का उपयोग करके दिया जाता है, जहां पर्ल-जैसे सामान्य प्रयोजन

प्रोग्राम और नियमित अभिव्यक्तियां लिखी जाती हैं.

चूंकि इस सभी में उच्च क्रम के कॉम्बिनेटरिक्स शामिल हैं, इसलिए इस अभ्यास से सांख्यिकीय नियमों का एक बड़ा भंडार उत्पन्न होता है. जितना अधिक क्रम परिवर्तन और संयोजन लागू किया जा सकता है, उतना ही मशीन की सीखने की प्रभावकारिता होगी. इसका मतलब यह है कि इन नियमों के साथ जितना अधिक कंप्यूटर प्रशिक्षित किया जाता है, वह उतना ही वांछित सटीकता के करीब हो सकता है.

ऐतिहासिक रूप से, जब हेडनोट मैन्युअल रूप से तैयार किया जाता था, हेडनोट लेखकों ने हेडनोट के लिए प्रासंगिक भागों की पहचान करने की प्रक्रिया में इनपुट मामलों में एक पैटर्न स्थापित किया था. उदाहरण के लिए, यदि यह किसी उच्च न्यायालय से एक आपराधिक मामला था, तो एक सामान्य पैटर्न उन्हें पृष्ठ संख्याओं की एक निश्चित सीमा, आदि में होल्डिंग या संचालन भाग का पता लगाने में मदद करेगा. परन्तु, जब एआई का प्रयोग किया गया, तो इस तरह के स्वरुप की मान्यता सीमित संख्या में केवल एक संक्षिप्त तथ्य कथन के क्षेत्र के लिए प्रभावी थी. दिलचस्प है, संक्षिप्त तथ्य कथन का एक अनूठा प्रारूप है और इस प्रकार, उन्हें अनुक्रम में कई तत्वों में विभाजित किया जाता है.

हर मामले के लिए एक विशिष्ट पहचानकर्ता, अदालत जिसे वह अपीलकर्ता बनाम प्रतिवादी, कानून का क्षेत्र, विधान, कानून का प्रावधान, की वर्ड, तथ्य, मुद्दा, होल्डिंग, ऑर्बिटर डिक्टा के साथ विवाद और रेशो डेसिडेंडी में दर्ज करता है. इन बारह क्षेत्रों में से, आपका ध्यान इस बात की ओर जाएगा कि तथ्य, मुद्दे, और होल्डिंग हेडनोट के दिल और दिमाग हैं.  दिलचस्प बात है, कि अन्य सभी फील्ड का सारांश प्लेस लोकेटर के माध्यम से निकाला जा सकता है. ये तीनों किसी भी हेडनोट लेखक के लिए प्रमुख चुनौती बने हुए हैं क्योंकि इन ग्रंथों से संबंधित सामग्री का स्वरूप पूरी तरह से व्यक्तिपरक है.

कार्यानुभव से, सामग्री के निष्कर्ष की उच्च सटीकता, तथ्य, मुद्दे, और मामले की होल्डिंग को छोड़कर अन्य नौ क्षेत्रों में रिपोर्ट की गई थी. रिपोर्ट के कानूनी मामलों से सही डेटा निकालने के लिए डेटा वैज्ञानिकों और कानूनी विशेषज्ञों की टीमें दिन-रात काम कर रही हैं.

इस प्रकार इस उपयोग के मामले में आर्टिफिशियल इंटेलीजेंस को लागू करने की यह कवायद तीन प्रमुख परिणाम - सामग्री वर्गीकरण, निष्कर्षण और अंत में संक्षेपण, प्रदान करती है. हम सभी जानते हैं कि सामग्री सर्वोपरि है, और सामग्री के लिए डिजिटीकरण लागू करने से हमें कई अन्य अनुप्रयोगों में भी इसे लागू करने में मदद मिल सकती है. यदि सामग्री एक समान नहीं है और प्रकृति में भिन्न है तो यह चुनौती और बड़ी हो जाती है.

कानूनी डोमेन, इस तरह तेजी से विकसित सामग्री पर आधारित है, जो विशाल है, और एक समान नहीं है. इस चुनौती ने इस प्रकार एक बड़े उद्योग को जन्म दिया है, जिसे कानूनी प्रक्रिया आउटसोर्सिंग या कानूनी प्रसंस्करण कहा जाता है, जो वकीलों और न्यायाधीशों के कानूनी समुदाय, पैरा-क़ानूनी डोमेन, कॉरपोरेट्स में काम करने वाले पेशेवरों, जो बौद्धिक और संपत्ति अधिकारों, और कानूनी सामग्री एग्रीगेटर्स और प्रकाशक आदि में काम करता है.

कानूनी प्रक्रिया एक प्रमुख अनुप्रयोग क्षेत्र है जहां कई कारणों से एआई के प्रयोग की अत्यधिक मांग है. अदालत में केस लड़ते समय प्रासंगिक मामलों/पूर्ववर्ती स्थिति में हुए मामलों की सामग्री की खोज के लिए कई बार, न्यायाधीशों और वकीलों को सामग्री के एक बड़े भंडार में से ढूंढ़ने के लिए संघर्ष करना पड़ता है. इसी तरह, पेटेंट और ट्रेडमार्क के मामलों में, वकीलों की मदद के लिए एआई का अनुप्रयोग अत्यधिक महत्वपूर्ण और प्रासंगिक है, विशेष रूप से जब आवश्यक हो और सामग्री के प्रासंगिक हिस्से कम से कम समय में खींचे जाने हों. इसका मतलब है कि एक बहुत ही कम समय में, सही और त्वरित निर्णय के लिए अत्यधिक सही और सटीक डेटा को विधिवत निष्कर्षित किया जाना चाहिए.

वास्तव में, यह इतना सरल नहीं है जितना कि समझा जाता है. मामले के निर्णय को सारांशित करने के अलावा एक और बड़ी चुनौती इसका वर्गीकरण है. कानूनी मामलों को कई प्रकारों में विभाजित किया जाता है, वे कई अदालतों से आते हैं, आदि, और इस प्रकार तेजी से विकसित होने वाले कानूनी सामग्री प्रबंधन डोमेन के लिए वस्तुरूप विज्ञान को विकसित करने में आर्टिफिशियल इंटेलीजेंस के अनुप्रयोग की आवश्यकता होती है.

बहरहाल, यह एक बड़ी कहानी का ट्रेलर मात्र है. वैश्विक स्तर पर, कानूनी उद्योग के पास एक तरफ विरासत की कानूनी सामग्री के डेटा भंडार होते हैं और दूसरी ओर इसी तरह की सामग्री का बड़ी मात्रा में उत्पादन जारी रहता है, और वह भी दैनिक आधार पर. इसका स्पष्ट अर्थ है कि यह डोमेन कानून, बौद्धिक संपदा, पेटेंट और ट्रेडमार्क, सामग्री प्रबंधन, डेटा विज्ञान और सूचना प्रौद्योगिकी में डोमेन विशेषज्ञों के लिए नौकरियों और अवसरों की एक बड़ी खान है.

हां, यह कानूनी सामग्री प्रबंधन सेवाओं की तेजी से बढ़ती दुनिया है, जिसने राष्ट्रीय सीमाओं को पार कर लिया है और किसी भी अन्य निर्यात आउटसोर्सिंग व्यवसाय की तरह बहुराष्ट्रीय स्थिति प्राप्त की है. देश के भीतर उत्पन्न आंकड़ों के अलावा, हमारे आईटी और कानूनी संसाधन विदेशी बाजार की बड़ी जरूरत के लिए भी उपयोगी साबित हुए हैं. कई कानूनी स्नातकों और स्नातकोत्तरों ने बड़े कानूनी सामग्री एग्रीगेटर्स और प्रकाशकों के माध्यम से कानूनी सामग्री प्रबंधन सेवाओं में कॅरिअर बनाया है.

बड़ी संख्या में मानव संसाधन के काम में लगे होने के बावजूद, इस उद्योग में अभी भी राष्ट्रीय डेटा के उपभोक्ताओं की बढ़ती जरूरतों को पूरा करने के लिए पर्याप्त संसाधनों की कमी है. राष्ट्रीय सामग्री के अलावा, निर्यात कानूनी प्रक्रिया आउटसोर्सिंग उद्योग भी फल-फूल रहा है. पश्चिमी देशों से, कई कानून सेवाएं देने वाले प्रतिष्ठान और एग्रीगेटर्स, विशेष रूप से अमरीका, कानूनी संसाधनों और आईटी पेशेवरों के लिए दस्तावेज़ समीक्षा, कानूनी प्रतिलेखन, ई-खोज, दुर्घटना रिपोर्ट, हेडनोट्स/सारांश, प्रलेखन और अन्य  क्षेत्रों में लगातार काम के अवसर प्रदान कर रहा है.

निजी क्षेत्र में, चार बड़ी लेखा फर्मों (केपीएमजी, ई एंड वाय, डेलॉइट एंड पी डब्लू सी) के अलावा, लीक्सिसनेक्सिस, थॉमसन रॉयटर्स, क्लूवर और जैसे कई अन्य  कानूनी कंटेंट एग्रीगेटर्स संभावनाशील नौकरी प्रदाता हैं, जो नियमित रोज़गार और फ्रीलांस असाइनमेंट के रूप में रोज़गार प्रदान करते हैं.

एलपीओ (लीगल प्रोसेस आउटसोर्सिंग) की दुनिया आशाजनक लगती है और नए सामान्य में, जहां वर्क-फ्रॉम-होम पसंदीदा विकल्प लगता है, यह डोमेन उपयुक्त रूप से अच्छी तरह से फिट बैठता है. लब्बोलुआब यह है कि अगर कानूनी पृष्ठभूमि वाले किसी व्यक्ति का डेटा साइंस की ओर झुकाव है, तो यह संयोजन भविष्य में उसके/उसकी आजीविका के लिए  बहुत फायदेमंद सिद्ध हो सकता है. भारत इस मामले में अग्रणी रहा है क्योंकि हमारे यहां अधिक से अधिक डोमेन विशेषज्ञ हैं, जो डेटा विज्ञान की होनहार दुनिया में कॅरिअर अपग्रेड के लिए आवेदन कर रहे हैं.

(लेखक विज्ञान प्रसार, नई दिल्ली के निदेशक हैं.

ई-मेल: director@ vigyanprasar.gov.in)

व्यक्त विचार व्यक्तिगत हैं.

(चित्र: गूगल के सौजन्य से)