मामले का अध्ययन
Copyleaks एपीआई
साहित्यिक चोरी का पता लगाना
सटीकता, विश्लेषण गहराई, और वर्कफ़्लो दक्षता
नेशनल स्पेस सोसाइटी (एनएसएस) ने 1994 से वार्षिक जेरार्ड के. ओ'नील स्पेस सेटलमेंट प्रतियोगिता की मेजबानी की है। छात्रों को इस परियोजना के अलावा कोई भी आवश्यकता नहीं दी गई है, जिसमें फ्री-फ्लोटिंग, स्थायी अंतरिक्ष निपटान अवधारणा पर ध्यान केंद्रित करना होगा। हर साल, दुनिया भर में 12वीं कक्षा से लेकर हजारों छात्र प्रतियोगिता में भाग लेते हैं, जिनमें से अधिकांश प्रस्तुतियाँ निबंध के रूप में होती हैं, जिनमें से कुछ पिछले वर्षों में 200 पृष्ठों तक पहुँच जाती हैं। निर्णय प्रक्रिया के भाग के रूप में, साहित्यिक चोरी के लिए प्रत्येक सबमिशन की समीक्षा की जाती है, यह प्रक्रिया मैन्युअल रूप से की जाती थी, जिसमें अक्सर हफ्तों से लेकर महीनों तक का समय लगता था।
एनएसएस ने निर्णय प्रक्रिया में तेजी लाने और दक्षता बढ़ाने के लिए, विशेष रूप से साहित्यिक चोरी का पता लगाने वाले हिस्से के लिए, समाधान ढूंढना शुरू किया। समाधान खोजने के लिए एक महत्वपूर्ण विचार एपीआई एकीकरण वाला एक मंच था जो प्रतियोगिता के लिए उपयोग किए जाने वाले पुरस्कार प्रबंधन सॉफ्टवेयर, अवार्ड फोर्स के साथ सहजता से काम कर सकता था। एक अन्य चिंता प्रभावी और संपूर्ण रिपोर्टिंग, दस्तावेज़ीकरण और बड़ी मात्रा में सामग्री और डेटा प्रोसेसिंग को संभालने की क्षमता थी।
2018 में, एनएसएस ने प्रतियोगिता सबमिशन के भीतर संभावित साहित्यिक चोरी का पता लगाने के लिए एपीआई एकीकरण का उपयोग करते हुए Copyleaks प्लेटफॉर्म के साथ काम करना शुरू किया। अवार्ड्स फोर्स के माध्यम से प्रत्येक स्कैन एक संदिग्ध स्कोर उत्पन्न करता है, जिससे न्यायाधीशों को संभावित साहित्यिक चोरी के बारे में तेजी से और अधिक सूचित निर्णय लेने की अनुमति मिलती है। परिणामस्वरूप, प्रसंस्करण समय हफ्तों या एक महीने से घटकर कुछ ही दिन रह गया।
मैथ्यू जे लेविन, एनएसएस जेरार्ड के. ओ'नील स्पेस सेटलमेंट प्रतियोगिता के निदेशक
एनएसएस ने यह मानना शुरू कर दिया कि यदि संदिग्ध स्कोर 0% था, तो यह एक स्वचालित पास था; यदि यह 51टीपी9टी या इससे अधिक था, तो यह आम तौर पर एक स्वचालित विफलता थी। 0-5% के बीच किसी भी चीज़ के लिए प्रत्येक स्कैन के साथ उत्पन्न Copyleaks समानता रिपोर्ट का उपयोग करके गहन विश्लेषण के माध्यम से आगे की जांच की आवश्यकता होती है। प्रत्येक रिपोर्ट के भीतर एक समानता स्कोर होता है (उपरोक्त संदिग्ध स्कोर से अलग गणना की जाती है) जो स्कैन किए गए दस्तावेज़ के भीतर पाए गए समान पाठ का गहन विश्लेषण करता है। ये रिपोर्ट विश्लेषण न्यायाधीशों को पाठ की एक-दूसरे से तुलना करने और यह निर्धारित करने की अनुमति देते हैं कि क्या सामग्री चोरी की गई थी।
एनएसएस Copyleaks रिपॉजिटरी का भी उपयोग करता है, जो उन्हें सभी स्कैन किए गए सबमिशन को एक सुरक्षित, निजी डेटाबेस में संग्रहीत करने की अनुमति देता है जिसका उपयोग भविष्य के स्कैन के लिए तुलना करने के लिए किया जा सकता है ताकि यह सुनिश्चित किया जा सके कि किसी भी प्रतियोगी ने पिछले विजेता सबमिशन की चोरी नहीं की है।
Copyleaks से शुरुआत के बाद से, एनएसएस प्रतियोगिता प्रस्तुतियों के भीतर बहुत तेज, अधिक सटीक दर से साहित्यिक चोरी का पता लगाने में सक्षम रहा है। उदाहरण के लिए, 2023 में, 4,567 सबमिशन में से, 1,894 को साहित्यिक चोरी के लिए अयोग्य घोषित कर दिया गया था, जब कार्य मैन्युअल रूप से किया गया था तब से एक महत्वपूर्ण वृद्धि हुई है।
एनएसएस इस बात पर भी विचार कर रहा है कि चैटजीपीटी जैसे चैटबॉट्स से एआई-जनरेटेड सामग्री जेरार्ड के. ओ'नील स्पेस सेटलमेंट प्रतियोगिता और उसके सबमिशन को कैसे प्रभावित करेगी और निर्णय प्रक्रिया के नए कार्यान्वित भाग के रूप में Copyleaks एआई कंटेंट डिटेक्टर का उपयोग करने की खोज कर रही है।