कॉर्नेल विश्वविद्यालय द्वारा होस्ट किए गए वैज्ञानिक प्रीप्रिंट के लिए व्यापक रूप से उपयोग किया जाने वाला ओपन-एक्सेस प्लेटफ़ॉर्म, arXiv, अपने संपूर्ण संचालन को विश्वविद्यालय-होस्टेड वर्चुअल मशीनों से Google क्लाउड प्लेटफ़ॉर्म (GCP) पर स्थानांतरित कर रहा है।
यह कदम “arXiv CE” (क्लाउड संस्करण) नामक एक बहु-वर्षीय तकनीकी नवीनीकरण परियोजना का आधार है, जिसे प्लेटफ़ॉर्म की क्षमता और स्थिरता को मज़बूत करने के लिए डिज़ाइन किया गया है क्योंकि यह बढ़ते उपयोग से जूझ रहा है और पुराने कोड को हटाना चाहता है।
यह बदलाव ऐसे समय में आया है जब arXiv, जो 2.6 मिलियन से अधिक शोधपत्रों की मेजबानी करता है और लगभग पाँच मिलियन मासिक उपयोगकर्ताओं को सेवा प्रदान करता है, अपने मेजबान संस्थान, कॉर्नेल द्वारा सामना किए जा रहे आंतरिक तकनीकी ऋण और बाहरी वित्तीय दबावों, दोनों से निपटता है। इस पहल को सिमंस फ़ाउंडेशन से समर्थन और इन्वेस्ट इन ओपन इंफ्रास्ट्रक्चर से रणनीतिक मार्गदर्शन प्राप्त है, जिसकी शुरुआत 2023 की शुरुआत में हुई थी।
एक आधारभूत प्लेटफ़ॉर्म का आधुनिकीकरण
कई शोधकर्ताओं के लिए, विशेष रूप से भौतिकी और गणित के क्षेत्र में, arXiv एक दैनिक संसाधन है। “गणित और भौतिकी में हर कोई इसका इस्तेमाल करता है,” कंप्यूटर वैज्ञानिक स्कॉट आरोनसन ने मार्च में WIRED को बताया। “मैं इसे हर रात स्कैन करता हूँ।”
लॉस एलामोस नेशनल लेबोरेटरी में 1991 में पॉल गिन्सपार्ग द्वारा स्थापित, arXiv ने पारंपरिक, धीमी सहकर्मी-समीक्षा जर्नल टाइमलाइन को दरकिनार कर दिया, जिससे प्रीप्रिंट्स का तेज़ी से साझाकरण संभव हो गया।
इसके शुरुआती स्वरूप में गिन्सपार्ग की NeXT मशीन पर चलने वाली शेल स्क्रिप्ट का इस्तेमाल किया गया, जिसके बाद इसे ईमेल/FTP और बाद में वेब पर स्थानांतरित किया गया। भौतिक विज्ञानी पॉल फेंडली के अनुसार, इसकी सफलता ने यह प्रदर्शित किया कि “आप अपने परिणामों के वास्तविक प्रसारण को रेफरी प्रक्रिया से अलग कर सकते हैं।”
हालाँकि, इस प्लेटफ़ॉर्म की तकनीकी नींव पुरानी हो गई है। arXiv CE परियोजना सीधे इसी विरासती बुनियादी ढाँचे को लक्षित करती है। arXiv के करियर पृष्ठ पर विस्तृत एक मुख्य उद्देश्य शेष Perl और PHP बैकएंड घटकों को प्रतिस्थापित करना और Python पर मानकीकृत करना है।
इस योजना में आलेख प्रसंस्करण को पूरी तरह से अतुल्यकालिक बनाने और सेवाओं को कंटेनरीकृत करने के लिए पुनर्रचना शामिल है। कंटेनरीकरण अनुप्रयोगों को सुसंगत परिनियोजन के लिए पैकेज करता है, और arXiv Kubernetes (कंटेनर प्रबंधन को स्वचालित करने के लिए एक ओपन-सोर्स सिस्टम) या Google Cloud Run (एक प्रबंधित सर्वर रहित कंटेनर प्लेटफ़ॉर्म) जैसी तकनीकों का उपयोग करने की योजना बना रहा है।
बेहतर निगरानी, लॉगिंग, और एक सतत एकीकरण/सतत परिनियोजन (CI/CD) पाइपलाइन—कोड अद्यतनों को स्वचालित करना—भी प्रमुख तकनीकी लक्ष्य हैं। ये प्रयास मौजूदा बुनियादी ढाँचे के विकल्पों का पूरक हैं, जैसे Fastly सामग्री वितरण नेटवर्क (CDN) का उपयोग करना।
रणनीतिक पुनर्रचना और भविष्य के लक्ष्य
GCP की ओर कदम को व्यापक सेवा सुधारों के लिए एक आवश्यक कदम के रूप में प्रस्तुत किया गया है। arXiv का लक्ष्य नए विषय क्षेत्रों में अधिक आसानी से विस्तार करना, मेटाडेटा संग्रह (वित्तदाता आईडी और लेखक अस्पष्टता को संबोधित करने सहित) को बढ़ाना, और अपने वैश्विक अनुसंधान समुदाय के लिए पहुँच और समग्र उपयोगिता में सुधार करना है।
यह कम से कम 2023 की शुरुआत से चल रहे एक रणनीतिक नियोजन प्रयास के अनुरूप है, जिसे सिमंस फ़ाउंडेशन द्वारा समर्थित किया जा रहा है और जिसमें इन्वेस्ट इन ओपन इंफ्रास्ट्रक्चर (IOI) का मार्गदर्शन शामिल है। सिमंस फ़ाउंडेशन के इवान ओरांस्की ने कहा कि IOI का “ओपन इंफ्रास्ट्रक्चर क्षेत्र में व्यापक अनुभव और स्थिरता एवं शासन में उनकी विशेषज्ञता, arXiv को आने वाले दशकों में अपनी दिशा तय करने में मदद करेगी।”
समुदाय की प्रतिक्रिया और कॉर्नेल का संदर्भ
GCP में जाने की खबर ने तकनीकी समुदाय में, विशेष रूप से हैकर न्यूज़ जैसे मंचों पर, चर्चा छेड़ दी है। टिप्पणीकारों ने क्लाउड परिचालन व्यय बनाम ऑन-प्रिमाइसेस पूंजीगत लागतों, विक्रेता लॉक-इन के जोखिमों और प्लेटफ़ॉर्म नीतियों के कारण ईरान जैसे कुछ क्षेत्रों में उपयोगकर्ताओं के लिए संभावित पहुँच प्रतिबंधों के साथ संभावित दीर्घकालिक लागत वृद्धि के बारे में चिंता व्यक्त की। एक उपयोगकर्ता ने संदेह व्यक्त किया, और आशंका जताई कि “सरलता और स्थिरता को अलविदा, समान/कम सेवा गुणवत्ता के लिए अत्यधिक मासिक लागत।”
अन्य लोगों ने arXiv पर बढ़ती माँगों की ओर इशारा किया, विशेष रूप से इसके रिपॉजिटरी तक पहुँचने वाले AI क्रॉलर्स के बढ़ते लोड की ओर, जिसके कारण बेहतर स्केलेबिलिटी की आवश्यकता थी। घनिष्ठ संबंध होने का दावा करने वाले एक उपयोगकर्ता ने कहा कि प्लेटफ़ॉर्म की वर्तमान “स्थिरता केवल इसे चालू रखने के लिए किए जाने वाले असाधारण प्रयासों के कारण है।”
कुछ लोगों ने स्थापित क्लाउड सेवाओं के उपयोग को स्केलिंग और तकनीकी ऋण के प्रबंधन का एक व्यावहारिक तरीका माना। Google के पहले से ही गोल्ड प्रायोजक के रूप में सूचीबद्ध होने के कारण, इस विकल्प को प्रभावित करने वाले संभावित क्रेडिट के बारे में अटकलें लगाई गईं। यह समय कॉर्नेल विश्वविद्यालय की वित्तीय चुनौतियों से भी मेल खाता है। हाल ही में NPR की एक रिपोर्ट में ट्रम्प प्रशासन द्वारा $1 बिलियन के संघीय वित्त पोषण पर रोक लगाने का विवरण दिया गया है।
इसके बाद मार्च में वित्तीय अनिश्चितता का हवाला देते हुए विश्वविद्यालय-व्यापी भर्ती पर रोक लगा दी गई। हालाँकि arXiv ने आधिकारिक तौर पर GCP के इस कदम को इन बजटीय मुद्दों से नहीं जोड़ा है, लेकिन यह संदर्भ माइग्रेशन के उद्देश्यों पर चर्चा को और बल देता है।
एक दीर्घकालिक प्लेटफ़ॉर्म का विकास
अपनी स्थापना के बाद से, arXiv वैज्ञानिक संचार का केंद्र बन गया है। GCP में माइग्रेशन, इस प्लेटफ़ॉर्म को आधुनिक तकनीकी आवश्यकताओं के अनुकूल बनाने की दिशा में एक नवीनतम कदम है, जो अक्सर LaTeX (कई वैज्ञानिक क्षेत्रों में एक मानक दस्तावेज़ निर्माण प्रणाली) में लिखे गए दस्तावेज़ों को संसाधित करता है।
arXiv CE परियोजना, जिसकी घोषणा 2023 में डेवलपर्स की तलाश में एक ब्लॉग पोस्ट के माध्यम से की गई थी, इस प्रणाली में व्यापक सुधार के लिए एक ठोस प्रतिबद्धता का प्रतिनिधित्व करती है। गिंसपार्ग, जिन्होंने एक बार arXiv को “एक बच्चा जिसे मैंने कॉलेज भेजा था, लेकिन जो बार-बार मेरे लिविंग रूम में आकर बुरा व्यवहार करता है,” के रूप में वर्णित किया था, अब रोज़मर्रा की ज़िंदगी में कम सक्रिय हैं, लेकिन नए नेतृत्व और हाल ही में फाउंडेशन के सहयोग से यह प्लेटफ़ॉर्म अब शोध जगत को अपनी निरंतर सेवा सुनिश्चित करने के लिए यह बदलाव कर रहा है।
स्रोत: विनबज़र / डिग्पू न्यूज़टेक्स