কর্নেল বিশ্ববিদ্যালয় কর্তৃক আয়োজিত বৈজ্ঞানিক প্রিপ্রিন্টের জন্য বহুল ব্যবহৃত ওপেন-অ্যাক্সেস প্ল্যাটফর্ম, arXiv, তার সম্পূর্ণ কার্যক্রম বিশ্ববিদ্যালয়-হোস্টেড ভার্চুয়াল মেশিন থেকে Google ক্লাউড প্ল্যাটফর্ম (GCP) এ স্থানান্তরিত করছে।
এই পদক্ষেপটি “arXiv CE” (ক্লাউড সংস্করণ) নামে একটি বহু-বছরের প্রযুক্তিগত রিফ্রেশ প্রকল্পকে নোঙ্গর করে, যা প্ল্যাটফর্মের ক্ষমতা এবং স্থিতিশীলতা বৃদ্ধির জন্য ডিজাইন করা হয়েছে কারণ এটি ক্রমবর্ধমান ব্যবহারের সাথে লড়াই করছে এবং লিগ্যাসি কোডটি বাদ দেওয়ার চেষ্টা করছে।
এই পরিবর্তনটি এসেছে arXiv হিসাবে, যা 2.6 মিলিয়নেরও বেশি কাগজপত্র হোস্ট করে এবং প্রতি মাসে প্রায় পাঁচ মিলিয়ন ব্যবহারকারীকে পরিবেশন করে, তার হোস্ট প্রতিষ্ঠান, কর্নেলের মুখোমুখি অভ্যন্তরীণ প্রযুক্তিগত ঋণ এবং বহিরাগত আর্থিক চাপ উভয়ই নেভিগেট করে। এই উদ্যোগটি সাইমন্স ফাউন্ডেশন থেকে সমর্থন এবং 2023 সালের গোড়ার দিকে শুরু হওয়া ইনভেস্ট ইন ওপেন ইনফ্রাস্ট্রাকচার থেকে কৌশলগত নির্দেশনা পায়।
একটি ভিত্তিগত প্ল্যাটফর্ম আধুনিকীকরণ
অনেক গবেষকের জন্য, বিশেষ করে পদার্থবিদ্যা এবং গণিতে, arXiv একটি দৈনন্দিন সম্পদ। “গণিত এবং পদার্থবিদ্যার সবাই এটি ব্যবহার করে,” কম্পিউটার বিজ্ঞানী স্কট অ্যারনসন মার্চ মাসে WIRED কে বলেন। “আমি প্রতি রাতে এটি স্ক্যান করি।”
১৯৯১ সালে লস আলামোস ন্যাশনাল ল্যাবরেটরিতে থাকাকালীন পল গিন্সপার্গ কর্তৃক প্রতিষ্ঠিত arXiv, ঐতিহ্যবাহী, ধীর পিয়ার-রিভিউ জার্নাল টাইমলাইনকে এড়িয়ে যায়, যা প্রিপ্রিন্ট দ্রুত ভাগ করে নেওয়ার সুযোগ করে দেয়।
এর প্রাথমিক ফর্মটি ইমেল/FTP এবং পরে ওয়েবে যাওয়ার আগে Ginsparg এর NeXT মেশিনে চলমান শেল স্ক্রিপ্ট ব্যবহার করত। পদার্থবিদ পল ফেন্ডলির মতে, এর সাফল্য প্রমাণ করেছে, “আপনি রেফারি করার প্রক্রিয়া থেকে আপনার ফলাফলের প্রকৃত সংক্রমণকে আলাদা করতে পারেন।”
তবে, প্ল্যাটফর্মের প্রযুক্তিগত ভিত্তি পুরানো হয়ে গেছে। arXiv CE প্রকল্পটি সরাসরি এই উত্তরাধিকারী অবকাঠামোকে লক্ষ্য করে। arXiv এর ক্যারিয়ার পৃষ্ঠায় বিশদভাবে উল্লেখ করা একটি মূল উদ্দেশ্য হল অবশিষ্ট Perl এবং PHP ব্যাকএন্ড উপাদানগুলির প্রতিস্থাপন, Python-এর মানসম্মতকরণ।
এই পরিকল্পনায় নিবন্ধ প্রক্রিয়াকরণকে সম্পূর্ণরূপে অ্যাসিঙ্ক্রোনাস এবং কন্টেইনারাইজিং পরিষেবাগুলিতে পুনর্নির্মাণ করা অন্তর্ভুক্ত। ধারাবাহিক স্থাপনার জন্য কন্টেইনারাইজেশন প্যাকেজ অ্যাপ্লিকেশন এবং arXiv Kubernetes (কন্টেইনার ব্যবস্থাপনা স্বয়ংক্রিয় করার জন্য একটি ওপেন-সোর্স সিস্টেম) বা Google Cloud Run (একটি পরিচালিত সার্ভারলেস কন্টেইনার প্ল্যাটফর্ম) এর মতো প্রযুক্তি ব্যবহার করার পরিকল্পনা করছে।
উন্নত পর্যবেক্ষণ, লগিং এবং একটি ক্রমাগত ইন্টিগ্রেশন/কন্টিনিউয়াস ডিপ্লয়মেন্ট (CI/CD) পাইপলাইন—কোড আপডেট স্বয়ংক্রিয় করা—এগুলিও মূল প্রযুক্তিগত লক্ষ্য। এই প্রচেষ্টাগুলি বিদ্যমান অবকাঠামোগত পছন্দগুলিকে পরিপূরক করে, যেমন Fastly কন্টেন্ট ডেলিভারি নেটওয়ার্ক (CDN) ব্যবহার করা।
কৌশলগত ওভারহল এবং ভবিষ্যতের লক্ষ্য
GCP-তে স্থানান্তরকে বৃহত্তর পরিষেবা উন্নতির জন্য একটি প্রয়োজনীয় পদক্ষেপ হিসাবে উপস্থাপন করা হয়েছে। arXiv এর লক্ষ্য হল আরও সহজে নতুন বিষয় ক্ষেত্রগুলিতে প্রসারিত করা, মেটাডেটা সংগ্রহ (তহবিলদাতা আইডি এবং লেখকের অস্পষ্টতা মোকাবেলা সহ) উন্নত করা এবং এর বিশ্বব্যাপী গবেষণা সম্প্রদায়ের জন্য অ্যাক্সেসযোগ্যতা এবং সামগ্রিক ব্যবহারযোগ্যতা উন্নত করা।
এটি কমপক্ষে ২০২৩ সালের গোড়ার দিকে সিমন্স ফাউন্ডেশন দ্বারা সমর্থিত এবং ইনভেস্ট ইন ওপেন ইনফ্রাস্ট্রাকচার (IOI) এর দিকনির্দেশনা জড়িত একটি কৌশলগত পরিকল্পনা প্রচেষ্টার সাথে সামঞ্জস্যপূর্ণ। সিমন্স ফাউন্ডেশনের ইভান ওরানস্কি উল্লেখ করেছেন যে IOI-এর “উন্মুক্ত অবকাঠামোগত ক্ষেত্রে বিস্তৃত অভিজ্ঞতা এবং টেকসইতা এবং শাসনব্যবস্থায় তাদের দক্ষতা আগামী কয়েক দশক ধরে arXiv-কে তার গতিপথ নির্ধারণে সহায়তা করবে।”
সম্প্রদায় প্রতিক্রিয়া এবং কর্নেলের প্রসঙ্গ
GCP-তে স্থানান্তরের খবর প্রযুক্তিগত সম্প্রদায়ের মধ্যে আলোচনার জন্ম দিয়েছে, বিশেষ করে হ্যাকার নিউজের মতো ফোরামে। মন্তব্যকারীরা প্ল্যাটফর্ম নীতির কারণে ক্লাউড অপারেশনাল ব্যয় বনাম প্রাঙ্গনে মূলধন ব্যয়ের সাথে সম্ভাব্য দীর্ঘমেয়াদী ব্যয় বৃদ্ধি, বিক্রেতা লক-ইনের ঝুঁকি এবং ইরানের মতো নির্দিষ্ট অঞ্চলের ব্যবহারকারীদের জন্য সম্ভাব্য অ্যাক্সেস সীমাবদ্ধতা সম্পর্কে উদ্বেগ প্রকাশ করেছেন। একজন ব্যবহারকারী সন্দেহ প্রকাশ করেছেন, আশা করছেন “বিদায় সরলতা এবং স্থিতিশীলতা, একই/কম পরিষেবার মানের জন্য অত্যধিক মাসিক খরচ।”
অন্যরা arXiv-এর ক্রমবর্ধমান চাহিদার দিকে ইঙ্গিত করেছেন, বিশেষ করে AI ক্রলারদের কাছ থেকে এর সংগ্রহস্থলে প্রবেশের লোড বৃদ্ধি পেয়েছে, যার ফলে বর্ধিত স্কেলেবিলিটি প্রয়োজন। ঘনিষ্ঠ সম্পর্ক দাবিকারী একজন ব্যবহারকারী বলেছেন যে প্ল্যাটফর্মের বর্তমান “স্থিতিশীলতা কেবল এটি চালু রাখার জন্য তাদের ব্যতিক্রমী প্রচেষ্টার কারণে।”
প্রতিষ্ঠিত ক্লাউড পরিষেবাগুলির ব্যবহারকে কেউ কেউ স্কেলিং এবং প্রযুক্তিগত ঋণ পরিচালনার একটি ব্যবহারিক উপায় হিসাবে দেখেছেন। গুগল ইতিমধ্যেই গোল্ড স্পনসর হিসাবে তালিকাভুক্ত হওয়ায়, সম্ভাব্য ক্রেডিটগুলি পছন্দকে প্রভাবিত করে এমন জল্পনা শুরু হয়েছে। সময়টি কর্নেল বিশ্ববিদ্যালয়ের আর্থিক চ্যালেঞ্জের সাথেও মিলে যায়। সাম্প্রতিক NPR রিপোর্টে ট্রাম্প প্রশাসন কর্তৃক $1 বিলিয়ন ফেডারেল তহবিল স্থগিত করার বিস্তারিত বিবরণ দেওয়া হয়েছে।
আর্থিক অনিশ্চয়তার কথা উল্লেখ করে মার্চ মাসে বিশ্ববিদ্যালয়-ব্যাপী নিয়োগ স্থগিত ঘোষণা করা হয়েছিল। যদিও arXiv আনুষ্ঠানিকভাবে এই বাজেট বিষয়গুলির সাথে GCP পদক্ষেপের যোগসূত্র রাখেনি, এই প্রেক্ষাপটটি অভিবাসনের প্রেরণা নিয়ে আলোচনাকে আরও বাড়িয়ে তোলে।
একটি দীর্ঘমেয়াদী প্ল্যাটফর্ম বিকশিত হচ্ছে
প্রতিষ্ঠার পর থেকে, arXiv বৈজ্ঞানিক যোগাযোগের কেন্দ্রবিন্দুতে পরিণত হয়েছে। GCP-তে স্থানান্তর হল প্ল্যাটফর্মটিকে অভিযোজিত করার সর্বশেষ পদক্ষেপ, যা প্রায়শই LaTeX (অনেক বৈজ্ঞানিক ক্ষেত্রে একটি আদর্শ নথি প্রস্তুতি ব্যবস্থা) তে লেখা নথিগুলিকে আধুনিক প্রযুক্তিগত চাহিদার সাথে প্রক্রিয়াজাত করে।
arXiv CE প্রকল্প, যা 2023 সালে ডেভেলপারদের সন্ধানে একটি ব্লগ পোস্টের মাধ্যমে ইতিমধ্যেই ঘোষণা করা হয়েছিল, সিস্টেমটিকে পুনর্গঠনের জন্য একটি উল্লেখযোগ্য প্রতিশ্রুতির প্রতিনিধিত্ব করে। যদিও Ginsparg, যিনি একবার arXiv কে “একটি শিশু যাকে আমি কলেজে পাঠিয়েছিলাম কিন্তু যে আমার বসার ঘরে ফিরে এসে খারাপ আচরণ করে,” হিসাবে বর্ণনা করেছিলেন, প্রতিদিন কম জড়িত, নতুন নেতৃত্বে এবং সাম্প্রতিক ফাউন্ডেশন সহায়তায় প্ল্যাটফর্মটি এখন গবেষণা জগতে তার অব্যাহত পরিষেবা নিশ্চিত করার জন্য এই পরিবর্তনটি গ্রহণ করছে।
সূত্র: Winbuzzer / Digpu NewsTex