आर्टिफिशियल इंटेलिजेंस मॉडलों की रैंकिंग के लिए व्यापक रूप से अनुसरण किए जाने वाले प्लेटफ़ॉर्म, चैटबॉट एरिना के पीछे के शैक्षणिक अनुसंधान समूह ने एक औपचारिक कंपनी, एरिना इंटेलिजेंस इंक. की स्थापना की है, जो LMArena ब्रांड नाम से संचालित होगी।
जैसा कि गुरुवार को कंपनी के आधिकारिक ब्लॉग पोस्ट में विस्तार से बताया गया है, इस कदम का उद्देश्य प्लेटफ़ॉर्म के महत्वपूर्ण उन्नयन और त्वरित विकास के लिए आवश्यक धन और संरचना सुनिश्चित करना है।
इस उद्यम का नेतृत्व इसके शैक्षणिक मूल के प्रमुख व्यक्तियों द्वारा किया जा रहा है, जिनमें हाल ही में यूसी बर्कले के पोस्टडॉक्टरल शोधकर्ता अनास्तासियोस एंजेलोपोलोस और वेई-लिन चियांग, साथ ही यूसी बर्कले के प्रोफेसर और प्रसिद्ध तकनीकी उद्यमी आयन स्टोइका, जो डेटाब्रिक्स और एनीस्केल के सह-संस्थापक हैं, शामिल हैं।
विश्वविद्यालय परियोजना से उद्योग के लिए एक आवश्यक वस्तु तक
2023 की शुरुआत में यूसी बर्कले की स्काई कंप्यूटिंग लैब से कई संस्थानों के शोधकर्ताओं द्वारा लॉन्च किया गया, चैटबॉट एरिना ने एआई क्षेत्र में तेज़ी से प्रमुखता हासिल की।
इसने मानव प्रतिक्रिया को क्राउडसोर्स करके, आमने-सामने की तुलना के ज़रिए बड़े भाषा मॉडलों के मूल्यांकन का एक नया तरीका पेश किया। उपयोगकर्ता एक साथ दो अनाम मॉडलों के साथ इंटरैक्ट करते हैं और पसंदीदा प्रतिक्रिया के लिए वोट करते हैं, जिससे गतिशील एलो-आधारित रैंकिंग (शतरंज में खिलाड़ियों के कौशल स्तर का मूल्यांकन करने के लिए आमतौर पर इस्तेमाल की जाने वाली एक विधि) तैयार होती है।
इस प्रणाली ने एक सार्वजनिक लीडरबोर्ड बनाया जो प्रभावशाली बन गया और जल्द ही हर महीने दस लाख आगंतुकों को आकर्षित करने लगा। ओपनएआई, गूगल और एंथ्रोपिक जैसी प्रमुख एआई प्रयोगशालाएँ इस प्लेटफ़ॉर्म का उपयोग करती हैं, कभी-कभी इसे अप्रकाशित मॉडलों के परीक्षण स्थल के रूप में भी इस्तेमाल करती हैं। एंजेलोपोलोस ने कहा कि अंतर्निहित दृष्टिकोण अपरिवर्तित है: “हमारा दृष्टिकोण यह है कि यह एक ऐसा स्थान बना रहेगा जहाँ इंटरनेट पर हर कोई आकर चैट कर सके और एआई का उपयोग कर सके, विभिन्न प्रदाताओं की तुलना कर सके, इत्यादि।”
यह परियोजना शुरू में विश्वविद्यालय अनुदानों और गूगल के कागल प्लेटफ़ॉर्म, वेंचर कैपिटल फर्म आंद्रेसेन होरोविट्ज़ और एआई इंफ्रास्ट्रक्चर कंपनी टुगेदर एआई सहित संगठनों से प्राप्त दान से संचालित हुई।
पैमाने और जाँच-पड़ताल पर ध्यान
एरिना इंटेलिजेंस इंक. का गठन ऐसे समय में हुआ है जब यह प्लेटफ़ॉर्म अपनी लोकप्रियता की परिचालन संबंधी ज़रूरतों से जूझ रहा है। टीम ने कहा कि “एक कंपनी बनने से हमें LMArena को आज की तुलना में काफ़ी बेहतर बनाने के संसाधन मिलेंगे।”
इसके साथ ही, beta.lmarena.ai पर एक नई बीटा वेबसाइट लॉन्च की गई है, जिसे घोषणा के अनुसार, गति बढ़ाने, मोबाइल अनुभव को बेहतर बनाने और समुदाय के इनपुट के आधार पर स्पष्ट वोटिंग विकल्प प्रदान करने के लिए पुनर्निर्मित किया गया है। भविष्य के प्लेटफ़ॉर्म अपग्रेड में उपयोगकर्ता खाते, चैट इतिहास सहेजना और व्यक्तिगत लीडरबोर्ड बनाना शामिल होगा।
यह संगठनात्मक बदलाव प्लेटफ़ॉर्म की कार्यप्रणाली और संभावित पूर्वाग्रहों, और इसके तरीकों और वित्तपोषण के संबंध में मौजूदा जाँच-पड़ताल के बीच चल रही चर्चा के बीच भी हो रहा है। पिछली आलोचनाएँ उपयोगकर्ता वोटों की व्यक्तिपरकता (शैलीगत प्राथमिकताओं और एआई त्रुटियों का पता लगाने की विविध क्षमताओं से प्रभावित), उपयोगकर्ता आधार के आम जनता से दूर होने की संभावित जनसांख्यिकीय प्रवृत्ति, और संपूर्ण डेटासेट के संबंध में पारदर्शिता पर केंद्रित थीं।
इसके पिछले वित्तपोषण ढांचे और वाणिज्यिक एपीआई-आधारित मॉडल बनाम स्थिर ओपन-सोर्स मॉडल के प्लेटफ़ॉर्म के साथ परस्पर क्रिया के विभिन्न तरीकों से भी निष्पक्षता पर सवाल उठे।
दायरे का विस्तार करते हुए तटस्थता का संकल्प
LMArena टीम ने अपनी घोषणा में निष्पक्षता के महत्वपूर्ण मुद्दे को सीधे संबोधित किया, निष्पक्ष मूल्यांकन के प्रति प्रतिबद्धता पर ज़ोर दिया: “हमारा लीडरबोर्ड कभी भी किसी प्रदाता के प्रति (या उसके विरुद्ध) पक्षपाती नहीं होगा, और डिज़ाइन द्वारा हमारे समुदाय की प्राथमिकताओं को ईमानदारी से प्रतिबिंबित करेगा। यह विज्ञान-संचालित होगा।” उन्होंने अपने इस विश्वास पर ज़ोर दिया कि सभी उपयोगकर्ताओं और डेवलपर्स के लिए एआई को ज़िम्मेदारी से आगे बढ़ाने के लिए वास्तविक, वास्तविक दुनिया की मानवीय प्राथमिकताओं को समझना महत्वपूर्ण है।
मुख्य चैटबॉट रैंकिंग को और बेहतर बनाने के अलावा, LMArena अपनी मूल्यांकन गतिविधियों का व्यापक विस्तार करने की योजना बना रहा है। इस रोडमैप में खुले शोध के लिए समर्थन को मज़बूत करना और अधिक विशिष्ट परीक्षण वातावरण शुरू करना शामिल है। कंपनी की वेबसाइट पर पहले से ही WebDev Arena, RepoChat Arena और Search Arena जैसी सक्रिय परियोजनाएँ सूचीबद्ध हैं, साथ ही भविष्य में विज़न मॉडल, AI एजेंट और AI रेड-टीमिंग अभ्यासों को समर्पित एरेना की योजनाएँ भी हैं।
वित्त पोषण और भविष्य के संचालन
हालांकि एरिना इंटेलिजेंस इंक. अपने विकास और प्लेटफ़ॉर्म विकास के लिए उद्यम पूंजी जुटाने का इरादा रखता है, लेकिन संभावित निवेशकों या वित्तपोषण लक्ष्यों के बारे में विशिष्ट जानकारी साझा नहीं की गई है। कंपनी अभी भी अपने दीर्घकालिक व्यावसायिक मॉडल का निर्धारण कर रही है। स्टोइका द्वारा ब्लूमबर्ग को बताई गई एक संभावना यह हो सकती है कि प्लेटफ़ॉर्म पर अपने मॉडलों के मूल्यांकन के लिए कंपनियों से शुल्क लिया जाए। प्लेटफ़ॉर्म की तटस्थता और वैज्ञानिक विश्वसनीयता को दृढ़ता से बनाए रखते हुए, वित्तपोषण प्राप्त करने और संभावित रूप से राजस्व स्रोतों को शुरू करने के मार्ग पर सफलतापूर्वक आगे बढ़ना, LMArena के अपने शैक्षणिक मूल से एक स्थायी व्यावसायिक इकाई में परिवर्तन के लिए महत्वपूर्ण होगा।
स्रोत: Winbuzzer / Digpu NewsTex