গুগল গতকাল তার জেমিনি ২.৫ ফ্ল্যাশ এআই মডেলটিকে পাবলিক প্রিভিউতে ঠেলে দিয়েছে, যার ফলে এটি একাধিক চ্যানেলের মাধ্যমে অ্যাক্সেসযোগ্য হয়েছে: গ্রাহক-মুখী জেমিনি অ্যাপ এবং গুগল এআই স্টুডিও এবং ভার্টেক্স এআই এর মাধ্যমে জেমিনি এপিআই সহ ডেভেলপার প্ল্যাটফর্ম।
গুগলের ঘোষণায় এটির প্রথম “সম্পূর্ণ হাইব্রিড রিজনিং মডেল” হিসাবে বর্ণনা করা হয়েছে, ২.৫ ফ্ল্যাশ অনন্যভাবে ডেভেলপারদের এআই এর “চিন্তাভাবনা” প্রক্রিয়ার উপর স্পষ্ট নিয়ন্ত্রণ প্রদান করে, যার লক্ষ্য উচ্চ-ভলিউম কাজের জন্য কর্মক্ষমতা, খরচ এবং বিলম্বের ভারসাম্য বজায় রাখার জন্য একটি নমনীয় সরঞ্জাম প্রদান করা। গুগল তার কর্মক্ষমতা-থেকে-ব্যয় অনুপাতকে “প্যারেটো সীমান্ত” এ রেখে নির্দিষ্ট কাজের চাপের জন্য সর্বোত্তম ভারসাম্যের পরামর্শ দেয়।
শেষ ব্যবহারকারীদের জন্য, জেমিনি অ্যাপ এবং ওয়েবসাইটে মডেলটি কেবল “২.৫ ফ্ল্যাশ (পরীক্ষামূলক)” হিসাবে প্রদর্শিত হয়, যা জেমিনি ২.০ ফ্ল্যাশ থিঙ্কিং মডেলকে প্রতিস্থাপন করে যা ২০২৪ সালের ডিসেম্বরে পরীক্ষামূলকভাবে প্রকাশিত হয়েছিল এবং কখনও সেই পর্যায় থেকে উত্তীর্ণ হয়নি।
এই 2.5 পুনরাবৃত্তিটি 2.0 ফ্ল্যাশ জেনারেশনের তুলনায় উল্লেখযোগ্যভাবে উন্নত যুক্তি ক্ষমতা প্রদান করে বলে বর্ণনা করা হয়েছে, যদিও মার্চ মাসে ঘোষিত হাই-এন্ড জেমিনি 2.5 প্রো-এর তুলনায় দ্রুত এবং সস্তা হওয়ার জন্য ডিজাইন করা হয়েছে। গ্রাহক অ্যাপ সংস্করণটি বর্তমানে কোড এবং টেক্সট সংশোধনের জন্য গুগলের ক্যানভাসের মতো বৈশিষ্ট্যগুলিকে সমর্থন করে, যদিও গুগল ইঙ্গিত দিয়েছে যে ডিপ রিসার্চ সমর্থন পরে অনুসরণ করবে।
এআই রিজনিং এবং খরচের জন্য ডেভেলপার লিভার
জেমিনি 2.5 ফ্ল্যাশের সংজ্ঞায়িত বৈশিষ্ট্য হল এর হাইব্রিড যুক্তি সিস্টেম, যা জেমিনি API এর মাধ্যমে নিয়ন্ত্রণযোগ্য। ডেভেলপাররা সর্বাধিক গতির জন্য “চিন্তাভাবনা” প্রক্রিয়াটি সম্পূর্ণরূপে বন্ধ করতে পারেন বা জটিল প্রশ্নের জন্য এটি সক্ষম করতে পারেন। আরও গ্র্যানুলারিটি সামঞ্জস্যযোগ্য “চিন্তাভাবনা বাজেট” এর মাধ্যমে আসে, মূলত প্রতি প্রশ্নের যুক্তির জন্য ব্যবহৃত গণনামূলক টোকেনের উপর একটি সীমা।
এই প্রক্রিয়াটির লক্ষ্য হল ডেভেলপারদের কম-বিলম্বিত চ্যাটবট থেকে বিশ্লেষণাত্মক কাজ পর্যন্ত বিভিন্ন চাহিদা জুড়ে অপ্টিমাইজ করতে সহায়তা করা। নিয়ন্ত্রণের এই স্তর প্রতিক্রিয়ার গুণমান, লেটেন্সি এবং পরিচালনাগত খরচের মধ্যে ট্রেড-অফের সুনির্দিষ্ট ব্যবস্থাপনার অনুমতি দেয়।
এই অভিযোজনযোগ্যতা প্রিভিউ API মূল্যের ক্ষেত্রে প্রতি মিলিয়ন ইনপুট টোকেনের ক্ষেত্রে প্রতি মিলিয়ন টোকেনের জন্য $0.15 প্রতি মিলিয়ন টোকেনের জন্য $0.60। চিন্তাভাবনা অক্ষম থাকা অবস্থায় আউটপুট খরচ $3.50 হয়, যখন যুক্তি সক্রিয় থাকে তখন প্রতি মিলিয়ন টোকেনের জন্য $3.50 হয়। Google এই অ-যুক্তিসঙ্গত খরচ কাঠামোকে OpenAI-এর o4-mini-এর মতো মডেলগুলির বিরুদ্ধে প্রতিযোগিতামূলকভাবে অবস্থান করে, যদিও o4-mini উচ্চ মূল্যের বিন্দুতে উচ্চতর কর্মক্ষমতা মানদণ্ড প্রদর্শন করে।
মূল্য কাঠামোটি উচ্চ-ভলিউম, খরচ-সংবেদনশীল ব্যবহারের জন্য ফ্ল্যাশের উপযুক্ততাকে শক্তিশালী করে যেমন সারসংক্ষেপ, চ্যাট অ্যাপ, ক্যাপশনিং এবং ডেটা নিষ্কাশন, উদাহরণগুলি Google-এর ডেভেলপার ব্লগ দ্বারা হাইলাইট করা হয়েছে।
জেমিনি পরিবারে ফ্ল্যাশের অবস্থান এবং এর বিবর্তন
জেমিনি 2.5 ফ্ল্যাশ প্রথম 9 এপ্রিল প্রকাশ্যে আলোচনা করা হয়েছিল, 2.5 প্রো-এর জটিল যুক্তি ক্ষমতা থেকে আলাদা একটি মডেল হিসাবে প্রবর্তিত হয়েছিল। ফ্ল্যাশের গতির উপর জোর দেওয়া সত্ত্বেও, এটি প্রো লাইনের বৃহৎ ১ মিলিয়ন টোকেন কনটেক্সট উইন্ডো বৈশিষ্ট্য ধরে রেখেছে, যা এটিকে বিস্তৃত ইনপুট পরিচালনা করতে সক্ষম করে।
অন্তর্নিহিত “চিন্তাভাবনা” ধারণাটি নিজেই ২০২৪ সালের ডিসেম্বরে পরীক্ষামূলক জেমিনি ২.০ ফ্ল্যাশ থিংকিং মডেল থেকে উদ্ভূত হয়েছিল। সেই পূর্ববর্তী পুনরাবৃত্তির লক্ষ্য ছিল যুক্তির স্বচ্ছতা প্রদান করা, আংশিকভাবে OpenAI এর o1 মডেলের প্রতিক্রিয়া হিসাবে। সেই পরীক্ষা সম্পর্কে, গুগল ডিপমাইন্ডের প্রধান বিজ্ঞানী জেফ ডিন X-এ বলেছেন, “২.০ ফ্ল্যাশের গতি এবং কর্মক্ষমতার উপর নির্মিত, এই মডেলটি তার যুক্তিকে শক্তিশালী করার জন্য চিন্তাভাবনা ব্যবহার করার জন্য প্রশিক্ষিত। এবং যখন আমরা ইনফারেন্স টাইম গণনা বৃদ্ধি করি তখন আমরা আশাব্যঞ্জক ফলাফল দেখতে পাই।”
জেমিনি ২.০ ফ্ল্যাশ থিংকিংকে কার্যকর দেখতে চান? এই ডেমোটি দেখুন যেখানে মডেলটি একটি পদার্থবিদ্যার সমস্যা সমাধান করে এবং এর যুক্তি ব্যাখ্যা করে। pic.twitter.com/Nl0hYj7ZFS
— জেফ ডিন (@JeffDean) ১৯ ডিসেম্বর, ২০২৪
যদিও “চিন্তাভাবনা” দেখানো স্পষ্ট ইন্টারফেস ২.৫ ফ্ল্যাশের অংশ নয়, API এর মাধ্যমে নিয়ন্ত্রণযোগ্য যুক্তি এই ধারণার কার্যকরী বিবর্তনের প্রতিনিধিত্ব করে।
পরীক্ষার মধ্যে একটি বিস্তৃত জেমিনি সম্প্রসারণের অংশ
২.৫ ফ্ল্যাশের রোলআউট গুগলের বিস্তৃত, AI এর ত্বরান্বিত স্থাপনার সাথে খাপ খায়, জেমিনি অ্যাডভান্সডের ভিও ২ ভিডিও জেনারেশন এবং গুগল ওয়ার্কস্পেসে অসংখ্য জেমিনি ইন্টিগ্রেশনের মতো সাম্প্রতিক সংযোজনগুলিতে যোগদান করে।
গুগল ডেভেলপারদের প্রতিক্রিয়ার উপর ভিত্তি করে মডেলের “গতিশীল চিন্তাভাবনা” পরিমার্জন করার জন্য এই প্রিভিউ পর্বটি কাজে লাগানোর লক্ষ্য রাখে, বিশেষ করে দোশি যেমন উল্লেখ করেছেন “যেখানে এটি কম চিন্তা করে বা অতিরিক্ত চিন্তা করে,”। পার্থক্যটি রয়ে গেছে যে ডেভেলপাররা গ্রানুলার API নিয়ন্ত্রণ পায়, যখন বর্তমান গ্রাহক অ্যাপটি ফ্ল্যাশকে একক পরীক্ষামূলক পছন্দ হিসেবে অফার করে, সম্ভবত ডিফল্টরূপে যুক্তি সক্ষম করে।
যাইহোক, যেমন উল্লেখ করা হয়েছে যে 2.5 ফ্ল্যাশ প্রথম ঘোষণা করার সময়, এই পাবলিক প্রিভিউটি বিস্তারিত প্রযুক্তিগত বা সুরক্ষা প্রতিবেদনের সাথে আসে না। স্বচ্ছতার এই অভাব সাম্প্রতিক কিছু AI রিলিজের সাথে দেখা একটি প্যাটার্ন অব্যাহত রেখেছে, বিশেষ করে মডেলগুলিকে ব্যাপকভাবে উপলব্ধ করার ক্ষেত্রে, যা তদন্তকে আকর্ষণ করে। যদিও Google ভবিষ্যতের উন্নয়নের পরিকল্পনা করছে যেমন অন-প্রিমিসেস প্রাপ্যতা এবং নতুন TPU ব্যবহার করা, তাৎক্ষণিক পদক্ষেপের মধ্যে রয়েছে 2.5 ফ্ল্যাশকে একটি সম্ভাব্য সাধারণ রিলিজের দিকে পরিচালিত করার জন্য বাস্তব-বিশ্বের ডেটা সংগ্রহ করা।
সূত্র: Winbuzzer / Digpu NewsTex