OpenAI ফ্লেক্স প্রসেসিং চালু করেছে, যা একটি স্বতন্ত্র API পরিষেবা স্তর যা ডেভেলপারদের জন্য কোম্পানির o3 এবং o4-মিনি রিজনিং মডেলগুলি ব্যবহার করার জন্য আরও সাশ্রয়ী উপায় খুঁজছে। আনুষ্ঠানিকভাবে 17 এপ্রিল, 2025-এ ঘোষণা করা হয়েছিল এবং বর্তমানে বিটাতে উপলব্ধ, এই বিকল্পটি স্ট্যান্ডার্ড API হারের তুলনায় প্রতি-টোকেন খরচ উল্লেখযোগ্যভাবে হ্রাস করে, উন্নত AI কে নির্দিষ্ট অ্যাপ্লিকেশনের জন্য সম্ভাব্যভাবে আরও অ্যাক্সেসযোগ্য করে তোলে, যদিও এটি কর্মক্ষমতা ট্রেড-অফের সাথে আসে।
এই নতুন স্তরটি বিশেষভাবে এমন কাজগুলিকে লক্ষ্য করে যেখানে তাৎক্ষণিক ফলাফল প্রাথমিক উদ্বেগ নয়। ফ্লেক্স প্রক্রিয়াকরণ ডকুমেন্টেশন আদর্শ প্রার্থী হিসাবে “মডেল মূল্যায়ন, ডেটা সমৃদ্ধকরণ এবং অ্যাসিঙ্ক্রোনাস ওয়ার্কলোড” এর মতো কেসগুলি ব্যবহার করার দিকে নির্দেশ করে। এটি নিম্ন-অগ্রাধিকার বা অ-উৎপাদন কাজের জন্য একটি সমাধান হিসাবে উপস্থাপিত হয় যেখানে খরচ সাশ্রয় গতির প্রয়োজনের চেয়ে বেশি।
ফ্লেক্স বনাম স্ট্যান্ডার্ড মূল্য নির্ধারণের তুলনা
ফ্লেক্স প্রক্রিয়াকরণ প্রোগ্রামগতভাবে এই মডেলগুলির সাথে ইন্টারঅ্যাক্ট করার খরচ অর্ধেকে কমিয়ে দেয়। o3 মডেলের জন্য, Flex ব্যবহারকারী ডেভেলপারদের প্রতি মিলিয়ন ইনপুট টোকেনের জন্য $5 এবং প্রতি মিলিয়ন আউটপুট টোকেনের জন্য $20 দিতে হবে, যা যথাক্রমে $10 এবং $40 এর স্ট্যান্ডার্ড হার থেকে উল্লেখযোগ্যভাবে কম।
o4-মিনি মডেলটি একইভাবে 50% হ্রাস পাবে, যার দাম Flex এর অধীনে প্রতি মিলিয়ন ইনপুট টোকেনের জন্য $0.55 এবং প্রতি মিলিয়ন আউটপুট টোকেনের জন্য $2.20, স্বাভাবিক $1.10 এবং $4.40 এর তুলনায়। এই মূল্য কাঠামোটি Flex কে OpenAI এর Batch API এর জন্য ইতিমধ্যে প্রতিষ্ঠিত হারের সাথে সামঞ্জস্যপূর্ণ করে, যা অ-রিয়েল-টাইম প্রক্রিয়াকরণ কাজের জন্য একটি পূর্বাভাসযোগ্য খরচ কাঠামো প্রদান করে।
পারফরম্যান্স ট্রেড-অফ বোঝা
উল্লেখযোগ্য খরচ সাশ্রয়ের জন্য ডেভেলপারদের নির্দিষ্ট সীমাবদ্ধতা মেনে নিতে হবে। Flex প্রক্রিয়াকরণ একটি নিম্ন-অগ্রাধিকার গণনা সারিতে কাজ করে, যার অর্থ API প্রতিক্রিয়াগুলি স্বাভাবিকভাবেই স্ট্যান্ডার্ড স্তরের মাধ্যমে করা অনুরোধের চেয়ে বেশি সময় নেবে।
অধিকন্তু, OpenAI স্পষ্টভাবে “মাঝে মাঝে রিসোর্স অনুপলব্ধতা” সম্পর্কে সতর্ক করে। যদি ফ্লেক্স অনুরোধ আসার সময় সিস্টেমে পর্যাপ্ত ক্ষমতার অভাব থাকে, তাহলে এটি একটি 429 HTTP ত্রুটি কোড ফেরত দেবে। গুরুত্বপূর্ণভাবে, OpenAI নিশ্চিত করেছে যে এই নির্দিষ্ট ত্রুটির সাথে ব্যর্থ হওয়া অনুরোধগুলির জন্য ডেভেলপারদের কাছ থেকে কোনও চার্জ নেওয়া হবে না।
এই শর্তগুলি মোকাবেলা করার জন্য, OpenAI ডেভেলপারদের উপযুক্ত ত্রুটি পরিচালনা বাস্তবায়নের পরামর্শ দেয়। বিলম্ব সহনশীল অ্যাপ্লিকেশনগুলির জন্য, বিরতির পরে অনুরোধটি পুনরায় চেষ্টা করার পরামর্শ দেওয়া হয় – সম্ভাব্যভাবে সূচকীয় ব্যাকঅফ লজিক ব্যবহার করে -। যদি সময়মত সমাপ্তির প্রয়োজন হয়, তবে স্ট্যান্ডার্ড API স্তরে ফিরে যাওয়া একটি বিকল্প থেকে যায়।
ডেভেলপারদের তাদের অ্যাপ্লিকেশন লজিকে ধীর প্রতিক্রিয়া সময় অনুমান করতে হবে; OpenAI এর অফিসিয়াল SDK গুলিতে ডিফল্ট 10-মিনিটের সময়সীমা অপর্যাপ্ত হতে পারে এবং কোম্পানি Flex অনুরোধের জন্য এই সময়সীমা সম্ভবত 15 মিনিটে বাড়ানোর পরামর্শ দেয়। এই পরিষেবাটি সক্রিয় করতে, ডেভেলপারদের তাদের API কলের মধ্যে `service_tier=”flex”` প্যারামিটার নির্দিষ্ট করতে হবে।
প্রসঙ্গ: o3/o4-mini মডেল এবং বাজার গতিবিদ্যা
এই নতুন মূল্য স্তরটি বিশেষভাবে OpenAI-এর কয়েকদিন আগে, ১৬ এপ্রিল, ২০২৫ তারিখে চালু হওয়া মডেলগুলির ক্ষেত্রে প্রযোজ্য। o3 এবং o4-মিনি মডেলগুলি নিজেরাই ক্ষমতার বিকাশের প্রতিনিধিত্ব করে, যা উন্নত যুক্তির সাথে প্রবর্তিত হয় এবং যাকে OpenAI “প্রাথমিক এজেন্টিক আচরণ” বলে অভিহিত করে।
এর অর্থ হল গ্রাহকদের জন্য ইন্টারেক্টিভ ChatGPT পরিবেশের মধ্যে, এই মডেলগুলি “এখন স্বাধীনভাবে সিদ্ধান্ত নিতে পারে যে কোন সরঞ্জামগুলি ব্যবহার করতে হবে এবং কখন, ব্যবহারকারীর অনুরোধ ছাড়াই,” ওয়েব ব্রাউজিং বা কোড সম্পাদনের মতো ক্ষমতাগুলি স্বায়ত্তশাসিতভাবে নির্বাচন করতে পারে। ফ্লেক্স প্রক্রিয়াকরণ ডেভেলপারদের API-এর মাধ্যমে এই মডেলগুলির শক্তি ব্যবহার করার জন্য একটি ভিন্ন, আরও সাশ্রয়ী মূল্যের পথ অফার করে, ব্যাকএন্ড কাজের জন্য উপযুক্ত যেখানে খরচ একটি প্রাথমিক চালিকাশক্তি।
মডেল প্রকাশের দ্রুত উত্তরাধিকার এবং এই নতুন মূল্য স্তরটি একটি প্রতিযোগিতামূলক পরিবেশের মধ্যে আসে যেখানে অত্যাধুনিক AI মডেল ব্যবহারের খরচ একটি প্রধান বিবেচ্য বিষয়, এবং Google-এর মতো প্রতিদ্বন্দ্বীরা Gemini 2.5 Flash-এর মতো দক্ষ মডেলগুলিকে প্রচার করছে।
ডেভেলপারদের খরচ বনাম পারফরম্যান্সের উপর আরও সূক্ষ্ম নিয়ন্ত্রণ প্রদানের জন্য ফ্লেক্সকে OpenAI-এর পদক্ষেপ বলে মনে হচ্ছে। এই লঞ্চটি OpenAI-এর অন্যান্য সাম্প্রতিক ডেভেলপার-কেন্দ্রিক রিলিজগুলিকেও অনুসরণ করে, যেমন ওপেন-সোর্স কোডেক্স CLI টুল, যা o3 এবং o4-মিনি মডেলগুলিকেও কাজে লাগাতে পারে।
API অ্যাক্সেসের প্রয়োজনীয়তা
API-এর মাধ্যমে এই নতুন মডেলগুলিতে প্রোগ্রাম্যাটিক অ্যাক্সেস ডেভেলপার ব্যবহারের স্তরের উপর ভিত্তি করে কিছু শর্ত সাপেক্ষে। যদিও o4-মিনি একাধিক স্তরে (1-5) বিস্তৃতভাবে উপলব্ধ, আরও শক্তিশালী o3 মডেলের জন্য সাধারণত ডেভেলপারদের উচ্চতর ব্যয় স্তরে (4 বা 5) থাকা প্রয়োজন।
যাইহোক, OpenAI নিম্ন স্তরের (1-3) ব্যবহারকারীদের o3-তে API অ্যাক্সেস পেতে দেয়, যার মধ্যে যুক্তি সারাংশ এবং স্ট্রিমিং সমর্থনের মতো সম্পর্কিত ক্ষমতা অন্তর্ভুক্ত। এটি দায়িত্বশীল প্ল্যাটফর্ম ব্যবহার নিশ্চিত করার লক্ষ্যে OpenAI-এর বর্ণিত নীতিগুলির সাথে সামঞ্জস্যপূর্ণ।
সূত্র: Winbuzzer / Digpu NewsTex