நிறுவனத்தின் o3 மற்றும் o4-மினி பகுத்தறிவு மாதிரிகளைப் பயன்படுத்துவதற்கு மிகவும் சிக்கனமான வழிகளைத் தேடும் டெவலப்பர்களை இலக்காகக் கொண்ட ஒரு தனித்துவமான API சேவை அடுக்கான Flex செயலாக்கத்தை OpenAI அறிமுகப்படுத்தியுள்ளது. ஏப்ரல் 17, 2025 அன்று அதிகாரப்பூர்வமாக அறிவிக்கப்பட்டது, தற்போது பீட்டாவில் கிடைக்கிறது, இந்த விருப்பம் நிலையான API விகிதங்களுடன் ஒப்பிடும்போது டோக்கன் செலவுகளைக் கணிசமாகக் குறைக்கிறது, மேம்பட்ட AI சில பயன்பாடுகளுக்கு மிகவும் அணுகக்கூடியதாக ஆக்குகிறது, இருப்பினும் இது செயல்திறன் பரிமாற்றங்களுடன் வருகிறது.
இந்த புதிய அடுக்கு குறிப்பாக உடனடி முடிவுகள் முதன்மை கவலையாக இல்லாத பணிகளை குறிவைக்கிறது. ஃப்ளெக்ஸ் செயலாக்க ஆவணங்கள் “மாதிரி மதிப்பீடுகள், தரவு செறிவூட்டல் மற்றும் ஒத்திசைவற்ற பணிச்சுமைகள்” போன்ற நிகழ்வுகளை சிறந்த வேட்பாளர்களாகப் பயன்படுத்துவதை சுட்டிக்காட்டுகின்றன. வேகத்திற்கான தேவையை விட செலவு சேமிப்பு அதிகமாக இருக்கும் குறைந்த முன்னுரிமை அல்லது உற்பத்தி அல்லாத வேலைகளுக்கான தீர்வாக இது வழங்கப்படுகிறது.
ஃப்ளெக்ஸ் vs. நிலையான விலை நிர்ணயம்
ஃப்ளெக்ஸ் செயலாக்கம் இந்த மாதிரிகளுடன் நிரல் ரீதியாக தொடர்புகொள்வதற்கான செலவை சரியாக பாதியாகக் குறைக்கிறது. o3 மாடலைப் பொறுத்தவரை, ஃப்ளெக்ஸைப் பயன்படுத்தும் டெவலப்பர்கள் ஒரு மில்லியன் உள்ளீட்டு டோக்கன்களுக்கு $5 மற்றும் ஒரு மில்லியன் வெளியீட்டு டோக்கன்களுக்கு $20 செலுத்துவார்கள், இது முறையே $10 மற்றும் $40 என்ற நிலையான விகிதங்களிலிருந்து கூர்மையான குறைவு.
o4-மினி மாடல் இதேபோன்ற 50% குறைப்பைக் காண்கிறது, இது ஃப்ளெக்ஸின் கீழ் ஒரு மில்லியன் உள்ளீட்டு டோக்கன்களுக்கு $0.55 மற்றும் ஒரு மில்லியன் வெளியீட்டு டோக்கன்களுக்கு $2.20 என விலை நிர்ணயம் செய்யப்பட்டுள்ளது, இது சாதாரண $1.10 மற்றும் $4.40 உடன் ஒப்பிடும்போது. இந்த விலை நிர்ணய அமைப்பு ஃப்ளெக்ஸை OpenAI இன் பேட்ச் API க்காக ஏற்கனவே நிறுவப்பட்ட விகிதங்களுடன் சீரமைக்கிறது, இது நிகழ்நேர செயலாக்கப் பணிகளுக்கு ஒரு கணிக்கக்கூடிய செலவு கட்டமைப்பை வழங்குகிறது.
செயல்திறன் வர்த்தக-ஆஃப்களைப் புரிந்துகொள்வது
குறிப்பிடத்தக்க செலவு சேமிப்பு டெவலப்பர்கள் சில வரம்புகளை ஏற்க வேண்டும். ஃப்ளெக்ஸ் செயலாக்கம் குறைந்த முன்னுரிமை கணினி வரிசையில் இயங்குகிறது, அதாவது API பதில்கள் நிலையான அடுக்கு மூலம் செய்யப்படும் கோரிக்கைகளை விட இயல்பாகவே அதிக நேரம் எடுக்கும்.
மேலும், Flex கோரிக்கை வரும்போது கணினியில் போதுமான திறன் இல்லாவிட்டால், அது 429 HTTP பிழைக் குறியீட்டை வழங்கும் என்று OpenAI வெளிப்படையாக எச்சரிக்கிறது. முக்கியமாக, இந்த குறிப்பிட்ட பிழையுடன் தோல்வியடையும் கோரிக்கைகளுக்கு டெவலப்பர்களிடம் கட்டணம் வசூலிக்கப்படாது என்பதை OpenAI உறுதிப்படுத்தியுள்ளது.
இந்த நிலைமைகளைக் கையாள, டெவலப்பர்கள் பொருத்தமான பிழை கையாளுதலை செயல்படுத்துமாறு OpenAI பரிந்துரைக்கிறது. தாமதங்களை பொறுத்துக்கொள்ளும் பயன்பாடுகளுக்கு, இடைநிறுத்தத்திற்குப் பிறகு கோரிக்கையை மீண்டும் முயற்சிப்பது – சாத்தியமான அதிவேக பேக்ஆஃப் லாஜிக்கைப் பயன்படுத்துவது – பரிந்துரைக்கப்படுகிறது. சரியான நேரத்தில் நிறைவு செய்வது அவசியமானால், நிலையான API அடுக்குக்குத் திரும்புவது ஒரு விருப்பமாகவே உள்ளது.
டெவலப்பர்கள் தங்கள் பயன்பாட்டு தர்க்கத்தில் மெதுவான மறுமொழி நேரங்களையும் எதிர்பார்க்க வேண்டும்; OpenAI இன் அதிகாரப்பூர்வ SDK களில் இயல்புநிலை 10 நிமிட நேர முடிவு போதுமானதாக இருக்காது, மேலும் Flex கோரிக்கைகளுக்கு இந்த நேர முடிவை 15 நிமிடங்களாக அதிகரிக்க நிறுவனம் பரிந்துரைக்கிறது. இந்த சேவையைச் செயல்படுத்த, டெவலப்பர்கள் தங்கள் API அழைப்புகளுக்குள் `service_tier=”flex”` அளவுருவைக் குறிப்பிட வேண்டும்.
Context: o3/o4-mini Models and Market Dynamics
இந்த புதிய விலை நிர்ணய அடுக்கு குறிப்பாக ஏப்ரல் 16, 2025 அன்று சில நாட்களுக்கு முன்பு அறிமுகப்படுத்தப்பட்ட OpenAI மாடல்களுக்கு பொருந்தும். o3 மற்றும் o4-mini மாதிரிகள் தாங்களாகவே திறனில் ஒரு வளர்ச்சியைக் குறிக்கின்றன, மேம்படுத்தப்பட்ட பகுத்தறிவு மற்றும் OpenAI “ஆரம்பகால முகவர் நடத்தை” என்று அழைத்ததுடன் அறிமுகப்படுத்தப்பட்டது.
இதன் பொருள் சந்தாதாரர்களுக்கான ஊடாடும் ChatGPT சூழலுக்குள், இந்த மாதிரிகள் “பயனர் தூண்டுதல் இல்லாமல் எந்த கருவிகளைப் பயன்படுத்த வேண்டும், எப்போது பயன்படுத்த வேண்டும் என்பதை இப்போது சுயாதீனமாக தீர்மானிக்க முடியும்,” வலை உலாவல் அல்லது குறியீடு செயல்படுத்தல் போன்ற தன்னியக்கமாக திறன்களைத் தேர்ந்தெடுக்கின்றன. ஃப்ளெக்ஸ் செயலாக்கம் டெவலப்பர்கள் API வழியாக இந்த மாதிரிகளின் சக்தியைப் பயன்படுத்துவதற்கான வேறுபட்ட, மிகவும் மலிவு பாதையை வழங்குகிறது, இது செலவு ஒரு முதன்மை இயக்கியாக இருக்கும் பின்தளப் பணிகளுக்கு ஏற்றது.
மாடல் வெளியீட்டின் விரைவான தொடர்ச்சி மற்றும் இந்த புதிய விலை நிர்ணய அடுக்கு, அதிநவீன AI மாதிரிகளைப் பயன்படுத்துவதற்கான செலவு ஒரு முக்கிய பரிசீலனையாகும், மேலும் கூகிள் போன்ற போட்டியாளர்கள் ஜெமினி 2.5 ஃப்ளாஷ் போன்ற திறமையான மாதிரிகளை விளம்பரப்படுத்துகின்றனர்.
செலவு மற்றும் செயல்திறன் மீது டெவலப்பர்களுக்கு அதிக நுணுக்கமான கட்டுப்பாட்டை வழங்குவதற்கான OpenAI-யின் நடவடிக்கையாக Flex தோன்றுகிறது. இந்த வெளியீடு OpenAI-இன் பிற சமீபத்திய டெவலப்பர்-மையப்படுத்தப்பட்ட வெளியீடுகளையும் பின்பற்றுகிறது, அதாவது o3 மற்றும் o4-மினி மாடல்களையும் பயன்படுத்தக்கூடிய ஓப்பன்-சோர்ஸ் கோடெக்ஸ் CLI கருவி.
API அணுகல் தேவைகள்
API மூலம் இந்த புதிய மாடல்களுக்கான நிரல் அணுகல் டெவலப்பர் பயன்பாட்டு அடுக்குகளின் அடிப்படையில் சில நிபந்தனைகளுக்கு உட்பட்டது. o4-mini பல அடுக்குகளில் (1-5) பரவலாகக் கிடைக்கும் அதே வேளையில், மிகவும் சக்திவாய்ந்த o3 மாதிரி பொதுவாக டெவலப்பர்கள் அதிக செலவு அடுக்குகளில் (4 அல்லது 5) இருக்க வேண்டும்.
இருப்பினும், OpenAI குறைந்த அடுக்குகளில் (1-3) பயனர்கள் பகுத்தறிவு சுருக்கங்கள் மற்றும் ஸ்ட்ரீமிங் ஆதரவு போன்ற தொடர்புடைய திறன்களை உள்ளடக்கிய o3க்கான API அணுகலைப் பெற அனுமதிக்கிறது. இது பொறுப்பான தள பயன்பாட்டை உறுதி செய்வதை நோக்கமாகக் கொண்ட OpenAI-இன் கூறப்பட்ட கொள்கைகளுடன் ஒத்துப்போகிறது.
மூலம்: Winbuzzer / Digpu NewsTex