যদিও OpenAI ChatGPT-এর ক্ষমতা বৃদ্ধি করে চলেছে, ব্যবহারকারীর অভিজ্ঞতা সেশন স্থিতিশীলতা, মেমোরি ধরে রাখা এবং কর্মক্ষমতা সহ স্থায়ী চ্যালেঞ্জগুলিকে তুলে ধরে, বিশেষ করে জটিল, ডকুমেন্ট-ভারী কর্মপ্রবাহের সময়।
২০২৫ সালের এপ্রিলের মাঝামাঝি সময়ে GitHub-এ প্রকাশিত একটি বিস্তারিত কেস স্টাডি ব্যবহারকারী `sks38317` দ্বারা, যাকে ১৮ বছর বয়সী দক্ষিণ কোরিয়ার একজন ছাত্র হিসেবে চিহ্নিত করা হয়েছিল, এই সমস্যাগুলির একটি বিস্তৃত রূপরেখা প্রদান করে। লেখক দ্বারা বর্ণিত এই সংগ্রহস্থলটি “ক্যাশে ব্যর্থতা এবং মেমোরি ওয়ার্কারাউন্ড কেস স্টাডি ব্যবহার করে GPT-4o (কোরিয়ার একজন ১৮ বছর বয়সী ছাত্র দ্বারা রচিত),” OpenAI-এর পরবর্তী মেমোরি বর্ধনগুলি যে বাস্তব চ্যালেঞ্জগুলি মোকাবেলা করার লক্ষ্যে রয়েছে তার উপর আলোকপাত করে।
ব্যবহারকারী-নথিভুক্ত ব্যর্থতা এবং কর্মক্ষমতা মেট্রিক্স
`sks38317` সংগ্রহস্থলটি GPT-4o ব্যবহার করার সময় পরিলক্ষিত বেশ কয়েকটি গুরুত্বপূর্ণ অপারেশনাল ব্যর্থতার রূপরেখা দেয়। ব্যবহারকারীর বিস্তারিত প্রতিবেদন অনুসারে, ChatGPT ক্রমাগত PDF রেন্ডারিং ব্যর্থতাকে সফল অপারেশন হিসেবে ভুল ব্যাখ্যা করেছে। এর ফলে সিস্টেমের ক্যাশে ত্রুটিপূর্ণ প্রতিক্রিয়া সংরক্ষণ করা হয়েছে বলে জানা গেছে, যা পরবর্তীতে ভাঙা ক্যাশে এন্ট্রিগুলি পুনরায় ব্যবহার করার চেষ্টা করার সময় পুনরাবৃত্তিমূলক, অনুৎপাদনশীল লুপগুলিকে ট্রিগার করে।
নথিভুক্ত আরও সমস্যাগুলির মধ্যে রয়েছে সেশনের প্রেক্ষাপটে একাধিক সম্পাদিত ডকুমেন্ট সংস্করণের অপ্রয়োজনীয় স্টোরেজ, বিষয়বস্তু দ্বন্দ্ব তৈরি করা এবং লক্ষণীয় প্রতিক্রিয়া বিলম্ব এবং সেশনের ধীরগতি, যা ব্যবহারকারী ক্যাশে ওভারলোডের জন্য দায়ী করেছেন।
শিক্ষার্থী স্ব-পরিকল্পিত সমাধানের চেষ্টা করার আগে প্রভাবের পরিমাপ করেছে: PDF লুপগুলি প্রতি ঘন্টায় চারবারের বেশি ঘটে, যার জন্য 4-6 বার পুনরায় চেষ্টা করার প্রয়োজন হয়; অপ্রয়োজনীয় নথি প্রতি সেশনে গড়ে পাঁচ থেকে ছয়টি; আনুমানিক ক্যাশে টোকেন লোড 17,000 থেকে 18,500 টোকেনের মধ্যে বেড়ে যায়; এবং অপ্রয়োজনীয় বাক্যাংশগুলি এই ক্যাশের প্রায় 22% গঠন করে।
এই কর্মপ্রবাহের ব্যাঘাতের মুখোমুখি হয়ে – ব্যবহারকারী উল্লেখ করেছেন যে, “একটি নতুন সেশন শুরু করলে কথোপকথনের ইতিহাস মুছে যায়, যা ডকুমেন্টে কাজ করার সময় আমার কর্মপ্রবাহকে মারাত্মকভাবে ব্যাহত করে” – তারা ব্যর্থ আউটপুটগুলি স্বয়ংক্রিয়ভাবে মুছে ফেলার এবং রিডানডেন্সি ছাঁটাই করার জন্য সেশন বিশ্লেষণ এবং লজিক সার্কিট সহ একটি ম্যানুয়াল সমাধান বাস্তবায়ন করেছে।
এই হস্তক্ষেপের ফলে উল্লেখযোগ্য উন্নতি হয়েছে বলে জানা গেছে: PDF লুপের ফ্রিকোয়েন্সি অর্ধেক (-৫০%), পুনরায় চেষ্টার ফ্রিকোয়েন্সি প্রায় ৬৬% (≤২ ঘটনা) কমেছে, অপ্রয়োজনীয় নথির সংখ্যা ৫০-৬০% (≤৩) কমেছে, ক্যাশে টোকেন লোড ১৩.৭% (১৪,২০০ টোকেনের নিচে) কমেছে, অপ্রয়োজনীয় বাক্যাংশের হার ৭% এর নিচে নেমে এসেছে এবং প্রতিক্রিয়া বিলম্ব দূর করা হয়েছে।
ব্যবহারকারী পরামর্শ দিয়েছেন যে OpenAI-এর উচিত “ব্যবহারকারীদের সমস্ত পুরানো সংস্করণ স্বয়ংক্রিয়ভাবে মুছে ফেলার পরিবর্তে সীমিত সংখ্যক পূর্ববর্তী ডকুমেন্ট সংস্করণ – যেমন 1 বা 2 – ধরে রাখার অনুমতি দেওয়া উচিত। আদর্শভাবে, এটি কনফিগারযোগ্য করা যেতে পারে…” রিপোজিটরিতে OpenAI সাপোর্ট থেকে প্রতিক্রিয়া হিসাবে উপস্থাপিত একটি ফাইলও রয়েছে যা বিস্তারিত প্রতিক্রিয়া স্বীকার করে।
OpenAI-এর স্তরযুক্ত মেমরির পদ্ধতি
ব্যবহারকারী-প্রতিবেদিত এই সমস্যাগুলি OpenAI-এর বহু-পর্যায়ের মেমরি বৈশিষ্ট্যগুলির রোলআউটের জন্য প্রসঙ্গ প্রদান করে যা দৃশ্যত এই ধরনের সমস্যাগুলি প্রশমিত করার জন্য ডিজাইন করা হয়েছে। কোম্পানিটি প্রথমে 2024 সালের ফেব্রুয়ারিতে একটি বেস মেমরি ক্ষমতা পরীক্ষা শুরু করে, ব্যবহারকারীদের ChatGPT-কে মনে রাখার জন্য স্পষ্টভাবে তথ্য সরবরাহ করার অনুমতি দেয়। এই বেস বৈশিষ্ট্যটি পরে প্লাস গ্রাহকদের জন্য প্রসারিত প্রাপ্যতা দেখেছিল।
১০ এপ্রিল, ২০২৫ সালের দিকে একটি স্বতন্ত্র, আরও অন্তর্নিহিত মেমোরি ফাংশন এসেছিল, যখন OpenAI ChatGPT (প্রো সাবস্ক্রাইবারদের সাথে শুরু করে) ব্যবহারকারীর সম্পূর্ণ চ্যাট ইতিহাস ব্যক্তিগতকরণের জন্য উল্লেখ করতে সক্ষম করেছিল, যাকে CEO স্যাম অল্টম্যান “AI সিস্টেম যা আপনাকে আপনার জীবন জুড়ে জানতে সাহায্য করে” এর দিকে অগ্রসর হচ্ছে বলে বর্ণনা করেছিলেন।
এর কিছুক্ষণ পরেই, “Memory with Search” বৈশিষ্ট্যটি কোম্পানির রিলিজ নোটে বিস্তারিতভাবে বর্ণনা করা হয়েছিল, যা ChatGPT কে মাইক্রোসফ্ট বিংয়ের মতো অংশীদারদের মাধ্যমে পরিচালিত ওয়েব অনুসন্ধান কোয়েরিগুলি কাস্টমাইজ করার জন্য সঞ্চিত মেমোরি (চ্যাট ইতিহাস থেকে স্পষ্ট তথ্য এবং অন্তর্নিহিত প্রসঙ্গ উভয়ই, মেমোরি FAQ-তে বিশদ সেটিংসের মাধ্যমে নিয়ন্ত্রণযোগ্য) ব্যবহার করার অনুমতি দেয়।
আপডেটটি উন্নত যুক্তির জন্য উল্লেখ করা নতুন o3 এবং o4-মিনি মডেল প্রকাশের সাথে মিলে যায়। পুনরাবৃত্তিমূলক কলগুলিতে কর্মক্ষমতা অপ্টিমাইজেশনের জন্য API এর মাধ্যমে ব্যবহৃত OpenAI-এর পৃথক, সার্ভার-সাইড প্রম্পট ক্যাশিং থেকে এই ব্যবহারকারী-মুখী মেমোরি বৈশিষ্ট্যগুলিকে আলাদা করা গুরুত্বপূর্ণ।
স্থায়ী ডেটা, স্থায়ী ঝুঁকি?
ব্যবহারকারীর অভিজ্ঞতা উন্নত করার সময়, স্থায়ী মেমরি ক্ষমতা সহজাতভাবে সুরক্ষা বিবেচনার পরিচয় দেয়। প্রম্পট ইনজেকশন, যেখানে ব্যবহারকারীর ইনপুট বা বহিরাগত ডেটা উৎসের মধ্যে লুকানো দূষিত নির্দেশাবলী LLM আচরণকে হেরফের করে, OWASP-এর মতো গোষ্ঠীগুলি দ্বারা শীর্ষ AI নিরাপত্তা ঝুঁকি হিসাবে স্থান পেয়েছে, যা বিশ্বস্ত নির্দেশাবলীকে অবিশ্বস্ত ডেটা থেকে আলাদা করার ক্ষেত্রে মডেলগুলির অসুবিধাকে কাজে লাগায়।
এই ঝুঁকি মেমরি বৈশিষ্ট্য দ্বারা বৃদ্ধি করা যেতে পারে, সম্ভাব্যভাবে দূষিত নির্দেশাবলী বা নিষ্কাশিত ডেটা সেশন জুড়ে টিকে থাকার অনুমতি দেয়।
গবেষকরা 2024 সালে এই ধরনের দুর্বলতা প্রদর্শন করেছিলেন। জুনের একটি arXiv গবেষণাপত্রে অনুসন্ধান করা হয়েছিল যে কীভাবে মেমরি ডেটা এক্সফিল্ট্রেশন আক্রমণকে সহজতর করতে পারে, অন্যদিকে আরেকটি প্রতিবেদনে দূষিত নথির মাধ্যমে ChatGPT macOS অ্যাপের মেমরিতে ক্রমাগত “স্পাইওয়্যার” নির্দেশাবলী ইনজেকশনের বিষয়টি তুলে ধরা হয়েছে, যা সম্ভাব্য দীর্ঘমেয়াদী চ্যাট ডেটা চুরি সক্ষম করে।
যদিও OpenAI সেই নির্দিষ্ট macOS দুর্বলতা মোকাবেলা করেছে বলে জানা গেছে, তবুও স্থায়ী AI মেমরি সুরক্ষিত করার মৌলিক চ্যালেঞ্জটি শিল্প-ব্যাপী উদ্বেগের বিষয়, যা Google Gemini, Microsoft Copilot এবং xAI’s Grok-এর মতো প্রতিযোগীদের অনুরূপ বৈশিষ্ট্যগুলিকে প্রভাবিত করে।
OpenAI ব্যবহারকারীদের মেমরি বৈশিষ্ট্যগুলি সম্পূর্ণরূপে অক্ষম করার জন্য নিয়ন্ত্রণ প্রদান করে। কোম্পানিটি বলেছে যে নির্দিষ্ট ব্যবহারকারীর অ্যাকাউন্টের বিবরণ অনুসন্ধান অংশীদারদের সাথে ভাগ করা হয় না, যদিও IP ঠিকানা থেকে অনুমান করা সাধারণ অবস্থানের ডেটা ফলাফলের প্রাসঙ্গিকতা উন্নত করার জন্য ব্যবহার করা যেতে পারে। অনুসন্ধানের সাথে মেমরির রোলআউট ধীরে ধীরে। অর্থপ্রদানকারী গ্রাহকদের মনে রাখা উচিত যে মেমরি-সহায়তাযুক্ত অনুসন্ধান সহ অনুসন্ধান ফাংশন ব্যবহার তাদের GPT-4o বার্তা সীমার বিরুদ্ধে গণনা করা হয়। আরও কঠোর ব্রাউজার ইন্টিগ্রেশনের জন্য, OpenAI একটি Chrome এক্সটেনশনও অফার করে।
সূত্র: Winbuzzer / Digpu NewsTex