বেইজিংয়ের সিংহুয়া বিশ্ববিদ্যালয়ের গবেষকরা তাইচি উপস্থাপন করেছেন, যা একটি ফোটোনিক এআই চিপলেট আর্কিটেকচার যা বিজ্ঞান-এ সাম্প্রতিক প্রকাশনায় বিস্তারিতভাবে বর্ণনা করা হয়েছে। ইলেকট্রনিক ইঞ্জিনিয়ারিং বিভাগের সহযোগী অধ্যাপক লু ফ্যাং এবং অটোমেশন বিভাগের অধ্যাপক কিওনঘাই দাই দ্বারা তৈরি, এই চিপটি বৃহৎ-স্কেল কৃত্রিম বুদ্ধিমত্তার ক্রমবর্ধমান শক্তির চাহিদাকে লক্ষ্য করে।
দলটি প্রতি সেকেন্ডে ১৬০ টেরা-অপারেশন প্রতি ওয়াট (TOPS/W) শক্তি দক্ষতার রিপোর্ট করেছে, যা ব্যবহৃত শক্তির তুলনায় এআই প্রক্রিয়াকরণ শক্তির জন্য একটি গুরুত্বপূর্ণ মেট্রিক। চায়না একাডেমির বিশ্লেষণ অনুসারে, এটি পূর্বে তৈরি তুলনামূলক ফোটোনিক নিউরাল নেটওয়ার্ক চিপের তুলনায় একটি উল্লেখযোগ্য উন্নতি।
আলো দিয়ে এআই শক্তি সমস্যা মোকাবেলা
আধুনিক এআই মডেলগুলির জন্য প্রচুর গণনামূলক শক্তি প্রয়োজন, যা উল্লেখযোগ্য বিদ্যুৎ খরচ এবং হার্ডওয়্যার চাহিদার দিকে পরিচালিত করে, যা আরও অগ্রগতির জন্য একটি বাধা তৈরি করে। IEEE Spectrum তার কভারেজটিতে যেমন উল্লেখ করেছে, OpenAI-এর GPT-3-এর মতো মডেলগুলির প্রশিক্ষণ খরচ প্রচলিত ইলেকট্রনিক্সের শক্তি চ্যালেঞ্জগুলিকে তুলে ধরেছে। গণনার জন্য আলো ব্যবহার করে ফোটোনিক কম্পিউটিং, এর দক্ষতার সম্ভাবনার জন্য অন্বেষণ করা হয়েছে, কিন্তু শব্দ পরিবর্ধনের কারণে পূর্ববর্তী প্রচেষ্টাগুলি স্কেলিং সমস্যার সম্মুখীন হয়েছিল।
তাইচির বিকাশ মার্কিন বাণিজ্য নিয়ন্ত্রণের মধ্যেও ঘটে যা চীনে Nvidia-এর H100 এবং H20 GPU-এর মতো AI অ্যাক্সিলারেটরগুলিতে অ্যাক্সেস সীমাবদ্ধ করে, যা বিকল্প হার্ডওয়্যার অনুসন্ধানে প্রসঙ্গ যোগ করে। IEEE Spectrum দ্বারা উদ্ধৃত তুলনাগুলি পরামর্শ দেয় যে তাইচি H100 চিপের 1,000 গুণেরও বেশি শক্তি দক্ষতার সাথে কাজ করে।
ভবিষ্যতের দেশীয় AI চিপগুলিতে, AI চিপের চীনা নির্মাতারা Nvidia এবং অন্যান্য প্রতিদ্বন্দ্বীদের সাথে ব্যবধান কমাতে প্রযুক্তিটি ব্যবহার করতে পারে। Huawei সম্প্রতি CloudMatrix 384 AI ক্লাস্টার উন্মোচন করেছে যা কর্মক্ষমতার দিক থেকে Nvidia-এর শীর্ষস্থানীয় GB200 NVL72 আর্কিটেকচারকে ছাড়িয়ে গেছে, তবে অনেক বেশি বিদ্যুৎ খরচের খরচে।
একটি হাইব্রিড, ডিস্ট্রিবিউটেড ফোটোনিক ডিজাইন
তাইচি তার চিপলেটের মধ্যে আলোর বিবর্তন এবং হস্তক্ষেপ কৌশলগুলিকে একত্রিত করে একটি স্বতন্ত্র কৌশল ব্যবহার করে, যার লক্ষ্য হস্তক্ষেপের পুনর্গঠনের সাথে বিবর্তনের উচ্চ ঘনত্বকে একত্রিত করা।
এই কাজটি দলের পূর্ববর্তী গবেষণার উপর ভিত্তি করে তৈরি, যার মধ্যে দ্রুত চিত্র প্রক্রিয়াকরণের উপর দৃষ্টি নিবদ্ধ করা OPCA নামক একটি অপটিক্যাল চিপ অন্তর্ভুক্ত। ত্রুটিগুলিকে বাড়িয়ে তুলতে পারে এমন গভীর অপটিক্যাল স্তরগুলি ব্যবহার করার পরিবর্তে, তাইচি একটি বিতরণকৃত স্থাপত্য ব্যবহার করে। লু ফ্যাং এটিকে IEEE স্পেকট্রামের কাছে “‘গভীরে অগভীর কিন্তু প্রস্থে বিস্তৃত’ স্থাপত্য [যা] নেটওয়ার্ক স্কেলের গ্যারান্টি দেয়” হিসাবে বর্ণনা করেছেন।
জটিল AI কাজগুলি সমান্তরাল চিপলেটগুলিতে বিভক্ত, যা সিস্টেমকে বৃহৎ নেটওয়ার্ক পরিচালনা করতে সক্ষম করে। বিজ্ঞান বিমূর্ত নোট “মিলিয়ন-অফ-নিউরন ক্ষমতা” এর 13.96 মিলিয়ন পরামিতি থেকে উদ্ভূত, যখন বিশ্ববিদ্যালয়ের ঘোষণা কার্যকর স্কেলটিকে “বিলিয়ন” নিউরনকে সমর্থনকারী হিসাবে তৈরি করেছে।
এই স্থাপত্যটির গণনামূলক ঘনত্ব প্রায় ৮৮০ ট্রিলিয়ন MACS/mm², যা ৬৪×৬৪ পর্যন্ত ইনপুট/আউটপুট মাত্রা সহ চিপলেট দ্বারা সমর্থিত। গবেষণার সাথে সম্পর্কিত তথ্য অনুসারে, প্রকল্পের জন্য অর্থায়নে চীনের বিজ্ঞান ও প্রযুক্তি মন্ত্রণালয় এবং চীনের জাতীয় প্রাকৃতিক বিজ্ঞান ফাউন্ডেশনের সহায়তা অন্তর্ভুক্ত ছিল।
প্রদর্শিত ক্ষমতা এবং ব্যবহারিক বাধা
সিংহুয়া দল জটিল AI মানদণ্ডে তাইচিকে যাচাই করেছে। এটি Omniglot হাতে লেখা চরিত্র সেটের ১,৬২৩টি বিভাগকে শ্রেণীবদ্ধ করে ৯১.৮৯% নির্ভুলতা এবং ১০০-বিভাগের মিনি-ইমেজনেট টাস্কে ৮৭.৭৪% নির্ভুলতা অর্জন করেছে।
চিপটি কন্টেন্ট তৈরির জন্য AI মডেলগুলিকেও চালিত করে, বাখের স্টাইলে সঙ্গীত তৈরি করে এবং ভ্যান গঘ এবং মুঞ্চের অনুকরণে ছবি তৈরি করে। “অপটিক্যাল নিউরাল নেটওয়ার্কগুলি আর খেলনা মডেল নয়,”
লু ফ্যাং IEEE স্পেকট্রাম সাক্ষাৎকারে জোর দিয়েছিলেন। “এগুলি এখন বাস্তব-বিশ্বের কাজে প্রয়োগ করা যেতে পারে।” তবে, চিপলেটটি নিজেই কম্প্যাক্ট হলেও, সম্পূর্ণ সিস্টেমের জন্য বর্তমানে যথেষ্ট বাহ্যিক সরঞ্জামের প্রয়োজন। লু ফ্যাং IEEE স্পেকট্রামকে উল্লেখ করেছেন যে লেজার উৎস এবং ডেটা ইন্টারকানেক্টের মতো উপাদানগুলি ভারী থাকে, যা উল্লেখযোগ্য ল্যাব স্থান দখল করে (“প্রায় একটি সম্পূর্ণ টেবিল”)। ভবিষ্যতের কাজের লক্ষ্য হল এই ফাংশনগুলিকে আরও ঘনিষ্ঠভাবে সংহত করা, বৃহৎ AI মডেল, কন্টেন্ট তৈরি এবং রোবোটিক্সে অ্যাপ্লিকেশনগুলিকে লক্ষ্য করে।
সূত্র: Winbuzzer / Digpu NewsTex