হুয়াওয়ে তাদের AI CloudMatrix 384 সিস্টেম চালু করেছে, যা একটি বৃহৎ-স্কেল ক্লাস্টার যা Nvidia-এর শীর্ষস্থানীয় GB200 NVL72 আর্কিটেকচারের সাথে সরাসরি প্রতিযোগিতা করার জন্য ডিজাইন করা হয়েছে, যার উল্লেখযোগ্য সংখ্যক Ascend 910C প্রসেসর স্থাপন করা হয়েছে। মার্কিন সরকার ১৫ এপ্রিল চীনে Nvidia-এর H20 AI চিপের রপ্তানি কার্যকরভাবে সীমাবদ্ধ করার পরপরই ঘোষণা করা হয়েছে, CloudMatrix 384 একটি দেশীয় বিকল্প প্রতিনিধিত্ব করে যার লক্ষ্য হল শূন্যস্থান পূরণ করা।
এটি এমন কর্মক্ষমতা মেট্রিক্স অর্জন করে যা কাগজে কলমে Nvidia-এর বর্তমান ফ্ল্যাগশিপ GB200 NVL72 সিস্টেমকে বেশ কয়েকটি ক্ষেত্রে ছাড়িয়ে যায়, তবে সিলিকন পরিশীলনের চেয়ে স্কেলকে সমর্থন করার কৌশলের মাধ্যমে তা করে, যার ফলে বিদ্যুৎ খরচের জরিমানা বেশি হয়।
সিস্টেমের ভিত্তি হল Ascend 910C, একটি ডুয়াল-চিপলেট প্রসেসর যা AI-তে সাধারণ BF16 সংখ্যাসূচক ফর্ম্যাট ব্যবহার করে 780 TFLOPS সরবরাহ করে। সম্পূর্ণ CloudMatrix 384 ক্লাস্টারটিতে এই 384টি অ্যাক্সিলারেটর রয়েছে এবং SemiAnalys অনুসারে, আনুমানিক মোট 300 PFLOPS ঘন BF16 কর্মক্ষমতা পৌঁছেছে।
এই সংখ্যাটি Nvidia-এর 72-GPU GB200 NVL72 সেটআপের জন্য দায়ী প্রায় 180 PFLOPS-কে ছাড়িয়ে গেছে। Huawei-এর ডিজাইনে উল্লেখযোগ্যভাবে বেশি মেমরি রয়েছে, Nvidia-এর 13.8 TB-এর তুলনায় মোট HBM (হাই ব্যান্ডউইথ মেমরি, প্রসেসরের জন্য দ্রুত ডেটা অ্যাক্সেস প্রদানকারী এক ধরণের স্ট্যাকড মেমরি) ক্ষমতার 49.2 TB এবং 576 TB/s এর বিপরীতে মোট HBM ব্যান্ডউইথের 1229 TB/s রয়েছে।
স্কেলের মাধ্যমে কর্মক্ষমতা, দক্ষতা নয়
Nvidia তুলনামূলক সিস্টেমের তুলনায় পাঁচগুণ বেশি অ্যাক্সিলারেটর স্থাপন করে অর্জিত এই কর্মক্ষমতা সুবিধাটি উচ্চ শক্তি খরচে আসে। CloudMatrix 384 এর মোট সিস্টেম পাওয়ারের চাহিদা আনুমানিক 559 kW, যা GB200 NVL72 কনফিগারেশনে ব্যবহৃত 145 kW এর প্রায় চারগুণ।
এই পরিসংখ্যানের উপর ভিত্তি করে গণনা করা হলে দেখা যায় যে Huawei সিস্টেম BF16 কম্পিউটের TFLOP-এর তুলনায় 2.3 গুণ কম শক্তি-সাশ্রয়ী এবং মেমোরি ব্যান্ডউইথের প্রতি TB/s-এর তুলনায় 1.8 গুণ কম শক্তি-সাশ্রয়ী। HBM ক্ষমতার প্রতি টেরাবাইট ক্ষমতার দক্ষতা কাছাকাছি, Huawei-এর সিস্টেম প্রায় 1.1 গুণ বেশি শক্তি ব্যবহার করে।
এই বৈষম্য চীনের পরিস্থিতির সাথে একটি কৌশলগত অভিযোজনকে তুলে ধরে – সর্বাধিক উন্নত, বিদ্যুৎ-সাশ্রয়ী চিপ উৎপাদনে সীমিত অ্যাক্সেসের সাথে লড়াই করা, পাশাপাশি পর্যাপ্ত এবং তুলনামূলকভাবে সাশ্রয়ী মূল্যের শক্তি অবকাঠামো রয়েছে। চীনের কিছু অংশে বিদ্যুতের দাম উল্লেখযোগ্যভাবে হ্রাস পেয়েছে, জানা গেছে যে 2025 সালের প্রথম দিকে এটি প্রায় $56/MWh-এ নেমে এসেছে যা 2022 সালে $91/MWh-এর কাছাকাছি ছিল, যা বিদ্যুৎ-ক্ষুধার্ত সিস্টেমগুলিকে অন্য কোথাও অর্থনৈতিকভাবে আরও কার্যকর করে তুলেছে।
কপারের উপর অপটিক্স: নেটওয়ার্কের মেরুদণ্ড
এই বৃহৎ-স্কেল ক্লাস্টারটি সক্ষম করার মূল চাবিকাঠি হল CloudMatrix 384 এর নেটওয়ার্কিং আর্কিটেকচার। Huawei আন্তঃ-র্যাক এবং আন্তঃ-র্যাক যোগাযোগের জন্য একটি অল-অপটিক্যাল পদ্ধতি বেছে নিয়েছে, 384 Ascend 910C প্রসেসরগুলিকে একটি অল-টু-অল মেশে সংযুক্ত করে। এর মধ্যে একটি বিশাল 6,912 লিনিয়ার প্লাগেবল অপটিক্স (LPO) ট্রান্সসিভার স্থাপন করা জড়িত, প্রতিটি 800 Gbps এ কাজ করে।
LightCounting-এর মতো শিল্প প্রতিবেদনগুলিতে প্রায়শই আলোচিত LPO প্রযুক্তি, সংক্ষিপ্ত ডেটা সেন্টার রিচের জন্য ঐতিহ্যবাহী DSP-ভিত্তিক ট্রান্সসিভারগুলির তুলনায় সম্ভাব্য কম-পাওয়ার বিকল্প হিসাবে দেখা হয়, যা নেটওয়ার্ক ফ্যাব্রিকের মধ্যেই কিছু পাওয়ার সাশ্রয় প্রদান করে, যদিও এত বড়, জটিল অপটিক্যাল নেটওয়ার্কে সিগন্যাল অখণ্ডতা পরিচালনা করা তার নিজস্ব চ্যালেঞ্জ উপস্থাপন করে।
ফলস্বরূপ মোট অভ্যন্তরীণ ব্যান্ডউইথ 5.5 Pbps ছাড়িয়ে যায়। সেমিঅ্যানালাইসিস হিসাব করে যে সিস্টেমটি GB200 NVL72 বেসলাইনের তুলনায় স্কেল-আপ ব্যান্ডউইথের 2.1 গুণ (384-নোড ক্লাস্টারের মধ্যে) এবং স্কেল-আউট ব্যান্ডউইথের 5.3 গুণ (একাধিক ক্লাস্টার সংযোগের জন্য) অফার করে।
12টি কম্পিউট র্যাক এবং 4টি ডেডিকেটেড নেটওয়ার্ক সুইচিং র্যাক সহ সামগ্রিক 16-র্যাক সিস্টেম ডিজাইনটি Nvidia-এর অপ্রকাশিত DGX H100 NVL256 “Ranger” প্ল্যাটফর্মের সাথে সাদৃশ্যপূর্ণ, যেখানে একটি বৃহৎ, অপটিক্যালি সংযুক্ত মাল্টি-র্যাক ডিজাইনও ছিল যা সেই সময়ে উৎপাদনের জন্য অত্যন্ত জটিল এবং ব্যয়বহুল বলে মনে করা হত।
Sanctions Maze নেভিগেট করা
কঠোর মার্কিন রপ্তানি নিয়ন্ত্রণ সত্ত্বেও এই কৌশলটি কার্যকর করা উন্নত উপাদানগুলি সুরক্ষিত করার উপর নির্ভর করে। যদিও চীনের SMIC Ascend 910C-এর কম্পিউট চিপলেটের জন্য উপযুক্ত 7nm-শ্রেণীর চিপ তৈরি করতে পারে, বিশ্লেষণ থেকে জানা যায় যে এখন পর্যন্ত মোতায়েন করা প্রসেসরগুলি প্রাথমিকভাবে TSMC দ্বারা তৈরি চিপলেট ব্যবহার করে।
হুয়াওয়ে অভিযোগ করেছে যে তারা এই সীমাবদ্ধ ওয়েফারগুলি – যা ২০২৫ সাল পর্যন্ত দশ লক্ষেরও বেশি Ascend 910C প্রসেসরের জন্য যথেষ্ট – Sophgo এর মতো মধ্যস্থতাকারীদের মাধ্যমে সুরক্ষিত করেছে, যা হুয়াওয়ের বিরুদ্ধে সরাসরি নিষেধাজ্ঞা এড়িয়ে গেছে। এই কার্যকলাপের ফলে মার্কিন তদন্ত শুরু হয়েছে বলে জানা গেছে, এপ্রিলের শুরুতে রিপোর্ট করা হয়েছে যে TSMC সম্ভবত একটি উল্লেখযোগ্য জরিমানার সম্মুখীন হতে পারে।
অপরিহার্য HBM2E মেমোরি অ্যাক্সেস করার ক্ষেত্রেও একই রকম সমাধান জড়িত বলে জানা গেছে, পরিবেশক CoAsia Electronics এর মাধ্যমে Samsung উপাদানগুলিকে চ্যানেল করা, যার আয় HBM রপ্তানি নিয়ন্ত্রণের পরে উল্লেখযোগ্যভাবে বৃদ্ধি পেয়েছে।
এর মধ্যে ডিজাইন ফার্ম ফ্যারাডে টেকনোলজি এবং অ্যাসেম্বলার SPIL জড়িত যারা HBM ধারণকারী প্রযুক্তিগতভাবে সঙ্গতিপূর্ণ মধ্যবর্তী প্যাকেজ তৈরি করে, যা পরে চীনে পাঠানো হয় যেখানে Huawei এর চূড়ান্ত Ascend 910C মডিউলে ব্যবহারের জন্য মেমোরিটি বের করা হয় বলে ধারণা করা হচ্ছে। এই কৌশলগুলি প্রযুক্তি রপ্তানি নিয়ন্ত্রণ প্রয়োগের চলমান চ্যালেঞ্জকে তুলে ধরে।
চীনের AI প্রতিযোগিতায় একটি গণনাকৃত জুয়া
ক্লাউডম্যাট্রিক্স 384 লঞ্চ কৌশলগতভাবে সময় নির্ধারণ করা হয়েছে। Nvidia H20 রপ্তানি বন্ধ করে দেওয়ার মার্কিন পদক্ষেপের ফলে পূর্ববর্তী বিধিনিষেধের অধীনে চীনা বাজারের জন্য বিশেষভাবে তৈরি একটি মূল প্রতিযোগীকে সরিয়ে দেওয়া হয়েছে। H20, যদিও অবাধ Nvidia GPU এবং সম্ভাব্য Huawei-এর পূর্ববর্তী 910B চিপের তুলনায় কম-কার্যক্ষম অংশ ছিল, চীনের জন্য Nvidia-এর প্রধান সম্মতিমূলক অফার ছিল এবং নিষেধাজ্ঞার ফলে কোম্পানিটি সংশ্লিষ্ট ইনভেন্টরির জন্য $5.5 বিলিয়ন চার্জ নিতে বাধ্য হয়েছিল।
এই নিয়ন্ত্রক পরিবর্তন একটি উল্লেখযোগ্য বাজার উন্মুক্ত করে, যা Huawei কেবল CloudMatrix সিস্টেম দিয়েই পূরণ করতে যাচ্ছে না বরং একই সাথে ঘোষিত পরবর্তী প্রজন্মের Ascend 920 চিপ দিয়েও পূরণ করতে যাচ্ছে।
পরিস্থিতির কারণে Nvidia-এর সিইও জেনসেন হুয়াং নিষেধাজ্ঞার পরপরই বেইজিং সফরে যান, যেখানে তিনি জানা গেছে যে Nvidia আশা করেছিল “চীনের সাথে সহযোগিতা অব্যাহত রাখবে।”
বিশ্লেষক প্যাট্রিক মুরহেড স্পষ্টভাবে ফলাফল ভবিষ্যদ্বাণী করেছিলেন: “চীনা কোম্পানিগুলি কেবল Huawei-তে স্যুইচ করতে চলেছে।” এটি বৃহত্তর চীনা প্রযুক্তি লক্ষ্যগুলির সাথে সামঞ্জস্যপূর্ণ, যা বিদেশী টেলিকম চিপগুলি ফেজ-আউট এবং দেশীয় সেমিকন্ডাক্টর উন্নয়নকে সমর্থনকারী উল্লেখযোগ্য “বিগ ফান্ড”-এর মতো উদ্যোগগুলিতে দেখা যায়। হুয়াওয়ের ক্লাউডম্যাট্রিক্স ৩৮৪ এখন প্রতিযোগিতামূলক এআই সিস্টেমের কর্মক্ষমতার পথ দেখায়, ভূ-রাজনৈতিক সীমাবদ্ধতার মধ্যে জটিল বৈশ্বিক সরবরাহ শৃঙ্খলে নেভিগেট করার সময় উচ্চ শক্তি ব্যবহার গ্রহণ করে।
“হুয়াওয়ে ক্লাউডম্যাট্রিক্স ৩৮৪ এআই ক্লাস্টার এনভিডিয়া জিবি২০০-কে ছাড়িয়ে গেছে” পোস্টটি প্রথম উইনবাজারে প্রকাশিত হয়েছিল।
সূত্র: উইনবাজার / ডিগপু নিউজটেক্স