Huawei நிறுவனம் தனது AI CloudMatrix 384 அமைப்பை அறிமுகப்படுத்தியுள்ளது, இது Nvidiaவின் முன்னணி GB200 NVL72 கட்டமைப்போடு நேரடியாக போட்டியிட வடிவமைக்கப்பட்ட ஒரு பெரிய அளவிலான கிளஸ்டரான Ascend 910C செயலிகளை கணிசமான எண்ணிக்கையில் பயன்படுத்துவதன் மூலம் வடிவமைக்கப்பட்டுள்ளது. ஏப்ரல் 15 ஆம் தேதி வாக்கில் சீனாவிற்கு Nvidiaவின் H20 AI சிப்பின் ஏற்றுமதியை அமெரிக்க அரசாங்கம் திறம்பட கட்டுப்படுத்திய சிறிது நேரத்திலேயே அறிவிக்கப்பட்டது, CloudMatrix 384, வெற்றிடத்தை நிரப்பும் நோக்கில் ஒரு உள்நாட்டு மாற்றீட்டைக் குறிக்கிறது.
இது காகிதத்தில், Nvidiaவின் தற்போதைய முதன்மை GB200 NVL72 அமைப்பை பல பகுதிகளில் விஞ்சும் செயல்திறன் அளவீடுகளை அடைகிறது, ஆனால் சிலிக்கான் நுட்பத்தை விட அளவை ஆதரிக்கும் ஒரு உத்தி மூலம் அவ்வாறு செய்கிறது, இதன் விளைவாக கடுமையான மின் நுகர்வு அபராதம் ஏற்படுகிறது.
இந்த அமைப்பின் அடித்தளம் Ascend 910C ஆகும், இது AI இல் பொதுவான BF16 எண் வடிவமைப்பைப் பயன்படுத்தி 780 TFLOPS ஐ வழங்கும் இரட்டை-சிப்லெட் செயலி ஆகும். முழு CloudMatrix 384 கிளஸ்டர் இந்த முடுக்கிகளில் 384 ஐ ஒருங்கிணைக்கிறது, மேலும் SemiAnalys இன் படி, அடர்த்தியான BF16 செயல்திறனின் மதிப்பிடப்பட்ட மொத்த 300 PFLOPS ஐ அடைகிறது.
இந்த எண்ணிக்கை Nvidia இன் 72-GPU GB200 NVL72 அமைப்பிற்குக் காரணமான தோராயமாக 180 PFLOPS ஐ விட அதிகமாக உள்ளது. Huawei இன் வடிவமைப்பு Nvidia இன் 13.8 TB உடன் ஒப்பிடும்போது 49.2 TB மொத்த HBM (உயர் அலைவரிசை நினைவகம், செயலிகளுக்கான வேகமான தரவு அணுகலை வழங்கும் ஒரு வகை அடுக்கப்பட்ட நினைவகம்) திறனுடன் கணிசமாக அதிக நினைவகத்தையும் கொண்டுள்ளது, மேலும் 576 TB/s உடன் ஒப்பிடும்போது மொத்த HBM அலைவரிசையில் 1229 TB/s ஆகும்.
செயல்திறன் மூலம் செயல்திறன், அளவுகோல் அல்ல
Nvidia ஒப்பீட்டு அமைப்பை விட ஐந்து மடங்கு அதிகமான முடுக்கிகளை பயன்படுத்துவதன் மூலம் அடையப்படும் இந்த செயல்திறன் நன்மை, அதிக ஆற்றல் செலவில் வருகிறது. CloudMatrix 384 இன் மொத்த சிஸ்டம் மின் தேவை 559 kW என மதிப்பிடப்பட்டுள்ளது, இது GB200 NVL72 உள்ளமைவால் நுகரப்படும் 145 kW ஐ விட கிட்டத்தட்ட நான்கு மடங்கு அதிகம்.
இந்த புள்ளிவிவரங்களை அடிப்படையாகக் கொண்ட கணக்கீடுகள், Huawei சிஸ்டம் BF16 கம்ப்யூட்டின் TFLOP க்கு 2.3 மடங்கு குறைவான மின் திறன் கொண்டது மற்றும் நினைவக அலைவரிசையின் TB/s க்கு 1.8 மடங்கு குறைவான திறன் கொண்டது என்பதைக் குறிக்கிறது. HBM திறனின் ஒரு டெராபைட்டுக்கு செயல்திறன் நெருக்கமாக உள்ளது, Huawei இன் சிஸ்டம் சுமார் 1.1 மடங்கு அதிக சக்தியைப் பயன்படுத்துகிறது.
இந்த ஏற்றத்தாழ்வு சீனாவின் சூழ்நிலைகளுக்கு ஒரு மூலோபாய தழுவலை எடுத்துக்காட்டுகிறது – போதுமான மற்றும் ஒப்பீட்டளவில் மலிவு விலையில் எரிசக்தி உள்கட்டமைப்பைக் கொண்டிருக்கும் அதே வேளையில் மிகவும் மேம்பட்ட, மின் திறன் கொண்ட சிப் உற்பத்திக்கான வரையறுக்கப்பட்ட அணுகலுடன் போராடுகிறது. சீனாவின் சில பகுதிகளில் மின்சார விலைகள் குறிப்பிடத்தக்க அளவில் குறைந்துள்ளன, 2022 இல் $91/MWh க்கு அருகில் இருந்த முந்தைய நிலைகளிலிருந்து 2025 ஆம் ஆண்டின் தொடக்கத்தில் சுமார் $56/MWh ஆகக் குறைந்துள்ளதாகக் கூறப்படுகிறது, இதனால் மின் தேவை உள்ள அமைப்புகள் வேறு எங்கும் இருப்பதை விட பொருளாதார ரீதியாக மிகவும் சாத்தியமானதாக ஆக்குகிறது.
காப்பகத்திற்கு மேல் ஒளியியல்: நெட்வொர்க் முதுகெலும்பு
இந்த பெரிய அளவிலான கிளஸ்டரை இயக்குவதற்கான திறவுகோல் CloudMatrix 384 இன் நெட்வொர்க்கிங் கட்டமைப்பாகும். Huawei, இன்டர்-ரேக் மற்றும் இன்ட்ரா-ரேக் தொடர்புக்கு ஒரு ஆல்-ஆப்டிகல் அணுகுமுறையைத் தேர்ந்தெடுத்துள்ளது, 384 Ascend 910C செயலிகளை ஆல்-டு-ஆல் மெஷில் இணைக்கிறது. இது ஒரு பெரிய 6,912 லீனியர் ப்ளக்கபிள் ஆப்டிக்ஸ் (LPO) டிரான்ஸ்ஸீவர்களை பயன்படுத்துவதை உள்ளடக்கியது, ஒவ்வொன்றும் 800 Gbps இல் இயங்குகிறது.
LightCounting போன்ற தொழில்துறை அறிக்கைகளில் அடிக்கடி விவாதிக்கப்படும் LPO தொழில்நுட்பம், குறுகிய தரவு மைய ரீச்களுக்கான பாரம்பரிய DSP- அடிப்படையிலான டிரான்ஸ்ஸீவர்களுடன் ஒப்பிடும்போது குறைந்த சக்தி விருப்பமாகக் கருதப்படுகிறது, நெட்வொர்க் துணிக்குள்ளேயே சில மின் சேமிப்புகளை வழங்குகிறது, இருப்பினும் இவ்வளவு பெரிய, சிக்கலான ஆப்டிகல் நெட்வொர்க்கில் சிக்னல் ஒருமைப்பாட்டை நிர்வகிப்பது அதன் சொந்த சவால்களை முன்வைக்கிறது.
இதன் விளைவாக வரும் மொத்த உள் அலைவரிசை 5.5 Pbps ஐ விட அதிகமாக உள்ளது. GB200 NVL72 அடிப்படையுடன் ஒப்பிடும்போது, இந்த அமைப்பு 2.1 மடங்கு ஸ்கேல்-அப் அலைவரிசையை (384-நோட் கிளஸ்டருக்குள்) மற்றும் 5.3 மடங்கு ஸ்கேல்-அவுட் அலைவரிசையை (பல கிளஸ்டர்களை இணைப்பதற்கு) வழங்குகிறது என்று செமிஅனாலிசிஸ் கணக்கிடுகிறது.
12 கம்ப்யூட் ரேக்குகள் மற்றும் 4 பிரத்யேக நெட்வொர்க் ஸ்விட்சிங் ரேக்குகளைக் கொண்ட ஒட்டுமொத்த 16-ரேக் சிஸ்டம் வடிவமைப்பு, என்விடியாவின் வெளியிடப்படாத DGX H100 NVL256 “ரேஞ்சர்” தளத்தை ஒத்திருக்கிறது, இது அந்த நேரத்தில் உற்பத்திக்கு மிகவும் சிக்கலானதாகவும் விலை உயர்ந்ததாகவும் கருதப்பட்ட ஒரு பெரிய, ஒளியியல் ரீதியாக இணைக்கப்பட்ட மல்டி-ரேக் வடிவமைப்பையும் கொண்டிருந்தது.
தடைகள் பிரமை வழிசெலுத்தல்
இந்த உத்தியை செயல்படுத்துவது கடுமையான அமெரிக்க ஏற்றுமதி கட்டுப்பாடுகள் இருந்தபோதிலும் மேம்பட்ட கூறுகளைப் பாதுகாப்பதைப் பொறுத்தது. சீனாவின் SMIC, Ascend 910C இன் கம்ப்யூட் சிப்லெட்டுகளுக்கு ஏற்ற 7nm-வகுப்பு சிப்களை உருவாக்க முடியும் என்றாலும், இதுவரை பயன்படுத்தப்பட்டுள்ள செயலிகள் முதன்மையாக TSMC ஆல் தயாரிக்கப்பட்ட சிப்லெட்டுகளைப் பயன்படுத்துகின்றன என்று பகுப்பாய்வு காட்டுகிறது.
2025 ஆம் ஆண்டு வரை ஒரு மில்லியனுக்கும் அதிகமான Ascend 910C செயலிகளுக்கு போதுமானதாக இருக்கும் இந்த தடைசெய்யப்பட்ட வேஃபர்களை Huawei நிறுவனம் Sophgo போன்ற இடைத்தரகர்கள் மூலம் பாதுகாத்ததாகக் கூறப்படுகிறது, இது Huaweiக்கு எதிரான நேரடித் தடைகளைத் தவிர்க்கிறது. இந்தச் செயல்பாடு அமெரிக்காவின் ஆய்வுக்கு வழிவகுத்ததாகக் கூறப்படுகிறது, ஏப்ரல் தொடக்கத்தில் அறிவிக்கப்பட்டபடி TSMC குறிப்பிடத்தக்க அபராதத்தை எதிர்கொள்ளக்கூடும்.
அத்தியாவசிய HBM2E நினைவகத்தை அணுகுவது இதேபோன்ற ஒரு தீர்வை உள்ளடக்கியது, HBM ஏற்றுமதி கட்டுப்பாடுகளைத் தொடர்ந்து வருவாய் குறிப்பிடத்தக்க அளவில் அதிகரித்த விநியோகஸ்தர் CoAsia Electronics மூலம் Samsung கூறுகளை சேனல் செய்கிறது.
இதில் வடிவமைப்பு நிறுவனமான Faraday Technology மற்றும் அசெம்பிளர் SPIL ஆகியவை HBM ஐக் கொண்ட தொழில்நுட்ப ரீதியாக இணக்கமான இடைநிலை தொகுப்புகளை உருவாக்குகின்றன, பின்னர் அவை சீனாவிற்கு அனுப்பப்படுகின்றன, அங்கு நினைவகம் Huawei இன் இறுதி Ascend 910C தொகுதிகளில் பயன்படுத்துவதற்காக பிரித்தெடுக்கப்படுகிறது. தொழில்நுட்ப ஏற்றுமதி கட்டுப்பாடுகளைச் செயல்படுத்துவதில் நடந்து வரும் சவாலை இந்த சூழ்ச்சிகள் அடிக்கோடிட்டுக் காட்டுகின்றன.
சீனாவின் AI பந்தயத்தில் ஒரு கணக்கிடப்பட்ட சூதாட்டம்
CloudMatrix 384 வெளியீடு மூலோபாய ரீதியாக சரியான நேரத்தில் முடிக்கப்பட்டுள்ளது. Nvidia H20 ஏற்றுமதிகளை நிறுத்திய அமெரிக்க நடவடிக்கை, முந்தைய கட்டுப்பாடுகளின் கீழ் சீன சந்தைக்காக பிரத்யேகமாக வடிவமைக்கப்பட்ட ஒரு முக்கிய போட்டியாளரை நீக்கியது. H20, கட்டுப்பாடற்ற Nvidia GPUகள் மற்றும் Huawei இன் முந்தைய 910B சிப் உடன் ஒப்பிடும்போது குறைந்த செயல்திறன் கொண்ட பகுதியாக இருந்தாலும், Nvidia சீனாவிற்கான முக்கிய இணக்கமான சலுகையாக இருந்தது, மேலும் தடை நிறுவனம் தொடர்புடைய சரக்குகளுக்கு $5.5 பில்லியன் கட்டணத்தை எடுக்க வேண்டிய கட்டாயம் ஏற்பட்டது.
இந்த ஒழுங்குமுறை மாற்றம் ஒரு குறிப்பிடத்தக்க சந்தை திறப்பை உருவாக்கியது, இதை Huawei CloudMatrix அமைப்பால் மட்டுமல்லாமல், அதன் அடுத்த தலைமுறை Ascend 920 சிப்பையும் நிரப்ப நகர்கிறது.
இந்த சூழ்நிலை Nvidia CEO ஜென்சன் ஹுவாங்கை தடைக்குப் பிறகு விரைவில் பெய்ஜிங்கிற்கு வருகை தரத் தூண்டியது, அங்கு Nvidia “சீனாவுடன் தொடர்ந்து ஒத்துழைக்கும்” என்று நம்புவதாக அவர் கூறியதாக கூறப்படுகிறது.
ஆய்வாளர் பேட்ரிக் மூர்ஹெட் முடிவை வெளிப்படையாகக் கணித்தார்: “சீன நிறுவனங்கள் Huaweiக்கு மாறப் போகின்றன.” இது பரந்த சீன தொழில்நுட்ப இலக்குகளுடன் ஒத்துப்போகிறது, வெளிநாட்டு தொலைத்தொடர்பு சில்லுகளை படிப்படியாக வெளியேற்றுதல் மற்றும் உள்நாட்டு குறைக்கடத்தி மேம்பாட்டை ஆதரிக்கும் கணிசமான “பெரிய நிதி” போன்ற முயற்சிகளில் காணப்படுகிறது. Huawei இன் CloudMatrix 384, தற்போது போட்டித்தன்மை வாய்ந்த AI அமைப்பு செயல்திறனுக்கான பாதையைக் காட்டுகிறது, புவிசார் அரசியல் கட்டுப்பாடுகளின் கீழ் சிக்கலான உலகளாவிய விநியோகச் சங்கிலியை வழிநடத்தும் போது அதிக சக்தி பயன்பாட்டை ஏற்றுக்கொள்கிறது.
Huawei CloudMatrix 384 AI கிளஸ்டர் Nvidia GB200 ஐ விட சிறப்பாக செயல்படுகிறது என்ற இடுகை முதலில் WinBuzzer இல் தோன்றியது.
மூலம்: Winbuzzer / Digpu NewsTex