2023 மற்றும் 2024 ஆம் ஆண்டுகளில், AI உரை உருவாக்குநர்கள் முக்கிய நீரோட்டமாக மாறத் தொடங்கியபோது, ஒரு வினோதமான போக்கு தோன்றியது: “ஆழ்ந்த” என்ற சொல் சந்தேகத்திற்கிடமான எண்ணிக்கையிலான அறிவியல் ஆவணங்களில் தோன்றத் தொடங்கியது. இது AI-உருவாக்கிய உள்ளடக்கத்திற்கான ஒரு வகையான அழைப்பு அட்டையாக மாறியது – ஆனால் அது மிகவும் விசித்திரமான ஒன்றிலிருந்து வெகு தொலைவில் உள்ளது.
“தாவர எலக்ட்ரான் நுண்ணோக்கி” என்பதை உங்களுக்கு அறிமுகப்படுத்துவோம்.
தாவர என்ன?
உங்களுக்கு அடிப்படை அறிவியல் தெரிந்தால், நீங்கள் ஏற்கனவே புருவத்தை உயர்த்துகிறீர்கள். “தாவர எலக்ட்ரான் நுண்ணோக்கி” அர்த்தமல்ல – ஏனென்றால் அது ஒரு உண்மையான விஷயம் அல்ல. இதை ஆராய்ச்சியாளர்கள் “டிஜிட்டல் புதைபடிவம்” என்று அழைக்கிறார்கள் – ஆப்டிகல் ஸ்கேனிங் பிழைகள் மற்றும் AI பயிற்சி வினோதங்களின் கலவையிலிருந்து பிறந்த ஒரு விசித்திரமான, தவறான சொல். குறிப்பிடத்தக்க வகையில், இந்த முட்டாள்தனமான சொற்றொடர் ஒரு முறை அல்ல, இரண்டு முறை முற்றிலும் மாறுபட்ட சூழல்களில் தோன்றியது.
1950களில், பாக்டீரியாலஜிக்கல் ரிவியூஸ் இதழில் இரண்டு ஆய்வுக் கட்டுரைகள் ஸ்கேன் செய்யப்பட்டு டிஜிட்டல் மயமாக்கப்பட்டன. அவற்றில் ஒன்றில், “தாவர” என்ற சொல் ஒரு பத்தியிலும், அருகிலுள்ள ஒன்றில் “எலக்ட்ரான் நுண்ணோக்கி” என்ற சொல் தோன்றின. OCR மென்பொருள் இரண்டையும் தவறாக இணைத்தது – அதனால், புதைபடிவம் பிறந்தது.
பின்னர், 2017 மற்றும் 2019 இல், இரண்டு ஆய்வுக் கட்டுரைகள் மீண்டும் இந்த வார்த்தையைப் பயன்படுத்தின. இங்கே, இது ஒரு மொழிபெயர்ப்புப் பிழையாகத் தெரிகிறது. ஃபார்சியில், “தாவர” மற்றும் “ஸ்கேனிங்” என்பதற்கான சொற்கள் ஒரே ஒரு புள்ளியால் மட்டுமே வேறுபடுகின்றன. எனவே எலக்ட்ரான் நுண்ணோக்கியை ஸ்கேன் செய்வதற்குப் பதிலாக, நீங்கள் தாவர எலக்ட்ரான் நுண்ணோக்கியைப் பெற்றீர்கள்.
பிப்ரவரியில் திரும்பப் பெறுதல் கண்காணிப்பகத்தின் விரிவான விசாரணையின் மூலம் இவை அனைத்தும் வெளிச்சத்திற்கு வந்தன. ஆனால் இது கதையின் முடிவல்ல.
இது ஏன் முக்கியமானது
இந்த விசித்திரமான கோளாறு ஒரு பொருட்டல்ல என்று நீங்கள் நினைப்பீர்கள் – ஆனால் அது ஒருவிதத்தில் உண்மைதான்.
இந்த வார்த்தை இப்போது குறைந்தது 22 வெவ்வேறு ஆய்வுக் கட்டுரைகளில் வெளிவந்துள்ளது. சில திருத்தப்பட்டுள்ளன அல்லது திரும்பப் பெறப்பட்டுள்ளன, ஆனால் அதற்குள், சேதம் ஏற்பட்டுவிட்டது. ஸ்பெயினின் முன்னணி செய்தித்தாள்களில் ஒன்றான எல் பைஸ் கூட 2023 இல் ஒரு கதையில் அதை மேற்கோள் காட்டியது.
ஏன்? AI ஐ குறை கூறுங்கள்.
நவீன AI அமைப்புகள் பரந்த அளவிலான தரவுகளில் பயிற்சி பெற்றவை – அடிப்படையில் அவை துடைக்கக்கூடிய அனைத்தும். “தாவர எலக்ட்ரான் நுண்ணோக்கி” பல வெளியிடப்பட்ட ஆதாரங்களில் தோன்றியவுடன், AI மாதிரிகள் அதை ஒரு சட்டபூர்வமான வார்த்தையாகக் கருதின. எனவே ஆராய்ச்சியாளர்கள் இந்த அமைப்புகளை ஆவணங்களை எழுத அல்லது வரைவு செய்ய உதவுமாறு கேட்டபோது, மாதிரிகள் சில நேரங்களில் அதை துப்பினர், அது அபத்தமானது என்பதை மகிழ்ச்சியுடன் அறியாமல்.
The Conversation இல் ஆழமான ஆய்வுகளை வெளியிட்ட ஆரோன் ஜே. ஸ்னோஸ்வெல் மற்றும் சக ஊழியர்களின் கூற்றுப்படி, இந்த வார்த்தை 2020 க்குப் பிறகு AI அறிவுத் தொகுப்பை மாசுபடுத்தத் தொடங்கியது – அந்த இரண்டு சிக்கலான ஃபார்ஸி மொழிபெயர்ப்புகளுக்குப் பிறகு. இது ஒரு முறை மட்டுமே நடக்கும் ஒரு நிகழ்வு அல்ல: GPT-4o மற்றும் Claude 3.5 போன்ற பெரிய மாதிரிகளில் பிழை தொடர்கிறது.
“GPT-4o மற்றும் Anthropic’s Claude 3.5 உள்ளிட்ட பிற்கால மாதிரிகளிலும் பிழை நீடிப்பதை நாங்கள் கண்டறிந்தோம்,” என்று குழு The Conversation இல் ஒரு இடுகையில் எழுதுகிறது. “இது முட்டாள்தனமான சொல் இப்போது AI அறிவுத் தளங்களில் நிரந்தரமாக உட்பொதிக்கப்படலாம் என்பதைக் குறிக்கிறது.”
AI-உருவாக்கிய உள்ளடக்கம் ஏற்கனவே மாசுபடுத்துகிறது
இந்த வினோதமான உதாரணம் ஒரு வேடிக்கையான நிகழ்வை விட அதிகம் – இது உண்மையான அபாயங்களை எடுத்துக்காட்டுகிறது.
“AI-உதவி ஆராய்ச்சி மற்றும் எழுத்து மிகவும் பொதுவானதாகி வருவதால், இந்த டிஜிட்டல் புதைபடிவம் அறிவு ஒருமைப்பாடு பற்றிய முக்கியமான கேள்விகளையும் எழுப்புகிறது” என்று ஆராய்ச்சியாளர்கள் குறிப்பிடுகின்றனர்.
ஆராய்ச்சியாளர்கள் இதை எதிர்த்துப் போராடி இந்த வகையான சிக்கலைக் கண்டறிய முயற்சிக்கின்றனர். உதாரணமாக, பிரச்சனைக்குரிய காகிதத் திரையிடல் என்பது ஒவ்வொரு வாரமும் 130 மில்லியன் கட்டுரைகளை இணைக்கும் ஒரு தானியங்கி கருவியாகும். இது அறியப்பட்ட கைரேகைகள் அல்லது AI இன் முறையற்ற பயன்பாட்டின் புதிய நிகழ்வுகளைத் தேடும் ஒன்பது கண்டுபிடிப்பாளர்களைப் பயன்படுத்துகிறது. ஸ்பிரிங்கர் நேச்சரின் சுற்றுச்சூழல் அறிவியல் மற்றும் மாசு ஆராய்ச்சி இல் மட்டும் 78 ஆய்வுக் கட்டுரைகளைக் கண்டறிந்தனர்.
ஆனால் இது ஒரு கடினமான போராட்டம்.
ஏற்கனவே எல்லா இடங்களிலும் ஏராளமான AI உள்ளடக்கம் இருப்பதால் அதைக் கண்டறிவது கிட்டத்தட்ட சாத்தியமற்றதாகி வருகிறது; அது பிரச்சினையின் ஒரு பகுதி மட்டுமே. அறிவியல் இதழ்கள் மற்றொரு பிரச்சனை.
சந்தேகத்திற்குரிய உள்ளடக்கத்தைப் பாதுகாப்பதாக இருந்தாலும் கூட, பத்திரிகைகள் தங்கள் நற்பெயரைப் பாதுகாக்கவும், பின்வாங்கல்களைத் தவிர்க்கவும் அனைத்து ஊக்கத்தையும் கொண்டுள்ளன. உதாரணத்திற்கு: எல்சேவியர் ஆரம்பத்தில் ஒரு திருத்தத்தை வெளியிடுவதற்கு முன்பு “தாவர எலக்ட்ரான் நுண்ணோக்கி” பயன்பாட்டை நியாயப்படுத்த முயன்றார். அவர்கள் இறுதியில் ஒரு திருத்தத்தை வெளியிட்டனர், ஆனால் பதில் தெளிவாக உள்ளது.
பிரச்சனை என்னவென்றால், தொழில்நுட்ப நிறுவனங்கள் தங்கள் பயிற்சி தரவு மற்றும் முறைகள் குறித்து வெளிப்படையாக இல்லாத வரை, ஆராய்ச்சியாளர்கள் துப்பறியும் நபராக விளையாட வேண்டும் மற்றும் வெளியீட்டு வைக்கோலில் AI ஊசிகளைத் தேட வேண்டும். ஒரு மதிப்பீட்டின்படி, ஆண்டுக்கு கிட்டத்தட்ட 3 மில்லியன் ஆவணங்கள் வெளியிடப்படுகின்றன, மேலும் எழுத்தில் AI இன் பயன்பாடு மேலும் மேலும் பொதுவானதாகி வருகிறது.
உண்மையான ஆபத்து என்னவென்றால், இந்த வகையான தற்செயலான பிழைகள் நமது அறிவியல் பதிவில் வேரூன்றக்கூடும் – மேலும் உட்பொதிக்கப்பட்டவுடன், AI அமைப்புகள் அவற்றை மீண்டும் மீண்டும் செய்யும். அறிவு படிப்படியாக அதிகரித்து வருகிறது, தவறான அடித்தளங்களில் நாம் கட்டமைத்தால், விளைவுகள் கடுமையாக இருக்கும்.
இறுதியில், டிஜிட்டல் மயமாக்கப்பட்டு வெளியிடப்பட்டவுடன், முட்டாள்தனம் கூட அழியாததாகத் தெரிகிறது.
மூலம்: ZME அறிவியல் & தொழில்நுட்பம் / டிக்பு நியூஸ் டெக்ஸ்