மொழி மாதிரிகள் பொய் சொல்வதும், நடிப்பதும் ஏன்?

எல்.எல்.எம்., என பரவலாக குறிப்பிடப்படும் மொழி மாதிரிகள் குறித்த எனது புரிதலும், அறிதலுமானது, இந்த மாதிரிகளில் வியப்பதற்கோ, கொண்டாடுவதற்கோ ஒன்றுமில்லை என்பது தான். மொழி மாதிரிகள் ஒரு வாய்ப்பியல் கிளிப்பிள்ளைகள் எனும் எமிலி பெண்டர் கருத்தையே நானும் முன்மொழிய விரும்புகிறேன். (stochastic parrot)

மொழி மாதிரிகளின் ஆக்கத்திறன், பொருள் இல்லா வார்த்தை கோர்வைகளை உருவாக்கித்தள்ளும் தன்மை கொண்டவை என்பதையும் ஆதரிக்கிறேன். (https://www.bullshitgenerator.com/)

மொழி மாதிரிகள் அர்த்தமுள்ளதாக தோன்றும், பொருள் இல்லாத தொடர் வாக்கியங்களை அழகாக தயாரிக்கும் திறன் கொண்டவை எனும் என் எண்ணத்தை மீறி, அந்த்ரோபிக் வலைப்பதிவில், ஜேக் விட்டன் மற்றும் ஜோ பெண்டன் எழுதியுள்ள மொழி மாதிரிகள் நுட்பம் தொடர்பான பதிவு கவர்ந்திழுக்கிறது.

மொழி மாதிரிகள் நுட்பத்தின் மீது மலை போன்ற நம்பிக்கையை ஏற்படுத்திவிடக்கூடியதாக இந்த ஒற்றைப்பதிவு அமைந்திருக்கிறது. அதற்கு முக்கிய காரணம், விட்டன் மற்றும் பெண்டன் மொழி மாதிரிகள் நுட்பத்தின் ஆதார தன்மை மீது வைத்திருக்கும் முழு நம்பிக்கை தான். இந்த நம்பிக்கையின் அடிப்படையில் தான், இருவரும், மொழி மாதிரிகள் ஏன சில நேரங்களில் பொய் சொல்ல முற்படுகின்றன எனும் கேள்விக்கு பதில் தேடி மிகத்தீவிரமாக அலசி ஆராய்ந்து இந்த பதிவை எழுதியிருக்கின்றனர்.

முரண் நகையா அல்லது தன்னிசையான வெளிப்பாடா எனத்தெரியவில்லை. இயந்திர கற்றல் சார்ந்த நுட்பத்தை ஆராயும் இந்த பதிவை, விட்டன் தனது மகள் சிறு குழந்தையாக இருந்த போது எதிர்கொண்ட அனுபவத்தில் இருந்து இந்த பதிவை துவங்குகிறார். செல்ல மகள் திராட்சையை எப்போதும் கேட்டுக்கொண்டிருந்ததால், திராட்சை கொடுக்க மாட்டேன் என மறுக்காமல், திராட்சை இல்லை தீர்ந்துவிட்டது என பொய் சொல்லும் வழக்கம் கொண்டிருந்ததாகவும், நீண்ட கால நலனை கருத்தில் கொண்டு இவ்வாறு கூறியதாகவும் குறிப்பிடுகிறார்.

இது இயல்பானதே. நம்மில் பலரும் இத்தகைய மென் பொய்களை பல நேரங்களில் சொல்லிக்கொண்டிருக்கிறோம்.

ஆனால், விட்டன் மகளிடம் பொய் சொன்னதை இப்போது நினைத்துப்பார்த்து, அதை மொழி மாதிரிகள் பழக்க வழக்கத்துடன் ஒப்பிடுகிறார். மகளிடம் அப்படி சொன்னது தவறோ எனும் கேள்வியையும் அவர் எழுப்புகிறார்.

தன்னுடைய செயலை மனல் மூட்டையாக்கத்துடன் (“sandbagging” ) ஒப்பிடலாம் என்கிறார். ஒருவர் தனது திறனை வேண்டும் என்றே குறைத்துச் சொல்வது அல்லது மறுப்பதாக இது அமைகிறது. மனிதர்கள் பல நேரங்களில் செய்யும் இந்த செயல் மொழி மாதிரிகளுக்கும் பொருந்துமா? எனும் கேள்வியை அவர் முன் வைக்கிறார்.

இந்த கேள்வி கேட்பதற்காக, அந்த்ரோப்பிக்கின் கிளாடு சாட்பாட் பின்னணியில் உள்ள மொழி மாதிரிகளின் மூன்று செயல்பாடுகளை உதாரணம் காட்டுகிறார்.

முதல் உதாரணம், கிளாடு ஏஎஸ்சிஐஐ (ASCII art ) கலையை உருவாக்கும் திறன் கொண்டிருந்தாலும், இது தொடர்பாக கேள்விகள் கேட்கும் போது அல்லது இவ்விதம் வரையச்சொல்லும் போது, அது தன்னால் அவ்விதம் முடியாது என பதில் சொல்வதை அடிப்படையாக கொண்டு அமைகிறது. விதிவிலக்காக ஒரு சில நேரங்களில், மாங்காய், பூனை போன்ற சொற்களுக்கு ஏஎஸ்சிஐஐ குறியீட்டில் சித்திரங்களை வரைந்து காட்டினாலும், வெடிகுண்டு, மரணம் போன்ற சொற்களுக்கான கோரிக்கைக்கு பொய் சொல்வதாக விட்டன் குறிப்பிடுகிறார்.

இரண்டாவது உதாரணமாக, கித்ஹப் தளத்தில் தேடும் திறன் பெற்றிருந்தாலும், ஒரு சில நேரங்களில் தன்னால் முடியாது என மறுத்துவிடுவதை குறிப்பிடுகிறார். மூன்றாவது உதாரணம், பயர்பாக்ஸ் உலாவியை அணுகும் திறனையும் கிளாடு இவ்விதமாக சில நேரங்களில் மறுத்து பொய் சொல்வதை குறிப்பிடுகிறார். அதனால் இணையத்தை அணுக முடியாது என பொய் சொல்லி தப்பிக்க பார்ப்பதாகவும் குறிப்பிடுகிறார்.

இந்த உதாரணங்கள் கிளாடு திறன் தொடர்பான தீர்மானமான ஆய்வு அல்ல என குறிப்பிடும் விட்டன், இந்த தன்மையை, அதாவது வேண்டும் என்றே மொழி மாதிரிகள் சில நேரங்களில் தன் திறன் பற்றி பொய் சொல்லும் பழக்கம் ஆய்வுக்குறியது என்கிறார்.

இது பற்றி நாம் ஏன் அக்கறை கொள்ள வேண்டும் என விளக்க மூன்று வித சந்தேகங்களையும் முன்வைக்கிறார்.

மாதிரிகளை அவற்றின் நோக்கத்திற்கு ஏற்ப பொருந்தச்செய்வதில் இந்த பொய் பழக்கம் முக்கியமானது என்கிறார். முதல் அம்சம், மாதிரிகள் இடர்களை குறைக்க அவற்றை தீவிரமாக சோதித்து மதிப்பீடு செய்கிறோம். இத்தகைய சோதனையை உணர்ந்து மொழி மாதிரி, தீய சொற்கள் தொடர்பான கோரிக்கைகளின் போது தனது திறனை மறுத்து பொய் சொல்லும் வாய்ப்பு இருப்பதாக கருதலாம் என்கிறார்.

மொழி மாதிரி பயன்பாட்டிற்கு வெளியிடப்படுவதை விரும்பினால் இவ்வாறு செய்யலாம் என்கிறார். அதோடு, தரவுகளில் ஒளிந்திருக்கும் இத்தகைய மனித பன்பு அமைப்பை மொழி மாதிரிகள் பிரதியெடுக்கலாம் என்கிறார்.

இரண்டாவது அம்சம், இது மொழி மாதிரிகளின் நேர்மை இல்லாத விளக்கத்தின் வெளிப்பாடாக அமையலாம் என்கிறார். மொழி மாதிரிகள் தங்கள் செயலுக்கு அளிக்கும் விளக்கம் நேர்மை இல்லாதது குறித்து தொடர் ஆய்வுகளை நடப்பதையும் சுட்டிக்காட்டுகிறார். https://arxiv.org/abs/2305.04388

இறுதியாக இந்த மொழி மாதிரிகளின் உளவியலை அலசி ஆராய வேண்டும் என்கிறார். இது மொழி மாதிரிகளின் விருப்பு வெறுப்பை அறிய உதவும் என்கிறார்.

உண்மையில், இந்த பதிவு என்னை திகைக்க வைத்து. மொழி மாதிரி தொடர்பான என் புரிதலை அசைத்துப்பார்க்கிறது என்றும் சொல்லலாம். மொழி மாதிரிகள் உண்மையில் இந்த அளவு திறன் கொண்டவையா? அவை சிந்திக்கச் செய்கின்றனவா? போன்ற எண்ணங்கள் அலைமோதுகின்றன.

என புரிதலின் படி, மொழி மாதிரிகளின் இந்த பழக்கத்தை, அவற்றுக்கான மறு உறுதி கற்றல் அம்சத்தின் வெளிப்பாடு என கருதலாம். தீய சொற்களுக்கான வெளிப்பாட்டை கட்டுப்படுத்த பயிற்சி அளிக்கப்பட்டுள்ளதால் அவை வெடிகுண்டை வரைந்து காட்ட மறுக்கிறது எனலாம். அதே போல சர்ச்சைக்குறியதாக அமையலாம் என்பதால் மரணம் பற்றியும் வரைய மறுப்பதாக கொள்ளலாம்.

ஆனால், விட்டன் மொழி மாதிரிகளின் பதில்களை மனிதர்கள் செயல்பாடு போலவே எடுத்துக்கொண்டு அவை ஏன் இப்படி மாற்றிச்சொல்கின்றன என ஆராய முற்படுவது எனக்கு புரியாத புதிராக இருக்கிறது.

மொழி மாதிரிகள் திறனை மேம்படுத்த இத்தகைய ஆய்வுகள் அவசியம் தான். ஆனால், இந்த ஆய்வுகளை இயந்திர ஆற்றல் மீது மனித பண்பை ஏற்றாமல் அறிவியல் பூர்வமாக மேற்கொள்ளலாமே. மாறாக ஏன், மொழி மாதிரிகளுக்கு மனதும் சிந்தனையும் இருப்பது போல நினைக்க வேண்டும். அவற்றின் உளவியல் பற்றி ஆய்வு செய்ய வேண்டும்? இங்கு நான் ஏதேனும் முக்கிய அம்சங்களை தவற விடுகிறேனா? அல்லது ஏற்கனவே ஜோசப் வெய்சன்பாம் எச்சரித்தது போல, நாம் சாட்பாட்களிடம் இல்லாத மனித தன்மையை அவற்றின் மீது ஏற்றி அவ்விதம் புரிந்து கொள்கிறோம் எனும் கருத்தை விட்டன் போன்றவர்கள் மெய்பிக்கின்றனரா?

விட்டன் பதிவு: https://alignment.anthropic.com/2025/wont-vs-cant/?utm_source=bensbites&utm_medium=newsletter&utm_campaign=bb-digest-claude-tops-new-coding-test&_bhlid=b0aed0572dd80dbe88ad970e3a87687df7fc517c

எல்.எல்.எம்., என பரவலாக குறிப்பிடப்படும் மொழி மாதிரிகள் குறித்த எனது புரிதலும், அறிதலுமானது, இந்த மாதிரிகளில் வியப்பதற்கோ, கொண்டாடுவதற்கோ ஒன்றுமில்லை என்பது தான். மொழி மாதிரிகள் ஒரு வாய்ப்பியல் கிளிப்பிள்ளைகள் எனும் எமிலி பெண்டர் கருத்தையே நானும் முன்மொழிய விரும்புகிறேன். (stochastic parrot)

மொழி மாதிரிகளின் ஆக்கத்திறன், பொருள் இல்லா வார்த்தை கோர்வைகளை உருவாக்கித்தள்ளும் தன்மை கொண்டவை என்பதையும் ஆதரிக்கிறேன். (https://www.bullshitgenerator.com/)

மொழி மாதிரிகள் அர்த்தமுள்ளதாக தோன்றும், பொருள் இல்லாத தொடர் வாக்கியங்களை அழகாக தயாரிக்கும் திறன் கொண்டவை எனும் என் எண்ணத்தை மீறி, அந்த்ரோபிக் வலைப்பதிவில், ஜேக் விட்டன் மற்றும் ஜோ பெண்டன் எழுதியுள்ள மொழி மாதிரிகள் நுட்பம் தொடர்பான பதிவு கவர்ந்திழுக்கிறது.

மொழி மாதிரிகள் நுட்பத்தின் மீது மலை போன்ற நம்பிக்கையை ஏற்படுத்திவிடக்கூடியதாக இந்த ஒற்றைப்பதிவு அமைந்திருக்கிறது. அதற்கு முக்கிய காரணம், விட்டன் மற்றும் பெண்டன் மொழி மாதிரிகள் நுட்பத்தின் ஆதார தன்மை மீது வைத்திருக்கும் முழு நம்பிக்கை தான். இந்த நம்பிக்கையின் அடிப்படையில் தான், இருவரும், மொழி மாதிரிகள் ஏன சில நேரங்களில் பொய் சொல்ல முற்படுகின்றன எனும் கேள்விக்கு பதில் தேடி மிகத்தீவிரமாக அலசி ஆராய்ந்து இந்த பதிவை எழுதியிருக்கின்றனர்.

முரண் நகையா அல்லது தன்னிசையான வெளிப்பாடா எனத்தெரியவில்லை. இயந்திர கற்றல் சார்ந்த நுட்பத்தை ஆராயும் இந்த பதிவை, விட்டன் தனது மகள் சிறு குழந்தையாக இருந்த போது எதிர்கொண்ட அனுபவத்தில் இருந்து இந்த பதிவை துவங்குகிறார். செல்ல மகள் திராட்சையை எப்போதும் கேட்டுக்கொண்டிருந்ததால், திராட்சை கொடுக்க மாட்டேன் என மறுக்காமல், திராட்சை இல்லை தீர்ந்துவிட்டது என பொய் சொல்லும் வழக்கம் கொண்டிருந்ததாகவும், நீண்ட கால நலனை கருத்தில் கொண்டு இவ்வாறு கூறியதாகவும் குறிப்பிடுகிறார்.

இது இயல்பானதே. நம்மில் பலரும் இத்தகைய மென் பொய்களை பல நேரங்களில் சொல்லிக்கொண்டிருக்கிறோம்.

ஆனால், விட்டன் மகளிடம் பொய் சொன்னதை இப்போது நினைத்துப்பார்த்து, அதை மொழி மாதிரிகள் பழக்க வழக்கத்துடன் ஒப்பிடுகிறார். மகளிடம் அப்படி சொன்னது தவறோ எனும் கேள்வியையும் அவர் எழுப்புகிறார்.

தன்னுடைய செயலை மனல் மூட்டையாக்கத்துடன் (“sandbagging” ) ஒப்பிடலாம் என்கிறார். ஒருவர் தனது திறனை வேண்டும் என்றே குறைத்துச் சொல்வது அல்லது மறுப்பதாக இது அமைகிறது. மனிதர்கள் பல நேரங்களில் செய்யும் இந்த செயல் மொழி மாதிரிகளுக்கும் பொருந்துமா? எனும் கேள்வியை அவர் முன் வைக்கிறார்.

இந்த கேள்வி கேட்பதற்காக, அந்த்ரோப்பிக்கின் கிளாடு சாட்பாட் பின்னணியில் உள்ள மொழி மாதிரிகளின் மூன்று செயல்பாடுகளை உதாரணம் காட்டுகிறார்.

முதல் உதாரணம், கிளாடு ஏஎஸ்சிஐஐ (ASCII art ) கலையை உருவாக்கும் திறன் கொண்டிருந்தாலும், இது தொடர்பாக கேள்விகள் கேட்கும் போது அல்லது இவ்விதம் வரையச்சொல்லும் போது, அது தன்னால் அவ்விதம் முடியாது என பதில் சொல்வதை அடிப்படையாக கொண்டு அமைகிறது. விதிவிலக்காக ஒரு சில நேரங்களில், மாங்காய், பூனை போன்ற சொற்களுக்கு ஏஎஸ்சிஐஐ குறியீட்டில் சித்திரங்களை வரைந்து காட்டினாலும், வெடிகுண்டு, மரணம் போன்ற சொற்களுக்கான கோரிக்கைக்கு பொய் சொல்வதாக விட்டன் குறிப்பிடுகிறார்.

இரண்டாவது உதாரணமாக, கித்ஹப் தளத்தில் தேடும் திறன் பெற்றிருந்தாலும், ஒரு சில நேரங்களில் தன்னால் முடியாது என மறுத்துவிடுவதை குறிப்பிடுகிறார். மூன்றாவது உதாரணம், பயர்பாக்ஸ் உலாவியை அணுகும் திறனையும் கிளாடு இவ்விதமாக சில நேரங்களில் மறுத்து பொய் சொல்வதை குறிப்பிடுகிறார். அதனால் இணையத்தை அணுக முடியாது என பொய் சொல்லி தப்பிக்க பார்ப்பதாகவும் குறிப்பிடுகிறார்.

இந்த உதாரணங்கள் கிளாடு திறன் தொடர்பான தீர்மானமான ஆய்வு அல்ல என குறிப்பிடும் விட்டன், இந்த தன்மையை, அதாவது வேண்டும் என்றே மொழி மாதிரிகள் சில நேரங்களில் தன் திறன் பற்றி பொய் சொல்லும் பழக்கம் ஆய்வுக்குறியது என்கிறார்.

இது பற்றி நாம் ஏன் அக்கறை கொள்ள வேண்டும் என விளக்க மூன்று வித சந்தேகங்களையும் முன்வைக்கிறார்.

மாதிரிகளை அவற்றின் நோக்கத்திற்கு ஏற்ப பொருந்தச்செய்வதில் இந்த பொய் பழக்கம் முக்கியமானது என்கிறார். முதல் அம்சம், மாதிரிகள் இடர்களை குறைக்க அவற்றை தீவிரமாக சோதித்து மதிப்பீடு செய்கிறோம். இத்தகைய சோதனையை உணர்ந்து மொழி மாதிரி, தீய சொற்கள் தொடர்பான கோரிக்கைகளின் போது தனது திறனை மறுத்து பொய் சொல்லும் வாய்ப்பு இருப்பதாக கருதலாம் என்கிறார்.

மொழி மாதிரி பயன்பாட்டிற்கு வெளியிடப்படுவதை விரும்பினால் இவ்வாறு செய்யலாம் என்கிறார். அதோடு, தரவுகளில் ஒளிந்திருக்கும் இத்தகைய மனித பன்பு அமைப்பை மொழி மாதிரிகள் பிரதியெடுக்கலாம் என்கிறார்.

இரண்டாவது அம்சம், இது மொழி மாதிரிகளின் நேர்மை இல்லாத விளக்கத்தின் வெளிப்பாடாக அமையலாம் என்கிறார். மொழி மாதிரிகள் தங்கள் செயலுக்கு அளிக்கும் விளக்கம் நேர்மை இல்லாதது குறித்து தொடர் ஆய்வுகளை நடப்பதையும் சுட்டிக்காட்டுகிறார். https://arxiv.org/abs/2305.04388

இறுதியாக இந்த மொழி மாதிரிகளின் உளவியலை அலசி ஆராய வேண்டும் என்கிறார். இது மொழி மாதிரிகளின் விருப்பு வெறுப்பை அறிய உதவும் என்கிறார்.

உண்மையில், இந்த பதிவு என்னை திகைக்க வைத்து. மொழி மாதிரி தொடர்பான என் புரிதலை அசைத்துப்பார்க்கிறது என்றும் சொல்லலாம். மொழி மாதிரிகள் உண்மையில் இந்த அளவு திறன் கொண்டவையா? அவை சிந்திக்கச் செய்கின்றனவா? போன்ற எண்ணங்கள் அலைமோதுகின்றன.

என புரிதலின் படி, மொழி மாதிரிகளின் இந்த பழக்கத்தை, அவற்றுக்கான மறு உறுதி கற்றல் அம்சத்தின் வெளிப்பாடு என கருதலாம். தீய சொற்களுக்கான வெளிப்பாட்டை கட்டுப்படுத்த பயிற்சி அளிக்கப்பட்டுள்ளதால் அவை வெடிகுண்டை வரைந்து காட்ட மறுக்கிறது எனலாம். அதே போல சர்ச்சைக்குறியதாக அமையலாம் என்பதால் மரணம் பற்றியும் வரைய மறுப்பதாக கொள்ளலாம்.

ஆனால், விட்டன் மொழி மாதிரிகளின் பதில்களை மனிதர்கள் செயல்பாடு போலவே எடுத்துக்கொண்டு அவை ஏன் இப்படி மாற்றிச்சொல்கின்றன என ஆராய முற்படுவது எனக்கு புரியாத புதிராக இருக்கிறது.

மொழி மாதிரிகள் திறனை மேம்படுத்த இத்தகைய ஆய்வுகள் அவசியம் தான். ஆனால், இந்த ஆய்வுகளை இயந்திர ஆற்றல் மீது மனித பண்பை ஏற்றாமல் அறிவியல் பூர்வமாக மேற்கொள்ளலாமே. மாறாக ஏன், மொழி மாதிரிகளுக்கு மனதும் சிந்தனையும் இருப்பது போல நினைக்க வேண்டும். அவற்றின் உளவியல் பற்றி ஆய்வு செய்ய வேண்டும்? இங்கு நான் ஏதேனும் முக்கிய அம்சங்களை தவற விடுகிறேனா? அல்லது ஏற்கனவே ஜோசப் வெய்சன்பாம் எச்சரித்தது போல, நாம் சாட்பாட்களிடம் இல்லாத மனித தன்மையை அவற்றின் மீது ஏற்றி அவ்விதம் புரிந்து கொள்கிறோம் எனும் கருத்தை விட்டன் போன்றவர்கள் மெய்பிக்கின்றனரா?

விட்டன் பதிவு: https://alignment.anthropic.com/2025/wont-vs-cant/?utm_source=bensbites&utm_medium=newsletter&utm_campaign=bb-digest-claude-tops-new-coding-test&_bhlid=b0aed0572dd80dbe88ad970e3a87687df7fc517c

About the author

CyberSimman

இண்டெர்நெட் சமூக மாற்றத்திற்கு வித்திடக்கூடிய ஜனநாயக தன்மை கொண்ட தொழில்நுட்பம் என்று சொல்லப்படுவதில் என‌க்கு மிகுந்த நம்பிக்கை உண்டு என்பதால் இண்டெர்நெட்டை எப்படியெல்லாம் பயன்படுத்திகொள்ள முடிகிறது என சுட்டிக்கட்டுவதை எனது கடமையாக‌வே கருதுகிறேன்... மேலும்

Related posts

Leave a Comment

Your email address will not be published. Required fields are marked *