சாட்ஜிபிடி, கிளாட், ஜெமினி போன்ற சாட்பாட்களுடன் உரையாடும் போது அவை நாம் சொல்வதை எல்லாம் புரிந்து கொண்டு பதில் அளிப்பது போல தோன்றலாம். ஆனால், இந்த சாட்பாட்கள் எதையும் புரிந்து கொள்ளும் திறன் கொண்டவை அல்ல. மாறாக, இந்த சாட்பாட்கள் எல்லாம், அவற்றின் பின்னே இருக்கும் மொழி மாதிரிகளை நாம் தொடர்பு கொள்வதற்கான ஒரு வழி அவ்வளவு தான். கம்ப்யூட்டர் மொழியில் இடைமுகம்!
உண்மையில், ஏஐ சாட்பாட்களுக்கு அடிப்படையாக இருப்பது எல்.எல்.எம் எனப்படும் பெரிய மொழி மாதிரிகள். (large language models, or LLMs ). மொழி மாதிரி என்பவை, வார்த்தைகள் பயன்படுத்தப்படும் விதம், அவற்றுக்கு இடையிலான தொடர்புகளை புரிந்து கொண்டு, எந்த எந்த வார்த்தைகள் எப்படி எந்த வரிசைகளில் தோன்றுகின்றன என்பதை கொண்டு, அதே அடிப்படையில் வார்த்தை தொகுப்பை கணித்து இயங்குபவை.
எல்லாம் சரி மொழி மாதிரி என்றால் என்ன?
மனிதர்கள் பேசும் மொழி எப்படி இருக்கும் என கணிக்கும் அல்லது யூகிக்கும் திறன் கொண்டவை மொழி மாதிரி என்கிறார் அமெரிக்க கம்ப்யூட்டர் துறை பேராசிரியர் மார்க் ரைடல். அதாவது ஏற்கனவே கொடுக்கப்பட்ட சொற்களை கொண்டு அடுத்து வரக்கூடிய சொற்களை யூகிக்க கூடிய திறன் கொண்டதாக மொழி மாதிரிகள் இருக்க வேண்டும் என்கிறார்.
ஏறக்குறைய சொற்களை நமக்கு முன்னதாக முடித்துக்காட்டும் ஆட்டோ கம்ப்ளீட் போன்றது. ஆனால் ஏஐ சாட்பாட்களில், கேள்விகளுக்கு ஏற்ப ஊகித்து பதில் சொல்லக்கூடியதாக அமைகிறது.
மொழி மாதிரி என்றால் பொதுவாக பெரிய மொழி மாதிரியாகவே கொள்ளப்படுகிறது. பெரிய என்றால், எவ்வளவு பெரிய என்று கேட்கலாம். பெரிய என்பது இவற்றுக்கான காரணிகள் (“parameters.”) கொண்டு அளவிடப்படுகின்றது.
அதென்ன காரணிகள்?
மொழி மாதிரிகள் ஏஐ சாட்பாட்களுக்கு அடிப்படை என்றாலும், இவற்றுக்கு ஒரு அடிப்படை இருக்கிறது. நியூரால் நெட்வொர்க் எனப்படும் இயந்திர நரம்பியல் வலைப்பின்னல். இயந்திர கற்றல் மாதிரியால் இயங்கும் இந்த நரம்பியல் வலைப்பின்னல், சொற்களை உள்ளீட்டாக எடுத்துக்கொண்டு, அவற்றின் அடிப்படையில் புதிய சொற்களை உருவாக்கி தரக்கூடியவை. இந்த உருவாக்கத்திற்காக அவை, உள்ளீடு வார்த்தைகளை கொண்டு கணக்கிடுகின்றன. சும்மா கணக்கிட முடியுமா? இதற்கு வழிகாட்ட கோடிக்கணக்கில் காரணிகள் உருவாக்கி தரப்பட்டுள்ளன.
சாஜிபிடியை பொறுத்தவரை 175 கோடிக்கும் அதிகமான காரணிகள் இருக்கலாம் என்கின்றனர். கோடிக்கணக்கான காரணிகள் கொண்டு கணக்கிடும் திறனால் மொழி மாதிரிகள், எந்த சொற்கள் வரிசைக்கும் ஏற்ற, அடுத்து வரும் சொற்கள் வரிசையை கணித்து வழங்குகின்றன. அவை மனிதர்கள் உருவாக்கியது போலவே தோற்றம் தருகின்றன.
இன்னும் விரிவாக அறிய இந்தக்கட்டுரை:
–
சாட்ஜிபிடி, கிளாட், ஜெமினி போன்ற சாட்பாட்களுடன் உரையாடும் போது அவை நாம் சொல்வதை எல்லாம் புரிந்து கொண்டு பதில் அளிப்பது போல தோன்றலாம். ஆனால், இந்த சாட்பாட்கள் எதையும் புரிந்து கொள்ளும் திறன் கொண்டவை அல்ல. மாறாக, இந்த சாட்பாட்கள் எல்லாம், அவற்றின் பின்னே இருக்கும் மொழி மாதிரிகளை நாம் தொடர்பு கொள்வதற்கான ஒரு வழி அவ்வளவு தான். கம்ப்யூட்டர் மொழியில் இடைமுகம்!
உண்மையில், ஏஐ சாட்பாட்களுக்கு அடிப்படையாக இருப்பது எல்.எல்.எம் எனப்படும் பெரிய மொழி மாதிரிகள். (large language models, or LLMs ). மொழி மாதிரி என்பவை, வார்த்தைகள் பயன்படுத்தப்படும் விதம், அவற்றுக்கு இடையிலான தொடர்புகளை புரிந்து கொண்டு, எந்த எந்த வார்த்தைகள் எப்படி எந்த வரிசைகளில் தோன்றுகின்றன என்பதை கொண்டு, அதே அடிப்படையில் வார்த்தை தொகுப்பை கணித்து இயங்குபவை.
எல்லாம் சரி மொழி மாதிரி என்றால் என்ன?
மனிதர்கள் பேசும் மொழி எப்படி இருக்கும் என கணிக்கும் அல்லது யூகிக்கும் திறன் கொண்டவை மொழி மாதிரி என்கிறார் அமெரிக்க கம்ப்யூட்டர் துறை பேராசிரியர் மார்க் ரைடல். அதாவது ஏற்கனவே கொடுக்கப்பட்ட சொற்களை கொண்டு அடுத்து வரக்கூடிய சொற்களை யூகிக்க கூடிய திறன் கொண்டதாக மொழி மாதிரிகள் இருக்க வேண்டும் என்கிறார்.
ஏறக்குறைய சொற்களை நமக்கு முன்னதாக முடித்துக்காட்டும் ஆட்டோ கம்ப்ளீட் போன்றது. ஆனால் ஏஐ சாட்பாட்களில், கேள்விகளுக்கு ஏற்ப ஊகித்து பதில் சொல்லக்கூடியதாக அமைகிறது.
மொழி மாதிரி என்றால் பொதுவாக பெரிய மொழி மாதிரியாகவே கொள்ளப்படுகிறது. பெரிய என்றால், எவ்வளவு பெரிய என்று கேட்கலாம். பெரிய என்பது இவற்றுக்கான காரணிகள் (“parameters.”) கொண்டு அளவிடப்படுகின்றது.
அதென்ன காரணிகள்?
மொழி மாதிரிகள் ஏஐ சாட்பாட்களுக்கு அடிப்படை என்றாலும், இவற்றுக்கு ஒரு அடிப்படை இருக்கிறது. நியூரால் நெட்வொர்க் எனப்படும் இயந்திர நரம்பியல் வலைப்பின்னல். இயந்திர கற்றல் மாதிரியால் இயங்கும் இந்த நரம்பியல் வலைப்பின்னல், சொற்களை உள்ளீட்டாக எடுத்துக்கொண்டு, அவற்றின் அடிப்படையில் புதிய சொற்களை உருவாக்கி தரக்கூடியவை. இந்த உருவாக்கத்திற்காக அவை, உள்ளீடு வார்த்தைகளை கொண்டு கணக்கிடுகின்றன. சும்மா கணக்கிட முடியுமா? இதற்கு வழிகாட்ட கோடிக்கணக்கில் காரணிகள் உருவாக்கி தரப்பட்டுள்ளன.
சாஜிபிடியை பொறுத்தவரை 175 கோடிக்கும் அதிகமான காரணிகள் இருக்கலாம் என்கின்றனர். கோடிக்கணக்கான காரணிகள் கொண்டு கணக்கிடும் திறனால் மொழி மாதிரிகள், எந்த சொற்கள் வரிசைக்கும் ஏற்ற, அடுத்து வரும் சொற்கள் வரிசையை கணித்து வழங்குகின்றன. அவை மனிதர்கள் உருவாக்கியது போலவே தோற்றம் தருகின்றன.
இன்னும் விரிவாக அறிய இந்தக்கட்டுரை:
–