கிளாடு, சாட்ஜிபிடி போன்ற சாட்பாட்களை பயன்படுத்த, பிராம்ட் இஞ்ஜினியரிங் என சொல்லப்படும் தூண்டு பொறியியலை கற்பதற்கு முன், எல்.எல்.எம்., போன்ற அடிப்படை அம்சங்களை ஓரளவேனும் அறிந்து கொள்வது அவசியம்.
எல்.எல்.எம்., (LLM) பற்றி ’சாட்ஜிபிடி சரிதம்’ புத்தகத்தில் விரிவாக எழுதியிருக்கிறேன். பெரும் மொழி மாதிரி என புரிந்து கொள்ளக்கூடிய எல்.எல்.எம் தான் ஏஐ சாட்பாட்களுக்கான அடிப்படை. மொழி மாதிரிகள் என்பவை நியூரால் நெட்வொர்க் என்றாலும், இவை ஆழ் கற்றல் மூலம் இயங்குகின்றன என்று விளக்கம் அளிக்கப்பட்டாலும், ஆக்கத்திறன் ஏஐ நுட்பத்தை உள்வாங்கி கொள்ள, இந்த தொழில்நுட்ப விளக்கங்கள் போதுமானவை அல்ல.
மொழி மாதிரிகளை புரிந்து கொள்ள வேறு விதமான விளக்கங்கள் தேவை. இணையத்தில், எல்.எல்.எம் விளக்க கட்டுரைகள் நிறைய இருக்கின்றன என்றாலும், சிநெட் இணையதளத்தில் அண்மையில் வெளியாகியுள்ள கட்டுரை இதை மிக அழகாக விளக்குகிறது.
இந்த கட்டுரை எல்..எல்.எம் என்றால் என்ன என வரையறுப்பதற்கு முன், சாட்பாட்களுக்கு நன்றாக புரியக்கூடிய விளக்கம் அளிக்கிறது. சாட்பாட்களுடன் உரையாடும் போது நீங்கள் உண்மையில் மறுமுனையில் மனிதர்கள் யாருடனும் பேசுவதில்லை. சாட்பாட்கள் எந்த சொற்களின் பொருளையும் அறிந்தவை அல்ல. மாறாக, அவை எல்.எல்.எம் எனும் மொழி மாதிரிகளுடன் தொடர்பு கொள்வதற்கான இடைமுகம் மட்டுமே என குறிப்பிடப்பட்டுள்ளது.
சாட்பாட்களை இடைமுகம் என புரிந்து கொள்வது சிறந்தது. ஏனெனில் உண்மையில் சாட்பாட்கள் வாயிலாக நாம் அவற்றை இயக்கும் மொழி மாதிரிகளையே தொடர்பு கொள்கிறோம்.
சரி மொழி மாதிரிகள் (language model ) என்றால் என்ன?
மொழி மாதிரிகளை ஏஐ கிளி ஜோஸியம் என புரிந்து கொள்ளலாம். இந்த கட்டுரை எல்.எல்.எம் என்பவை, சொற்களுக்கான கணிப்பாளர் என்கிறது.
மொழி மாதிரி என்பவை, மனிதர்கள் உண்டாக்க கூடிய மொழியை போல தோன்றக்கூடிய மொழியை கணிக்க கூடியவை என பேராசிரியர் ஒருவரின் மேற்கோள் விளக்கமாக அளிக்கப்படுகிறது.
தொடர்ந்து வரும் விளக்கம் இதை அழகாக புரிய வைக்கிறது.
முந்தைய சொற்கள் கொண்டு எதிர்கால சொற்களை கணிக்க கூடிய திறன் கொண்ட ஒன்றே மொழி மாதிரியாகிறது.
மொழி மாதிரி என்பவை, உண்மையில் அடுத்து வரும் சொல்லை யூகிக்கும் வகையில் செயல்படுபவை என்பதை, சாட்ஜிபிடி சரிதம் புத்தகத்தில், சாட்ஜிபிடி எப்படி செயல்படுகிறது என விளக்க பயன்படுத்தியிருக்கிறேன்.
மேலும் அறிய ஜீரோடிகிரி வெளியீடாக வந்திருக்கும் சாட்ஜிபிடி சரிதம் வாசிக்கவும்.
–
கிளாடு, சாட்ஜிபிடி போன்ற சாட்பாட்களை பயன்படுத்த, பிராம்ட் இஞ்ஜினியரிங் என சொல்லப்படும் தூண்டு பொறியியலை கற்பதற்கு முன், எல்.எல்.எம்., போன்ற அடிப்படை அம்சங்களை ஓரளவேனும் அறிந்து கொள்வது அவசியம்.
எல்.எல்.எம்., (LLM) பற்றி ’சாட்ஜிபிடி சரிதம்’ புத்தகத்தில் விரிவாக எழுதியிருக்கிறேன். பெரும் மொழி மாதிரி என புரிந்து கொள்ளக்கூடிய எல்.எல்.எம் தான் ஏஐ சாட்பாட்களுக்கான அடிப்படை. மொழி மாதிரிகள் என்பவை நியூரால் நெட்வொர்க் என்றாலும், இவை ஆழ் கற்றல் மூலம் இயங்குகின்றன என்று விளக்கம் அளிக்கப்பட்டாலும், ஆக்கத்திறன் ஏஐ நுட்பத்தை உள்வாங்கி கொள்ள, இந்த தொழில்நுட்ப விளக்கங்கள் போதுமானவை அல்ல.
மொழி மாதிரிகளை புரிந்து கொள்ள வேறு விதமான விளக்கங்கள் தேவை. இணையத்தில், எல்.எல்.எம் விளக்க கட்டுரைகள் நிறைய இருக்கின்றன என்றாலும், சிநெட் இணையதளத்தில் அண்மையில் வெளியாகியுள்ள கட்டுரை இதை மிக அழகாக விளக்குகிறது.
இந்த கட்டுரை எல்..எல்.எம் என்றால் என்ன என வரையறுப்பதற்கு முன், சாட்பாட்களுக்கு நன்றாக புரியக்கூடிய விளக்கம் அளிக்கிறது. சாட்பாட்களுடன் உரையாடும் போது நீங்கள் உண்மையில் மறுமுனையில் மனிதர்கள் யாருடனும் பேசுவதில்லை. சாட்பாட்கள் எந்த சொற்களின் பொருளையும் அறிந்தவை அல்ல. மாறாக, அவை எல்.எல்.எம் எனும் மொழி மாதிரிகளுடன் தொடர்பு கொள்வதற்கான இடைமுகம் மட்டுமே என குறிப்பிடப்பட்டுள்ளது.
சாட்பாட்களை இடைமுகம் என புரிந்து கொள்வது சிறந்தது. ஏனெனில் உண்மையில் சாட்பாட்கள் வாயிலாக நாம் அவற்றை இயக்கும் மொழி மாதிரிகளையே தொடர்பு கொள்கிறோம்.
சரி மொழி மாதிரிகள் (language model ) என்றால் என்ன?
மொழி மாதிரிகளை ஏஐ கிளி ஜோஸியம் என புரிந்து கொள்ளலாம். இந்த கட்டுரை எல்.எல்.எம் என்பவை, சொற்களுக்கான கணிப்பாளர் என்கிறது.
மொழி மாதிரி என்பவை, மனிதர்கள் உண்டாக்க கூடிய மொழியை போல தோன்றக்கூடிய மொழியை கணிக்க கூடியவை என பேராசிரியர் ஒருவரின் மேற்கோள் விளக்கமாக அளிக்கப்படுகிறது.
தொடர்ந்து வரும் விளக்கம் இதை அழகாக புரிய வைக்கிறது.
முந்தைய சொற்கள் கொண்டு எதிர்கால சொற்களை கணிக்க கூடிய திறன் கொண்ட ஒன்றே மொழி மாதிரியாகிறது.
மொழி மாதிரி என்பவை, உண்மையில் அடுத்து வரும் சொல்லை யூகிக்கும் வகையில் செயல்படுபவை என்பதை, சாட்ஜிபிடி சரிதம் புத்தகத்தில், சாட்ஜிபிடி எப்படி செயல்படுகிறது என விளக்க பயன்படுத்தியிருக்கிறேன்.
மேலும் அறிய ஜீரோடிகிரி வெளியீடாக வந்திருக்கும் சாட்ஜிபிடி சரிதம் வாசிக்கவும்.
–