எதற்கெடுத்தாலும் சாட்ஜிபிடியை பயன்படுத்துவதை எல்லாம் விட்டுத்தள்ளுங்கள், நீங்கள் நினைத்தால் உங்களுக்கான சாட்ஜிபிடி போன்ற சொந்த சாட்பாட்டை உருவாக்கி கொள்ளலாம் தெரியுமா? பிரான்க் ஆடம்ஸ் என்பவர் இதற்கு வழிகாட்டும் எளிய கட்டுரையை எழுதியிருக்கிறார்.
ஆடம்சின் அந்த கட்டுரை, சாட்ஜிபிடி போன்ற ஏஐ சாட்பாட்களுக்கு பின்னணியில் இருக்கும், மிகப்பெரிய மொழி மாதிரிகளைப் போல (Large Language Models (LLMs)), தனிநபர்கள் தங்களுக்கான சிறிய மொழி மாதிரிகளை உருவாக்கி கொள்ள வழிகாட்டுகிறது.
மொழி மாதிரி என்பதை இந்த இடத்தில் ஏஐ சாட்பாட்களின் மூளை அல்லது அவற்றுக்கான தகவல் சுரங்கம் என புரிந்து கொள்ளலாம். அதாவது, எழுத்து வடிவிலான ஆக்கங்களின் தொகுப்பு மற்றும் அவற்றுக்கிடையே உள்ள தொடர்புகளின் குறிப்புகள் அடங்கிய தரவுகள் பட்டியல்.
உரையாடலின் போது கேட்கப்படும் கேள்விகளுக்கு ஏற்ப, இந்த பட்டியலில் இருந்து பொருத்தமான பதில்களை சாட்பாட்கள் உருவி தருகின்றன. ( இது பற்றி விரிவாக அறிய சாட்ஜிபிடி தொடர்களை வாசிக்கவும்).
இத்தகைய மொழி மாதிரிகள் ஏறக்குறைய இணையத்தில் பதிவேற்றப்பட்டுள்ள பெரும்பாலான எழுத்து வடிவிலான தகவல்களை உள்ளடக்கியிருப்பதால் பெரும் மொழி மாதிரிகள் என கொள்ளப்படுகின்றன. இதே போலவே தனிநபர்களும் தங்களுக்கான சிறிய மொழி மாதிரிகளை உருவாக்கி கொள்ளலாம்.
இதற்கான முதல்படி உங்களிடம் உள்ள அனைத்து முக்கிய ஆவணங்களையும், தொகுத்து சிறிய பகுதிகளாக பிரித்துக்கொள்ள வேண்டும். ஒவ்வொரு பகுதியும் தேடக்கூடிய ஒரு ஒரு தகவல் துண்டை குறிக்க வேண்டும். ஆவணங்கள் பிடிஎப் கோப்புகள் போன்றவையாக இருக்கலாம். இதை எழுத்து தொகுப்பு அல்லது சேகரம் எனலாம். ஆங்கிலத்தில் டெக்ஸ்ட் கார்பஸ்.
அடுத்த கட்டமாக, இந்த தொகுப்பில் உள்ள சிறு சிறு தகவல்களை அவற்றுக்கு இணையான எண்ணாக ( வெக்டார் ) மாற்றிக்கொள்ள வேண்டும். இந்த எண் குறியீடுகள் எல்லாவற்றையும் தொகுத்து, அவற்றுக்கு இணையான எழுத்து தகவல்களையும் சேமித்து வைக்க வேண்டும்.
இதன் பின், கேள்விகளை வெக்டார் வடிவமாக்கி அதற்கேற்ற வெக்டார்களை மேலே சொன்ன தொகுப்பில் இருந்து பதிலாக பெற வேண்டும். இதனிடையே, ஒரு வெக்டாருக்கு அருகாமையில் உள்ள இன்னொரு பொருத்தமான வெக்டாரை தேடுவது போன்றவையும் நிகழும்.
இவ்வாறு செய்துவிட்டால் உங்களுக்கான தனிப்பட்ட சாட்பாட்டை உருவாக்கி கொள்ளலாம். இதே முறையில் தான் சாட்ஜிபிடியும் செயல்படுகிறது. என்ன அதன் அளவு சற்று பெரியது.
எதற்கெடுத்தாலும் சாட்ஜிபிடியை பயன்படுத்துவதை எல்லாம் விட்டுத்தள்ளுங்கள், நீங்கள் நினைத்தால் உங்களுக்கான சாட்ஜிபிடி போன்ற சொந்த சாட்பாட்டை உருவாக்கி கொள்ளலாம் தெரியுமா? பிரான்க் ஆடம்ஸ் என்பவர் இதற்கு வழிகாட்டும் எளிய கட்டுரையை எழுதியிருக்கிறார்.
ஆடம்சின் அந்த கட்டுரை, சாட்ஜிபிடி போன்ற ஏஐ சாட்பாட்களுக்கு பின்னணியில் இருக்கும், மிகப்பெரிய மொழி மாதிரிகளைப் போல (Large Language Models (LLMs)), தனிநபர்கள் தங்களுக்கான சிறிய மொழி மாதிரிகளை உருவாக்கி கொள்ள வழிகாட்டுகிறது.
மொழி மாதிரி என்பதை இந்த இடத்தில் ஏஐ சாட்பாட்களின் மூளை அல்லது அவற்றுக்கான தகவல் சுரங்கம் என புரிந்து கொள்ளலாம். அதாவது, எழுத்து வடிவிலான ஆக்கங்களின் தொகுப்பு மற்றும் அவற்றுக்கிடையே உள்ள தொடர்புகளின் குறிப்புகள் அடங்கிய தரவுகள் பட்டியல்.
உரையாடலின் போது கேட்கப்படும் கேள்விகளுக்கு ஏற்ப, இந்த பட்டியலில் இருந்து பொருத்தமான பதில்களை சாட்பாட்கள் உருவி தருகின்றன. ( இது பற்றி விரிவாக அறிய சாட்ஜிபிடி தொடர்களை வாசிக்கவும்).
இத்தகைய மொழி மாதிரிகள் ஏறக்குறைய இணையத்தில் பதிவேற்றப்பட்டுள்ள பெரும்பாலான எழுத்து வடிவிலான தகவல்களை உள்ளடக்கியிருப்பதால் பெரும் மொழி மாதிரிகள் என கொள்ளப்படுகின்றன. இதே போலவே தனிநபர்களும் தங்களுக்கான சிறிய மொழி மாதிரிகளை உருவாக்கி கொள்ளலாம்.
இதற்கான முதல்படி உங்களிடம் உள்ள அனைத்து முக்கிய ஆவணங்களையும், தொகுத்து சிறிய பகுதிகளாக பிரித்துக்கொள்ள வேண்டும். ஒவ்வொரு பகுதியும் தேடக்கூடிய ஒரு ஒரு தகவல் துண்டை குறிக்க வேண்டும். ஆவணங்கள் பிடிஎப் கோப்புகள் போன்றவையாக இருக்கலாம். இதை எழுத்து தொகுப்பு அல்லது சேகரம் எனலாம். ஆங்கிலத்தில் டெக்ஸ்ட் கார்பஸ்.
அடுத்த கட்டமாக, இந்த தொகுப்பில் உள்ள சிறு சிறு தகவல்களை அவற்றுக்கு இணையான எண்ணாக ( வெக்டார் ) மாற்றிக்கொள்ள வேண்டும். இந்த எண் குறியீடுகள் எல்லாவற்றையும் தொகுத்து, அவற்றுக்கு இணையான எழுத்து தகவல்களையும் சேமித்து வைக்க வேண்டும்.
இதன் பின், கேள்விகளை வெக்டார் வடிவமாக்கி அதற்கேற்ற வெக்டார்களை மேலே சொன்ன தொகுப்பில் இருந்து பதிலாக பெற வேண்டும். இதனிடையே, ஒரு வெக்டாருக்கு அருகாமையில் உள்ள இன்னொரு பொருத்தமான வெக்டாரை தேடுவது போன்றவையும் நிகழும்.
இவ்வாறு செய்துவிட்டால் உங்களுக்கான தனிப்பட்ட சாட்பாட்டை உருவாக்கி கொள்ளலாம். இதே முறையில் தான் சாட்ஜிபிடியும் செயல்படுகிறது. என்ன அதன் அளவு சற்று பெரியது.