இதுவரை ரோபோ டெக்ஸ்டிற்கான தமிழ் சொல் இல்லை. ரோபோ டெக்ஸ்ட் (robots txt ) என்றால், தேடியந்திரங்கள் சார்பாக உள்ளட்டக்க பட்டியலுக்காக வந்து நிற்கும் வலை சிலந்திகளிடம், எந்த பக்கங்களை எல்லாம் பட்டியலிடலாம் என தெரிவிக்கும் கோப்பு. எனவே தமிழல், இயந்திர அனுமதி கோப்பு என கொள்ளலாம்.
இந்த கோப்பின் அழகு என்னவெனில், ஒரே நேரத்தில் இது அனுமதி அளிக்கவும் செய்கிறது, விலகி நிற்கவும் சொல்கிறது.
ரோபோ டெக்ஸ்டை இணைய உலகின் எழுதப்படாத ஒப்பந்தம் என புரிந்து கொள்ளலாம். அதாவது, தகவல்களை சேகரிக்க வரும் தேடியந்திர மென்பொருள்கள் எந்த வகை தகவல்களுக்கு அனுமதி உண்டு/ இல்லை என சொல்வதற்கான ஒப்பந்தம்.
கூகுள் உள்ளிட்ட தேடியந்திரங்கள் இணையத்தை அடிக்கடி துழாவி கோடிக்கணக்கான பக்கங்களை பட்டயலிட்டு, அவற்றை புதுப்பித்து, நாம் தேடும் தகவல்களை தேடித்தருகின்றன. இதற்காக இணையத்தில் உலாவ, கிராளர்கள் எனப்படும், மென்பொருள்கள் அல்லது பாட்களை பயன்படுத்துகின்றன. இந்த பாட்கள் பொதுவாக வலை சிலந்திகள் என குறிப்பிடப்படுகின்றன.
ஒவ்வொரு இணையதளமாக இந்த பாட்கள் சென்றாலும், தளங்களில் நுழைய உடனே அனுமதி கிடைத்துவிடுவதில்லை. அதற்கு முன், தளத்தின் சார்பில், அதில் உள்ள எந்த பக்கங்களை எல்லாம் சேகரித்து பட்டியலிடலாம், எவற்றை தவிர்க்கலாம் என சொல்லப்படுகிறது. இந்த பணியை செய்வது தான் இயந்திர கோப்பின் நோக்கம்.
இணையத்தின் முதல் தேடியந்திரம் என கருதப்படும் அலி வெப் (ALIWEB) தேடுபொறியை உருவாக்கிய மென்பொருளாலர் மார்ட்டீன் கோஸ்டர் (Martijn Koster ) தான் முதன் முதலில் இந்த இயந்திர கோப்பை உருவாக்கினார். இந்த உருவாக்கம் காரணமாகவே அலி வெப் முதல் தேடியந்திரம் என குறிப்பிடப்படுகிறது. மற்றபடி வேறு சில தேடியந்திரங்களையும் இதற்காக பரிசீலிக்க வேண்டும்.
இயந்திர கோப்பு என்பது, ஒரு வகையான அனுமதி சீட்டு. ஆனால் முழுவதும் கறாரானது அல்ல. கிட்டத்தட்ட கனவான்கள் ஒப்பந்தம் போல. தேடுபொறிகள் இதை பெரும்பாலும் மதிக்கின்றன. மீறினாலும் ஒன்றும் செய்வதற்கில்லை.
தேடியந்திரங்கள் எவ்வளவோ முன்னேறி இருந்தாலும், இந்த இயந்திர கோப்பு முறை அவற்றின் அடிப்படை அம்சங்களில் ஒன்றாக இருக்கிறது. பெரும்பாலும் எஸ்.இ.ஓ உத்திகளில் ஈடுபடுபவர்களால் கவனிக்கப்படும் இந்த இயந்திர கோப்பு ஏஐ உலகில் வெகுமக்கள் கவனத்தை ஈர்க்கத்துவங்கியுள்ளது. ஏனெனில் சாட்ஜிபிடி உள்ளிட்ட சாட்பாட்கள் எந்த உள்ளடக்கத்தை அணுகலாம் கூடாது என தீர்மானிக்க இவை அதிகம் பயன்படுத்தப்படுவது தான்.
*
சாட்பாட்கள் பற்றி இன்னும் விரிவாக அறிய: ‘சாட்ஜிபிடி சரிதம்’ புத்தகம் வாசிக்கவும்.
தொடர்புடைய முந்தைய பதிவு: தொழில்நுட்ப அகராதி: Crawl Budget- துழாவல் கணக்கு
இதுவரை ரோபோ டெக்ஸ்டிற்கான தமிழ் சொல் இல்லை. ரோபோ டெக்ஸ்ட் (robots txt ) என்றால், தேடியந்திரங்கள் சார்பாக உள்ளட்டக்க பட்டியலுக்காக வந்து நிற்கும் வலை சிலந்திகளிடம், எந்த பக்கங்களை எல்லாம் பட்டியலிடலாம் என தெரிவிக்கும் கோப்பு. எனவே தமிழல், இயந்திர அனுமதி கோப்பு என கொள்ளலாம்.
இந்த கோப்பின் அழகு என்னவெனில், ஒரே நேரத்தில் இது அனுமதி அளிக்கவும் செய்கிறது, விலகி நிற்கவும் சொல்கிறது.
ரோபோ டெக்ஸ்டை இணைய உலகின் எழுதப்படாத ஒப்பந்தம் என புரிந்து கொள்ளலாம். அதாவது, தகவல்களை சேகரிக்க வரும் தேடியந்திர மென்பொருள்கள் எந்த வகை தகவல்களுக்கு அனுமதி உண்டு/ இல்லை என சொல்வதற்கான ஒப்பந்தம்.
கூகுள் உள்ளிட்ட தேடியந்திரங்கள் இணையத்தை அடிக்கடி துழாவி கோடிக்கணக்கான பக்கங்களை பட்டயலிட்டு, அவற்றை புதுப்பித்து, நாம் தேடும் தகவல்களை தேடித்தருகின்றன. இதற்காக இணையத்தில் உலாவ, கிராளர்கள் எனப்படும், மென்பொருள்கள் அல்லது பாட்களை பயன்படுத்துகின்றன. இந்த பாட்கள் பொதுவாக வலை சிலந்திகள் என குறிப்பிடப்படுகின்றன.
ஒவ்வொரு இணையதளமாக இந்த பாட்கள் சென்றாலும், தளங்களில் நுழைய உடனே அனுமதி கிடைத்துவிடுவதில்லை. அதற்கு முன், தளத்தின் சார்பில், அதில் உள்ள எந்த பக்கங்களை எல்லாம் சேகரித்து பட்டியலிடலாம், எவற்றை தவிர்க்கலாம் என சொல்லப்படுகிறது. இந்த பணியை செய்வது தான் இயந்திர கோப்பின் நோக்கம்.
இணையத்தின் முதல் தேடியந்திரம் என கருதப்படும் அலி வெப் (ALIWEB) தேடுபொறியை உருவாக்கிய மென்பொருளாலர் மார்ட்டீன் கோஸ்டர் (Martijn Koster ) தான் முதன் முதலில் இந்த இயந்திர கோப்பை உருவாக்கினார். இந்த உருவாக்கம் காரணமாகவே அலி வெப் முதல் தேடியந்திரம் என குறிப்பிடப்படுகிறது. மற்றபடி வேறு சில தேடியந்திரங்களையும் இதற்காக பரிசீலிக்க வேண்டும்.
இயந்திர கோப்பு என்பது, ஒரு வகையான அனுமதி சீட்டு. ஆனால் முழுவதும் கறாரானது அல்ல. கிட்டத்தட்ட கனவான்கள் ஒப்பந்தம் போல. தேடுபொறிகள் இதை பெரும்பாலும் மதிக்கின்றன. மீறினாலும் ஒன்றும் செய்வதற்கில்லை.
தேடியந்திரங்கள் எவ்வளவோ முன்னேறி இருந்தாலும், இந்த இயந்திர கோப்பு முறை அவற்றின் அடிப்படை அம்சங்களில் ஒன்றாக இருக்கிறது. பெரும்பாலும் எஸ்.இ.ஓ உத்திகளில் ஈடுபடுபவர்களால் கவனிக்கப்படும் இந்த இயந்திர கோப்பு ஏஐ உலகில் வெகுமக்கள் கவனத்தை ஈர்க்கத்துவங்கியுள்ளது. ஏனெனில் சாட்ஜிபிடி உள்ளிட்ட சாட்பாட்கள் எந்த உள்ளடக்கத்தை அணுகலாம் கூடாது என தீர்மானிக்க இவை அதிகம் பயன்படுத்தப்படுவது தான்.
*
சாட்பாட்கள் பற்றி இன்னும் விரிவாக அறிய: ‘சாட்ஜிபிடி சரிதம்’ புத்தகம் வாசிக்கவும்.
தொடர்புடைய முந்தைய பதிவு: தொழில்நுட்ப அகராதி: Crawl Budget- துழாவல் கணக்கு