ரோபோ கோப்பு சில குறிப்புகள், சில சிந்தனைகள்

இதுவரை ரோபோ டெக்ஸ்டிற்கான தமிழ் சொல் இல்லை. ரோபோ டெக்ஸ்ட் (robots txt ) என்றால், தேடியந்திரங்கள் சார்பாக உள்ளட்டக்க பட்டியலுக்காக வந்து நிற்கும் வலை சிலந்திகளிடம், எந்த பக்கங்களை எல்லாம் பட்டியலிடலாம் என தெரிவிக்கும் கோப்பு. எனவே தமிழல், இயந்திர அனுமதி கோப்பு என கொள்ளலாம்.

இந்த கோப்பின் அழகு என்னவெனில், ஒரே நேரத்தில் இது அனுமதி அளிக்கவும் செய்கிறது, விலகி நிற்கவும் சொல்கிறது.

ரோபோ டெக்ஸ்டை இணைய உலகின் எழுதப்படாத ஒப்பந்தம் என புரிந்து கொள்ளலாம். அதாவது, தகவல்களை சேகரிக்க வரும் தேடியந்திர மென்பொருள்கள் எந்த வகை தகவல்களுக்கு அனுமதி உண்டு/ இல்லை என சொல்வதற்கான ஒப்பந்தம்.

கூகுள் உள்ளிட்ட தேடியந்திரங்கள் இணையத்தை அடிக்கடி துழாவி கோடிக்கணக்கான பக்கங்களை பட்டயலிட்டு, அவற்றை புதுப்பித்து, நாம் தேடும் தகவல்களை தேடித்தருகின்றன. இதற்காக இணையத்தில் உலாவ, கிராளர்கள் எனப்படும், மென்பொருள்கள் அல்லது பாட்களை பயன்படுத்துகின்றன. இந்த பாட்கள் பொதுவாக வலை சிலந்திகள் என குறிப்பிடப்படுகின்றன.

ஒவ்வொரு இணையதளமாக இந்த பாட்கள் சென்றாலும், தளங்களில் நுழைய உடனே அனுமதி கிடைத்துவிடுவதில்லை. அதற்கு முன், தளத்தின் சார்பில், அதில் உள்ள எந்த பக்கங்களை எல்லாம் சேகரித்து பட்டியலிடலாம், எவற்றை தவிர்க்கலாம் என சொல்லப்படுகிறது. இந்த பணியை செய்வது தான் இயந்திர கோப்பின் நோக்கம்.

இணையத்தின் முதல் தேடியந்திரம் என கருதப்படும் அலி வெப் (ALIWEB) தேடுபொறியை உருவாக்கிய மென்பொருளாலர் மார்ட்டீன் கோஸ்டர் (Martijn Koster ) தான் முதன் முதலில் இந்த இயந்திர கோப்பை உருவாக்கினார். இந்த உருவாக்கம்  காரணமாகவே அலி வெப் முதல் தேடியந்திரம் என குறிப்பிடப்படுகிறது. மற்றபடி வேறு சில தேடியந்திரங்களையும் இதற்காக பரிசீலிக்க வேண்டும்.

இயந்திர கோப்பு என்பது, ஒரு வகையான அனுமதி சீட்டு. ஆனால் முழுவதும் கறாரானது அல்ல. கிட்டத்தட்ட கனவான்கள் ஒப்பந்தம் போல. தேடுபொறிகள் இதை பெரும்பாலும் மதிக்கின்றன. மீறினாலும் ஒன்றும் செய்வதற்கில்லை.

தேடியந்திரங்கள் எவ்வளவோ முன்னேறி இருந்தாலும், இந்த இயந்திர கோப்பு முறை அவற்றின் அடிப்படை அம்சங்களில் ஒன்றாக இருக்கிறது. பெரும்பாலும் எஸ்.இ.ஓ உத்திகளில் ஈடுபடுபவர்களால் கவனிக்கப்படும் இந்த இயந்திர கோப்பு ஏஐ உலகில் வெகுமக்கள் கவனத்தை ஈர்க்கத்துவங்கியுள்ளது. ஏனெனில் சாட்ஜிபிடி உள்ளிட்ட சாட்பாட்கள் எந்த உள்ளடக்கத்தை அணுகலாம் கூடாது என தீர்மானிக்க இவை அதிகம் பயன்படுத்தப்படுவது தான்.

*

சாட்பாட்கள் பற்றி இன்னும் விரிவாக அறிய: ‘சாட்ஜிபிடி சரிதம்’ புத்தகம் வாசிக்கவும்.

தொடர்புடைய முந்தைய பதிவு: தொழில்நுட்ப அகராதி: Crawl Budget- துழாவல் கணக்கு

இதுவரை ரோபோ டெக்ஸ்டிற்கான தமிழ் சொல் இல்லை. ரோபோ டெக்ஸ்ட் (robots txt ) என்றால், தேடியந்திரங்கள் சார்பாக உள்ளட்டக்க பட்டியலுக்காக வந்து நிற்கும் வலை சிலந்திகளிடம், எந்த பக்கங்களை எல்லாம் பட்டியலிடலாம் என தெரிவிக்கும் கோப்பு. எனவே தமிழல், இயந்திர அனுமதி கோப்பு என கொள்ளலாம்.

இந்த கோப்பின் அழகு என்னவெனில், ஒரே நேரத்தில் இது அனுமதி அளிக்கவும் செய்கிறது, விலகி நிற்கவும் சொல்கிறது.

ரோபோ டெக்ஸ்டை இணைய உலகின் எழுதப்படாத ஒப்பந்தம் என புரிந்து கொள்ளலாம். அதாவது, தகவல்களை சேகரிக்க வரும் தேடியந்திர மென்பொருள்கள் எந்த வகை தகவல்களுக்கு அனுமதி உண்டு/ இல்லை என சொல்வதற்கான ஒப்பந்தம்.

கூகுள் உள்ளிட்ட தேடியந்திரங்கள் இணையத்தை அடிக்கடி துழாவி கோடிக்கணக்கான பக்கங்களை பட்டயலிட்டு, அவற்றை புதுப்பித்து, நாம் தேடும் தகவல்களை தேடித்தருகின்றன. இதற்காக இணையத்தில் உலாவ, கிராளர்கள் எனப்படும், மென்பொருள்கள் அல்லது பாட்களை பயன்படுத்துகின்றன. இந்த பாட்கள் பொதுவாக வலை சிலந்திகள் என குறிப்பிடப்படுகின்றன.

ஒவ்வொரு இணையதளமாக இந்த பாட்கள் சென்றாலும், தளங்களில் நுழைய உடனே அனுமதி கிடைத்துவிடுவதில்லை. அதற்கு முன், தளத்தின் சார்பில், அதில் உள்ள எந்த பக்கங்களை எல்லாம் சேகரித்து பட்டியலிடலாம், எவற்றை தவிர்க்கலாம் என சொல்லப்படுகிறது. இந்த பணியை செய்வது தான் இயந்திர கோப்பின் நோக்கம்.

இணையத்தின் முதல் தேடியந்திரம் என கருதப்படும் அலி வெப் (ALIWEB) தேடுபொறியை உருவாக்கிய மென்பொருளாலர் மார்ட்டீன் கோஸ்டர் (Martijn Koster ) தான் முதன் முதலில் இந்த இயந்திர கோப்பை உருவாக்கினார். இந்த உருவாக்கம்  காரணமாகவே அலி வெப் முதல் தேடியந்திரம் என குறிப்பிடப்படுகிறது. மற்றபடி வேறு சில தேடியந்திரங்களையும் இதற்காக பரிசீலிக்க வேண்டும்.

இயந்திர கோப்பு என்பது, ஒரு வகையான அனுமதி சீட்டு. ஆனால் முழுவதும் கறாரானது அல்ல. கிட்டத்தட்ட கனவான்கள் ஒப்பந்தம் போல. தேடுபொறிகள் இதை பெரும்பாலும் மதிக்கின்றன. மீறினாலும் ஒன்றும் செய்வதற்கில்லை.

தேடியந்திரங்கள் எவ்வளவோ முன்னேறி இருந்தாலும், இந்த இயந்திர கோப்பு முறை அவற்றின் அடிப்படை அம்சங்களில் ஒன்றாக இருக்கிறது. பெரும்பாலும் எஸ்.இ.ஓ உத்திகளில் ஈடுபடுபவர்களால் கவனிக்கப்படும் இந்த இயந்திர கோப்பு ஏஐ உலகில் வெகுமக்கள் கவனத்தை ஈர்க்கத்துவங்கியுள்ளது. ஏனெனில் சாட்ஜிபிடி உள்ளிட்ட சாட்பாட்கள் எந்த உள்ளடக்கத்தை அணுகலாம் கூடாது என தீர்மானிக்க இவை அதிகம் பயன்படுத்தப்படுவது தான்.

*

சாட்பாட்கள் பற்றி இன்னும் விரிவாக அறிய: ‘சாட்ஜிபிடி சரிதம்’ புத்தகம் வாசிக்கவும்.

தொடர்புடைய முந்தைய பதிவு: தொழில்நுட்ப அகராதி: Crawl Budget- துழாவல் கணக்கு

About the author

CyberSimman

இண்டெர்நெட் சமூக மாற்றத்திற்கு வித்திடக்கூடிய ஜனநாயக தன்மை கொண்ட தொழில்நுட்பம் என்று சொல்லப்படுவதில் என‌க்கு மிகுந்த நம்பிக்கை உண்டு என்பதால் இண்டெர்நெட்டை எப்படியெல்லாம் பயன்படுத்திகொள்ள முடிகிறது என சுட்டிக்கட்டுவதை எனது கடமையாக‌வே கருதுகிறேன்... மேலும்

Related posts

Leave a Comment

Your email address will not be published. Required fields are marked *