டெக் டிக்ஷனரி- 30 வெப் கிராளர் (web crawler) – இணைய தவழான்கள்

crwஇணையத்தில் நாம் மட்டும் தான் உலா வந்து கொண்டிருப்பதாக நினைக்க வேண்டாம். எண்ணற்ற மென்பொருள் எந்திரங்களும் இணையத்தை வலம் வந்து கொண்டிருக்கின்றன. இந்த மென்பொருள் எந்திரங்கள் தான் தான் கிராளர்கள் என அழைக்கப்படுகின்றன. சிலந்தி எந்திரன்கள் அல்லது தேடியந்திர எந்திரன்கள் எனும் இவை அழைக்கப்படுகின்றன.

நாம் தகவல்களை இணையத்தில் உலாவுகிறோம் என்றால், இந்த எந்திரன்களுக்கு இணையத்தில் என்ன வேலை என கேட்கலாம். இந்த எந்திரங்கள் நம் பொருட்டே இணையத்தில் உலாவுகின்றன என்பதே இதற்கான பதில்.

ஆம், நாம் பயன்படுத்தும் இணைய தேடல் வசதி இயங்க இந்த எந்திரன்களே காரணம்.

இணையம் எனும் மாபெரும் வலைப்பின்னல், கோடிக்கணக்கான இணையதளங்களை கொண்டிருப்பதை நீங்கள் அறிந்திருக்கலாம். ஆனால், இந்த தளங்களுக்கு எல்லாம் முழுமையான பட்டியல் கிடையாது. சொல்லப்போனால், மொத்தம் எத்தனை இணையதளங்கள் இருக்கின்றன என்பது ஒருவருக்கும் தெரியாது.

இணையதளங்களின் எண்ணிக்கை தெரியாவிட்டால் என்ன? அது தான் கூகுள் போன்ற தேடியந்திரங்கள் இருக்கின்றனவே அவற்றை தேட என நீங்கள் சொல்லலாம். உண்மை தான். ஆனால் தேடியந்திரங்கள் மட்டும் எப்படி இணையதளங்களை தேடித் தருகின்றன?

இந்த கேள்விக்கான பதிலாக தான் கிராளர்கள் இணையத்தை துழாவிக்கொண்டிருக்கின்றன. ஒவ்வொரு வீட்டு கதவைத்தட்டி தகவல் சேகரிக்கும் பணியாளர் போல, இந்த கிராளர்கள் ஒவ்வொரு இணையதளமாக விஜயம் செய்து, அவற்றில் உள்ள தகவல்களை குறித்து வைத்துக்கொள்கின்றன.

இப்படி ஒவ்வொரு இணைய பக்கமாக விஜயம் செய்து தகவல் சேகரிப்பதற்காக என்றே, இந்த மென்பொருள்கள் உருவாக்கப்படுகின்றன. இணையத்தில் இவை தவழ்ந்து சென்று தகவல்களை சேகரிப்பதால், ஆங்கிலத்தில் கிராளர்கள் என குறிப்பிடப்படுகின்றன. தமிழில் தவழான்கள் என வைத்துக்கொள்ளலாம். சிலந்தி தனது வலையில் நகர்வது போல இவை இணையத்தை வலம் வருவதால், சிலந்தி எந்திரன்கள் என்றும் சொல்லப்படுகின்றன.

இந்த தவழான்கள், ஒரு இணைய பக்கத்தில் உள்ள இணைப்புகளையும் கண்டு கொண்டு அவற்றுக்கும் சென்று தகவல்களை குறித்து கொள்கின்றன. இணையத்தில் இணையும் புதிய தளங்கள் மற்றும் பழைய தளங்களில் புதுப்பிக்கப்படும் புதிய தகவல்கள் என எல்லாவற்றையும் இந்த தவழான்கள் குறித்து வைத்துக்கொள்கின்றன.

இந்த எந்திரன்கள் சேகரித்து தரும் தகவல்களின் அடிப்படையில் தான் தேடியந்திரங்கள் இணையதளங்களை பட்டியலிட்டு, அவற்றில் இருந்து பொருத்தமான தளங்களை முன்வைக்கின்றன. கூகுள் சார்பில் இப்படி உலாவவிடப்பட்டிருக்கும் எந்திரனுக்கு கூகுள்பாட் என பெயர். மைக்ரோசாப்டின் பிங் தேடியந்திரம் சார்பிலும் ஒரு எந்திரன் உலாவுகிறது.

பெரும்பாலான தவழான்கள் மொத்த இணையத்தையும் வலம் வந்து தகவல்களை சேகரிப்பதில்லை. அவற்றுக்கு இடப்படும் கட்டளைக்கு பொருந்தும் இணையதளங்களுக்கு எல்லாம் சென்று தகவல்களை சேகரிக்கின்றன.

இணையதளங்களில் மாறி இருக்கும் தகவல்களை கண்டறிய இவை, தளங்களுக்கு மீண்டும் மீண்டும் விஜயம் செய்வதும் உண்டு. அந்த வகையில் இவை சோம்பலே அறியா உழைப்பாளிகள்.

கிராளர்கள் தான் தேடியந்திரங்களுக்கு அடித்தளம் என்பது மட்டும் அல்ல, வெப்கிராளர் எனும் பெயரிலேயே ஆரம்ப கால தேடியந்திரம் ஒன்று செயல்பட்டிருக்கிறது. கிராளர் தொழில்நுட்பத்தை பயன்படுத்திய முதல் தேடியந்திரமான இது இன்னமும் பயன்பாட்டில் இருக்கிறது.

இணைய முகவரி: www.webcrawler.com

 

 

crwஇணையத்தில் நாம் மட்டும் தான் உலா வந்து கொண்டிருப்பதாக நினைக்க வேண்டாம். எண்ணற்ற மென்பொருள் எந்திரங்களும் இணையத்தை வலம் வந்து கொண்டிருக்கின்றன. இந்த மென்பொருள் எந்திரங்கள் தான் தான் கிராளர்கள் என அழைக்கப்படுகின்றன. சிலந்தி எந்திரன்கள் அல்லது தேடியந்திர எந்திரன்கள் எனும் இவை அழைக்கப்படுகின்றன.

நாம் தகவல்களை இணையத்தில் உலாவுகிறோம் என்றால், இந்த எந்திரன்களுக்கு இணையத்தில் என்ன வேலை என கேட்கலாம். இந்த எந்திரங்கள் நம் பொருட்டே இணையத்தில் உலாவுகின்றன என்பதே இதற்கான பதில்.

ஆம், நாம் பயன்படுத்தும் இணைய தேடல் வசதி இயங்க இந்த எந்திரன்களே காரணம்.

இணையம் எனும் மாபெரும் வலைப்பின்னல், கோடிக்கணக்கான இணையதளங்களை கொண்டிருப்பதை நீங்கள் அறிந்திருக்கலாம். ஆனால், இந்த தளங்களுக்கு எல்லாம் முழுமையான பட்டியல் கிடையாது. சொல்லப்போனால், மொத்தம் எத்தனை இணையதளங்கள் இருக்கின்றன என்பது ஒருவருக்கும் தெரியாது.

இணையதளங்களின் எண்ணிக்கை தெரியாவிட்டால் என்ன? அது தான் கூகுள் போன்ற தேடியந்திரங்கள் இருக்கின்றனவே அவற்றை தேட என நீங்கள் சொல்லலாம். உண்மை தான். ஆனால் தேடியந்திரங்கள் மட்டும் எப்படி இணையதளங்களை தேடித் தருகின்றன?

இந்த கேள்விக்கான பதிலாக தான் கிராளர்கள் இணையத்தை துழாவிக்கொண்டிருக்கின்றன. ஒவ்வொரு வீட்டு கதவைத்தட்டி தகவல் சேகரிக்கும் பணியாளர் போல, இந்த கிராளர்கள் ஒவ்வொரு இணையதளமாக விஜயம் செய்து, அவற்றில் உள்ள தகவல்களை குறித்து வைத்துக்கொள்கின்றன.

இப்படி ஒவ்வொரு இணைய பக்கமாக விஜயம் செய்து தகவல் சேகரிப்பதற்காக என்றே, இந்த மென்பொருள்கள் உருவாக்கப்படுகின்றன. இணையத்தில் இவை தவழ்ந்து சென்று தகவல்களை சேகரிப்பதால், ஆங்கிலத்தில் கிராளர்கள் என குறிப்பிடப்படுகின்றன. தமிழில் தவழான்கள் என வைத்துக்கொள்ளலாம். சிலந்தி தனது வலையில் நகர்வது போல இவை இணையத்தை வலம் வருவதால், சிலந்தி எந்திரன்கள் என்றும் சொல்லப்படுகின்றன.

இந்த தவழான்கள், ஒரு இணைய பக்கத்தில் உள்ள இணைப்புகளையும் கண்டு கொண்டு அவற்றுக்கும் சென்று தகவல்களை குறித்து கொள்கின்றன. இணையத்தில் இணையும் புதிய தளங்கள் மற்றும் பழைய தளங்களில் புதுப்பிக்கப்படும் புதிய தகவல்கள் என எல்லாவற்றையும் இந்த தவழான்கள் குறித்து வைத்துக்கொள்கின்றன.

இந்த எந்திரன்கள் சேகரித்து தரும் தகவல்களின் அடிப்படையில் தான் தேடியந்திரங்கள் இணையதளங்களை பட்டியலிட்டு, அவற்றில் இருந்து பொருத்தமான தளங்களை முன்வைக்கின்றன. கூகுள் சார்பில் இப்படி உலாவவிடப்பட்டிருக்கும் எந்திரனுக்கு கூகுள்பாட் என பெயர். மைக்ரோசாப்டின் பிங் தேடியந்திரம் சார்பிலும் ஒரு எந்திரன் உலாவுகிறது.

பெரும்பாலான தவழான்கள் மொத்த இணையத்தையும் வலம் வந்து தகவல்களை சேகரிப்பதில்லை. அவற்றுக்கு இடப்படும் கட்டளைக்கு பொருந்தும் இணையதளங்களுக்கு எல்லாம் சென்று தகவல்களை சேகரிக்கின்றன.

இணையதளங்களில் மாறி இருக்கும் தகவல்களை கண்டறிய இவை, தளங்களுக்கு மீண்டும் மீண்டும் விஜயம் செய்வதும் உண்டு. அந்த வகையில் இவை சோம்பலே அறியா உழைப்பாளிகள்.

கிராளர்கள் தான் தேடியந்திரங்களுக்கு அடித்தளம் என்பது மட்டும் அல்ல, வெப்கிராளர் எனும் பெயரிலேயே ஆரம்ப கால தேடியந்திரம் ஒன்று செயல்பட்டிருக்கிறது. கிராளர் தொழில்நுட்பத்தை பயன்படுத்திய முதல் தேடியந்திரமான இது இன்னமும் பயன்பாட்டில் இருக்கிறது.

இணைய முகவரி: www.webcrawler.com

 

 

About the author

CyberSimman

இண்டெர்நெட் சமூக மாற்றத்திற்கு வித்திடக்கூடிய ஜனநாயக தன்மை கொண்ட தொழில்நுட்பம் என்று சொல்லப்படுவதில் என‌க்கு மிகுந்த நம்பிக்கை உண்டு என்பதால் இண்டெர்நெட்டை எப்படியெல்லாம் பயன்படுத்திகொள்ள முடிகிறது என சுட்டிக்கட்டுவதை எனது கடமையாக‌வே கருதுகிறேன்... மேலும்

Related posts

Leave a Comment

Your email address will not be published.