பெரும்பாலான இணையதளங்கள் கூகுளுக்காகவே உருவாக்கப்படுகின்றன. அதாவது கூகுளை மனதில் கொண்டு உருவாக்கப்படுகின்றன. இணையத்தில் கண்டறியப்பட கூகுள் சிறந்த வழியாக கருதப்படுவதால் இந்த உத்தியில் தவறேதும் இல்லை தான். ஆனால், கூகுளை மட்டுமே கருத்தில் கொண்டு தளங்களை உருவாக்கும் போக்கு தான் தவறானது. அதாவது, பயனாளிகளின் தேவை பற்றி எதுவும் சிந்திக்காமல் கூகுள் கடைக்கண் பார்வையை மட்டுமே இலக்காக கொண்டு தளங்களை உருவாக்குவது.
இப்படி, கூகுளில் முன்னிலை பெறும் ஒற்றை நோக்குடன் உருவாக்கப்படும் பயனில்லா இணையதளங்களுக்கு ’மெலிதான உள்ளடக்கம்’ (thin content ) என பெயரும் இருக்கிறது. இத்தகைய உள்ளடக்கத்தை கூகுளே தண்டிப்பதாகவும் சொல்லப்படுகிறது.
பெரும்பாலான தேடல்களுக்கு கூகுள் முன்வைக்கும் தேடல் பட்டியலை பார்க்கும் போது, அதில் குப்பை தளங்களும், பயனில்லா தளங்களும் முன்னிலை பெறுவதை பார்க்கும் போது கூகுளின் வடிகட்டல் திறன் அல்லது நோக்கம் பற்றி சந்தேகம் எழவே செய்யும். எனினும், இப்போது நாம் பார்க்கப்போவது மெலிதான உள்ளடக்கத்தை கூகுள் கட்டுப்படுத்த தவறும் விதம் பற்றி அல்ல, மாறாக இணையத்தில் இருந்து மறைந்து கொண்டிருக்கும் உள்ளடக்கம் பற்றி தான்.
இணையத்தில் இருந்து உள்ளடக்கம் மறைந்து கொண்டிருப்பதை நீங்கள் பலமுறை எதிர்கொண்டிருக்கலாம். நாம் தேடிச்செல்லும் பழைய கட்டுரை அல்லது பழைய தகவல் கிடைக்காமல் போவது முதல், ஏற்கனவே கொடுக்கப்பட்ட இணைப்புகள் தற்போது செயலிழந்து உயிற்ற இணைப்புகளாக (dead links) மாறிவிட்டது வரை பலவிதங்களில் இதை உணரலாம். மன்னிக்கவும், நீங்கள் தேடி வந்த இணைய பக்கம் இல்லை ( page not found ) எனும் அறிவிப்பையும் இதில் சேர்த்துக்கொள்ளலாம்.
கூகுளுக்கு பழகிய இணையவாசிகள் பலரும் இப்படி காணாமல் போகும் உள்ளடக்கம் பற்றி கவலைப்படாமல், வேறு வேலை பார்க்க போய்விடுகின்றனர். இணையத்தின் ஒரு பகுதி மறைந்து கொண்டிருப்பது கவலை அளிக்கும் விஷயம் என்றால், இதற்கான முக்கிய காரணங்களில் கூகுளும் ஒன்றாக இருப்பது தான் இன்னும் கவலை அளிக்கும் விஷயம்.
இணையத்தில் இருந்த உள்ளடக்கம் இல்லாமல் போவதற்கு, தளங்கள் மூடப்படுவது உள்ளிட்ட வேறுபட காரணங்கள் இருந்தாலும், கூகுளை இங்கே முதன்மையாக குற்றம்சாட்டுவது ஏனெனில், பல இணையதளங்கள் கூகுளில் முன்னிலை பெறுவதற்காகவே பழைய கட்டுரைகள் போன்ற உள்ளடக்கத்தை நீக்கி வரும் வழக்கம் கொண்டிருப்பதால் தான்.
காணாமல் போகும் உள்ளடக்கம் தொடர்பான ஒரு கட்டுரையில் அதன் ஆசிரியர் சைமன் புரு, இந்த போக்கை கூகுள் பீடத்தில் தியாகம் செய்யப்பட்டும் உள்ளடக்கம் என குறிப்பிட்டுள்ளார்.
கூகுளின் தேடல் அல்கோரிதம் மாறிக்கொண்டே இருக்கிறது. எனவே கூகுளால் பட்டியலிடப்படுவதற்கான விதிகளும் மாறிக்கொண்டே இருக்கின்றன. இவற்றில் முக்கியமானது வேகம்- நொடிப்பொழுதுக்குள்ளும் இணையதளங்களின் உள்ளடக்கம் வந்து நிற்க வேண்டும் என எதிர்பார்க்கப்படுவதால், கூகுளும் ஒரு இணைய பக்கம் தரவிறக்கம் ஆகும் வேகத்தை தனது அல்கோரிதத்தில் முக்கிய அம்சமாக கொண்டுள்ளது.
வேகமாக தரவிறக்கம் ஆகும் இணைய பக்கங்களே கூகுளில் முன்னிலை பெறுவதால், இணையதளங்கள், குறிப்பாக செய்தி தளங்கள் பழைய கட்டுரைகளை சுமை என கருதி நீக்கிவிடுகின்றன. அதே போல, மற்ற இடங்களில் பார்க்க கூடிய செய்தி அல்லது கட்டுரைகளுக்கான இணைப்புகளையும் நீக்கிவிடுகின்றன. பல ஆண்டுகளாக செயல்பட்டு வரும் இணையதளங்கள் கூட, பழைய கட்டுரைகள் பலி கொடுக்கப்படுகின்றன.
இதன் விளைவாகவே இணையத்தில் பழைய கட்டுரைகளை கண்டறிவது சிக்கலாகிறது. நிற்க, இப்படி இணையத்தில் இருந்து கூகுள் நிர்பந்தம் காரணமாக பழைய உள்ளடக்கம் மறைவதற்கு, thin content எனும் பெயர் இருப்பதாக கட்டுரையாளர் சைமன் புரு குறிப்பிடுகிறார். ஆனால், இவர் மெலிதான உள்ளடக்கம் எனும் பொருளில் இதை பயன்படுத்தாமல், மறையும் உள்ளடக்கம் எனும் பொருளிலேயே பயன்படுத்துகிறார். கூகுளில் வேகம் பெறும் நோக்கில் இணையதளங்கள் பழைய கட்டுரைகளை நீக்கில் இளைப்பதில் ஈடுபடுவதாக இவர் குறிப்பிடுவதாகவும் புரிந்து கொள்ளலாம்.
ஆனால், கூகுளில் தின் கண்டெண்ட் என தேடினால், அது தான் தேடல் முடிவுகளில், மேலே பார்த்த பயனில்லா உள்ளட்டகம் தொடர்பான கருத்தாக்கத்தையே முன்னிறுத்துகிறது. உண்மையில் இத்தகைய பயனிள்ள உள்ளடக்கம் உருவாக மூலக்காரணமே கூகுள் என்று தான் சொல்ல வேண்டும்.
கூகுள் மீதான இந்த குற்றச்சாட்டில் உங்களுக்கு உடன்பாடு இருக்கிறதோ இல்லையோ, ஆனால், கூகுள் உள்பட பல்வேறு காரணங்களினால், இணையத்தில் இருந்து உள்ளடக்கம் மறைந்து கொண்டிருப்பதற்கு நிவாரணம் தேவை எனில் அது, இணைய காப்பகமான ஆர்க்கிவ்.ஆர்க் (https://archive.org/) தான். இணையத்தின் உள்ளடக்கத்தை பாதுகாக்கும் வகையில், பெரும்பாலான இணைய பக்கங்களின் ஒரு நகலை சேமித்து வரும் இந்த இணைய முயற்சியையும் இக்கட்டுரையில் சைமன் சுட்டிக்காட்டுகிறார்.
பெரும்பாலான இணையதளங்கள் கூகுளுக்காகவே உருவாக்கப்படுகின்றன. அதாவது கூகுளை மனதில் கொண்டு உருவாக்கப்படுகின்றன. இணையத்தில் கண்டறியப்பட கூகுள் சிறந்த வழியாக கருதப்படுவதால் இந்த உத்தியில் தவறேதும் இல்லை தான். ஆனால், கூகுளை மட்டுமே கருத்தில் கொண்டு தளங்களை உருவாக்கும் போக்கு தான் தவறானது. அதாவது, பயனாளிகளின் தேவை பற்றி எதுவும் சிந்திக்காமல் கூகுள் கடைக்கண் பார்வையை மட்டுமே இலக்காக கொண்டு தளங்களை உருவாக்குவது.
இப்படி, கூகுளில் முன்னிலை பெறும் ஒற்றை நோக்குடன் உருவாக்கப்படும் பயனில்லா இணையதளங்களுக்கு ’மெலிதான உள்ளடக்கம்’ (thin content ) என பெயரும் இருக்கிறது. இத்தகைய உள்ளடக்கத்தை கூகுளே தண்டிப்பதாகவும் சொல்லப்படுகிறது.
பெரும்பாலான தேடல்களுக்கு கூகுள் முன்வைக்கும் தேடல் பட்டியலை பார்க்கும் போது, அதில் குப்பை தளங்களும், பயனில்லா தளங்களும் முன்னிலை பெறுவதை பார்க்கும் போது கூகுளின் வடிகட்டல் திறன் அல்லது நோக்கம் பற்றி சந்தேகம் எழவே செய்யும். எனினும், இப்போது நாம் பார்க்கப்போவது மெலிதான உள்ளடக்கத்தை கூகுள் கட்டுப்படுத்த தவறும் விதம் பற்றி அல்ல, மாறாக இணையத்தில் இருந்து மறைந்து கொண்டிருக்கும் உள்ளடக்கம் பற்றி தான்.
இணையத்தில் இருந்து உள்ளடக்கம் மறைந்து கொண்டிருப்பதை நீங்கள் பலமுறை எதிர்கொண்டிருக்கலாம். நாம் தேடிச்செல்லும் பழைய கட்டுரை அல்லது பழைய தகவல் கிடைக்காமல் போவது முதல், ஏற்கனவே கொடுக்கப்பட்ட இணைப்புகள் தற்போது செயலிழந்து உயிற்ற இணைப்புகளாக (dead links) மாறிவிட்டது வரை பலவிதங்களில் இதை உணரலாம். மன்னிக்கவும், நீங்கள் தேடி வந்த இணைய பக்கம் இல்லை ( page not found ) எனும் அறிவிப்பையும் இதில் சேர்த்துக்கொள்ளலாம்.
கூகுளுக்கு பழகிய இணையவாசிகள் பலரும் இப்படி காணாமல் போகும் உள்ளடக்கம் பற்றி கவலைப்படாமல், வேறு வேலை பார்க்க போய்விடுகின்றனர். இணையத்தின் ஒரு பகுதி மறைந்து கொண்டிருப்பது கவலை அளிக்கும் விஷயம் என்றால், இதற்கான முக்கிய காரணங்களில் கூகுளும் ஒன்றாக இருப்பது தான் இன்னும் கவலை அளிக்கும் விஷயம்.
இணையத்தில் இருந்த உள்ளடக்கம் இல்லாமல் போவதற்கு, தளங்கள் மூடப்படுவது உள்ளிட்ட வேறுபட காரணங்கள் இருந்தாலும், கூகுளை இங்கே முதன்மையாக குற்றம்சாட்டுவது ஏனெனில், பல இணையதளங்கள் கூகுளில் முன்னிலை பெறுவதற்காகவே பழைய கட்டுரைகள் போன்ற உள்ளடக்கத்தை நீக்கி வரும் வழக்கம் கொண்டிருப்பதால் தான்.
காணாமல் போகும் உள்ளடக்கம் தொடர்பான ஒரு கட்டுரையில் அதன் ஆசிரியர் சைமன் புரு, இந்த போக்கை கூகுள் பீடத்தில் தியாகம் செய்யப்பட்டும் உள்ளடக்கம் என குறிப்பிட்டுள்ளார்.
கூகுளின் தேடல் அல்கோரிதம் மாறிக்கொண்டே இருக்கிறது. எனவே கூகுளால் பட்டியலிடப்படுவதற்கான விதிகளும் மாறிக்கொண்டே இருக்கின்றன. இவற்றில் முக்கியமானது வேகம்- நொடிப்பொழுதுக்குள்ளும் இணையதளங்களின் உள்ளடக்கம் வந்து நிற்க வேண்டும் என எதிர்பார்க்கப்படுவதால், கூகுளும் ஒரு இணைய பக்கம் தரவிறக்கம் ஆகும் வேகத்தை தனது அல்கோரிதத்தில் முக்கிய அம்சமாக கொண்டுள்ளது.
வேகமாக தரவிறக்கம் ஆகும் இணைய பக்கங்களே கூகுளில் முன்னிலை பெறுவதால், இணையதளங்கள், குறிப்பாக செய்தி தளங்கள் பழைய கட்டுரைகளை சுமை என கருதி நீக்கிவிடுகின்றன. அதே போல, மற்ற இடங்களில் பார்க்க கூடிய செய்தி அல்லது கட்டுரைகளுக்கான இணைப்புகளையும் நீக்கிவிடுகின்றன. பல ஆண்டுகளாக செயல்பட்டு வரும் இணையதளங்கள் கூட, பழைய கட்டுரைகள் பலி கொடுக்கப்படுகின்றன.
இதன் விளைவாகவே இணையத்தில் பழைய கட்டுரைகளை கண்டறிவது சிக்கலாகிறது. நிற்க, இப்படி இணையத்தில் இருந்து கூகுள் நிர்பந்தம் காரணமாக பழைய உள்ளடக்கம் மறைவதற்கு, thin content எனும் பெயர் இருப்பதாக கட்டுரையாளர் சைமன் புரு குறிப்பிடுகிறார். ஆனால், இவர் மெலிதான உள்ளடக்கம் எனும் பொருளில் இதை பயன்படுத்தாமல், மறையும் உள்ளடக்கம் எனும் பொருளிலேயே பயன்படுத்துகிறார். கூகுளில் வேகம் பெறும் நோக்கில் இணையதளங்கள் பழைய கட்டுரைகளை நீக்கில் இளைப்பதில் ஈடுபடுவதாக இவர் குறிப்பிடுவதாகவும் புரிந்து கொள்ளலாம்.
ஆனால், கூகுளில் தின் கண்டெண்ட் என தேடினால், அது தான் தேடல் முடிவுகளில், மேலே பார்த்த பயனில்லா உள்ளட்டகம் தொடர்பான கருத்தாக்கத்தையே முன்னிறுத்துகிறது. உண்மையில் இத்தகைய பயனிள்ள உள்ளடக்கம் உருவாக மூலக்காரணமே கூகுள் என்று தான் சொல்ல வேண்டும்.
கூகுள் மீதான இந்த குற்றச்சாட்டில் உங்களுக்கு உடன்பாடு இருக்கிறதோ இல்லையோ, ஆனால், கூகுள் உள்பட பல்வேறு காரணங்களினால், இணையத்தில் இருந்து உள்ளடக்கம் மறைந்து கொண்டிருப்பதற்கு நிவாரணம் தேவை எனில் அது, இணைய காப்பகமான ஆர்க்கிவ்.ஆர்க் (https://archive.org/) தான். இணையத்தின் உள்ளடக்கத்தை பாதுகாக்கும் வகையில், பெரும்பாலான இணைய பக்கங்களின் ஒரு நகலை சேமித்து வரும் இந்த இணைய முயற்சியையும் இக்கட்டுரையில் சைமன் சுட்டிக்காட்டுகிறார்.