யோலா கட்டிடக்கலையும், ஏஐ பார்வை திறனும்!

யோலா கட்டிடக்கலையும், ஏஐ பார்வை திறனும்!

மனிதர்கள் போலவே செயல்படுவது தான் ஏஐ எனும் செயற்கை நுண்ணறிவின் நோக்கம் என்றாலும், மனிதர்கள் புரிந்து கொள்ளும் விதத்திற்கும், ஏஐ செயல்படும் விதத்திற்கும் அடிப்படையான வேறுபாடு இருக்கிறது. இதை மிக அழகாக, கம்ப்யூட்டர் பார்வையின் உட்பிரிவுகளில் ஒன்றான ’பொருள் கண்டறிதல்’ (Object detection ) மூலம் விளக்கலாம்.

பொருள் கண்டறிதல் என சொல்லப்படுவது நமக்கு குழப்பத்தை தரலாம். அதிலும், வழக்கமான பொருள் உணர்தலில் (image recognition ) இருந்து இது வேறுபட்டது என சொல்வது இன்னும் குழப்பலாம். ஆனால், தொழில்நுட்ப நோக்கில் இரண்டிற்கும் வேறுபாடு இருப்பதாக சொல்கின்றனர்.

இந்த வேறுபாட்டை புரிந்து கொள்ள முதலில் கம்ப்யூட்டர் பார்வையை புரிந்து கொள்ள வேண்டும். நிஜ உலக பொருட்களை கம்ப்யூட்டர் கண்டு உணரும் திறனே இவ்வாறு குறிப்பிடப்படுகிறது. உதாரணமாக, ஒரு படத்தை பார்த்து அதில் உள்ளது பூனை என அடையாளம் காணும் திறன்.

பூனையை பார்த்து சொல்வது எல்லாம் பெரிய விஷயமா என நாம் நினைக்கலாம். ஆனால் கம்ப்யூட்டர்களுக்கு அது சாத்தியமாக, நரம்பியல் வலைப்பின்னலும், அதை இயக்குவதற்கான வலுவான அல்கோரிதமும் தேவை. அது மட்டும் அல்ல, பூனையை காண, லட்சக்கணக்கான பூனை மாதிரிகளும் வேண்டும்.

அதன் பிறகு, கம்ப்யூட்டர் பூனையை பார்த்தவுடன் பூனை என்று சொல்லிவிடும். அது கருப்பு பூனையாக இருந்தாலும். ஆனால், பூனையை கண்டறியும் திறன் நாய் அல்லது புலியை கண்டறிய பயன்படாது என்பதை நினைவில் கொள்ள வேண்டும். அதற்கு தனியே பயிற்சி தேவை.

பூனையை பார்தத்தும், அது பூனை வகையைச் சேர்ந்தது என சொல்வதை பொருள் அல்லது உருவ உணர்தல் என்கின்றனர். அதாவது, இது பூனைகள் படங்களை ஒத்திருக்கிறது என முடிவுக்கு வருவது.

மாறாக, ஒரு படத்தை பார்க்கும் போது, அதில் உள்ள பொருட்களை எல்லாம் அடையாளம் காணும் திறன் பொருள் அறிதல் என்கின்றனர். உதாரணமாக, ஒரு கால்பந்தாட்ட காட்சியை எடுத்துக்கொண்டால், அதில் மைதானம் இருப்பது தவிர, கால்பந்து வீரர்கள் அல்லது வீராங்கனைகள், கால்பந்து, கம்பி வலை போன்றவை இருப்பதை கண்டறியும் திறனை இவ்வாறு குறிப்பிடுகின்றனர்.

கால்பந்தாட்ட காட்சியை பார்த்து அதில் வீரர்கள் இருக்கின்றனரா இல்லையா என சொல்வது நமக்கு எளிதாக, இயல்பாக இருக்கலாம். ஆனால், கம்ப்யூட்டர் இதை கண்டுபிடித்தாக வேண்டும். ஏனெனில் அதற்கு கால்பந்தும் தெரியாது, மைதானமும் தெரியாது, விளையாட்டும் தெரியாது.

நிற்க, இவ்விதம் ஒரு காட்சியில் உள்ள பொருட்களை கண்டறிய அல்கோரிதமுக்கு பயிற்சி அளிக்க வேண்டும். இதற்கு பலவித முறைகள் இருந்தாலும், யோலா எனும் நவீன முறை தான் மைல்கல் என்கின்றனர்.

நீங்கள் ஒரு முறை தான் பார்க்கிறீர்கள் (You Only Look Once (YOLO) ) எனும் ஆங்கில சொற்களின் சுருக்கமான யோலா, காட்சிகளில் உள்ள பொருட்களை கண்டறிவதற்கான எளிதான வழியாக கருதப்படுகிறது. இதை விளக்கும் ஆய்வுக்கட்டுரை 2015 ல் வெளியானது.

ஆய்வுக்கட்டுரையில் யோலா கட்டிடக்கலை என ஆங்கிலத்தில் குறிப்பிடப்பட்டாலும், தமிழில் இதை கட்டமைப்பு என்றே புரிந்து கொள்ள  வேண்டும். அதாவது அல்கோரிதம் செயல்முறைக்கான உள்கட்டமைப்பு.

இந்த அல்கோரிதம் காட்சிகளில் பொருட்களை கண்டறியும் செயல்முறை நமக்கு கொஞ்சம் விநோதமாக தான் இருக்கிறது. முதலில் காட்சியை ஒரே அளவிலான பலவித கட்டங்களாக பிரித்துக்கொள்ள வேண்டும். அதன் பிறகு ஒவ்வொரு கட்டத்திலும் ஏதேனும் பொருள் உள்ளதா என்பதை அறிய அருகாமையில் உள்ள எல்லை கட்டங்களை கவனிக்க வேண்டும். இப்படியே கட்டங்களை சுருக்கி கொண்டு வந்தால், கட்டங்கள் சங்கமத்தில் என்ன பொருட்கள் எல்லாம் இருக்கின்றன என்பதை பிரித்துக்கொள்ளலாம்.

இதன் படி பார்த்தால், ஒரு கட்டத்தில் கால் இருக்கும், இன்னொரு கட்டத்தில் தலை இருக்கும், அருகே உள்ள கட்டத்தில் பாதி பந்து இருக்கும். மொத்தமாக கட்டங்களை பகுத்தாய்ந்து, அதில் உள்ளது வீரர் மற்றும் கால்பந்து என அல்கோரிதம் துல்லியமாக சொல்கிறது.

இதன் பின்னே, வெறும் எண்ணிக்கை சார்ந்த கணக்கு இருப்பதையும் மனதில் கொள்ள வேண்டும். அதாவது அல்கோரிதம் காட்சியை நோக்குவதாக சொல்லப்பட்டாலும், உண்மையில் அது கட்டங்களின் தன்மையை கணக்கிட்டு பார்க்கிறது.

இப்படியா நாம் கால்பந்தட்டா காட்சியை பார்க்கிறோம் எனும் வியப்பு ஏற்பட்டாலும், இந்த நுட்பம், மருத்துவ துறையில் கட்டிகளை கண்டறிய, அகழ்வாரய்ச்சியில் பழைய சிதிலங்களை கண்டறிய மற்றும் இன்னும்பிற விதங்களில் எல்லாம் பயன்படுகிறது. விவசாயத்தில், மரத்தில் இருந்து பழுத்த பழங்களை பறிக்கவும் கைகொடுக்கிறது என்கின்றனர். எப்படி இருக்கிறது!

https://www.datacamp.com/blog/yolo-object-detection-explained

யோலா கட்டிடக்கலையும், ஏஐ பார்வை திறனும்!

மனிதர்கள் போலவே செயல்படுவது தான் ஏஐ எனும் செயற்கை நுண்ணறிவின் நோக்கம் என்றாலும், மனிதர்கள் புரிந்து கொள்ளும் விதத்திற்கும், ஏஐ செயல்படும் விதத்திற்கும் அடிப்படையான வேறுபாடு இருக்கிறது. இதை மிக அழகாக, கம்ப்யூட்டர் பார்வையின் உட்பிரிவுகளில் ஒன்றான ’பொருள் கண்டறிதல்’ (Object detection ) மூலம் விளக்கலாம்.

பொருள் கண்டறிதல் என சொல்லப்படுவது நமக்கு குழப்பத்தை தரலாம். அதிலும், வழக்கமான பொருள் உணர்தலில் (image recognition ) இருந்து இது வேறுபட்டது என சொல்வது இன்னும் குழப்பலாம். ஆனால், தொழில்நுட்ப நோக்கில் இரண்டிற்கும் வேறுபாடு இருப்பதாக சொல்கின்றனர்.

இந்த வேறுபாட்டை புரிந்து கொள்ள முதலில் கம்ப்யூட்டர் பார்வையை புரிந்து கொள்ள வேண்டும். நிஜ உலக பொருட்களை கம்ப்யூட்டர் கண்டு உணரும் திறனே இவ்வாறு குறிப்பிடப்படுகிறது. உதாரணமாக, ஒரு படத்தை பார்த்து அதில் உள்ளது பூனை என அடையாளம் காணும் திறன்.

பூனையை பார்த்து சொல்வது எல்லாம் பெரிய விஷயமா என நாம் நினைக்கலாம். ஆனால் கம்ப்யூட்டர்களுக்கு அது சாத்தியமாக, நரம்பியல் வலைப்பின்னலும், அதை இயக்குவதற்கான வலுவான அல்கோரிதமும் தேவை. அது மட்டும் அல்ல, பூனையை காண, லட்சக்கணக்கான பூனை மாதிரிகளும் வேண்டும்.

அதன் பிறகு, கம்ப்யூட்டர் பூனையை பார்த்தவுடன் பூனை என்று சொல்லிவிடும். அது கருப்பு பூனையாக இருந்தாலும். ஆனால், பூனையை கண்டறியும் திறன் நாய் அல்லது புலியை கண்டறிய பயன்படாது என்பதை நினைவில் கொள்ள வேண்டும். அதற்கு தனியே பயிற்சி தேவை.

பூனையை பார்தத்தும், அது பூனை வகையைச் சேர்ந்தது என சொல்வதை பொருள் அல்லது உருவ உணர்தல் என்கின்றனர். அதாவது, இது பூனைகள் படங்களை ஒத்திருக்கிறது என முடிவுக்கு வருவது.

மாறாக, ஒரு படத்தை பார்க்கும் போது, அதில் உள்ள பொருட்களை எல்லாம் அடையாளம் காணும் திறன் பொருள் அறிதல் என்கின்றனர். உதாரணமாக, ஒரு கால்பந்தாட்ட காட்சியை எடுத்துக்கொண்டால், அதில் மைதானம் இருப்பது தவிர, கால்பந்து வீரர்கள் அல்லது வீராங்கனைகள், கால்பந்து, கம்பி வலை போன்றவை இருப்பதை கண்டறியும் திறனை இவ்வாறு குறிப்பிடுகின்றனர்.

கால்பந்தாட்ட காட்சியை பார்த்து அதில் வீரர்கள் இருக்கின்றனரா இல்லையா என சொல்வது நமக்கு எளிதாக, இயல்பாக இருக்கலாம். ஆனால், கம்ப்யூட்டர் இதை கண்டுபிடித்தாக வேண்டும். ஏனெனில் அதற்கு கால்பந்தும் தெரியாது, மைதானமும் தெரியாது, விளையாட்டும் தெரியாது.

நிற்க, இவ்விதம் ஒரு காட்சியில் உள்ள பொருட்களை கண்டறிய அல்கோரிதமுக்கு பயிற்சி அளிக்க வேண்டும். இதற்கு பலவித முறைகள் இருந்தாலும், யோலா எனும் நவீன முறை தான் மைல்கல் என்கின்றனர்.

நீங்கள் ஒரு முறை தான் பார்க்கிறீர்கள் (You Only Look Once (YOLO) ) எனும் ஆங்கில சொற்களின் சுருக்கமான யோலா, காட்சிகளில் உள்ள பொருட்களை கண்டறிவதற்கான எளிதான வழியாக கருதப்படுகிறது. இதை விளக்கும் ஆய்வுக்கட்டுரை 2015 ல் வெளியானது.

ஆய்வுக்கட்டுரையில் யோலா கட்டிடக்கலை என ஆங்கிலத்தில் குறிப்பிடப்பட்டாலும், தமிழில் இதை கட்டமைப்பு என்றே புரிந்து கொள்ள  வேண்டும். அதாவது அல்கோரிதம் செயல்முறைக்கான உள்கட்டமைப்பு.

இந்த அல்கோரிதம் காட்சிகளில் பொருட்களை கண்டறியும் செயல்முறை நமக்கு கொஞ்சம் விநோதமாக தான் இருக்கிறது. முதலில் காட்சியை ஒரே அளவிலான பலவித கட்டங்களாக பிரித்துக்கொள்ள வேண்டும். அதன் பிறகு ஒவ்வொரு கட்டத்திலும் ஏதேனும் பொருள் உள்ளதா என்பதை அறிய அருகாமையில் உள்ள எல்லை கட்டங்களை கவனிக்க வேண்டும். இப்படியே கட்டங்களை சுருக்கி கொண்டு வந்தால், கட்டங்கள் சங்கமத்தில் என்ன பொருட்கள் எல்லாம் இருக்கின்றன என்பதை பிரித்துக்கொள்ளலாம்.

இதன் படி பார்த்தால், ஒரு கட்டத்தில் கால் இருக்கும், இன்னொரு கட்டத்தில் தலை இருக்கும், அருகே உள்ள கட்டத்தில் பாதி பந்து இருக்கும். மொத்தமாக கட்டங்களை பகுத்தாய்ந்து, அதில் உள்ளது வீரர் மற்றும் கால்பந்து என அல்கோரிதம் துல்லியமாக சொல்கிறது.

இதன் பின்னே, வெறும் எண்ணிக்கை சார்ந்த கணக்கு இருப்பதையும் மனதில் கொள்ள வேண்டும். அதாவது அல்கோரிதம் காட்சியை நோக்குவதாக சொல்லப்பட்டாலும், உண்மையில் அது கட்டங்களின் தன்மையை கணக்கிட்டு பார்க்கிறது.

இப்படியா நாம் கால்பந்தட்டா காட்சியை பார்க்கிறோம் எனும் வியப்பு ஏற்பட்டாலும், இந்த நுட்பம், மருத்துவ துறையில் கட்டிகளை கண்டறிய, அகழ்வாரய்ச்சியில் பழைய சிதிலங்களை கண்டறிய மற்றும் இன்னும்பிற விதங்களில் எல்லாம் பயன்படுகிறது. விவசாயத்தில், மரத்தில் இருந்து பழுத்த பழங்களை பறிக்கவும் கைகொடுக்கிறது என்கின்றனர். எப்படி இருக்கிறது!

https://www.datacamp.com/blog/yolo-object-detection-explained

About the author

CyberSimman

இண்டெர்நெட் சமூக மாற்றத்திற்கு வித்திடக்கூடிய ஜனநாயக தன்மை கொண்ட தொழில்நுட்பம் என்று சொல்லப்படுவதில் என‌க்கு மிகுந்த நம்பிக்கை உண்டு என்பதால் இண்டெர்நெட்டை எப்படியெல்லாம் பயன்படுத்திகொள்ள முடிகிறது என சுட்டிக்கட்டுவதை எனது கடமையாக‌வே கருதுகிறேன்... மேலும்

Related posts

Leave a Comment

Your email address will not be published. Required fields are marked *