
தண்டனையில் இருந்து கற்றுக்கொள்ளலாம்! MIT-யின் ஒரு புதிய கண்டுபிடிப்பு!
MIT (Massachusetts Institute of Technology) என்றழைக்கப்படும் மிகச்சிறந்த அறிவியல் பல்கலைக்கழகம், ஆகஸ்ட் 20, 2025 அன்று ஒரு சுவாரஸ்யமான புதிய கண்டுபிடிப்பைப் பற்றி நமக்குச் சொல்லியிருக்கிறது. அதன் பெயர் “Learning from punishment”, அதாவது “தண்டனையில் இருந்து கற்றுக்கொள்வது”.
இது என்ன புதிர்? நாம் தவறு செய்தால் தண்டனை கிடைக்கும் என்று பள்ளியிலும் வீட்டிலும் படித்திருப்போம். ஆனால், இந்தமுறை MIT விஞ்ஞானிகள், “தண்டனை”யை ஒரு கற்றல் கருவியாகப் பயன்படுத்தி, எப்படி இன்னும் புத்திசாலித்தனமான இயந்திரங்களை (ரோபோக்களைப் போல!) உருவாக்கலாம் என்று கண்டுபிடித்திருக்கிறார்கள்.
எதற்காக இந்த கண்டுபிடிப்பு?
நாம் குழந்தைகள் எப்படி கற்றுக்கொள்கிறோம் என்று யோசித்துப் பாருங்கள்.
- சரியாக செய்தால்: நீங்கள் ஒரு வேலையை சரியாக செய்தால், அம்மா உங்களுக்குப் பாராட்டு தெரிவிப்பார்கள் அல்லது சாக்லேட் கொடுப்பார்கள். இது உங்களுக்கு அடுத்த முறையும் அதைச் சரியாகச் செய்ய ஊக்கமளிக்கும்.
- தவறு செய்தால்: நீங்கள் ஒரு பொம்மையை உடைத்துவிட்டால், அம்மா உங்களைக் கண்டிப்பார்கள். இது அடுத்த முறை பொம்மைகளை கவனமாகப் பயன்படுத்த கற்றுக்கொடுக்கும்.
அதாவது, நாம் “நல்ல விஷயங்களுக்கு வெகுமதியும்”, “தவறான விஷயங்களுக்கு தண்டனையும்” பெற்றுக்கொண்டே கற்றுக்கொள்கிறோம்.
MIT விஞ்ஞானிகளின் யோசனை என்ன?
MIT விஞ்ஞானிகள் இதைத்தான் இயந்திரங்களுக்கும் (ரோபோக்களுக்கும்) செய்ய முயற்சி செய்கிறார்கள். பொதுவாக, இயந்திரங்கள் ஒரு வேலையைச் செய்ய பயிற்சி அளிக்கும்போது, அவை சரியாகச் செய்தால் “பாராட்டு” (reward) மட்டுமே கொடுக்கப்படும். ஆனால், MIT கண்டுபிடிப்பு என்னவென்றால், இயந்திரங்கள் தவறு செய்யும் போது, அந்தத் தவறை “தண்டனையாக” உணர்த்தி, அதிலிருந்து கற்றுக்கொள்ள வைப்பது.
இது எப்படி வேலை செய்கிறது?
இதை எளிமையாகப் புரிந்துகொள்ள, ஒரு குட்டி உதாரணத்தைப் பார்ப்போம்.
ஒரு ரோபோவுக்கு ஒரு சுவரில் உள்ள ஓட்டையைக் கண்டுபிடித்து, அதில் ஒரு பொருளைச் செருக வேண்டும் என்று வைத்துக்கொள்வோம்.
- பழைய முறை: ரோபோ சரியான ஓட்டையைக் கண்டுபிடித்து பொருளைச் செருகினால், அதுக்கு ஒரு “பாராட்டு” கிடைக்கும். தவறான ஓட்டையைத் தேர்ந்தெடுத்தால், எந்தப் பாராட்டும் கிடைக்காது. அதனால், அதுக்கு அது ஒரு தவறா, சரியானா என்று தெரியாது.
- MIT-யின் புதிய முறை: ரோபோ சரியான ஓட்டையைக் கண்டுபிடித்து பொருளைச் செருகினால், அதற்குப் பாராட்டு கிடைக்கும். ஆனால், தவறான ஓட்டையைத் தேர்ந்தெடுத்தால், ஒரு சிறிய “தண்டனை” கிடைக்கும். இந்தத் தண்டனை என்பது, ரோபோவுக்கு ஒருவிதமான “எச்சரிக்கை” போல. அது, “நான் இங்கே தவறு செய்தேன், அடுத்த முறை இதைச் செய்யக்கூடாது” என்று ரோபோவுக்குத் தெரிவிக்கும்.
இந்த “தண்டனை” என்பது, ரோபோவுக்கு வலியை ஏற்படுத்துவது அல்ல. அது, கணினியில் ஒரு விதமான “குறைந்த மதிப்பெண்” அல்லது “எதிர்மறை சமிக்ஞை” (negative signal) போல செயல்படும். இந்தத் தண்டனையின் மூலம், ரோபோ எந்தச் செயல்பாடு தவறானது என்பதை விரைவாகவும், திறமையாகவும் கற்றுக்கொள்ளும்.
இதன் நன்மைகள் என்ன?
- வேகமான கற்றல்: இயந்திரங்கள் தண்டனையில் இருந்து கற்றுக்கொள்ளும்போது, அவை செய்யும் தவறுகளை மிக விரைவாகத் திருத்திக்கொள்ளும்.
- புத்திசாலித்தனமான முடிவுகள்: எந்தச் செயல்பாடு சரி, எது தவறு என்பதைத் தெளிவாகப் புரிந்துகொள்வதால், இயந்திரங்கள் எதிர்காலத்தில் இன்னும் சிறந்த முடிவுகளை எடுக்கும்.
- சிக்கலான வேலைகளைச் செய்தல்: இது, சாலைகளில் தானாக ஓடும் கார்கள் (self-driving cars), மருத்துவர்களுக்கு உதவும் ரோபோக்கள் போன்ற மிகவும் சிக்கலான வேலைகளைச் செய்யும் இயந்திரங்களை உருவாக்க உதவும்.
குழந்தைகளுக்கும் மாணவர்களுக்கும் இது ஏன் முக்கியம்?
இந்தக் கண்டுபிடிப்பு, அறிவியல் எவ்வளவு சுவாரஸ்யமானது என்பதைக் காட்டுகிறது.
- கண்டுபிடிப்பின் உற்சாகம்: விஞ்ஞானிகள் எவ்வளவு புதுமையான யோசனைகளுடன் செயல்படுகிறார்கள் என்பதை நாம் பார்க்கலாம்.
- பிரச்சினைகளுக்குத் தீர்வு: இது போன்ற கண்டுபிடிப்புகள், நம்முடைய வாழ்க்கையை எளிதாக்கும் புதிய தொழில்நுட்பங்களை உருவாக்கும்.
- நீங்களும் ஒரு விஞ்ஞானி ஆகலாம்! உங்களுக்கு அறிவியல் ஆர்வம் இருந்தால், நீங்களும் இது போன்ற அற்புதமான கண்டுபிடிப்புகளைச் செய்யலாம்!
வருங்காலம் எப்படி இருக்கும்?
வருங்காலத்தில், நம்முடைய வீட்டு வேலைகளைச் செய்யும் ரோபோக்கள், பள்ளியில் நமக்குப் பாடங்களைச் சொல்லித்தரும் ரோபோக்கள், ஏன், நம்முடைய நண்பர்களாகக்கூட ரோபோக்கள் இருக்கலாம்! இந்த MIT கண்டுபிடிப்பு, அந்த எதிர்காலத்தை இன்னும் சிறப்பாகவும், பாதுகாப்பாகவும் மாற்ற உதவும்.
எனவே, அடுத்த முறை நீங்கள் ஒரு தவறு செய்தால், அதை ஒரு கற்றல் வாய்ப்பாகப் பாருங்கள். MIT விஞ்ஞானிகளும் இதையேதான் தங்கள் இயந்திரங்களுக்கும் கற்றுக்கொடுக்கிறார்கள். அறிவியலும், கண்டுபிடிப்புகளும் எப்பொழுதும் நம்மை ஆச்சரியப்படுத்தும்!
ஏஐ செய்திகள் வழங்கியுள்ளது.
Google Gemini இலிருந்து பதிலை பெற கீழே உள்ள கேள்வி பயன்படுத்தப்பட்டது:
2025-08-20 20:45 அன்று, Massachusetts Institute of Technology ‘Learning from punishment’ ஐ வெளியிட்டது. தயவுசெய்து தொடர்புடைய தகவல்களுடன் விரிவான கட்டுரையை குழந்தைகள் மற்றும் மாணவர்கள் புரிந்துகொள்ளக்கூடிய எளிய மொழியில் எழுதவும், இது அதிக குழந்தைகளை அறிவியலில் ஆர்வம் கொள்ள ஊக்குவிக்கும். தயவுசெய்து கட்டுரையை தமிழில் மட்டும் வழங்கவும்.