தண்டனையில் இருந்து கற்றுக்கொள்ளலாம்! MIT-யின் ஒரு புதிய கண்டுபிடிப்பு!,Massachusetts Institute of Technology


தண்டனையில் இருந்து கற்றுக்கொள்ளலாம்! MIT-யின் ஒரு புதிய கண்டுபிடிப்பு!

MIT (Massachusetts Institute of Technology) என்றழைக்கப்படும் மிகச்சிறந்த அறிவியல் பல்கலைக்கழகம், ஆகஸ்ட் 20, 2025 அன்று ஒரு சுவாரஸ்யமான புதிய கண்டுபிடிப்பைப் பற்றி நமக்குச் சொல்லியிருக்கிறது. அதன் பெயர் “Learning from punishment”, அதாவது “தண்டனையில் இருந்து கற்றுக்கொள்வது”.

இது என்ன புதிர்? நாம் தவறு செய்தால் தண்டனை கிடைக்கும் என்று பள்ளியிலும் வீட்டிலும் படித்திருப்போம். ஆனால், இந்தமுறை MIT விஞ்ஞானிகள், “தண்டனை”யை ஒரு கற்றல் கருவியாகப் பயன்படுத்தி, எப்படி இன்னும் புத்திசாலித்தனமான இயந்திரங்களை (ரோபோக்களைப் போல!) உருவாக்கலாம் என்று கண்டுபிடித்திருக்கிறார்கள்.

எதற்காக இந்த கண்டுபிடிப்பு?

நாம் குழந்தைகள் எப்படி கற்றுக்கொள்கிறோம் என்று யோசித்துப் பாருங்கள்.

  • சரியாக செய்தால்: நீங்கள் ஒரு வேலையை சரியாக செய்தால், அம்மா உங்களுக்குப் பாராட்டு தெரிவிப்பார்கள் அல்லது சாக்லேட் கொடுப்பார்கள். இது உங்களுக்கு அடுத்த முறையும் அதைச் சரியாகச் செய்ய ஊக்கமளிக்கும்.
  • தவறு செய்தால்: நீங்கள் ஒரு பொம்மையை உடைத்துவிட்டால், அம்மா உங்களைக் கண்டிப்பார்கள். இது அடுத்த முறை பொம்மைகளை கவனமாகப் பயன்படுத்த கற்றுக்கொடுக்கும்.

அதாவது, நாம் “நல்ல விஷயங்களுக்கு வெகுமதியும்”, “தவறான விஷயங்களுக்கு தண்டனையும்” பெற்றுக்கொண்டே கற்றுக்கொள்கிறோம்.

MIT விஞ்ஞானிகளின் யோசனை என்ன?

MIT விஞ்ஞானிகள் இதைத்தான் இயந்திரங்களுக்கும் (ரோபோக்களுக்கும்) செய்ய முயற்சி செய்கிறார்கள். பொதுவாக, இயந்திரங்கள் ஒரு வேலையைச் செய்ய பயிற்சி அளிக்கும்போது, அவை சரியாகச் செய்தால் “பாராட்டு” (reward) மட்டுமே கொடுக்கப்படும். ஆனால், MIT கண்டுபிடிப்பு என்னவென்றால், இயந்திரங்கள் தவறு செய்யும் போது, அந்தத் தவறை “தண்டனையாக” உணர்த்தி, அதிலிருந்து கற்றுக்கொள்ள வைப்பது.

இது எப்படி வேலை செய்கிறது?

இதை எளிமையாகப் புரிந்துகொள்ள, ஒரு குட்டி உதாரணத்தைப் பார்ப்போம்.

ஒரு ரோபோவுக்கு ஒரு சுவரில் உள்ள ஓட்டையைக் கண்டுபிடித்து, அதில் ஒரு பொருளைச் செருக வேண்டும் என்று வைத்துக்கொள்வோம்.

  • பழைய முறை: ரோபோ சரியான ஓட்டையைக் கண்டுபிடித்து பொருளைச் செருகினால், அதுக்கு ஒரு “பாராட்டு” கிடைக்கும். தவறான ஓட்டையைத் தேர்ந்தெடுத்தால், எந்தப் பாராட்டும் கிடைக்காது. அதனால், அதுக்கு அது ஒரு தவறா, சரியானா என்று தெரியாது.
  • MIT-யின் புதிய முறை: ரோபோ சரியான ஓட்டையைக் கண்டுபிடித்து பொருளைச் செருகினால், அதற்குப் பாராட்டு கிடைக்கும். ஆனால், தவறான ஓட்டையைத் தேர்ந்தெடுத்தால், ஒரு சிறிய “தண்டனை” கிடைக்கும். இந்தத் தண்டனை என்பது, ரோபோவுக்கு ஒருவிதமான “எச்சரிக்கை” போல. அது, “நான் இங்கே தவறு செய்தேன், அடுத்த முறை இதைச் செய்யக்கூடாது” என்று ரோபோவுக்குத் தெரிவிக்கும்.

இந்த “தண்டனை” என்பது, ரோபோவுக்கு வலியை ஏற்படுத்துவது அல்ல. அது, கணினியில் ஒரு விதமான “குறைந்த மதிப்பெண்” அல்லது “எதிர்மறை சமிக்ஞை” (negative signal) போல செயல்படும். இந்தத் தண்டனையின் மூலம், ரோபோ எந்தச் செயல்பாடு தவறானது என்பதை விரைவாகவும், திறமையாகவும் கற்றுக்கொள்ளும்.

இதன் நன்மைகள் என்ன?

  • வேகமான கற்றல்: இயந்திரங்கள் தண்டனையில் இருந்து கற்றுக்கொள்ளும்போது, அவை செய்யும் தவறுகளை மிக விரைவாகத் திருத்திக்கொள்ளும்.
  • புத்திசாலித்தனமான முடிவுகள்: எந்தச் செயல்பாடு சரி, எது தவறு என்பதைத் தெளிவாகப் புரிந்துகொள்வதால், இயந்திரங்கள் எதிர்காலத்தில் இன்னும் சிறந்த முடிவுகளை எடுக்கும்.
  • சிக்கலான வேலைகளைச் செய்தல்: இது, சாலைகளில் தானாக ஓடும் கார்கள் (self-driving cars), மருத்துவர்களுக்கு உதவும் ரோபோக்கள் போன்ற மிகவும் சிக்கலான வேலைகளைச் செய்யும் இயந்திரங்களை உருவாக்க உதவும்.

குழந்தைகளுக்கும் மாணவர்களுக்கும் இது ஏன் முக்கியம்?

இந்தக் கண்டுபிடிப்பு, அறிவியல் எவ்வளவு சுவாரஸ்யமானது என்பதைக் காட்டுகிறது.

  • கண்டுபிடிப்பின் உற்சாகம்: விஞ்ஞானிகள் எவ்வளவு புதுமையான யோசனைகளுடன் செயல்படுகிறார்கள் என்பதை நாம் பார்க்கலாம்.
  • பிரச்சினைகளுக்குத் தீர்வு: இது போன்ற கண்டுபிடிப்புகள், நம்முடைய வாழ்க்கையை எளிதாக்கும் புதிய தொழில்நுட்பங்களை உருவாக்கும்.
  • நீங்களும் ஒரு விஞ்ஞானி ஆகலாம்! உங்களுக்கு அறிவியல் ஆர்வம் இருந்தால், நீங்களும் இது போன்ற அற்புதமான கண்டுபிடிப்புகளைச் செய்யலாம்!

வருங்காலம் எப்படி இருக்கும்?

வருங்காலத்தில், நம்முடைய வீட்டு வேலைகளைச் செய்யும் ரோபோக்கள், பள்ளியில் நமக்குப் பாடங்களைச் சொல்லித்தரும் ரோபோக்கள், ஏன், நம்முடைய நண்பர்களாகக்கூட ரோபோக்கள் இருக்கலாம்! இந்த MIT கண்டுபிடிப்பு, அந்த எதிர்காலத்தை இன்னும் சிறப்பாகவும், பாதுகாப்பாகவும் மாற்ற உதவும்.

எனவே, அடுத்த முறை நீங்கள் ஒரு தவறு செய்தால், அதை ஒரு கற்றல் வாய்ப்பாகப் பாருங்கள். MIT விஞ்ஞானிகளும் இதையேதான் தங்கள் இயந்திரங்களுக்கும் கற்றுக்கொடுக்கிறார்கள். அறிவியலும், கண்டுபிடிப்புகளும் எப்பொழுதும் நம்மை ஆச்சரியப்படுத்தும்!


Learning from punishment


ஏஐ செய்திகள் வழங்கியுள்ளது.

Google Gemini இலிருந்து பதிலை பெற கீழே உள்ள கேள்வி பயன்படுத்தப்பட்டது:

2025-08-20 20:45 அன்று, Massachusetts Institute of Technology ‘Learning from punishment’ ஐ வெளியிட்டது. தயவுசெய்து தொடர்புடைய தகவல்களுடன் விரிவான கட்டுரையை குழந்தைகள் மற்றும் மாணவர்கள் புரிந்துகொள்ளக்கூடிய எளிய மொழியில் எழுதவும், இது அதிக குழந்தைகளை அறிவியலில் ஆர்வம் கொள்ள ஊக்குவிக்கும். தயவுசெய்து கட்டுரையை தமிழில் மட்டும் வழங்கவும்.

Leave a Comment