
AWS Entity Resolution: பெயர்களை சரியாக அடையாளம் காண ஒரு சூப்பர் ஹீரோ!
குழந்தைகளே, நீங்கள் இப்போதுதான் அறிவியல் உலகில் கால்பதிக்கிறீர்கள்! இன்று நாம் “AWS Entity Resolution” என்ற ஒரு அற்புதமான விஷயத்தைப் பற்றிப் பார்க்கப்போகிறோம். இது எப்படி ஒரு சூப்பர் ஹீரோ போல செயல்படுகிறது என்றும், நம் பெயர்களை சரியாக அடையாளம் காண எப்படி உதவுகிறது என்றும் பார்க்கலாம்.
AWS Entity Resolution என்றால் என்ன?
கற்பனை செய்து பாருங்கள், உங்களிடம் ஒரு பெரிய புத்தகம் இருக்கிறது. அதில் நிறைய குழந்தைகளின் பெயர்கள் எழுதப்பட்டிருக்கின்றன. ஆனால், சில பெயர்கள் கொஞ்சம் மாறி மாறி எழுதப்பட்டிருக்கின்றன. உதாரணத்திற்கு:
- அமுதா
- அமுத்தா
- அமுர்தா
இந்த பெயர்களைப் பார்க்கும் போது, இவை அனைத்தும் ஒரே குழந்தையைத்தான் குறிக்கின்றன என்று உங்களுக்குத் தெரியும். ஆனால், கணினிக்கு இது கொஞ்சம் கடினமாக இருக்கலாம். இங்குதான் AWS Entity Resolution என்ற சூப்பர் ஹீரோ வருகிறது!
AWS Entity Resolution என்பது அமேசான் (Amazon) உருவாக்கிய ஒரு புத்திசாலித்தனமான கருவி. இது பல்வேறு தரவுகளில் (data) உள்ள ஒரே நபரின் அல்லது ஒரே பொருளின் பெயர்களை அல்லது தகவல்களை சரியாக இணைக்க உதவுகிறது.
இது எப்படி வேலை செய்கிறது?
இந்த சூப்பர் ஹீரோ சில மந்திர உத்திகளைப் பயன்படுத்துகிறது. அவை:
-
லெவன்ஸ்டீன் (Levenshtein) உத்தி:
- இது ஒரு வார்த்தையில் உள்ள எழுத்துக்களை ஒப்பிட்டு, அவை எவ்வளவு தூரம் ஒன்றிலிருந்து ஒன்று வேறுபடுகின்றன என்பதை அளவிடும்.
- உதாரணமாக, “அமுதா” மற்றும் “அமுத்தா” இடையே ஒரு சிறிய வேறுபாடுதான் உள்ளது (கடைசி ‘அ’ எழுத்து). லெவன்ஸ்டீன் இந்த சிறிய வேறுபாட்டைப் புரிந்துகொண்டு, இந்த இரண்டு பெயர்களும் ஒன்றுதான் என்று கூறும்.
- இது ஒரு புதிர் விளையாட்டு மாதிரி. ஒரு வார்த்தையை உருவாக்க எத்தனை மாற்றங்கள் (சேர்த்தல், நீக்குதல், மாற்றுதல்) செய்ய வேண்டும் என்று கணக்கிடுவது.
-
கோசைன் (Cosine) உத்தி:
- இது வார்த்தைகளில் உள்ள எழுத்துக்களின் தொகுப்பை (set of characters) ஒப்பிடும்.
- “அமுதா” என்பதில் ‘அ’, ‘மு’, ‘தா’ என்ற எழுத்துக்கள் உள்ளன. “அமுர்தா” என்பதில் ‘அ’, ‘மு’, ‘ர்’, ‘தா’ என்ற எழுத்துக்கள் உள்ளன.
- கோசைன் உத்தி இந்த எழுத்துக்களின் தொகுப்புகளைப் பார்த்து, இவை எவ்வளவு ஒத்திருக்கின்றன என்பதைக் கண்டறியும். அமுதா மற்றும் அமுர்தா இடையே “அ”, “மு”, “தா” போன்ற பொதுவான எழுத்துக்கள் நிறைய உள்ளன, எனவே அவை ஒன்றாக இணைக்கப்படும்.
- இது ஒரு விளையாட்டுப் பொருட்களை ஒப்பிடுவது போல. ஒரே மாதிரியான வண்ணங்கள் அல்லது வடிவங்கள் உள்ள பொருட்களை ஒன்றாக வைப்பது.
-
சவுண்டெக்ஸ் (Soundex) உத்தி:
- இது பெயர்களின் உச்சரிப்பை (pronunciation) அடிப்படையாகக் கொண்டது.
- “அமுதா” மற்றும் “அமுர்தா” ஆகியவற்றை நீங்கள் உச்சரிக்கும்போது, அவை கிட்டத்தட்ட ஒரே மாதிரி ஒலிக்கும்.
- சவுண்டெக்ஸ் உத்தி பெயர்களின் ஒலியைக் குறியீடாக (code) மாற்றும். ஒரே மாதிரி ஒலிக்கும் பெயர்களுக்கு ஒரே குறியீடு கிடைக்கும்.
- இது ஒரு பாடலை கேட்பது போல. வெவ்வேறு இசைக் கருவிகளில் ஒரே பாடலை வாசித்தாலும், அதன் மெட்டு ஒன்றே.
ஏன் இது முக்கியம்?
குழந்தைகளே, நீங்கள் பள்ளியில் ஒரு திட்டம் செய்யும்போது, அல்லது ஒரு விளையாட்டில் உங்கள் நண்பர்களின் பெயர்களைப் பட்டியலிடும்போது, இந்த AWS Entity Resolution உங்களுக்கு உதவும்.
- தகவல்களை ஒழுங்கமைக்க: பள்ளியில் உள்ள மாணவர்களின் பட்டியலை எடுக்கும்போது, சில மாணவர்கள் தங்கள் பெயரை ஒருமுறை “ராஜ்” என்றும், மறுமுறை “ராஜா” என்றும் எழுதியிருக்கலாம். AWS Entity Resolution இவை இரண்டுமே ஒரே ராஜாதான் என்று அடையாளம் கண்டு, பட்டியலைச் சரியாக ஒழுங்கமைக்க உதவும்.
- தவறுகளைக் குறைக்க: பெரிய நிறுவனங்கள் தங்கள் வாடிக்கையாளர்களின் தகவல்களைச் சேமிக்கும்போது, இந்த சூப்பர் ஹீரோ தவறுகளைத் தடுக்கவும், சரியான தகவல்களைப் பெறவும் உதவுகிறது.
- புதிய விஷயங்களைக் கண்டறிய: சில சமயம், நாம் தெரியாத தகவல்களைத் தேடும்போதும், இந்த உத்திகள் நமக்கு உதவும்.
குழந்தைகளே, இது அறிவியல்!
நீங்கள் விளையாடும்போது, நீங்கள் யோசிக்கும்போது, நீங்கள் விஷயங்களைக் கவனிக்கும்போது, அனைத்தும் அறிவியலின் ஒரு பகுதியே! AWS Entity Resolution என்பது கணிதம், மொழி மற்றும் கணினி அறிவியலின் ஒரு அழகான கலவையாகும்.
இது போன்ற புதிய கண்டுபிடிப்புகள் நம் வாழ்க்கையை எளிதாக்குகின்றன. இந்த சூப்பர் ஹீரோ உத்திகளைப் பயன்படுத்தி, கணினிகள் நம் உலகைப் புரிந்துகொள்ளவும், தகவல்களைச் சிறப்பாக நிர்வகிக்கவும் உதவுகின்றன.
நீங்கள் என்ன செய்யலாம்?
- உங்கள் நண்பர்களின் பெயர்களைப் பாருங்கள். எப்படி அவை சிறிது சிறிதாக மாறுகின்றன?
- வார்த்தைகளில் உள்ள எழுத்துக்களை மாற்றி விளையாடுங்கள்.
- நீங்கள் புதிதாக ஒரு வார்த்தையைக் கண்டுபிடித்தால், அது எப்படி ஒலிக்கும் என்று யோசியுங்கள்.
இவையெல்லாம் உங்களை ஒரு சிறந்த விஞ்ஞானியாக்க உதவும்! AWS Entity Resolution போன்ற கருவிகள், நாம் அனைவரும் அறிவியலை எவ்வாறு பயன்படுத்தலாம் என்பதைக் காட்டுகின்றன. அறிவியலைக் கற்றுக்கொள்வது ஒரு பெரிய சாகசம்! இந்த சாகசத்தில் ஈடுபடுங்கள், புதிய விஷயங்களைக் கண்டறியுங்கள்!
AWS Entity Resolution launches advanced matching using Levenshtein, Cosine, and Soundex
ஏஐ செய்திகள் வழங்கியுள்ளது.
Google Gemini இலிருந்து பதிலை பெற கீழே உள்ள கேள்வி பயன்படுத்தப்பட்டது:
2025-07-30 13:47 அன்று, Amazon ‘AWS Entity Resolution launches advanced matching using Levenshtein, Cosine, and Soundex’ ஐ வெளியிட்டது. தயவுசெய்து தொடர்புடைய தகவல்களுடன் விரிவான கட்டுரையை குழந்தைகள் மற்றும் மாணவர்கள் புரிந்துகொள்ளக்கூடிய எளிய மொழியில் எழுதவும், இது அதிக குழந்தைகளை அறிவியலில் ஆர்வம் கொள்ள ஊக்குவிக்கும். தயவுசெய்து கட்டுரையை தமிழில் மட்டும் வழங்கவும்.