தரவுச் சுரங்கம் - 13

இந்தப் பகுதியில் பல கருத்தாழமிக்க தகவல் தொழில்நுட்பச் சொல்லாடல்களையும் ஒன்றாகக் கட்டி வைத்திருக்கும் சங்கிலியைப் பற்றிக் காண்போம். எடுத்துக்காட்டாக வியாபார நுண்ணறிவு (Business Intelligence), தரவுத்தள மேலாண்மை (Database Management), தகவல் தொழில்நுட்பம் (Information Technology), தரவுச்சுரங்கம் (Data Mining), தரவுக் கிட்டங்கி (Data Warehouse), நிகழ்தரவு பகுப்பாய்வு (Online Analytical Processing), செயற்கை நுண்ணறிவு (Artificial Intelligence), இயந்திரக் கற்றல் (Machine Learning), ஆழக் கற்றல் (Deep Learning) போன்ற பல நவீனக் கணினித் தரவுச் சொற்களைத் தற்போது காண முடிகின்றது.  இவை அனைத்தையும் ஒன்றிணைத்து ஒரு நவயுகத் துறையாக உருவெடுத்து வருவது தரவு அறிவியல் ஆகும். தகவல் அறிவியல் வேறு. தரவு அறிவியல் வேறு. இன்று நாம் காண இருப்பது தரவு அறிவியல்.

தரவு அறிவியல் என்றால் என்ன? விக்கிப்பீடியாவில் அறிவார்ந்த பெருமக்கள் என்ன சொல்கின்றார்கள் என்று பார்ப்போம்.

தரவு அறிவியல் கணிதம், புள்ளியியல், கணினி அறிவியல், தரவுச் செயலாக்கம் போன்ற பல்வேறு துறைகளிலிருந்து கோட்பாடுகளையும், தொழில்நுட்பங்களையும் பயன்படுத்துகிறது. தரவு அறிவியலின் ஒரு முக்கியமான பிரிவு பெருந் தரவு ஆகும்.

உழவு, சந்தைப்படுத்தலை மேம்படுத்தல், மோசடிகளைக் கண்டுபிடித்தல் போன்ற சிக்கல்களை ஆராய, தரவுத் தயார்ப்படுத்துதல், புள்ளியியல், இயந்திரக் கற்றல் போன்ற துறைகளைத் தரவு அறிவியல் பயன்படுத்துகிறது.

தரவு விஞ்ஞானிகள் தங்களின் திறனைப் பயன்படுத்தி தரவு மூலத்தை கண்டுபிடித்து விளக்கவும், வன்பொருள், மென்பொருள் மற்றும் அலைவரிசை தடைகள் இருந்தபோதிலும் அதிக அளவிலான தரவுகளை நிர்வகிக்கவும், தரவுகளுக்கான ஆதாரங்களை இணைக்கவும், தரவுகளின் நிலைத்தன்மையை உறுதிப்படுத்தவும், தரவுகளை புரிந்து கொள்வதற்கு உதவியாக காட்சிப்படங்களை உருவாக்கவும், தரவுகளைப் பயன்படுத்தி கணித மாதிரிகளை கட்டமைக்கவும் மற்றும் தரவுகளைப்பற்றிய கண்டுபிடிப்புகளை வெளிப்படுத்தவும் செய்கிறார்கள்.

என்ன அருமையான விளக்கம் பாருங்கள்? மேற்கண்ட பத்திகளைத் திரும்பத் திரும்ப இருமுறை வாசித்துப் பார்த்தாலே தரவு அறிவியல் பற்றி உணர்ந்து கொள்ளலாம்.

இன்றைய தகவல் தொழில்நுட்ப யுகத்தின் புதிய துறையாகவும் அதிக வேலைவாய்ப்பைத் தரக் கூடிய துறையாகவும் இந்தத் தரவு அறிவியல் துறையைக் காண முடிகின்றது. இந்தியர்கள் அதிலும் குறிப்பாக கணிப்பொறியாளர்கள் தங்கள் வாயால் உச்சரிக்கும் ஒரு மந்திரமாக இந்தச் சொல் இருப்பதைக் காணலாம்.

இதில் ஒரு கணிப்பொறியாளர் தம்மை ஒரு தரவு விஞ்ஞானியாக மேம்படுத்திக் கொள்வதைக் காணலாம். விஞ்ஞானிகள் என்பவர்கள் உலகில் ஆல்பர்ட் ஐன்ஸ்டீன் போல ஐசக் நியூட்டனைப் போல அபூர்வமாகப் பிறப்படுத்துத் தங்கள் கண்டுபிடிப்புகளைக் கொண்டு சாதனைகளையும் புதுவிதக் கருவிகளையும், இயற்கையின் விசித்திரமான புதிர்களுக்கான பதில்களையும் கண்டுபிடிப்பவர்களாகத் தான் இதுவரை நாம் உணர்ந்திருக்கின்றோம்.

இன்றோ யார் வேண்டுமானாலும் தரவு விஞ்ஞானி ஆக முடிகின்ற ஒரு வசதியையும் வாய்ப்பையும் இந்தக் கணினித் துறை உருவாக்கிக் கொடுத்திருக்கின்றது என்றால் அது மிகையாகாது.

மேலே குறிப்பிட்டபடி, கணிதம், புள்ளியியல், கணிப்பொறியியல், தரவு மேலாண்மை குறித்த அறிவு ஆகியவற்றை வளர்த்துக் கொண்டால் நீங்கள் நானும் கூட தரவு விஞ்ஞானிகளாக ஆகி விட முடியும்!

இன்றைய உலகம் காண்கின்ற மற்றும் காணப் போகின்ற பல்வேறு பிரச்னைகளுக்கும் கணினியைப் பயன்படுத்தி தீர்வு காணும் ஒரு துறை தரவு அறிவியல் துறை.

இதனை இதனால் இவன்முடிக்கும் என்றாய்ந்து அதனை அவன்கண் விடல். என்னும் திருக்குறளுக்கு ஏற்ப விண்மீண்களின் எண்ணிக்கையை ஒத்திருக்கும் பெருந்தரவை ஆராய்ந்து அதிலிருந்து காலப் புதிர்களை விடுவிக்கும் அறிவைப் பெறுவதற்குக் கணினியை எவ்வாறு பயன்படுத்துவது என்பதை இப்போது மனிதன் நன்றாகவே கற்றுக் கொண்டு விட்டான். தரவு அறிவியலில் இன்று பலரும் கற்றுத் தேர்ந்து கணினியின் கையில் சுக்கானைக் கொடுத்து பெருந்தரவுக் கடலில் கப்பல் ஓட்ட வைக்கின்றார்கள்.

தரவு விஞ்ஞானிகள் “தரவுகளை புரிந்து கொள்வதற்கு உதவியாக காட்சிப்படங்களை (Visualizations) உருவாக்கவும், தரவுகளைப் பயன்படுத்தி கணித மாதிரிகளை (Mathematical Models) கட்டமைக்கவும் மற்றும் தரவுகளைப்பற்றிய கண்டுபிடிப்புகளை வெளிப்படுத்தவும் செய்கிறார்கள்.” மேலே தடிப்பான எழுத்துகளில் கூறப்பட்டிருப்பதில் நம் கவனத்தைச் செலுத்துவோம்!


Author: ரத்தினகிரி

ரத்தினகிரி சுப்பையா

-பட்டயக் கணக்காளர் - ஆசிரியர் - தரவு பகுப்பாய்வு ஆர்வலர்