தரவுச்சுரங்கம் – 33
கனத் தரவு, தொழில் நுண்ணறிவிற்கு உதவும் ஒரு மிகச் சிறந்த கருவி என்று சென்ற பகுதியில் கண்டோம். அவ்வாறான கனத்தரவினை எளிதாகவும், மிகச் சரியாகவும், விரைவாகவும் பயன்படுத்த வேண்டுமென்றால் கச்சிதமான தரவு மாதிரி தேவை என்பதையும் கண்டோம். அவ்வாறான தரவுமாதிரியில் என்னென்ன அம்சங்கள் இருக்கவேண்டும் என்பதைப் பற்றி இந்தப் பகுதியில் காண்போம்.
தரவு மாதிரியின் முக்கிய அம்சங்கள் (Data Model Features)
| அம்சம் (Feature) | தமிழ்ப் பதம் (Tamil Term) | விளக்கம் (Description) |
|---|---|---|
| Tables | அட்டவணைகள் | இது தரவு மாதிரியின் அடிப்படை அலகு. இது நிரல்கள் (Columns) மற்றும் நிரைகளை (Rows) உள்ளடக்கியது. இதில் 'உண்மை அட்டவணைகள்' (Fact Tables) மற்றும் 'பரிமாண அட்டவணைகள்' (Dimension Tables) என இருவகை உண்டு. |
| Schema | திட்ட அமைப்பு | தரவுத்தளத்தின் ஒட்டுமொத்தக் கட்டமைப்பு அல்லது வரைபடம். இது அட்டவணைகள் எவ்வாறு அமைக்கப்பட்டிருக்கின்றன என்பதைக் குறிக்கிறது. |
| Relationships | உறவுகள் / தொடர்புகள் | இரண்டு அட்டவணைகளுக்கு இடையே உள்ள பிணைப்பு. இது முதன்மைத் திறவி (Primary Key) மற்றும் அந்நியத் திறவி (Foreign Key) மூலம் ஏற்படுத்தப்படுகிறது. |
| Cardinality | தொடர்பு நிலை | அட்டவணைகளுக்கு இடையேயான உறவின் எண்ணிக்கையை இது குறிக்கிறது. (உதாரணம்: ஒரு வாடிக்கையாளர் பல ஆர்டர்களைச் செய்யலாம் - One-to-Many). |
| Roles | பங்கு / பொறுப்புகள் | தரவுப் பாதுகாப்பிற்காகப் (Security) பயன்படுத்தப்படுகிறது. குறிப்பிட்ட பயனர் குழுக்கள் எந்தெந்தத் தரவை மட்டும் பார்க்கலாம் என்பதை இது தீர்மானிக்கிறது (Row-Level Security - RLS). |
| Hierarchies | படிநிலைகள் | தரவை மேலிருந்து கீழாக ஆழமாகப் பார்க்க (Drill-down) உதவும் அமைப்பு. உதாரணமாக: ஆண்டு > காலாண்டு > மாதம் > நாள். |
| Measures | அளவீடுகள் | தரவு மாதிரியில் செய்யப்படும் கணக்கீடுகள். இவை 'உண்மை' தரவுகளிலிருந்து (e.g., Sales, Profit) சூத்திரங்கள் மூலம் உருவாக்கப்படும் புதிய மதிப்புகள். |
| Cultures | கலாச்சார அமைப்புகள் | ஒரு சர்வதேசத் தரவு மாதிரியில், வெவ்வேறு நாடுகளில் உள்ள மொழிகள், தேதி வடிவங்கள் மற்றும் நாணய குறியீடுகளுக்கு ஏற்பத் தரவைக் காட்டும் வசதி. |
| Perspectives | பார்வைக் கோணங்கள் | ஒரு பிரம்மாண்டமான தரவு மாதிரியில், ஒரு குறிப்பிட்ட துறையினருக்கு (உதாரணம்: விற்பனைத் துறை மட்டும்) தேவையான அட்டவணைகள் மற்றும் அளவீடுகளை மட்டும் பிரித்துக் காட்டும் ஒரு 'துணைத் தொகுப்பு' (Subset). |
இதில் குறிப்பிட்ட முக்கியமான அம்சங்களை மட்டும் சற்றே விரிவாகக் காண்போம். முதலில் அட்டவணைகளை எடுத்துக் கொள்வோம். உறவுநிலைத் தரவுத்தள மேலாண்மையில் அத்தனை செய்திகளும் அட்டவணைகளாகவே சேமிக்கப்படுகின்றன என்றும் அவை அனைத்தும் முதன்மை மற்றும் அந்நியத் திறவிகளின் மூலம் நிர்வகிக்கப்படுகின்றன என்பதையும் அறிவோம். அவ்வாறு பெற்றோர் மற்றும் குழந்தை உறவுடன் இருக்கும் அட்டவணைகளை நெடுவரிசைத் தரவுக்கு மாற்றும் போது அதிலிருக்கும் செய்திகளின் தன்மைக்கேற்றவாறு உண்மை அட்டவணைகள், பரிமாண அட்டவணைகள் என்று அழைக்கப்படுகின்றன. கனத் தரவு என்பது ஒரு பலபரிமாண கனசதுர அமைப்பு என்பதை ஏற்கனவே கண்டோம் அல்லவா? அதற்குத் தகுந்தவாறு பெயரிட்டு அழைக்கப்படுகின்றன.
இனி அவற்றின் தன்மைகளைக் காண்போம்.
பரிமாண அட்டவணைகள் (Dimension Tables): இவை பெரும்பாலும் பெற்றோர்/முதன்மை அட்டவணைகளாக (Parent/Master Tables) இருக்கும். இவற்றில் இருக்கும் செய்திகள் பெரும்பாலும் எழுத்து வடிவமாக (Labels) இருக்கும். ஒரு வியாபாரத் தலத்தில் எப்போதும் இருக்கும் அல்லது அடிக்கடி மாறாதிருக்கும் நிரந்தரத் தன்மை கொண்டதாக இருக்கும். இதுவே வியாபார நடவடிக்கைகளுக்கு அர்த்தம் வழங்குவதாக இருக்கும். அதாவது இவைகளை நீக்கி விட்டு வியாபார நடவடிக்கைகளான வெறும் எண்களை மட்டும் பார்த்தால் அர்த்தமற்றதாகிவிடும். இவை கனத் தரவுச் சதுரத்தின் விளிம்பினில் இருப்பதாகக் கொள்ளப்படும். எடுத்துக்காட்டு: வாடிக்கையாளர், வாங்கிய/விற்ற பொருள், இடம், காலம், பணியாளர் பெயர், துறை, இயந்திரம் ஆகியன.
உண்மை அட்டவணைகள் (Fact Tables). இவை பெரும்பாலும் குழந்தை/நடவடிக்கை அட்டவணைகளாக (Child/Transaction Tables) இருக்கும். இவற்றில் இருக்கும் செய்திகள் பெரும்பாலும் எண்களைக் கொண்டிருக்கும். தினந்தோறும் மேற்கண்ட பரிமாணங்கள் ஏற்படுத்திய அல்லது செயல்படுத்திய நடவடிக்கைகளின் தொகுப்பாக இருக்கும். இவை கனத் தரவுச் சதுரத்தின் நடுப்பகுதியில் இருப்பதாகக் கொள்ளப்படும். எடுத்துக்காட்டு: விற்பனை நாள், எண், எண்ணிக்கை, விற்பனை விலை, தொகை, தள்ளுபடி, லாபம் ஆகியன.
இனி இவை எவ்வாறு தரவு மாதிரியில் பொருத்தி வைக்கப்படுகின்றன என்பதை அடுத்த பகுதியில் காணலாம்.