தரவுச் சுரங்கம் - 33

தரவுச்சுரங்கம் – 33

கனத் தரவு, தொழில் நுண்ணறிவிற்கு உதவும் ஒரு மிகச் சிறந்த கருவி என்று சென்ற பகுதியில் கண்டோம். அவ்வாறான கனத்தரவினை எளிதாகவும், மிகச் சரியாகவும், விரைவாகவும் பயன்படுத்த வேண்டுமென்றால் கச்சிதமான தரவு மாதிரி தேவை என்பதையும் கண்டோம். அவ்வாறான தரவுமாதிரியில் என்னென்ன அம்சங்கள் இருக்கவேண்டும் என்பதைப் பற்றி இந்தப் பகுதியில் காண்போம்.

தரவு மாதிரியின் முக்கிய அம்சங்கள் (Data Model Features)

அம்சம் (Feature) தமிழ்ப் பதம் (Tamil Term) விளக்கம் (Description)
Tables அட்டவணைகள் இது தரவு மாதிரியின் அடிப்படை அலகு. இது நிரல்கள் (Columns) மற்றும் நிரைகளை (Rows) உள்ளடக்கியது. இதில் 'உண்மை அட்டவணைகள்' (Fact Tables) மற்றும் 'பரிமாண அட்டவணைகள்' (Dimension Tables) என இருவகை உண்டு.
Schema திட்ட அமைப்பு தரவுத்தளத்தின் ஒட்டுமொத்தக் கட்டமைப்பு அல்லது வரைபடம். இது அட்டவணைகள் எவ்வாறு அமைக்கப்பட்டிருக்கின்றன என்பதைக் குறிக்கிறது.
Relationships உறவுகள் / தொடர்புகள் இரண்டு அட்டவணைகளுக்கு இடையே உள்ள பிணைப்பு. இது முதன்மைத் திறவி (Primary Key) மற்றும் அந்நியத் திறவி (Foreign Key) மூலம் ஏற்படுத்தப்படுகிறது.
Cardinality தொடர்பு நிலை அட்டவணைகளுக்கு இடையேயான உறவின் எண்ணிக்கையை இது குறிக்கிறது. (உதாரணம்: ஒரு வாடிக்கையாளர் பல ஆர்டர்களைச் செய்யலாம் - One-to-Many).
Roles பங்கு / பொறுப்புகள் தரவுப் பாதுகாப்பிற்காகப் (Security) பயன்படுத்தப்படுகிறது. குறிப்பிட்ட பயனர் குழுக்கள் எந்தெந்தத் தரவை மட்டும் பார்க்கலாம் என்பதை இது தீர்மானிக்கிறது (Row-Level Security - RLS).
Hierarchies படிநிலைகள் தரவை மேலிருந்து கீழாக ஆழமாகப் பார்க்க (Drill-down) உதவும் அமைப்பு. உதாரணமாக: ஆண்டு > காலாண்டு > மாதம் > நாள்.
Measures அளவீடுகள் தரவு மாதிரியில் செய்யப்படும் கணக்கீடுகள். இவை 'உண்மை' தரவுகளிலிருந்து (e.g., Sales, Profit) சூத்திரங்கள் மூலம் உருவாக்கப்படும் புதிய மதிப்புகள்.
Cultures கலாச்சார அமைப்புகள் ஒரு சர்வதேசத் தரவு மாதிரியில், வெவ்வேறு நாடுகளில் உள்ள மொழிகள், தேதி வடிவங்கள் மற்றும் நாணய குறியீடுகளுக்கு ஏற்பத் தரவைக் காட்டும் வசதி.
Perspectives பார்வைக் கோணங்கள் ஒரு பிரம்மாண்டமான தரவு மாதிரியில், ஒரு குறிப்பிட்ட துறையினருக்கு (உதாரணம்: விற்பனைத் துறை மட்டும்) தேவையான அட்டவணைகள் மற்றும் அளவீடுகளை மட்டும் பிரித்துக் காட்டும் ஒரு 'துணைத் தொகுப்பு' (Subset).

இதில் குறிப்பிட்ட முக்கியமான அம்சங்களை மட்டும் சற்றே விரிவாகக் காண்போம். முதலில் அட்டவணைகளை எடுத்துக் கொள்வோம். உறவுநிலைத் தரவுத்தள மேலாண்மையில் அத்தனை செய்திகளும் அட்டவணைகளாகவே சேமிக்கப்படுகின்றன என்றும் அவை அனைத்தும் முதன்மை மற்றும் அந்நியத் திறவிகளின் மூலம் நிர்வகிக்கப்படுகின்றன என்பதையும் அறிவோம். அவ்வாறு பெற்றோர் மற்றும் குழந்தை உறவுடன் இருக்கும் அட்டவணைகளை நெடுவரிசைத் தரவுக்கு மாற்றும் போது அதிலிருக்கும் செய்திகளின் தன்மைக்கேற்றவாறு உண்மை அட்டவணைகள், பரிமாண அட்டவணைகள் என்று அழைக்கப்படுகின்றன. கனத் தரவு என்பது ஒரு பலபரிமாண கனசதுர அமைப்பு என்பதை ஏற்கனவே கண்டோம் அல்லவா? அதற்குத் தகுந்தவாறு பெயரிட்டு அழைக்கப்படுகின்றன.

இனி அவற்றின் தன்மைகளைக் காண்போம்.

பரிமாண அட்டவணைகள் (Dimension Tables): இவை பெரும்பாலும் பெற்றோர்/முதன்மை அட்டவணைகளாக (Parent/Master Tables) இருக்கும். இவற்றில் இருக்கும் செய்திகள் பெரும்பாலும் எழுத்து வடிவமாக (Labels) இருக்கும். ஒரு வியாபாரத் தலத்தில் எப்போதும் இருக்கும் அல்லது அடிக்கடி மாறாதிருக்கும் நிரந்தரத் தன்மை கொண்டதாக இருக்கும். இதுவே வியாபார நடவடிக்கைகளுக்கு அர்த்தம் வழங்குவதாக இருக்கும். அதாவது இவைகளை நீக்கி விட்டு வியாபார நடவடிக்கைகளான வெறும் எண்களை மட்டும் பார்த்தால் அர்த்தமற்றதாகிவிடும். இவை கனத் தரவுச் சதுரத்தின் விளிம்பினில் இருப்பதாகக் கொள்ளப்படும். எடுத்துக்காட்டு: வாடிக்கையாளர், வாங்கிய/விற்ற பொருள், இடம், காலம், பணியாளர் பெயர், துறை, இயந்திரம் ஆகியன.

உண்மை அட்டவணைகள் (Fact Tables). இவை பெரும்பாலும் குழந்தை/நடவடிக்கை அட்டவணைகளாக (Child/Transaction Tables) இருக்கும். இவற்றில் இருக்கும் செய்திகள் பெரும்பாலும் எண்களைக் கொண்டிருக்கும். தினந்தோறும் மேற்கண்ட பரிமாணங்கள் ஏற்படுத்திய அல்லது செயல்படுத்திய நடவடிக்கைகளின் தொகுப்பாக இருக்கும். இவை கனத் தரவுச் சதுரத்தின் நடுப்பகுதியில் இருப்பதாகக் கொள்ளப்படும். எடுத்துக்காட்டு: விற்பனை நாள், எண், எண்ணிக்கை, விற்பனை விலை, தொகை, தள்ளுபடி, லாபம் ஆகியன.

இனி இவை எவ்வாறு தரவு மாதிரியில் பொருத்தி வைக்கப்படுகின்றன என்பதை அடுத்த பகுதியில் காணலாம்.


Author: ரத்தினகிரி

ரத்தினகிரி சுப்பையா

-பட்டயக் கணக்காளர் - ஆசிரியர் - தரவு பகுப்பாய்வு ஆர்வலர்