தரவுச் சுரங்கம் - 35

தரவுச்சுரங்கம் – 35

கனத் தரவு மாதிரியின் முக்கிய அம்சங்கள்

கனத் தரவு மாதிரியின் அம்சங்களைப் பற்றி அறிந்துகொண்டிருக்கின்றோம். இந்தப் பகுதியில், மீதமுள்ளவற்றில் முக்கியமான சில அம்சங்களை மட்டும் காணலாம்.

பங்கு / பொறுப்புகள் (Role)

ஒரு நிறுவனத்தின் எல்லாத் தகவல்களும் அனைவரும் பார்க்கத் தகுந்தவையாக இருப்பதில்லை. தங்கத்தை இரும்புப் பெட்டியில் பூட்டி வைத்தால்தான் அதற்கு பாதுகாப்பும் மதிப்பும் உண்டு; அதுபோலத் தகவல்களும் உரிய ரகசியத்துடன் பாதுகாக்கப்பட வேண்டும். உங்கள் பெயரை எல்லோருக்கும் சொல்லலாம்; ஆனால் கடவுச்சொல்லை ரகசியமாகத்தானே வைத்திருக்க வேண்டும்?

தொழில் நுண்ணறிவு என்பது, பல ஆண்டுகளாக ஒரு நிறுவனம் சேகரித்து வைத்துள்ள தரவிலிருந்து சுரங்கம் தோண்டி தங்கத்தை எடுப்பதற்கு ஒப்பானது. அத்தகைய தகவல்கள் தேவையில்லாதோரிடம் எக்காரணம் கொண்டும் சென்றடையக் கூடாது. தகவல் பாதுகாப்பு எந்த நிலையிலும் விட்டுக்கொடுக்கப்படக் கூடாது.

ஒரு முதன்மை நிதி அதிகாரி (CFO) நிறுவனத்தின் அனைத்து ஆண்டுகளுக்குமான அனைத்து அறிக்கைகளையும் பார்க்கக்கூடியவராக இருக்கலாம். ஆனால் ஒரு கிளை அதிகாரி, தனது கிளைக்குரிய தரவுகளை மட்டுமே பார்க்கக்கூடியவாறு தரவு மாதிரி அமைக்கப்பட வேண்டும். தகவல் தொழில்நுட்பத்தின் நோக்கம், சரியான தகவல் சரியான நேரத்தில் சரியான நபருக்குச் சென்றடைவதை உறுதிசெய்வதே. அதே நேரத்தில், தவறான நபரிடம் அந்தத் தகவல் சென்றடையாதிருக்கச் செய்வதும் அதே அளவு முக்கியம்.

இதற்கெனத் தரவு மாதிரியில் அமைக்கப்படும் கட்டுப்பாடே “பங்கு” (Role) ஆகும். எந்தப் பயனர் அல்லது பயனர்குழு எந்தத் தகவலைப் பார்க்கலாம் என்பதை வரி மட்டத்திலேயே கட்டுப்படுத்தி பாதுகாப்பது வரிநிலை பாதுகாப்பு (Row Level Security) எனப்படுகிறது. இதைச் சரியாக அமைக்காவிட்டால், தகவல் கசிவு ஏற்பட்டு, தகவல் தொழில்நுட்பத்தின் அடிப்படை நோக்கமே பாதிக்கப்படும்.

படிநிலைகள் (Hierarchies)

பரிமாண அட்டவணைகள் (Dimension Tables) நிரந்தரமானவை என்பதை முன்பே கண்டோம். ஒரு பெரிய நிறுவனத்தில் பல பரிமாண அட்டவணைகள் இருக்கும்; அவற்றில் ஒவ்வொன்றிலும் ஆயிரக்கணக்கான உறுப்புகள் இருக்கக்கூடும். உதாரணமாக, ஆயிரக்கணக்கான வாடிக்கையாளர்கள் அல்லது பொருட்கள் இருக்கலாம்.

இவற்றை ஒவ்வொன்றாகப் பார்ப்பதற்குப் பதிலாக, அவற்றின் இயல்புகளுக்கேற்ப பல படிநிலைகளில் தொகுத்துப் பார்ப்பது அவசியமாகிறது. உதாரணமாக, ஒரு CFO-க்கு ஒரே ஒரு வாடிக்கையாளர் என்ன வாங்கினார் என்பது காட்டிலும், ஒரு குறிப்பிட்ட வகை வாடிக்கையாளர்கள் என்ன வாங்கினர் என்பதைப் பார்ப்பதே பயனுள்ளதாக இருக்கும். அதைப் போலவே, ஒரு தனிக் கிளையைப் பார்ப்பதைவிட ஒரு மண்டலத்தின் செயல்திறனைப் பார்ப்பது மேலாண்மைக்கு ஏற்றதாக இருக்கலாம்.

எனவே, ஒவ்வொரு பரிமாணத்திலும் பல நிலைகளில் தொகுக்கப்பட்ட படிநிலைகள் அமைக்கப்பட வேண்டும்.

பரிமாணம் படிநிலைகள்
இடம் நாடு, மண்டலம், மாநிலம், மாவட்டம், நகர், தெரு
காலம் ஆண்டு, காலாண்டு, மாதம், வாரம், நாள், மணி
நிறுவனம் மண்டலம், கிளை
அளவீடுகள் (Measures)

தரவு மாதிரியில் செய்யப்படும் கணக்கீடுகள் அளவீடுகள் (Measures) எனப்படும். ஒரு பெட்டியின் நீளம், அகலம், உயரம் ஆகிய மூன்று பரிமாணங்களையும் அளக்க ஒரே அளவுமுறை தேவைப்படுவது போல, தொழில் நுண்ணறிவிலும் ஒரு தரவு மாதிரிக்குள் பயன்படுத்தப்படும் அளவீடுகள் ஒரே மாதிரியான தளத்தில் அமைந்திருக்க வேண்டும்.

ஒரு பொருளை சென்டிமீட்டரிலும் மற்றொன்றை அங்குலத்திலும் அளந்தால் ஒப்பீடு அர்த்தமற்றதாகிவிடும். அதுபோல, ஒரு வாடிக்கையாளரை ஒரு அளவீட்டால், ஒரு கிளையை வேறு அளவீட்டால் மதிப்பிட்டால் சரியான பகுப்பாய்வு சாத்தியமில்லை.

எடுத்துக்காட்டாக, மொத்த விற்பனை என்ற அளவீட்டை எடுத்துக் கொண்டால், அதையே வைத்து வாடிக்கையாளரை அளக்கலாம்; பொருளை அளக்கலாம்; கிளையை அளக்கலாம்; மண்டலத்தை அளக்கலாம்.

இதன் முக்கிய நன்மை என்னவெனில், தேவையில்லாமல் பல தனித்தனி சூத்திரங்களை எழுத வேண்டிய அவசியம் குறைகிறது. ஒட்டுமொத்த கனத் தரவு மாதிரிக்குமான ஒரு பொதுவான அளவீட்டு சூத்திரம் உருவாக்கப்பட்டு, அதையே பல பரிமாணங்களின் வழியாகப் பயன்படுத்த முடியும். இதுவே கனத் தரவின் நுட்பமான சிறப்பு.

அதாவது, ஒரு குறிப்பிட்ட அளவீட்டை எந்தவொரு பரிமாணத்தின் வழியாகவும் பகுப்பாய்வு செய்ய முடியும்.

கலாச்சார அமைப்புகள் (Cultures)

ஒரு சர்வதேச தரவு மாதிரியில், பல நாடுகளின் மொழிகள், தேதி வடிவங்கள், எண் வடிவங்கள், நாணயக் குறியீடுகள் ஆகியவற்றுக்கேற்ப தரவைக் காட்டும் வசதி இருக்க வேண்டும். உதாரணமாக, ஒரே தரவை அமெரிக்காவில் டாலரில் காண வேண்டியிருக்கும்; இந்தியாவில் ரூபாயில் காண வேண்டியிருக்கும். அதேபோல், தேதி வடிவமும் மொழியும் பயனர் நாட்டுக்கு ஏற்ப மாற வேண்டும்.

ஆகவே, தரவு மாதிரி தொழில்நுட்ப ரீதியாகச் சரியாக இருப்பது மட்டும் போதாது; அது பயனாளியின் மொழி மற்றும் பிராந்திய தேவைகளுக்கும் ஏற்ப தன்னை வெளிப்படுத்தக்கூடியதாக இருக்க வேண்டும்.

இத்துடன், கனத் தரவின் சில முக்கிய அம்சங்களைப் பார்த்தோம். அடுத்த பகுதியில், கனத் தரவின் முக்கிய செயல்பாடுகளை விரிவாகக் காணலாம்.


Author: ரத்தினகிரி

ரத்தினகிரி சுப்பையா

-பட்டயக் கணக்காளர் - ஆசிரியர் - தரவு பகுப்பாய்வு ஆர்வலர்