தரவுச் சுரங்கம் - 34

தரவுச்சுரங்கம் – 34

சென்ற பகுதியில் தரவு மாதிரிகளின் அடிப்படை அலகான அட்டவணைகளைக் குறித்துக் கண்டோம். பரிமாண மற்றும் உண்மை/நடவடிக்கை அட்டவணைகளாக உருமாறுவதையும் கண்டோம். எவ்வாறு ஒரு கனசதுரத்தின் விளிம்புகள் அளக்கக்கூடிய அதன் பரிமாணங்களை உருவாக்குகின்றதோ அதே போல் இங்கே பரிமாண அட்டவணைகள் கனத் தரவுச் சதுரத்தின் விளிம்புகளில் பொருத்திப் பார்க்கப்படுகின்றன. அவ்வாறு பொருத்தி, அத்தனை அட்டவணைகளையும் இணைத்து வடிவமைப்பதை திட்ட அமைப்பு (Schema) என்கின்றோம்.

இந்தத் திட்ட அமைப்பு நிறுவனத்தின் தரவுத்தளத்தினைப் பொறுத்தும், அதன் அளவைப் பொறுத்தும், அட்டவணைகளின் எண்ணிக்கையினைப் பொறுத்தும், நாம் எந்த நோக்கத்திற்காக இந்தத் தரவு மாதிரியை உருவாக்குகின்றோம் என்பதைப் பொறுத்தும் வடிவமைக்கப்படும். இத்திட்ட அமைப்புகளில் முதன்மையாகத் திகழ்வது நட்சத்திரத் திட்ட அமைப்பு (Star Schema) மற்றும் பனித்துகள் திட்ட அமைப்பு (Snowflake Schema)ஆகும். அவை பற்றிச் சற்று விரிவாக இப்பகுதியில் காண்போம்.

enter image description here

  1. நட்சத்திரத் திட்ட அமைப்பு (Star Schema)

இது தரவு மாதிரியாக்கத்தில் (Data Modeling) மிக எளிமையான மற்றும் பரவலாகப் பயன்படுத்தப்படும் ஒரு அமைப்பாகும். இதன் மையத்தில் ஒரு 'உண்மை அட்டவணை' (Fact Table) இருக்கும், அதனைச் சுற்றிப் பல 'பரிமாண அட்டவணைகள்' (Dimension Tables) இணைக்கப்பட்டிருக்கும். இதைப் பார்க்கும் போது ஒரு நட்சத்திரத்தின் வடிவம் கிடைப்பதால் இப்பெயர் பெற்றது.

• கட்டமைப்பு: உண்மை அட்டவணைக்கும் ஒவ்வொரு பரிமாண அட்டவணைக்கும் இடையே நேரடித் தொடர்பு (Direct Relationship) இருக்கும். • சிறப்பு: இதில் தரவுகள் 'இயல்புறா நிலையில்' (Denormalized) இருக்கும். அதாவது, ஒரே தகவல் மீண்டும் மீண்டும் வரலாம் (Redundancy), ஆனால் தரவைத் தேடி எடுக்கும் வேகம் (Query Performance) மிக அதிகமாக இருக்கும். • பயன்பாடு: Power BI போன்ற கருவிகளில் இதுவே 'தங்கத் தரநிலை' (Gold Standard) எனக் கருதப்படுகிறது.

  1. பனித்துகள் திட்ட அமைப்பு (Snowflake Schema)

நட்சத்திரத் திட்ட அமைப்பின் ஒரு மேம்பட்ட அல்லது விரிவுபடுத்தப்பட்ட வடிவமே இதுவாகும். இதில் பரிமாண அட்டவணைகள் மீண்டும் சிறு சிறு துணைப் பரிமாண அட்டவணைகளாகப் பிரிக்கப்பட்டிருக்கும்.

• கட்டமைப்பு: ஒரு துணைப் பரிமாண அட்டவணைக்கும் உண்மை அட்டவணைக்கும் இடையே நேரடித் தொடர்பு இருக்காது. மாறாக, அது மற்றொரு பரிமாண அட்டவணையின் மூலமாக இணைக்கப்பட்டிருக்கும்.

o எடுத்துக்காட்டு: 'பொருள் வகை' (Category) என்ற துணை அட்டவணை நேரடியாக உண்மை அட்டவணையுடன் இணையாமல், பொருள்வகை -> பொருள் -> உண்மை அட்டவணை மூலம் இணைந்திருக்கும்.

• சிறப்பு: இதில் தரவுகள் 'இயல்புநிலைப்படுத்தப்பட்டிருக்கும்' (Normalized). இதனால் தரவு சேமிப்பு இடம் (Storage Space) மிச்சமாகும், ஆனால் பல அட்டவணைகளை இணைக்க வேண்டியிருப்பதால் (Multiple Joins) வேகம் சற்று குறைய வாய்ப்புண்டு. • பயன்பாடு: தரவுக் கிடங்குகளில் (Data Warehousing) இடவசதியைச் சிக்கனப்படுத்த இது பயன்படுத்தப்படுகிறது.

ஒப்பீடு: எது சிறந்தது?

| அம்சம் | நட்சத்திரத் திட்ட அமைப்பு | பனித்துகள் திட்ட அமைப்பு | |--|--|--| | வடிவம் | எளிமையானது | சற்று சிக்கலானது | | தரவுச் சுருக்கம் | குறைவு (Redundancy உண்டு) | அதிகம் (Normalization உண்டு) | | வேகம் | மிக அதிகம் | குறைவு (பல Joins தேவை) | | பராமரிப்பு | எளிது | கூடுதல் கவனம் தேவை | தரவுமாதிரியின் மற்ற சில முக்கிய அம்சங்களைப் பற்றி அடுத்த பகுதியில் காண்போம்.


Author: ரத்தினகிரி

ரத்தினகிரி சுப்பையா

-பட்டயக் கணக்காளர் - ஆசிரியர் - தரவு பகுப்பாய்வு ஆர்வலர்