இத்தனை பாகங்களாக தரவுச்சுரங்கம் பற்றிய ஒரு நீண்ட அறிமுகத்தை வழங்கியிருக்கின்றோம். இனி சுரங்கம் தோண்டுவதற்கான பணியினை ஆரம்பிக்கலாம். ஒரு நிறுவனத்தில் தரவுகளின் பயன்பாடு கீழ்க்கண்ட இரண்டு வகைகளில் ஒன்றாக இருக்கின்றது.
- நிகழ்நிலை நடப்புச் செயல்முறை (Online Transaction Processing – OLTP)
நடவடிக்கைகள் நடந்தவுடன் நமக்குத் தேவைப்படும் அறிக்கைகளுக்காக இந்தச் செயல்முறை இருக்கின்றது. எடுத்துக்காட்டாக ஒரு வாடிக்கையாளர் சரக்கு வாங்கும் போது அவருக்குத் தருவதற்காக ஒரு பட்டி அல்லது ரசீது தரவேண்டியிருக்கின்றது. அதன் பின்னர் அதைக் கணக்குப் பதிவு செய்ய வேண்டியிருக்கின்றது. அன்றாடம் நமது நிறுவனம் செவ்வனே நடைபெறுவதற்காக இந்தச் செயல்முறை நடைமுறையில் இருக்கின்றது. இது உறவுமுறைத் தரவுத்தள மேலாண்மையைக் (Relational Database Management System) கொண்டு இயங்குகின்றது. உருபொருட்களை (Entities) மையப்படுத்தியும் அவற்றின் பண்புகளைச் (Attributes) சுற்றிலும் அமையுமாறு உள்ளது. இதற்கு நிரைகளை அடிப்படையாகக் கொண்டுஇயங்கும் உறவுமுறைத் தரவுத்தளம் (Row based Databases) பொருத்தமானதாக உள்ளது. அதாவது ஒரு ரசீதை நாம் அச்சிட வேண்டுமானால் நமக்கு வாடிக்கையாளரின் பெயர், முகவரி, வரிவிதிப்பு எண் என்று ஒட்டு மொத்தத் தரவும் தேவைப்படுகின்றது.
- நிகழ்நிலை பகுப்பாய்வுச் செயல்முறை (Online Analytical Processing – OLAP)
நடவடிக்கைகள் நடந்து முடிந்தவுடன் எதிர்காலத் தேவைக்காக இரண்டாம் வகை தரவு வடிவமைப்பு அவசியமாகின்றது. ஏனெனில் பகுப்பாய்வு செய்வதற்கு நமக்கு ஒவ்வொரு வாடிக்கையாளரின் முகவரி, வரிவிதிப்பு எண் போன்ற துல்லியமான தரவுகள் தேவைப்படாது. நடவடிக்கைகள் குறித்த செய்தித் தரவுகள் மட்டுமே தேவைப்படும். எனவே இங்கே செய்தியை (Facts) நடுவில் வைத்து உருபொருட்களைச் (Entities) சுற்றிலும் அமைக்கும் வழிமுறை தேவைப்படுகின்றது. இவ்வுருபொருட்களும் பின்னால் பரிமாணங்களில் (Dimensions) சிலவாக உருவெடுக்கும் விந்தையும் காணப் போகின்றோம்.
இரண்டு வகைகளுமே ஒரு நிறுவனம் செவ்வனே இயங்குவதற்குத் தேவை என்றாலும் அதே தரவையே அடிப்படையாகக் கொண்டு இரண்டுமே வடிவமைக்கப்படுகின்றது என்றாலும் அடிப்படையில் இவற்றுக்கிடையே மலைக்கும் மடுவுக்குமான வேறுபாடுகளைக் காண முடிகின்றது. அவற்றை இங்கே பட்டியலிடுவோம்.
வ. எண் | நிகழ்நிலை நடப்புச் செயல்முறை (OLTP) | நிகழ்நிலை பகுப்பாய்வுச் செயல்முறை (OLAP) |
1 | அன்றாட நடவடிக்கைகளுக்காகப் பயன்படுத்தப்படுகின்றது. | எதிர்காலத் திட்டமிடலுக்கும் பகுப்பாய்வுக்கும் பயன்படுத்தப்படுகின்றது. |
2 | அன்றாடத் தரவுகளை மட்டுமே பயன்படுத்துகின்றது. | தேவைப்பட்டால் நிறுவனம் தொடங்கிய நாளில் இருந்து இன்று வரையான வரலாற்றுத் தரவுகளும் பயன்படுத்தப்படுகின்றது. |
3 | அறிக்கைகளுக்குப் பொதுவாக தரவுத்தள மேலாண்மையைப் பயன்படுத்துகின்றது. (DBMS) | அறிக்கைகளுக்கு தரவுக்கிட்டங்கிகள் தேவைப்படுகின்றன. (Data warehouses) |
4 | இதன் தேவை அன்றாட மென்பொருள் பயன்பாட்டுக்கானதாகும். (Application Oriented) தொழில் நடைமுறைக்குப் பயன்படுகின்றது. | இது புலம் சார்ந்த மேலான (Subject Oriented) பயன்பாட்டுக்காகும். திட்டமிடல், முடிவெடுத்தல், பகுப்பாய்வு செய்தல் ஆகியவற்றுக்குப் பயன்படுகின்றது. |
5 | தரவுத் தள இயல்பாக்கம் (Database Normalization) அவசியமாகும். | இயல்பாக்கம் இருக்க வேண்டிய அவசியமில்லை. |
6 | இன்றைய தொழிலின் நிலையை அறிய உதவும் ஒரு கண்ணாடி போன்றது.. | இது பல்பரிமாணத் தரவுப் பெட்டகமாகத் திகழ்கின்றது. |
7 | எப்போதுமே 100 சதவீதத் தரவுகளைப் பயன்படுத்தப்போவதில்லை ஆதலால் மிகவும் வேகமாக இயங்கும்! | அதிகப்படியான தரவுகளைப் பயன்படுத்துவதால் சற்று மெதுவாகவே இயங்கும். மணிக்கணக்கில் கூட ஆகலாம்! |
8 | இதைப் பயன்படுத்துபவர்கள் நிறுவனத்தின் அடிமட்டப் பணியாளர்கள். | இதைப் பயன்படுத்துபவர்கள் திட்டமிடும் அளவில் இருக்கின்ற மேல்மட்டப் பணியாளர்கள். |
9 | தரவில் வாசித்தல் மற்றும் எழுதல் (Read and Write) ஆகிய இரு பணிகளும் அடிக்கடி நடக்கும். | இதில் எழுத வேண்டிய அவசியமில்லை. வாசித்தல் மட்டுமே நடைபெறும். |
10 | நிரைவரிசைத் தரவுகள் பொருத்தமானதாகும். (Row based Database) | நெடுவரிசைத் தரவுகள் (Columnar Databases) பொருத்தமானதாகும். |
11 | உருபொருளை மையமாகக் கொண்டு, பண்புகளைச் சுற்றிலும் கொண்ட வடிவமைப்பில் இயங்குகின்றது. (Entity Centered.) | நடவடிக்கைச் செய்திகளை மையமாகக் கொண்டு பரிமாணங்களைச் சுற்றிலும் கொண்ட வடிவமைப்பில் இயங்குகின்றது. (Fact Centered) |
12 | இயல்பாக்கத்தினால் உருபொருள் உறவுமுறை வரைபடத்தின் மூலம் வரையப்படுகின்றது. (Entity Relationship Diagrams) | எளிய நட்சத்திர வடிவமைப்பிலிருந்து பனித்துகள் வடிவமைப்பு மற்றும் சிக்கலான நட்சத்திரத் திரள் வடிவமைப்பு வரை நீண்டு கொண்டே செல்லக்கூடும். (Star/Snowflake/Cluster Schema) |
மேற்கண்ட வேறுபாடுகளிலிருந்து நிகழ்தரவு பகுப்பாய்வின் சிறப்பம்சங்களை அறிந்து கொள்ளலாம். மேலும் பல ஆண்டுகளின் தரவுகளையும் சேர்க்கும் போது சில சிக்கல்களும் ஏற்படுகின்றன. அவைபற்றிய விளக்கங்களை அடுத்தடுத்த பகுதிகளில் காணலாம்.