දත්ත – හැදින්වීම (Introduction to Data)

ලංකාවේ හැම වසර 10 කටම වරක්ම පවත්වන ජන සංගණනය සලකමු . සැම නිවසකටම පැමිණෙන ජනලේඛන හා සංඛ්‍යාලේඛන දෙපාර්තමේන්තුවේ නියෝජිතයේක් ගෘහ මුලිකයාගෙ නම,ගෙදර කොපමණ සාමාජිකයෝ ඉන්නවද, ඒ අයගෙ නම් ,වයස ,ස්ත්‍රි පුර්ෂ භාවය ආදී විශාල කරුණු ප්‍රමාණයක්(facts) ,ස්ථිර පදිංචිය තහවුරු කරගෙන , සටහන් කර ගනී.ගෙදරට ලබාදී ඇති සංගනණ අංකයට මෙහි සුවිශේෂී ස්ථානයක් හිමි වී තිබෙනු දැකිය හැක .2011 ජන හා නිවාස සංගණනය භාවිතා කල පහත පත්‍රිකව සහ එහි අවශ්‍ය කර ඇති කරුණු වෙත අවදානය යොමු කරන්න.

(සම්පූර්ණ පත්‍රිකාව: http://www.statistics.gov.lk/PopHouSat/CPH2011/Pages/sm/CPH2011_Questionnaire_S.pdf )






මෙලෙස ලංකාවේ සැම ගෘහයකින්ම එකතු කරගත් පත්‍රිකා,සුවිශේෂ ක්‍රියාවලියකින් පසු ,ජනලේඛන හා සංඛ්‍යාලේඛන දෙපාර්තමෙන්තුව පහත දක්වෙන කෙටි වගු වලට පරිවර්තනය කරයි.මෙය ඉහත කරුණු එක් ස්වරුපයක(facts) සිටවෙනත් ස්වරුපයකට පරිවර්තනයක් ලෙස සැලකිය හැක.

 
(උපුටාගැනීම: සංඛ්‍යාන දත්ත පත්‍රිකාව 2012 :www.statistics.gov.lk/DataSheet/datasinhala.pdf )



කුඩා අවදියේ පටන්කරුණු සංශිප්තව දැක්වීමට අප වගු සටහන් භාවිතා කරයි. ඉහත සංශිප්තව දක්වා ඇති ,මධය වාර්ෂික ජනගහනය,ජන ඝනත්වය,වාර්ෂික උපත් මරණ අනුපතය ආදිය උපුටගෙන නොයෙකුත් සැසදිම් ,ව්ශ්ලේෂ හා නිගමන ඉදිරිපත් කරන අතර මෙය ඉදිරි කටයුතු පිබුරුපත් කිරීමටත් ඉතාම වැදගත්.මෙහිදී එළබෙන නිගමන වඩාත් සංශිප්ත වන අතර නව සවරුපයක වඩාත් වැදගත් කරුණකි. ( උදා : එක් ,එක් දිස්ත්‍රිකයකින් පාර්ලිමේන්තුවේ නියෝගනය කරන අසුන් ගණන වෙනස්  කිරීම)
පත්‍රිකාව  නිවැරදිව සම්පූර්ණ කල විට ,මෙය කියවන ඔබ ඇතුළු ඔබේ පවුලේ සාමාජිකයින් මධය වාර්ෂික ජනගහනයට දායකවී ඇති බව  පැහැදිලි වේ .නමුත් ,පවුලේ සාමාජිකයින් ගණන පමණක් රටේ මුළු ගනගාහනය සාපේක්ෂව  සැලකු විට, පරිපාලකයන්ට නොසැලකිය හැකි තරම් කුඩා නොවැදගත් අගයකි.
එනමුත් ගෙදර කොපමන් සංඛ්‍යාවක් ඉන්නවද යන්න නිගමන, තිරණ ගන්න වැදගත්වන අවස්ථා නැතුවාක් නොවේ.උදාහරණයක් වශයෙන් ඔබගේ මව ආහාර පිසීමට පෙර ගෙදර එදින කොපමණ සංඛ්‍යාවක් සිටීද යන්න විමසා බලන අවස්ථාව සලකන්න.
තොරතුරු හා සන්නිවේදන තාක්ෂණයට අත්පොත් තබන නංගිලා මල්ලිලාට පහත දැක්වෙන කරුණු මිට ඉහතදී සමහර අවස්ථා වල ගැටළුවක් වන්නට ඇත.හේතුව මේ වන විට අවබෝධ කරගෙන සිටීමටත් පුලුවන් .
  • එක් රැස් කරගත් පත්‍රිකා කිසිදු වෙනසකට භාවිතා නොකර ,ලංකාව ගැන ව්ශ්ලේෂ හා නිගමන කිරීමට හැකිද?
  •  නිවාස දෙකක් පමණක් සැසදීමට ,කොට්ඨාශ දෙකක් පමණක් සැසදීමට, ඉහත සංශිප්ත වගුව සුදුසුද ? (වටහ ගන්න පුලුවන්)
  • පත්‍රිකවල අඩංගු කරුණු වෙනත් ස්වරුපයකට පත් කලවිට , වෙනත් පාර්ශවයක් එයට ඉහල වටිනාකමක් ලබාදෙන්නේ ඇයි?
  •  එක පුද්ගලයකුට වැදගත් වන පත්‍රිකාවක් හෝ පත්‍රිකා තවත් පුද්ගලයකුට ඒ හා සමානව වැදගත් නොවන්නේ ඇයි?
හේතුව තමයි දත්ත වල බහුමාධ්‍ය ආකාරයෙන් පැවතීම









දත්තවල නිර්වචනය වෙත දැන් අවදානය යොමුකරමු.


අර්ථ රහිත (Meaningless)

 අර්ථ රහිත ( අර්ථ විරහිත ) කියලා කියන්නේ දත්ත දැනට පවතින ආකාරයෙන් භාවිතා කරන්නාගේ අරමුණ සම්පුර්න කරගන්න බැරි නිසා .ඒ කියන්නේ පවතින අර්ථ විරහිත ආකාරයේ සිට අර්ථාන්විත ආකාරයකට පත් කරන්න ඕනේ. ජන සංගණනයේ  සැසදිම් ,ව්ශ්ලේෂ හා නිගමන ඉදිරිපත් කරන අයට ගෙවල් වලින් එකතු කරපු පත්‍රිකා වලින් කෙලිම නිගමන වලට පැමිණීම ප්‍රයෝගික නැහැ. එවැනි විශ්ලේෂණයක් පිළිගැනීමට ලක්වෙන්නේ නැත්තේ යොදාගත් දත්ත අර්ථාන්විත ආකාරයකට( සංශිප්ත ,වගුගත , ලංකාවේම කරුණු ඇතුලත් ) අකාරයට පත්කර නැති නිසා. විශ්ලේෂකයන්ට අනුව පත්‍රිකා වල අඩංගු වෙන්න දත්ත ලෙස සැලකිය හැකියි.
 

අසංවිධි (Not organized)

 සැම පත්‍රිකාවකම එම නිවසේ කරුණු බොහොමයක් අඩංගුයි. එක එක පත්‍රිකාව අරන් කියන්න හැකි වෙන්නේ ඒ ඒ නිවසේ විස්තර විතරයි. ලකාවේ තොරතුරක් ලබා ගන්න තවදුරත් දත්ත සවිධානය කල යුතුයි .  ලංකාවේ ඉන්න පුද්ගලෙක් ගේ නම,  ජාතික හැදුනුම්පත් අංකය දන්නවානම් තහවුරු කරගන්න  ,මේ හැම පත්‍රිකාවකම නිවැසියන්ගේ  නම හෝ ජාතික හැදුනුම්පත් අංකයට (NIC) සමඟ සටහන් කරගන්න වෙනවා. උදාහරණයක ‌ලංකාවේ ඉන්නේ හැමෝගෙ නම සමග වයස දන්නවා නම්, ඔබගේ වයසේ කි දෙනෙක් ඉන්නවාද ඇසුවොත්, අපිට ඒ දත්ත අවම වශයෙන් කණ්ඩායම් දෙකකට බෙදාගන්නවත් වෙනවා.ඊට පස්සේ අපේ වයසට සමාන කණ්ඩායමේ කි දෙනෙක් ඉන්නවද කියලා ගනින්න (count) ඕනේ .දත්ත සංවිධානය කරන්න බහුලව සංඛ්‍යානය (Statistics) භාවිතා කරන්න පුළුවන් කියලා දැන් ඔය ගොල්ලන්ට තේරෙනවා ඇති .
 

අවිධිමත් – ( Informal )

දත්ත පිහිටන ආකාරය අනුව භාවිතා කරන්නා අවිධිමත් ලෙස වර්ග කරන්න පුළුවන් . දත්ත එක්රැස් කිරීමේදී මූලික අර්ථයෙන් ලබාගන්නා(source format) දත්ත අසම්පුරන වෙන්න පලුවන්. උදාහරණයට හැටියට සමහර වයසක අයගේ ජාතික හැදුනුම්පත් ලබාගන්න බැරි වෙන්න පලුවන්.එවැනි අවස්ථාවක පත්‍රිකාවේ  අනිවාර්ය දත්ත පවා මගහැරී තියෙන්න පුළුවන්. ජනලේඛන හා සංඛ්‍යාලේඛන දෙපාර්තමේන්තුව ඉහත ආකාරයේ සම්මතව පත්‍රිකාවක් නිදේශ කර නොතිබුනානම් , නියෝජිතයන් විවිධ පත්‍රිකා සකස්කර ( විවිධ පිලිවල , විවිධ හදුන්වන නාම ) ලබාදෙන්නේ පලුවන්. එවිට පත්‍රිකාවල අවිධිමත් බව වැඩි වෙනවා.
 
 
 

දත්ත පිහිටන ආකාර

දත්ත එක්රැස් කරන කොට ඒවා ප්‍රදාන වශයෙන් ආකාර 3 කට පවතිනවා.
 
1. ලිඛිත සටහන් (Text )   
දත්ත රස කරන ප්‍රධාන මාධ්‍යක් වෙන්නේ ලිඛිත සටහන්. ලියන්න හැකි ඕනෑම කෙනෙකුට, දත්ත කොලයක හෝ ජංගම දුරකථනයක සටහන් කර ගන්න පලුවන්. පුද්ගලයෙකුට එදිනෙදා වැදගත් වෙන ,දුරකථන අංක ,ගමන් කළ ස්ථාන, ස්ථාන අතර දුර , බැංකු ගිණුම් අංක සහ තවත් බොහෝ දේවල් ලිඛිත දත්ත ලෙස සලකන්න පලුවන්.තේරුම් ගත නොහැකි අපිළිවෙල සංකේත කිහිපයක් රහස් භාෂාවක දත්තයක් වෙන්න පලුවන්.


දත්ත එකතු කිරීම ගවේෂනයෙන් (observation ) හෝ ප්‍රශ්න ඇසීමෙන් (questioning ) හෝ දත්ත එක්රැස් කරන විශේෂ උපකරණයක සටහන් කර ගන්න පලුවන්.උදාහරනයක් විදියට කොනමනය ,උනකටුව ගන්න පලුවන්. පරිගණකය සොයා පෙර දත්ත කළමනාකරණය කිරීමට file system භාවිතා කලා. එවැන්නක් මුලාශ දත්ත සකස්කර ,ගොණුකර තැබුවෙත ලිඛිත සටහන් ලෙසින්. ලිඛිත සටහන් පසුව කායික ක්‍රම (manual) හෝ ප්‍රකාශ සලකුණු කියවනය (OMR) ,ප්‍රකාශ අනුලක්‍ෂණ කියවනය (OCR) ආදී ස්වයංක්‍රිය ක්‍රම මගින් පරිගණකයට feed කරන්න පලුවන්.


2. ශ්‍රව්‍ය (Audio ) 
කම්පන අකාරයට ඇති සන්තතික (continuous) ශබ්ද තරංග microphone දියුණුවත් සමග විද්‍යුත් තරංගයක් (electric signal ) බවට පරිවර්තනය (convert) කිරීමට හැකි උනා.පරිගණක තාක්ෂණයේ සහ සන්නිවේදන තාක්ෂණයේ දියුණුවත් සමගම මෙම electric signal එක පරිගණකයට තේරුම් ගතහැකි ද්විමය (Binary) විද්‍යුත් තරංගයක් බවට පරිවර්තනය කර feed කිරීමට දැන් පුළුවන්. මෙම ක්‍රියාවලිය විස්තරාත්මකව 8. දත්ත හා සන්නිවේදනය පාඩමේදී දැනගන්න පලුවන්. මෙහිදී විවිධ microphone අවශ්‍යතාව අනුව යොදාගන්නවා.උදාහරන ලෙස සංගීතඥයා vocal recoding microphone එකක් බාවිතා කරන අතර රහස් පරීක්ෂක කටයුතු සදහා සංවේදී කුඩා microphone භාවිතා වෙනවා .ශබ්ද තරංග පරිගණකය feed කිරීමෙන් මූලික වශයෙන් ශබ්ද තරංග ලෙස ප්‍රතිදානය ලබාගැනීමත් , සැකසීමත් (උදාහරනයක් ලෙස ඝෝෂාව ඉවත් කිරීම ) බලාපොරත්තු වෙනවා .


3. දෘශ‍ය(Video ) 
ශබ්ද තරංග පරිගණකයට සාර්ථකව feed කිරීමත් සමගම දෘශ්‍ය මාධ්‍යයෙන් දත්ත ඇතුලත් කිරීමත් හැකි උනා . මෙහිදී ප්‍රදාන වශයෙන් Digital Camera බාවිතයට ගන්නවා. Digital Camera තුල දත්ත ගබඩා කරන්නේ ද්විමය (Binary) විද්‍යුත් තරංග ආකාරයටමය.සැබවින්ම මෙහිදී වීඩියෝ වක් ,අනුපිලිවලකට ඇති නිශ්චල ඦායාරූප වල එකතුවක් ලෙස සලකන්න පලුවන්. පරිගණකයට තේරුම් ගතහැකි ද්විමය (Binary) මාධ්‍යට පරිවතනයේදී මෙම නිශ්චල  ඦායාරූප ඉතා කුඩා කොටු (pixel) වලට වෙන් කිරීම හෝ දෛශික ගණිතමය සමීකරණ අකාරයට පත් කරනවා. සරළ වෙබ් camera සිට Augmented Reality තාක්ෂණයේදී බාවිතා වෙන අධි සංවේදී සංවේදක (sensors) දක්වා මෙම Digital Camera විකාශය වෙලා තියෙනවා .

 
Share on Google Plus

About REX

    Blogger Comment
    Facebook Comment

1 comments: