স্বাভাবিককরণ (পরিসংখ্যান)

পরিসংখ্যান প্রক্রিয়া

পরিসংখ্যান এবং পরিসংখ্যানের অ্যাপ্লিকেশনগুলির মধ্যে, স্বাভাবিককরণের অর্থের একটি পরিসীমা থাকতে পারে। [1] সরলতম ক্ষেত্রে, রেটিংগুলির স্বাভাবিককরণের অর্থ হল, গড় মানের সাথে তুলনা করে বিভিন্ন মাপের মানগুলো একটি অনুভূমিকভাবে সাধারণ স্কেলে পরিমাপ করা, যাতে করে মান গুলো আরো দৃষ্টিগোচর হয়। এছাড়াও মানগুলো প্রকাশকারী চলকের উপর বিভিন্ন মাত্রার শক্তি নিয়ে, চলকগুলোর রূপান্তরের মাধ্যমেও স্বাভাবিককরণ অথবা স্বাভাবিককরণের প্রায় নিকটবর্তী মান পাওয়া সম্ভব। আরো জটিল ক্ষেত্রে, স্বাভাবিককরণ আরো জটিল অবস্থার সমন্বয় করতে পারে যেখানে অভিপ্রায় সংযোজনে পূর্ণ সম্ভাব্যতা বিতরণ করা হয়। শিক্ষাগত মূল্যায়নের স্কোরের স্বাভাবিককরণের ক্ষেত্রে, ডিস্ট্রিবিউশনগুলিকে একটি সাধারণ বিতরণে সাজানোর একটি ইচ্ছা থাকতে পারে। সম্ভাব্যতা ডিস্ট্রিবিউশন স্বাভাবিককরণের একটি ভিন্ন পদ্ধতি পরিমাপ স্বাভাবিককরণ হয়, যেখানে বিভিন্ন ব্যবস্থা পরিমাণে প্রান্তিককরণে আনা হয়। যে কোন দ্বি-মাত্রিক এবং ত্রি-মাত্রিক কাঠামোতে যদি অসংখ্য প্রসঙ্গ বিন্দু থাকে এবং খালি চোখে যদি সেই বিন্দুগুলোকে এলোমেলো ভাবে অবিন্যস্ত মনে হয়, তবে বিন্দুগুলোর মানের স্বাভাবিককরণের মাধ্যমে বিন্দুগুলোর মধ্যে থাকা সামাঞ্জস্যতা বের করা সম্ভব হয়। এ কারনেই কোন একটি সিস্টেমে ঘটে যাওয়া অসংখ্য ঘটনার পারস্পারিক ক্রিয়া-প্রতিক্রিয়ার মাধ্যমে বিভিন্ন চলকের যে মানগুলো পাওয়া যায়, তাদের বিভিন্ন সময়ে একসাথে ঘটার সম্ভাবনাকে যে ধরনের ফাংশন দ্বারা প্রকাশ করা যায়, তা নিরূপন করার জন্য মানগুলোর স্বভাবিককরণ গুরুত্বপূর্ণ।

নীচের রূপান্তরগুলো লক্ষ্য করুন,

যেখানে,

গ্রাফটিতে ভূমি-অক্ষ স্বাধীন চলক এবং লম্ব-অক্ষ অধীন চলক নির্দেশ করছে। গ্রাফে নির্দেশিত বিন্দুগুলোকে তিনটি এলাকাতে পৃথকভাবে ভাগ করে দেখানো হয়েছে। পৃথক তিনটি ভাগ হচ্ছে A , B এবং C। C এলাকাতে Outlier এর উপস্থিতি রয়েছে। স্বাভাবিককরণের মাধ্যমে যে কোন একটি চলক অথবা উভয় চলককে রূপান্তর করলে, তিনটি ভাগকে আলাদা করে চিহ্নিত করা খুবই কঠিন। Outlier গুলোকে সরিয়ে স্বাভাবিককরণ করে তাৎপর্যপূ্র্ন ফলাফল পাওয়া সম্ভব।

পরিসংখ্যানের অন্য ব্যবহারে, স্বাভাবিককরণের পরিসংখ্যান স্থানান্তরিত ও মাপিত সংস্করণ তৈরির বোঝায়, যেখানে এই সাধারণ মানগুলি বিভিন্ন ডেটাসেটগুলির সাথে সম্পর্কিত সাধারণ মানের মানগুলির তুলনা করে এমন একটি পদ্ধতিতে অনুমোদন করে যা নির্দিষ্ট নিঃশব্দ প্রভাবগুলির প্রভাবকে দূর করে দেয় একটি অনিয়মিত সময় সিরিজ মধ্যে কিছু আকারের স্বাভাবিকীকরণ কিছু আকার পরিবর্তনশীল মানগুলির কাছে পৌঁছানোর জন্য শুধুমাত্র একটি rescaling অন্তর্ভুক্ত। পরিমাপ মাত্রার পরিপ্রেক্ষিতে, এই ধরনের অনুপাত শুধুমাত্র অনুপাত পরিমাপের অনুভূতি (পরিমাপের অনুপাত অর্থপূর্ণ), ব্যবধানের পরিমাপ (যেখানে শুধুমাত্র দূরত্ব অর্থপূর্ণ, কিন্তু অনুপাত নয়) নয়।

তাত্ত্বিক পরিসংখ্যানগুলিতে, প্যারামিটিক নর্দানেশনে প্রায়ই মৌলিক সংখ্যা হতে পারে - ফাংশন যার নমুনা বণ্টন প্যারামিটারগুলির উপর নির্ভর করে না - এবং সহায়ক পরিমান - নিরীক্ষণের পরিমান যা পর্যবেক্ষণগুলি থেকে পরিমাপ করা যায়,

বহুচলক দিয়ে তৈরি একটি রিগ্রেশান (Regression) মডেলকে বিবেচনায় আনলে, সেই মডেলে যদি Heteroskedasticity এর উপস্থিতি থাকে তাহলে, নিন্মোক্ত ম্যাট্রিক্স বীজগণিতের কাঠামোগত রূপটি বিবেচ্য ,

Heteroskedasticity এর উপস্থিতিতে এলোমেলো যে কোন মান প্রদর্শন করতে পাারে। সুতরাং স্বাভাবিককরণের প্রক্রিয়ায় যদি ধরে নেয়া হয় তাহলে,

যদি, সম্ভব হয় তবে, ও সম্ভব হবে।