উপাত্ত খনন

বৃহদাকারের উপাত্ত সমষ্টিসমূহ থেকে যে গণনমূলক প্রক্রিয়াতে বিভিন্ন বিন্যাস আবিষ্কার করা হয়

উপাত্ত খনন বা ইংরেজি পরিভাষায় ডাটা মাইনিং (ইংরেজি: data mining) পরিগণক বিজ্ঞান তথা কম্পিউটার বিজ্ঞানের একটি ক্ষেত্র হিসেবে বিবেচিত হয়।[১][২][৩] এটি "উপাত্তাধারগুলিতে জ্ঞান আবিষ্কার" (নলেজ ডিসকভারি ইন ডেটাবেসেজ বা সংক্ষেপে কেডিডি)[৩]-এর একটি ধাপ।

An example of data produced by data dredging through a bot operated by statistician Tyler Vigen, apparently showing a close link between the best word winning a spelling bee competition and the number of people in the United States killed by venomous spiders. The similarity in trends is obviously a coincidence.

উপাত্ত খনন কৃত্রিম বুদ্ধিমত্তা, পরিসংখ্যান, ডেটাবেজ ম্যানেজমেন্ট সিস্টেম সমন্বয়ে গঠিত একটি কম্পিউটিং বা পরিগণন কর্মকাণ্ড যার মাধ্যমে বিশালাকার উপাত্ত সংকলন (ডাটা সেট) থেকে নির্দিষ্ট বৈশিষ্টের উপাত্ত আবিষ্কার করা সম্ভব হয়। উপাত্ত খননের লক্ষ্য হল একটি উপাত্ত সংকলন থেকে নির্দিষ্ট বা কাংক্ষিত উপাত্ত খুঁজে বের করা এবং তা নির্দিষ্ট কাজের উপযোগী করে বিন্যাস, শ্রেণীবদ্ধ ও উপস্থাপন করা।

উপাত্তাধারগুলিতে জ্ঞান আবিষ্কারের ধাপগুলো নিম্নরূপঃ

  • বাছাইকরণ (সিলেকশন)
  • প্রাক-প্রক্রিয়াজাতকরণ (প্রি-প্রোসেসিং)
  • রূপান্তর (ট্রান্সফরমেশন)
  • উপাত্ত খনন (ডাটা মাইনিং)
  • মূল্যায়ন (এভালুয়েশন)[৪]

উপাত্ত খননের অ্যালগরিদম বা পরিগণনা প্রক্রিয়া সম্পাদনা

  • শ্রেণীবদ্ধকরণ (ক্লাসিফিকেশন)

এই প্রক্রিয়ায় পূর্বের উপাত্ত বিশ্লেষণ করে ভবিষ্যতের উপাত্তের চরিত্র সম্পর্কে পূর্ভাবাস দেওয়া যায়। সিদ্ধান্ত বৃক্ষ (ডিসিশন ট্রি), স্নায়বিক জাল [(নিউরাল নেটওয়ার্ক), ইত্যাদি প্রক্রিয়ায় সাধারণত উপাত্ত বিশ্লেষণ করা হয়।

  • গুচ্ছকরণ (ক্লাস্টারিং)

এই প্রক্রিয়ায় উপাত্তসমূহকে নির্দিষ্ট বৈশিষ্ট্যের ভিত্তিতে শ্রেণীবদ্ধ করা হয়। একটি নির্দিষ্ট শ্রেণীর উপাত্তগুলির মধ্যে সর্বোচ্চ সাদৃশ্য বজায় রাখা এবং দুইটি ভিন্ন শ্রেণীর উপাত্তগুলির মধ্যে সর্বনিম্ন সাদৃশ্য বজায় রাখা গুচ্ছকরণের উদ্দেশ্য।[৫]

  • সম্পর্কস্থাপন (অ্যাসোসিয়েশন)

এই প্রক্রিয়ায় পূর্বের কোন লিখিত নথিবিবণীতে (রেকর্ডে) যেসব উপাত্ত এসাথে অবস্থান করে তাদের মধ্যে সম্পর্কস্থাপন করা হয়।

  • অনুক্রম আবিষ্কার (সিকুয়েন্স ডিসকভারি)

এই প্রক্রিয়ায় সময়ের ভিত্তিতে এবং ক্রমানুসারে উপাত্ত শ্রেণীবদ্ধ করা হয়।[৪]

আরও দেখুন সম্পাদনা

তথ্যসূত্র সম্পাদনা

  1. Clifton, Christopher (২০১০)। "Encyclopædia Britannica: Definition of Data Mining"। সংগ্রহের তারিখ ২০১০-১২-০৯ 
  2. Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome (২০০৯)। "The Elements of Statistical Learning: Data Mining, Inference, and Prediction"। ২০০৯-১১-১০ তারিখে মূল থেকে আর্কাইভ করা। সংগ্রহের তারিখ ২০১২-০৮-০৭ 
  3. "Data Mining Curriculum"ACM SIGKDD। ২০০৬-০৪-৩০। ২০১১-১০-২৮ তারিখে মূল থেকে আর্কাইভ করা। সংগ্রহের তারিখ ২০১১-১০-২৮ 
  4. Book: Decision Support System and Business Intelligence by Efraim Turban
  5. Book: Data Mining: Concepts and Techniques by Jiawei Han, Micheline Kamber and Jian Pei

বহিঃসংযোগ সম্পাদনা