ডিসিশন ট্রি লার্নিং

কম্পিউটার বিজ্ঞানে, ডিসিশন ট্রি লার্নিং বলতে ডিসিশন ট্রি (Decision_tree) মডেল ব্যবহার করে কোন আইটেমকে পর্যবেক্ষণের মাধ্যমে টার্গেট মান সম্পর্কে সিদ্ধান্ত গ্রহণ করাকে বুঝায়।এটি একটি ভবিষ্যদ্বাণীমূলক মডেলিং পদ্ধতি যা পরিসংখ্যান(Statistics), ডেটা মাইনিং(Data_mining) এবং মেশিন লার্নিংয়ে (Machine_learning)ব্যবহৃত হয়। ট্রি মডেলে যেখানে টার্গেট ভেরিয়েবলগুলোকে স্বতন্ত্র (Discrete) মানের সেটে নেয়া হয় তাকে শ্রেণিবদ্ধকরণ ট্রি (classification trees) বলে। এই ট্রি কাঠামতে নোডগুলো ক্লাস লেবেলগুলিকে প্রকাশ করে এবং শাখাগুলো ( Branch) কনযাঙ্কশন এর বৈশিষ্টগুলোকে প্রকাশ করে যা ক্লাস লেবেলগুলিকে পরিচালনা করে। ট্রি মডেলে যেখানে টার্গেট ভেরিয়েবলগুলোকে ধারাবাহিক মানে (Continuous Value) নিতে পারে (সাধারণত বাস্তব সংখ্যা) তাকে রিগ্রেশন ট্রি (regression trees) বলা হয়।

ডিসিশন এনালাইসিসে, ডিসিশন ট্রি স্পষ্টভাবে সিদ্ধান্ত এবং সিদ্ধান্ত গ্রহণে ব্যবহৃত হয়। ডেটা মাইনিং এ ডিসিশন ট্রি ডেটা বর্ণনা করতে ব্যবহৃত হয়।

সাধারণ সম্পাদনা

 
ডিসিশন ট্রি লার্নিং

ডিসিশন ট্রি লার্নিং পদ্ধতি সাধারণত ডেটা মাইনিং এ ব্যবহৃত হয়।[১] ইনপুট ভেরিয়েবলের ভিত্তিতে একটি টার্গেট ভেরিয়েবলের মানের পূর্বাভাস দেয়ায় এই মডেলের লক্ষ।

শ্রেণিবদ্ধ উদাহরণগুলির জন্য ডিসিশন ট্রি একটি সহজ উপস্থাপনা।ধরে নেয়া যাক,সমস্ত ইনপুট বৈশিষ্ট্যগুলির সীমাবদ্ধ পৃথক ডোমেন রয়েছে এবং "শ্রেণিবদ্ধকরণ(Classification)" নামে একটি টার্গেট বৈশিষ্ট্য রয়েছে।শ্রেণিবদ্ধকরণের(classification) ডোমেনের প্রতিটি উপাদানকে একটি ক্লাস বলা হয়।শ্রেণিবদ্ধকরণ ট্রি (classification trees) একটি ট্রি যার প্রতিটি অভ্যন্তরীণ নোডগুলো ইনপুট ফিচারের সাথে লেবেল করা।কোনও লেবেলযুক্ত ইনপুট ফিচার নোড থেকে আগত আর্কগুলি টার্গেট বা আউটপুট ফিচারের প্রতিটি সম্ভাব্য মানগুলির সাথে লেবেলযুক্ত থাকে। ট্রির প্রতিটি নোড ক্লাসের উপর একটি শ্রেণি বা সম্ভাব্যতা বণ্টনের সাথে লেবেলযুক্ত করা হয়,এটি নির্দেশ করে,ডেটা সেটটিকে ট্রি দ্বারা একটি নির্দিষ্ট শ্রেণিতে শ্রেণিবদ্ধ করা হয়েছে ।

একটি ট্রি তৈরি করা হয় উৎস সেটটি বিভক্ত করে , ট্রির মূল নোড গঠন করে সাবসেটে ভাগ করা হয় - যা successor children গঠন করে। বিভক্তিকরণ নিয়ম এবং classification ফিচারের উপর ভিত্তি করে বিভক্ত(splitting ) করা হয়।[২] এই প্রক্রিয়াটি পুনরাবৃত্ত পদ্ধতিতে প্রতিটি উৎসযুক্ত সাবসেটে পুনরাবৃত্তি করা হয় যাকে রিকারসিভ পার্টিশনিং বলে। এই রিকারসিভ প্রক্রিয়া সম্পন্ন হবে যদি একটি নোডের সাবসেটের টার্গেট ভেরিয়েবলের মান একই হয়।[৩]

ডিসিশন ট্রি গাণিতিক এবং ধারণাগত কৌশলগুলির সংমিশ্রণ হিসাবেও বর্ণিত হতে পারে যা নির্দিষ্ট উপাত্তের সংকলনের বিবরণ, শ্রেণিবদ্ধকরণ এবং সাধারণীকরণে সহায়তা করে।

প্রকারভেদ সম্পাদনা

ডেটা মাইনিং এ প্রধানত দুই ধরনের ডিসিশন ট্রি ব্যবহার করা হয়।

  • ক্লাসিফিকেশন ট্রি বিশ্লেষণ তখন হয় যখন ধারনাগত ফলাফলটি ডেটা ক্লাসের সাথে থাকে।
  • রিগ্রেশন ট্রি

তথ্যসূত্র সম্পাদনা

  1. Rokach, Lior; Maimon, O. (২০০৮)। Data mining with decision trees: theory and applications। World Scientific Pub Co Inc। আইএসবিএন 978-9812771711 
  2. Shalev-Shwartz, Shai; Ben-David, Shai (২০১৪)। "18. Decision Trees"। Understanding Machine Learning। Cambridge University Press। 
  3. Quinlan, J. R. (১৯৮৬)। "Induction of decision trees" (পিডিএফ)Machine Learning1: 81–106। ডিওআই:10.1007/BF00116251