স্বয়ংক্রিয় সংক্ষিপ্তকরণ

কোন দীর্ঘ নথি থেকে মূল বিষয় সফটওয়্যারের মাধ্যমে তুলে নিয়ে সারাংশ তৈরির প্রক্রিয়াকে স্বয়ংক্রিয় সংক্ষিপ্তকরণ বলে। মূলত লেখার দৈর্ঘ্য, লেখার শৈলী এবং শব্দবিন্যাস ব্যবহার করে প্রযুক্তি একটি সুসংগত সারাংশ তৈরি করে।

স্বয়ংক্রিয় তথ্য সংক্ষিপ্তকরণ হলো মেশিন লার্নিং এবং ডেটা মাইনিং এর অংশ। সংক্ষিপ্তকরণের মূল পদ্ধতি হলো কোন পূর্ণ সেট থেকে তার উপসেট বের করা, যে উপসেট পুরো সেটের তথ্য প্রকাশ করে। বর্তমানে সারা বিশ্বের সকল শিল্পে এই পদ্ধতি ব্যবহার করা হচ্ছে। উদাহরণস্বরূপ বলা যায় সার্জ ইঞ্জিন;

নথি সংক্ষিপ্তকরণ হলো কোন দীর্ঘ নথি থেকে মূল ও গুরুত্বপূর্ণ বাক্য নিয়ে সারাংশ তৈরির প্রক্রিয়া।[১]

প্রকারভেদসম্পাদনা

উৎপাটন-ভিত্তিক সংক্ষিপ্তকরণসম্পাদনা

পূর্ণ সংগ্রহ থেকে বস্তুকে কোন প্রকার পরিবর্তন ছাড়াই সরাসরি স্বয়ংক্রিয়ভাবে তুলে নিয়ে আশার প্রক্রিয়াকে উৎপাটন-ভিত্তিক সংক্ষিপ্তকরণ বলে। যেমন কোন নথিকে সংক্ষিপ্ত করার জন্য সেই নথির মূল বাক্যগুলিকে কোন প্রকার সম্পাদন ছাড়াই সরাসরি তুলে নিয়ে সারাংশ তৈরি করা হলো উৎপাটন প্রক্রিয়া।

বিমূর্তন ভিত্তিক সংক্ষিপ্তকরণসম্পাদনা

বিমূর্তন ভিত্তিক সারসংক্ষেপ সরাসরি কোন বস্তু কিংবা বাক্যকে উৎপাটন না করে সেগুলোর মূলভাব বা শব্দান্তরিত ভাব নিয়ে সারাংশ গঠন করে। মূলত উৎপাটন প্রক্রিয়ার চেয়ে বিমূর্তন প্রক্রিয়া অনেক শক্তিশালী কিন্তু এটিকে তৈরি করা অনেক কঠিন একটি বিষয়। কারণ এখানে নতুন শব্দ উৎপাদন বিষয়টি কাজ করে। যেটি প্রাকৃতিক ভাষা উৎপাদন প্রক্রিয়ার অংশ। যদিও কিছু কাজ বিমূর্তন ভিত্তিক সারসংক্ষেপে করা হয়েছে কিন্তু বেশির ভাগ কাজই উৎপাটন প্রক্রিয়ায় করা।

সংক্ষিপ্তকরণ পদ্ধতি ও প্রয়োগসম্পাদনা

সংক্ষিপ্তকরণের একটি উদাহরণ হলো নথি সংক্ষিপ্তকরণ, যেটি সংক্রিয়ভাবে কোন নথি থেকে সারাংশ উৎপন্ন করে। কেউ হয়তো একক কোন নথির সারাংশ বের করতে পারেন কিংবা অনেকগুলো নথির। অনেকগুলো নথির সারসংক্ষেপ বের করার পদ্ধতিকে বলে 'বহু নথি সংক্ষিপ্তকরণ'। এটির একটি উৎকৃষ্ট প্রয়োগ হলো সংবাদ প্রবন্ধ সংক্ষিপ্তকরণ। এমন একটি পদ্ধতি চিন্তা করুণ যেটি স্বয়ংক্রিয় ভাবে একটি বিষয়ের উপর সংবাদ প্রবন্ধ সংগ্রহ করবে (ওয়েব থেকে) এবং সেগুলোর সারসংক্ষেপ প্রদান করবে।

চিত্র সংগ্রহ করা স্বয়ংক্রিয় সংক্ষিপ্তকরণের আরেকটি প্রয়োগিক দিক। এটি মূলত অনেকগুলো চিত্র থেকে মূল চিত্রগুলো বের করে নিয়ে আসে।[২] একইভাবে আরেকটি প্রয়োগ হলো ভিডিও সংক্ষিপ্তকরণ, যেখানে সিস্টেম স্বয়ংক্রিয়ভাবে দীর্ঘ কোন সিনেমার ট্রেলার(trailer) তৈরি করতে পারে।

তথ্যসূত্রসম্পাদনা

  1. Sankar K. Pal; Alfredo Petrosino (২৫ জানুয়ারি ২০১২)। Handbook on Soft Computing for Video Surveillance। CRC Press। পৃষ্ঠা 81–। আইএসবিএন 978-1-4398-5685-7 
  2. Jorge E. Camargo and Fabio A. González. A Multi-class Kernel Alignment Method for Image Collection Summarization. In Proceedings of the 14th Iberoamerican Conference on Pattern Recognition: Progress in Pattern Recognition, Image Analysis, Computer Vision, and Applications (CIARP '09), Eduardo Bayro-Corrochano and Jan-Olof Eklundh (Eds.). Springer-Verlag, Berlin, Heidelberg, 545-552. ডিওআই:10.1007/978-3-642-10268-4_64

আরও পড়াসম্পাদনা