স্বয়ংক্রিয় সংক্ষিপ্তকরণ: সংশোধিত সংস্করণের মধ্যে পার্থক্য

বিষয়বস্তু বিয়োগ হয়েছে বিষয়বস্তু যোগ হয়েছে
++
NahidSultanBot (আলোচনা | অবদান)
বট নিবন্ধ পরিষ্কার করেছে। কোন সমস্যায় এর পরিচালককে জানান।
১ নং লাইন:
কোন দীর্ঘ নথি থেকে মূল বিষয় [[কম্পিউটার সফটওয়্যার|সফটওয়্যারের]] মাধ্যমে তুলে নিয়ে [[সারাংশ]] তৈরির প্রক্রিয়াকে '''স্বয়ংক্রিয় সংক্ষিপ্তকরণ''' বলে। মূলত লেখার দৈর্ঘ্য, লেখার শৈলী এবং শব্দবিন্যাস ব্যবহার করে প্রযুক্তি একটি সুসংগত সারাংশ তৈরি করে।
 
স্বয়ংক্রিয় তথ্য সংক্ষিপ্তকরণ হলো [[মেশিন লার্নিং]] এবং [[ডাটা মাইনিং|ডেটা মাইনিং]] এর অংশ। সংক্ষিপ্তকরণের মূল পদ্ধতি হলো কোন পূর্ণ সেট থেকে তার উপসেট বের করা, যে উপসেট পুরো সেটের তথ্য প্রকাশ করে। বর্তমানে সারা বিশ্বের সকল শিল্পে এই পদ্ধতি ব্যবহার করা হচ্ছে। উদাহরণস্বরূপ বলা যায় [[ওয়েব অনুসন্ধান ইঞ্জিন|সার্জ ইঞ্জিন]];
কোন দীর্ঘ নথি থেকে মূল বিষয় [[কম্পিউটার সফটওয়্যার|সফটওয়্যারের]] মাধ্যমে তুলে নিয়ে [[সারাংশ]] তৈরির প্রক্রিয়াকে '''স্বয়ংক্রিয় সংক্ষিপ্তকরণ''' বলে। মূলত লেখার দৈর্ঘ্য, লেখার শৈলী এবং শব্দবিন্যাস ব্যবহার করে প্রযুক্তি একটি সুসংগত সারাংশ তৈরি করে।
 
নথি সংক্ষিপ্তকরণ হলো কোন দীর্ঘ নথি থেকে মূল ও গুরুত্বপূর্ণ বাক্য নিয়ে সারাংশ তৈরির প্রক্রিয়া।<ref name="PalPetrosino2012">{{বই উদ্ধৃতি|ইউআরএল=https://books.google.com/?id=O0fNBQAAQBAJ&pg=PA81&dq=video+surveillance+summarization#v=onepage&q=summarization&f=false|শিরোনাম=Handbook on Soft Computing for Video Surveillance|শেষাংশ=Sankar K. Pal|শেষাংশ২=Alfredo Petrosino|তারিখ=25 January 2012|প্রকাশক=CRC Press|পাতাসমূহ=81–|আইএসবিএন=978-1-4398-5685-7}}</ref>
স্বয়ংক্রিয় তথ্য সংক্ষিপ্তকরণ হলো [[মেশিন লার্নিং]] এবং [[ডাটা মাইনিং|ডেটা মাইনিং]] এর অংশ। সংক্ষিপ্তকরণের মূল পদ্ধতি হলো কোন পূর্ণ সেট থেকে তার উপসেট বের করা, যে উপসেট পুরো সেটের তথ্য প্রকাশ করে। বর্তমানে সারা বিশ্বের সকল শিল্পে এই পদ্ধতি ব্যবহার করা হচ্ছে। উদাহরণস্বরূপ বলা যায় [[ওয়েব অনুসন্ধান ইঞ্জিন|সার্জ ইঞ্জিন]];
 
নথি সংক্ষিপ্তকরণ হলো কোন দীর্ঘ নথি থেকে মূল ও গুরুত্বপূর্ণ বাক্য নিয়ে সারাংশ তৈরির প্রক্রিয়া।<ref name="PalPetrosino2012">{{বই উদ্ধৃতি|ইউআরএল=https://books.google.com/?id=O0fNBQAAQBAJ&pg=PA81&dq=video+surveillance+summarization#v=onepage&q=summarization&f=false|শিরোনাম=Handbook on Soft Computing for Video Surveillance|শেষাংশ=Sankar K. Pal|শেষাংশ২=Alfredo Petrosino|তারিখ=25 January 2012|প্রকাশক=CRC Press|পাতাসমূহ=81–|আইএসবিএন=978-1-4398-5685-7}}</ref>
 
== প্রকারভেদ ==
=== উৎপাটন-ভিত্তিক সংক্ষিপ্তকরণ===
পূর্ণ সংগ্রহ থেকে বস্তুকে কোন প্রকার পরিবর্তন ছাড়াই সরাসরি স্বয়ংক্রিয়ভাবে তুলে নিয়ে আশার প্রক্রিয়াকে উৎপাটন-ভিত্তিক '''সংক্ষিপ্তকরণ''' বলে। যেমন কোন নথিকে সংক্ষিপ্ত করার জন্য সেই নথির মূল বাক্যগুলিকে কোন প্রকার সম্পাদন ছাড়াই সরাসরি তুলে নিয়ে সারাংশ তৈরি করা হলো উৎপাটন প্রক্রিয়া।
 
=== বিমূর্তন ভিত্তিক সংক্ষিপ্তকরণ===
বিমূর্তন ভিত্তিক সারসংক্ষেপ সরাসরি কোন বস্তু কিংবা বাক্যকে উৎপাটন না করে সেগুলোর মূলভাব বা শব্দান্তরিত ভাব নিয়ে সারাংশ গঠন করে। মূলত উৎপাটন প্রক্রিয়ার চেয়ে বিমূর্তন প্রক্রিয়া অনেক শক্তিশালী কিন্তু এটিকে তৈরি করা অনেক কঠিন একটি বিষয়। কারণ এখানে নতুন শব্দ উৎপাদন বিষয়টি কাজ করে। যেটি [[প্রাকৃতিক ভাষা উৎপাদন]] প্রক্রিয়ার অংশ। যদিও কিছু কাজ বিমূর্তন ভিত্তিক সারসংক্ষেপে করা হয়েছে কিন্তু বেশির ভাগ কাজই উৎপাটন প্রক্রিয়ায় করা।
 
== সংক্ষিপ্তকরণ পদ্ধতি ও প্রয়োগ ==
সংক্ষিপ্তকরণের একটি উদাহরণ হলো নথি সংক্ষিপ্তকরণ, যেটি সংক্রিয়ভাবে কোন নথি থেকে সারাংশ উৎপন্ন করে। কেউ হয়তো একক কোন নথির সারাংশ বের করতে পারেন কিংবা অনেকগুলো নথির। অনেকগুলো নথির সারসংক্ষেপ বের করার পদ্ধতিকে বলে 'বহু নথি সংক্ষিপ্তকরণ'। এটির একটি উৎকৃষ্ট প্রয়োগ হলো সংবাদ প্রবন্ধ সংক্ষিপ্তকরণ। এমন একটি পদ্ধতি চিন্তা করুণ যেটি স্বয়ংক্রিয় ভাবে একটি বিষয়ের উপর সংবাদ প্রবন্ধ সংগ্রহ করবে (ওয়েব থেকে) এবং সেগুলোর সারসংক্ষেপ প্রদান করবে।
 
চিত্র সংগ্রহ করা স্বয়ংক্রিয় সংক্ষিপ্তকরণের আরেকটি প্রয়োগিক দিক। এটি মূলত অনেকগুলো চিত্র থেকে মূল চিত্রগুলো বের করে নিয়ে আসে।<ref>Jorge E. Camargo and Fabio A. González. A Multi-class Kernel Alignment Method for Image Collection Summarization. In Proceedings of the 14th Iberoamerican Conference on Pattern Recognition: Progress in Pattern Recognition, Image Analysis, Computer Vision, and Applications (CIARP '09), Eduardo Bayro-Corrochano and Jan-Olof Eklundh (Eds.). Springer-Verlag, Berlin, Heidelberg, 545-552. {{Doi|10.1007/978-3-642-10268-4_64}}</ref> একইভাবে আরেকটি প্রয়োগ হলো ভিডিও সংক্ষিপ্তকরণ, যেখানে সিস্টেম স্বয়ংক্রিয়ভাবে দীর্ঘ কোন সিনেমার ট্রেলার(trailer) তৈরি করতে পারে।
 
== তথ্যসূত্র ==
২৮ ⟶ ২৭ নং লাইন:
* {{বই উদ্ধৃতি|ইউআরএল=http://www.informatica.si/ojs-2.4.3/index.php/informatica/article/download/273/269|শিরোনাম=Challenging Issues of Automatic Summarization: Relevance Detection and Quality-based Evaluation|শেষাংশ=Elena|প্রথমাংশ=Lloret and Manuel, Palomar|বছর=2009}}
* {{বই উদ্ধৃতি|শিরোনাম=Automatic Summarization|শেষাংশ=Andrew|প্রথমাংশ=Goldberg|বছর=2007}}
* {{বই উদ্ধৃতি|শিরোনাম=Automatic Keyphrases Extraction|শেষাংশ=Alrehamy|প্রথমাংশ=Hassan|বছর=2017|ধারাবাহিক=Advances in Intelligent Systems and Computing|পাতাসমূহ=222–235|অধ্যায়=SemCluster: Unsupervised Automatic Keyphrase Extraction Using Affinity Propagation|doiডিওআই=10.1007/978-3-319-66939-7_19|আইএসবিএন=978-3-319-66938-0}} <bdi> {{বই উদ্ধৃতি|শিরোনাম=Automatic Keyphrases Extraction|শেষাংশ=Alrehamy|প্রথমাংশ=Hassan|বছর=2017|ধারাবাহিক=Advances in Intelligent Systems and Computing|পাতাসমূহ=222–235|অধ্যায়=SemCluster: Unsupervised Automatic Keyphrase Extraction Using Affinity Propagation|doiডিওআই=10.1007/978-3-319-66939-7_19|আইএসবিএন=978-3-319-66938-0}} </bdi> {{বই উদ্ধৃতি|শিরোনাম=Automatic Keyphrases Extraction|শেষাংশ=Alrehamy|প্রথমাংশ=Hassan|বছর=2017|ধারাবাহিক=Advances in Intelligent Systems and Computing|পাতাসমূহ=222–235|অধ্যায়=SemCluster: Unsupervised Automatic Keyphrase Extraction Using Affinity Propagation|doiডিওআই=10.1007/978-3-319-66939-7_19|আইএসবিএন=978-3-319-66938-0}}
* {{বই উদ্ধৃতি|শিরোনাম=Summarizing Information|শেষাংশ=Endres-Niggemeyer|প্রথমাংশ=Brigitte|বছর=1998|আইএসবিএন=978-3-540-63735-6}} <bdi> {{বই উদ্ধৃতি|শিরোনাম=Summarizing Information|শেষাংশ=Endres-Niggemeyer|প্রথমাংশ=Brigitte|বছর=1998|আইএসবিএন=978-3-540-63735-6}} </bdi> {{বই উদ্ধৃতি|শিরোনাম=Summarizing Information|শেষাংশ=Endres-Niggemeyer|প্রথমাংশ=Brigitte|বছর=1998|আইএসবিএন=978-3-540-63735-6}}
* {{বই উদ্ধৃতি|শিরোনাম=The Theory and Practice of Discourse Parsing and Summarization|শেষাংশ=Marcu|প্রথমাংশ=Daniel|বছর=2000|আইএসবিএন=978-0-262-13372-2}} <bdi> {{বই উদ্ধৃতি|শিরোনাম=The Theory and Practice of Discourse Parsing and Summarization|শেষাংশ=Marcu|প্রথমাংশ=Daniel|বছর=2000|আইএসবিএন=978-0-262-13372-2}} </bdi> {{বই উদ্ধৃতি|শিরোনাম=The Theory and Practice of Discourse Parsing and Summarization|শেষাংশ=Marcu|প্রথমাংশ=Daniel|বছর=2000|আইএসবিএন=978-0-262-13372-2}}
৩৫ ⟶ ৩৪ নং লাইন:
* {{বই উদ্ধৃতি|ইউআরএল=http://portal.acm.org/citation.cfm?id=1937055.1937111&coll=DL&dl=GUIDE&CFID=23185814&CFTOKEN=40272014/|শিরোনাম=Essential summarizer: innovative automatic text summarization software in twenty languages - ACM Digital Library|শেষাংশ=Lehmam|প্রথমাংশ=Abderrafih|বছর=2010|ধারাবাহিক=Riao '10|পাতাসমূহ=216–217}} {{বই উদ্ধৃতি|ইউআরএল=http://portal.acm.org/citation.cfm?id=1937055.1937111&coll=DL&dl=GUIDE&CFID=23185814&CFTOKEN=40272014/|শিরোনাম=Essential summarizer: innovative automatic text summarization software in twenty languages - ACM Digital Library|শেষাংশ=Lehmam|প্রথমাংশ=Abderrafih|বছর=2010|ধারাবাহিক=Riao '10|পাতাসমূহ=216–217}} {{বই উদ্ধৃতি|ইউআরএল=http://portal.acm.org/citation.cfm?id=1937055.1937111&coll=DL&dl=GUIDE&CFID=23185814&CFTOKEN=40272014/|শিরোনাম=Essential summarizer: innovative automatic text summarization software in twenty languages - ACM Digital Library|শেষাংশ=Lehmam|প্রথমাংশ=Abderrafih|বছর=2010|ধারাবাহিক=Riao '10|পাতাসমূহ=216–217}} , প্রকাশিত RIAO'10 অ্যাডাপ্টিভিটি, ব্যক্তিগতকরণ এবং বৈষম্যমূলক তথ্যের সংশ্লেষণ, সিআইডি প্যারিস, ফ্রান্সে প্রকাশিত
* {{বই উদ্ধৃতি|ইউআরএল=http://pages.cs.wisc.edu/~jerryzhu/pub/grasshopper.pdf|শিরোনাম=Improving diversity in ranking using absorbing random walks|শেষাংশ=Xiaojin|প্রথমাংশ=Zhu, Andrew Goldberg, Jurgen Van Gael, and David Andrzejewski|বছর=2007}} {{বই উদ্ধৃতি|ইউআরএল=http://pages.cs.wisc.edu/~jerryzhu/pub/grasshopper.pdf|শিরোনাম=Improving diversity in ranking using absorbing random walks|শেষাংশ=Xiaojin|প্রথমাংশ=Zhu, Andrew Goldberg, Jurgen Van Gael, and David Andrzejewski|বছর=2007}} , GRASSHOPPER অ্যালগরিদম
* {{বই উদ্ধৃতি|শিরোনাম=Conceptual Structures for STEM Research and Education|শেষাংশ=Miranda-Jiménez|প্রথমাংশ=Sabino, Gelbukh, Alexander, and Sidorov, Grigori|বছর=2013|ধারাবাহিক=Lecture Notes in Computer Science|পাতাসমূহ=245–253|অধ্যায়=Summarizing Conceptual Graphs for Automatic Summarization Task|doiডিওআই=10.1007/978-3-642-35786-2_18|আইএসবিএন=978-3-642-35785-5}} {{বই উদ্ধৃতি|শিরোনাম=Conceptual Structures for STEM Research and Education|শেষাংশ=Miranda-Jiménez|প্রথমাংশ=Sabino, Gelbukh, Alexander, and Sidorov, Grigori|বছর=2013|ধারাবাহিক=Lecture Notes in Computer Science|পাতাসমূহ=245–253|অধ্যায়=Summarizing Conceptual Graphs for Automatic Summarization Task|doiডিওআই=10.1007/978-3-642-35786-2_18|আইএসবিএন=978-3-642-35785-5}} {{বই উদ্ধৃতি|শিরোনাম=Conceptual Structures for STEM Research and Education|শেষাংশ=Miranda-Jiménez|প্রথমাংশ=Sabino, Gelbukh, Alexander, and Sidorov, Grigori|বছর=2013|ধারাবাহিক=Lecture Notes in Computer Science|পাতাসমূহ=245–253|অধ্যায়=Summarizing Conceptual Graphs for Automatic Summarization Task|doiডিওআই=10.1007/978-3-642-35786-2_18|আইএসবিএন=978-3-642-35785-5}} {{বই উদ্ধৃতি|শিরোনাম=Conceptual Structures for STEM Research and Education|শেষাংশ=Miranda-Jiménez|প্রথমাংশ=Sabino, Gelbukh, Alexander, and Sidorov, Grigori|বছর=2013|ধারাবাহিক=Lecture Notes in Computer Science|পাতাসমূহ=245–253|অধ্যায়=Summarizing Conceptual Graphs for Automatic Summarization Task|doiডিওআই=10.1007/978-3-642-35786-2_18|আইএসবিএন=978-3-642-35785-5}} {{বই উদ্ধৃতি|শিরোনাম=Conceptual Structures for STEM Research and Education|শেষাংশ=Miranda-Jiménez|প্রথমাংশ=Sabino, Gelbukh, Alexander, and Sidorov, Grigori|বছর=2013|ধারাবাহিক=Lecture Notes in Computer Science|পাতাসমূহ=245–253|অধ্যায়=Summarizing Conceptual Graphs for Automatic Summarization Task|doiডিওআই=10.1007/978-3-642-35786-2_18|আইএসবিএন=978-3-642-35785-5}} <bdi> {{বই উদ্ধৃতি|শিরোনাম=Conceptual Structures for STEM Research and Education|শেষাংশ=Miranda-Jiménez|প্রথমাংশ=Sabino, Gelbukh, Alexander, and Sidorov, Grigori|বছর=2013|ধারাবাহিক=Lecture Notes in Computer Science|পাতাসমূহ=245–253|অধ্যায়=Summarizing Conceptual Graphs for Automatic Summarization Task|doiডিওআই=10.1007/978-3-642-35786-2_18|আইএসবিএন=978-3-642-35785-5}} </bdi> {{বই উদ্ধৃতি|শিরোনাম=Conceptual Structures for STEM Research and Education|শেষাংশ=Miranda-Jiménez|প্রথমাংশ=Sabino, Gelbukh, Alexander, and Sidorov, Grigori|বছর=2013|ধারাবাহিক=Lecture Notes in Computer Science|পাতাসমূহ=245–253|অধ্যায়=Summarizing Conceptual Graphs for Automatic Summarization Task|doiডিওআই=10.1007/978-3-642-35786-2_18|আইএসবিএন=978-3-642-35785-5}} , গবেষণা এবং শিক্ষা জন্য ধারণাগত কাঠামো।
 
[[বিষয়শ্রেণী:ডাটা মাইনিং]]
[[বিষয়শ্রেণী:স্বাভাবিক ভাষা প্রক্রিয়াকরণ]]