গণনামূলক বা ভাষাংশ ভাষাবিজ্ঞানের পরিভাষায় সহাবস্থান ([Collocation কোলোকেশন] ত্রুটি: {{Lang-xx}}: text has italic markup (সাহায্য)) হচ্ছে দুই বা তার বেশি শব্দ (word) নিয়ে গঠিত এক ধরনের কথা [১] (Expression), যে কথা আমরা অহরহ স্বাভাবিকভাবেই বলে বা লিখে থাকি।

উপরের ছবিটি "সহাবস্থান" এর একটি উদাহরণ দেখায়

কিছু সহায়ক ধারণা সম্পাদনা

সংযোজনশীলতা সম্পাদনা

কোন কথার অর্থ (meaning) ঐ কথা গঠনকারী শব্দগুলোর আলাদা আলাদা অর্থ মিলিয়ে পাওয়া যায় কী না, সেই ব্যাপারটাই হল সংযোজনশীলতা (compositionality)।

যদি কোন কথার সম্পূর্ণ অর্থ কেবলমাত্র এর গঠনকারী পদগুলোর আলাদা আলাদা অর্থ যোগ করেই পাওয়া যায়, তবে তাকে বলে সম্পূর্ণ সংযোজনশীল (fully compositional) কথা।

সহাবস্থানগুলো সাধারণত সম্পূর্ণ সংযোজনশীল কথা নয়, কারণ এদের সম্পূর্ণ অর্থে গঠনকারী পদের অর্থের বাইরেও আলাদা একটা অর্থ (element of added meaning) যুক্ত থাকে।

আবার কোন ভাষায় প্রচলিত বাগধারাগুলো একেবারেই সংযোজনীয় নয়। এগুলো অ-সংযোজনশীলতার (non-compositionality) উদাহরণ।

তবে বেশির ভাগ সহাবস্থানের অর্থ অ-সংযোজনশীলও নয়, আবার সম্পূর্ণ সংযোজনশীল-ও নয়, এই দুইয়ের মাঝামাঝি।

পরিভাষা সম্পাদনা

কোন কারিগরি দলিল (technical document) থেকে এতে ব্যবহৃত সহাবস্থানগুলো বের করার যে প্রক্রিয়া, তার নাম পরিভাষা নিষ্কাশন (terminology extraction)। আর এই পরিভাষা নিষ্কাশন প্রক্রিয়ায় পাওয়া সহাবস্থানগুলোকে সাধারণত পারিভাষিক শব্দ বা পরিভাষা (ইংরেজিতে যেগুলো Term, Technical term বা Terminological Phrase নামে অভিহিত) নামে উল্লেখ করা হয়।

সহাবস্থানের ব্যবহার সম্পাদনা

১। কম্পিউটারের মাধ্যমে মানুষের মুখের স্বাভাবিক ভাষা উৎপাদনে (Natural language generation): যাতে কম্পিউটার থেকে আউটপুট করা কথাগুলো একজন মানুষের কাছে স্বাভাবিক শোনায়।

২। গণনামূলক অভিধানবিজ্ঞানে (Computational lexicography): যাতে অভিধান রচনার সময় দরকারী গুরুত্বপূর্ণ সহাবস্থানগুলো স্বয়ংক্রিয়ভাবে অভিধানের ভুক্তি হিসেবে বাছাই হয়ে যায়।

৩। বাক্য-বিশ্লেষণে (Parsing): যাতে একই বাক্যের জন্য পাওয়া বিভিন্ন বিশ্লেষণের মধ্যে যে বিশ্লেষণগুলোতে স্বাভাবিক সহাবস্থানগুলোর (natural collocation) সংখ্যা বেশি, সেই বিশ্লেষণগুলোকে যেন প্রাধান্য দেয়া হয়।

৪। ভাষাংশ ভাষাবিজ্ঞান গবেষণায় (Corpus linguistics): যেমন সাংস্কৃতিক গৎবাঁধা ব্যাপারগুলো (stereotypes) কীভাবে ভাষার মাধ্যমে আরও দৃঢ় (reinforce) করা হয়, বিভিন্ন সহাবস্থানের সংঘটনের হার (frequency) দেখে তা বার করা যায়।

ভাষাবিজ্ঞানে সহাবস্থান সম্পাদনা

সোস্যুরীয়চম্‌স্কীয় মার্কিনী ভাষাবিজ্ঞানের ধারায় ভাষার বিশ্লেষণে বিমূর্ততার (abstraction) গুরুত্ব বেশি, অর্থাৎ এখানে তত্ত্বের সুবিধার্থে ভাষিক সংগঠনগুলো (linguistics structures) প্রতিবেশ (context) থেকে বিচ্ছিন্ন পরিগণিত হয়, এবং এর ফলে ভাষা-বিশ্লেষণের এই ধারায় সহাবস্থান ধারণাটির গুরুত্ব কম। তবে ফার্থীয় ব্রিটিশ ভাষাবিজ্ঞানের ধারায় (বিশেষত ফার্থের Contextual theory of meaning-এ) প্রতিবেশ (context)-এর গুরুত্ব বেশি, ফলে এ ধারায় সহাবস্থানেরও গুরুত্ব আছে। ফার্থ মনে করেন কোন বাক্য বা অভিব্যক্তির অর্থ নির্ণয়ে তিন ধরনের প্রতিবেশ গুরুত্বপূর্ণ: বক্তার চারপাশের সমাজ (social setting), বক্তার বলা অন্যান্য বাক্যের প্রেক্ষিতে আলোচ্য বাক্যের অবস্থান (context of spoken or textual discourse), এবং প্রতিটি শব্দের আশেপাশের শব্দের অবস্থান (context of surrounding words), অর্থাৎ সহাবস্থান। ফার্থের বিখ্যাত একটি উক্তি এখানে স্মরণ করা যায়: “A word is characterized by the company it keeps.”

সহাবস্থানের পরীক্ষা সম্পাদনা

কোন শব্দসমষ্টি সহাবস্থান কি না, তা পরীক্ষা করার খুব সহজ উপায় হল ঐ শব্দসমষ্টিটিকে অন্য একটি ভাষায় আক্ষরিক অনুবাদের চেষ্টা করা। যদি আক্ষরিক অনুবাদ করার পর দেখা যায় অনুবাদটি সঠিক হয়নি, তাহলে বুঝতে হবে এই শব্দসমষ্টিটি একটি সহাবস্থান। যেমন – ইংরেজি “take an exam” এর আক্ষরিক অনুবাদ “পরীক্ষা নেওয়া”, কিন্তু বাংলাতে সঠিক অনুবাদ হবে “পরীক্ষা দেওয়া”, আবার ইংরেজি “give an exam”-এর আক্ষরিক অনুবাদ “পরীক্ষা দেওয়া”, কিন্তু বাংলাতে এর সঠিক অনুবাদ “পরীক্ষা নেওয়া”। এ থেকে বোঝা যায়, ইংরেজিতে take an exam এবং give an exam উভয়ই দুইটি সহাবস্থানের উদাহরণ।

সহাবস্থানের অনুসন্ধান সম্পাদনা

কোন ভাষাংশে (corpus) সহাবস্থান খুঁজে বের করার একটি সহজ উপায় হল এতে ঘন ঘন ব্যবহৃত শব্দসমষ্টিগুলো খুঁজে বের করা। কেননা যদি কোন শব্দসমষ্টি প্রচুর ব্যবহৃত হয়, তবে তা এটাই প্রমাণ করে যে এটির অর্থ এর উপাদান শব্দগুলোর অর্থের সমষ্টি নয়, বরং অন্য কিছু; অর্থাৎ এই শব্দসমষ্টিটি একটি সহাবস্থান হতে পারে। এভাবে পাওয়া শব্দসমষ্টিগুলোকে একাধিক পদ সংযোজনের ভাষাবিজ্ঞানসম্মত নিয়ম অনুযায়ী (যেমন - বিশেষ্য+বিশেষণ, বিশেষ্য+বিশেষ্য, ইত্যাদি) সাজালে প্রচুর সঠিক (proper) সহাবস্থান বেরিয়ে আসে।

পাদটীকা সম্পাদনা

  1. এখানে “কথা” একটি বিশেষ পরিভাষা হিসেবে ব্যবহৃত হয়েছে। দেখুন দাস, রমাপ্রসাদ (২০০২), কথার কর্ম ও অপকর্ম, কলকাতা: পশ্চিমবঙ্গ বাংলা আকাদেমি । রমাপ্রসাদ ৭নং পৃষ্ঠায় Expression-এর বাংলা পরিভাষা হিসেবে “কথা” ব্যবহারের পেছনে যুক্তি দিয়েছেন।

কৃতজ্ঞতা স্বীকার সম্পাদনা

  • Manning, Christopher; Schütze, Hinrich (১৯৯৯), Foundations of Statistical Natural Language Processing, Cambridge, MA: MIT Press. 

এই নিবন্ধে ব্যবহৃত পরিভাষা সম্পাদনা

  • collocation - সহাবস্থান
  • expression - কথা
  • meaning - অর্থ
  • compositionality - সংযোজনশীলতা
  • fully compositional - সম্পূর্ণ সংযোজনশীল
  • non-compositionality - অ-সংযোজনশীলতা
  • terminology extraction - পরিভাষা নিষ্কাশন
  • term - পারিভাষিক শব্দ
  • technical term - পরিভাষা
  • terminological Phrase - পারিভাষিক বাক্যাংশ
  • natural language generation - স্বাভাবিক ভাষা উৎপাদন
  • computational lexicography - গণনামূলক অভিধানবিজ্ঞান
  • parsing - বাক্য-বিশ্লেষণ
  • corpus linguistics - ভাষাংশ ভাষাবিজ্ঞান
  • abstraction - বিমূর্ততা