প্রসঙ্গমুক্ত ব্যাকরণ

ভাষাবিজ্ঞান এবং কম্পিউটার বিজ্ঞানে প্রসঙ্গমুক্ত ব্যাকরণ (ইংরেজি: Context-free grammar বা সংক্ষেপে CFG) হচ্ছে একটি বিধিগত ব্যাকরণ (formal grammar) যেখানে প্রতিটি উৎপাদনী সূত্র (production rule) নিম্নোক্ত রূপের হয়-

V → w

যেখানে V একটি অসমাপ্তিজ্ঞাপক প্রতীক (nonterminal symbol) এবং w হচ্ছে সমাপ্তিজ্ঞাপক (terminal symbol) ও/অথবা অসমাপ্তিজ্ঞাপক প্রতীক দিয়ে গঠিত একটি স্ট্রিং। "প্রসঙ্গমুক্ত" (context-free) পরিভাষাটি দিয়ে বোঝানো হচ্ছে যে অসমাপ্তিজ্ঞাপক V-কে সর্বদাই w দিয়ে প্রতিস্থাপিত করা যাবে, সেটি যে প্রসঙ্গেই ঘটুক না কেন। একটি বিধিগত ভাষা (formal language) যদি কোন প্রসঙ্গমুক্ত ব্যাকরণ থেকে উৎপাদন বা সৃষ্টি (generate) করা হয়, তবে তাকে প্রসঙ্গমুক্ত ভাষা (context-free language) বলা হয়।

প্রসঙ্গমুক্ত ব্যাকরণ একটি শক্তিশালী ধারণা এবং এর সাহায্যে বেশির ভাগ প্রোগ্রামিং ভাষার সিনট্যাক্স বর্ণনা করা যায় এবং তা-ই বাস্তবে ঘটেছে। কিন্তু প্রসঙ্গমুক্ত ব্যাকরণগুলি সরলও বটে; এগুলির সাহায্যে দক্ষ পার্সিং অ্যালগোরিদম নির্মাণ করা সম্ভব, যেগুলি কোন প্রদত্ত স্ট্রিং কীভাবে ব্যাকরণটি থেকে সৃষ্টি হতে পারে, তা নির্ণয়ে সক্ষম। আর্লি পার্সার (Earley parser) এই ধরনের অ্যালগোরিদমের একটি উদাহরণ। এলআর পার্সার (LR parser) এবং এলএল পার্সারগুলি (LL parser) প্রসঙ্গমুক্ত ব্যাকরণসমূহের একটি সীমিত উপসেটের ওপর কাজ করে।

প্রসঙ্গমুক্ত ব্যাকরণ প্রকাশ করার জন্য সবচেয়ে প্রচলিত লিখন পদ্ধতি (notation) হচ্ছে বিএনএফ (BNF) বা বাকাস-নাউর রূপ

বিধিগত ভাষামাত্রেই প্রসঙ্গমুক্ত নয়। এরকম একটি ভাষা হল , যা এমন কতগুলি স্ট্রিং-এর সেট, যার প্রতিটি স্ট্রিং কিছু সংখ্যক a দিয়ে শুরু হয়, এবং একে অনুসরণ করে সমসংখ্যক b এবং c।

বিধিগত সংজ্ঞা সম্পাদনা

অন্য যেকোন বিধিগত ব্যাকরণের (formal grammar) মতই কোন প্রসঙ্গমুক্ত ব্যাকরণ G-কে একটি ৪-টুপল আকারে প্রকাশ করা যায়:

  যেখানে

  •   সমাপ্তিজ্ঞাপক প্রতীকের সসীম সেট
  •   অ-সমাপ্তিজ্ঞাপক প্রতীকের সসীম সেট
  •   উৎপাদন নিয়মসমূহের একটি সসীম সেট
  •   হচ্ছে   একটি উপাদান, একটি বিশেষভাবে চিহ্নিত আরম্ভসূচক অ-সমাপ্তিজ্ঞাপক প্রতীক (starting non-terminal)
  •  -এর উপাদানগুলি নিচের রূপবিশিষ্ট
 

কোন ভাষা L-কে একটি প্রসঙ্গমুক্ত ভাষা (Context-Free-Language বা CFL) বলা হয় যদি এর ব্যাকরণটি প্রসঙ্গমুক্ত হয়। আরও সঠিকভাবে, L এমন একটি ভাষা যার শব্দ, বাক্য এবং পদগুচ্ছগুলি একটি প্রসঙ্গমুক্ত ব্যাকরণের প্রতীক ও শব্দ দিয়ে গঠিত। L-কে তাই সাধারণত L=L(G) আকারে প্রকাশ করা হয়।

নিচে কিছু প্রসঙ্গমুক্ত ব্যাকরণের উদাহরণ দেয়া হল:

উদাহরণসমূহ সম্পাদনা

উদাহরণ ১ সম্পাদনা

নিচে একটি সরল প্রসঙ্গমুক্ত ব্যাকরণ দেয়া হল:

S → aSb | ε

যেখানে | দিয়ে একই অসমাপ্তিজ্ঞাপক প্রতীকের জন্য একাধিক অপশনগুলিকে পৃথক করে দেখানো হয়েছে এবং ε দিয়ে খালি স্ট্রিং বোঝানো হয়েছে। এই ব্যাকরণটি নিচের ভাষাটিকে সৃষ্টি করে:   যা একটি নিয়মিত ভাষা নয়।

উদাহরণ ২ সম্পাদনা

নিচের প্রসঙ্গমুক্ত ব্যাকরণটি x, y এবং z নামক তিনটি চলকের জন্য সিনট্যাক্সগতভাবে সঠিক ইনফিক্স বীজগাণীতিক এক্সপ্রেশন সৃষ্টি করতে পারে:

S → x | y | z | S + S | S - S | S * S | S/S | (S)

উদাহরণস্বরূপ এই ব্যাকরণটি "( x + y ) * x - z * y / ( x + x )" স্ট্রিংটি সৃষ্টি করতে পারে।

এই ব্যাকরণটি দ্ব্যর্থবোধক, অর্থাৎ এতে একই স্ট্রিং-কে একাধিক পার্স-বৃক্ষের সাহায্যে সৃষ্টি করা সম্ভব।

উদাহরণ ৩ সম্পাদনা

{a,b} সেটটির উপর ভিত্তি করে গঠিত সমস্ত স্ট্রিং, যেগুলির প্রতিটিতে a-এর সংখ্যা b-এর সংখ্যার সমান নয়, যে ভাষা গঠন করে, সেই ভাষাটিকে নিচের প্রসঙ্গমুক্ত ব্যাকরণ দিয়ে নির্দেশ করা যায়

S → U | V
U → TaU | TaT
V → TbV | TbT
T → aTbT | bTaT | ε

এখানে T এরকম সমস্ত স্ট্রিং সৃষ্টি করে যেগুলিতে a ও b-এর সংখ্যা সমান। U এরকম সমস্ত স্ট্রিং সৃষ্টি করে যেগুলিতে a-এর সংখ্যা b-এর চেয়ে বেশি এবং V এমন সমস্ত স্ট্রিং সৃষ্টি করে যেগুলিতে a-এর সংখ্যা b-এর সংখ্যার চেয়ে কম।

উদাহরণ ৪ সম্পাদনা

প্রসঙ্গমুক্ত ভাষার আরেকটি উদাহরণ হল  । এটি একটি নিয়মিত ভাষা নয়, কিন্তু এটি প্রসঙ্গমুক্ত এবং নিচের প্রসঙ্গমুক্ত ব্যাকরণটি দিয়ে সৃষ্টি করা সম্ভব:

S → bSbb | A
A → aA | ε

অন্যান্য উদাহরণ সম্পাদনা

প্রসঙ্গমুক্ত ব্যাকরণ কেবল গাণিতিক বিধিগত ভাষাসমূহের মধ্যেই সীমাবদ্ধ নয়। ভেনপা নামের এক শ্রেণীর তামিল কবিতা প্রসঙ্গমুক্ত ব্যাকরণ-নিয়ন্ত্রিত বলে ধারণা করা হয়।[১]

তথ্যসূত্র সম্পাদনা

  1. L, BalaSundaraRaman (২০০৩-০৮-২২)। "Context Free Grammar for Natural Language Constructs - An implementation for Venpa Class of Tamil Poetry"Proceedings of Tamil Internet, Chennai, 2003। International Forum for Information Technology in Internet। পৃষ্ঠা 128–136। সংগ্রহের তারিখ ২০০৬-০৮-২৪  অজানা প্যারামিটার |coauthors= উপেক্ষা করা হয়েছে (|author= ব্যবহারের পরামর্শ দেয়া হচ্ছে) (সাহায্য)