কণ্ঠ শনাক্তকরণ হলো কম্পিউটেশনাল ভাষাবিদ্যার পারস্পরিক সম্পর্কযুক্ত একটি উপক্ষেত্র যেখানে কম্পিউটারের সাহায্যে কণ্ঠ শনাক্তকরণ ও মুখে উচ্চারিত ভাষাকে কম্পিউটারের সাহায্যে লেখ্যরুপে রুপান্তর সম্পর্কিত প্রযুক্তিসমূহ উন্নয়ন করে থাকে। কণ্ঠ শনাক্তকরণকে স্বয়ংক্রিয় কণ্ঠ শনাক্তকরণ, কম্পিউটার কণ্ঠ শনাক্তকরণ বা কণ্ঠ থেকে লেখ্যরুপে রুপান্তর (Speech to text (STT)) বলা হয়ে থাকে। ভাষাবিদ্যা, কম্পিউটার বিজ্ঞান ও ইলেক্ট্রিক্যাল প্রকৌশল এর ক্ষেত্রসমূহের জ্ঞান ও গবেষণার সমন্বিত রুপ হলো কণ্ঠ শনাক্তকরণ।

কিছু কণ্ঠ শনাক্তকরণ সিস্টেমে "প্রশিক্ষণ" প্রয়োজন হয়ে থাকে যেখানে একজন ব্যক্তি বা বক্তা কোন বাক্য পড়ে বা আলাদা আলাদা শব্দ পড়ে। সিস্টেম ব্যক্তির কণ্ঠ বিশ্লেষণ করে,বিশ্লেষিত বৈশিষ্ট্য ব্যবহার করে ভবিষ্যতে উক্ত ব্যক্তির কণ্ঠ শনাক্তকরণে ব্যবহার করে থাকে যা শনাক্তকরণের সঠিকতা বাড়িয়ে দেয়। যেসকল কণ্ঠ শনাক্তকরণ সিস্টেম "প্রশিক্ষণ" ধাপ ব্যবহার করে না, সেগুলোকে "বক্তা-স্বাধীন ব্যবস্থা" ("speaker independent"[1] systems)। যেসকল কণ্ঠ শনাক্তকরণ সিস্টেম "প্রশিক্ষণ" ধাপ ব্যবহার করে, সেগুলোকে "বক্তা-নির্ভর ব্যবস্থা" ("speaker dependent"[1] systems)।

তথ্যসূত্র সম্পাদনা