আলোকভিত্তিক অক্ষর শনাক্তকরণ

(Optical character recognition থেকে পুনর্নির্দেশিত)

আলোকভিত্তিক অক্ষর শনাক্তকরণ হাতে লেখা বা টাইপযন্ত্রে টাইপকৃত লেখার ছবিকে (সাধারণত স্ক্যানার দিয়ে স্ক্যান করা) কম্পিউটারে সম্পাদনাযোগ্য লেখায় অনূদিত করার যান্ত্রিক বা ইলেকট্রনিক পদ্ধতিকে বুঝায়। ইংরেজি ভাষায় এটিকে "অপটিক্যাল ক্যারেক্টার রিকগনিশন" (সংক্ষেপে "ওসিআর") নামে ডাকা হয়। কম্পিউটার বিজ্ঞানের যে শাখাগুলি আলোকভিত্তিক অক্ষর শনাক্তকরণের সাথে সম্পর্কিত সেগুলি হচ্ছে: বিন্যাস শনাক্তকরণ (প্যাটার্ন রিকগনিশন), কৃত্রিম বুদ্ধিমত্তা এবং যান্ত্রিক দর্শন (মেশিন ভিশন)।

ওসিয়ার সফটওয়্যারের মাধ্যমে অক্ষর শনাক্তকরণ
ওসিয়ার সফটওয়্যারের মাধ্যমে অক্ষর শনাক্তকরণ

বাংলা আলোকভিত্তিক অক্ষর শনাক্তকরণ সম্পাদনা

বাংলাতে গুগল টেসারাকটের আলোকভিত্তিক অক্ষর শনাক্তকরণ আছে সেটি আগে খুবই দুর্বল এবং ছাপা হরফের জন্য প্রযোজ্য ছিল। কিন্তু বর্তমানে গুগল ড্রাইভ ও গুগল ডক গুগল টেসারাকটের যে আলোকভিত্তিক অক্ষর শনাক্তকরণ প্রযুক্তি ব্যবহার করে তা বেশ উন্নত, ফলাফলও বেশ সঠিক। ২০০৭ সালে সি.আর.বি.এল.পি ল্যাব বাংলার জন্য এটি বানানোর একটি প্রচেষ্টা শুরু করে গুগলের সহায়তায়। এর পর বাংলাদেশ ও ভারতে অনেক বিশ্ববিদ্যালয় এবং গবেষণাগারে এটির গবেষণার কাজ এখনো চলছে।

বাংলা ভাষা হল জটিল ভাষা, এতে যুক্তাক্ষর এবং মাত্রার ব্যবহার আছে, বাংলার ন্যায় হিন্দিতেও এবং বিশ্বের আরও অনেক ভাষাতে যুক্তাক্ষর এবং জটিলতা আছে। তাই অনেক সময় কম্পিউটারের পক্ষে সেটিকে বুঝতে কঠিন হয়।

তথ্যসূত্র সম্পাদনা

বহিঃসংযোগ সম্পাদনা