بازشناسی گفتار (Speech Recognition) ـ تشخیص گفتار انسان توسط ماشین و تبدیل آن به متن یا دستورالعمل معادل:
- نکات مطرح در بازشناسی گفتار
- تعداد کلمات مورد بازشناسی
- پیوسته یا گسسته بودن ادای کلمات
- وابستگی یا استقلال از گوینده
یک سیستم بازشناسی کامل:
- قادر به بازشناسی گفتار پیوسته و محاورهای باشد.
- گفتار افراد مختلف، حتی با لهجههای متفاوت را بازشناسی نماید.
- در محیطهای شلوغ و نویزی هم جوابگو باشد.
- بصورت بلادرنگ عمل کند.
- قادر به فراگیری اطلاعات جدید نظیر کلمات، قوانین زبانی و . . . باشد.
سیستمهای کاربردی امروزی:
- گفتار بایستی به صورت کتابی باشد.
- گفتار بایستی بر اساس حالت استاندارد زبان باشد و تغییرات مربوط به لهجهها منجر به کاهش کارایی میشود.
- استفاده از آنها در محیط و شرایط نویزی منجر به افت کارایی و دقت آنها میشود.
- اغلب سیستم های کاربردی امروزی تقریبا بلادرنگ هستند.
- سیستمهای موجود محدود به کلمات موجود در واژگان هستند و از اطلاعات زبانی و معنایی به صورت محدود استفاده میکنند.
انواع سیستم های بازشناسی گفتار بر اساس تعداد کلمات:
- واژگان کوچک (Small Vocabulary): 1 تا ۱۰۰ کلمه
- واژگان متوسط (Medium Vocabulary): بین ۱۰۰ تا ۱۰۰۰ کلمه
- واژگان بزرگ (Large Vocabulary): بین ۱۰۰۰ تا ۶۰۰۰۰ کلمه
- واژگان خیلی بزرگ (Very Large Vocabulary): بیشتر از ۶۰۰۰۰ کلمه
انواع سیستم های بازشناسی گفتار بر اساس وابستگی یا استقلال از گوینده:
- وابسته به گوینده (SD: Speaker Dependent): به یک و یا چند گوینده خاص پاسخ میدهد.
- مستقل از گوینده (SI: Speaker Independent): به تمام گویندگان یک زبان پاسخ میدهد.