مروری بر بازشناسی خودکار گفتار (Automatic Speech Recognition- A Review):
- سیستمهای بازشناسی خودکار گفتار ـ معرفی
- گفتار سادهترین و کارآمدترین راه ارتباط انسان هاست
- هدف بازشناسی خودکار گفتار Automatic Speech Recognition (ASR)
- تبدیل گفتار انسان به متن یا دستورالعمل معادل
- گفتار میتواند یک فایل صوتی، ورودی با میکروفون، از طریق خط تلفن و یا فرمان از راه دور باشد.
یک سیستم بازشناسی کامل:
- قادر به بازشناسی گفتار پیوسته و محاورهای باشد.
- گفتار افراد مختلف، حتی با لهجههای متفاوت را بازشناسی نماید.
- در محیطهای شلوغ و نویزی هم جوابگو باشد.
- بصورت بلادرنگ عمل کند.
- قادر به فراگیری اطلاعات جدید نظیر کلمات، قوانین زبانی و . . . باشد.
سیستمهای کاربردی امروزی:
- گفتار بایستی به صورت کتابی باشد.
- گفتار بایستی بر اساس حالت استاندارد زبان باشد و تغییرات مربوط به لهجهها منجر به کاهش کارایی میشود.
- استفاده از آنها در محیط و شرایط نویزی منجر به افت کارایی و دقت آنها میشود.
- اغلب سیستم های کاربردی امروزی تقریبا بلادرنگ هستند.
- سیستمهای موجود محدود به کلمات موجود در واژگان هستند و از اطلاعات زبانی و معنایی به صورت محدود استفاده میکنند.
سیستمهای بازشناسی خودکار گفتار ـ پیچیدگی ها:
- بازشناسی گفتار کار پیچیده ای است
- ارتباط انسان با ماشین امروزه بر پایه دکمه ها و کلیدهاست، نه گفتار
- اگر شما یک کلمه خاص مانند ”آسمان“ را ۱۰ بار مختلف بیان نمایید، تقریبا در هیچ دو حالتی فایل های ضبط شده دیجیتالی آنها دقیقا یکسان نیست!
پیچیدگیهای مطرح در سیستمهای بازشناسی گفتار ـ میزان وابستگی یا استقلال از گوینده:
- پیوسته یا گسسته بودن گفتار
- اندازهی واژگان
- محدودیتهای زبانی
- کارایی در حضور نویز و در محیطهای کاربردی مختلف
- ابهام آکوستیکی و میزان اشتباه بین کلمات
فهرست مطالب:
- معرفی تکنولوژی بازشناسی گفتار
- مروری بر کاربردهای بازشناسی گفتار
- نمایش عملی سامانه تایپ گفتاری فارسی نویسا
- نمایش عملی یک سیستم دیالوگ تلفنی ویژه بانکداری
- پرسش و پاسخ