مروری بر بازشناسی خودکار گفتار (Automatic Speech Recognition- A Review):

سیستم‌های بازشناسی خودکار گفتار ـ معرفی
گفتار ساده‌ترین و کارآمدترین راه ارتباط انسان هاست
هدف بازشناسی خودکار گفتار Automatic Speech Recognition (ASR)
تبدیل گفتار انسان به متن یا دستورالعمل معادل
گفتار می‌تواند یک فایل صوتی، ورودی با میکروفون، از طریق خط تلفن و یا فرمان از راه دور باشد.

یک سیستم بازشناسی کامل:

گفتار بایستی به صورت کتابی باشد.
گفتار بایستی بر اساس حالت استاندارد زبان باشد و تغییرات مربوط به لهجه‌ها منجر به کاهش کارایی می‌شود.
استفاده از آنها در محیط و شرایط نویزی منجر به افت کارایی و دقت آنها می‌شود.
اغلب سیستم های کاربردی امروزی تقریبا بلادرنگ هستند.
سیستم‌های موجود محدود به کلمات موجود در واژگان هستند و از اطلاعات زبانی و معنایی به صورت محدود استفاده می‌کنند.

بازشناسی گفتار کار پیچیده ای است
ارتباط انسان با ماشین امروزه بر پایه دکمه ها و کلیدهاست، نه گفتار
اگر شما یک کلمه خاص مانند ”آسمان“ را ۱۰ بار مختلف بیان نمایید، تقریبا در هیچ دو حالتی فایل های ضبط شده دیجیتالی آنها دقیقا یکسان نیست!

هنوز بررسی‌ای ثبت نشده است.

تنظیم کننده فایل

آخرین ویرایش‌ توسط: امیر پیرعلیلو

کارشناس پسیو هلدینگ های وب ـ مهندسی تجارت الکترونیک از دانشگاه تبریز ـ عضو شورای علمی دانشجویی دانشگاه مدیریت صنعتی