روش نوین برای بازشناسی گفتار در تلفن همراه و کامپیوتر ارائه شد
پژوهشگران دانشکده مهندسی پزشکی دانشگاه صنعتی امیرکبیر با استفاده از صوت و تصویر روشی را برای بهبود گفتار در سامانههای هوشمند عرضه کردند.
پرتال دانشگاهی به نقل از گزارش گروه دانشگاه خبرگزاری فارس، پژوهشگران دانشکده مهندسی پزشکی دانشگاه صنعتی امیرکبیر با استفاده از صوت و تصویر روشی را برای بهبود گفتار در سامانههای هوشمند عرضه کردند که نتایج این تحقیقات در تلفن همراه و رایانههای بدون موس و صفحه کلید کاربرد دارد.
کامران قاصدی مجری این طرح با اشاره به اهمیت بازشناسی گفتار در حوزه ارتباطات هوشمند رایانه و انسان، افزود: بازشناسی گفتار به دلیل کاربردهای فراوان و فناوریهای جدید و ایفای نقش اساسی در حوزه ارتباطات هوشمند رایانه و انسان یکی از موضوعات مهم و مورد توجه محققان است ولی سامانههای بازشناسی خودکار گفتار برای انجام ماموریتهای مورد نظر در شرایط واقعی به دلیل وجود عناصر مزاحم و مخرب مانند انواع نویز با مشکلات زیادی همراه است.
وی با بیان اینکه برای حل این مشکل تاکنون روشهای مختلفی ارائه شده است، اظهار داشت: در این راستا پروژهای در قالب پایاننامه دوره کارشناسی ارشد، با عنوان «بازشناسی گفتار مستقل از فرد با استفاده از تلفیق اطلاعات صوتی و تصویری» در دانشگاه امیرکبیر اجرایی شد.
قاصدی، بازشناسی صوتی و تصویری گفتار را مستلزم استخراج ویژگیهای تصویری عنوان کرد و افزود: برای این منظور با استفاده از یک مدل شبکه عصبی، فضای رنگی جدیدی به دست آمده، تا تمایز بیشتری میان پیکسلهای لب و غیرلب ایجاد شود و سپس ویژگیهای مورد نظر از سیگنال تصویری استخراج شده است.
در این تحقیق علاوه بر ویژگیهای صوتی از ویژگیهای تصویری نیز برای بازشناسی گفتار استفاده شد و در نهایت موفق به بهبود بازشناسی بویژه در شرایط نویزی شدیم.