پردازش صدا با استفاده از تکنیک های شبکه های عصبی مصنوعی – پی سی اسکریپت

چکیده:

پردازش صدا یکی از مباحث روز و هیجان انگیزه بوده که کاربرد های بسیار دارد. یکی از راه های پردازش صدا، استفاده از مدل های آماری است. مدل سازی عروض، نقشی حیاتی در توسعه ی سیستم ترکیب متن به گفتار (TTS) با کیفیت بالا را بازی می کند. عروض به مدت زمان، زیر و بمی صدا و الگوهای شدت گفتار مربوط به دنباله ای از هجاها، کلمات و عبارات اشاره می کند. این ویژگی ها معمولاً در بخش های طولانی تری از گفتار مشاهده می شوند.

دنباله ی مدت زمان هجا به عنوان الگوی مدت زمان تعریف شده است. یک روش شناسی هوشمند ترکیب شده توسط تبدیل بسته- موجک و شبکه ی عصبی مصنوعی برای تشخیص کیفیت صدا در این مقاله ارائه شده است. بر اساس اندازه ی تسریع نویز حامل، مقایسه ی پنج تکنیک تجزیه و تحلیل فرکانس- زمان نشان می دهد که WPT با پارتیشن فرکانس معلوم برای شبیه سازی باندهای بحرانی شنوایی انسان مناسب تر است. بنابر این، درخت ناکامل WPT به نام OPWT به طور خاص برای استخراج ویژگی مبتنی بر انرژی صدا ها طراحی شده است.

بیان مساله:

تنوع در الگوهای مدت زمان، موجب طبیعی بودن گفتار می شود. زیر و بمی صدا می تواند به عنوان دینامیک های فرکانس های پایه (F0) کانتور در طول زمان تعریف شود. در نظر گرفته می شود که شدت، رابطه ی بسیار نزدیکی با بلندی صدای دریافتی داشته باشد. رفتار دینامیکی الگوی شدت، به عنوان کانتور شدت یا انرژی شناخته شده است.

یک مدل عروض خوب باید مدت زمان، زیر و بمی صدا و الگوهای شدت گفتار طبیعی را ضبط کند. هدف مطالعه ی فعلی، تعیین اینکه آیا مدل های غیر خطی می توانند دانش ضمنی الگوهای عروض هجاها را ضبط کند یا خیر، می باشد. در این کار، مدل های شبکه ی عصبی برای مدل سازی عروض ارائه شدند. شبکه های عصبی برای قابلیت ضبط روابط غیر خطی پیچیده ی ارائه شده در داده های [1, 2] شناخته شده می باشند. شبکه های عصبی توانایی تعمیم پیش بینی مقادیر خوبی برای الگوهایی را دارند که در فاز یادگیری ارائه نشده اند.

اخیراً، یک نقشه ی خود سازماندهی افزایشی ادغام شده با شبکه عصبی سلسله مراتبی (ISOM-HNN)، توجه زیادی را در میان کار محققان در ناحیه ی شبکه های عصبی و تشخیص الگو، به خود جلب کرده است. دلایل بالقوه برای محبوبیت آن با توجه به (i) تشخیص مؤثر سیگنال های رادیویی شناخته شده در محیط های بسیار مبهم، (ii) مناسب با برنامه های زمان واقعی، و (iii) بهبود در دقت پیش بینی می باشد. هدف ISOM جاسازی توانایی ضبط افزایشی در داخل SOM می باشد.

کلید واژه: پردازش صدا، شبکه عصبی مصنوعی، مدل سازی عروض

پی سی اسکریپت تلاش نموده است تا مقاله ای جامع برای شما عزیزان گردآوری نماید.

جزئیات محصول

english-article-type	مقاله ترجمه شده
number-of-pages	6
release-date	2019

لغو پاسخ

درباره پشتیبانی محصول

کلیه محصولات پیش از انتشار توسط کارشناسان پی سی اسکریپت بررسی می شود اگر قبل از خرید سؤالی دارید می توانید در قسمت دیدگاه ها مطرح کنید اما اگر بعد از خرید محصول خریداری شده لینک دانلودش خراب است یا به هر پشتیبانی دیگری در مورد این محصول نیاز دارید از طریق تیکت با فروشنده این محصول می توانید در میان بگذارید،اگر با اشتراک ویژه این فایل را خریداری کردید، از طریق پنل کاربری تیکت ارسال بفرمایید.

روشهای پشتیبانی

جهت ارسال تیکت جدید باید وارد حساب کاربری خود شوید.

1169 نمایش

۲۰,۰۰۰تومان

مزایای شما از این خرید:

6 ماه پشتیبانی اریگان

دانلود مادام العمر محصولات

دانلود رایگان آپدیت محصولات

سایر محصولات Samo Other Products

Samo

خدمات آنلاین بانکداری به صورت سلف سرویس

خدمات آنلاین بانکداری به صورت سلف سرویس یکی از نیازهای اساسی جامعه است. در این مقاله تیم پی سی اسکریپت تلاش دارد تا در خصوص مزایا و فواید راه اندازی این سیستم توضیحاتی را ارائه نماید.

1161 نمایش

5.0

۱۰,۰۰۰تومان

افزودن به سبد خرید

Samo

ایجاد زیرساخت وب معنایی برای قرآن کریم

زیرساخت وب معنایی برای قرآن کریم منجر می شود تا بتوان بین آیات و سوره های این کتاب ارتباط معنایی پیدا نمود و در همین راستا فراخوانی معنایی اطلاعات آسان تر خواهد بود

1080 نمایش

5.0

۱۵,۰۰۰تومان

افزودن به سبد خرید

وب سایت پلیس و شیوه سازماندهی اطلاعات در آن

Samo

وب سایت پلیس و شیوه سازماندهی اطلاعات در آن

وب سایت پلیس و شیوه سازماندهی اطلاعات بسیار مهم می باشد. حجم اطلاعات این سازمان تا حدی زیادی می باشد که لازم است تا بتوان اطلاعات را به صورت طبقه بندی در آن قرار داد و در زمان مورد نیاز آنها را بازیابی نمود.

1006 نمایش

5.0

۱۵,۰۰۰تومان

افزودن به سبد خرید

Samo

تحلیل و پنهان شکنی کور تصاویر JPGE

تحلیل و پنهان شکنی تصاویر ممکن است دارای نام سختی باشد اما در پردازش تصاویر کاربرد بسیاری دارد. در این مقاله پی سی اسکریپت تلاش دارد تا به کاربرد آن بپردازند.

950 نمایش

5.0

۱۵,۰۰۰تومان

افزودن به سبد خرید