شما این محصولات را انتخاب کرده‌اید

سبد خرید

پردازش صدا با استفاده از تکنیک های شبکه های عصبی مصنوعی پردازش صدا با استفاده از تکنیک های شبکه های عصبی مصنوعی
پردازش صدا با استفاده از تکنیک های شبکه های عصبی مصنوعی پردازش صدا با استفاده از تکنیک های شبکه های عصبی مصنوعی

پردازش صدا با استفاده از تکنیک های شبکه های عصبی مصنوعی

امتیاز خریداران: 1 از 1 رای
168 بازدید
20,000 تومان

چکيده:

پردازش صدا یکی از مباحث روز و هیجان انگیزه بوده که کاربرد های بسیار دارد. یکی از راه های پردازش صدا، استفاده از مدل های آماری است. مدل سازی عروض، نقشی حیاتی در توسعه ی سیستم ترکیب متن به گفتار (TTS) با کیفیت بالا را بازی می کند. عروض به مدت زمان، زیر و بمی صدا و الگوهای شدت گفتار مربوط به دنباله ای از هجاها، کلمات و عبارات اشاره می کند. این ویژگی ها معمولاً در بخش های طولانی تری از گفتار مشاهده می شوند.

دنباله ی مدت زمان هجا به عنوان الگوی مدت زمان تعریف شده است. یک روش شناسی هوشمند ترکیب شده توسط تبدیل بسته- موجک و شبکه ی عصبی مصنوعی برای تشخیص کیفیت صدا در این مقاله ارائه شده است. بر اساس اندازه ی تسریع نویز حامل، مقایسه ی پنج تکنیک تجزیه و تحلیل فرکانس- زمان نشان می دهد که WPT با پارتیشن فرکانس معلوم برای شبیه سازی باندهای بحرانی شنوایی انسان مناسب تر است. بنابر این، درخت ناکامل WPT به نام OPWT به طور خاص برای استخراج ویژگی مبتنی بر انرژی صدا ها طراحی شده است.

 

بیان مساله:

تنوع در الگوهای مدت زمان، موجب طبیعی بودن گفتار می شود. زیر و بمی صدا می تواند به عنوان دینامیک های فرکانس های پایه (F0) کانتور در طول زمان تعریف شود. در نظر گرفته می شود که شدت، رابطه ی بسیار نزدیکی با بلندی صدای دریافتی داشته باشد. رفتار دینامیکی الگوی شدت، به عنوان کانتور شدت یا انرژی شناخته شده است.

یک مدل عروض خوب باید مدت زمان، زیر و بمی صدا و الگوهای شدت گفتار طبیعی را ضبط کند. هدف مطالعه ی فعلی، تعیین اینکه آیا مدل های غیر خطی می توانند دانش ضمنی الگوهای عروض هجاها را ضبط کند یا خیر، می باشد. در این کار، مدل های شبکه ی عصبی برای مدل سازی عروض ارائه شدند. شبکه های عصبی برای قابلیت ضبط روابط غیر خطی پیچیده ی ارائه شده در داده های [1, 2] شناخته شده می باشند. شبکه های عصبی توانایی تعمیم پیش بینی مقادیر خوبی برای الگوهایی را دارند که در فاز یادگیری ارائه نشده اند.

اخیراً، یک نقشه ی خود سازماندهی افزایشی ادغام شده با شبکه عصبی سلسله مراتبی (ISOM-HNN)، توجه زیادی را در میان کار محققان در ناحیه ی شبکه های عصبی و تشخیص الگو، به خود جلب کرده است. دلایل بالقوه برای محبوبیت آن با توجه به (i) تشخیص مؤثر سیگنال های رادیویی شناخته شده در محیط های بسیار مبهم، (ii) مناسب با برنامه های زمان واقعی، و (iii) بهبود در دقت پیش بینی می باشد. هدف ISOM جاسازی توانایی ضبط افزایشی در داخل SOM می باشد.

 

كليد واژه: پردازش صدا، شبکه عصبی مصنوعی، مدل سازی عروض

 

پی سی اسکریپت تلاش نموده است تا مقاله ای جامع برای شما عزیزان گردآوری نماید.

ویژگی های محصول

فرمت مقاله انگلیسی

مقاله ترجمه شده

تعداد صفحات

6

سال انتشار

2019

آشنایی با فرآیند پشتیبانی محصولات

کلیه محصولات پیش از انتشار توسط کارشناسان پی سی اسکریپت بررسی می شود اگر قبل از خرید سؤالی دارید می توانید در قسمت دیدگاه ها مطرح کنید اما اگر بعد از خرید محصول خریداری شده لینک دانلودش خراب است یا به هر پشتیبانی دیگری در مورد این محصول نیاز دارید از طریق تیکت با فروشنده این محصول می توانید در میان بگذارید،اگر با اشتراک ویژه این فایل را خریداری کردید، از طریق پنل کاربری تیکت ارسال بفرمایید.

روش های پشتیبانی

جهت ارسال تیکت باید به حساب کاربری خود وارد شوید.
168 بازدید
20,000 تومان
با خرید این محصول از مزایای زیر بهره‌مند می‌شوید:
دسترسی به فایل محصول به صورت مادام‌العمر
۶ ماه پشتیبانی کاملا رایگان و تضمین شده
پردازش صدا با استفاده از تکنیک های شبکه های عصبی مصنوعی
امتیاز خریداران: 1 از 1 رای
تاریخ بروزرسانی:
کارشناس ارشد مهندسی کامپیوتر(نرم افزار) که 4 سال است در زمینه ترجمه انواع متون تخصصی، انجام پروژه و پایان نامه و همچنین نگارش مقالات داخلی و خارجی در حوزه IT ، مهندسی کامپیوتر و مدیریت فعالیت دارم. با توجه به علاقه ای که به بحث سئو و بهینه سایت داشتم حدود 2 سال است که به صورت جدی بر روی مقالات این گرایش متمرکز شده ام/

سایر محصولات مژدهی Other Products