توضیحات
چکیده:
هرزنامههای تصویری به نامههای الکترونیکی ناخواستهای گفته میشود که اکثر محتوای پیام را به صورت تصویر نشان میدهد. اینترنت تغییر بزرگی در نحوۀ ایجاد و تبادل اطلاعات رسانه ای بین افراد را به وجود آورده است. در طی دهۀ اخیر، نامه های الکترونیکی ناخواسته (هرزنامههای الکترونیکی) در قالب های مختلف، تبدیل به یکی از جدیترین مسائل برای ارائه دهندگان خدمات اینترنتی (ISP)، شرکتهای تجاری و کاربران شده است.
از آنجا که بیشتر نرم افزارهای نامههای الکترونیکی به صورت پیش فرض، پیام های تصویری را مسقیماً به کاربر نشان می دهند، هرزنامههای تصویری تبدیل به مؤثرترین راه برای شکست حفاظ مبتنی بر رویۀ فیلترینگ موجود شده است. در سال های اخیر، شاهد افزایش سریع حجم هرزنامههای تصویری بودهایم. آمارهای اخیر نشان میدهند که هرزنامههای تصویری 27% از کل تعداد هرزنامهها را در بر گرفته و در سال 2010 به 55% از هرزنامههای الکترونیکی رسیده است. در نتیجه، نیاز مبرمی جهت طراحی و ارزیابی روشهای پیشرفته برای فیلترینگ ضد هرزنامه وجود دارد.
اخیراً توسعۀ سیستم تشخیص هرزنامه کارآ و الگوریتمهای متناظر، توجه بسیاری را جلب کرده است. فعالیتهای قبلی را میتوان به طور کلی به دو جریان پذیرفته شده و همگانی دستهبندی کرد: (1) بلاک کردن مبتنی بر IP و (2) تشخیص مبتنی بر محتوا.
ایدۀ اصلی برای رویکردهای بلاکینگ مبتنی بر IP، ایجاد و حفظ چندین لیست سیاه از آدرسهای IP مربوط به مشتریهای ارسال کنندههای هرزنامه احتمالی است که از این اطلاعات میتوان در تعیین اینکه آیا فرستندۀ یک ایمیل باید بلاک شود یا خیر، کمک گرفت. رویههای مربوط به بلاکینگ مبتنی بر IP میتوانند رویه های مبتنی بر سیاست، یا رویه های واکنشی باشند. متأسفانه، حفظ و نگهداری خودکار از یک لیست سیاه جامع در اکثر مواقع، امر بسیار دشواری است.
بیان مساله :
دلیل عمدۀ این دشواری، این است که لیستهای سیاه فعلی ممکن است با استفاده از شناسندههای اینترنتی موقتی ایجاد شوند. به طور ویژه، میزبانهای موجود در محیط سیار میتواند پویایی بیشتری را به وجود آورده و شرایط را سختتر کنند. در مقایسه با تصاویر طبیعی، هرزنامههای تصویری شامل مشخصات یکتای بسیاری هستند. هرزنامههای تصویری محتواهای متنی بسیاری را در خود جای دادهاند.
در ضمن، کنتراست رنگی تصاویر طبیعی بسیار هموار بوده و محتوای آنها میتوانند با استفاده از توابع توزیع مصنوعی با دقت بیشتری تخمین زده شوند. در واقع، این خاصیت مناسب، امکان تشخیص پیام غیر اسپم را فراهم میآورد که میتواند از تصاویر طبیعی بعنوان یک ضمیمه استفاده کند. بعلاوه، تصاویر اسپم ممکن است با استفاده از الگوهای خاصی به وجود آمده و از این رو، شامل الگوهای رنگی و بافتی یکسانی باشند. یکی از رایجترین روشهای ایجاد تصاویر اسپم، ترکیب مجموعهای از الگوهای اصلی و ایجاد خودکار میزان عظیمی از پیامهای تکراری است. تمام شواهد حاکی از این هستند که با استفاده از ترکیب مناسب ویژگیهای ظاهری متعدد میتوان هرزنامههای تصویری را شناسایی کرد.
چرایی مساله مقابله با هرزنامه های تصویری:
فیلترینگ هرزنامههای تصویری را میتوان به صورت کلاسبندی دودوئی و باینری مدلسازی کرد. هدف نهایی این کار، دستهبندی تصاویر ورودی به دو کلاس اسپم و غیراسپم است. این فرایند را میتوان به دو مرحلۀ اصلی تقسیم کرد: استخراج ویژگی و کلاس بندی. در مرحلۀ اول، ویژگیهای ظاهری باید استخراج شود تا اسپم به صورت کارآ مدلسازی شود.
در مرحلۀ دوم یک رویۀ محاسباتی بکار گرفته می شود (مدل آماری یا طبقهبندهای یادگیری ماشین) تا برچسب پیامهای ورودی بر اساس ویژگیهای آنها تخمین زده شود. در این پایاننامه، توجۀ عمدۀ ما به روی طراحی و آزمایش رویۀ مبتنی بر محتوای مقاوم برای فیلتر کردن هرزنامه تصویری است. در این پایاننامه یک سیستم تشخیص جدید جهت تسهیل کلاس بندی اسپم تصویری دقیق و مؤثر پیشنهاد میشود. این سیستم نه تنها قادر به ترکیب مؤثر چندین نوع از اطلاعات ظاهری در سطوح رزولوشن متفاوت است، بلکه برای پرداختن به مسئلۀ تعداد کم نمونه های آموزشی، از یک رویۀ نمونه برداری استفاده میکند.
**برای سفارش این پایان نامه و برآورد هزینه لطفا از بخش ثبت سفارش اقدام نمایید.**
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.