چکیده:
با پیشرفت فناوری شبکه های کامپیوتری و افزایش اندازه پایگاه داده ها، غیرمتمرکز سازی پایگاه داده ها منجر به توسعه پایگاه داده های توزیع شده بر روی چندین دستگاه شده است که در آن توزیع پایگاه داده ها برای کاربران ناپیدا و نامعلوم است. مسأله بهینه سازی پرس و جو در پایگاه داده های توزیع شده در مقیاس بزرگ ماهیتاً NP-سخت است و حل آن مشکل می باشد. تحقیقاتی در مورد یافتن یک الگوریتم مناسب به منظور دست یافتن به راه حلی بهینه خصوصاً در مواقعی که اندازه پایگاه داده ها افزایش می یابد انجام گرفته است.
یک الگوریتم کولونی مورچه ای به علت ویژگی هایی چون بازخورد مثبت، محاسبع توزیع شده و ترکیب با دیگر الگوریتم های ابتکاری می تواند ملزومات فوق الذکر را برآورده سازد. هرچند که وقتی ACO در پرس و جوی پایگاه داده های توزیع شده اجرا می شود، اطلاعات اولیه مورد نیاز ACO برای تولید یک مجموعه نتیجه بهینه سیستماتیک و سازمان یافته نبوده و منجر به سرعت همگرایی کند تر در ابتدای پردازش به منظور تولید یک حل بهینه می شود. در این مقاله، ترکیب هایی از استراتژی های الگوریتم بهینه سازی کولونی مورچه ای در پایگاه داده های توزیع شده مرور شده و مطالعات انجام شده نشان می دهند که عملکرد بهینه سازی پرس و جوی توزیع شده وقتی که ACO با دیگر الگوریتم های بهینه سازی ترکیب شود بهبود خواهد یافت.
بیان مساله:
سیستم مدیریت پایگاه داده های توزیع شده متشکل از یک پایگاه داده های منفرد منطقی است که به تکه هایی از داده های تقسیم می شود که بر روی یک سری کامپیوتر متصل به هم از طریق شبکه های ارتباطی تحت مرکزیت مدیر پایگاه داده های سراسری و محلی ذخیره شده اند. پایگاه داده های توزیع شده قابلیت اطمینان بالاتری دارد، امکان دسترسی به آن بیشتر است و عملکرد آن بهتر می باشد.
در طراحی الگوریتم های بهینه سازی به زمان و هزینه ورد نیاز برای اجرای این برنامه ها توجه بسیاری می شود. البته جستجو در تمام قسمت های این فضای بزرگ امکان پذیر نیست. این مشکل در پایگاه داده های توزیع شده یه مسأله بهینه سازی ترکیبی است و با تکنیک های متعددی مانند تقویت شبیه سازی شده، بهبود چندباره، بهینه سازی دو مرحله ای، الگوریتم های قطعی، افزونه ای و اکتشافی برای یافتن راه حل بهینه با در نظر گرفتن زمان لازم برای اجرا و هزینه اجرا و پیچیدگی اجرای این جستجو ها به آن پرداخته شده است.