توضیحات
چکیده:
به تازگی، پردازش پرس و جو مرتبط نمایش داده شد توجه در به دست آوردن است . شناسایی ما و به طور سیستماتیک مورد بحث سه استراتژی اصلی: یک استراتژی پایین به بالا که منابع جدید در طول پردازش پرس و جو کشف شده توسط ارتباط بین منابع زیر، یک استراتژی از بالا به پایین است که متکی بر دانش کامل در مورد منابع به انتخاب و فرآیند مربوطه منابع و استراتژی ترکیبی است که فرض برخی از دانش ناقص کشف منابع جدید و در زمان اجرا. برای بهره برداری از دانش کشف در زمان اجرا، ما یک مرحله دیگر، به صراحت در طول پرس و جو برنامه ریزی پیشنهاد پردازش، به نام رتبه بندی منبع صحیح.
علاوه بر این، ما پیشنهاد تصویب پردازش پرس و جو جریان مبتنی بر برای مقابله با غیر قابل پیش بینی ماهیت دسترسی به داده ها در توزیع های مرتبط محیط زیست داده. که در آزمایش، ما نشان می دهد که اجرای ما از استراتژی ترکیبی منجر به گزارش های اولیه از نتایج و پردازش پرس و جو در نتیجه، بیشتر پاسخگو، در حالی که نیاز به دانش کامل نیست.
بیان مساله پردازش پرس و جو:
مقدار داده های مرتبط در وب بزرگ و رو به افزایش است. . با این حال، ساختار بسیار توزیع و در حال تحول ماهیت داده پیوندی چالش های منحصر به فرد ارائه می دهد.
– حجم مجموعه منبع باشد:
با توجه به اصول داده های مرتبط[2]، هر URI می تواند بصورت غیر مرجع و سند نشان دهنده یک بازگشت مجازی “منبع داده” است. این به طور چشمگیری افزایش تعداد داده های مرتبط منابع که نیاز به پرس و جو برای پردازش در نظر گرفته می شود.
– پویا از مجموعه منبع:
منابع داده های مرتبط اضافه می شوند و حذف و محتوای منابع، به سرعت در حال در طول زمان تغییر می کند. با توجه به این پویا، آن است که دیگر امن فرض کنیم که اطلاعات در مورد تمام منابع را می توان به دست آورد . به طور خاص، منابع ممکن است یک ناشناخته پیشینی و تنها می تواند در زمان اجرا را کشف کردند.
– عدم تجانس از منابع، منبع توضیحات و گزینه های دسترسی:
منابع در اندازه متفاوت باشد. ممکن است منابع زیادی وجود دارد، مربوط به وب پایگاه های داده امروزاست . منابع همچنین می تواند فقط شامل چندین اظهارات RDF به دست آمده از طریق URI مراجعه کند. علاوه بر این، تاکنون هیچ استاندارد برای توصیف منابع وجود ندارد. همه منابع با یک خلاء همراه 1توضیحات و حتی اگر چنین است، آنها اغلب ناقص هستند.
همچنین، طیف وسیعی از گزینه دسترسی گسترده است. منابع می توانید از طریق HTTP گرین کارت آمریکا به دست آمده، برگرفته از پایانه های SPARQL یا به طور مستقیم لود شده از یک مخزن محلی و یا کش باشد . حتی با استفاده از روش دسترسی یکسان، زمان مورد نیاز برای به دست آوردن همان مقدار از داده ها ممکن است تا حد زیادی به دلیل متفاوت با تاخیر شبکه باشد.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.