داده کاوی چیست؟
در یک تعریف غیر رسمی داده کاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی می کنند، که این دانش به صورت ضمنی در پایگاه دادههای عظیم، انباره داده (Data warehouses) و دیگر مخازن بزرگ اطلاعات، ذخیره شده است.تیم پی سی اسکریپت تلاش نموده ایت تا شما را با مفاهیم اولیه و کاربردهای داده کاوی آشنا نماید.
گرداب– واحد آموزش و پژوهش: در دو دهه قبل تواناییهای فنی بشر در برای تولید و جمع آوری دادهها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسب و کار، علوم، خدمات دولتی و پیشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهواره ای، در این تغییرات نقش مهمی دارند.
بهطور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات میکند. این رشد انفجاری در دادههای ذخیره شده، نیاز مبرم وجود تکنولوژی های جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند: داده کاوی به عنوان یک راه حل برای این مسائل مطرح است.
مساله داده کاوی:
در یک تعریف غیر رسمی داده کاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی می کنند، که این دانش به صورت ضمنی در پایگاه داده های عظیم، انباره داده (Data warehouses) و دیگر مخازن بزرگ اطلاعات، ذخیره شده است.
داده کاوی بطور همزمان از چندین رشته علمی بهره می برد نظیر: تکنولوژی پایگاه داده، هوش مصنوعی، یادگیری ماشین، شبکه های عصبی، آمار، شناسایی الگو، سیستم های مبتنی بر دانش (Knowledge-based system)، حصول دانش (Knowledge-acquisition)، بازیابی اطلاعات (Information retrieval)، محاسبات سرعت بالا (High-performance computing) و بازنمایی بصری داده (Data visualization).
داده کاوی در اواخر دهه 1980 پدیدار شد، در دهه 1990 گامهای بلندی در این شاخه از علم برداشته شده و انتظار می رود در این قرن به رشد و پیشرفت خود ادامه دهد.
واژه های « داده کاوی » و «کشف دانش در پایگاه داده» (Knowledge Discovery in Database) اغلب به صورت مترادف یکدیگر مورد استفاده قرار می گیرند. کشف دانش به عنوان یک فرآیند در شکل 1-1 نشان داده شده است.