توضیحات
قبل از بیان مفهوم وب کاوی و کاربرد های آن لازم است که یک تعریف اولیه از وب را داشته باشیم:
وب مجموعه ای از فایلهای پیوند داده ها شده است که در یک یا چند وب سرور قرار داده ها شده است.
بر اساس تعریف ویکی پدیا: وب کاوی (Web mining) کاربرد تکنیکهای داده کاوی برای شناسایی الگوها در وب میباشد.
بر اساس نوع تحلیل مورد نظر، وبکاوی به سه دسته کاربرد کاوی وب (Web usage mining)، محتوا کاوی وب (web content mining) و ساختار کاوی وب (web structure mining) تقسیم میشود.
فهرست محتوا
انواع داده هایی که در وب وجود دارند :
- غیر ساختیافته : مانند متن ساده
- نیمه ساختیافته :مانند HTML Page
- داده های ساختیافته : مانند جدول
با افزایش چشمگیر حجم اطلاعات و توسعه وب، نیاز به روش ها و تکنیک هایی که بتوانند امکان دستیابی کارا به داده ها و استخراج اطلاعات از آنها را فراهم کنند، بیش از پیش احساس می شود.
وبکاوی یکی از زمینه های تحقیقاتی است که با به کارگیری تکنیک های داده کاوی به کشف و استخراج خودکار اطلاعات از اسناد و سرویس های وب می پردازد.
در واقع وب کاوی، فرآیند کشف اطلاعات و دانش ناشناخته و مفید از داده های وب می باشد.
روش های وب کاوی بر اساس آن که چه نوع داده ای را مورد کاوش قرار می دهند، به سه دسته کاوش محتوای وب، کاوش ساختار وب و کاوش استفاده از وب تقسیم میشوند.
مدیر سایت –
a