کارکردهای دادهكاوي
كاركردهاي دادهكاوي، انواع الگوهايي را كه در عمليات دادهكاوي بايد يافت شوند، مشخص ميكنند. به طور كلي ميتوان عمليات دادهكاوي را در دو گروه دستهبندي كرد: توصيفي و پيشگويانه.ادامه مطلب...
عمليات كاوش توصيفي، ويژگيهاي عمومي دادههاي موجود در پايگاه داده را توصيف ميكند و عمليات كاوش پيشگويانه، با انجام استنتاج بر روي دادههاي موجود به پيشگويي ميپردازد.
در ادامه به بيان كاركردهاي مختلف دادهكاوي و انواع مختلف الگوهايي كه ميتوانند استخراج كنند، ميپردازيم.
توصيف مفهوم یا رده: توصيف ويژگيها و بيان وجوه تمايز
دادهها را ميتوان با ردهها يا مفاهيمي مرتبط دانست. توصيف ردهها و مفاهيم خاص در قالب واژههاي مختصر و مفيد و در عين حال دقيق ميتواند مفيد باشد. چنين توصيفاتي را از دو طريق ميتوان به دست آورد؛ يكي توصيف ويژگيهاي دادهها كه با خلاصه كردن دادههاي مربوط به ردههاي مورد بررسي در قالب واژگان عمومي قابل انجام است و ديگري بيان وجوه تمايز، كه با مقايسهي ردهي مورد بررسي با يك يا چند ردهي ديگر صورت ميگيرد. همچنين ميتوان از هر دو روش نيز با هم بهره گرفت.
رده بندي و پيشگويي[1]
ردهبندي عبارتست از فرآيند يافتن يك مدل (يا تابع) جهت توصيف و تميز ردهها يا مفاهيم، با اين هدف كه به كمك اين مدل بتوان به پيشگويي ردهي مربوط به اشيائي پرداخت كه برچسب ردهبندي آنها نامشخص است. مدل بدست آمده بر اساس تحليل مجموعهاي از دادههاي آموزشدهنده (يعني اشياء دادهاي كه برچسب ردهبندي آنها مشخص است) میباشد. جهت نمايش مدل استخراج شده، شكلهاي گوناگوني را ميتوان مورد توجه قرار داد كه از آن جمله قوانين ردهبندي (IF-THEN)، درختهاي تصميم، فرمولهاي رياضي يا شبكههاي عصبي را ميتوان ذكر كرد. درخت تصميم يك ساختار درختي شبيه نمودار گردش كار[2]است كه برگهاي آن نشان دهندهي ردهها يا توزيعهاي ردهاي ميباشند و با شروع از ریشهی درخت و عبور از گرههای میانی، با رسیدن به برگها تخمینی از ردهی مورد جستجو به دست میآید. درختهاي تصميم را ميتوان به راحتي به قوانين ردهبندي تبديل كرد. يك شبكهي عصبي، هنگامي كه براي ردهبندي استفاده ميشود، نوعاً مجموعهاي است
از واحدهاي پردازشي شبيه به سلولهاي عصبي و داراي اتصالات وزندار بين واحدها. روشهاي بسيار ديگري نيز براي ساختن مدلهاي ردهبندي وجود دارد، مانند ردهبندي بيزي ساده[3]، ماشينهاي برداري پشتيباني و ردهبندي از نوع kتا نزديكترين همسايه.
در حاليكه در عمليات ردهبندي، برچسبهاي (گسسته و غيرترتيبي) مربوط به ردهها پيشبيني ميشود، در روشهاي پيشگويانه، توابع داراي مقادير پيوسته مدل ميشوند؛ يعني در اينجا به جاي برچسب ردهها، اين مقادير عددي دادههاست كه پيشبيني ميشود.
تحليل رگرسيون[4]نوعي روش آماري است كه اغلب براي پيشگويي عددي مورد استفاده قرار ميگيرد، هرچند ساير روشها نيز همچنان موجودند. در روشهاي پيشگويانه همچنين شناسايي روندهاي توزيعي بر اساس دادههاي موجود نيز انجام ميشود.
ممكن است قبل از ردهبندي و پيشگويي نياز به تحليل ارتباط[5]وجود داشته باشد، كه به منظور شناسايي صفاتي كه در فرآيند ردهبندي يا پيشگويي نقشي ندارند، انجام ميشود. آنگاه ميتوان چنين صفاتي را كنار گذاشت.
[1]prediction
[2]flowchart
[3]naïve Bayesian classification
[4]regression analysis
[5]relevance analysis
xtumwnvu viagra online HlQfd online cialis 4391 order quality cialis GOqzU viagra =-]