الگوریتم Apriori و FP-Growth در وب کاوی و متن کاوی پایگاه داده

الگوریتم Apriori و FP-Growth

الگوریتم Apriori و FP-Growth در وب کاوی و متن کاوی پایگاه داده در قالب ورد و قابل ویرایش و پرینت در ۹۰ صفحه.

چکیده:

در دو دهه قبل توانايي­های فنی بشر برای توليد و جمع­آوری داده‌ها به سرعت افزايش يافته است. عواملی نظير استفاده گسترده از بارکد برای توليدات تجاری، به خدمت گرفتن کامپيوتر در کسب­و­کار، علوم، خدمات­ دولتی و پيشرفت در وسائل جمع­آوری داده، از اسکن کردن متون و تصاوير تا سيستمهای سنجش از دور ماهواره­ای، در اين تغييرات نقش مهمی دارند.

بطور کلی استفاده همگانی از وب و اينترنت به عنوان يک سيستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات می‌کند. اين رشد انفجاری در داده‌های ذخيره شده، نياز مبرم وجود تکنولوژی­های جديد و ابزارهای خودکاری را ايجاد کرده که به صورت هوشمند به انسان ياری رسانند تا اين حجم زياد داده را به اطلاعات و دانش تبديل کند. داده­کاوی به عنوان يک راه حل برای اين مسائل مطرح مي باشد. در يک تعريف غير رسمی داده­کاوی فرآيندی است، خودکار برای استخراج الگوهايی که دانش را بازنمايی مي­کنند، که اين دانش به صورت ضمنی در پايگاه داده­های عظيم، انباره­داده[۱] و ديگر مخازن بزرگ اطلاعات، ذخيره شده است.

به لحاظ اینکه در چند سال اخیر مبحث داده­کاوی و اکتشاف دانش موضوع بسیاری از مقالات و کنفرانسها قرار گرفته و نرم­افزار­های آن در بازار به شدت مورد توجه قرار گرفته، از اینرو در مقاله سعی بر آن شده تا گذری بر آن داشته باشیم.

در این مقاله درفصل مروری بر داده­کاوی خواهیم داشت . که به طور عمده به تاریخچه ، تعاریف، کاربردها وارتباط آن با انبار داده و OLAP خواهیم پرداخت. در پایان فصل مراحل فرایند کشف دانش از پایگاه داده­ها را ذکر کردیم که داده­کاوی یکی از مراحل آن است.

در فصل ۲ یکی از شیوه­های داده­کاوی که از سبد خرید گرفته شده­ است توضیح داده شده است . در این فصل به شرح قوانین ارتباطی خواهیم پرداخت که در آن بعد از دسته­بندی الگوریتمها ، الگوریتم Apriori ( که یک الگوریتم پایه در این زمینه است ) و الگوریتم FP-Growth ( یک الگوریتم جدید میباشد) را با شرح یک مثال توضیح می­دهیم و در آخر آن دو را با هم مقایسه می­کنیم .

در فصل ۳ مباحث وب­کاوی و متن­کاوی را که در بسیاری از مراجع جزء کاربردهای داده­کاوی به حساب می­آید شرح داده خواهد شد.

فهرست اشکال … ۱۰

فهرست جداول .. ۱۱

فصل۱: مقدمه¬ای بر داده¬کاوی ……………. ۱۳

۱-۱ تعریف داده¬کاوی ……….. ۱۵

۲-۱ تاریخچه داده¬کاوی …….. ۱۶

۳-۱ چه چیزی سبب پیدایش داده¬کاوی شده است؟ …….. ۱۷

۴-۱ اجزای سیستم داده¬کاوی . ۱۹

۵-۱ جایگاه داده¬کاوی در میان علوم مختلف ……………… ۲۱

۶-۱ قابلیتهای داده¬کاوی ……… ۲۲

۷-۱ چرا به داده¬کاوی نیاز داریم؟ …………… ۲۳

۸-۱ داده¬کاوی چه کارهایی نمی¬تواند انجام دهد؟ ………. ۲۵

۹-۱ کاربردهای داده¬کاوی ….. ۲۵

۱-۹-۱ کاربردهای پیش¬بینی¬کننده ………………. ۲۷

۲-۹-۱ کاربردهای توصیف¬کننده ۲۷

۱۰-۱ ابزارهای تجاری داده¬کاوی …………… ۲۸

۱۱-۱ داده¬کاوی و انبار¬داده¬ها . ۲۹

۱-۱۱-۱ تعاریف انبار¬داده ………… ۲۹

۲-۱۱-۱ چهار خصوصیت اصلی انبار¬داده ……… ۳۰

۳-۱۱-۱ موارد تفاوت انبار¬داده و پایگاه¬ داده …. ۳۱

۱۲-۱ داده¬کاوی و OLAP … 33

۱-۱۲-۱ OLAP … 33

۲-۱۲-۱ انواع OLAP …………… 34

۱۳-۱ مراحل فرایند کشف دانش از پایگاه داده¬ها ……….. ۳۴

۱-۱۳-۱ انبارش داده¬ها ……………. ۳۵

۲-۱۳-۱ انتخاب داده¬ها ……………. ۳۶

۳-۱۳-۱ پاکسازی- پیش¬پردازش- آماده¬سازی ۳۶

۴-۱۳-۱ تبدیل داده¬ها ……………… ۳۶

۵-۱۳-۱ کاوش در داده¬ها (Data Mining) . 37

۶-۱۳-۱ تفسیر نتیجه ۳۸

فصل ۲: قوانین ارتباطی …………… ۳۹

۱-۲ قوانین ارتباطی ……………. ۴۰

۲-۲ اصول پایه … ۴۱

۱-۲-۲ شرح مشکل جدی ……….. ۴۱

۲-۲-۲ پیمایش فضای جستجو ….. ۴۳

۳-۲-۲ مشخص کردن درجه حمایت مجموعه اقلام …………. ۴۵

۳-۲ الگوریتمهای عمومی …… ۴۵

۱-۳-۲ دسته¬بندی …. ۴۵

۲-۳-۲ BFS و شمارش رویداد¬ها ………………. ۴۶

۳-۳-۲ BFS و دونیم¬سازی TID-list ……….. 47

۴-۳-۲ DFS و شمارش رویداد .. ۴۷

۵-۳-۲ DFS و دو نیم¬سازی TID-list ………. 48

۴-۲ الگوریتم Apriori …….. 48

۱-۴-۲ مفاهیم کلیدی …………….. ۴۸

۲-۴-۲ پیاده¬سازی الگوریتم Apriori ………… 49

۳-۴-۲ معایب Apriori و رفع آنها …………….. ۵۴

۵-۲ الگوریتم رشد الگوی تکرارشونده …… ۵۵

۱-۵-۲ چرا رشد الگوی تکرار سریع است؟ ….. ۵۸

۶-۲ مقایسه دو الگوریتم Apriori و FP-growth …… 59

۷-۲ تحلیل ارتباطات ………….. ۶۳

فصل ۳: وب¬کاوی و متن¬کاوی ….. ۶۵

۱-۳ وب¬کاوی … ۶۶

۱-۱-۳ الگوریتمهای هیتس و لاگسام …………… ۶۹

۲-۱-۳ کاوش الگوهای پیمایش مسیر ………….. ۷۶

۲-۳ متن¬کاوی … ۸۰

۱-۲-۳ کاربردهای متن¬کاوی ……. ۸۲

۱-۱-۲-۳ جستجو و بازیابی ………….. ۸۳

۲-۱-۲-۳ گروه¬بندی و طبقه¬بندی …… ۸۳

۳-۱-۲-۳ خلاصه¬سازی ۸۴

۴-۱-۲-۳ روابط میان مفاهیم …………. ۸۴

۵-۱-۲-۳ یافتن و تحلیل گرایشات …. ۸۴

۶-۱-۲-۳ برچسب زدن نحوی (pos) ………………. 85

۷-۱-۲-۳ ایجاد Thesaurus و آنتولوژی به صورت اتوماتیک . ۸۵

۲-۲-۳ فرایند متن¬کاوی …………… ۸۶

۳-۲-۳ روشهای متن¬کاوی ……….. ۸۷

مراجع . ۸۹

برای دانلود این پروژه از لینک زیر اقدام به خرید نمایید.بعد از پرداخت مبلغ بلافاصله فایل را دریافت کنید.

تعداد صفحات نوع فایل قیمت
90 WORD 7,900 تومان

الگوریتم Apriori و FP-Growth در وب کاوی و متن کاوی پایگاه داده



لینک دانلود فایل خریداری شده بلافاصله بعد از پرداخت نمایش داده می شود.
اشتراک در
اطلاع از

0 Comments
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها