پایان نامه الگوریتم و روش های خوشه بندی جریان داده

پایان نامه الگوریتم و روش های خوشه بندی جریان داده
مرکز دانشجویی ایران پـــایــان نــامه روش های خوشه بندی جریان داد روش های خوشه بندی جریان داده رایگان داده های جریانی می باشند.این پدیده که در فصل چهارم مطرح شده است,اشاره به حجم وسیعی از اطلاعات انباشته شده دارد.خوشه بندی جریانهای داده سیستم مدیریت آرشیو پروژه های فارغ سه نیاز اساسی یک الگوریتم خوشه بندی جریان داده ناشی از محدودیت فضا و زمان به شرح زیر است: در بخش بعدی چندین روش خوشه بندی جریان داده،از قبیل بررسی الگوریتم های خوشه بندی جریان های داده متنی سیستم مدیریت خوشه بندی یکی از مهم ترین روش های تجزیه و تحلیل جریان متن است. مسئله خوشه بندي جريان متن نسبت به خوشه بندي جريانهاي عددي در آغاز راه است پایان نامه روش های دسته بندی جریان داده مرجع رام ایران الگوریتم های خوشه بندی گوناگونی برای استخراج دانش از درون مجموعه اطلاعات مختلف وجود دارد.اما عموما مروری بر روش های خوشه بندی جریان داده تحلیل و بررسی الگوریتم های خوشه بندی داده های جریانی
پژوهشگاه علوم و در حالی که مسئله خوشه بندی مسئله دوشاری در زمینه جریان داده ها بشمار می رود به دلیل توانمندی روش های خوشه بندی در تولید خوشه های با کیفیت توسعه این الگوریتم ها صنعتی اميرکبير دانشکده مهندسی کامپيوتر و فناوری اطلاعات – طبقهبندی جريان دادهها با استفاده از يک روش خود روشهای دادهکاوی به سه دسته کلی تقسيم میشوند که عبارتند از خوشهبندی، طبقهبندی و کشف بررسی الگوریتم های خوشه بندی جریان داده متنی

الگوریتم خوشه بندی جریان داده

پایان نامه الگوریتم و روش های خوشه بندی جریان داده

دانلود فایل آماده پایان نامه الگوریتم و روش های خوشه بندی جریان داده با فرمت ورد و قابل پرینت.این پایان نامه در ۹۷ صفحه تنظیم شده است.

چکیده

حجم بزرگ داده ها به تنهایی به مدیران سازمان ها در تصمیم سازی و تصمیم گیری هیچ کمکی نمی کند، بلکه باعث سردرگمی مدیران سازمان ها نیز می شود.بنابراین مدیریت داده های خام و تبدیل داده های خارجی و داخلی سازمان به اطلاعات و دانش با استفاده از تکنیک های گوناگون،نقش اساسی و محوری دارد.از تکنیک های معروف در این زمینه داده کاوی است،که می تواند بر روی بانک اطلاعاتی انجام شود و دانش مورد نیاز را بدست آورد.در فصل اول به بررسی این مفهوم پرداختیم. کاوش خوشه ها نیز یکی از تکنیک های حائز اهمیت در زمینه رو به رشد،معروف به داده کاوی اکتشافی می باشد که در رشته های گوناگون مهندسی و علمی از قبیل زیست شناسی،روان شناسی،پزشکی،بازاریابی،کامپیوتر و نقشه برداری ماهواره ای به کار گرفته شده است.

این مفهوم در فصل های سوم و چهارم دنبال شده است.در فصل سوم به یکی از الگوریتم های خوشه بندی به نام CStree پرداخته شده و نقاط ضعف این الگوریتم نیز مطرح شده است .تحلیل خوشه ها،اطلاعات را بوسیله یک ساختار اساسی مختصر بدو شکل گروه بندی تنها یا گروه بندی سلسله مراتبی سازماندهی می نماید.خوشه بندی ،ابزاری برای اکتشاف ساختارهایی از درون داده هاست که نیاز به هیچ فرضی از آنها نیست.این روش در هوش مصنوعی و شناسایی الگو،یادگیری بدون ناظر نامیده می شود.

الگوریتم های خوشه بندی گوناگونی برای استخراج دانش از درون مجموعه اطلاعات مختلف وجود دارد.اما عموما این الگوریتم ها حساس به داده های مورد آزمایش و برخی پارامترهای اولیه می باشند،لذا نتایج حاصل از آنها وابسته به ساختار داده ها می باشد.تاکنون الگوریتمی ارائه نشده است که بتواند هر گونه ساختار داده ای را استخراج نماید. یکی دیگر از پدیده های نوظهور در دنیای اطلاعات،داده های جریانی می باشند.این پدیده که در فصل چهارم مطرح شده است،اشاره به حجم وسیعی از اطلاعات انباشته شده دارد که محدودیت های فراوانی برای پردازش ایجاد کرده اند.اندازه این داده ها بیش از حافظه اصلی،یکی از این موانع می باشد.لذا می بایست الگوریتم های جدیدی برای برخورد با این گونه داده ها توسعه یابند.

کلمات کلیدی: داده کاوی، دسته بندی، خوشه بندی، جریان داده

فهرست مطالب

تقديم به: ۳

تقدیر و تشکر. ۴

فصل اول مقدمه ای بر داده کاوی. ۱

۱-۱ مقدمه ۲

۱-۲عامل مسبب پیدایش داده کاوی. ۲

۱-۳داده کاوی و مفهوم اکتشاف دانش (K.D.D) 3

۱-۳-۱ تعریف داده کاوی. ۵

۲-۳-۱ فرایند داده‌کاوی. ۶

۱-۳-۳ قابلیتهای داده کاوی. ۷

۴-۳-۱ چه نوع داده‌هایی مورد کاوش قرار می گیرند؟ ۸

۴-۱ وظایف داده کاوی. ۹

۱-۴-۱ کلاس بندی. ۱۰

۲-۴-۱ مراحل یک الگوریتم کلاس‌بندی. ۱۱

۳-۴-۱ انواع روش‌های کلاس‌بندی. ۱۱

۱-۳-۴-۱ درخت تصمیم. ۱۲

۱-۱-۳-۴-۱ کشف تقسیمات.. ۱۳

۲-۱-۳-۴-۱ دسته بندی با درخت تصمیم. ۱۵

۳-۱-۳-۴-۱ انواع درخت‌های تصمیم. ۱۷

۴-۱-۳-۴-۱ نحوه‌ی هرس کردن درخت.. ۱۷

۲-۳-۴-۱ بیزی. ۱۸

۱-۲-۳-۴-۱ تئوری بیز. ۲۰

۲-۲-۳-۴-۱ دسته بندی ساده بیزی. ۲۲

۴-۴-۱ ارزیابی روش‌های کلاس‌بندی. ۲۸

۴-۱-۶ انواع روش‌های پیش بینی. ۲۹

۱-۴-۶-۱ رگرسیون. ۲۹

۱-۴-۶-۱-۱ رگرسیون خطی. ۲۹

۱-۴-۶-۱-۲ رگرسیون منطقی. ۳۱

۱-۴-۷ تخمین. ۳۲

فصل دوم خوشه بندی. ۳۴

۲ ۱-تعریف فرایند خوشه‌بندی. ۳۵

۲-۲ روش ها و الگوریتم‌های خوشه‌بندی. ۳۶

۲-۳ روش و الگوریتم سلسله مراتبی. ۳۷

۲ ۳-۱-روش های سلسله‌مراتبی. ۳۷

۲ ۳-۲-الگوریتم های سلسله مراتبی. ۳۸

۲-۳-۳- الگوریتم خوشه بندی single-linkage. 39

۲ ۳-۴-الگوریتم‌های تفکیک… ۴۵

۳-۵-۲روش‌های متکی برچگالی. ۴۶

۳-۷-۲ روش‌‌های متکی بر مدل. ۴۷

فصل سوم خوشه بندی CS tree. 48

۳-۱مقدمه ۴۹

۳-۲ مروری بر روش های خوشه بندی جریان داده ۵۰

۳-۳ خوشه بندی توری جریان داده ۵۲

۳-۱-۳ مروری بر روش خوشه بندی توری CS tree. 53

۳-۲- ۳ بررسی نقاط ضعف الگوریتم CS tree. 56

۳-۴ الگوریتم پیشنهادی. ۶۰

۳-۱-۴ بازتعریف مفهوم همسایگی و رفع مشکل تقسیم بی معنی خوشه ها ۶۳

۳-۵ اصلاح روند بروز رسانی خوشه ها ۶۶

۳-۶ اصلاح ساختار نمایش خوشه ها ۶۷

فصل چهارم جریان داده و مدل های ان. ۶۹

۴-۱ مقدمه ۷۰

۴-۲ کاربردهای داده های جریانی. ۷۱

۴-۲-۱ شبکه های حسگر. ۷۱

۴-۲-۲ تحلیل ترافیک شبکه ۷۲

۴-۲-۳ محرک های مالی. ۷۳

۴-۲-۴ تحلیل تراکنش ها ۷۳

۴-۳ مدل داده های جریانی. ۷۴

۴-۴ زیربنای نظری. ۷۵

۴-۴-۱ تکنیک های مبتنی بر داده ۷۶

۴-۴-۱-۱ نمونه برداری. ۷۶

۴-۴-۱-۲ پراکنده ساختن بار ۷۷

۴-۴-۱-۳ طراحی اولیه ۷۷

۴-۴-۱-۴ ساختمان داده خلاصه ۷۸

۴-۴-۱-۵ انبوه سازی. ۷۸

۴-۴-۲ تکنیک های مبتنی بر وظیفه ۷۸

۴-۴-۲-۱ الگوریتم های تخمین. ۷۹

۴-۴-۲-۲ الگوریتم های مبتنی بر پنجره ۷۹

۴-۴-۲-۳ الگوریتم های دانه دانه سازی نتایج. ۸۰

۴-۵ خوشه بندی داده های جریانی. ۸۰

۴-۵-۱ بهبود روش های سنتی. ۸۱

۴-۵-۱-۱ الگوریتم CLARANS. 82

۴-۵-۱-۲ الگوریتم BIRCH.. 84

۴-۵-۲ ظهور تکنیک های جدید. ۸۷

۴-۵-۲-۱ الگوریتم مبتنی بر چگالی DBSCAN.. 87

۴-۵-۲-۲ الگوریتم مبتنی بر گریدSTING.. 90

۴-۶ بحث در مورد الگوریتم ها ۹۳

۴-۶-۱ ایا توسعه روش های سنتی درست است؟ ۹۳

۴-۶-۲ روش های جدید چه پیشنهاداتی دارند؟ ۹۴

منابع. ۹۶

فهرست اشکال

شکل ۱-۱ فرآینده داده کاوی.. ۷

شکل۱-۲ نمونه یک درخت تصمیم.. ۱۳

شکل ۱-۳ یک تقسیم بندی خوب ، درجه خلوص را برای فرزندان افزایش می دهد. ۱۵

شکل ۳-۱ تقسیم خوشه های با معنی به زیر خوشه های بی معنی.. ۵۸

شکل۳-۲ خطاهای روش Cs tree در ترکیب خوشه های یک بعدی و ایجاد خوشه های چند بعدی- قسمت A خطا در تعداد خوشه ها ، قسمت B خطا در شکل خوشه ها، قسمت C خطا در مرز خوشه ها ۵۹

شکل۳ -۳ روی هم افتادگی خوشه ها در بروز رسانی به روش Cs tree. 60

شکل ۴-۲ الگوریتم خوشه بندی CLARA.. 82

شکل ۴-۳ الگوریتم خوشه بندی CLARANS . 84

شکل ۴-۴ الگوریتم خوشه بندی BIRCH.. 86

شکل ۴-۶ الگوریتم خوشه بندی.STING.. 92

تعداد صفحات نوع فایل قیمت
97 WORD 8,900 تومان

پایان نامه الگوریتم و روش های خوشه بندی جریان داده



لینک دانلود فایل خریداری شده بلافاصله بعد از پرداخت نمایش داده می شود.
اشتراک در
اطلاع از

0 Comments
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها