رشد روزافزون و انفجاری دادهها در عصر حاضر، پایگاههای داده را به عنوان جز لاینفکی در همهی زمینههای کامپیوتر قرار داده است. اما با این سیل عظیم اطلاعات و نیازهای گستردهی امروزی تنها نمیتوان به اطلاعات بازیابی شوندهای از بانکهای اطلاعاتی که تنها یک کپی از اطلاعات ذخیره شده در پایگاه داده هستند، دل، خوش کرد، بلکه باید راههایی برای استخراج دانش موجود در این دادهها پیدا کرد.
به این منظور پروسهی کشف دانش از پایگاه داده مطرح شد که یک پروسهی علمی برای شناسایی الگوهای معتبر، نوین، بالقوه مفید و قابل فهم از دادهها میباشد. مهمترین بخش این پروسه، کاوش دادهها میباشد که با استفاده از الگوریتمهای مشخصی یک سری الگوها را از پایگاه داده استخراج میکند.
در این پروژه هدف ما طراحی یک زبان سطح بالای انعطافپذیر برای دادهکاوی اطلاعات میباشد. این کار علاوه بر کمک به محققان این زمینه برای بررسی روشهای جدید و تست سریع و کارای الگوریتمهای کاوش، امکان استفاده از این روشها را به سادگی برای کسانی که اطلاعات اندکی در این زمینه دارند، را نیزفراهم میآورد.
پیادهسازی یک زبا ن دادهکاوی انعطافپذیر، با امکان در اختیار گذاشتن انواع روشهای موجود و امکان وارد کردن پارامترهای جدید، بدون وابستگی خاص به محیط و یا پلاتفرم دیگری و با سرعت اجرای قابلقبول، برای هرکسی که به اهمیت موضوع پی برده باشد، میتواند یک «شهر آرزوها» باشد.
تا کنون تلاشهای بسیاری به همین منظور صورت گرفته است. ولی متاسفانه هر کدام از این تلاشها دارای نقاط ضعف عمدهای میباشد که آنها را عملا برای بسیاری از موارد بلااستفاده ساخته است. مهمترین محصول تولیدی در این قسمت زبان DMQL میباشد، که بر روی محیط خاص DBMiner کار میکند.
همچنین تلاشهای پراکندهای در مورد کلی1 کردن الگوریتمها و یا تبدیل الگوریتمهای موجود به الگوریتمهای بر پایهی SQL انجام شده است، که از آنجمله میتوان به کلی کردن الگوریتمهای پیدا کردن قوانین وابستهسازی در دادهها یا الگوریتم EM اشاره نمود، که در بخش های بعدی مفصلا در مورد آنها صحبت خواهیم کرد.
در این رساله ابتدا در بخش دوم، پروسهی کشف دانش از پایگاه داده را به اجمال همراه با مراحل آن بررسی میکنیم و نگاهی هم به زبانهای دادهکاوی موجود میاندازیم. در بخش سوم انواع معماریهای ممکن برای این منظور را بررسی کرده و معماری مورد نظر خود را ارایه میدهیم. در بخش چهارم آمادهسازی دادهها را تا مرحلهای که بتوان الگوریتمها را بر روی آن اعمال کرد، توضیح داده و همچنین اعمالی را که ما برای این منظور در نظر گرفتهایم بیان میکنیم. بخشهای پنجم تا هفتم به بررسی سه دسته از روشهای اصلی در دادهکاوی، آنها را همراه با جزییات کامل مطالعه کرده و همچنین در هر قسمت، نحوهی پشتیبانی FlexQG را از این روشها بیان میکنیم. در بخش هشتم، توضیح و پیادهسازی الگوریتم کلی کاوش قوانین وابستهسازی، با استفاده از رهیافت SQL آمده است. بخش نهم نیز به توضیح و نحوهی پیادهسازی چارچوب2 کلی الگوریتمهای خوشهبندی تفکیکی (EM) ، بر پایهی SQL، میپردازد نهایتا در بخش آخر به نتیجهگیری کلی خواهیم پرداخت.
این مقاله به صورت ورد (docx ) می باشد و تعداد صفحات آن 117صفحه آماده پرینت می باشد
چیزی که این مقالات را متمایز کرده است آماده پرینت بودن مقالات می باشد تا خریدار از خرید خود راضی باشد
مقالات را با ورژن office2010 به بالا بازکنید
مقاله ویژگیهای KDDوداده ها