تعداد نشریات | 418 |
تعداد شمارهها | 9,997 |
تعداد مقالات | 83,560 |
تعداد مشاهده مقاله | 77,801,377 |
تعداد دریافت فایل اصل مقاله | 54,843,984 |
طبقه بندی داده های نامتعادل با ترکیب منحنی اصلی و smote بهبود یافته درجه پشتیبان | ||
مجله فناوری اطلاعات در طراحی مهندسی | ||
مقاله 4، دوره 10، شماره 2، اسفند 1396، صفحه 42-54 اصل مقاله (556.71 K) | ||
نوع مقاله: مقاله پژوهشی | ||
نویسندگان | ||
ریحانه کمال پور* ؛ عادل قاضی خانی | ||
گروه مهندسی کامپیوتر، دانشگاه بین المللی امام رضا (ع)، مشهد، ایران | ||
چکیده | ||
مسئله طبقهبندی دادههای نامتعادل بهعنوان یکی از چالشهای اصلی در حوزه دادهکاوی است. در مجموعه دادههای نامتعادل، تعداد نمونهها در کلاسهای گوناگون اختلاف بسیاری دارند. در دادههای نامتعادل هدف اصلی شناسایی صحیح نمونههای کلاس اقلیت است. بهعنوان مثال در حوزهیپزشکی، تعداد نمونههای مثبت از یک بیماری در مقابل تعداد نمونههای منفی بسیار کمتر است. در حالیکه برای این مسئله ارائه ،SdCurveSmote اهمیت شناسایی نمونههای مربوط به دسته مثبت، بسیار زیاد است. در این مقاله الگوریتمی بانام شده است. این الگوریتم شامل سه بخش کلی است بخش اول محاسبه پارامتری بنام درجه پشتیبانی برای انتخاب نمونههای مناسب بر روی این نمونههای مناسب با درجه پشتیبان بالا و تولید نمونه جدید است Smote و بخش دوم انجام عمل Smote مرزی برای عمل و در بخش آخر محاسبات منحنی اصلی وحدآستانه و بررسی نمونههای تولید شده میباشد. در این مقاله از 5 مجموعه داده نامتعادل، استفاده شده است که میزان عدم تعادل متفاوت دارند. الگوریتم پیشنهادی نسبت به الگوریتمهای مشابه، KEEL و UCI برگرفته از سایت نشان میدهد که در آن تفاوت معنادار بسیار مطلوبی بین Adaboost با آزمون فریدمن نتایج بهتری داشت در این آزمون برای طبقه بند وجود دارد. SdSmote و Smote روش پیشنهادی و روشهای | ||
کلیدواژهها | ||
طبقه بندی؛ داده های نامتعادل؛ نمونه افزایی؛ منحنی اصلی؛ حد آستانه عضویت | ||
آمار تعداد مشاهده مقاله: 400 تعداد دریافت فایل اصل مقاله: 816 |