چکیده:

درختان تصمیم‌گیری به عنوان يکي از تکنيک‌هاي داده کاوي کاربرد زيادي در اعتبارسنجي مشتريان بانک و شناسايي آن ها براي اعطاي تسهيلات اعتباري دارد. مساله اصلي در پيچيدگي درختان تصمیم‌گیری ، اندازه بيش از حد، عدم انعطاف پذيري و دقت کم در طبقه‌بندي است. هدف از اين مقاله ارائه مدل ترکيبي در بهينه‌سازي درختان تصميم گيري توسط تکنيک الگوريتم ژنتيک به منظور حل مسائل ذکر شده در فوق براي اعتبارسنجي مشتريان بانک است.

به نظر مي رسد بتوان با انتخاب ويژگي هاي مناسب و ساخت درختان تصميم‌گيري توسط الگوريتم ژنتيک به کاهش پيچيدگي و افزايش انعطاف پذيري درختان تصميم‌گيري پرداخت. در مدل ترکيبي پيشنهادي ابتدا داده‌هاي اعتباري توسط تکنيک خوشه بندي SimpleKmeans به دو خوشه تقسيم مي‌شوند. سپس با استفاده از الگوريتم ژنتيک، پنج الگوريتم انتخاب ويژگي مبتني بر سه رويکرد فيلتر، Wrapper و طرح جاسازي شده بر پايه درخت تصميم گيري ژنتيکي، به انتخاب ويژگي‌هاي اعتبارسنجي مهم در مجموعه داده مي‌پردازند. در ادامه پنج درخت تصميم‌گيري مبتني بر الگوريتم C4.5 در هر خوشه با مجموعه ويژگي‌هاي منتخب ساخته مي‌شود.

بهترين درختان تصميم‌گيري در هر خوشه مبتني بر معيارهاي بهينگي مورد نظر در اين مقاله انتخاب شده و با هم ترکيب مي‌شوند تا درخت تصميم‌گيري نهايي براي اعتبارسنجي مشتريان بانک ايجاد شود. ابزار يادگيري ماشين وکا و نرم افزار GATree براي رسيدن به نتايج بکار گرفته شده است. نتايج پژوهش نشان مي‌دهد که استفاده از مدل ترکيبي پيشنهادي در ساخت درخت تصميم‌‌گيري منجر به افزايش دقت طبقه‌بندي نسبت به بسياري از الگوريتم‌هاي مقايسه شده در اين مقاله مي‌شود، ولي پيچيدگي الگوريتم مدل ترکيبي پيشنهادي از برخي الگوريتم‌هاي طبقه‌بندي مقايسه شده در اين مقاله بيشتر است.

واژگان کلیدی:

اعتبارسنجي، طبقه‌بندي، الگوريتم ژنتيک، درختان تصميم‌گيری ، انتخاب ويژگي، خوشه‌بندي

نویسندگان:

محمود البرزي، محمد خان‌بابايي، محمدابراهيم محمدپورزرندي

   

این مقاله را در لینک زیر میتوانید مشاهده نمایید:

http://jmfr.srbiau.ac.ir/article_5175_73f7d20b0b59d9a0c641395de6c451b4.pdf