بکارگيري تکنيک هاي خوشه بندي و الگوريتم ژنتيک در بهينهسازي درختان تصميمگيری براي اعتبارسنجي مشتريان بانک ها

چکیده:
درختان تصمیمگیری به عنوان يکي از تکنيکهاي داده کاوي کاربرد زيادي در اعتبارسنجي مشتريان بانک و شناسايي آن ها براي اعطاي تسهيلات اعتباري دارد. مساله اصلي در پيچيدگي درختان تصمیمگیری ، اندازه بيش از حد، عدم انعطاف پذيري و دقت کم در طبقهبندي است. هدف از اين مقاله ارائه مدل ترکيبي در بهينهسازي درختان تصميم گيري توسط تکنيک الگوريتم ژنتيک به منظور حل مسائل ذکر شده در فوق براي اعتبارسنجي مشتريان بانک است.
به نظر مي رسد بتوان با انتخاب ويژگي هاي مناسب و ساخت درختان تصميمگيري توسط الگوريتم ژنتيک به کاهش پيچيدگي و افزايش انعطاف پذيري درختان تصميمگيري پرداخت. در مدل ترکيبي پيشنهادي ابتدا دادههاي اعتباري توسط تکنيک خوشه بندي SimpleKmeans به دو خوشه تقسيم ميشوند. سپس با استفاده از الگوريتم ژنتيک، پنج الگوريتم انتخاب ويژگي مبتني بر سه رويکرد فيلتر، Wrapper و طرح جاسازي شده بر پايه درخت تصميم گيري ژنتيکي، به انتخاب ويژگيهاي اعتبارسنجي مهم در مجموعه داده ميپردازند. در ادامه پنج درخت تصميمگيري مبتني بر الگوريتم C4.5 در هر خوشه با مجموعه ويژگيهاي منتخب ساخته ميشود.
بهترين درختان تصميمگيري در هر خوشه مبتني بر معيارهاي بهينگي مورد نظر در اين مقاله انتخاب شده و با هم ترکيب ميشوند تا درخت تصميمگيري نهايي براي اعتبارسنجي مشتريان بانک ايجاد شود. ابزار يادگيري ماشين وکا و نرم افزار GATree براي رسيدن به نتايج بکار گرفته شده است. نتايج پژوهش نشان ميدهد که استفاده از مدل ترکيبي پيشنهادي در ساخت درخت تصميمگيري منجر به افزايش دقت طبقهبندي نسبت به بسياري از الگوريتمهاي مقايسه شده در اين مقاله ميشود، ولي پيچيدگي الگوريتم مدل ترکيبي پيشنهادي از برخي الگوريتمهاي طبقهبندي مقايسه شده در اين مقاله بيشتر است.
واژگان کلیدی:
اعتبارسنجي، طبقهبندي، الگوريتم ژنتيک، درختان تصميمگيری ، انتخاب ويژگي، خوشهبندي
نویسندگان:
محمود البرزي، محمد خانبابايي، محمدابراهيم محمدپورزرندي
این مقاله را در لینک زیر میتوانید مشاهده نمایید:
http://jmfr.srbiau.ac.ir/article_5175_73f7d20b0b59d9a0c641395de6c451b4.pdf