شناسایی عوامل اثرگذار و ضریب تاثیر آنها در سود و زیان بیمه شخص ثالث خودرو شرکتهای بیمه با داده کاوی
دسته بندي :
کالاهای دیجیتال »
رشته کامپیوتر و IT (آموزش_و_پژوهش)
عنوان : ارائه مدلی برای شناسایی عوامل اثرگذار و ضریب تاثیر آنها در سود و زیان بیمه شخص ثالث خودرو شرکتهای بیمه بوسیله روشهای داده کاوی مطالعه موردی شرکت سهامی بیمه ایران
تعداد صفحات :106
فرمت : ورد قابل ویرایش
چکیده
بررسی اطلاعات بیمه های اتومبیل نشان داده عواملی چون نوع استفاده خودرو، داشتن گواهینامه رانندگی، نوع گواهینامه و تطابق یا عدم تطابق آن با وسیله نقلیه، مبلغ حق بیمه، میزان تعهدات بیمه نامه، کیفیت خودروی خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بیمه با مورد بیمه، تاخیردرتمدید بیمه نامه، در سود و زیان شرکت های بیمه تاثیر داشته اند.
هدف این پروژه شناخت عوامل اثرگذار و ضریب تاثیر آنها در سود و زیان بیمه شخص ثالث خودرو شرکت های بیمه با استفاده از روش داده کاوی و سپس انتخاب الگوریتمی که بهترین میزان دقت پیش بینی برای تشخیص این عوامل را داشته اند می باشد.
نتیجه حاصل از این پژوهش نشان می دهد که روشهای داده کاوی با استفاده از الگوریتم های دسته بندی با دقت بالای 91% و الگوریتم های درخت تصمیم با دقت بالای 96% و الگوریتم های خوشه بندی با ایجاد خوشه های قابل قبول قادر به ارائه مدلی برای تشخیص عوامل اثرگذار و تعیین میزان اثر آنها در سود و زیان بیمه نامه شخص ثالث خودرو خواهند بود.
فصل اول: مقدمه
1-1 تعریف داده کاوی
1-2 تعریف بیمه
1-3 هدف پروژه
1-4 مراحل انجام تحقیق
1-5 ساختار پروژه
فصل دوم: ادبیات موضوع و تحقیقات پیشین
2-1 داده کاوی و یادگیری ماشین
2-2 ابزارها و تکنیک های داده کاوی
2-3 روشهای داده کاوی
2-3-1 روشهای توصیف داده ها
2-3-2 روشهای تجزیه و تحلیل وابستگی
2-3-3 روشهای دسته بندی و پیشگویی
2-3-4 درخت تصمیم
2-3-5 شبکه عصبی
2-3-6 استدلال مبتنی بر حافظه
2-3-7 ماشین های بردار پشتیبانی
2-3-8 روشهای خوشه بندی
2-3-9 روش K-Means
2-3-10 شبکه کوهنن
2-3-11 روش دو گام
2-3-12 روشهای تجزیه و تحلیل نویز
2-4 دسته های نامتعادل صنیعی آباده 1391
2-4-1 راهکار مبتنی بر معیار
2-4-2 راهکار مبتنی بر نمونه برداری
2-5 پیشینه تحقیق
2-6 خلاصه فصل
فصل سوم: شرح پژوهش
3-1 انتخاب نرم افزار
3-1-1 Rapidminer
3-1-2 مقایسه RapidMiner با سایر نرم افزار های مشابه
3-2 داده ها
3-2-1 انتخاب داده
3-2-2 فیلدهای مجموعه داده صدور
3-2-3 کاهش ابعاد
3-2-4 فیلدهای مجموعه داده خسارت
3-2-5 پاکسازی داده ها
3-2-6 رسیدگی به داده های از دست رفته
3-2-7 کشف داده دور افتاده
3-2-8 انبوهش داده
3-2-9 ایجاد ویژگی دسته
3-2-10 تبدیل داده
3-2-11 انتقال داده به محیط داده کاوی
3-2-12 انواع داده تعیین شده
3-2-13 عملیات انتخاب ویژگیهای موثرتر
3-3 نتایج اعمال الگوریتم PCA و الگوریتم های وزن دهی
3-4 ویژگی های منتخب جهت استفاده در الگوریتمهای حساس به تعداد ویژگی
3-5 معیارهای ارزیابی الگوریتمهای دسته بندی
3-6 ماتریس درهم ریختگی
3-7 معیار AUC
3-8 روشهای ارزیابی الگوریتم های دسته بندی
3-8-1 روش Holdout
3-8-2 روش Random Subsampling
3-8-3 روش Cross-Validation
3-8-4 روش Bootstrap
3-9 الگوریتمهای دسته بندی
3-9-1 الگوریتم KNN
3-9-2 الگوریتم Naïve Bayes
3-9-3 الگوریتم Neural Network
3-9-4 الگوریتم SVM خطی
3-9-5 الگوریتم رگرسیون لجستیک
3-9-6 الگوریتم Meta Decision Tree
3-9-7 الگوریتم درخت Wj48
3-9-8 الگوریتم درخت Random forest
3-10 معیارهای ارزیابی الگوریتم های مبتنی بر قانون(کشف قوانین انجمنی)
3-10-1 الگوریتم FPgrowth
3-10-2 الگوریتم Weka Apriori
3-11 معیارهای ارزیابی الگوریتمهای خوشه بندی
3-12 الگوریتم های خوشه بندی
3-12-1 الگوریتم K-Means
3-12-2 الگوریتم Kohonen
3-12-3 الگوریتم دوگامی
فصل چهارم: ارزیابی و نتیجه گیری
4-1 مقایسه نتایج
4-2 الگوریتمهای دسته بندی
4-3 الگوریتم های دسته بندی درخت تصمیم
4-4 الگوریتم های خوشه بندی
4-5 الگوریتم های قواعد تلازمی(مبتنی بر قانون)
4-6 پیشنهادات به شرکت های بیمه
4-7 پیشنهادات جهت ادامه کار
منابع و مأخذ
فهرست منابع فارسی
فهرست منابع انگلیسی
دارای فهرست جداول و اشکال می باشد
گرایش : نرم افزار
عنوان : ارائه مدلی برای شناسایی عوامل اثرگذار و ضریب تاثیر آنها در سود و زیان بیمه شخص ثالث خودرو شرکتهای بیمه بوسیله روشهای داده کاوی مطالعه موردی شرکت سهامی بیمه ایران
تعداد صفحات : 106