ارزیابی قابلیتهای ترکیب الگوریتمهای مجموعههای راف و ژنتیک برای دادهکاوی و استخراج قوانین مرتبط با آب مصرفی در شهر تهران | ||
| نشریه سنجش از دور و GIS ایران | ||
| مقاله 4، دوره 9، شماره 2، اسفند 1396، صفحه 61-78 اصل مقاله (4.97 M) | ||
| نوع مقاله: علمی - پژوهشی | ||
| نویسندگان | ||
| عباس علیمحمدی2؛ جلال کرمی3؛ | ||
| 1کارشناس ارشد GIS و سنجش از دور، دانشگاه تربیت مدرس | ||
| 2دانشیار گروه مهندسی GIS، دانشگاه صنعتی خواجه نصیرالدین طوسی | ||
| 3استادیار گروه سنجش از دور و GIS، دانشگاه تربیت مدرس | ||
| چکیده | ||
| مدیریت و برنامهریزی آب شهری، بهویژه در کلانشهرها، اهمیت بسیار زیادی دارد. توسعة مناطق شهری، تبدیل شهرها به کلانشهر و افزایش پیچیدگی عوامل تأثیرگذار در مصرف آب در شهرها سبب دشواری مدیریت مصرف، تأمین و توزیع آب شده است. بنابراین، استخراج قوانین نقش مهمی در کشف الگوهای حاکم بر مجموعة داده و کاهش پیچیدگیها دارد. اصل نظریة مجموعههای راف، که پائولاک در دهة 80 مطرح کرد، روشی توانمند و انعطافپذیر در پردازش دادههای دارای عدم قطعیت شمرده میشود و در این تحقیق، بهمنظور استخراج قوانین حاکم بر مصرف آب، بهکار رفته است. در این تحقیق، از روش ترکیب الگوریتمهای مجموعههای راف و ژنتیک از روشهای دادهکاوی، برای بهبود استخراج قوانین و طبقهبندی دادههای آب مصرفی، با کاربری مسکونی در شهر تهران بهمنزلة منطقة مورد مطالعه استفاده شده است. دادههای مورد استفاده در این تحقیق شامل دادههای اجتماعیـ اقتصادی، محیطی، اقلیمی و فنیـ مدیریتی میشوند. این دادهها به دو زیرمجموعه، شامل 60% با هدف آموزش و 40% بهقصد ارزیابی نتایج، تقسیم شدند. نتایج نشان میدهند که تلفیق الگوریتمهای ژنتیک و مجموعههای راف کارآیی بالاتری برای استخراج مؤثر قوانین از دادههای مصرف آب شهر تهران را دارند. دقت طبقهبندی مجموعه دادة آزمون، ازطریق قوانین استخراجشده از مجموعههای راف، 77% بود. پس از بهینهسازی قوانین با استفاده از الگوریتم ژنتیک در مجموعههای راف، دقت طبقهبندی در نسل ششم، با سرعت همگرایی متوسط، به 88% و در نسل دهم، به 92% افزایش یافت. براساس قوانین استخراجشده، عوامل مؤثر در مصرف سالیانة آب بهترتیب میزان تأثیرگذاری، جمعیت ساکن، آببها، تراکم جمعیت در واحد سطح، بعد خانوار، موقعیت مکانی (عرض جغرافیایی)، تحصیلات ساکنان و سرانة فضای سبز بهشمار میروند. | ||
| کلیدواژهها | ||
| استخراج قوانین؛ مجموعة راف؛ الگوریتم ژنتیک؛ دادهکاوی مکانی | ||
| عنوان مقاله [English] | ||
| Evaluation of the Capabilities of Integration of Rough Sets and Genetic Algorithms for Data Mining and Rule Extraction in Domestic Water Usage in Tehran City | ||
| نویسندگان [English] | ||
| A Alimohammadi2؛ J Karami3؛ | ||
| 1M.Sc. of GIS & Remote Sensing, Tarbiat Modares University, Tehran | ||
| 2Associate Prof., Department of GIS Engineering, Faculty of Geodesy & Geomatic Engineering, K.N.Toosi University of Tech, Tehran | ||
| 3Assistant Prof., Department of GIS & RS, Tarbiat Modares University, Tehran | ||
| چکیده [English] | ||
| Management and planning of urban water supply in metropolis is very important. Development of the region urban and make cities to metropolis and increase of effective complex factor on water usage in the cities make consumption management and supply and distribution Water difficult. So rule extraction plays an important role in exploring patterns over data and decreasing complex. Rough Set Algorithm, which was developed in 1980s by Pawlak, is a powerful and flexible method to deal with uncertain and ambiguous data which has been used in this research to extract dominant rules over data set. The method used in this paper is combination of the rough set and genetic algorithms from data mining methods to develop rule extraction and data classification of water usage in Tehran city as the studying area. Socio-economic, environmental, time and water consumption and management zones have been used as the explanatory variables for prediction of the water use that database divided to 2 part 60% for result extraction and 40% as test set. Independent test sets have been used for evaluation of the accuracy of the extracted rules. Results have shown that, combination of the genetic algorithms and Rough Set leads to extraction of more reliable rules. Classification accuracy of the extracted rules from Rough sets was 77 percent. But optimization of rules by combination of the genetic algorithm with Rough sets, resulted in classification accuracy of 88 percent in 6th generation with average speed of convergence. By using the same speed of convergence in the accuracy increased to 92 percent in 10th generation. According to the extracted rules, important effective factors on annual water consumption are respectively the resident population, water price, population density, family size, spatial location (latitude), education levels, and per capita green spaces. | ||
| کلیدواژهها [English] | ||
| Rule Extraction, Rough Set, Genetic algorithm, Spatial Data Mining | ||
| مراجع | ||
| ||
|
آمار تعداد مشاهده مقاله: 5,226 تعداد دریافت فایل اصل مقاله: 3,109 |
||
