ในการทำ CART นั้นจะใช้วิธีทาง GINI เพื่อวัดค่า ความไม่บริสุทธิ์ เพื่อเอาไว้เลือกตัวแปรและแอทริบิวในการสรา้งต้นไม้ตัดสินใจแบบ regression tree หรือ classification tree แล้วจึงนำไปสรา้งเป็น predictive model ต่อไป
เมื่อมองมาในทางสังคมโลกปัจจุบันที่กำลังดำเนินไปจะพบว่าค่า GINI ใช้วัดการกระจายตัวของประชากร เพื่อหาความแตกต่างระหว่างรายได้ของกลุ่มประชากร ซึ่ง GDP ไม่สามารถบ่งบอกได้
ดังนั้น เวลาจะวัดความกินดีอยู่ดีก็ควรดูทั้ง GDP ต่อหัว และ Gini Index ประกอบกัน จะได้ภาพที่สมบูรณ์ขึ้น
REF:
P. N. Tan, M. Steinbach, and V. Kumar. Introduction to Data Mining, Pearson International Edition
ไม่มีความคิดเห็น:
แสดงความคิดเห็น