วันอังคารที่ 17 มกราคม พ.ศ. 2555

เรื่องของ GINI

     ในการทำ CART นั้นจะใช้วิธีทาง GINI เพื่อวัดค่า ความไม่บริสุทธิ์ เพื่อเอาไว้เลือกตัวแปรและแอทริบิวในการสรา้งต้นไม้ตัดสินใจแบบ regression tree หรือ classification tree แล้วจึงนำไปสรา้งเป็น predictive model ต่อไป

      เมื่อมองมาในทางสังคมโลกปัจจุบันที่กำลังดำเนินไปจะพบว่าค่า GINI ใช้วัดการกระจายตัวของประชากร เพื่อหาความแตกต่างระหว่างรายได้ของกลุ่มประชากร ซึ่ง GDP ไม่สามารถบ่งบอกได้
ดังนั้น เวลาจะวัดความกินดีอยู่ดีก็ควรดูทั้ง GDP ต่อหัว และ Gini Index ประกอบกัน จะได้ภาพที่สมบูรณ์ขึ้น


REF:
P. N. Tan, M. Steinbach, and V. Kumar.  Introduction to Data Mining, Pearson International Edition

ไม่มีความคิดเห็น:

แสดงความคิดเห็น