ความสัมพันธ์ในข้อมูลสองตัวแปร

โดยทั่วไป ข้อมูลที่พบเห็นมักมีตัวแปรที่มากกว่าหนึ่งตัว ซึ่งตัวแปรเหล่านั้น อาจมีความเกี่ยวข้องสัมพันธ์กัน ตัวอย่างเช่น รถยนต์เมื่อมีอายุการใช้งานนานขึ้น ก็จะเสียค่าใช้จ่ายในการบำรุงรักษามากขึ้น นั่นคือ อายุการใช้งานและค่าใช้จ่ายในการบำรุงรักษามีความสัมพันธ์กัน หรือผลการเรียนของนิสิตสัมพันธ์หรือขึ้นอยู่กับสติปัญญาของนิสิต และเวลาที่นิสิตใช้ในการทบทวนบทเรียน ความรู้เรื่องความสัมพันธ์ในข้อมูลจะทำให้เข้าใจสิ่งต่าง ๆ ที่อยู่รอบตัวได้ดีขึ้น เช่น ทราบเหตุผลว่าทำไมนิสิตแต่ละคนมีผลการเรียนแปรผันแตกต่างกัน หรือทราบว่าค่าใช้จ่ายในการบำรุงรักษารถยนต์แปรผันตามอายุการใช้งานของรถคันนั้นอย่างไร

ดังนั้น จากหน่วยตัวอย่างแต่ละหน่วยที่สุ่มมา หากมีการสังเกตและจดบันทึกค่าของตัวแปรมาตั้งแต่ 2 ตัวแปรขึ้นไป ก็สามารถนำข้อมูลที่ได้มาศึกษาว่า ตัวแปรเหล่านั้นมีความเกี่ยวข้องสัมพันธ์กันหรือไม่ ถ้ามีระดับความสัมพันธ์ มีมากน้อยเพียงใด และลักษณะความสัมพันธ์เป็นแบบใด การที่ตัวแปรมีความสัมพันธ์กันหมายความว่า ความรู้เกี่ยวกับตัวแปรหนึ่งจะช่วยให้ทราบเรื่องราวเกี่ยวกับตัวแปรอื่นที่สัมพันธ์กันได้

ฉะนั้น ประโยชน์หนึ่งที่ได้จากการทราบความสัมพันธ์ระหว่างตัวแปร คือ จะสามารถทำนายค่าของตัวแปรหนึ่งที่สนใจ จากข้อมูลของตัวแปรอื่น ๆ เช่น สามารถคาดคะเนได้ว่า ค่าใช้จ่ายในการบำรุงรักษารถยนต์คันหนึ่งที่ใช้งานมาแล้ว 10 ปีเป็นเท่าใด ต่อไปจะกล่าวถึงความสัมพันธ์ เฉพาะกรณีที่มีตัวแปรเพียง 2 ตัว โดยพิจารณาแต่กรณีที่ทั้งสองตัวแปรมีค่าที่บอกถึงประเภทหรือกลุ่มนั้น คือ ข้อมูลเชิงคุณภาพ หรือข้อมูลจำแนกประเภท เช่น ความสัมพันธ์ระหว่างการสูบบุหรี่และการเป็นมะเร็งปอด และกรณีที่ตัวแปรทั้งคู่วัดค่าเป็นตัวเลข หรือข้อมูลเชิงปริมาณ เช่น ความสัมพันธ์ระหว่างผลผลิตและปริมาณปุ๋ยที่ใช้ ส่วนกรณีที่ตัวแปรหนึ่งเป็นตัวแปรที่บอกถึงการจำแนกประเภท และอีกตัวแปรวัดค่าเป็นตัวเลขจะไม่กล่าวถึง

สำหรับข้อมูลที่เป็นเชิงปริมาณล้วน ๆ ซึ่งอาจหาสมการแสดงความสัมพันธ์ระหว่างตัวแปร เพื่อใช้ประโยชน์ในการคาดคะเนค่าได้ เช่น สมการแสดงความสัมพันธ์ระหว่างน้ำหนักและความสูง ช่วยให้ทราบน้ำหนักตัวที่เหมาะสมสำหรับคนที่มีความสูงระดับต่าง ๆ เทคนิคการสร้างสมการนี้เรียกว่า การถดถอย

ความสัมพันธ์หนึ่งที่สำคัญมากคือเมื่อตัวแปรตัวหนึ่งเป็นเวลา และสนใจการเปลี่ยนแปลงของค่าตัวแปรอีกตัวเมื่อเวลาเปลี่ยนไป เรียกการเปลี่ยนแปลงตามเวลานี้ว่า แนวโน้ม ตัวอย่างที่พบมาก ได้แก่ แนวโน้มของข้อมูลทางเศรษฐกิจต่าง ๆ เช่น การขึ้นลงของดัชนีราคาตลาดหลักทรัพย์ อัตราดอกเบี้ย ปริมาณการส่งออกสินค้า เป็นต้น

ดังนั้น จะกล่าวถึงความสัมพันธ์ในข้อมูลของสองตัวแปร การสร้างสมการแสดงความสัมพันธ์และแนวโน้มอย่างง่าย ๆ เพื่อให้เกิดความเข้าใจและสามารถนำความรู้ไปประยุกต์ใช้ในชีวิตประจำวันต่อไป

ความสัมพันธ์ในข้อมูลสองตัวแปร

เมื่อสังเกตลักษณะสองลักษณะหรือสองตัวแปรจากแต่ละหน่วยตัวอย่าง การศึกษาข้อมูลของตัวแปรแต่ละตัวแยกกันจะไม่สามารถให้คำตอบเกี่ยวกับความสัมพันธ์ได้ แต่จำเป็นต้องนำข้อมูลของทั้งสองตัวแปรมาศึกษาพร้อมกันโดยการจัดระเบียบข้อมูล เพื่อให้เห็นความสัมพันธ์ได้ง่ายขึ้น ซึ่งอาจจัดระเบียบตารางหรือกราฟ ทั้งนี้ ขึ้นกับว่าข้อมูลนั้นเป็นข้อมูลเชิงคุณภาพหรือข้อมูลเชิงปริมาณ

ความสัมพันธ์ในข้อมูลเชิงคุณภาพ
ความสัมพันธ์ในข้อมูลเชิงปริมาณ
สัมประสิทธิ์สหสัมพันธ์
การถดถอยและการคาดคะเนค่า


ที่มา: เอกสารประกอบการสอน มหาวิทยาลัยเกษตรศาสตร์ 2542, วิชาบูรณาการ
หมวดการศึกษาทั่วไป รหัสวิชา 999211 คณิตศาสตร์และคอมพิวเตอร์ในชีวิตประจำวัน