เมื่อมีข้อมูลของตัวแปรสองตัวที่วัดค่าเป็นตัวเลข ซึ่งเรียกว่า ข้อมูลเชิงปริมาณ สิ่งที่น่าสนใจจากข้อมูลนี้ ได้แก่
ตัวแปรทั้งสองเกี่ยวข้องกันหรือไม่
ระดับความสัมพันธ์ของตัวแปรมีมากน้อยเพียงใด
ความสัมพันธ์ของตัวแปรอยู่ในรูปแบบใด
จะคาดคะเนค่าตัวแปรหนึ่งจากอีกตัวแปรได้หรือไม่
เพื่อความสะดวกในการตอบคำถามต่าง ๆ ข้างต้น จะกำหนดให้ตัวแปรหนึ่งเป็น x และอีกตัวแปรเป็น y ตัวอย่างเช่น การสมัครเข้าศึกษาต่อระดับปริญญาโทสาขาวิชาบริหารธุรกิจในหลาย ๆ สถาบัน มักมีข้อกำหนดว่า ผู้สมัครต้องมีคะแนนจากผลการสอบ GMAT (Graduate Management Attitude Test) ประกอบการสมัครด้วย คะแนน GMAT เป็นตัวที่ใช้วัดความรู้ความสามารถของผู้สมัครอย่างหนึ่ง จึงต้องการทราบว่า ผลการเรียนของผู้สมัคร (GPA) ในระดับปริญญาตรีมีความสัมพันธ์กับคะแนน GMAT หรือไม่ หรือจะคาดคะเนคะแนน GMAT จาก GPA ของผู้สมัครได้หรือไม่ ฉะนั้นอาจกำหนดตัวแปร x คือ GPA และตัวแปร y คือ GMAT สมมติเราสังเกตค่าข้อมูลของ x และ y จากผู้สมัครเรียนจำนวน 36 คน ดังนั้นจึงมีคู่ลำดับของค่าสังเกต (x, y) จากผู้สมัครแต่ละคน นั่นคือจะมีค่าสังเกต (x1, y1), (x2, y2),
, (x36, y36) เช่น ผู้สมัครคนหนึ่งมี GPA เป็น 2.68 และได้คะแนน GMAT 414 คะแนน ค่าสังเกตของผู้สมัครก็จะเป็น (2.68, 414) เป็นต้น ข้อมูลของผู้สมัครทั้ง 36 คนแสดงในตาราง
|