Παρασκευή 15 Αυγούστου 2025

📊 Το Κριτήριο Χ²: Έλεγχος Διαφορών και Συσχετίσεων

Το κριτήριο Χ² (Chi-Square Test) είναι ένα από τα πιο χρήσιμα εργαλεία της στατιστικής, όταν θέλουμε να ελέγξουμε αν υπάρχει διαφορά ανάμεσα στα παρατηρούμενα δεδομένα και σε αυτά που περιμένουμε με βάση μια θεωρία ή μια υπόθεση.

🔹 Σε τι χρησιμεύει;

  1. Έλεγχος Προσαρμογής (Goodness of Fit)
    Μας δείχνει αν μια παρατηρούμενη κατανομή ταιριάζει με μια θεωρητική.

    • Παράδειγμα: Είναι ένα ζάρι «δίκαιο»; (περιμένουμε κάθε πλευρά να εμφανίζεται περίπου το ίδιο συχνά).

  2. Έλεγχος Ανεξαρτησίας (Test of Independence)
    Μας βοηθά να δούμε αν δύο κατηγορικές μεταβλητές σχετίζονται.

    • Παράδειγμα: Υπάρχει συσχέτιση ανάμεσα στο φύλο (άνδρας/γυναίκα) και την προτίμηση σε είδος ταινίας (δράση/ρομαντική);


🔹 Ο μαθηματικός τύπος

χ2=(OiEi)2Ei​

  • OiO_i: παρατηρούμενη συχνότητα (Observed Frequency)

  • EiE_i: αναμενόμενη συχνότητα (Expected Frequency)

Δηλαδή, μετράμε πόσο «μακριά» είναι τα δεδομένα μας από αυτά που θα περιμέναμε, και το συνολικό μέτρο αυτής της απόκλισης είναι το Χ².


🔹 Πώς δουλεύει στην πράξη;

  1. Διατυπώνουμε τις υποθέσεις:

    • H0H_0: Δεν υπάρχει διαφορά / Δεν υπάρχει σχέση.

    • H1H_1: Υπάρχει διαφορά / Υπάρχει σχέση.

  2. Υπολογίζουμε τις αναμενόμενες τιμές με βάση τη θεωρία ή τα ολικά δεδομένα.

  3. Εφαρμόζουμε τον τύπο και βρίσκουμε την τιμή Χ².

  4. Συγκρίνουμε με την κρίσιμη τιμή από τον πίνακα Χ² (ανάλογα με τους βαθμούς ελευθερίας).

    • Αν το Χ² είναι μικρό → αποδεχόμαστε το H0H_0.

    • Αν το Χ² είναι μεγάλο → απορρίπτουμε το H0H_0.


🔹 Παράδειγμα

Ρίχνουμε ένα ζάρι 60 φορές. Παρατηρούμε:

  • 1: 8, 2: 9, 3: 12, 4: 11, 5: 10, 6: 10

Αναμενόμενη συχνότητα: 10 για κάθε πλευρά.

Υπολογίζουμε:

χ2=(810)210+(910)210++(1010)210=1.0

Με 5 βαθμούς ελευθερίας, η κρίσιμη τιμή στο 5% είναι 11.07.
👉 Επειδή 1.0 < 11.07, δεν απορρίπτουμε το H0H_0 → το ζάρι φαίνεται δίκαιο. ✅


📌 Το κριτήριο Χ² είναι λοιπόν ένας απλός αλλά ισχυρός τρόπος να ελέγχουμε αν η πραγματικότητα ταιριάζει με τις προσδοκίες μας ή αν υπάρχει κάποια υποκρυπτόμενη σχέση στα δεδομένα μας.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου

>