EisatoponAI

Your Daily Experience of Math Adventures

Το Παράδοξο του Simpson: Όταν τα δεδομένα λένε ψέματα

Μπορεί κάτι να φαίνεται αληθινό σε κάθε επιμέρους περίπτωση, αλλά να είναι ψευδές συνολικά; Αυτό ακριβώς συμβαίνει στο Παράδοξο του Simpson — ένα από τα πιο ενδιαφέροντα και παραπλανητικά φαινόμενα της στατιστικής.

Εικαστική αναπαράσταση του Παραδόξου του Simpson: δύο γραφήματα που δείχνουν αντίθετες τάσεις όταν συνδυάζονται, συμβολίζοντας την παραπλάνηση από τα δεδομένα.

Η ιστορία πίσω από το παράδοξο

Ο μαθηματικός Edward Simpson περιέγραψε το 1951 ένα περίεργο φαινόμενο: όταν συγκεντρώνουμε δεδομένα από διαφορετικές ομάδες, η συνολική τάση μπορεί να αντιστραφεί.

Το ίδιο αποτέλεσμα είχε ήδη παρατηρηθεί σε διάφορα παραδείγματα, όπως σε αγώνες κρίκετ ή εξετάσεις φοιτητών. Το 1980, ο Alan Fekete δημοσίευσε στην «Parabola» το περίφημο άρθρο “Simpson’s Paradox, or the Bowler’s Competition”, δίνοντας απλά αλλά εντυπωσιακά παραδείγματα.

🎯 Παράδειγμα 1: Οι δύο παίκτες του κρίκετ

Δύο παίκτες, ο Smith και ο Jones, παίζουν σε δύο innings. Η απόδοση μετριέται από τον λόγο:

$$\text{Απόδοση} = \frac{\text{runs}}{\text{wickets}}$$

Στο πρώτο inning:

  • Smith: 5 για 60 → 1:12
  • Jones: 3 για 57 → 1:19

Ο Smith φαίνεται καλύτερος. Στο δεύτερο inning:

  • Smith: 1 για 18
  • Jones: 6 για 60

Ξανά, ο Smith είναι πιο αποδοτικός (λιγότερα runs ανά wicket). Όμως συνολικά:

Smith: 6 για 78 (1:13) και Jones: 9 για 117 (1:13)

Το αποτέλεσμα είναι ίδιο! Κανείς δεν είναι καλύτερος συνολικά, παρότι ο Smith ήταν ανώτερος σε κάθε ξεχωριστή περίσταση.


🧮 Παράδειγμα 2: Οι φοιτητές και τα ποσοστά επιτυχίας

Ας δούμε τώρα την εκδοχή του Dr. Hoetzel, που εξήγησε το παράδοξο με εξετάσεις φοιτητών.

Ένα τεστ γράφεται σε δύο αίθουσες:

ΑίθουσαΑπέτυχαν ΑγόριαΠέρασαν ΑγόριαΑπέτυχαν ΚορίτσιαΠέρασαν Κορίτσια
Hall A6102798
Hall B18155645

Αν εξετάσουμε κάθε αίθουσα ξεχωριστά:

  • Στην Hall A: τα αγόρια αποτυγχάνουν λιγότερο (6.6% έναντι 7.1%)
  • Στην Hall B: πάλι τα αγόρια φαίνονται καλύτερα (10.4% έναντι 11.6%)

Όμως συνολικά, αν ενώσουμε τα δεδομένα:

  • Αγόρια: 24 αποτυχίες σε 257 → 9.33%
  • Κορίτσια: 13 αποτυχίες σε 143 → 9.09%

Ξαφνικά, οι γυναίκες φαίνονται καλύτερες!

🔍 Γιατί συμβαίνει αυτό;

Το παράδοξο εμφανίζεται όταν οι ομάδες έχουν διαφορετικά μεγέθη ή κατανομές. Στο παράδειγμά μας, περισσότερα αγόρια κάθισαν στην «δύσκολη» αίθουσα, άρα το συνολικό τους ποσοστό επηρεάστηκε δυσανάλογα.

Αντίστοιχα, σε ιατρικές μελέτες, ένα φάρμακο μπορεί να φαίνεται αποτελεσματικό σε κάθε υποομάδα, αλλά να δείχνει συνολικά αναποτελεσματικό — ή το αντίστροφο.


🧩 Μαθηματική εξήγηση

Αν έχουμε δύο ομάδες \(A\) και \(B\), και δύο υποομάδες \(1\) και \(2\), το Παράδοξο του Simpson μπορεί να εκφραστεί ως εξής:

$$ \frac{a_1}{b_1} > \frac{c_1}{d_1}, \quad \frac{a_2}{b_2} > \frac{c_2}{d_2}, \quad \text{αλλά} \quad \frac{a_1+a_2}{b_1+b_2} < \frac{c_1+c_2}{d_1+d_2}. $$

Δηλαδή, μια τάση που ισχύει σε κάθε υποομάδα μπορεί να αντιστραφεί όταν τα δεδομένα συνδυαστούν.


💡 Το μάθημα του παραδόξου

Το Παράδοξο του Simpson μας θυμίζει ότι:

  • Η στατιστική δεν αποδεικνύει αιτιακές σχέσεις — δείχνει μόνο συσχετίσεις.
  • Η ομαδοποίηση των δεδομένων μπορεί να αλλάξει εντελώς τα συμπεράσματα.
  • Πρέπει να εξετάζουμε το πλαίσιο και όχι μόνο τους αριθμούς.

Όπως έγραψε ο Fekete: «Οι αριθμοί δεν ψεύδονται — αλλά μπορεί να ψεύδεται η οπτική μας πάνω τους.»

Ρώτησε το Math Oracle Mathematical Duel
Ανακάλυψε μαθηματική σοφία!

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου