EisatoponAI

Your Daily Experience of Math Adventures

Welcome to EisatoponAI!

Τα άρθρα μας είναι διαθέσιμα και στα Αγγλικά 🇬🇧.
Our posts are also available in English.
Tap the English button at the top of each article.

Why Does Least Squares Sometimes Look Biased?

Γιατί η OLS φαίνεται «μεροληπτική» σε απλά δεδομένα;

Σε απλά δισδιάστατα νέφη σημείων, η ευθεία ελαχίστων τετραγώνων (OLS) συχνά φαίνεται «εκτός κέντρου» ή αφύσικα κεκλιμένη σε σχέση με το νέφος των δεδομένων.

Η ευθεία OLS φαίνεται οπτικά «λανθασμένη» σε σχέση με το νέφος σημείων.

Αυτό όμως δεν σημαίνει ότι η OLS είναι στατιστικά μεροληπμένη. Το φαινόμενο προκύπτει από το γεγονός ότι η OLS απαντά σε διαφορετικό ερώτημα από αυτό που υποβάλλει η οπτική μας διαίσθηση.

Η OLS ελαχιστοποιεί τα κατακόρυφα τετραγωνικά σφάλματα και εκτιμά τον υπό όρους μέσο όρο \(E[Y \mid X=x]\), θεωρώντας το \(x\) ελεγχόμενη μεταβλητή.

Η OLS ελαχιστοποιεί τις κατακόρυφες αποστάσεις (vertical residuals).

Αντίθετα, η ευθεία που «περιμένει το μάτι μας» είναι πιο κοντά στον κύριο άξονα του νέφους, όπως αυτός προκύπτει από PCA ή ολική παλινδρόμηση ελαχίστων τετραγώνων.

Σε αυτή την περίπτωση, οι αποστάσεις ελαχιστοποιούνται ορθογώνια και οι μεταβλητές \(x\) και \(y\) αντιμετωπίζονται συμμετρικά.

Ο κύριος άξονας (PCA) ελαχιστοποιεί τις ορθογώνιες αποστάσεις.

Η φαινομενική «μεροληψία» της OLS είναι επομένως γεωμετρική και εννοιολογική, όχι στατιστική. Η OLS δεν κάνει λάθος — απλώς απαντά σε διαφορετικό ερώτημα.

Πηγή συζήτησης: r/math – Reddit

Ρώτησε το Math Oracle Mathematical Duel
Ανακάλυψε μαθηματική σοφία!

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου