1. Η βασική ιδέα
Σκοπός είναι να παραγάγουμε μια ακολουθία τυχαίων δειγμάτων από μια πολυδιάστατη κατανομή πιθανότητας .
Σε πολλές περιπτώσεις, η κοινή κατανομή είναι δύσκολο να δειγματοληφθεί άμεσα, αλλά οι υπό συνθήκη κατανομές (conditional distributions) κάθε μεταβλητής είναι πολύ απλούστερες.
Η ιδέα του Gibbs είναι να εκμεταλλευτούμε αυτή την απλότητα:
-
Αντί να δειγματοληπτούμε όλες τις μεταβλητές μαζί,
-
Δειγματοληπτούμε μία κάθε φορά, θεωρώντας τις υπόλοιπες γνωστές.
2. Ο αλγόριθμος βήμα-βήμα
Έστω ότι θέλουμε να δειγματοληπτούμε από την κατανομή :
-
Αρχικοποίηση
Επιλέγουμε μια τυχαία αρχική τιμή . -
Επανάληψη για κάθε βήμα :
-
Δειγματοληπτούμε:
-
Έπειτα:
-
Συνεχίζουμε ανάλογα για όλες τις μεταβλητές.
-
-
Σύγκλιση
Για μεγάλο αριθμό επαναλήψεων, τα δείγματα προσεγγίζουν την πραγματική κατανομή .
3. Παράδειγμα με δύο μεταβλητές
Έστω ότι έχουμε μια διδιάστατη κατανομή .
Ο αλγόριθμος Gibbs δουλεύει ως εξής:
-
Επιλέγουμε τυχαία αρχικές τιμές .
-
Για κάθε βήμα :
-
Υπολογίζουμε:
-
Έπειτα:
-
-
Επαναλαμβάνουμε.
Έπειτα από αρκετά βήματα, τα σημεία κατανέμονται όπως η αρχική .
4. Γιατί δουλεύει;
Η δειγματοληψία Gibbs βασίζεται στο ότι:
-
Οι υπό συνθήκη κατανομές είναι συχνά εύκολες να δειγματοληφθούν.
-
Η αλυσίδα Markov που δημιουργείται έχει μοναδική στάσιμη κατανομή, που είναι η ζητούμενη .
-
Με αρκετές επαναλήψεις, ο αλγόριθμος συγκλίνει στην πραγματική κατανομή.
5. Εφαρμογές
Η δειγματοληψία Gibbs έχει ευρύτατη χρήση σε στατιστική και μηχανική μάθηση:
-
Βαϊζιανή συμπερασματολογία — υπολογισμός posterior όταν η αναλυτική λύση είναι δύσκολη.
-
Topic Modeling — μοντέλα όπως το LDA χρησιμοποιούν εκτενώς Gibbs sampling.
-
Εκπαίδευση Restricted Boltzmann Machines (RBMs) στη μηχανική μάθηση.
-
Βιοστατιστική, επεξεργασία εικόνας, γενετική ανάλυση και οικονομετρία.
6. Πλεονεκτήματα και μειονεκτήματα
Πλεονεκτήματα ✅
-
Απλός στην υλοποίηση.
-
Ιδανικός για υψηλές διαστάσεις.
-
Συχνά οι συνθήκες έχουν κλειστή μορφή.
Μειονεκτήματα ⚠️
-
Αργή σύγκλιση αν οι μεταβλητές έχουν μεγάλη συσχέτιση.
-
Απαιτεί να μπορούμε να υπολογίζουμε εύκολα τις υπό συνθήκη κατανομές.
-
Μπορεί να «κολλήσει» σε τοπικές περιοχές αν η κατανομή είναι πολύπλοκη.
Συμπέρασμα
Η δειγματοληψία Gibbs είναι ένα από τα ισχυρότερα εργαλεία της MCMC.
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου