Ο HMC «φορά» σε κάθε σημείο μια τεχνητή ορμή και ορίζει μια ενέργεια (Hamiltonian) που συνδυάζει:
-
δυναμική ενέργεια → πόσο «απίθανο» είναι το σημείο (log-πιθανότητα)
-
κινητική ενέργεια → από την ορμή που του δίνουμε τυχαία
Έπειτα, χρησιμοποιεί τις εξισώσεις του Hamilton για να προσομοιώσει την κίνηση του σωματιδίου μέσα στον χώρο των παραμέτρων. Αυτή η κίνηση ακολουθεί ομαλές τροχιές που διατηρούν την ενέργεια, άρα και την «σωστή» κατανομή πιθανοτήτων. Το αποτέλεσμα είναι ότι ο αλγόριθμος κινείται μακριά και στοχευμένα μέσα στον χώρο, αντί να σέρνεται αργά όπως οι κλασικές MCMC μέθοδοι τύπου random walk.
Γι’ αυτό το Hamiltonian Monte Carlo είναι τόσο ισχυρό σε υψηλής διάστασης Bayesian μοντέλα: εκμεταλλεύεται καμπύλες, κλίσεις και «δυνάμεις» της συνάρτησης πιθανότητας για να εξερευνήσει γρήγορα την κατανομή. Είναι ένα όμορφο παράδειγμα του πώς η κλασική μηχανική δίνει εργαλεία αιχμής στη σύγχρονη στατιστική και στην machine learning.

Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου