Comprendere quali parti di un sistema dinamico sono legate da relazioni causa-effetto è di fondamentale importanza sia nelle scienze di base che in quelle applicate. Tuttavia, l’inferenza di relazioni causali a partire da dati osservazionali di serie temporali, ossia senza interventi diretti sul sistema, rimane una sfida computazionale, in particolare quando i dati sono alto-dimensionali.
Nella prima parte di questo seminario, introdurrò un approccio innovativo per inferire la presenza di relazioni causali a partire da serie temporali ad alta dimensionalità, basato sulla minimizzazione di una misura nota come Information Imbalance. Mostrerò come questo approccio può essere utilizzato per inferire relazioni causali tra variabili collettive in dinamica molecolare, e quale ipotesi sono necessarie per questa inferenza.
Nella seconda parte del seminario, estenderò la misura proposta per la ricostruzione di grafi causali, introducendo un algoritmo il cui costo computazionale scala linearmente con il numero di variabili. L’approccio si basa sull’identificazione automatica di comunità dinamiche, gruppi di variabili che si influenzano reciprocamente e possono essere descritte come un singolo nodo in un grafo causale. Tali comunità possono essere ordinate in modo gerarchico, partendo da quelle completamente autonome, la cui evoluzione è indipendente dalle rimanenti, fino a quelle progressivamente dipendenti da altre comunità. Questo framework offre un’alternativa efficiente e promettente per l’analisi di sistemi ad alta dimensionalità, nei quali i canonici grafi causali diventano di difficile interpretazione.