Home IstruzioniObiettivi generali Board scientificoReferenze  
Capitolo 11 - Statistica: Applicazioni pratiche per gli ortopedici

Mohit Bhandari, MD, MSc, FRCSC

III. Inferenza statistica di base

A. Distribuzione normale (Tabella 1)

1. Definizione - È definibile normale una distribuzione di dati continui che forma una curva a campana; vale a dire, una curva con numerosi valori vicini alla media e un numero di valori progressivamente decrescente verso gli estremi.

2. Diversi test statistici presuppongono una distribuzione normale. Se un campione non presenta una distribuzione normale, occorre applicare un set di test statistici diverso. Tali test vengono definiti non parametrici, in quanto non basati su parametri quali la media e la deviazione standard.


Per ingrandire clicca qui
 
Tabella 1. Test statistici comuni

B. Statistica descrittiva

1. Misure della tendenza centrale

  • Media - La media del campione è uguale alla somma delle misurazioni divisa per il numero delle osservazioni.
  • Mediana - La mediana di un set di misurazioni è il numero che ricade nel mezzo.
  • Moda - Viene definita moda il numero registrato con maggiore frequenza nell'ambito di un set di misurazioni.
  • Impiego delle misure della tendenza centrale

              i. Le variabili continue (quali la pressione arteriosa, o il peso corporeo) sono riassumibili con una media in caso di distribuzione normale dei dati.

              ii. Se i dati non presentano una distribuzione normale, la mediana può costituire un parametro statistico riassuntivo migliore.

             iii. Le variabili categoriche (ad es., grado del dolore [0,1, 2, 3, 4, 5]) sono riassumibili con una mediana.

2. Misure di dispersione o variabilità (spread)

  • Deviazione standard - Ricavabile dalla radice quadrata della varianza del campione. La varianza viene calcolata come la media delle radici delle deviazioni delle misurazioni dalla loro media.
  • Range - Riflette i valori minimo e massimo registrati.

C. Confronto delle medie

1. Confronto di due medie 

  • Quando vengono confrontati due campioni indipendenti di dati continui distribuiti normalmente si utilizza il t-test (chiamato spesso di Student, che ha generato l'attributo comune test t di Student).
  • Quando i dati non presentano una distribuzione normale si può utilizzare un test non parametrico come quello di Mann-Whitney, o quello della somma dei ranghi di Wilcoxon. Quando le medie sono appaiate, come nel caso del ginocchio sinistro e di quello destro, risulta più appropriato un test per t appaiate. Il correlato non parametrico di tale test è quello dei ranghi segnati di Wilcoxon.

2. Confronto di tre o più medie - Confrontando tre o più medie differenti (ad es., degenza ospedaliera tra i soggetti trattati per fratture tibiali con fissazione del piatto, chiodi endomidollari e fissazione esterna), il test di elezione è l'analisi della varianza con un singolo fattore.

D. Confronto di percentuali

1. Percentuali indipendenti - Il test del Chi-2 (c2) costituisce un metodo semplice per il confronto di due percentuali, come la differenza tra i tassi d'infezione (%) tra due gruppi. Talvolta si utilizza un fattore di correzione di Yates per tenere in considerazione le piccole dimensioni di un campione, ma quando i valori misurati sono molto piccoli (ad es., meno di 5 eventi in ciascun gruppo trattato o di controllo) il test del χ2 diventa inaffidabile, e il test di elezione è rappresentato da quello esatto di Fisher.

2. Percentuali appaiate - Quando le percentuali sono appaiate (ad es., prima e dopo lo studio sugli stessi soggetti), viene utilizzato il test di McNemar per esaminare le differenze tra i gruppi.

E. Regressione e correlazione

1. Analisi di regressione - Utilizzata per predire (o stimare) l'associazione esistente tra la variabile di una risposta (variabile dipendente) e una serie di variabili esplicative note (indipendenti).

  • Regressione semplice - Quando si utilizza una singola variabile indipendente.
  • Regressione multipla - Quando si utilizzano più variabili indipendenti.
  • Regressione logistica - Quando la variabile della risposta è dicotomica (sì o no; infezione presente o assente).
  • Regressione dei rischi proporzionali di Cox - Usata nell'analisi della sopravvivenza per valutare la relazione tra due o più variabili e una singola variabile dipendente (il tempo a un evento).

2. Correlazione - La forza della relazione tra due variabili (ad es., età versus permanenza ospedaliera in soggetti con fratture d'anca) può essere riassunta con un semplice numero, il coefficiente di correlazione, indicato con la lettera r. Il coefficiente di correlazione può variare tra -1,0 e 1,0.

  • Un coefficiente di correlazione di -1,0 indica la relazione più fortemente negativa possibile, nella quale il soggetto che ottiene il punteggio più elevato per una variabile raggiunge quello più basso per l'altra variabile.
  • Un coefficiente di correlazione di 1,0 indica la relazione più fortemente positiva possibile.
  • Un coefficiente di correlazione di 0 indica l'assenza di relazioni tra le due variabili.
  • La correlazione r di Pearson viene utilizzata per valutare la relazione tra due variabili a distribuzione continua normale. Se una delle variabili non presenta una distribuzione normale, la soluzione migliore è costituita dalla correlazione di Spearman.

F. Analisi di sopravvivenza

1. L'analisi del tempo all'evento comporta la stima della probabilità che un evento possa verificarsi in diversi momenti temporali.

2. L'analisi della sopravvivenza calcola la probabilità di sopravvivenza in funzione del tempo trascorso da un determinato momento d'avvio (il momento dell'infortunio, o quello dell'intervento chirurgico).

3. Le curve di sopravvivenza, definite anche curve di Kaplan-Meier, vengono spesso utilizzate per descrivere la sopravvivenza di uno o più gruppi di pazienti nel tempo.

   

MODULO 1:
CONOSCENZE FONDAMENTALI

MODULO 2:
COLONNA VERTEBRALE