Principale Altro Analisi dei dati Time-To-Event

Analisi dei dati Time-To-Event

Panoramica

Software

Descrizione

Siti web

letture

Corsi

Panoramica

Questa pagina descrive brevemente una serie di domande che dovrebbero essere prese in considerazione quando si analizzano i dati time-to-event e fornisce un elenco di risorse annotate per ulteriori informazioni.

Descrizione

Qual è l'unicità dei dati time-to-event (TTE)?

I dati Time-to-Event (TTE) sono unici perché il risultato di interesse non è solo se un evento si è verificato o meno, ma anche quando si è verificato tale evento. I metodi tradizionali di regressione logistica e lineare non sono adatti a includere sia l'evento che l'aspetto temporale come risultato nel modello. Inoltre, i metodi di regressione tradizionali non sono attrezzati per gestire la censura, un tipo speciale di dati mancanti che si verifica nelle analisi time-to-event quando i soggetti non sperimentano l'evento di interesse durante il periodo di follow-up. In presenza di censura, il tempo reale all'evento è sottovalutato. Tecniche speciali per i dati TTE, come verrà discusso di seguito, sono state sviluppate per utilizzare le informazioni parziali su ciascun soggetto con dati censurati e fornire stime di sopravvivenza imparziali. Queste tecniche incorporano dati provenienti da più punti temporali tra soggetti e possono essere utilizzate per calcolare direttamente tassi, rapporti temporali e rapporti di rischio.

Quali sono importanti considerazioni metodologiche sui dati time-to-event?

Ci sono 4 principali considerazioni metodologiche nell'analisi del tempo all'evento o dei dati di sopravvivenza. È importante avere una chiara definizione dell'evento target, l'origine temporale, la scala temporale e descrivere come i partecipanti usciranno dallo studio. Una volta che questi sono ben definiti, l'analisi diventa più diretta. In genere c'è un singolo evento target, ma ci sono estensioni delle analisi di sopravvivenza che consentono più eventi o eventi ripetuti.

Qual è l'origine del tempo?

L'origine temporale è il punto in cui inizia il tempo di follow-up. I dati TTE possono impiegare una varietà di origini temporali che sono in gran parte determinate dalla progettazione dello studio, ciascuna con vantaggi e svantaggi associati. Gli esempi includono il tempo di riferimento o l'età di riferimento. Le origini temporali possono anche essere determinate da una caratteristica distintiva, come l'inizio dell'esposizione o la diagnosi. Questa è spesso una scelta naturale se il risultato è correlato a quella caratteristica. Altri esempi includono la nascita e l'anno solare. Per gli studi di coorte, la scala temporale è più comunemente il tempo di studio.

C'è un'altra opzione per la scala temporale oltre al tempo dedicato allo studio?

L'età è un'altra scala temporale comunemente usata, in cui l'età di base è l'origine del tempo e gli individui escono al loro evento o età di censura. I modelli con l'età come scala temporale possono essere regolati per gli effetti del calendario. Alcuni autori raccomandano di utilizzare l'età piuttosto che il tempo trascorso nello studio come scala temporale in quanto potrebbe fornire stime meno distorte.

Che cos'è la censura?

Una delle sfide specifiche dell'analisi di sopravvivenza è che solo alcuni individui avranno sperimentato l'evento entro la fine dello studio, e quindi i tempi di sopravvivenza saranno sconosciuti per un sottoinsieme del gruppo di studio. Questo fenomeno è chiamato censura e può manifestarsi nei seguenti modi: il partecipante allo studio non ha ancora sperimentato l'esito rilevante, come ricaduta o morte, entro la chiusura dello studio; il partecipante allo studio è perso al follow-up durante il periodo di studio; oppure, il partecipante allo studio sperimenta un evento diverso che rende impossibile un ulteriore follow-up. Tali tempi di intervallo censurati sottovalutano il tempo vero ma sconosciuto dell'evento. Per la maggior parte degli approcci analitici, si presume che la censura sia casuale o non informativa.

Esistono tre tipi principali di censura, destra, sinistra e intervallo. Se gli eventi si verificano oltre la fine dello studio, i dati vengono censurati a destra. I dati censurati a sinistra si verificano quando viene osservato l'evento, ma l'ora esatta dell'evento è sconosciuta. I dati censurati a intervalli si verificano quando l'evento viene osservato, ma i partecipanti entrano ed escono dall'osservazione, quindi l'ora esatta dell'evento è sconosciuta. La maggior parte dei metodi analitici di sopravvivenza sono progettati per osservazioni censurate a destra, ma sono disponibili metodi per dati a intervalli e censurati a sinistra.

Qual è la domanda di interesse?

La scelta dello strumento analitico dovrebbe essere guidata dalla domanda di ricerca di interesse. Con i dati TTE, la domanda di ricerca può assumere diverse forme, il che influenza quale funzione di sopravvivenza è la più rilevante per la domanda di ricerca. Tre diversi tipi di domande di ricerca che possono essere di interesse per i dati TTE includono:

  1. Quale percentuale di individui rimarrà libera dall'evento dopo un certo tempo?

  2. Quale proporzione di individui avrà l'evento dopo un certo tempo?

  3. Qual è il rischio dell'evento in un determinato momento, tra coloro che sono sopravvissuti fino a quel momento?

Ognuna di queste domande corrisponde a un diverso tipo di funzione utilizzata nell'analisi di sopravvivenza:

  1. Funzione di sopravvivenza, S(t): la probabilità che un individuo sopravviva oltre il tempo t [Pr(T>t)]

  2. Funzione di densità di probabilità, F(t), o funzione di incidenza cumulativa, R(t): la probabilità che un individuo abbia un tempo di sopravvivenza inferiore o uguale a t [Pr(T≤t)]

  3. Hazard Function, h(t): il potenziale istantaneo di sperimentare un evento al tempo t, a condizione di essere sopravvissuto a quel momento

  4. Funzione di rischio cumulativo, H(t): l'integrale della funzione di rischio dal tempo 0 al tempo t, che è uguale all'area sotto la curva h(t) tra il tempo 0 e il tempo t

Se una di queste funzioni è nota, le altre funzioni possono essere calcolate utilizzando le seguenti formule:

S(t) = 1 – F(t) La funzione di sopravvivenza e la funzione di densità di probabilità si sommano a 1

h(t)=f(t)/S(t) Il pericolo istantaneo è uguale alla probabilità incondizionata di

vivendo l'evento al tempo t, scalato dalla frazione viva al tempo t

H(t) = -log[S(t)] La funzione di rischio cumulativo è uguale al log negativo della sopravvivenza

funzione

S(t) = e –H(t) La funzione di sopravvivenza è uguale al rischio cumulativo negativo esponenziale

funzione

Queste conversioni vengono spesso utilizzate nei metodi di analisi della sopravvivenza, come verrà discusso di seguito. Generalmente, un aumento di h(t), il rischio istantaneo, porterà ad un aumento di H(t), il rischio cumulativo, che si traduce in una diminuzione di S(t), la funzione di sopravvivenza.

Quali ipotesi devono essere fatte per utilizzare tecniche standard per i dati time-to-event?

Il presupposto principale nell'analisi dei dati TTE è quello della censura non informativa: gli individui censurati hanno la stessa probabilità di vivere un evento successivo degli individui che rimangono nello studio. La censura informativa è analoga ai dati mancanti non ignorabili, che distorceranno l'analisi. Non esiste un modo definitivo per verificare se la censura non è informativa, sebbene l'esplorazione dei modelli di censura possa indicare se un'ipotesi di censura non informativa è ragionevole. Se si sospetta una censura informativa, le analisi di sensibilità, come gli scenari del caso migliore e del caso peggiore, possono essere utilizzate per cercare di quantificare l'effetto che la censura informativa ha sull'analisi.

Un'altra ipotesi quando si analizzano i dati TTE è che ci sia un tempo di follow-up e un numero di eventi sufficienti per un'adeguata potenza statistica. Questo deve essere considerato nella fase di progettazione dello studio, poiché la maggior parte delle analisi di sopravvivenza si basa su studi di coorte.

Vale la pena menzionare ulteriori ipotesi semplificatrici, poiché sono spesso fatte nelle panoramiche dell'analisi di sopravvivenza. Sebbene queste ipotesi semplifichino i modelli di sopravvivenza, non sono necessarie per condurre analisi con dati TTE. È possibile utilizzare tecniche avanzate se vengono violati questi presupposti:

  • Nessun effetto di coorte sulla sopravvivenza: per una coorte con un lungo periodo di reclutamento, supponi che gli individui che si uniscono in anticipo abbiano le stesse probabilità di sopravvivenza di quelli che si uniscono in ritardo

  • Censura destra solo nei dati

  • Gli eventi sono indipendenti l'uno dall'altro

Quali tipi di approcci possono essere utilizzati per l'analisi della sopravvivenza?

Esistono tre approcci principali per l'analisi dei dati TTE: approcci non parametrici, semiparametrici e parametrici. La scelta di quale approccio utilizzare dovrebbe essere guidata dalla domanda di ricerca di interesse. Spesso, più di un approccio può essere opportunamente utilizzato nella stessa analisi.

Quali sono gli approcci non parametrici all'analisi della sopravvivenza e quando sono appropriati?

Gli approcci non parametrici non si basano su ipotesi sulla forma o sulla forma dei parametri nella popolazione sottostante. Nell'analisi della sopravvivenza, vengono utilizzati approcci non parametrici per descrivere i dati stimando la funzione di sopravvivenza, S(t), insieme alla mediana e ai quartili del tempo di sopravvivenza. Queste statistiche descrittive non possono essere calcolate direttamente dai dati a causa della censura, che sottovaluta il vero tempo di sopravvivenza nei soggetti censurati, portando a stime distorte della media, della mediana e di altri descrittivi. Gli approcci non parametrici sono spesso usati come primo passo in un'analisi per generare statistiche descrittive imparziali e sono spesso usati insieme ad approcci semiparametrici o parametrici.

Stimatore Kaplan-Meier

L'approccio non parametrico più comune in letteratura è lo stimatore di Kaplan-Meier (o limite di prodotto). Lo stimatore di Kaplan-Meier funziona suddividendo la stima di S(t) in una serie di passaggi/intervalli basati sui tempi degli eventi osservati. Le osservazioni contribuiscono alla stima di S(t) fino al verificarsi dell'evento o fino alla censura. Per ogni intervallo viene calcolata la probabilità di sopravvivere fino alla fine dell'intervallo, dato che i soggetti sono a rischio all'inizio dell'intervallo (questo è comunemente indicato come pj =( nj – dj)/nj). La stima di S(t) per ogni valore di t è uguale al prodotto della sopravvivenza a ciascun intervallo fino al tempo t compreso. I presupposti principali di questo metodo, oltre alla censura non informativa, è che la censura si verifica dopo i fallimenti e che non vi è alcun effetto di coorte sulla sopravvivenza, quindi i soggetti hanno la stessa probabilità di sopravvivenza indipendentemente da quando sono stati oggetto di studio.

La stima di S(t) dal metodo di Kaplan-Meier può essere tracciata come una funzione a gradini con il tempo sull'asse X. Questo grafico è un bel modo per visualizzare l'esperienza di sopravvivenza della coorte e può anche essere usato per stimare la mediana (quando S(t)≤0,5) o i quartili del tempo di sopravvivenza. Queste statistiche descrittive possono anche essere calcolate direttamente utilizzando lo stimatore Kaplan-Meier. Gli intervalli di confidenza (CI) al 95% per S(t) si basano sulle trasformazioni di S(t) per garantire che il CI al 95% sia compreso tra 0 e 1. Il metodo più comune in letteratura è lo stimatore di Greenwood.

Stima della tabella di vita

Lo stimatore della tabella di sopravvivenza della funzione di sopravvivenza è uno dei primi esempi di metodi statistici applicati, essendo stato utilizzato per oltre 100 anni per descrivere la mortalità in grandi popolazioni. Lo stimatore della tabella di vita è simile al metodo di Kaplan-Meier, tranne per il fatto che gli intervalli si basano sul tempo di calendario anziché sugli eventi osservati. Poiché i metodi della tabella di vita si basano su questi intervalli di calendario e non su singoli eventi/tempi di censura, questi metodi utilizzano la dimensione media del set di rischio per intervallo per stimare S(t) e devono presumere che la censura sia avvenuta uniformemente nell'intervallo di tempo del calendario. Per questo motivo, lo stimatore della tabella di vita non è preciso come lo stimatore di Kaplan-Meier, ma i risultati saranno simili in campioni molto grandi.

Stimatore Nelson-Aalen

Un'altra alternativa a Kaplan-Meier è lo stimatore di Nelson-Aalen, che si basa sull'utilizzo di un approccio di processo di conteggio per stimare la funzione di rischio cumulativo, H(t). La stima di H(t) può quindi essere utilizzata per stimare S(t). Le stime di S(t) derivate con questo metodo saranno sempre maggiori della stima K-M, ma la differenza sarà piccola tra i due metodi in campioni di grandi dimensioni.

È possibile utilizzare approcci non parametrici per analisi univariate o multivariate?

Approcci non parametrici come lo stimatore di Kaplan-Meier possono essere utilizzati per condurre analisi univariate per fattori categoriali di interesse. I fattori devono essere categoriali (in natura o una variabile continua suddivisa in categorie) perché la funzione di sopravvivenza, S(t), viene stimata per ogni livello della variabile categoriale e quindi confrontata tra questi gruppi. La stima di S(t) per ogni gruppo può essere tracciata e confrontata visivamente.

I test basati sui ranghi possono essere utilizzati anche per testare statisticamente la differenza tra le curve di sopravvivenza. Questi test confrontano il numero di eventi osservati e previsti in ogni momento tra i gruppi, sotto l'ipotesi nulla che le funzioni di sopravvivenza siano uguali tra i gruppi. Esistono diverse versioni di questi test basati sul rango, che differiscono per il peso dato a ciascun punto temporale nel calcolo della statistica del test. Due dei più comuni test basati sul rango visti in letteratura sono il log rank test, che attribuisce ad ogni punto temporale lo stesso peso, e il test di Wilcoxon, che pesa ogni punto temporale in base al numero di soggetti a rischio. Sulla base di questo peso, il test di Wilcoxon è più sensibile alle differenze tra le curve all'inizio del follow-up, quando più soggetti sono a rischio. Altri test, come il test di Peto-Prentice, utilizzano pesi tra quelli del log rank e dei test di Wilcoxon. I test basati sui ranghi sono soggetti all'ulteriore presupposto che la censura sia indipendente dal gruppo e tutti sono limitati dallo scarso potere di rilevare le differenze tra i gruppi quando le curve di sopravvivenza si incrociano. Sebbene questi test forniscano un p-value della differenza tra le curve, non possono essere utilizzati per stimare le dimensioni dell'effetto (il log rank test p-value, tuttavia, è equivalente al p-value per un fattore categorico di interesse in un Cox univariabile modello).

I modelli non parametrici sono limitati in quanto non forniscono stime degli effetti e generalmente non possono essere utilizzati per valutare l'effetto di più fattori di interesse (modelli multivariabili). Per questo motivo, in epidemiologia, gli approcci non parametrici vengono spesso utilizzati in combinazione con modelli semi- o completamente parametrici, in cui i modelli multivariabili vengono generalmente utilizzati per controllare i fattori di confondimento.

È possibile regolare le curve di Kaplan-Meier?

È un mito comune che le curve di Kaplan-Meier non possano essere regolate, e questo è spesso citato come motivo per utilizzare un modello parametrico in grado di generare curve di sopravvivenza aggiustate per covariate. Tuttavia, è stato sviluppato un metodo per creare curve di sopravvivenza aggiustate utilizzando la ponderazione di probabilità inversa (IPW). Nel caso di una sola covariata, gli IPW possono essere stimati in modo non parametrico e sono equivalenti alla standardizzazione diretta delle curve di sopravvivenza alla popolazione in studio. Nel caso di più covariate, devono essere utilizzati modelli semi- o completamente parametrici per stimare i pesi, che vengono poi utilizzati per creare curve di sopravvivenza aggiustate per più covariate. I vantaggi di questo metodo sono che non è soggetto all'assunzione dei rischi proporzionali, può essere utilizzato per covariate variabili nel tempo e può essere utilizzato anche per covariate continue.

login fondi pensione all'avanguardia

Perché abbiamo bisogno di approcci parametrici per analizzare i dati time-to-event?

Un approccio non parametrico all'analisi dei dati TTE viene utilizzato per descrivere semplicemente i dati di sopravvivenza rispetto al fattore in esame. I modelli che utilizzano questo approccio sono indicati anche come modelli univariati. Più comunemente, gli investigatori sono interessati alla relazione tra diverse covariate e il tempo all'evento. L'uso di modelli semi e completamente parametrici consente di analizzare il tempo all'evento rispetto a molti fattori contemporaneamente e fornisce stime della forza dell'effetto per ciascun fattore costituente.

Che cos'è un approccio semiparametrico e perché è così comunemente usato?

Il modello proporzionale di Cox è l'approccio multivariabile più comunemente utilizzato per l'analisi dei dati di sopravvivenza nella ricerca medica. Si tratta essenzialmente di un modello di regressione time-to-event, che descrive la relazione tra l'incidenza dell'evento, espressa dalla funzione di rischio, e un insieme di covariate. Il modello di Cox è scritto come segue:

funzione di rischio, h(t) = h0(t)exp{β1X1 + β2X2 + … + βpXp}

È considerato un approccio semiparametrico perché il modello contiene un componente non parametrico e un componente parametrico. La componente non parametrica è il rischio di base, h0(t). Questo è il valore del rischio quando tutte le covariate sono uguali a 0, il che evidenzia l'importanza di centrare le covariate nel modello per l'interpretabilità. Non confondere il rischio di base con il rischio al tempo 0. La funzione di rischio di base è stimata in modo non parametrico e quindi, a differenza della maggior parte degli altri modelli statistici, si presume che i tempi di sopravvivenza non seguano una particolare distribuzione statistica e la forma della linea di base il rischio è arbitrario. La funzione di rischio di base non ha bisogno di essere stimata per fare inferenze sul rischio relativo o sul rapporto di rischio. Questa caratteristica rende il modello di Cox più robusto degli approcci parametrici perché non è vulnerabile a specifiche errate del rischio di riferimento.

La componente parametrica è costituita dal vettore covariato. Il vettore della covariata moltiplica il rischio di base per la stessa quantità indipendentemente dal tempo, quindi l'effetto di qualsiasi covariata è lo stesso in qualsiasi momento durante il follow-up, e questa è la base per l'assunzione dei rischi proporzionali.

Qual è l'assunzione dei rischi proporzionali?

L'assunzione dei rischi proporzionali è vitale per l'uso e l'interpretazione di un modello di Cox.

Sotto questa ipotesi, esiste una relazione costante tra il risultato o la variabile dipendente e il vettore covariato. Le implicazioni di questa ipotesi sono che le funzioni di rischio per due individui qualsiasi sono proporzionali in qualsiasi momento e il rapporto di rischio non varia nel tempo. In altre parole, se un individuo ha un rischio di morte in un momento iniziale che è il doppio di quello di un altro individuo, allora in tutti i momenti successivi il rischio di morte rimane il doppio. Questa ipotesi implica che le curve di rischio per i gruppi dovrebbero essere proporzionali e non dovrebbero incrociarsi. Poiché questa ipotesi è così importante, dovrebbe essere assolutamente verificata.

Come si verifica l'assunzione dei rischi proporzionali?

Esistono diverse tecniche, sia grafiche che basate su test, per valutare la validità dell'assunzione dei rischi proporzionali. Una tecnica consiste nel tracciare semplicemente le curve di sopravvivenza di Kaplan-Meier se si confrontano due gruppi senza covariate. Se le curve si incrociano, l'assunzione dei rischi proporzionali può essere violata. Un avvertimento importante a questo approccio deve essere tenuto presente per i piccoli studi. Potrebbe esserci una grande quantità di errori associati alla stima delle curve di sopravvivenza per studi con una piccola dimensione del campione, quindi le curve possono incrociarsi anche quando viene soddisfatta l'assunzione dei rischi proporzionali. Il diagramma log-log complementare è un test più robusto che traccia il logaritmo del logaritmo negativo della funzione di sopravvivenza stimata rispetto al logaritmo del tempo di sopravvivenza. Se i rischi sono proporzionali tra i gruppi, questo grafico produrrà curve parallele. Un altro metodo comune per testare l'assunzione dei rischi proporzionali consiste nell'includere un termine di interazione temporale per determinare se l'HR cambia nel tempo, poiché il tempo è spesso il colpevole della non proporzionalità dei rischi. L'evidenza che il termine di interazione gruppo*tempo non è zero è una prova contro i rischi proporzionali.

Cosa succede se l'assunzione dei rischi proporzionali non regge?

Se trovi che l'assunzione di PH non regge, non devi necessariamente abbandonare l'uso del modello di Cox. Esistono opzioni per migliorare la non proporzionalità nel modello. Ad esempio, è possibile includere altre covariate nel modello, nuove covariate, termini non lineari per covariate esistenti o interazioni tra covariate. Oppure si può stratificare l'analisi su una o più variabili. Questo stima un modello in cui il rischio di base può essere diverso all'interno di ogni strato, ma gli effetti delle covariate sono uguali tra gli strati. Altre opzioni includono la divisione del tempo in categorie e l'uso di variabili indicatrici per consentire ai rapporti di rischio di variare nel tempo e la modifica della variabile del tempo di analisi (ad esempio, dal tempo trascorso all'età o viceversa).

Come si esamina l'adattamento del modello semiparametrico?

Oltre al controllo delle violazioni del presupposto di proporzionalità, ci sono altri aspetti dell'adattamento del modello che dovrebbero essere esaminati. Statistiche simili a quelle utilizzate nella regressione lineare e logistica possono essere applicate per eseguire queste attività per i modelli di Cox con alcune differenze, ma le idee essenziali sono le stesse in tutte e tre le impostazioni. È importante verificare la linearità del vettore covariato, che può essere fatto esaminando i residui, proprio come facciamo nella regressione lineare. Tuttavia, i residui nei dati TTE non sono così semplici come nella regressione lineare, in parte perché il valore del risultato è sconosciuto per alcuni dati e i residui sono spesso distorti. Sono stati sviluppati diversi tipi di residui per valutare l'idoneità del modello di Cox per i dati TTE. Gli esempi includono Martingale e Schoenfeld, tra gli altri. Puoi anche guardare i residui per identificare osservazioni altamente influenti e poco adattate. Esistono anche test di bontà di adattamento specifici per i modelli di Cox, come il test di Gronnesby e Borgan e l'indice prognostico di Hosmer e Lemeshow. È inoltre possibile utilizzare l'AIC per confrontare diversi modelli, sebbene l'uso di R2 sia problematico.

Perché utilizzare un approccio parametrico?

Uno dei principali vantaggi dei modelli semiparametrici è che non è necessario specificare il rischio di base per stimare i rapporti di rischio che descrivono le differenze nel rischio relativo tra i gruppi. Può essere, tuttavia, che la stessa stima del rischio di base sia di interesse. In questo caso è necessario un approccio parametrico. Negli approcci parametrici vengono specificati sia la funzione di rischio che l'effetto delle covariate. La funzione di rischio è stimata sulla base di una distribuzione presunta nella popolazione sottostante.

I vantaggi dell'utilizzo di un approccio parametrico all'analisi della sopravvivenza sono:

  • Gli approcci parametrici sono più informativi degli approcci non parametrici e semiparametrici. Oltre a calcolare le stime degli effetti relativi, possono essere utilizzati anche per prevedere il tempo di sopravvivenza, i tassi di rischio e i tempi di sopravvivenza medi e mediani. Possono anche essere usati per fare previsioni di rischio assoluto nel tempo e per tracciare curve di sopravvivenza aggiustate per covariate.

  • Quando la forma parametrica è specificata correttamente, i modelli parametrici hanno più potenza dei modelli semiparametrici. Sono anche più efficienti, portando a errori standard più piccoli e stime più precise.

  • Gli approcci parametrici si basano sulla massima verosimiglianza per stimare i parametri.

  • I residui dei modelli parametrici assumono la forma familiare della differenza tra l'osservato e l'atteso.

    che ha scritto da qualche parte oltre l'arcobaleno

Il principale svantaggio dell'utilizzo di un approccio parametrico è che si basa sul presupposto che la distribuzione della popolazione sottostante sia stata specificata correttamente. I modelli parametrici non sono resistenti a specifiche errate, motivo per cui i modelli semiparametrici sono più comuni in letteratura e sono meno rischiosi da usare quando c'è incertezza sulla distribuzione della popolazione sottostante.

Come si sceglie la forma parametrica?

La scelta della forma parametrica appropriata è la parte più difficile dell'analisi parametrica di sopravvivenza. La specificazione della forma parametrica dovrebbe essere guidata dall'ipotesi di studio, insieme alla conoscenza precedente e alla plausibilità biologica della forma del rischio di base. Ad esempio, se si sa che il rischio di morte aumenta drammaticamente subito dopo l'intervento chirurgico e poi diminuisce e si appiattisce, sarebbe inopportuno specificare la distribuzione esponenziale, che assume una pericolosità costante nel tempo. I dati possono essere utilizzati per valutare se la forma specificata sembra adattarsi ai dati, ma questi metodi basati sui dati dovrebbero integrare, non sostituire, le selezioni guidate da ipotesi.

Qual è la differenza tra un modello a rischi proporzionali e un modello a tempo di guasto accelerato?

Sebbene il modello dei rischi proporzionali di Cox sia semiparametrico, anche i modelli dei rischi proporzionali possono essere parametrici. I modelli parametrici di rischio proporzionale possono essere scritti come:

h(t,X) = h0(t)exp(Xi β) = h0(t)λ

dove il rischio di base, h0(t), dipende solo dal tempo, t, ma non da X, e è una funzione unità-specifica delle covariate, che non dipende da t, che aumenta o riduce la funzione di rischio di base. non può essere negativo. In questo modello, il tasso di rischio è una funzione moltiplicativa del rischio di base e gli hazard ratio possono essere interpretati allo stesso modo del modello dei rischi proporzionali semiparametrici.

I modelli Accelerated Failure Time (AFT) sono una classe di modelli parametrici di sopravvivenza che possono essere linearizzati prendendo il log naturale del modello del tempo di sopravvivenza. L'esempio più semplice di un modello AFT è il modello esponenziale, che si scrive come:

ln (T) = 0 + β1X1 +…. + βpXp + ε *

La principale differenza tra i modelli AFT e i modelli PH è che i modelli AFT presuppongono che gli effetti delle covariate siano moltiplicativi su scala temporale, mentre i modelli Cox utilizzano la scala di rischio come mostrato sopra. Le stime dei parametri dei modelli AFT sono interpretate come effetti sulla scala temporale, che possono accelerare o rallentare il tempo di sopravvivenza. Exp(β)>1 da un modello AFT significa che il fattore accelera il tempo di sopravvivenza o porta a una sopravvivenza più lunga. Esp(β)<1 decelerates survival time (shorter survival). AFT models assume that estimated time ratios are constant across the time scale. A time ratio of 2, for example, can be interpreted as the median time to death in group 1 is double the median time to death in group 2 (indicated longer survival for group 1).

Alcune distribuzioni di errore possono essere scritte e interpretate sia come modelli PH che AFT (es. esponenziale, Weibull), altre sono solo modelli PH (es. Gompertz) o solo modelli AFT (es. log-logistici) e altre non sono né modelli PH né AFT (ad es. montaggio di una spline).

Quali forme possono assumere i modelli parametrici?

La funzione di rischio può assumere qualsiasi forma purché h(t)>0 per tutti i valori di t. Mentre la considerazione principale per la forma parametrica dovrebbe essere la conoscenza preliminare della forma del rischio di riferimento, ogni distribuzione ha i suoi vantaggi e svantaggi. Alcune delle forme più comuni verranno spiegate brevemente, con maggiori informazioni disponibili nell'elenco delle risorse.

Distribuzione esponenziale

La distribuzione esponenziale assume che h(t) dipenda solo dai coefficienti e dalle covariate del modello e sia costante nel tempo. Il vantaggio principale di questo modello è che è sia un modello a rischi proporzionali sia un modello a tempo di guasto accelerato, in modo che le stime degli effetti possano essere interpretate come rapporti di rischio o rapporti temporali. Lo svantaggio principale di questo modello è che spesso non è plausibile assumere un rischio costante nel tempo.

Distribuzione Weibull

La distribuzione di Weibull è simile alla distribuzione esponenziale. Mentre la distribuzione esponenziale assume un rischio costante, la distribuzione di Weibull assume un rischio monotono che può essere crescente o decrescente, ma non entrambi. Ha due parametri. Il parametro di forma (σ ) controlla se il rischio aumenta (σ1 ) (nella distribuzione esponenziale, questo parametro è impostato su 1). Il parametro di scala, (1/σ)exp(-β0/σ), determina la scala di questo aumento/diminuzione. Poiché la distribuzione di Weibull si semplifica alla distribuzione esponenziale quando =1, l'ipotesi nulla che σ=1 può essere verificata utilizzando un test di Wald. Il vantaggio principale di questo modello è che è sia un modello PH che AFT, quindi è possibile stimare sia i rapporti di rischio che i rapporti temporali. Anche in questo caso, lo svantaggio principale è che l'ipotesi di monotonicità del rischio di base può non essere plausibile in alcuni casi.

Distribuzione Gompertz

La distribuzione di Gompertz è un modello PH uguale alla distribuzione log-Weibull, quindi il log della funzione di rischio è lineare in t. Questa distribuzione ha un tasso di fallimento esponenzialmente crescente ed è spesso appropriata per i dati attuariali, poiché anche il rischio di mortalità aumenta esponenzialmente nel tempo.

Distribuzione Log-Logistica

La distribuzione log-logistica è un modello AFT con un termine di errore che segue la distribuzione logistica standard. Può adattarsi a rischi non monotonici e generalmente si adatta meglio quando il rischio sottostante sale a un picco e poi scende, il che può essere plausibile per alcune malattie come la tubercolosi. La distribuzione log-logistica non è un modello PH, ma è un modello di probabilità proporzionale. Ciò significa che è soggetto all'assunzione di odds proporzionali, ma il vantaggio è che i coefficienti di pendenza possono essere interpretati come rapporti temporali e anche come rapporti odd. Un odds ratio di 2 da un modello log-logistico parametrico, per esempio, verrebbe interpretato come l'odd di sopravvivenza oltre il tempo t tra soggetti con x=1 è il doppio di quello tra soggetti con x=0.

Distribuzione Gamma generalizzata (GG)

La distribuzione gamma generalizzata (GG) è in realtà una famiglia di distribuzioni che contiene quasi tutte le distribuzioni più comunemente usate, comprese le distribuzioni esponenziale, Weibull, log normale e gamma. Ciò consente il confronto tra le diverse distribuzioni. La famiglia GG include anche tutti e quattro i tipi più comuni di funzioni di rischio, il che rende la distribuzione GG particolarmente utile poiché la forma della funzione di rischio può aiutare a ottimizzare la selezione del modello.

Approccio splineline

Poiché l'unica limitazione generale della specifica della funzione di rischio di base è thath(t)>0 per tutti i valori di t, le spline possono essere utilizzate per la massima flessibilità nella modellazione della forma del rischio di base. Le spline cubiche ristrette sono un metodo che è stato recentemente raccomandato in letteratura per l'analisi parametrica della sopravvivenza poiché questo metodo consente flessibilità nella forma, ma limita la funzione ad essere lineare sulle estremità in cui i dati sono sparsi. Le spline possono essere utilizzate per migliorare la stima e sono anche vantaggiose per l'estrapolazione, poiché massimizzano l'adattamento ai dati osservati. Se specificate correttamente, le stime degli effetti dei modelli che utilizzano le spline non dovrebbero essere distorte. Come in altre analisi di regressione, le sfide nell'adattamento delle spline possono includere la scelta del numero e della posizione dei nodi e problemi di adattamento eccessivo.

Come si esamina l'adattamento del modello parametrico?

La componente più importante della valutazione dell'adattamento del modello parametrico è verificare se i dati supportano la forma parametrica specificata. Questo può essere valutato visivamente rappresentando graficamente il rischio cumulativo basato sul modello rispetto alla funzione di rischio cumulativo stimato di Kaplan-Meier. Se la forma specificata è corretta, il grafico deve passare attraverso l'origine con una pendenza di 1. Il test di bontà di adattamento di Grønnesby-Borgan può essere utilizzato anche per stabilire se il numero di eventi osservato è significativamente diverso dal numero di eventi previsto in gruppi differenziati per punteggi di rischio. Questo test è molto sensibile al numero di gruppi scelti e tende a rifiutare troppo liberamente l'ipotesi nulla di un adattamento adeguato se vengono scelti molti gruppi, specialmente in piccoli set di dati. Tuttavia, il test non ha la capacità di rilevare le violazioni del modello, se vengono scelti troppi pochi gruppi. Per questo motivo, sembra sconsigliato fare affidamento solo su un test di bontà di adattamento per determinare se la forma parametrica specificata è ragionevole.

L'AIC può essere utilizzato anche per confrontare i modelli eseguiti con diverse forme parametriche, con l'AIC più basso indicativo del miglior adattamento. Tuttavia, l'AIC non può essere utilizzato per confrontare i modelli parametrici e semiparametrici, poiché i modelli parametrici si basano sui tempi degli eventi osservati ei modelli semiparametrici si basano sull'ordine dei tempi degli eventi. Anche in questo caso, questi strumenti dovrebbero essere utilizzati per esaminare se la forma specificata si adatta ai dati, ma la plausibilità del rischio sottostante specificato è ancora l'aspetto più importante della scelta di una forma parametrica.

Una volta che la forma parametrica specificata è stata determinata per adattarsi bene ai dati, è possibile utilizzare metodi simili a quelli precedentemente descritti per i modelli di rischio semiproporzionali per scegliere tra diversi modelli, come grafici residui e test di bontà di adattamento.

E se i predittori cambiano nel tempo?

Nelle dichiarazioni del modello scritte sopra, abbiamo assunto che le esposizioni siano costanti nel corso del follow-up. Le esposizioni con valori che cambiano nel tempo, o covariate variabili nel tempo, possono essere incluse nei modelli di sopravvivenza cambiando l'unità di analisi dall'individuo al periodo di tempo in cui l'esposizione è costante. Questo suddivide il tempo-persona degli individui in intervalli in cui ogni persona contribuisce all'insieme di rischi di esposti e non esposti per quella covariata. L'assunzione principale di includere una covariata variabile nel tempo in questo modo è che l'effetto della covariata variabile nel tempo non dipende dal tempo.

Per un modello di rischio proporzionale di Cox, l'inclusione di una covariata variabile nel tempo assumerebbe la forma di: h(t) = h0(t)e^β1x1(t). Le covariate variabili nel tempo possono essere incluse anche nei modelli parametrici, sebbene sia un po' più complicato e difficile da interpretare. I modelli parametrici possono anche modellare covariate variabili nel tempo utilizzando spline per una maggiore flessibilità.

Generalmente le covariate variabili nel tempo dovrebbero essere utilizzate quando si ipotizza che il rischio dipenda più dai valori successivi della covariata che dal valore della covariata al basale. Le sfide che sorgono con le covariate variabili nel tempo sono dati mancanti sulla covariata in diversi momenti e una potenziale distorsione nella stima del rischio se la covariata variabile nel tempo è effettivamente un mediatore.

Che cos'è l'analisi dei rischi concorrenti?

I metodi tradizionali di analisi della sopravvivenza presuppongono che si verifichi un solo tipo di evento di interesse. Tuttavia, esistono metodi più avanzati per consentire l'indagine di diversi tipi di eventi nello stesso studio, come la morte per cause multiple. L'analisi dei rischi concorrenti viene utilizzata per questi studi in cui la durata della sopravvivenza è terminata dal primo di numerosi eventi. Sono necessari metodi speciali perché l'analisi del tempo di ciascun evento separatamente può essere distorta. Proprio in questo contesto, il metodo KM tende a sovrastimare la proporzione di soggetti che vivono eventi. L'analisi dei rischi concorrenti utilizza il metodo dell'incidenza cumulativa, in cui la probabilità complessiva dell'evento in qualsiasi momento è la somma delle probabilità specifiche dell'evento. I modelli sono generalmente implementati inserendo ogni partecipante allo studio più volte, una per tipo di evento. Per ogni partecipante allo studio, il tempo di ogni evento è censurato nel momento in cui il paziente ha vissuto il primo evento. Per ulteriori informazioni, consultare la pagina advancedepidemiology.org su rischi concorrenti .

Cosa sono i modelli di fragilità e perché sono utili per i dati correlati?

I dati di sopravvivenza correlati possono sorgere a causa di eventi ricorrenti vissuti da un individuo o quando le osservazioni sono raggruppate in gruppi. O per mancanza di conoscenza o per fattibilità, alcune covariate relative all'evento di interesse potrebbero non essere misurate. I modelli di fragilità tengono conto dell'eterogeneità causata da covariate non misurate aggiungendo effetti casuali, che agiscono in modo moltiplicativo sulla funzione di rischio. I modelli di fragilità sono essenzialmente estensioni del modello di Cox con l'aggiunta di effetti casuali. Sebbene ci siano vari schemi di classificazione e nomenclatura usati per descrivere questi modelli, quattro tipi comuni di modelli di fragilità includono fragilità condivisa, annidata, congiunta e additiva.

Esistono altri approcci per analizzare i dati degli eventi ricorrenti?

I dati degli eventi ricorrenti sono correlati poiché più eventi possono verificarsi all'interno dello stesso soggetto. Mentre i modelli di fragilità sono un metodo per spiegare questa correlazione nelle analisi di eventi ricorrenti, un approccio più semplice che può anche spiegare questa correlazione è l'uso di errori standard robusti (SE). Con l'aggiunta di SE robusti, l'analisi degli eventi ricorrenti può essere eseguita come una semplice estensione di modelli semi-parametrici o parametrici.

Sebbene sia semplice da implementare, esistono diversi modi per modellare i dati degli eventi ricorrenti utilizzando SE robusti. Questi approcci differiscono nel modo in cui definiscono il rischio impostato per ciascuna ricorrenza. In questo modo, rispondono a domande di studio leggermente diverse, quindi la scelta di quale approccio di modellazione utilizzare dovrebbe essere basata sull'ipotesi di studio e sulla validità delle ipotesi di modellazione.

Il processo di conteggio, o approccio di Andersen-Gill, alla modellazione degli eventi ricorrenti presuppone che ogni ricorrenza sia un evento indipendente e non tiene conto dell'ordine o del tipo di evento. In questo modello, il tempo di follow-up per ogni soggetto inizia all'inizio dello studio ed è suddiviso in segmenti definiti da eventi (ricorrenze). I soggetti contribuiscono al rischio fissato per un evento purché siano sotto osservazione in quel momento (non censurati). Questi modelli sono semplici da adattare come un modello di Cox con l'aggiunta di un robusto stimatore SE e gli hazard ratio sono interpretati come l'effetto della covariata sul tasso di recidiva nel periodo di follow-up. Questo modello sarebbe inappropriato, tuttavia, se l'ipotesi di indipendenza non fosse ragionevole.

Gli approcci condizionali presuppongono che un soggetto non sia a rischio per un evento successivo fino a quando non si verifica un evento precedente e quindi tengono conto dell'ordine degli eventi. Sono fit utilizzando un modello stratificato, con il numero di evento (o numero di ricorrenza, in questo caso), come variabile di strati e includendo SE robusti. Esistono due diversi approcci condizionali che utilizzano scale temporali diverse e quindi hanno diversi set di rischi. L'approccio della probabilità condizionata utilizza il tempo dall'inizio dello studio per definire gli intervalli di tempo ed è appropriato quando l'interesse è nel corso completo del processo dell'evento ricorrente. L'approccio del gap time essenzialmente reimposta l'orologio per ogni ricorrenza utilizzando il tempo trascorso dall'evento precedente per definire gli intervalli di tempo ed è più appropriato quando le stime degli effetti specifici dell'evento (o della ricorrenza) sono di interesse.

Infine, gli approcci marginali (noti anche come approccio WLW – Wei, Lin e Weissfeld –) considerano ogni evento come un processo separato, quindi i soggetti sono a rischio per tutti gli eventi dall'inizio del follow-up, indipendentemente dal fatto che abbiano sperimentato un evento precedente. Questo modello è appropriato quando si pensa che gli eventi derivino da diversi processi sottostanti, in modo che un soggetto possa sperimentare un 3° evento, ad esempio, senza sperimentare il 1°. Sebbene questa ipotesi sembri non plausibile con alcuni tipi di dati, come le recidive di cancro, potrebbe essere utilizzata per modellare le recidive di lesioni in un periodo di tempo, quando i soggetti potrebbero subire diversi tipi di lesioni nel periodo di tempo che non hanno un ordine naturale. I modelli marginali possono essere adattati anche utilizzando modelli stratificati con SE robusti.

letture

Questo progetto mirava a descrivere le decisioni metodologiche e analitiche che si possono affrontare quando si lavora con i dati time-to-event, ma non è affatto esaustivo. Le risorse sono fornite di seguito per approfondire questi argomenti.

Libri di testo e capitoli

Vittinghoff E, Glidden DV, Shiboski SC, McCulloch CE (2012). Metodi di regressione in biostatistica, 2nd New York, NY: Springer.

  • Testo introduttivo ai modelli lineari, logistici, di sopravvivenza ea misure ripetute, ideale per coloro che desiderano un punto di partenza di base.

  • Il capitolo sull'analisi della sopravvivenza fornisce una buona panoramica ma non approfondita. Gli esempi sono basati su STATA.

Hosmer DW, Lemeshow S, May S. (2008) Analisi di sopravvivenza applicata: modellazione di regressione dei dati Time-to-Event, 2a ed. Hoboken, NJ: John Wiley & Sons, Inc.

  • Panoramica approfondita dei modelli Cox non parametrici, semiparametrici e parametrici, ideali per coloro che sono esperti in altre aree della statistica. Le tecniche avanzate non sono trattate in modo approfondito, ma sono forniti riferimenti ad altri libri di testo specialistici.

Kleinbaum DG, Klein M (2012). Analisi della sopravvivenza: un testo di autoapprendimento, 3a ed. New York, NY: Springer Science + Business Media, LLC

  • Ottimo testo introduttivo

Klein JP, Moeschberger ML (2005). Analisi di sopravvivenza: tecniche per dati censurati e troncati, 2a ed. New York, NY: Springer Science + Business Media, LLC

  • progettato per studenti laureati, questo libro fornisce molti esempi pratici

Therneau TM, Grambsch PM (2000). Modellazione dei dati di sopravvivenza: estensione del modello di Cox. New York, NY: Springer Science + Business Media, LLC

  • Buona introduzione all'approccio al processo di conteggio e all'analisi dei dati di sopravvivenza correlati. L'autore ha anche scritto il pacchetto di sopravvivenza in R

Allison PD (2010). Analisi di sopravvivenza utilizzando SAS: una guida pratica, 2a ed. Cary, NC: Istituto SAS

  • Un ottimo testo applicato per gli utenti SAS

Bagdonavicio V, Nikulin M (2002). Modelli di vita accelerata: modellazione e analisi statistica. Boca Raton, FL: Chapman & Hall/CRC Press.

  • Buona risorsa per ulteriori informazioni sui modelli di tempo di guasto accelerato parametrici e semiparametrici e come si confrontano con i modelli di rischio proporzionale

Articoli metodologici

Articoli introduttivi/panoramici

Hougaard P (1999). Fondamenti dei dati di sopravvivenza. Biometria 55(1): 13-22. PMID: 11318147 .

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analisi della sopravvivenza parte I: concetti di base e prime analisi. Fr. J Cancro 89(2): 232-8. PMID: 12865907

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analisi di sopravvivenza parte II: analisi dei dati multivariati – un'introduzione a concetti e metodi. Fr. J Cancro 89 (3): 431-6. PMID: 1288808

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analisi di sopravvivenza parte II: analisi multivariata dei dati: scelta di un modello e valutazione della sua adeguatezza e adattamento. Fr. J Cancro 89(4): 605-11. PMID: 12951864

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analisi di sopravvivenza parte IV: ulteriori concetti e metodi nell'analisi di sopravvivenza. Fr. J Cancro 89(5): 781-6. PMID: 12942105

  • La serie di quattro articoli sopra è un'eccellente panoramica introduttiva dei metodi nell'analisi della sopravvivenza che è estremamente ben scritta e facile da capire: è altamente raccomandata.

L'età come scala temporale

Korn EL, Graubard BI, Midthune D (1997). Analisi time-to-event del follow-up longitudinale di un'indagine: scelta della scala temporale. Am J Epidemiol 145(1):72-80. PMID: 8982025

  • Documento che sostiene l'uso dell'età come scala temporale piuttosto che del tempo dedicato allo studio.

Ingram DD, Makuc DM, Feldman JJ (1997). Re: Analisi time-to-event del follow-up longitudinale di un'indagine: scelta della scala temporale. Am J Epidemiol 146(6):528-9. PMID: 9290515 .

  • Commenta il documento Korn che descrive le precauzioni da prendere quando si utilizza l'età come scala temporale.

Thiébaut AC, Bénichou J (2004). Scelta della scala temporale nell'analisi del modello di Cox dei dati di coorte epidemiologica: uno studio di simulazione. Stat Med 30;23(24):3803-20. PMID: 15580597

  • Studio di simulazione che mostra l'entità del bias per diversi gradi di associazione tra l'età e la covariata di interesse quando si utilizza il tempo di studio come scala temporale.

Canchola AJ, Stewart SL, Bernstein L, et al. Regressione di Cox utilizzando differenti scale temporali. Disponibile a: http://www.lexjansen.com/wuss/2003/DataAnalysis/i-cox_time_scales.pdf .

  • Un bel documento che confronta 5 modelli di regressione di Cox con variazioni sul tempo di studio o sull'età come scala temporale con il codice SAS.

censura

Huang CY, Ning J, Qin J (2015). Inferenza di verosimiglianza semiparametrica per dati troncati a sinistra e censurati a destra. Biostatistica [epub] PMID: 25796430 .

  • Questo documento ha una bella introduzione all'analisi dei dati censurati e fornisce una nuova procedura di stima per la distribuzione del tempo di sopravvivenza con dati troncati a sinistra e censurati a destra. È molto denso e ha un focus statistico avanzato.

Cain KC, Harlow SD, Little RJ, Nan B, Yosef M, Taffe JR, Elliott MR (2011). Bias dovuto al troncamento sinistro e alla censura sinistra negli studi longitudinali dei processi di sviluppo e di malattia. Am J Epidemiol 173(9):1078-84. PMID: 21422059 .

  • Una risorsa eccellente che spiega il pregiudizio inerente ai dati censurati a sinistra da una prospettiva epidemiologica.

Sole J, Sole L, Zhu C (2007). Test del modello di probabilità proporzionale per i dati censurati a intervalli. Lifetime Data Anal 13:37–50. PMID 17160547 .

  • Un altro articolo statisticamente denso su un aspetto sfumato dell'analisi dei dati TTE, ma fornisce una buona spiegazione dei dati censurati a intervalli.

Robins JM (1995a) Un metodo analitico per studi randomizzati con censura informativa: Parte I. Lifetime Data Anal 1: 241-254. PMID 9385104 .

Robins JM (1995b) Un metodo analitico per studi randomizzati con censura informativa: Parte II. Dati a vita Anale 1: 417–434. PMID 9385113 .

  • Due documenti che discutono i metodi per affrontare la censura informativa.

Metodi di sopravvivenza non parametrici

Borgan Ø (2005) Stimatore Kaplan-Meier. Enciclopedia di biostatistica DOI: 10.1002 / 0470011815.b2a11042

ms master of science
  • Eccellente panoramica dello stimatore Kaplan-Meier e della sua relazione con lo stimatore Nelson-Aalen

Rodríguez G (2005). Stima non parametrica nei modelli di sopravvivenza. Disponibile da: http://data.princeton.edu/pop509/NonParametricSurvival.pdf

  • Introduzione ai metodi non parametrici e al modello di rischio proporzionale di Cox che spiega le relazioni tra i metodi con le formule matematiche

Cole SR, Hernan MA (2004). Curve di sopravvivenza aggiustate con pesi di probabilità inversi. Programmi di metodi di calcolo Biomed 75 (1): 35-9. PMID: 15158046

  • Descrive l'uso di IPW per creare curve di Kaplan-Meier regolate. Include un esempio e una macro SAS.

Zhang M (2015). Metodi robusti per migliorare l'efficienza e ridurre i bias nella stima delle curve di sopravvivenza negli studi clinici randomizzati. Dati a vita Anale 21 (1): 119-37. PMID: 24522498

  • Metodo proposto per le curve di sopravvivenza aggiustate per covariate negli RCT

Metodi di sopravvivenza semiparametrici

Cox DR (1972) Modelli di regressione e tavole di vita (con discussione). JR Statist Soc B 34: 187-220.

  • Il riferimento classico.

Christensen E (1987) Analisi della sopravvivenza multivariata utilizzando il modello di regressione di Cox. Hepatology 7: 1346-1358. PMID 3679094 .

  • Descrive l'uso del modello di Cox utilizzando un esempio motivante. Eccellente revisione degli aspetti chiave dell'analisi del modello Cox, incluso come adattare un modello Cox e il controllo delle ipotesi del modello.

Grambsch PM, Therneau TM (1994) Prove di rischio proporzionali e diagnostica basate su residui ponderati. Biometrika 81: 515-526.

  • Un documento approfondito sulla verifica dell'assunzione dei rischi proporzionali. Buon mix di teoria e spiegazione statistica avanzata.

Ng'andu NH (1997) Un confronto empirico di test statistici per valutare l'assunzione di rischi proporzionali del modello di Cox. Stat Med 16: 611–626. PMID 9131751 .

  • Un altro documento approfondito sulla verifica dell'assunzione dei rischi proporzionali, questo include la discussione sul controllo dei residui e degli effetti della censura.

Metodi di sopravvivenza parametrici

Rodrίguez, G (2010). Modelli parametrici di sopravvivenza. Disponibile da: http://data.princeton.edu/pop509/ParametricSurvival.pdf

  • breve introduzione alle distribuzioni più comuni utilizzate nell'analisi parametrica di sopravvivenza

Nardi A, Schemper M (2003). Confronto tra modelli di Cox e parametrici negli studi clinici.Stat Med 22 (23): 2597-610. PMID: 14652863

  • Fornisce buoni esempi di confronto di modelli semiparametrici con modelli che utilizzano distribuzioni parametriche comuni e si concentra sulla valutazione dell'adattamento del modello

Royston P, Parmar MK (2002). Modelli parametrici a rischio proporzionale e a probabilità proporzionale flessibili per dati di sopravvivenza censurati, con applicazione alla modellazione prognostica e alla stima degli effetti del trattamento. Stat Med 21(15): 2175-97. PMID: 12210632

  • Buona spiegazione per le basi dei rischi proporzionali e modelli odd e confronti con spline cubiche

Cox C, Chu H, Schneider MF, Muñoz A (2007). Analisi parametrica di sopravvivenza e tassonomia delle funzioni di rischio per la distribuzione gamma generalizzata. Statista Med 26:4352–4374. PMID 17342754 .

  • Fornisce un'eccellente panoramica dei metodi di sopravvivenza parametrica, inclusa una tassonomia delle funzioni di rischio e una discussione approfondita della famiglia di distribuzione gamma generalizzata.

Crowther MJ, Lambert PC (2014). Un quadro generale per l'analisi parametrica della sopravvivenza.Stat Med 33(30): 5280-97. PMID: 25220693

  • Descrive le ipotesi restrittive delle distribuzioni parametriche comunemente usate e spiega la metodologia della spline cubica ristretta

Sparling YH, Younes N, Lachin JM, Bautista OM (2006). Modelli di sopravvivenza parametrici per dati censurati a intervalli con covariate dipendenti dal tempo. Biometria 7 (4): 599-614. PMID: 16597670

  • Estensione ed esempio di come utilizzare modelli parametrici con dati censurati a intervalli

Covariate variabili nel tempo

Fisher LD, Lin DY (1999). Covariate dipendenti dal tempo nel modello di regressione dei rischi proporzionali di Cox. Annu Rev Public Health 20: 145-57. PMID: 10352854

  • Spiegazione completa e di facile comprensione delle covariate variabili nel tempo nei modelli di Cox, con un'appendice matematica

Petersen T (1986). Fitting di modelli parametrici di sopravvivenza con covariate dipendenti dal tempo. Statista Appl 35(3): 281-88.

  • Articolo denso, ma con un utile esempio applicato

Analisi del rischio competitivo

Vedi Rischi Concorrenti

Tai B, Machin D, White I, Gebski V (2001) Analisi dei rischi competitivi dei pazienti con osteosarcoma: confronto tra quattro diversi approcci. Stat Med 20: 661–684. PMID 11241570 .

  • Buon articolo approfondito che descrive quattro diversi metodi di analisi dei dati sui rischi concorrenti e utilizza i dati di uno studio randomizzato di pazienti con osteosarcoma per confrontare questi quattro approcci.

Checkley W, Brower RG, Munoz A (2010). Inferenza per eventi concorrenti che si escludono a vicenda attraverso una miscela di distribuzioni gamma generalizzate. Epidemiologia 21(4): 557-565. PMID 20502337 .

  • Documento sui rischi concorrenti utilizzando la distribuzione gamma generalizzata.

Analisi di dati cluster e modelli di fragilità

Yamaguchi T, Ohashi Y, Matsuyama Y (2002) Modelli di rischi proporzionali con effetti casuali per esaminare gli effetti centrali negli studi clinici multicentrici sul cancro. Metodi Stat Med Ris 11: 221-236. PMID 12094756 .

  • Un documento con un'eccellente spiegazione teorica e matematica di prendere in considerazione il clustering quando si analizzano i dati di sopravvivenza da studi clinici multicentrici.

O'Quigley J, Stare J (2002) Modelli di rischi proporzionali con fragilità ed effetti casuali. Stat Med 21: 3219–3233. PMID 12375300 .

  • Un confronto diretto tra modelli di fragilità e modelli a effetti casuali.

Balakrishnan N, Peng Y (2006). Modello di fragilità gamma generalizzata. Statista Med 25: 2797-2816. PMID

  • Un articolo sui modelli di fragilità che utilizzano la distribuzione gamma generalizzata come distribuzione di fragilità.

Rondeau V, Mazroui Y, Gonzalez JR (2012). frailtypack: un pacchetto R per l'analisi dei dati di sopravvivenza correlati con modelli di fragilità che utilizzano la stima di verosimiglianza penalizzata o la stima parametrica. Journal of Statistical Software 47(4): 1-28.

  • Vignetta del pacchetto R con buone informazioni di base sui modelli fragili.

Schaubel DE, Cai J (2005). Analisi dei dati di eventi ricorrenti raggruppati con applicazione ai tassi di ospedalizzazione tra i pazienti con insufficienza renale. Biostatistica 6(3):404-19. PMID 15831581 .

  • Ottimo articolo in cui gli autori presentano due metodi per analizzare i dati di eventi ricorrenti raggruppati e quindi confrontano i risultati dei modelli proposti con quelli basati su un modello di fragilità.

Gharibvand L, Liu L (2009). Analisi dei dati di sopravvivenza con eventi raggruppati. SAS Global Forum 2009 Documento 237-2009.

  • Fonte succinta e di facile comprensione per l'analisi dei dati time to event con eventi in cluster con procedure SAS.

Analisi di eventi ricorrenti

Twisk JW, Smidt N, de Vente W (2005). Analisi applicata di eventi ricorrenti: una panoramica pratica. J Epidemiol Community Health 59(8): 706-10. PMID: 16020650

  • Introduzione molto facile da capire alla modellazione di eventi ricorrenti e al concetto di set di rischio

Villegas R, Juliá O, Ocaña J (2013). Studio empirico dei tempi di sopravvivenza correlati per eventi ricorrenti con margini di rischio proporzionali e l'effetto di correlazione e censura.BMC Med Res Methodol 13:95. PMID: 23883000

  • Utilizza simulazioni per testare la robustezza di diversi modelli per dati di eventi ricorrenti

Kelly PJ, Lim LL (2000). Analisi di sopravvivenza per dati di eventi ricorrenti: un'applicazione alle malattie infettive infantili. Med 19 (1): 13-33. PMID: 10623190

  • Esempi applicati dei quattro approcci principali per la modellazione di dati di eventi ricorrenti

Wei LJ, Lin DY, Weissfeld L (1989). Analisi di regressione di dati di tempo di guasto incompleto multivariato modellando distribuzioni marginali. Journal of American Statistical Association84 (108): 1065-1073

L'articolo originale che descrive i modelli marginali per l'analisi degli eventi ricorrenti

Corsi

Epidemiologia e salute della popolazione Summer Institute presso la Columbia University (EPIC)

Statistical Horizons, fornitore privato di seminari di statistica specializzati tenuti da esperti del settore

Programma estivo del Consorzio interuniversitario per la ricerca politica e sociale (ICPSR) in metodi quantitativi di ricerca sociale, parte dell'Istituto per la ricerca sociale dell'Università del Michigan

  • Seminario di 3 giorni sull'analisi della sopravvivenza, sulla modellazione della cronologia degli eventi e sull'analisi della durata offerto dal 22 al 24 giugno 2015 a Berkeley, in California, tenuto da Tenko Raykov della Michigan State University. Panoramica completa dei metodi di sopravvivenza tra le discipline (non solo la salute pubblica): http://www.icpsr.umich.edu/icpsrweb/sumprog/courses/0200

Institute for Statistics Research offre due corsi online per l'analisi della sopravvivenza, offerti più volte all'anno. Questi corsi si basano sul libro di testo di analisi applicata di Klein e Kleinbaum (vedi sotto) e possono essere seguiti à la carte o come parte di un programma di certificazione in Statistica:

  • Introduzione all'analisi della sopravvivenza, con un focus sui modelli semiparametrici di Cox, insegnata da David Kleinbaum o Matt Strickland: http://www.statistics.com/survival/

  • Analisi di sopravvivenza avanzata, inclusi modelli parametrici, analisi di ricorrenza e modelli di fragilità, insegnati da Matt Strickland: http://www.statistics.com/survival2/

L'Istituto per la ricerca e l'istruzione digitale dell'UCLA offre quelli che chiamano seminari attraverso il loro sito Web per l'analisi della sopravvivenza in diversi software statistici. Questi seminari dimostrano come condurre un'analisi di sopravvivenza applicata, concentrandosi più sul codice che sulla teoria.

Articoli Interessanti

Scelta Del Redattore

CEO di Antena 3 v. Extraconfidencial, S.L.
CEO di Antena 3 v. Extraconfidencial, S.L.
Columbia Global Freedom of Expression cerca di far progredire la comprensione delle norme e delle istituzioni internazionali e nazionali che meglio proteggono il libero flusso di informazioni e di espressione in una comunità globale interconnessa con importanti sfide comuni da affrontare. Per raggiungere la sua missione, Global Freedom of Expression intraprende e commissiona ricerche e progetti politici, organizza eventi e conferenze, partecipa e contribuisce ai dibattiti globali sulla protezione della libertà di espressione e di informazione nel 21° secolo.
I vantaggi P-EBT consentono alle famiglie degli studenti di New York di acquistare più cibo
I vantaggi P-EBT consentono alle famiglie degli studenti di New York di acquistare più cibo
Il Teachers College, Columbia University, è la prima e più grande scuola di specializzazione negli Stati Uniti e anche perennemente classificata tra le migliori della nazione.
La pittrice più famosa del Rinascimento italiano di cui non hai mai sentito parlare
La pittrice più famosa del Rinascimento italiano di cui non hai mai sentito parlare
Il nuovo libro del professor Michael Cole, 'La lezione di Sofonisba', illumina il lavoro di un'artista in anticipo sui tempi.
Alumni della Columbia immaginaria: edizione cinematografica
Alumni della Columbia immaginaria: edizione cinematografica
Calendari
Calendari
Dennis v. Stati Uniti
Dennis v. Stati Uniti
Columbia Global Freedom of Expression cerca di far progredire la comprensione delle norme e delle istituzioni internazionali e nazionali che meglio proteggono il libero flusso di informazioni e di espressione in una comunità globale interconnessa con importanti sfide comuni da affrontare. Per raggiungere la sua missione, Global Freedom of Expression intraprende e commissiona ricerche e progetti politici, organizza eventi e conferenze, partecipa e contribuisce ai dibattiti globali sulla protezione della libertà di espressione e di informazione nel 21° secolo.
Studi postcoloniali
Studi postcoloniali