Site Overlay

å Utvikle en Weibull-Modellen Extension for å Beregne Kreft Ventetid

Abstrakt

Den matematiske modellen som omtales i denne artikkelen presenterer en teknikk for å estimere lengden av kreft er stille vekst i perioden. Metodikken er beskrevet benytter seg av informasjon som er innhentet fra observert kreft forekomsten å rekonstruere hva er forsiktig antatt å være den periode fra ondartet kreft innvielse til diagnose. Analyser viser en synkende fare for kreft som indikerer at jo lenger pasienten overlever, jo mer sannsynlig er det at de er til å nå den øvre grensen av deres naturlige levetid., Basert på tidligere forskning, Weibull distribution har blitt brukt for å beskrive mekanismene for kreftutvikling. I motsetning til memoryless eksponentiell fordeling som forutsetter en konstant feilrate, i form av Weibull distribution er avhengig av tidligere hendelser og bevarer et minne om før overlevelse. Dette gir en enkel, men effektiv måte å karakterisere hvordan de uobserverte opplevelse av kreft relatert til observert som en funksjon for å beregne tid mellom alder og diagnose., Resultatene indikerer en mulighet for tidlig intervensjon når kreft er mest treatable. Metoden som presenteres gir nyttig informasjon for å identifisere kreft med høy dødelighet, og lengre perioder med uoppdaget vekst for å skille mellom typer av dire folkehelsen.

1. Innledning

Overlevelse analyse statistikk i kreftforskning er ofte rapportert i form av individuell overlevelse fra diagnosetidspunktet. Når utnytte kreftregisteret data, sann tid der ondartet kreft celler utviklet i kroppen er ukjent fordi det er ofte ingen indikasjon., Den vanlige tegn og symptomer som er karakteristiske for kreft kan være måneder, om ikke år, borte. Utløsende faktorer kan handle i rekkefølge for å iverksette eller fremme carcinogenesis, og ti år eller mer ofte passere mellom eksponering for ytre faktorer og synlig kreft . Mer enn en tredjedel av alle Amerikanere vil bli diagnostisert med kreft gang i sitt liv. Selv om deres sykdom kan være usynlig nå, det utgjør en stor, og i stor grad unexamined, mulighet til å finne og behandle sine kreft tidlig ., Tidlig påvisning representerer en av de mest lovende tilnærminger for å redusere de voksende kreft byrden ved å identifisere kreft mens det er lokalisert og kureres, hindrer ikke bare jorden, men også å redusere sykelighet og kostnader .

De to-parameter Weibull distribution er en populær levetid modell som ofte brukes i biomedisin overlevelse analyse for å beskrive aldersspesifikke dødelighet og feilrater ., Fordi Weibull distribution gjør ingen antakelser om form av den underliggende fare distribusjon, kombinert med fleksibilitet til å modellere øke og redusere fare funksjoner, det har blitt brukt med hell i mange applikasjoner som et rent empirisk modell, selv i tilfeller der det er liten eller ingen teoretisk begrunnelse . Forskning som er utført av Kravchenko et al. og Manton et al. brukt en fem-parameteren versjon av svakhetene modell med en Weibull baseline for å karakterisere kreftfremkallende mekanismer, inkludert forsinkelser periode (dvs., perioden mellom forekomsten av de første ondartet kreft celle og dato for kreft utbruddet) for utvalgte kreft histotypes. Mdzinarishvili og Sherman brukt Armitage-Doll modell og konkluderte med at kreft insidens data er konsistent med en Weibull-modellen av carcinogenesis justert for alder av første eksponering.

I dette notatet beskriver vi en metodikk som bruker den populære to-parameter Weibull-modellen som rammeverk og utvikle en betinget Weibull overlevelse modell som står for antagelsen om at den enkelte overlevd frem til diagnosen., Ved hjelp av enkel lineær regresjon metoder vi bruker informasjon som er innhentet fra observert forekomst av data for å beregne lengden av kreft ventetid periode. Når faren pris endrer seg over tid, sannsynligheten for svikt er avhengig av tid, og Weibull fordeling gir et «minne» av tidligere overlevelse tid for en observasjon . Den Weibull-modellen extension gir informasjon-drevet og populasjon-nivå slutninger om kreft ventetid ganger for å bidra til å utvikle effektive og praktiske retningslinjer for screening og identifisere områder for forbedring.

2. Metoder

2.1., Introduksjon til Overlevelse Analyse

Den statistiske analysen av livet data er et viktig tema i mange områder, inkludert den biomedisinske, ingeniør -, og samfunnsfag . Overlevelse analyse innebærer generelt modellering av tid-til-event data der utfallet er tid til svikt av noen sykdom eller tilstand. Fag som påbegynner studiet på ulike tider har ulike lengder av oppfølging for de observerte feil tid., Et særtrekk for å overleve analyse er at det lykkes inneholder informasjon fra sensurert og avkortet, eller er ufullstendige, observasjoner, noe som gjør den til den mest praktiske metoden for type analyse.

2.2. Estimere Overlevelse Funksjon

begrepene overlevelse og faresetninger er viktig for å forstå overlevelse analyse. Overlevelsen kurven gir uttrykk for den samlede virkningen av den risiko en person, og hazard-funksjonen karakteriserer endring av overlevelse funksjon over tid., Dette indikerer at overlevelsen er raskt avtagende, fare er høy; hvis overlevelse kurve er konstant fare er null .

La oss anta at det er en ikke-negative kontinuerlige tilfeldige variable som representerer liv av mennesker i noen befolkningen. Overlevelse tid kan uttrykkes som lengden av tid fra kreft innvielse til kreft-spesifikke død, når døden inntreffer. Det er også antatt at overlevelse ganger er uavhengige og sensurere mekanisme som oppstår er uninformative., Overlevelse-funksjonen , brukes til å anslå sannsynligheten for å overleve utenfor tiden , som følger: survivor-funksjonen er en monotont avtagende kontinuerlig funksjon der og . Det er antatt ved starten av studien at alle fag er i live og i tid lik , og sannsynligheten for å overleve er 0 siden til slutt alle mennesker må bukke til døden.,

The hazard-funksjonen, som er merket av , gir den umiddelbare risikoen for å dø i tid , gitt at hendelsen har ennå ikke skjedd og det kan defineres som Den fare funksjon beskriver hvordan risiko for svikt varierer med tid og gir et nyttig verktøy for å forstå de underliggende fordelingen av overlevelse ganger . Hvis du For eksempel angir tiden fra kreft innvielse til død av kreft og tilsvarende fare-funksjonen , reduserer over tid, den betingede sannsynligheten for å dø av kreft reduseres hver måned pasienten overlever, gitt overlevelse opp til den tiden av interesse.,

for Å estimere overlevelse funksjon, Kaplan-Meier produkt-limit estimator metoden ble brukt. Denne metoden er en nonparametric maximum likelihood-funksjonen av overlevelse funksjon som brukes til å beregne overlevelse sannsynligheter som en funksjon av tiden. Denne metoden er gunstig fordi det gir ingen antakelse om den underliggende fordelingen av overlevelse ganger og har blitt den mest brukte tilnærmingen til overlevelse analyse i medisin ., Denne metoden fungerer ved å estimere overlevelse sannsynligheten på hvert intervall ved hjelp av antall pasienter som overlevde, delt på antall pasienter i faresonen. I hvert intervall, pasienter som er vurdert til å være «at risk» hvis de har ennå ikke opplevd hendelsen. Pasienter tapt for oppfølging, eller rett sensurert, er ekskludert fra «i faresonen» pool. Til slutt, sannsynligheten for å overleve til enhver tid er estimert ved hjelp av den kumulative sannsynligheten for å overleve hver av de foregående tidsintervallene.

Vi anta et utvalg av uavhengige observasjoner med tilgjengelig overlevelse ganger merket med ., Å la være bestilt feil ganger, Kaplan-Meier-estimator kan defineres som Her, representerer antall personer med risiko for å dø like før annen , inkludert de som vil dø i tid , og er antall dødsfall observert i tid . På et bestemt tidspunkt, observerte sannsynligheten for død er . Den nonparametric Kaplan-Meier estimater av survivorship funksjonen ble brukt til å utvikle en logg overlevelse tid modell og en log-log overlevelse tid modell., Parameter verdier for den lineære regresjonsmodeller ble brukt for å simulere ventetid perioden som er nærmere omtalt i Avsnitt 2.4.

2.3. Weibull Fordeling

The Weibull-modellen er mye brukt i overlevelse analyse, og har vist seg å passe data som involverer tid til å forekomsten av svulster eller død i dyr utsatt for kreftfremkallende fornærmelser over tid . Gjedde og Peto og Lee ga en teoretisk motivasjon for anvendelse av Weibull-modellen til å passe data involverer tid før utseendet av en svulst eller død i dyr utsettes for kreftfremkallende fornærmelser over tid .,

Som tidligere nevnt, antar vi at observasjonene er tilgjengelige på uavhengig feil ganger av individer om hvor de representerer tid til å mislykkes. La være en Weibull tilfeldig variabel som representerer manglende tid til en vilkårlig person. Sannsynligheten for distribusjon av kan være beskrevet av sannsynlighetstetthetsfunksjonen (pdf), slik at tilsvarende Weibull overlevelse funksjon er Forskjellige verdier i form parameter , kan ha en betydelig innvirkning på atferden til Weibull fordeling og til og med føre til at det å redusere til andre distribusjoner ., Hvis fordelingen reduserer til den eksponentielle fordelingen som forutsetter konstant fare over en levetid, og er memoryless. Den memoryless eiendom indikerer at en fremtidig hendelse, målt fra noen øyeblikk i tid, er forventet å skje i tide uavhengig av når den siste hendelsen skjedde .

Når er det stor sannsynlighet for å overleve på hver etterfølgende er avhengig av tidligere overlevelse, og Weibull fordeling beholder en «minne» av tidligere overlevelse ganger. Typiske verdier variere avhengig av programmet, men distribusjoner med i området 0,5 til 3 er hensiktsmessig ., I denne analysen har vi funnet noe som indikerer en nedgang i fare. Dette betyr at formen på fordelingen for de observerte overlevelse feil ganger er en funksjon av de underliggende fordelingen for uobserverte overlevelse ganger, noe som tillater oss å anslå lengden av kreft ventetid periode.

2.4. Weibull-Modellen Extension

Utnytte betinget sannsynlighet teori og den populære to-parameter Weibull-modellen som våre rammebetingelser, har vi utviklet en matematisk modell for å forklare at forutsetningen om individuell overlevelse frem til diagnosen., Ved å innføre denne ekstra parameter og utnytte minne eiendom Weibull fordeling, kan vi gjenopprette hva vi forsiktig mener tiden mellom kreft oppstart og diagnose. Ved hjelp av informasjon fra observert forekomst i tilgjengelige data fra kreftregistrene, vår analyse viste at Weibull form parameter , var strengt mindre enn 1 for alle kreftformer. Fordi fare funksjon reduseres over tid, distribusjon har et sterkt minne av før overlevelse ganger noe som er en avgjørende faktor i denne analysen.,

for Å illustrere tidslinjen av hendelser, Figur 1 viser en skjematisk fremstilling av rekken av kreft hendelser. Den første hendelsen til å skje er initiering av sykdom, den andre hendelsen er kreft diagnose der saken er anmeldt til den lokale kreftregisteret, og den tredje hendelsen er tidspunktet for dødsfallet eller studere endepunkt. Ventetid periode er definert som tiden mellom kreft oppstart og diagnose, som vi ønsker å estimere. Den enkelte er sant at livet kan være representert ved lengden av tid fra kreft innvielse til døden.,

– >

Figur 1

Tidslinjen av hendelser som viser den uobserverte og observerte perioder av kreft begynnelsen på den tiden av sykdom initiering.,

ved Hjelp av Weibull overlevelse funksjonen i (5) som utgangspunkt, den betingede sannsynligheten for å overleve utover tid , gitt pasienten overlevelse frem til diagnose, kan være representert ved funksjonen I denne modellen, lengden på ventetiden perioden er utpekt av lag parameter, formet som parameter, og omfanget parameter . Hver representerer den tid en person ble observert fra den tid av kreft diagnose til kreft-spesifikke død eller studere endepunkt.

2.5., Estimering av modellparametre

Kaplan-Meier metoden ble brukt til å estimere overlevelse sannsynligheter som ble brukt som resultat variabel i vår modell. For denne analysen, vi bruker lineær regresjon metoder for å beregne Weibull-modellen parametere på grunn av deres computational enkelhet og brukervennlighet grafisk tolkning . Den Weibull-modellen har den viktige egenskapen at ln (−ln) er lineær med ln hvor regresjonsligningen har skråningen, og fange opp, ln () .,

Utnytte de metoder som er skissert av Nadler og Zurbenko , omtrentlig sannsynligheten verdien av ventetid perioden , kan beregnes ved hjelp av følgende formel: Denne funksjonen representerer tiden der log-transformert overlevelse estimat , regressed på , er lik den korreksjonsfaktor ., For å finne verdien av , vi plotte logg negative logg av theKaplan-Meier estimater mot den naturlige logaritmen av tid og finne ut skråningen av regresjonsligningen til Å bestemme hvilken modell-parametre, og den log-transformert betinget Kaplan-Meier estimater var regressed på tide med skjæringspunkt, og skråningen, Dette tilnærming gir en enkel og rask måte å beregne ventetid kreft periode når det fare pris endrer seg over tid.

2.6., Data

Månedlige observasjoner av nylig diagnostiserte voksne kreft tilfeller i Usa ble innhentet for perioden 1973-2008 tilgjengelig gjennom Overvåking, Epidemiologi og sluttresultatet (SEER -) Program. SEEREN er et nasjonalt register for kreft som er bestilt av National Cancer Institute, som begynte å opprettholde registreringer av pasienter med kreft i 1973 . Fra dette datasettet, kreft nettstedet, dato for diagnose, sammendrag scenen, svulst sekvens nummer, og vital status ble brukt i analysen.,

typer kreft valgt for denne analysen ble begrenset til de med høy dødelighet og begrenset tilgjengelighet av effektive behandlingstilbud slik at sykdommen å følge sitt naturlige løp, noe som reduserer potensielle skjevheter. Høy dødelighet maksimere mengden av informasjon som er kjent for å forskeren slik at mer presise estimater. Totalt 6 in situ og invasive primære kreft ble valgt ut og analysert med en total utvalgsstørrelse av 556,696. Disse krefttypene inkluderer akutt myelogen leukemi, hjerne, lever, lunge og luftrøret ble, bukspyttkjertel og magesekk., Hendelsene ble vurdert i tilfeller hvor årsaken til dødsfallet var kreft-spesifikke.

3. Resultater og Diskusjon

betinget overlevelse plottet i Figur 2 tyder på at Weibull form parameter , er synkende, og deretter stabiliserer seg over tid for alle typer kreft som bekrefter at Weibull fordeling gir et minne om før overlevelse observasjoner. Overlevelsen kurver indikerer at risikoen for svikt reduseres over tid som kan tilskrives svake individer, forsvinner raskt etter diagnose og sterkere enkeltpersoner overleve i lange perioder av gangen., Melanom har den høyeste raten for overlevelse med 80% av pasientene er overlevende 30 år etter diagnose. Brystkreft har også en relativt høy 30-års overlevelse med 58% av pasientene er overlevende 30 år etter diagnose. Lunge kreft har en dystre prognose med 6.4% av pasientene er overlevende 30 år etter diagnose; kreft i bukspyttkjertelen er lik med 98% av pasienter døde i løpet av tretti år med diagnosen.,

– >

Figur 2

Observert betinget overlevelse tomter med Weibull form parameter for melanom, brystkreft, lungekreft og kreft i bukspyttkjertelen.

Tidlig diagnose av kreft kan oppstå økt screening praksis og kan endre det naturlige forløpet av sykdommen. Innsamling av SEER data startet i 1973, og tilgjengeligheten av kreft screenings og effektiv behandling for brystkreft melanom og kreft har økt dramatisk i de siste 20 årene., I noen tilfeller, rutine visninger kan identifisere lesjoner hos pasienter som ellers kanskje aldri har vært diagnostisert i løpet av livet. Disse skjevheter, kjent som lead-time bias og overdiagnosis bias, kan påvirke vår evne til å generalisere resultatene fra et utvalg til populasjon. I et forsøk på å unngå slike potensielle skjevheter, kreft med lav dødelighet og kjent behandling kurs (dvs., bryst og melanom) ble ekskludert fra denne analysen.,

I Figur 3, er en grafisk representasjon av den metoden som er vist der omtrentlig anslag er brukt til å bestemme tid mellom lungekreft oppstart og diagnose for alle stadier av sykdommen kombinert. Den Weibull form parameter for alle-scenen lungekreft var 0.57, og korreksjonsfaktor var 0.735. Ved å utvide den lineære regresjonsligningen til å peke 0.735 på -aksen, kan vi beregne ventetid periode for lungekreft for å være 13.6 år. Modellen parameter estimater ble innhentet ved hjelp av (7), (8) og (9)., Totalt er vi fant Weibull regresjonsmodell montering av data utrolig godt med en gjennomsnittlig kvadratmeter verdi av 93.3. Modellen restene ble tilfeldig fordelt om regresjons-linje antyder ingen underliggende trender.

– >

Figur 3

Beregne den omtrentlige tiden for lungekreft initiation bruke Weibull-modellen extension.,

Søker Weibull-modellen utvidelse til et delsett av kreft i SEER-data, har vi bestemt lengde av ventetid perioder og presentert disse estimatene i Figur 4. Vær oppmerksom på at disse anslagene er stratifisert av kreft, type, men omfatter alle stadier kombinert. Modellen kan videre stratifisert som nødvendig, så lenge prøven størrelser forbli stor. I Figur 4, akutt myelogen leukemi har den lengste anslått ventetid periode på 25.75 år, magesekk kreft er den nest lengste ventetid periode på 22.,86 år, og kreft i hjernen har en anslått ventetid periode på 21.87 år. I bukspyttkjertelen, leveren og lungene kreft har forholdsvis kort ventetid perioder alt fra 8.59 år til 13.57 år. Disse kreftformene er ofte diagnostisert i sene stadier når prognosen er dårlig, og sjansen for langsiktig overlevelse er dyster. Selv om disse estimatene kan ikke være helt nøyaktig, fordi de er en matematisk tilnærming, de gir en meningsfull rangering av kreft med den lengste perioder av uoppdaget vekst.,

– >

Figur 4

Estimerte intervallet mellom første kreft-relaterte mutasjoner og diagnose innhentet ved hjelp av den Weibull-modellen extension.

En biologisk studie publisert i Nature samlet genetisk materiale fra 7 pasienter som døde av end-stage kreft i bukspyttkjertelen og er fast bestemt på tidspunktet for carcinogenesis. Forskerne fant ut at det tok 11.7 år, i gjennomsnitt, for en moden svulst i bukspyttkjertelen til å danne etter utseendet på den første kreft-relaterte mutasjon i bukspyttkjertelen celle. En annen 6.,8 år gikk, og i gjennomsnitt, før den primære svulsten sendt ut en metastatisk lesjon til et annet organ. Fra det punktet, pasienten døde i 2,7 år, i gjennomsnitt. I alt mer enn 20 årene som er gått mellom utseendet på første muterte bukspyttkjertelen celler og død . Anslaget innhentet ved hjelp av den Weibull-modellen extension indikerer at 8.59 år gikk, og i gjennomsnitt, fra den tid av kreft innvielse til diagnose for pasienter med alle-scenen pankreas kreft kombinert.

Som nevnt tidligere, Manton et al., utnyttet fem-parameteren versjon av svakhetene modell med en Weibull baseline å undersøke forholdet mellom mangfold i alder-relaterte mønster av kreft forekomsten og mekanismer carcinogenesis. De estimater for «lag» – perioden mellom forekomsten av de første ondartet kreft celle og dato for kreft utbruddet for utvalgte kreft histotypes er vist i Tabell 1 .,

Cancer type Lag estimate
(years)
Liver 817 21.2 ± 2.3
Lung and bronchus 804 19.8 ± 5.8
Lung and bronchus 807 15.3 ± 6.2
Lung and bronchus 814 19.3 ± 4.0
Pancreas 814 14.8 ± 9.,4
Tabell 1
Estimert lag bestemmes av Manton et al. for utvalgte kreft histotypes.

Totale våre resultater er konsistente med de som ble oppnådd ved Manton et al. imidlertid, nøyaktige sammenligningen er ikke mulig, siden forskerne gi histotype-spesifikke estimater og måling perioder kan ikke være nøyaktig. En annen faktor som gjør sammenligning vanskelig «lag» som er referert til av Manton et al., representerer perioden mellom forekomsten av de første ondartet kreft celle og kreft utbruddet. Vårt anslag gjenspeiler perioden mellom kreft utbruddet og diagnose, som kan eller ikke kan være tilsvarende.

For lunge og luftrøret ble kreftformer, våre resultater faller innenfor de anslag som er gitt i Tabell 1. Vi anslår at 13.57 år gått fra kreft innvielse til diagnose for alle stadier og histotypes av lungekreft kombinert. Resultatene som kan oppnås ved Manton et al. utvalg fra et etterslep av år og år for lungekreft histotypes 804, 807, og 814. Manton et al., estimat år gikk i gjennomsnitt mellom forekomsten av de første ondartet kreft celle og kreft utbruddet for kreft i bukspyttkjertelen. Våre resultater for kreft i bukspyttkjertelen faller i tråd med de av Manton et al. og tyder på at 8.59 år gikk mellom kreft oppstart og diagnose. Ventetid estimat for leverkreft indikerer at 10.81 år gått fra kreft innvielse til diagnose som faller litt utenfor det området som er foreslått av Manton et al. i år., Denne forskjellen kan være grunn til sammenligning av alle histotypes til en bestemt histotype samt eventuelle forskjeller i målingen av kreftfremkallende perioder som er referert tidligere.

I dette paper, en ny algoritme er presentert som bruker overlevelse informasjon innhentet strengt etter sykdom diagnose å anslå hva vi forsiktig mener tiden mellom kreft utbruddet og diagnose. Evnen til å «spore» progresjon av før overlevelse historier er avhengig av formen på fare økende eller synkende over tid., Samlet sett er vår kvantitative analyse indikerer at det er en stor mulighet for diagnose mens sykdommen er fortsatt i den kurative scenen. Selv om det Weibull-modellen utvidelsen kan ikke gi eksakte anslag fordi det er en tilnærming løsning, er det utvilsomt gjør det medisinske miljøet for å identifisere kreft-typer ved å øke risikoen for å skille de «silent killers» med lenge uoppdaget perioder av vekst og en høy risiko for død., Ved å gjøre denne informasjonen tilgjengelig, presenterer vi et mangfold av muligheter for ny forskning på tidlig oppdagelse og forebyggende screening, forbedre prognosen for sykdommen. De viktigste fordelene med betinget Weibull-modellen er dens enkelhet, utnytte bare enkel lineær regresjon metoder, og evne til å sørge for ytterligere forskning på medisinske problemstillinger gjennom matematisk modellering.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *