Når du sammenligner månedlige datac-data eller udfører indledende metodevalideringseksperimenter, foretager du en masse gennemsnitlig sammenligning. Dr. Madelon F. .ady, Ph. D., taler om midlerne til midler og andre vigtige statistiske beregninger.,riment
- Scores, Betyder, Afvigelse score
- Første øjeblik, Sum af kvadrater
- Varians, standardafvigelse
- gennemsnit af midler, Afvigelser eller fejl
- Sum af kvadrater, varians betyder
- Standard afvigelse betyder, standard error of the mean
- Prøve fordeling af midler
- Vigtige statistiske egenskaber
- Vigtigt laboratorium programmer
Middelværdien eller gennemsnittet
Den foregående lektion, der er beskrevet beregning af middelværdi, SD, og CV og illustreret, hvordan disse statistikker kan benyttes til at beskrive fordelingen af målinger, der forventes fra en laboratoriemetode. En almindelig anvendelse af disse statistikker er beregningen af kontrolgrænser for at fastlægge det forventede værdiområde, når laboratoriemetodens ydeevne er stabil., Ændringer i metodens ydeevne kan medføre, at middelværdien ændrer rækkevidden af forventede værdier, eller få SD til at udvide rækkevidden af forventede værdier. I begge tilfælde skal individuelle kontrolværdier overstige de beregnede kontrolgrænser (forventet værdiområde) og signalere, at der er noget galt med metoden.,
beregningen af et gennemsnit, der er knyttet til den centrale placering, eller rigtigheden en test i et laboratorium eller metode (nøjagtighed, unøjagtighed, bias, systematisk fejl, korrekthed) og beregning af et SD-er ofte relateret til spredning eller distribution af resultater (præcision, unøjagtighed, tilfældige fejl, usikkerhed). Ved estimering af den centrale placering af en gruppe testresultater kunne man forsøge at måle hele populationen eller estimere populationsparametrene fra en mindre prøve., Værdierne beregnet fra hele befolkningen kaldes parametre (mu for gennemsnittet, Sigma for standardafvigelsen), mens værdierne beregnet ud fra en mindre prøve kaldes statistik (SDBAR for gennemsnittet, SD for standardafvigelsen).
et simuleret eksperiment
overvej situationen, hvor der er 2000 patienter til rådighed, og du vil estimere gennemsnittet for den population. Blodprøver kunne trækkes fra alle 2000 patienter og analyseres for glukose, for eksempel., Dette ville være meget arbejde, men hele befolkningen kunne testes og det sande middel beregnet, som derefter ville være repræsenteret af det græske symbol mu (µ). Antag, at gennemsnittet (µ) for hele populationen er 100 mg/dl. Hvor tæt ville du være, hvis du kun analyserede 100 prøver?
denne situation kan demonstreres eller simuleres ved at registrere 2000-værdierne på separate papirskiver og placere dem i en stor beholder., Derefter tegner du en prøve på 100 papirstykker, beregner gennemsnittet for denne prøve på 100, registrerer det middel på et stykke papir og placerer det i en anden mindre beholder. De 100 sedler sættes derefter tilbage i den store beholder med de andre 1900 (en proces kaldet med prøveudtagning med udskiftning), og beholderen blandes og blandes. Derefter tegner du en anden prøve på 100 slips fra den store beholder, beregner middelværdien, registrerer middelværdien på papir, anbring det stykke papir i den lille beholder, returner de 100 slips papir til den store beholder, og bland og bland., Hvis du gentager denne proces ti gange mere, har den lille beholder nu 12 mulige estimater af” prøven på 100 ” betyder fra befolkningen i 2000.
beregning af gennemsnittet af en prøve (og relateret statistisk terminologi)
Vi begynder med at beregne middel-og standardafvigelsen for en enkelt prøve på 100 patienter. Middel – og standardafvigelsen beregnes som i den foregående lektion, men vi vil udvide den statistiske terminologi i denne diskussion., Tabellen nedenfor viser de første 9 af disse værdier, hvor.er en individuel værdi eller score, Xbar er middelværdien, og minus minus minusbar kaldes afvigelsesresultatet eller delta ().
- score. Kolonne A giver de enkelte værdier eller scoringer bruges til at beregne middelværdien.
- middelværdi. Summen af scorerne divideres med antallet af værdier (N=100 for dette eksempel) for at estimere gennemsnittet, dvs. ./N = middelværdi.
- afvigelse scoringer., Kolonne B repræsenterer afvigelsesscorerne (- -barbar), som viser, hvor meget hver værdi adskiller sig fra gennemsnittet. I lektion fire kaldte vi disse forskellen scoringer. De kaldes også nogle gange fejl (som det ses senere i denne lektion).
- første øjeblik. Summen af afvigelsesscorerne er altid nul. Denne nul er en vigtig kontrol af beregninger og kaldes det første øjeblik. (Momenterne bruges i Pearson-Produktmomentkorrelationsberegningen, der ofte bruges med metodesammenligningsdata.)
- summen af kvadrater., Den tredje kolonne repræsenterer kvadreret afvigelse scores, (2-2bar)2, som det blev kaldt i Lektion 4. Summen af de kvadrerede afvigelser, (2-2bar)2, kaldes også summen af kvadrater eller mere simpelthen SS. SS repræsenterer summen af kvadrerede forskelle fra gennemsnittet og er et ekstremt vigtigt udtryk i statistikker.
- varians. Summen af kvadrater giver anledning til varians. Den første brug af udtrykket SS er at bestemme variansen., Variansen for denne prøve beregnes ved at tage summen af kvadrerede afvigelser fra middelværdien, og dividere med N-1:
- Standard afvigelse. Variansen giver anledning til standardafvigelse. Den anden anvendelse af SS er at bestemme standardafvigelsen. Laboratoriere har en tendens til at beregne SD fra en gemt formel uden at notere vilkårene meget.,
Det er vigtigt at erkende, igen, at det er summen af kvadrater, der fører til variansen, hvilket igen fører til, at standard afvigelsen. Dette er et vigtigt generelt koncept eller tema, der vil blive brugt igen og igen i statistikker. Variansen af en mængde er relateret til den gennemsnitlige sum af kvadrater, som igen repræsenterer summen af kvadrerede afvigelser eller forskelle fra middelværdien.,
beregning af middelværdien af prøverne (standardfejlen i gennemsnittet)
lad os nu overveje værdierne for de tolv midler i den lille beholder. Lad os beregne gennemsnittet for disse tolv “gennemsnit af 100” prøver, behandle dem matematisk meget det samme som det foregående eksempel, der illustrerede beregningen af et individuelt gennemsnit af 100 patientværdier.
- middelværdi. Husk, at Kolonne A repræsenterer midlerne til de 12 prøver af 100, der blev trukket fra den store beholder. Gennemsnittet af de 12 “prøver af 100” er 1188/12 eller 99, 0 mg/dl., afvigelser eller fejl. Kolonne B viser de afvigelser, der beregnes mellem det observerede gennemsnit og det sande gennemsnit (100 = 100 mg/dL), der blev beregnet ud fra værdierne for alle 2000 prøver.
- summen af kvadrater. Kolonne C viser de kvadrerede afvigelser, som giver en SS af 102.
- varians af midlerne. Efter det foregående mønster kan variansen beregnes ud fra SS og derefter standardafvigelsen fra variansen. Variansen ville være 102/12, hvilket er 8.5 (Bemærk, at N bruges her snarere end N-1, fordi det sande middel er kendt). Matematisk er det SS over N.,
- standardafvigelse af midlerne eller standardfejl af middelværdien. Ved at fortsætte mønsteret ekstraheres kvadratroden fra variansen på 8, 5 for at give en standardafvigelse på 2, 9 mg/dL. Denne standardafvigelse beskriver den forventede variation for middelværdier snarere end individuelle værdier, derfor kaldes den normalt standardfejlen for middelværdien, prøveudtagningsfejlen for middelværdien eller mere simpelthen standardfejlen (undertiden forkortet SE). Matematisk er det kvadratroden af SS over N; statistikere tager en genvej og kalder det s over kvadratroden af N.,
- Sampling distribution af midlerne. Hvis der fra det foregående eksempel på 2000 patientresultater blev trukket alle mulige prøver på 100 og alle deres midler blev beregnet, ville vi være i stand til at plotte disse værdier for at producere en fordeling, der ville give en normal kurve. Prøveudtagningsfordelingen vist her består af midler, ikke prøver, derfor kaldes det prøveudtagningsfordelingen af midler.
Hvorfor er standardfejlen og prøveudtagningsfordelingen af gennemsnittet vigtig?
vigtige statistiske egenskaber., Konklusioner om udførelsen af en test eller metode er ofte baseret på beregning af midler og den formodede normalitet af prøveudtagningsfordelingen af midler. Hvis nok eksperimenter kunne udføres, og midlerne til alle mulige prøver kunne beregnes og afbildes i en frekvenspolygon, ville grafen vise en normal fordeling. I de fleste applikationer kan prøveudtagningsfordelingen imidlertid ikke genereres fysisk (for meget arbejde, tid, kræfter, omkostninger), så i stedet er det afledt teoretisk., Heldigvis vil den afledte teoretiske distribution have vigtige fælles egenskaber forbundet med prøveudtagningsfordelingen.
- gennemsnittet af prøveudtagningsfordelingen er altid det samme som gennemsnittet af den population, hvorfra prøverne er udtaget.
- middelfejlen kan estimeres med kvadratroden af SS over N eller s over kvadratroden af N eller endda SD/(N)1/2. Derfor kan prøveudtagningsfordelingen beregnes, når SD ‘ en er veletableret og N er kendt.,
- fordelingen vil være normal, hvis den stikprøvestørrelse, der bruges til at beregne gennemsnittet, er relativt stor, uanset om populationsfordelingen i sig selv er normal. Dette er kendt som den centrale grænse sætning. Det er grundlæggende for brugen og anvendelsen af parametriske statistikker, fordi det sikrer, at – hvis der anvendes middelværdier – afledninger kan foretages på grundlag af en gaussisk eller normal fordeling.
- disse egenskaber gælder også for prøvetagningsfordelinger af andre statistikker end midler, for eksempel varians og skråninger i regression.,
kort sagt hjælper prøveudtagningsfordelinger og deres sætninger med at sikre, at vi arbejder med normale distributioner, og at vi kan bruge alle de velkendte “porte.”
vigtige laboratorieanvendelser. Disse egenskaber er vigtige i fælles anvendelser af statistikker i laboratoriet. Overvej de problemer, der opstår, når en ny test, metode eller instrument implementeres. Laboratoriet skal sørge for, at den nye udfører såvel som den gamle. Statistiske procedurer bør anvendes til at sammenligne resultaterne af de to.,indledende metodevalideringseksperimenter, der kontrollerer for systematiske fejl, inkluderer typisk gendannelse, interferens og sammenligning af metodeksperimenter. Dataene fra alle tre af disse forsøg kan vurderes ved beregning af midler og sammenligning af midlerne mellem metoder. Spørgsmålene om acceptabel ydeevne afhænger ofte af, om en observeret forskel er større end den, der forventes ved en tilfældighed. Den observerede forskel er normalt forskellen mellem middelværdierne ved de to metoder., Den forventede forskel kan beskrives ved stikprøvefordelingen af middelværdien.
Selvvurderingsspørgsmål
- hvad repræsenterer SS? Beskriv det med ord., Udtryk det matematisk.
- Hvorfor er begrebet sum af kvadrater (SS) vigtigt?
- Vis, hvordan variansen beregnes ud fra SS.
- Vis, hvordan SD beregnes ud fra variansen og SS.
- hvad er forskellen mellem standardafvigelsen og standardfejlen i middelværdien?
- på grund af en metode, hvis SD er 4, 0 mg/dL, og der foretages 4 replikatmålinger for at estimere et testresultat på 100 mg/dL, beregnes standardfejlen for middelværdien for at bestemme usikkerheden i testresultatet.
om forfatteren: Madelon F. F.ady
Madelon F., Zady er adjunkt ved University of Louisville, School of Allied Health Sciences Clinical Laboratory Science program og har over 30 års erfaring i undervisning. Hun har BS, MAT og EdD grader fra University of Louisville, har taget andet avanceret kursusarbejde fra School of Medicine og School of Education, og også avancerede kurser i statistik. Hun er en registreret MT(ASCP) og en credentialed CLS (NCA) og har arbejdet deltid som bænkteknolog i 14 år., Hun er medlem af: American Society for Clinical Laboratory Science, Kentucky State Society for Clinical Laboratory Science, American Educational Research Association, og National Science Teachers Association. Hendes undervisningsområder er klinisk kemi og statistik. Hendes forskningsområder er metakognition og læringsteori.