wanneer u maandelijkse QC-gegevens vergelijkt of initiële methoden validatieexperimenten uitvoert, doet u veel gemiddelde vergelijkingen. Dr. Madelon F. Zady, Ph. D., praat over de middelen van middelen en andere belangrijke statistische berekeningen.,riment
- Scores, Gemiddelde, Standaarddeviatie scores
- Eerste moment, de Som van de kwadraten
- Variantie, standaarddeviatie
- Gemiddelde van middelen, Afwijkingen of fouten
- de Som van de kwadraten, is de variantie van de middelen
- standaarddeviatie van middelen, standaard fout van het gemiddelde
- Voorbeelden verdeling van de middelen
- belangrijke statistische eigenschappen
- belangrijke laboratoriumtoepassingen
gemiddelde of gemiddelde
in de vorige les werd de berekening van het gemiddelde, de SD en het CV beschreven en werd geïllustreerd hoe deze statistieken kunnen worden gebruikt om de verdeling te beschrijven van de metingen die van een laboratoriummethode worden verwacht. Een gemeenschappelijke toepassing van deze statistieken is de berekening van controlegrenzen om het bereik van de verwachte waarden vast te stellen wanneer de prestaties van de laboratoriummethode stabiel zijn., Veranderingen in de prestaties van de methode kunnen ervoor zorgen dat het gemiddelde het bereik van de verwachte waarden verschuift of dat de SD het bereik van de verwachte waarden uitbreidt. In beide gevallen moeten Individuele controlewaarden de berekende controlegrenzen overschrijden (verwacht bereik van waarden) en aangeven dat er iets mis is met de methode.,
de berekening van een gemiddelde hangt samen met de centrale locatie of juistheid van een laboratoriumtest of-methode (nauwkeurigheid, onnauwkeurigheid, bias, systematische fout, juistheid) en de berekening van een SD houdt vaak verband met de verspreiding of verspreiding van de resultaten (precisie, onnauwkeurigheid, willekeurige fout, onzekerheid). Bij het schatten van de centrale locatie van een groep testresultaten, zou men kunnen proberen om de gehele populatie te meten of om de populatie parameters van een kleinere steekproef te schatten., De uit de gehele populatie berekende waarden worden parameters genoemd (mu voor het gemiddelde, sigma voor de standaardafwijking), terwijl de uit een kleinere steekproef berekende waarden statistieken worden genoemd (Xbar voor het gemiddelde, SD voor de standaardafwijking).
een gesimuleerd experiment
overweeg de situatie waarin er 2000 patiënten beschikbaar zijn en u wilt het gemiddelde voor die populatie schatten. Bloedmonsters kunnen worden genomen van alle 2000 patiënten en geanalyseerd voor glucose, bijvoorbeeld., Dit zou veel werk zijn, maar de hele bevolking zou kunnen worden getest en het ware gemiddelde berekend, dat dan zou worden weergegeven door het Griekse symbool mu (µ). Stel dat het gemiddelde (µ) voor de gehele populatie 100 mg/dl is. Hoe dichtbij zou je zijn als je maar 100 monsters analyseerde?
deze situatie kan worden aangetoond of gesimuleerd door de 2000 waarden op afzonderlijke stroken papier te registreren en in een grote container te plaatsen., Je neemt dan een monster van 100 stukjes papier, berekent het gemiddelde voor dit monster van 100, noteert dat gemiddelde op een stuk papier, en plaatst het in een tweede kleinere container. De 100 stukjes papier worden vervolgens teruggezet in de grote container met de andere 1900 (een proces genoemd met bemonstering met vervanging) en de container geschud en gemengd. Je trekt dan nog een monster van 100 slips uit de grote container, berekent het gemiddelde, noteert het gemiddelde op papier, plaatst die slip van papier in de kleine container, retourneert de 100 slips van papier naar de grote container, en shuffle en meng., Als u dit proces nog tien keer herhaalt, heeft de kleine container nu 12 mogelijke schattingen van de “steekproef van 100” middelen van de bevolking van 2000.
berekening van het gemiddelde van een steekproef (en gerelateerde statistische terminologie)
We zullen beginnen met het berekenen van het gemiddelde en de standaardafwijking voor een enkele steekproef van 100 patiënten. De gemiddelde en standaardafwijking worden berekend zoals in de vorige les, maar we zullen de statistische terminologie in deze discussie uitbreiden., De tabel hieronder toont de eerste 9 van deze waarden, waarbij X een individuele waarde of score is, Xbar het gemiddelde is, en X minus Xbar de deviation score of delta wordt genoemd ().
- Scores. Kolom A geeft de individuele waarden of scores worden gebruikt om het gemiddelde te berekenen.
- gemiddelde. De som van de scores wordt gedeeld door het aantal waarden (n=100 voor dit voorbeeld) om het gemiddelde te schatten, d.w.z. X/n = gemiddelde.
- Deviatiescores., Kolom B staat voor de deviatiescores, (X-Xbar), die laten zien hoeveel elke waarde verschilt van het gemiddelde. In Les vier noemden we deze de verschil scores. Ze worden ook wel fouten genoemd (zoals later in deze les zal blijken).
- eerste moment. De som van de deviatiescores is altijd nul. Deze nul is een belangrijke controle op berekeningen en wordt het eerste moment genoemd. (De momenten worden gebruikt in de Pearson product Moment Correlatieberekening die vaak wordt gebruikt met methode vergelijking gegevens.)
- kwadratensom., De derde kolom geeft de kwadraatdeviatiescores weer, (X-Xbar)2, zoals het in Les 4 werd genoemd. De som van de kwadraatafwijkingen, (X-Xbar)2, wordt ook wel de kwadratensom of simpelweg SS genoemd. SS vertegenwoordigt de som van kwadraatverschillen van het gemiddelde en is een uiterst belangrijke term in de statistiek.
- variantie. De kwadratensom geeft aanleiding tot variantie. Het eerste gebruik van de term SS is om de variantie te bepalen., De variantie voor dit monster wordt berekend door de som van de kwadraatverschillen van het gemiddelde te nemen en te delen door N-1:
- standaardafwijking. De variantie geeft aanleiding tot standaardafwijking. Het tweede gebruik van de SS is om de standaardafwijking te bepalen. Laboratorians hebben de neiging om de SD te berekenen uit een gememoriseerde formule, zonder veel nota te maken van de termen.,
Het is belangrijk om opnieuw te erkennen dat het de kwadratensom is die tot variantie leidt, wat op zijn beurt tot standaardafwijking leidt. Dit is een belangrijk algemeen concept of thema dat keer op keer zal worden gebruikt in de statistiek. De variantie van een grootheid is gerelateerd aan de gemiddelde kwadratensom, die op zijn beurt de som van de kwadraatafwijkingen of verschillen van het gemiddelde weergeeft.,
berekening van het gemiddelde van de gemiddelden van de monsters (de standaardfout van het gemiddelde)
laten we nu eens kijken naar de waarden voor de twaalf gemiddelden in de kleine container. Laten we het gemiddelde berekenen voor deze twaalf “gemiddelde van 100” monsters, waarbij we ze wiskundig ongeveer hetzelfde behandelen als het voorgaande voorbeeld dat de berekening van een individueel gemiddelde van 100 patiëntwaarden illustreerde.
- gemiddelde van gemiddelden. Vergeet niet dat Kolom A Het gemiddelde vertegenwoordigt van de 12 monsters van 100 die uit de grote container zijn genomen. Het gemiddelde van de 12 “monsters van 100” is 1188/12 of 99,0 mg/dl.,
- afwijkingen of fouten. Kolom B toont de afwijkingen die worden berekend tussen het waargenomen gemiddelde en het werkelijke gemiddelde (µ = 100 mg/dL) dat werd berekend uit de waarden van alle 2000 monsters.
- kwadratensom. Kolom C toont de kwadraatafwijkingen die een SS van 102 geven.
- variantie van de gemiddelden. Volgens het voorgaande patroon kan de variantie worden berekend uit de SS en vervolgens de standaardafwijking van de variantie. De variantie zou 102/12 zijn, wat 8.5 is (merk op dat N hier wordt gebruikt in plaats van N-1 omdat het ware gemiddelde bekend is). Wiskundig gezien is het SS over N.,
- standaardafwijking van het gemiddelde of standaardafwijking van het gemiddelde. Door het patroon voort te zetten, wordt de vierkantswortel geëxtraheerd uit de variantie van 8,5 om een standaardafwijking van 2,9 mg/dL op te leveren. Deze standaardafwijking beschrijft de verwachte variatie voor gemiddelde waarden in plaats van individuele waarden, daarom wordt het meestal de standaardfout van het gemiddelde, de steekproeffout van het gemiddelde, of meer eenvoudig de standaardfout (soms afgekort SE) genoemd. Wiskundig is het de vierkantswortel van SS over N; statistici nemen een kortere weg en noemen het s over de vierkantswortel van N.,
- Sampling distribution of the means. Als uit het voorgaande voorbeeld van 2000 patiëntresultaten, alle mogelijke monsters van 100 werden genomen en al hun middelen werden berekend, zouden we in staat zijn om deze waarden te plotten om een verdeling te produceren die een normale curve zou geven. De hier getoonde steekproefverdeling bestaat uit middelen, niet uit monsters, daarom wordt het de steekproefverdeling van middelen genoemd.
Waarom zijn de standaardfout en de steekproefverdeling van het gemiddelde belangrijk?
belangrijke statistische eigenschappen., Conclusies over de uitvoering van een test of methode zijn vaak gebaseerd op de berekening van de gemiddelden en de veronderstelde normaliteit van de steekproefverdeling van de gemiddelden. Als er genoeg experimenten konden worden uitgevoerd en de middelen van alle mogelijke monsters konden worden berekend en uitgezet in een frequentie-veelhoek, zou de grafiek een normale verdeling laten zien. Echter, in de meeste toepassingen kan de sampling distributie niet fysiek worden gegenereerd (te veel werk, tijd, moeite, kosten), dus in plaats daarvan is het theoretisch afgeleid., Gelukkig zal de afgeleide theoretische verdeling belangrijke gemeenschappelijke eigenschappen in verband met de steekproefverdeling hebben.
- Het gemiddelde van de steekproefverdeling is altijd hetzelfde als het gemiddelde van de populatie waaruit de monsters zijn genomen.
- de standaardfout van het gemiddelde kan worden geschat door de vierkantswortel van SS gedeeld door N of s gedeeld door de vierkantswortel van N of zelfs SD/(N)1/2. Daarom kan de steekproefverdeling worden berekend wanneer de SD goed is vastgesteld en N bekend is.,
- de verdeling is normaal als de steekproefgrootte die wordt gebruikt om het gemiddelde te berekenen relatief groot is, ongeacht of de verdeling van de populatie zelf normaal is. Dit staat bekend als de centrale limietstelling. Het is fundamenteel voor het gebruik en de toepassing van parametrische statistieken omdat het verzekert dat – als gemiddelde waarden worden gebruikt – gevolgtrekkingen kunnen worden gemaakt op basis van een Gaussiaanse of normale verdeling.
- deze eigenschappen zijn ook van toepassing op steekproefverdelingen van andere statistieken dan gemiddelden, bijvoorbeeld variantie en de hellingen in regressie.,
kortom, sampling distributies en hun stellingen helpen om te verzekeren dat we met normale distributies werken en dat we alle bekende “gates kunnen gebruiken.”
belangrijke laboratoriumtoepassingen. Deze eigenschappen zijn belangrijk in gemeenschappelijke toepassingen van statistieken in het laboratorium. Denk aan de problemen die zich voordoen wanneer een nieuwe test, methode of instrument wordt geïmplementeerd. Het laboratorium moet ervoor zorgen dat het nieuwe net zo goed presteert als het oude. Er moeten statistische procedures worden toegepast om de prestaties van de twee te vergelijken.,
- initiële methode validatieexperimenten die controleren op systematische fouten omvatten doorgaans herstel, interferentie en vergelijking van methoden experimenten. De gegevens van alle drie deze experimenten kunnen worden beoordeeld door middel van berekening van de middelen en vergelijking van de middelen tussen de methoden. De vragen van aanvaardbare prestaties hangen vaak af van het bepalen of een waargenomen verschil groter is dan dat bij toeval wordt verwacht. Het waargenomen verschil is meestal het verschil tussen de gemiddelde waarden door de twee methoden., Het verwachte verschil kan worden beschreven door de steekproefverdeling van het gemiddelde.
- Kwaliteitscontrolestatistieken worden van maand tot maand vergeleken om na te gaan of er sprake is van een verandering op lange termijn in de prestaties van de methode. Het gemiddelde voor een controlemateriaal voor de meest recente maand wordt vergeleken met het gemiddelde van de vorige maand of het cumulatieve gemiddelde van de voorgaande maanden. De wijziging die belangrijk of significant zou zijn, hangt af van de standaardfout van het gemiddelde en de steekproefverdeling van het gemiddelde.,
- vergelijkingen tussen laboratoria zijn mogelijk wanneer gemeenschappelijke controlematerialen worden geanalyseerd door een groep laboratoria – een programma dat vaak peer comparison wordt genoemd. Het verschil tussen het gemiddelde van een individueel laboratorium en het gemiddelde van de groep laboratoria geeft een schatting van systematische fouten of onnauwkeurigheden. De significantie van een individueel verschil kan worden beoordeeld door de individuele waarde te vergelijken met de verdeling van de voor de groep laboratoria waargenomen middelen.
Zelfbeoordelingsvragen
- Wat betekent SS? Beschrijf het in woorden., Druk het wiskundig uit.
- Waarom is het concept kwadratensom (SS) belangrijk?
- laat zien hoe de variantie wordt berekend op basis van de SS.
- laat zien hoe de SD wordt berekend uit de variantie en SS.
- Wat is het verschil tussen de standaardafwijking en de standaardafwijking van het gemiddelde?
- bij een methode met een SD van 4,0 mg/dL en 4 herhaalde metingen om een testresultaat van 100 mg / dL te schatten, wordt de standaardfout van het gemiddelde berekend om de onzekerheid van het testresultaat te bepalen.
over de auteur: Madelon F. Zady
Madelon F., Zady is een assistent Professor aan de Universiteit van Louisville, School of Allied Health Sciences Clinical Laboratory Science program en heeft meer dan 30 jaar ervaring in het onderwijs. Ze heeft BS, MAT en EdD graden van de Universiteit van Louisville, heeft andere geavanceerde cursus werk van de School Of Medicine en School of Education genomen, en ook geavanceerde cursussen in de statistiek. Ze is een geregistreerde MT (ASCP) en een credential CLS(NCA) en heeft gewerkt parttime als een bench technoloog voor 14 jaar., Ze is lid van de American Society for Clinical Laboratory Science, Kentucky State Society for Clinical Laboratory Science, American Educational Research Association en de National Science Teachers Association. Haar onderwijsgebieden zijn klinische chemie en statistiek. Haar onderzoeksgebieden zijn metacognitie en leertheorie.