Wenn Sie monatliche QC – Daten vergleichen oder erste Methodenvalidierungsexperimente durchführen, führen Sie viele mittlere Vergleiche durch. Dr. Madelon F. Zady, Ph. D., spricht über die Mittel, Mittel und andere wichtige statistische Berechnungen.,
- Werte, Mittelwert, Abweichungswerte
- Erster Moment, Summe der Quadrate
- Varianz, Standardabweichung
- Mittelwert der Mittelwerte, Abweichungen oder Fehler
- Summe der Quadrate, Varianz der Mittelwerte
- Standardabweichung der Mittelwerte, Standardfehler des Mittelwerts
- Stichprobenverteilung der Mittelwerte
- Wichtige statistische Eigenschaften
- Wichtige Laboranwendungen
Mittelwert oder Durchschnitt
In der vorherigen Lektion wurde die Berechnung von Mittelwert, SD und CV beschrieben und veranschaulicht, wie diese Statistiken verwendet werden können, um die Verteilung der Messungen zu beschreiben, die von einer Labormethode erwartet werden. Eine gängige Anwendung dieser Statistiken ist die Berechnung von Kontrollgrenzen, um den erwarteten Wertebereich festzulegen, wenn die Leistung der Labormethode stabil ist., Änderungen in der Methodenleistung können dazu führen, dass der Mittelwert den Bereich der erwarteten Werte verschiebt oder dass der MITTELWERT den Bereich der erwarteten Werte erweitert. In jedem Fall sollten einzelne Steuerwerte die berechneten Steuergrenzen (erwarteter Wertebereich) überschreiten und signalisieren, dass mit der Methode etwas nicht stimmt.,
Die Berechnung eines Mittelwerts hängt mit der zentralen Lage oder Richtigkeit eines Labortests oder einer Methode zusammen (Genauigkeit, Ungenauigkeit, Verzerrung, systematischer Fehler, Wahrhaftigkeit) und die Berechnung eines SD hängt häufig mit der Streuung oder Verteilung der Ergebnisse zusammen (Präzision, Ungenauigkeit, zufälliger Fehler, Unsicherheit). Bei der Schätzung der zentralen Lage einer Gruppe von Testergebnissen könnte man versuchen, die gesamte Population zu messen oder die Populationsparameter aus einer kleineren Stichprobe abzuschätzen., Die aus der gesamten Population berechneten Werte werden Parameter genannt (mu für den Mittelwert, sigma für die Standardabweichung), während die aus einer kleineren Stichprobe berechneten Werte Statistik genannt werden (Xbar für den Mittelwert, SD für die Standardabweichung).
Ein simuliertes Experiment
Betrachten Sie die Situation, in der 2000 Patienten verfügbar sind, und Sie möchten den Mittelwert für diese Population schätzen. Von allen 2000 Patienten konnten Blutproben entnommen und beispielsweise auf Glukose untersucht werden., Dies wäre eine Menge Arbeit, aber die gesamte Population könnte getestet und der wahre Mittelwert berechnet werden, der dann durch das griechische Symbol mu (µ) dargestellt würde. Angenommen, der Mittelwert (µ) für die gesamte Population beträgt 100 mg/dl. Wie nahe wären Sie, wenn Sie nur 100 Proben analysieren würden?
Diese Situation kann demonstriert oder simuliert werden, indem die 2000 Werte auf separaten Zetteln aufgezeichnet und in einen großen Behälter gegeben werden., Sie zeichnen dann eine Probe von 100 Zetteln aus, berechnen den Mittelwert für diese Probe von 100, zeichnen diesen Mittelwert auf ein Stück Papier auf und legen ihn in einen zweiten kleineren Behälter. Die 100 Zettel werden dann mit den anderen 1900 (ein Verfahren, das mit Probenahme mit Ersatz bezeichnet wird) wieder in den großen Behälter gegeben und der Behälter gemischt und gemischt. Sie zeichnen dann eine weitere Probe von 100 Zetteln aus dem großen Behälter, berechnen den Mittelwert, zeichnen den Mittelwert auf Papier auf, legen diesen Zettel in den kleinen Behälter, geben die 100 Zettel in den großen Behälter zurück und mischen und mischen., Wenn Sie diesen Vorgang noch zehnmal wiederholen,hat der kleine Behälter jetzt 12 mögliche Schätzungen der“ Stichprobe von 100 “ aus der Bevölkerung von 2000.
Berechnung des Mittelwerts einer Stichprobe (und zugehörige statistische Terminologie)
Zunächst berechnen wir den Mittelwert und die Standardabweichung für eine einzelne Stichprobe von 100 Patienten. Der Mittelwert und die Standardabweichung werden wie in der vorherigen Lektion berechnet, aber wir werden die statistische Terminologie in dieser Diskussion erweitern., Die folgende Tabelle zeigt die ersten 9 dieser Werte, wobei X ein einzelner Wert oder eine Punktzahl ist, Xbar der Mittelwert ist und X minus Xbar als Abweichungswert oder Delta bezeichnet wird ().
- Erzielt. Spalte A enthält die einzelnen Werte oder Werte, die zur Berechnung des Durchschnitts verwendet werden.
- Bedeuten. Die Summe der Werte wird durch die Anzahl der Werte geteilt (N=100 für dieses Beispiel), um den Mittelwert zu schätzen, dh X/N = mean.
- Abweichungswerte., Spalte B stellt die Abweichungswerte (X-Xbar) dar, die zeigen, wie stark sich jeder Wert vom Mittelwert unterscheidet. In Lektion vier nannten wir diese die Differenzwerte. Sie werden manchmal auch als Fehler bezeichnet (wie später in dieser Lektion zu sehen sein wird).
- Erster Moment. Die Summe der Abweichungswerte ist immer Null. Diese Null ist eine wichtige Überprüfung der Berechnungen und wird als erster Moment bezeichnet. (Die Momente werden in der Pearson-Produktmomentkorrelationsberechnung verwendet, die häufig mit Methodenvergleichsdaten verwendet wird.)
- Summe der Quadrate., Die dritte Spalte repräsentiert die quadrierten Abweichungswerte (X-Xbar) 2, wie sie in Lektion 4 genannt wurden. Die Summe der quadratischen Abweichungen, (X-Xbar)2, wird auch als Summe der Quadrate oder einfacher SS bezeichnet. SS stellt die Summe der quadratischen Unterschiede zum Mittelwert dar und ist ein äußerst wichtiger Begriff in der Statistik.
- Varianz. Die Summe der Quadrate führt zu Varianz. Die erste Verwendung des Begriffs SS besteht darin, die Varianz zu bestimmen., Die Varianz für diese Stichprobe wird berechnet, indem die Summe der quadratischen Unterschiede vom Mittelwert genommen und durch N-1 dividiert wird:
- Standardabweichung. Die Varianz führt zu einer Standardabweichung. Die zweite Verwendung der SS besteht darin, die Standardabweichung zu bestimmen. Laboratorianer neigen dazu, die SD aus einer gespeicherten Formel zu berechnen, ohne die Begriffe zu notieren.,
Es ist wichtig, erneut zu erkennen, dass es die Summe der Quadrate ist, die zu einer Varianz führt, die wiederum zu einer Standardabweichung führt. Dies ist ein wichtiges allgemeines Konzept oder Thema, das in der Statistik immer wieder verwendet wird. Die Varianz einer Größe hängt mit der durchschnittlichen Summe der Quadrate zusammen, die wiederum die Summe der quadratischen Abweichungen oder Unterschiede zum Mittelwert darstellt.,
Berechnung des Mittelwerts der Stichproben (der Standardfehler des Mittelwerts)
Betrachten wir nun die Werte für die zwölf Mittelwerte im kleinen Behälter. Lassen Sie uns den Mittelwert für diese zwölf „Mittelwert von 100“ Proben berechnen und sie mathematisch ähnlich behandeln wie das vorherige Beispiel, das die Berechnung eines individuellen Mittelwerts von 100 Patientenwerten veranschaulichte.
- Mittelwert der Mittelwerte. Denken Sie daran, dass Spalte A die Mittelwerte der 12 Proben von 100 darstellt, die aus dem großen Behälter gezogen wurden. Der Mittelwert der 12 „Proben von 100“ beträgt 1188/12 oder 99,0 mg / dl.,
- Abweichungen oder Fehler. Spalte B zeigt die Abweichungen, die zwischen dem beobachteten Mittelwert und dem wahren Mittelwert (µ = 100 mg/dl) berechnet wurden, der aus den Werten aller 2000 Proben berechnet wurde.
- Summe der Quadrate. Spalte C zeigt die quadratischen Abweichungen, die eine SS von 102 ergeben.
- Varianz der Mittel. Nach dem vorherigen Muster kann die Varianz aus der SS und dann die Standardabweichung von der Varianz berechnet werden. Die Varianz wäre 102/12, also 8,5 (Beachten Sie, dass hier N anstelle von N-1 verwendet wird, da das wahre Mittel bekannt ist). Mathematisch ist es SS über N.,
- Standardabweichung der Mittel oder Standardfehler des Mittelwerts. In Fortsetzung des Musters wird die Quadratwurzel aus der Varianz von 8,5 extrahiert, um eine Standardabweichung von 2,9 mg/dl zu erhalten. Diese Standardabweichung beschreibt die für Mittelwerte erwartete Variation und nicht einzelne Werte, daher wird sie normalerweise als Standardfehler des Mittelwerts, als Abtastfehler des Mittelwerts oder einfacher als Standardfehler (manchmal abgekürzt SE) bezeichnet. Mathematisch ist es die Quadratwurzel von SS über N; Statistiker nehmen eine Abkürzung und nennen es s über die Quadratwurzel von N.,
- Sampling Verteilung der Mittel. Wenn aus dem vorherigen Beispiel von 2000 Patientenergebnissen alle möglichen Proben von 100 gezogen und alle ihre Mittel berechnet würden, könnten wir diese Werte zeichnen, um eine Verteilung zu erzeugen, die eine normale Kurve ergeben würde. Die hier gezeigte Probenahmeverteilung besteht aus Mitteln, nicht aus Proben, daher wird sie als Probenahmeverteilung von Mitteln bezeichnet.
Warum sind der Standardfehler und die Stichprobenverteilung des Mittelwerts wichtig?
Wichtige statistische Eigenschaften., Schlussfolgerungen über die Durchführung eines Tests oder einer Methode basieren häufig auf der Berechnung der Mittel und der angenommenen Normalität der Probenahmeverteilung der Mittel. Wenn genügend Experimente durchgeführt werden könnten und die Mittel aller möglichen Proben in einem Frequenzpolygon berechnet und gezeichnet werden könnten, würde der Graph eine Normalverteilung zeigen. In den meisten Anwendungen kann die Stichprobenverteilung jedoch nicht physisch erzeugt werden (zu viel Arbeit, Zeit, Aufwand, Kosten), sondern wird theoretisch abgeleitet., Glücklicherweise wird die abgeleitete theoretische Verteilung wichtige gemeinsame Eigenschaften haben, die mit der Stichprobenverteilung verbunden sind.
- Der Mittelwert der Stichprobenverteilung ist immer derselbe wie der Mittelwert der Population, aus der die Stichproben gezogen wurden.
- Der Standardfehler des Mittelwerts kann durch die Quadratwurzel von SS über N oder s über die Quadratwurzel von N oder sogar SD/(N)1/2 geschätzt werden. Daher kann die Abtastverteilung berechnet werden, wenn die SD gut etabliert ist und N bekannt ist.,
- Die Verteilung ist normal, wenn die Stichprobengröße, mit der der Mittelwert berechnet wird, relativ groß ist, unabhängig davon, ob die Bevölkerungsverteilung selbst normal ist. Dies ist als zentraler Grenzwertsatz bekannt. Es ist von grundlegender Bedeutung für die Verwendung und Anwendung parametrischer Statistiken, da es sicherstellt, dass bei Verwendung von Mittelwerten Rückschlüsse auf eine gaußsche oder normale Verteilung gezogen werden können.
- Diese Eigenschaften gelten auch für andere Stichprobenverteilungen von Statistiken als Mittel, z. B. Varianz und Steigungen in der Regression.,
Kurz gesagt, Stichprobenverteilungen und ihre Sätze helfen sicherzustellen, dass wir mit Normalverteilungen arbeiten und dass wir alle bekannten „Gates“ verwenden können.“
Wichtige Laboranwendungen. Diese Eigenschaften sind wichtig für gängige Anwendungen von Statistiken im Labor. Berücksichtigen Sie die Probleme, die auftreten, wenn ein neuer Test, eine neue Methode oder ein neues Instrument implementiert wird. Das Labor muss sicherstellen, dass das neue genauso gut funktioniert wie das alte. Statistische Verfahren sollten verwendet werden, um die Leistung der beiden zu vergleichen.,
- Erste Methodenvalidierungsexperimente, die auf systematische Fehler prüfen, umfassen typischerweise Wiederherstellung, Interferenz und Vergleich von Methodenexperimenten. Die Daten aus allen drei dieser Experimente kann bewertet werden, ist durch Berechnung und Vergleich der Mittel zwischen den Methoden. Die Frage nach einer akzeptablen Leistung hängt oft davon ab, ob ein beobachteter Unterschied größer ist als zufällig erwartet. Der beobachtete Unterschied ist normalerweise der Unterschied zwischen den Mittelwerten durch die beiden Methoden., Der erwartete Unterschied kann durch die Stichprobenverteilung des Mittelwerts beschrieben werden.
- Qualitätskontrollstatistiken werden von Monat zu Monat verglichen, um zu beurteilen, ob sich die Methodenleistung langfristig ändert. Der Mittelwert für ein Kontrollmaterial für den letzten Monat wird mit dem Mittelwert des Vormonats oder dem kumulativen Mittelwert der Vormonate verglichen. Die Änderung, die wichtig oder signifikant wäre, hängt vom Standardfehler des Mittels und der Stichprobenverteilung der Mittel ab.,
- Vergleiche zwischen Laboratorien sind möglich, wenn gängige Kontrollmaterialien von einer Gruppe von Laboratorien analysiert werden – ein Programm, das häufig als Peer-Vergleich bezeichnet wird. Der Unterschied zwischen dem Mittelwert eines einzelnen Labors und dem Mittelwert der Laborgruppe liefert eine Schätzung systematischer Fehler oder Ungenauigkeiten. Die Signifikanz einer individuellen Differenz kann durch Vergleich des individuellen Wertes mit der Verteilung der für die Gruppe der Laboratorien beobachteten Mittel beurteilt werden.
Fragen zur Selbsteinschätzung
- Was repräsentiert SS? Beschreibe es in Worten., Drücken Sie es mathematisch aus.
- Warum ist die Konzeptsumme von Quadraten (SS) wichtig?
- Zeigen Sie an, wie die Varianz aus der SS berechnet wird.
- Zeigen Sie, wie die SD aus der Varianz und SS berechnet wird.
- Was ist der Unterschied zwischen der Standardabweichung und dem Standardfehler des Mittelwerts?
- Bei einer Methode, deren SD 4,0 mg/dl beträgt und bei der 4 Replikatmessungen durchgeführt werden, um ein Testergebnis von 100 mg/dl abzuschätzen, berechnen Sie den Standardfehler des Mittels, um die Unsicherheit des Testergebnisses zu bestimmen.
Über den Autor: Madelon F. Zady
Madelon F., Zady ist Assistant Professor an der University of Louisville, School of Allied Health Sciences, Clinical Laboratory Science program und hat über 30 Jahre Erfahrung in der Lehre. Sie hält BS, MAT und EdD Grad von der University of Louisville, hat andere fortgeschrittene Kursarbeit von der School of Medicine und School of Education genommen, und auch fortgeschrittene Kurse in Statistik. Sie ist Registered MT(ASCP) und credentialed CLS(NCA) und arbeitet seit 14 Jahren Teilzeit als Banktechnologin., Sie ist Mitglied der American Society for Clinical Laboratory Science, Kentucky State Society for Clinical Laboratory Science, American Educational Research Association und der National Science Teachers Association. Ihre Lehrgebiete sind Klinische Chemie und Statistik. Ihre Forschungsgebiete sind Metakognition und Lerntheorie.