Wenn Sie einen Linux-Server verwenden, kennen Sie wahrscheinlich den Begriff load average/system load. Die Messung des Lastdurchschnitts ist entscheidend, um zu verstehen, wie Ihre Server funktionieren; Wenn Sie überlastet sind, müssen Sie die Prozesse beenden oder optimieren, die große Mengen an Ressourcen verbrauchen, oder mehr Ressourcen bereitstellen, um die Arbeitslast auszugleichen.,
Aber wie stellen Sie fest, ob Ihr Server über eine ausreichende Ladekapazität verfügt und wann sollten Sie sich Sorgen machen? Tauchen wir ein und finden es heraus.
Was ist ein Lastdurchschnitt?
Der Lastdurchschnitt ist die durchschnittliche Systemlast auf einem Linux-Server für einen definierten Zeitraum. Mit anderen Worten, es ist die CPU-Anforderung eines Servers, die die Summe der laufenden und der wartenden Threads enthält.,
Normalerweise liefert der Befehl top oder uptime den Lastdurchschnitt Ihres Servers mit einer Ausgabe, die wie folgt aussieht:
Diese Zahlen sind die Durchschnittswerte der Systemlast über einen Zeitraum von einer, fünf und 15 Minuten.
Bevor wir uns mit der Messung der durchschnittlichen Lastausgabe und der Bedeutung dieser Werte befassen, gehen wir auf das einfachste Beispiel ein: einen Server mit einem Single-Core-Prozessor.
Aufschlüsselung der Last
Ein Server mit einem Single-Core-Prozessor ist wie eine einzelne Kundenzeile, die darauf wartet, dass ihre Artikel in einem Lebensmittelgeschäft in Rechnung gestellt werden., Während der Stoßzeiten gibt es in der Regel eine lange Schlange und die Wartezeit für jeden Einzelnen ist ebenfalls hoch.
Wenn Sie der Kassierer sind und die Wartezeit aufzeichnen möchten, ist eine wichtige Metrik die Anzahl der Personen, die während eines bestimmten Zeitraums warten. Wenn keine Kunden warten, ist die Wartezeit Null. Auf der anderen Seite, wenn es eine lange Schlange von Kunden gibt, dann ist die Wartezeit hoch.
Anwenden auf die Lastdurchschnittsausgabe (0.5, 1.5, 3.0), die wir oben erhalten haben:
- 0.5 bedeutet die minimale Wartezeit am Zähler. Zwischen 0.00 und 1.,0, es besteht kein Grund zur Sorge. Ihre Server sind sicher!
- 1.5 bedeutet, dass sich die Warteschlange füllt. Wenn der Durchschnitt höher wird, werden sich die Dinge verlangsamen.
- 3.00 bedeutet, dass eine beträchtlich lange Warteschlange wartet und eine zusätzliche Ressource/ein zusätzlicher Zähler erforderlich ist, um die Warteschlange schneller zu löschen.
Was Sie wollen, ist eine Warteschlange/Last Durchschnittswert zwischen 0,00 und 1,00. Können wir daraus schließen, dass der ideale Lastdurchschnitt 1,00 beträgt und alles darüber ein Aktionsaufruf zur Fehlerbehebung ist?, Nun, obwohl es eine sichere Wette ist, hinterlässt ein proaktiverer Ansatz zusätzlichen Spielraum, um unerwartete Lasten zu bewältigen.
Multicores und Multiprozessoren zur Rettung
Sind ein einzelner Quad-Core-Prozessor und ein Server mit vier Prozessoren (jeweils mit einem Kern) gleich? Relativ, ja. Der Hauptunterschied zwischen Multicore und Multiprozessor besteht darin, dass sich erstere auf eine einzelne CPU mit mehreren Kernen bezieht, während sich letztere auf mehrere CPUs bezieht. Zusammenfassend: Ein Quad-Core entspricht zwei Doppelkernen, was vier einzelnen Kernen entspricht.,
Der Lastdurchschnitt ist relativ zur Anzahl der auf dem Server verfügbaren Kerne und nicht wie sie auf CPUs verteilt sind. Dies bedeutet, dass der maximale Nutzungsbereich 0-1 für einen einzelnen Kern, 0-2 für einen Dual-Core, 0-4 für einen Quad-Core, 0-8 für einen Octa-Core usw. beträgt.
In Bezug auf das Kassiererbeispiel würde eine Last von 1,00 bedeuten, dass die Kapazität auf einem Single-Core-Prozessor genau richtig ist; Während auf einem Dual-Core-Prozessor eine Last von 1,50 bedeuten würde, dass eine Zeile gefüllt und die andere Zeile gefüllt ist. Ebenso eine Last von 5.,00 auf einem Quad-Core-Prozessor ist etwas zu befürchten, während auf einem Octa-Core-Prozessor, es füllt sich nur gerade, und es gibt optimalen Platz zur Verfügung.
Rolle von Site24x7: Überwachung des Lastdurchschnitts
Das Hinzufügen von Ressourcen für einen höheren Lastwert kann Ihre Infrastrukturkosten erhöhen. Es ist ideal, um die Last effizient zu verwalten und ein optimales Niveau zu halten, um Probleme mit der Serverleistung zu vermeiden. Site24x7 Linux Monitoring überwacht die Lastdurchschnitte von über 60 Leistungsmetriken und bietet die Durchschnittswerte von 1, 5 und 15 Minuten in einem intuitiven und leicht verständlichen Diagramm.,
Außerdem können Sie Schwellenwerte festlegen und Benachrichtigungen erhalten, wenn ein Verstoß vorliegt. Aber was ist, wenn es mitten in der Nacht einen Bruch gibt? Site24x7 hat auch dafür eine Lösung. Das Überwachungstool bietet eine Reihe von IT-Automatisierungen zur automatischen Fehlerauflösung.
Wenn der Schwellenwert für die Systemlast beispielsweise für einen Dual-Core-Prozessor auf 2,90 festgelegt ist, können Sie ein Serverskript hochladen oder Serverbefehle hinzufügen, um den Prozess zu beenden, der die höchste CPU verbraucht, wenn der Schwellenwert überschritten wird., Auf diese Weise kann das Problem ohne manuellen Eingriff behoben und die mittlere Reparaturzeit (MTTR) erheblich verkürzt werden.
Das Einwickeln von
Das Hinzufügen weiterer Kerne beschleunigt möglicherweise die Serverleistung, erhöht jedoch möglicherweise auch Ihre Infrastrukturausgaben. Die konsequente Überwachung des Lastdurchschnitts zur Aufrechterhaltung einer effizienten Verwaltung des bestehenden Aufbaus ist eine ideale Alternative. Site24x7 Server Monitoring überwacht nicht nur den Lastdurchschnitt, sondern bietet auch ergänzende Fehlerlösungstools, um zu handeln, bevor sich ein hoher Lastdurchschnitt auf die Serverleistung auswirkt., Melden Sie sich jetzt für eine 30-tägige kostenlose Testversion an!