Ungewöhnlich hohe CPU Auslastung

  • Hallöchen!


    Seit letzten Freitag kämpft mein Server mit einer teilweise gewaltig hohen CPU Last!


    Ich denke wohl eher nicht, dass es direkt am TeamSpeak-Server liegt, wobei htop die Auslastung auf den TS-Server "schiebt" ;)


    Na dann fangen wir mal an das ganze zu beschreiben:
    Ihr kennt das ja sicher, ein TS-Server braucht ca. 2-5% CPU Last wenn überhaupt (bei 1-10 Server). Ich hatte einige Tage vor letzten Freitag (weiß nicht mehr genau wann) ein ganz normales upgrade via apt-get gemacht. Dabei waren im upgrade linux kernel und noch andere Updates für andere Programme drinnen.


    Bin am Freitagsabend Online gekommen und wurde gleich von mehrere Leute angeschrieben, dass der TS "laggt". habe mir das natürlich gleich angesehen, und tatsächlich hatte jeder beim Sprechen extreme laggs gehabt.
    Habe mich sofort via Putty eingeloggt und siehe da, was mir "htop" zeigt, war schockierend (das ganze stark schwankend):



    Rot ist lt. htop legende der Kernel.
    RAM ist ok (E-mail und Webserver laufen ja auch noch dadrauf) und die Netzwerkauslastung ist auch okay!


    Nach einem Reboot is die CPU-Last wieder bei 2-3%. Stündlich steigt die Auslastung aber immer höher und höher das geht wahrscheinlich mehrere Tage so und dann is eh schluss bei 100%.


    Hat jemand ähnliches Probleme gehabt? Ich schätze mal dass es am Kernel liegt bzw. am Virtio-Kernel, der sich mit dem "neuem" Kernel nicht verträgt. Das möchte mein Provider nicht genau zugeben und hilft genau 0 weiter :thumbdown:

    Edited once, last by NoobsLost: Bildverlinkung angepasst ().

    • Official Post

    Hallo,
    kannst du uns mal bitte folgende Informationen zukommen lassen?


    Inhalte des Verzeichnisses "boot":

    Code
    $ ls -lh /boot/


    Installierte Kernel:

    Code
    $ dpkg -l | grep -i linux-image


    CPU Details:

    Code
    $ cat /proc/cpuinfo


    Netzwerkadapter Details (IP-Adressen bitte mit Sternchen ersetzen):

    Code
    $ ifconfig


    Aktive Netzwerk-Verbindungen (IP-Adressen bitte mit Sternchen ersetzen; Ports jedoch lassen):

    Code
    $ netstat -A inet -p


    Alle (Sub-) Prozesse des TS3 Servers:

    Code
    $ lsof +p $(ps aux | grep -i ts3server | grep -v grep | egrep -o '[0-9]{4,5}' | head -1)


    oder einfacher gesagt so:

    Code
    $ ps aux | grep -i ts3serv
    $ lsof +p <TS3 Server PID>


    Wie viele Clients sind auf allen virtuellen Servern, also der ganzen Instanz meistens ungefähr gleichzeitig online? Führen diese Dateitransfers durch?

  • Hallo!


    Das ging aber jetzt schnell :D Ich bin hier echt am Verzweifeln, immer gibts probleme -.-


    Alles nach deiner Reihenfolge hineinkopiert:


    Code
    total 15M-rw-r--r-- 1 root root 127K Jan 12 23:45 config-3.2.0-4-amd64drwxr-xr-x 3 root root  12K Jan 17 18:10 grub-rw-r--r-- 1 root root 9.8M Jan 17 18:10 initrd.img-3.2.0-4-amd64-rw-r--r-- 1 root root 2.1M Jan 12 23:45 System.map-3.2.0-4-amd64-rw-r--r-- 1 root root 2.8M Jan 12 23:34 vmlinuz-3.2.0-4-amd64


    Code
    dpkg -l | grep -i linux-imageii  linux-image-3.2.0-4-amd64          3.2.65-1+deb7u1               amd64        Linux 3.2 for 64-bit PCsii  linux-image-amd64                  3.2+46                        amd64        Linux for 64-bit PCs (meta-package)


    Code
    processor       : 0vendor_id       : GenuineIntelcpu family      : 6model           : 62model name      : Intel(R) Xeon(R) CPU E5-2670 v2 @ 2.50GHzstepping        : 4microcode       : 0x1cpu MHz         : 2493.988cache size      : 4096 KBfpu             : yesfpu_exception   : yescpuid level     : 13wp              : yesflags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ss syscall nx pdpe1gb rdtscp lm constant_tsc rep_good nopl pni pclmulqdq ssse3 cx16 sse4_1 sse4_2 x2apic popcnt aes xsave avx f16c rdrand hypervisor lahf_lm xsaveopt fsgsbase smep ermsbogomips        : 4987.97clflush size    : 64cache_alignment : 64address sizes   : 40 bits physical, 48 bits virtualpower management:processor       : 1vendor_id       : GenuineIntelcpu family      : 6model           : 62model name      : Intel(R) Xeon(R) CPU E5-2670 v2 @ 2.50GHzstepping        : 4microcode       : 0x1cpu MHz         : 2493.988cache size      : 4096 KBfpu             : yesfpu_exception   : yescpuid level     : 13wp              : yesflags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ss syscall nx pdpe1gb rdtscp lm constant_tsc rep_good nopl pni pclmulqdq ssse3 cx16 sse4_1 sse4_2 x2apic popcnt aes xsave avx f16c rdrand hypervisor lahf_lm xsaveopt fsgsbase smep ermsbogomips        : 4987.97clflush size    : 64cache_alignment : 64address sizes   : 40 bits physical, 48 bits virtualpower management:


    Code
    eth0      Link encap:Ethernet  HWaddr 52:54:ad:04:bb:de          inet addr:*  Bcast:*  Mask:*          inet6 addr: fe80::5054:adff:fe04:bbde/64 Scope:Link          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1          RX packets:2196013 errors:0 dropped:0 overruns:0 frame:0          TX packets:2181891 errors:0 dropped:0 overruns:0 carrier:0          collisions:0 txqueuelen:1000          RX bytes:213895926 (203.9 MiB)  TX bytes:258963328 (246.9 MiB)lo        Link encap:Local Loopback          inet addr:*  Mask:*          inet6 addr: ::1/128 Scope:Host          UP LOOPBACK RUNNING  MTU:16436  Metric:1          RX packets:22826 errors:0 dropped:0 overruns:0 frame:0          TX packets:22826 errors:0 dropped:0 overruns:0 carrier:0          collisions:0 txqueuelen:0          RX bytes:18113471 (17.2 MiB)  TX bytes:18113471 (17.2 MiB)


    Code
    Active Internet connections (w/o servers)Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program nametcp        0      0 localhost:mysql         localhost:40269         ESTABLISHED 3088/mysqldtcp        0      0 localhost:40269         localhost:mysql         ESTABLISHED 2253/amavisd-new (ctcp        0      0 localhost:42020         localhost:10011         TIME_WAIT   -tcp        0    180 v22014112499221556.:* 193-80-28-74.adsl:49971 ESTABLISHED 14134/0tcp        0      0 localhost:42018         localhost:10011         TIME_WAIT   -tcp       71      0 localhost:38936         localhost:10025         CLOSE_WAIT  2253/amavisd-new (ctcp        0      0 v22014112499221556.:* 193-80-28-74.adsl:43518 ESTABLISHED 13981/sshd: root@noudp        0      0 v2201411249922155:58263 hardy.teamspeak.4p:2010 ESTABLISHED 2728/ts3server_linu


    Code
    1000      2728  2.4  0.3 216088 30848 ?        Sl   10:34   7:52 ./ts3server_lin                                                                                                                                                     ux_amd64root     15234  0.0  0.0   7840   896 pts/0    S+   15:51   0:00 grep -i ts3serv                                                                                                                                                     er



    Es gibt 4 Server, gleichzeitig online sind so um 21:00 ca. 70-80 user. Derzeit ist Die Auslastung noch bei 3-4% (da der Server erst rebootet worden ist).

    • Official Post

    Okay, da passt also schon mal alles. Nichts ungewöhnliches dabei.


    Stehen in deiner Instanz-Log eventuell Error, Warnings oder anders drin? Die sollten hier drin stehen:

    Quote

    /home/teamspeak/logs/ts3server_2015-01-21__09_34_33.010882_0.log


    Kannst du mal testweise deinen Virenscanner deaktivieren? Der kann je nach Einstellung sehr aggressiv sein und dadurch dein System mehr oder weniger lahmlegen, wenn dort eben Dateitransfers durchgeführt werden. Sollte ungefähr so möglich sein, ihn zu deaktivieren:

    Code
    $ /etc/init.d/amavisd stop


    Ich habe leider gerade keinen Amavis installiert, sodass ich es testen kann.


    Wie sieht denn dein TeamSpeak 3 Server root Verzeichnis aus?

    Code
    $ ls -lh /home/teamspeak/


    Bei 70-80 Clients sollte die CPU nicht so hoch gehen.

  • Hi Sebbo!


    Das einzige was da drinn stand unter error oder warning:

    Code
    2015-01-21 09:26:59.302266|ERROR   |              |   | TS3ANetwork::ResolveHostName failed error: -2 (Name or service not known) 02015-01-21 09:26:59.302472|ERROR   |              |   | TS3ANetwork::ResolveHostName failed error: -2 (Name or service not known) 02015-01-21 09:26:59.302549|ERROR   |              |   | Unable to connect to primary address, trying secondary2015-01-21 09:26:59.302663|ERROR   |              |   | TS3ANetwork::ResolveHostName failed error: -2 (Name or service not known) 02015-01-07 04:33:06.957487|WARNING |              |   | Accounting connection stalled2015-01-07 04:34:23.019936|ERROR   |              |   | read invalid packet size size


    Wann soll ich den ClamAV deaktivieren? Jetzt, oder wenn die Last so hoch ist? (jetzt werd ichs kaum merken, da ich eben nur 5% last habe, bisschen abwarten, das wird schon wieder steigen... oder es hat sich gelöst, aber mal schaun, ich denke eher nicht, dass sich das problem gelöst hatte)


    TS-Verzeichnis:


    im kern.log hätte ich da noch eingies mit warnings und error, wenn dir das weiterhelfen sollte? ich denk nicht, dass da einiges normal ist lt. logs.

  • This threads contains 24 more posts that have been hidden for guests, please register yourself or log-in to continue reading.