Alexey Vlasov
2007-07-23 10:52:45 UTC
Здравствуйте уважаемые друзья.
На сервере без всякой периодичности происходит коллапс
производительности, который сопровождается высоким LA, до 500-1500, и
iowait 100%.
Так выглядит top (при большем LA он отличается только большим
wait'ом) :
top - 13:04:09 up 55 days, 5 min, 3 users, load average: 188.97,
68.74, 25.99
Tasks: 1225 total, 5 running, 1194 sleeping, 2 stopped, 24 zombie
Cpu(s): 7.0% us, 6.5% sy, 0.0% ni, 0.0% id, 85.8% wa, 0.1% hi,
0.6% si
Mem: 4032680k total, 3993164k used, 39516k free, 11608k
buffers
Swap: 7815580k total, 1669872k used, 6145708k free, 45452k
cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
16993 10957 16 0 227m 112m 4152 D 5 2.9 0:05.40 httpd
17392 27090 15 0 152m 39m 3844 S 3 1.0 0:00.11 httpd
15464 30073 16 0 154m 18m 4744 S 3 0.5 0:00.16 httpd
17715 30073 15 0 153m 18m 4716 S 3 0.5 0:00.33 httpd
17185 28488 17 0 158m 44m 3828 S 3 1.1 0:00.16 httpd
17171 28488 15 0 160m 48m 4376 S 2 1.2 0:01.48 httpd
17229 27090 15 0 152m 39m 3928 S 2 1.0 0:00.13 httpd
17072 27307 15 0 158m 50m 4432 S 2 1.3 0:00.46 httpd
17078 30774 16 0 159m 51m 4460 D 2 1.3 0:00.62 httpd
При нормальном состоянии:
top - 13:56:27 up 59 days, 57 min, 3 users, load average: 1.49,
1.63, 1.80
Tasks: 651 total, 2 running, 648 sleeping, 0 stopped, 1 zombie
Cpu(s): 7.2% us, 3.3% sy, 0.0% ni, 86.2% id, 3.0% wa, 0.0% hi,
0.2% si
Mem: 4032680k total, 3639568k used, 393112k free, 196084k
buffers
Swap: 7815580k total, 870528k used, 6945052k free, 807292k
cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
29537 27307 15 0 171m 34m 4560 S 8 0.9 0:02.51 httpd
30388 27307 16 0 173m 36m 4444 R 7 0.9 0:01.57 httpd
31493 27307 15 0 166m 30m 4388 S 6 0.8 0:00.92 httpd
30909 30073 15 0 124m 32m 4344 S 3 0.8 0:00.12 httpd
31481 20632 17 0 173m 36m 4432 S 3 0.9 0:00.10 httpd
31242 29013 15 0 169m 32m 4388 S 3 0.8 0:00.35 httpd
Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s rkB/s wkB/s
avgrq-sz avgqu-sz await svctm %util
sda 0.00 121.21 0.00 62.63 0.00 1470.71 0.00
735.35 23.48 0.40 6.39 0.32 2.02
sdb 1.01 45.45 18.18 22.22 848.48 557.58 424.24
278.79 34.80 0.72 17.90 8.30 33.54
sdc 0.00 0.00 0.00 0.00 0.00 0.00 0.00
0.00 0.00 0.00 0.00 0.00 0.00
md1 0.00 0.00 19.19 65.66 848.48 525.25 424.24
262.63 16.19 0.00 0.00 0.00 0.00
vmstat -n 1
procs -----------memory---------- ---swap-- -----io---- --system-- ----
cpu----
r b swpd free buff cache si so bi bo in cs us
sy id wa
0 7 874192 674664 87508 393720 0 0 944 0 1707 1678 3
1 42 55
1 8 874192 669452 87616 395012 0 0 1376 0 1705 1653 3
1 41 55
0 11 874192 671176 88136 396056 0 0 900 864 1900 1858 5
2 40 54
0 8 874104 654092 88248 397032 72 0 1464 8 1802 2203 6
2 31 61
0 3 874104 614852 88296 399040 0 0 1152 2480 2360 3418 8
3 39 50
0 5 874104 617644 88528 399408 0 0 984 2896 2312 3078 7
3 42 49
1 4 874104 601456 88800 400560 0 0 972 2860 2674 4823 16
4 53 28
При копировании файла в 600M:
2 16 873592 37352 94664 920460 0 0 13380 15012 1834 2214 4
2 6 88
2 14 873592 41628 94780 915384 0 0 11432 16536 2060 2967 10
5 15 70
4 14 873592 53932 94888 923500 0 0 4844 3160 2032 2900 8
5 11 76
1 14 873592 34244 95000 951636 0 0 19072 9032 2338 3736 9
4 10 77
0 21 873612 35184 94988 895324 0 8 9852 20804 1997 3273 7
4 10 80
3 17 873640 86368 94952 896244 0 164 19840 17632 2065 2908 7
5 6 82
Через ~5 минут тормоза проходят.
На сервере работают апачи (2.2) с PHP SAPI, sendmail, vsftpd, samba,
courier (десяток юзеров) и больше ничего нет.
Конфигурация сервера:
мат. плата Intel SR1500;
2x Xeon (четырехядерные);
RAM 4G
Диски Seagate SATA2
# cat /etc/fstab
/dev/sda2 / ext3
noatime 0 1
/dev/sda5 /var reiserfs
nosuid 0 2
/dev/sda6 /home reiserfs
nosuid,nodev 0 2
/dev/sda7 /usr ext3
noatime 0 2
/dev/sda8 /opt ext3
noatime,nodev 0 2
/dev/md1 /home2 reiserfs
nosuid,noatime,nodev,usrquota,acl 0 2
tmpfs /tmp tmpfs
nosuid,noexec,size=1024m 0 0
proc /proc
proc 0 0
/dev/sda1 swap swap
pri=5 0 0
# hdparm -tT /dev/sda5
/dev/sda5:
Timing cached reads: 5194 MB in 2.00 seconds = 2598.28 MB/sec
Timing buffered disk reads: 180 MB in 3.01 seconds = 59.86 MB/sec
DMA 0 -> 4096
DMA32 4096 -> 1048576
DMA zone: 56 pages used for memmap
DMA zone: 1075 pages reserved
DMA zone: 2867 pages, LIFO batch:0
DMA32 zone: 14280 pages used for memmap
DMA32 zone: 635577 pages, LIFO batch:31
PCI-DMA: Using software bounce buffering for IO (SWIOTLB)
ide0: BM-DMA at 0x30c0-0x30c7, BIOS settings: hda:pio, hdb:pio
ide1: BM-DMA at 0x30c8-0x30cf, BIOS settings: hdc:pio, hdd:pio
ata1: SATA max UDMA/133 cmd 0xFFFFC20000006100 ctl 0x0 bmdma 0x0 irq
20
ata2: SATA max UDMA/133 cmd 0xFFFFC20000006180 ctl 0x0 bmdma 0x0 irq
20
ata3: SATA max UDMA/133 cmd 0xFFFFC20000006200 ctl 0x0 bmdma 0x0 irq
20
ata4: SATA max UDMA/133 cmd 0xFFFFC20000006280 ctl 0x0 bmdma 0x0 irq
20
ata5: SATA max UDMA/133 cmd 0xFFFFC20000006300 ctl 0x0 bmdma 0x0 irq
20
ata6: SATA max UDMA/133 cmd 0xFFFFC20000006380 ctl 0x0 bmdma 0x0 irq
20
ata1.00: ATA-7, max UDMA/133, 1465149168 sectors: LBA48 NCQ (depth
31/32)
ata1.00: configured for UDMA/133
ata2.00: ATA-7, max UDMA/133, 1465149168 sectors: LBA48 NCQ (depth
31/32)
ata2.00: configured for UDMA/133
ata3.00: ATA-7, max UDMA/133, 1465149168 sectors: LBA48 NCQ (depth
31/32)
ata3.00: configured for UDMA/133
Система Gentoo x86-64, 2.6.20.
Знатоки Linux'а просветите, чем могуть быть обусловлены такие тормоза
и высокий iowait?
--
BRGDS. Alexey Vlasov.
На сервере без всякой периодичности происходит коллапс
производительности, который сопровождается высоким LA, до 500-1500, и
iowait 100%.
Так выглядит top (при большем LA он отличается только большим
wait'ом) :
top - 13:04:09 up 55 days, 5 min, 3 users, load average: 188.97,
68.74, 25.99
Tasks: 1225 total, 5 running, 1194 sleeping, 2 stopped, 24 zombie
Cpu(s): 7.0% us, 6.5% sy, 0.0% ni, 0.0% id, 85.8% wa, 0.1% hi,
0.6% si
Mem: 4032680k total, 3993164k used, 39516k free, 11608k
buffers
Swap: 7815580k total, 1669872k used, 6145708k free, 45452k
cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
16993 10957 16 0 227m 112m 4152 D 5 2.9 0:05.40 httpd
17392 27090 15 0 152m 39m 3844 S 3 1.0 0:00.11 httpd
15464 30073 16 0 154m 18m 4744 S 3 0.5 0:00.16 httpd
17715 30073 15 0 153m 18m 4716 S 3 0.5 0:00.33 httpd
17185 28488 17 0 158m 44m 3828 S 3 1.1 0:00.16 httpd
17171 28488 15 0 160m 48m 4376 S 2 1.2 0:01.48 httpd
17229 27090 15 0 152m 39m 3928 S 2 1.0 0:00.13 httpd
17072 27307 15 0 158m 50m 4432 S 2 1.3 0:00.46 httpd
17078 30774 16 0 159m 51m 4460 D 2 1.3 0:00.62 httpd
При нормальном состоянии:
top - 13:56:27 up 59 days, 57 min, 3 users, load average: 1.49,
1.63, 1.80
Tasks: 651 total, 2 running, 648 sleeping, 0 stopped, 1 zombie
Cpu(s): 7.2% us, 3.3% sy, 0.0% ni, 86.2% id, 3.0% wa, 0.0% hi,
0.2% si
Mem: 4032680k total, 3639568k used, 393112k free, 196084k
buffers
Swap: 7815580k total, 870528k used, 6945052k free, 807292k
cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
29537 27307 15 0 171m 34m 4560 S 8 0.9 0:02.51 httpd
30388 27307 16 0 173m 36m 4444 R 7 0.9 0:01.57 httpd
31493 27307 15 0 166m 30m 4388 S 6 0.8 0:00.92 httpd
30909 30073 15 0 124m 32m 4344 S 3 0.8 0:00.12 httpd
31481 20632 17 0 173m 36m 4432 S 3 0.9 0:00.10 httpd
31242 29013 15 0 169m 32m 4388 S 3 0.8 0:00.35 httpd
Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s rkB/s wkB/s
avgrq-sz avgqu-sz await svctm %util
sda 0.00 121.21 0.00 62.63 0.00 1470.71 0.00
735.35 23.48 0.40 6.39 0.32 2.02
sdb 1.01 45.45 18.18 22.22 848.48 557.58 424.24
278.79 34.80 0.72 17.90 8.30 33.54
sdc 0.00 0.00 0.00 0.00 0.00 0.00 0.00
0.00 0.00 0.00 0.00 0.00 0.00
md1 0.00 0.00 19.19 65.66 848.48 525.25 424.24
262.63 16.19 0.00 0.00 0.00 0.00
vmstat -n 1
procs -----------memory---------- ---swap-- -----io---- --system-- ----
cpu----
r b swpd free buff cache si so bi bo in cs us
sy id wa
0 7 874192 674664 87508 393720 0 0 944 0 1707 1678 3
1 42 55
1 8 874192 669452 87616 395012 0 0 1376 0 1705 1653 3
1 41 55
0 11 874192 671176 88136 396056 0 0 900 864 1900 1858 5
2 40 54
0 8 874104 654092 88248 397032 72 0 1464 8 1802 2203 6
2 31 61
0 3 874104 614852 88296 399040 0 0 1152 2480 2360 3418 8
3 39 50
0 5 874104 617644 88528 399408 0 0 984 2896 2312 3078 7
3 42 49
1 4 874104 601456 88800 400560 0 0 972 2860 2674 4823 16
4 53 28
При копировании файла в 600M:
2 16 873592 37352 94664 920460 0 0 13380 15012 1834 2214 4
2 6 88
2 14 873592 41628 94780 915384 0 0 11432 16536 2060 2967 10
5 15 70
4 14 873592 53932 94888 923500 0 0 4844 3160 2032 2900 8
5 11 76
1 14 873592 34244 95000 951636 0 0 19072 9032 2338 3736 9
4 10 77
0 21 873612 35184 94988 895324 0 8 9852 20804 1997 3273 7
4 10 80
3 17 873640 86368 94952 896244 0 164 19840 17632 2065 2908 7
5 6 82
Через ~5 минут тормоза проходят.
На сервере работают апачи (2.2) с PHP SAPI, sendmail, vsftpd, samba,
courier (десяток юзеров) и больше ничего нет.
Конфигурация сервера:
мат. плата Intel SR1500;
2x Xeon (четырехядерные);
RAM 4G
Диски Seagate SATA2
# cat /etc/fstab
/dev/sda2 / ext3
noatime 0 1
/dev/sda5 /var reiserfs
nosuid 0 2
/dev/sda6 /home reiserfs
nosuid,nodev 0 2
/dev/sda7 /usr ext3
noatime 0 2
/dev/sda8 /opt ext3
noatime,nodev 0 2
/dev/md1 /home2 reiserfs
nosuid,noatime,nodev,usrquota,acl 0 2
tmpfs /tmp tmpfs
nosuid,noexec,size=1024m 0 0
proc /proc
proc 0 0
/dev/sda1 swap swap
pri=5 0 0
# hdparm -tT /dev/sda5
/dev/sda5:
Timing cached reads: 5194 MB in 2.00 seconds = 2598.28 MB/sec
Timing buffered disk reads: 180 MB in 3.01 seconds = 59.86 MB/sec
DMA 0 -> 4096
DMA32 4096 -> 1048576
DMA zone: 56 pages used for memmap
DMA zone: 1075 pages reserved
DMA zone: 2867 pages, LIFO batch:0
DMA32 zone: 14280 pages used for memmap
DMA32 zone: 635577 pages, LIFO batch:31
PCI-DMA: Using software bounce buffering for IO (SWIOTLB)
ide0: BM-DMA at 0x30c0-0x30c7, BIOS settings: hda:pio, hdb:pio
ide1: BM-DMA at 0x30c8-0x30cf, BIOS settings: hdc:pio, hdd:pio
ata1: SATA max UDMA/133 cmd 0xFFFFC20000006100 ctl 0x0 bmdma 0x0 irq
20
ata2: SATA max UDMA/133 cmd 0xFFFFC20000006180 ctl 0x0 bmdma 0x0 irq
20
ata3: SATA max UDMA/133 cmd 0xFFFFC20000006200 ctl 0x0 bmdma 0x0 irq
20
ata4: SATA max UDMA/133 cmd 0xFFFFC20000006280 ctl 0x0 bmdma 0x0 irq
20
ata5: SATA max UDMA/133 cmd 0xFFFFC20000006300 ctl 0x0 bmdma 0x0 irq
20
ata6: SATA max UDMA/133 cmd 0xFFFFC20000006380 ctl 0x0 bmdma 0x0 irq
20
ata1.00: ATA-7, max UDMA/133, 1465149168 sectors: LBA48 NCQ (depth
31/32)
ata1.00: configured for UDMA/133
ata2.00: ATA-7, max UDMA/133, 1465149168 sectors: LBA48 NCQ (depth
31/32)
ata2.00: configured for UDMA/133
ata3.00: ATA-7, max UDMA/133, 1465149168 sectors: LBA48 NCQ (depth
31/32)
ata3.00: configured for UDMA/133
Система Gentoo x86-64, 2.6.20.
Знатоки Linux'а просветите, чем могуть быть обусловлены такие тормоза
и высокий iowait?
--
BRGDS. Alexey Vlasov.