DD VTL備份速度慢?也許你錯怪它啦。昨天的內(nèi)容中,EMC技術(shù)大神Jim列出了影響備份性能的多種原因,從存儲節(jié)點(diǎn)到VTL的數(shù)據(jù)流,各個流程都可能影響備份速度。今天我們把剩下的內(nèi)容講完,看看通信協(xié)議是否也會影響性能,以及從Data Domain本身找找原因。
文/EMC備份恢復(fù)遠(yuǎn)程支持部 Jim
TCP/IP網(wǎng)絡(luò)方面,我們可以增加TCP window size 和buffer size來提升數(shù)據(jù)在網(wǎng)絡(luò)傳輸過程中的吞吐量:
∧∧向上滑動瀏覽∧∧
Oracle Solaris
tcp_default_mss-recommend is 1500 MTU
tcp_sendspace-changed to 16KB or 32KB
tcp_recvspace-changed to 16KB or 32KB
設(shè)置TCPIPWINDOW SIZE 63k 或者更高
編輯文件in_proto.c 來調(diào)整下面的buffer size
AIX-no(network option)-我們可以使用’no’命令來調(diào)整網(wǎng)絡(luò)參數(shù)
§ lowclust = 200
§ lowmbuf = 400
§ thewall = 131072
§ mb_cl_hiwat = 1200
§ sb_max = 1310720
§ rfc1323 = 1
Use no –a to view current settings
When using TCP window sizes ≥ 64, set rfc1323 to 1
Here are the recommended values for the parameters described in this section
Windows Platform
WIN2008: [HKEY_LOCAL_MACHINESYSTEMCurrentControlSetServicesTcpipParameters] Tcp1323Opts,REG_DWORD, 3
WINXP/2K3: [HKEY_LOCAL_MACHINESYSTEMCurrentControlSetServicesTcpipParameters] DefaultSendWindow"=dword:1048576
DefaultReceiveWindow"=dword:1048576
GlobalMaxTcpWindowSize"=dword:1048576
TcpWindowSize"=dword:1048576
Tcp1323Opts"=dword:3
Linux-Check with “cat /proc/sys/net/ipv4/tcp_window_scaling” ,默認(rèn)值應(yīng)該大于64K
SAN網(wǎng)絡(luò)方面:
首先需要排除的是有沒有物理端口或光纖問題。例如我們可以用交換機(jī)的命令查看“porterrshow”-是不是哪個SFP有錯誤,比如’crc error’等物理錯誤計數(shù)。如果你看到哪個口錯誤比較多的,還可以看看光強(qiáng)度是不是夠,這個可以用令’sfpshow’查看(brocade),建議值是大于-7dbm。
備份服務(wù)器和VTL是否跨多個交換機(jī)?建議不要超過3臺交換機(jī)。另外,特別重要的是ISL帶寬夠不夠用,備份數(shù)據(jù)流就像運(yùn)礦的車,不但體積大而且源源不斷的在跑運(yùn)輸,所以馬路寬不寬也很重要。
長距離傳輸?shù)脑捫枰黾咏粨Q機(jī)的B2B credit buffer,這個就相當(dāng)于tcp window size,一次傳的數(shù)據(jù)大一點(diǎn),可以免去在路上往返的開銷。
我們建議主機(jī)那邊的光口只連接到VTL,不能共享,這個也可以避免出現(xiàn)意外的通訊故障。
Slow drain device-我們稱之為累贅型設(shè)備。比如8G的SAN網(wǎng)絡(luò)里連接了2G的節(jié)點(diǎn),慢的設(shè)備會成為瓶頸所在,因為它處理數(shù)據(jù)很慢,其他設(shè)備都會因為等待它的回應(yīng)而造成整體性能的下降。
Zoning的配置很重要,多個initiator放在一個zoning 有時候會造成性能問題,因為他們彼此會嘗試握手建立連接,但是永遠(yuǎn)不成功,所以對性能會有些許的影響。
最后,說一下DD本身到底什么情況下會影響性能:
DD本身有硬件問題,比如硬盤或者內(nèi)存的問題。
在出現(xiàn)壞的硬盤以后,RAID在數(shù)據(jù)重建,這個往往會消耗很多系統(tǒng)資源。
垃圾回收和復(fù)制同時運(yùn)行,因為他們會占用很多資源,導(dǎo)致備份速度下降。我們建議備份窗口不要和它們重疊。
系統(tǒng)空間是不是超過了85%,系統(tǒng)空間越滿,DD會占用約多時間來查找數(shù)據(jù)唯一性。
VTL 的光口有沒有負(fù)載均衡。
VTL沒有被充分利用,可以增加并發(fā)數(shù)據(jù)流來提高整體吞吐量。
DD過于繁忙,沒有過多資源來進(jìn)行快速IO處理。我們可以用命令’iostat 2’來監(jiān)控。
本次就聊到這里,對于DD虛擬帶庫的性能問題概括起來就是先排除DD本身有沒有問題,比如硬件問題,空間使用情況,系統(tǒng)資源負(fù)載情況,光纖口有沒有做到負(fù)載均衡。所有其他的瓶頸都是DD以外的,最直接的就是磁帶設(shè)備的block size是不是大于256k。光纖網(wǎng)絡(luò)有沒有性能和配置問題以及備份主機(jī)的壓力情況等等。總而言之,順著單向的數(shù)據(jù)流一個個節(jié)點(diǎn)排查就是了。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。