網路城邦
上一篇 回創作列表 下一篇   字體:
【工作小筆記】HP DL-100 NAS 搶救資料大作戰
2010/05/10 10:17:10瀏覽3231|回應2|推薦10

話說在四月中旬,工廠同事告知我,在工廠機房的「機櫃風扇」好像有問題,會一直發出急促且連續的「喀啦」聲響。在仔細確認位置後,我確定是 HP ProLiant DL100 NAS 主機的電源供應器模組中的風扇出了問題。通常,主機風扇出問題後,這台主機若找不到零件替換,也代表這出問題的主機差不多要「壽終正寢」啦!所以,馬上發出 Email 通知會使用該部 NAS 主機的同仁備份資料。幾天後,我到工廠拍了下面這一小段影片,也確定是電源供應器模組中的風扇出了問題,請留意影片中第二十秒以後的聲音。

當然,在得知 NAS 出問題後,我也立刻詢問各供應商是否有零件可用,並且打電話到 HP 的客服專線詢問相關問題,而得到的答案幾乎是「沒有零件」可供替換。

廠商A:「喲!好久沒聽見你的聲音,還以為你消失了呢!......那麼久以前的機型,我們公司都沒有料件囉。」

廠商B:「......如果你們願意簽主機的維護合約的話,那我就幫你們處理。」

廠商C:「......我們好不容易問到一家同業有備品,但他們要整台出售,不願意單賣電源供應器模組。」

廠商D:「對不起,我們公司只賣IBM的主機。」

廠商E:「我們公司只針對有簽MA的客戶服務,不處理單獨叫修的Case。」

HP原廠:「那一台是 2005 年出廠,裝有四顆160GB的SATA硬碟,可做RAID-5,沒辦法單換電源供應器,我們都是『一機換一機』,但現在也不見得有機器可換。但是,它的下一個G2的機型就可單換電源供應器。」

就這樣,一個星期過去了。而每個星期一一大早,我幾乎都會以遠端連線去工廠檢查主機狀態。果然,那台DL-100「掛了」!沒多久,我也立刻接到User打來質疑的電話。而先前提了三次的備份方案,卻都「胎死腹中」,甚至連董事長都沒看到我寫的三份簽呈,況且,我在第一時間也發了 Email 通知 User 自行備份檔案。這樣,我覺得已經問心無愧,況且備份方案沒通過,問題並不是出在我身上;而現在能做的,就是要進行「搶救資料大作戰」了!

由於先前有一家自稱是「以客戶為尊」的廠商,在雙方聯絡的過程中還算積極。所以,我便請求她盡量與她們同業爭取單賣零件或以租用的方式讓我先把資料救出來,後續要如何處理其實都好談。沒想到,她們供應商的態度仍舊非常強硬,我只好對她說:「那只好讓妳的同業那台機器繼續『躺』在他們公司,要是沒人買,就當廢鐵賣掉或回收吧!」果然,再也沒有接到她的後續追蹤電話。

時間拖得越久,壓力也會隨著備增。因此,我打電話向我認識十多年的一家供應商老闆請教對策,而他也很幫忙地去詢問他在磁碟陣列製造公司任職的朋友詢問如何搶救資料。得到的答案卻令我有些擔心,因為他的建議是:「因為主機還可以開機,所以 Raid Card 及 HDD 一定是沒問題的。只要把 Raid Card 及 HDD 拆下來,裝到另一台PC中,而PC若也抓得到那張 Raid Card,那看要怎麼 Copy 資料都行。」所以,我便抽了一個空檔,前往工廠把 NAS 主機載回台北辦公室。

拿回 NAS 後,當然得先把機器拆開檢視一番。不拆還好,拆了就真的令人傻眼!主機板及電容上頭佈滿了灰塵,只好將它推入工作間,以空壓機清除上頭的髒污。

CPU 散熱風扇風道

記憶體插槽及電源供應器模組中間的散熱風扇

以空壓機清潔後的CPU 散熱風扇風道及記憶體插槽及電源供應器模組中間的散熱風扇處

由於清除髒汙並且開機後,它也撐不到十分鐘就斷電,而且斷電後電源供應器的中間部位外殼有點燙,加上廠商死都不肯單賣零件,只好讓我再把電源供應器模組一整個拆下。在還沒有拆開它之前,我查了一下這顆「HIPRO HP U280EF3 REV. 03」的料件。其實,它在中國大陸還有很多存貨,但若由大陸空運來台,除了緩不濟急之外,我們部門那錙銖必較的老大,他大概也不同意這樣做吧!所以,我便把它拆開,並再度拿去以空壓機清除上頭的髒污。

雖然有蓋子保護,但裡頭還是佈滿灰塵

裝上清乾淨的電源供應器模組後,便再開機嘗試。這次我先記下了這 Raid Card 做了三組 Array。Array 0 做 8.9GB 的 Raid-1、Array 1 做 8.9GB 的 Raid-1以及Array 2 做 420GB 的 Raid-5,但此次開機也差不多撐了十分鐘就斷電。而斷電後發現,其中的一個電容散熱鋁片的溫度之高,簡直可以把生雞蛋煮到半熟。所以,便請隔壁部門的同事協助我做了一個克難散熱模組。

自製克難散熱模組

那根迴紋針是為了要直接啟動 PC 的 ATX 電源供應器

自製克難散熱模組運作中

加上了兩個風扇對它狂吹後,它撐了二十幾分鐘,並且讓我 Copy 了一個事業單位的5.5GB資料。而不幸的是,這次關機之後,它再也開不起來了。狀況是有過電,每個散熱風扇也都有啟動,但到了主機板自我檢測畫面並要送訊號到螢幕時便立刻斷電。這時,我仍舊在做「困獸之鬥」,希望那家供應商能改變心意,但卻事與願違。所以,我便剩下最後一條路──拆磁碟陣列介面卡及硬碟!

就在拆下磁碟陣列介面卡後,我發現它是很常見的一張PCI介面卡,它是Adaptec SATA RAID 2410SA。但是它原本插在DL-100的100MHz PCI-X 64-bit插槽上,而我的PC主機板只有 PCI 32-bit插槽,因此我又再度與那家供應商老闆聯絡,而他也表明Adaptec SATA RAID 2410SA 可以直接插在 PCI 插槽上,後半部露出來是沒有關係的。在戒慎恐懼的心情下,我先下載了它的驅動程式,接著把PC關機並裝上了那張磁碟陣列介面卡。

歐耶!我的PC可以正確辨識這張Adaptec SATA RAID 2410SA喔!所以我又再次關機,再由DL-100的前方依序將硬碟拆下,並且以奇異筆寫上硬碟順序。接下來又翻箱倒櫃找出公司「唯四」的IDE轉SATA電源接頭後,再依序把硬碟接上磁碟陣列介面卡上。

Adaptec SATA RAID 2410SA 插在 PC 的 PCI 插槽上,SATA連接線也標上記號。

四顆 HDD 同時接上磁碟陣列介面卡的狀況

當時,心中仍舊是緊張萬分。因為,接著一開機就會知道結果是「上天堂」還是「下地獄」。當按下了電源開關,螢幕一進到XP的登入畫面,心中還是覺得忐忑不安。直到一登入系統,點開「我的電腦」之後,歐耶!真是開心到不行,當下真想衝到外面去放鞭炮啊!所有的資料都還存在於原硬碟之中,真是太 Happy 了。果然,我還是非常幸運的!

更多照片請參閱《搶救資料大作戰



Blog Look Score and Rank
free counters


free web hostingHosting24.com web hosting
Web Analytics
Clicky
( 興趣嗜好電腦3C )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=rickyshiu&aid=3994493
 引用者清單(1)  
2014/10/01 07:31 【udn】 這裡便宜!SATA 馬上 電源線 轉接頭比價

 回應文章

C.S.Julius
等級:8
留言加入好友
緊張刺激!
2010/05/18 12:55
緊張刺激!
看到最後,偶也想要跑出去放鞭炮咧!
真的是要好好恭喜你一下!

在父母的夢想與理想中溺斃了!

瑞奇(rickyshiu) 於 2010-05-18 18:09 回覆:

呵, 這篇文其實還有續集.....

只是最近一直沒時間把它寫完.....

續集目前只寫到一半.....

努力中.


阿菊
等級:8
留言加入好友
這一篇我有熟悉的喔!
2010/05/10 10:26
總算看到我懂的部份...就是....



那堆灰塵啦!



溫度在變化,你的心,也在變化嗎?
瑞奇(rickyshiu) 於 2010-05-10 10:28 回覆:

這台的灰塵還不算 " 經典 "....

哈~~~