Synology NAS 遷移 migration 造成外接的 Btrfs RAID5 磁碟陣列半毀 OSSLab 資料救援修復記錄





如標題,我在從一台舊 Synology NAS 遷移到新 NAS 的過程(也就是保留所有硬碟搬移到另外一台 NAS 上然後重新安裝 DSM 系統就可以繼續正常使用),發生了非預期的 RAID5 陣列損毀,我首先找原廠處理,最後找專業的 OSSLab 處理到好,這篇文章就是把這件事情的始末做一個完整的記錄,當然也包括了大家最關心的費用,到底找專業的廠商修復 RAID5 + Btrfs 要花多少錢?

起因:想要連同 DX513 將 DS918+ 遷移到 DS1821+

我有一台 DS918+ 並且穩定的與 DX513 這台外接的 5bay 硬碟擴充槽已經穩定工作快兩年了吧!

Synology 原廠網頁在 DS918+ 的相容周邊列表內並沒有寫上 DX513 這個 2013 年的產品,正確的外接裝置是外觀看起來與 DX513 幾乎一模一樣的 DX517。但因為我這樣穩定的運作了兩年,也確實是把 DX513 內的五顆硬碟組成 RAID5 正常運作,加上 DX513 與 DX517 都是用 eSATA 介面連接到 NAS 上,所以我想說原廠雖然沒有列入相容列表,但 DS1821+ 這個 8bay 的機種還是可以與 DX513 相結合吧?

這是我 DS918+ 與 DX513 接在一起正常工作的截圖:

這種保留硬碟然後遷移整台 NAS 資料的作法我已經做過很多次,應該算是熟練了,所以我就把 DS918+ 內的四顆硬碟都裝入新買的 DS1821+,並且將 DX513 改接到 DS1821+ 上,然後開始進行遷移:

遷移完 DS1821+ 就開始發出警報聲了,並且 DS1821+ 與 DX513 都亮起了黃色的警告燈:

我看了一下,原本 DS918+ 內的四顆硬碟已經順利在 DS1821+ 上使用並且資料也完整,但是外接的 DX513 卻呈現資料損毀,RAID5 不正常且未掛載的狀況:

1:原本在 DS918+ 內的 4 顆硬碟
2:DX513 內的 5 顆硬碟
3:我添加到 DS1821+ 內的全新硬碟 14TBx3

可以看到 DX513 內的第三顆硬碟變成「未初始化」,整個 RAID5 掉了一顆硬碟,至此我不明白為什麼會發生這種事情,但想説 RAID5 掉一顆硬碟應該沒關係,資料還在吧~只是發現系統也沒有將此 RAID5 掛載起來,所以我看不到裡面的資料,隨即我透過 DSM 內的 技術支援中心→尋求支援 請求 Synology 原廠支援。

上圖有一個很重要的事件證據:DS1821+ 與 DX513 是可以連接在一起,並且並沒有把 DX513 當成是一個普通的外接裝置,而是所有的硬碟都可以被 Synology 的「儲存空間管理員」來管理,也就是 DX513 並不是以單純的外接裝置存在,DX513 內的硬碟都被 DS1821+ 視為內接硬碟並且可以共同管理與組建 RAID,如果被認為是外接硬碟,就不會出現在「儲存空間管理員」內。

Synology 原廠處理過程

發出 support ticket 後的一天,原廠開始有技術人員遠端登入我的 DS1821+ 來觀看陣列損壞狀態,並且表示需要更進一步的研究,接著到了第四天有了明確的回信:

親愛的使用者 您好,

感謝您的耐心等候。

根據目前研發團隊的研究結果,主要是在Migrate到DS1821+,並將DX513接上後,就不斷出現擴充櫃上硬碟的device error, unknow error以及timeout。目前推測是因為DS1821+和DX513並未相容導致。而DS918+雖然和DX513也並未經過相容測試,但由於DS918+和DS1821+的硬體架構並不相同,因此無法用於比較。[1]

此一狀況就像是在讀寫狀態中,將硬碟硬生生拔掉一樣,因此才會導致file system error。

目前研發團隊已經先暫時手動將擴充櫃上的Volume掛載成唯讀模式,但已經有些資料受損了,請您先僅快備份還看得到的資料。若有些重要資料已經無法被看,或是讀取時發生I/O error,建議您尋求專業資料救援團隊的協助。

由於檔案系統錯誤已經無法修復,請您備份完成後,將此Storage Pool以及Volume刪除,將DX513替換成DS1821+有支援的DX517,來避免相容性的問題。

以上回覆希望有幫助,若您有任何其它問題都還請不吝聯繫我們,我們很樂意為您解答!

群暉技術支援工程師

由於是我自己挑戰 DS1821+ 硬上不在支援列表內的 DX513,儘管 migration 的過程一切正常,更沒有斷電等離譜的狀況,但這狀況我還是要自己吞了,誰叫我食髓知味,以為 DX513 既然能夠和 DS918+ 一起工作那應該同理也可以和 DS1821+ 一起工作,但真的不是這樣,發生了預期以外的狀況啊啊啊~

Synology 原廠強行掛上此 RAID5 後我以 terminal 進入 NAS 看到的資料是這樣:

我有三個資料夾的狀態不正常,且進不去,Synology 原廠表示無能為力,要我尋找外面的專業廠商,於是我想到了 OSSLab

尋求 OSSLab 專業資料救援協助

在我與 OSSLab 的老闆聯絡後(因為我們是舊識,認識超過20年啦,所以可以直達天廳找老闆),描述了故障的前因後果,於是我帶著 DX513 內的那五顆硬碟前來長春路上的 OSSLab 了。

親切可愛的服務小姐把硬碟拍照做紀錄。

過了兩天我收到 OSSLab 寄來的檔案列表,是用 HTML 格式來記載所有的檔案和樹狀結構,挺方便觀察的。

他們沒有把話說死說保證資料都 100% 恢復,但我看了一下這已經太完美啦~

當然伴隨著這張檔案列表而來的還有一份維修報價單,想要贖回救回所有檔案就請付錢台幣萬把元~

因為老闆在很久很久以前弄丟了我一顆小硬碟,所以這次就打個折給我,最後我還是要付出近三萬元,終結了這場自找的災難。

所有我知道近期有變動過、新增過的檔案,全部都有出現,內容也都正確,沒有打開來是一堆亂碼的狀況,至此感覺上應該是 100% 救回。

後話

我認為 OSSLab 在這個事件中所展現出來的專業技能是修復受損的 Btrfs。RAID5 的修復應該不難,因為畢竟是掉了一顆,其他四顆內的資料應該足以恢復過來。只是後來我也驗證過那顆說是「未初始化」的硬碟,使用起來一切正常,沒有任何壞軌。

在這個事件結束之後,DX513 再也無法以這個狀態與 DS1821+ 連接,而變成了一個單純的 5bay 外接裝置,我確定剛好就在這個期間 DSM 6.2.4 有一個小幅度的升級版本(2021-03-08 6.2.4-25556,我是 3/7 遷移後發生災難),不知道這個小版本升級是不是徹底終結了 DS1821+ 與 DX513 之間的誤用。

也就是說我無法再度重現 DX513 是可以被 DS1821+ 納為己用並且可以管理磁碟陣列的狀態了,DX513 正式的與 DS1821+ 分手說 byebye,在 DS1821+ 面前 DX513 淪落為凡間的普通外接硬碟櫃。

我也在 DS918+ 與 DX513 的組態下在 DX513 內做好一個 RAID5,然後再把 DX513 接到 DS1821+ 上,也不會於儲存空間管理員內見到 DX513 和 RAID5 了。

我甚至完整重做過,用多餘的備用硬碟先把 DS918+ & DX513 接好也裝好 DSM,並且把 DX513 內的硬碟們做 RAID5,然後把 DS918+ 內的硬碟與 DX513 搬去與 DS1821+ 裝好,再進行一次 migration,也無法重現這次的事件。遷移完後 DX513 上的硬碟都正常沒有故障,但也無法被 DS1821+ 當作 RAID 來看到裡面的資料,而不是像我這次在遷移完後可以看到 DX513 是與 DS1821+ 在一起工作的狀態。

原本的規劃就是要擺脫 DX513 的外接,把上面的資料全部移轉到 DS1821+ 內的 14TBx3 陣列,這讓我在硬碟因為挖 CHIA 幣導致的瘋狂漲價前從對岸的知名硬碟商用台幣兩萬元含運費買回 14TB 硬碟 3 顆真的是賺到了。

最後的最後:原廠沒在自家的相容列表裡面列出的自家設備,要相信啊!不要太鐵齒~



您可能也會喜歡…

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。

:D 
:) 
:( 
:| 
(H) 
:P 
:$ 
:\ 
*-) 
;) 
:-.-: 
:!: 
:S 
:!!: 
[B01] 
[B02] 
[B03] 
[B04] 
[B05] 
[B06] 
[B07] 
[B08] 
[B09] 
[B10] 
[B11] 
[B12] 
[B13] 
[B14] 
[XP] 
:XD 
(Y) 
(N) 
:-O 
:@ 
8o| 
:-# 
(L) 
(U) 
^o) 
|-)