http://m.sharifulalam.com 2025-07-01 16:23 來源:天碩
一次微不足道的數(shù)據(jù)錯誤,可能導致數(shù)十萬的虧損風險。在嚴苛的工業(yè)環(huán)境中,數(shù)據(jù)的精準不是優(yōu)選項,而是生死線。天碩 (TOPSSD) 憑借自研主控芯片和深厚的固件技術積累,結合自研4K LDPC ECC算法,將產品的UBER(不可糾正錯誤比特率)降至超低的 10^(-17),為核心數(shù)據(jù)鑄就堅不可摧的屏障。
天碩G55 Pro M.2 NVMe工業(yè)級固態(tài)硬盤以自研PCIe Gen3x4主控+100%純國產元器件實現(xiàn)了3600MB/s高速讀取,-55℃~85℃的超寬溫域穩(wěn)定運行;以硬件級PLP掉電與固件協(xié)同保護全盤,支持智能軟銷毀功能。產品設計滿足工業(yè)級抗振耐沖擊標準,擁有200萬小時+ MTBF高可靠認證及GJB2017體系背書,精準契合國產化存儲對高性能、高可靠、高耐用的嚴苛需求。該產品已廣泛應用于智能制造、雷達系統(tǒng)、電力等領域。
壞塊
要理解SSD為什么需要ECC (Error-Correcting Code;糾錯碼),就需要先理解什么是壞塊。壞塊指含有一個或多個無效位的內存塊,可能出廠即存在或在使用中產生,導致數(shù)據(jù)不可訪問、容量降低、性能下降,直至設備故障。
NAND閃存性能下降和位錯誤
為了管理壞塊,固態(tài)硬盤會通過編程實現(xiàn) ECC 和 NAND 塊映射。當檢測到壞塊時,壞 塊中的數(shù)據(jù)將傳輸至空閑塊,并執(zhí)行特定的糾錯碼來檢測和糾正位錯誤,以減少無效數(shù)據(jù)。隨著單元尺寸縮小和每單元比特數(shù)增加,以下因素會加劇性能下降和誤碼率上升:
(P/E)周期:寫入和擦除的恒定周期要求對NAND單元施加高壓,從而在隧穿氧化層上造成應力并削弱隧穿氧化層。這會導致電子從浮柵泄漏,NAND閃存單元性能下降。
每單元更多位: 新的閃存技術為提高密度,每單元存儲更多位會縮小電壓閾值分布的間隙,引起電壓偏移,并因單元間更緊湊而產生干擾,導致誤碼。
天碩NAND閃存設備中的錯誤檢測和糾正
ECC是糾正NAND錯誤的關鍵技術。與其他采用簡單糾錯算法的產品不同,天碩G55 Pro M.2 NVMe SSD所使用是更高級的機制:天碩自研的4K LDPC ECC。
LDPC(低密度奇偶校驗)
LDPC碼,也稱Gallagher碼,它們具有解碼軟位數(shù)據(jù)和硬位數(shù)據(jù)的能力。在Gallagher的論文中,低密度奇偶校驗碼被定義為“一種校驗矩陣中1的分布非常稀疏的線性二進制分組碼”,這意味著1比0要少。其具有以下優(yōu)勢:
1.低解碼復雜度
2.能夠同時利用NAND中的硬位和軟位信息進行解碼
3.良好的短塊性能
4.為長塊提供“近容量”(接近香農極限)性能
LDPC碼是目前最先進的糾錯算法。而天碩自主研發(fā)的4K LDPC ECC技術,則在原有技術基礎上進一步強化,實現(xiàn)了更低的數(shù)據(jù)錯誤率,增強了產品可靠性:
糾錯強度倍增:天碩的4K LDPC通過優(yōu)化奇偶校驗矩陣密度和解碼算法,糾錯能力較傳統(tǒng)LDPC提升數(shù)倍,尤其在處理高誤碼率場景(如極端溫度、輻照環(huán)境)時表現(xiàn)更穩(wěn)定。
適配高密度閃存:針對長江存儲等3D NAND的高密度架構,4K LDPC優(yōu)化了電壓閾值分布偏移的容錯性,減少因單元干擾導致的數(shù)據(jù)錯誤。
天碩的先進錯誤檢測和糾正技術,將數(shù)據(jù)出錯的可能性降至極限,為工業(yè)存儲產品帶來了更強大的可靠性。