본문 바로가기
Broadcast Tech.

아카이브 구축의 필요성과 미래 방향

by poZidea 2023. 7. 17.
반응형

디지털 데이터가 모든 측면에서 중요해짐에 따라 데이터의 증가는 불가피합니다. 데이터 보존 요구사항은 유형에 따라 다르겠지만 아카이브에 데이터 축적은 빠르게 일어나고 있습니다. 이러한 니즈 때문에 아카이브는 백업을 넘어 독립적인 기술 분야로 주목받고 있습니다. 

 

백업과 아카이브의 차이 

백업은 데이터 사본을 만드는 프로세서로서, 원본 사본이 손상되거나 손상될 경우 원본을 복원하는 데 사용할 수 있습니다. 중요한 데이터일수록 복구 속도는 중요해집니다. 

아카이빙은 더 이상 활발하게 사용되지는 않지만 장기 보관을 위해 다른 물리적인 위치에 안전하게 보관해야 하는 데이터를 이동하여 더 많은 비용이 드는 공간을 확보하는 과정입니다. 대부분의 아카이브는 데이터를 읽기 전용으로 초리 하여 수정되지 않도록 보호합니다.  

 

 

백업(데이터 복사) 아카이브(데이터 이동) 활성 아카이브
보호 및 복구를 위해 데이터를 복사하고, 원본 데이터는 유지 자주 사용하지 않은 데이터를 보다 효율적인 스토리지로 이동하여 소스 디바이스 공간 확보 지능형 소프트 웨어,SSD,테이프 시스템의 결합 
데이터 손실 시 원하는 사점으로 파일 복원
- 속도 중요
참조 및 분석을 위해 파일 검색
 - 속도 중요X
대용량 테이프 라이브러리를 위한 캐시 프론트앤드 - HDD 사용
주기적 프로세스, 보존기간 종료시 덮어 쓰기 영구적으로 증가하며 일반적으로 변경되지 않고 덮어쓰지 않음 파일 및 개체 수준에서 항상 보관 날짜에 대한 엑세스 제공 
단기간 영구적이고 장기적인 데이터를 변경으로부터 보호 아카이브 데이터에 더 쉽게 액세스 하여 워크플로우 개선

백업과-아카이브의-차이
백업과 아카이브의 차이

아카이브의 비정형 데이터

아카이브 데이터는 주로 검색이 쉽지 않은 비정형 데이터로, 사무용 문서, 오디오, 이미지, 과거 기록 등 데이터베이스에 없는 모든 것을 포함합니다. 

빅데이터는 대부분 비정형 아카이브 데이터로 구성되어 있어 기존 방법으로 검색이 어려운 문제점이 있습니다. 

하지만, 빅데이터를 분석하는 많은 도구가 메타데이터, 태그 및 카탈로그를 활용하여 아카이브 데이터를 쉽고 빠르게 검색할 수 있도록 지원하고 있습니다. 

 

데이터 분류 4 계층 

데이터 분류 프로세스는 스토리지 크기가 커질 수록 중요성도 더욱 커집니다. 원하는 만큼 스토리지 계층을 정의할 수 있지만, 보통 데이터 분류 계층은 네 가지가 사용됩니다. 

 

  • 초고성능 데이터 (PLTP)
  • 성능 데이터 (미션 크리티컬)
  • 활성 아카이브 (낮은 활동 데이터)
  • 장기 아카이브 

 

 

 

데이터 분류를 통해 데이터 특성을 최적의 스토리지 기술 계층에 맞게 조정하고 매핑할 수 있습니다. 가능한 많은 데이터를 비용이 적게 드는 스토리지 계층으로 옮기는 것이 최신 아카이빙 구축의 핵심이며 비용 절감이라는 경제적 이득을 더해 줍니다. 

이상적인 아카이브 구축은 데이터 분류와 메타데이터 생성이 주요 핵심 작업입니다. 데이터의 가차 실현을 위한 4가지 주요 과제는 다음과 같습니다. 

  • 수집 시 아카이브 데이터 접근성 확보 
  • 장기적인 아카이브 스토리지 인프라 관리 
  • 실제 필요한 데이터만 저장 
  • 아카이브 데이터 보안 및 가용성 보장 

 

클라우드의 테이프 아카이브 구현

테이프(Tape) 르네상스

1950년대 최초의 테이프 드라이브가 등장한 이래 테이프는 디스크 데이터의 백업 장치로 사용되었습니다.

물리적인 손상이 많았던 레거시 테이프 시대는 2000년대 들어서면서 막을 내립니다. 테이프 업계가 새롭게 등장하는 많은 데이터 집약적 애플리케이션을 처리하기 위한 새로운 기반을 구축하는 테이프 르네상스가 진행되면서 백업기능의 테이프가 아카이빙에 자리를 내주기 시작합니다. 

 

과거 테이프 테이프 르네상스 현재 테이프 
다양한 포맷 및 파일시스템
엣지,늘어남,찢김,압착
미디어 수명 4~10년
HDD보다 낮은 신뢰성 
백업기능 
LTO와 LTFS(표준 테이프 및 파일 시스템 교환)
30+년 미디어 수명을 위해 MP에서 산화미디어로 전환 
최고의 신뢰성을 위해 HDD애서 PRML ECC차용
HDDS에서 GMR 헤드 사용
서보 트랙을 테이프 가장자리에서 중간 대역 이동 
견고한 카트리지 
HDD보다 높은 신뢰성 
HDD보다 2배 이상 빠른 데이터  속도 
30년 이상 수명 
엑사바이트 라이브러리 
최저 에너지 소비 및 TCO
지능형 로봇 공학 
아카이브 기능 

다양한 테이프 기술의 발전으로 미래에 직면하게 될 고용량 및 아카이빙 과제를 해결하는 가장 효율적인 스토리지로 독립적인 영역을 만들 수 있는 기반을 마련할 수 있게 되었습니다. 테이프가 HDD나 SSD를 대처하지는 않겠지만 표준 아카이브 구조가 될 것입니다. 

향후 10년을 내다 보면, 많은 애플리케이션과 워크로드, 그리고 대부분의 대규모 하이퍼스케일 데이터 센터에서 데이터가 폭발적으로 증가함에 따라 테이프의 역할은 커질 것입니다.

 

HSDC 스토리지 구축과 미래 아카이브

2020년부터 가장 빠르게 성장하는 데이터센터 유형으로 전 세계적으로 570개에 달하는 HSDC가 구축되었습니다. 데이터 센터와 정보 기술은 현재 전 세계 전력의 약 2%를 소비하고 있으며 2030년에는 8%까지 급증할 것으로 예상됩니다. HSDC는 최신 아카이빙 전략의 진원지가 될 수 있습니다. 

HSDC는 운영 예산과 에너지자원을 소모하고 데이터 센터를 과밀하게 만드는 디스크 팜을 극복하여 아카이빙 및 활동량이 적은 데이터를 테이프로 대처해야 하는 상황에 직면해 있습니다. 테이프 카트리지는 수명의 대부분을 라이브러리 슬롯이나 선반에 보관하며 테이프 드라이브에 장착되어 있지 않을 때는 에너지를 소비하지 않아 이상적인 아카이빙 스토리지 구축이 가능합니다. 삭제 코딩, 엑사스케일 용량으로 지리적 확산을 지원하는 동시에 최저 TCO, 최고의 신뢰성, 향상된 사이버 보안 보호를 제공하는 확장성이나 뛰어난 고급 에어 갭 테이프 아키텍처는 앞으로 직면하게 될 막대한 HSDC 스토리지 과제를 해결하는 데 점점 더 중요한 역할을 할 것입니다.

 

미래의 아카이브의 구조는 여러 위치에 분산된 엑사바이트급 용량을 저장, 보호, 보존, 검색하고 쉽게 확장할 수 있는 기능을 갖추는 것이 목표가 됩니다. 대부분의 기업과 서비스 제공업체는 자연재해, 사이버 공격, EMP 또는 기타 재난으로 인해 전체 데이터센터가 오프라인 상태가 되거나 엑서스가 차단될 수 있기 때문에 단일 위치만으로는 고가용성 데이터 보호 전략을 제공하기에 충분하지 않을 수 있습니다. 

 

 

 

구성 요소 기능
액티브 아카이브
소프트웨어 
비전형 및 오브젝트 데이터를 확장하고 지리적으로 분산하여 아카이브 스토리지 요구 사항을 관리하고 보호하는 오브젝트 스토리지 소프트웨어
데이터 무버 스토리지 장치에서 데이터를 검색하여 네트워크 클라이언트에서 사용할 수 있도록 함
분류 조직의 모든 데이터 자산에 대한 상세한 인벤토리를 수집 시 생성하여 분석 또는 비지니스 목적에 가장 적절한 데이터를 신속하게 배치, 보호 및 검색
최적의 아카이브
스토리지
최적의 TCO,안정성,미디어 수명,확장성,최소한의 리마스터링,최저 비용을 위한 최신 테이프. 고성능 액티브 아카이브를 위한 대용량 HDD
RAIL 중복성 및 가용성 향상을 위해 여허 테이프 라이브러리에 걸쳐 데이터를 스트리밍 
이레이저 코딩 데이터를 샤드로 분할하고 인코딩 후 여러 위치에 저장하여 고가용성을 보장하는 패리티 기반 보호 체계
지리적 분산 여러 곳에 위치한 여러 물리적 스토리지 시스템에 제이터 분산

 


전 세계의 기업, 정부, 사회, 개인이 데이터에 대한 의존도가 높아지면서 데이터 보존과 아카이빙이 중요한 IT 업무로 빠르게 자리 잡고 있습니다. 디지털 아카이브의 보존 규모는 현재 페타스케일, 엑사스케일 수준에 도달했으며 곧 제타스케일 용량에 근접할 것으로 예상됩니다. 활동량은 적지만 잠재적으로 가치 있는 아카이브 데이터를 최적의 스토리지 계층으로 이동하는 전략은 데이터를 스토리지 계층에 맞게 조정하면서 스토리지 비용을 가장 크게 절감할 수 있는 방법입니다. 새로운 기술이 등장하지 않는 한, 테이프의 수많은 개선 사항으로 인해 테이프는 가까운 미래에 가장 확실한 최적의 데이터 아카이빙 스토리지가 될 것입니다.  

반응형

댓글