데이터 중력
데이터 중력은 전체 IT 인프라에 영향을 미치므로 데이터 관리 전략을 계획할 때 중요한 고려 사항이 되어야 합니다.
이제 데이터는 물리적 자본 및 지적 재산과 마찬가지로 모든 분야의 비즈니스에 필수적인 자산입니다. 구조화된 데이터와 구조화되지 않은 데이터의 양이 모두 지속적으로 증가함에 따라 데이터 성장은 앞으로도 전례 없는 속도로 계속될 것입니다. 한편 비즈니스 데이터가 더 이상 한 위치에 있지 않고 여러 데이터 센터와 지역에 흩어져 있는 수준의 증가 정도인 데이터 확산은 데이터의 성장, 이동 및 활성화를 관리하는 데 있어서 복잡성을 가중시킵니다.
기업은 클라우드, 엣지 및 엔드포인트 환경에서 대량의 데이터를 효율적으로 관리하는 전략을 구현해야 합니다. 그리고 데이터 스토리지 인프라스트럭처를 대규모로 설계할 때 의식적이고 계산된 전략을 개발하는 것이 그 어느 때보다 중요합니다.
테라바이트 규모에서 작동한 방식은 페타바이트 규모에서 작동하지 않습니다. 기업이 데이터를 대규모로 저장, 이동 및 활성화하는 데 드는 비용과 복잡성을 극복하는 것을 목표로 함에 따라 경제성 향상, 적은 마찰 및 단순한 경험을 추구해야 합니다. 즉, 분산된 기업을 위해 구축된 단순하고 개방적이며 한계가 사라진 시스템이 필요합니다. 데이터의 신세계
데이터 중력의 개념은 이러한 노력에서 고려해야 할 중요한 요소입니다.
Seagate에서 후원한 IDC의 새로운 보고서인 미래형 스토리지: 하이브리드, 엣지 및 클라우드 에코시스템 전반의 데이터 증가에 대비한 인프라 현대화에 따르면 대용량 데이터 세트와 연결된 스토리지가 계속 증가함에 따라 IT 세계의 다른 요소에 대한 중력도 증가할 것입니다
일반적으로 데이터 중력은 데이터의 양과 활성화 수준의 결과라고 할 수 있습니다. 기초 물리학에서 적절한 비유를 찾아볼 수 있습니다. 즉, 질량이 더 큰 물체는 주변 물체에 더 큰 중력 효과를 미칩니다. IDC 보고서에 따르면 "저장된 데이터의 양이 가장 많은 작업 부하는 '세계' 내에서 가장 큰 규모를 보임으로써 애플리케이션, 서비스 및 기타 인프라 리소스를 해당 궤도로 끌어당깁니다."
대규모 활성 데이터 세트는 복잡성과 중요성으로 인해 상호 작용해야 하는 작은 데이터 세트의 위치와 처리에 필연적으로 영향을 미칩니다. 따라서 데이터 중력은 데이터 수명 주기 역학을 반영하며 IT 아키텍처 결정에 정보를 제공해야 합니다.
하나는 1페타바이트이고 다른 하나는 1기가바이트인 두 가지 데이터 세트를 고려해 보겠습니다. 두 세트를 통합하려면 작은 데이터 세트를 큰 데이터 세트 위치로 이동하는 것이 더 효율적입니다. 결과적으로 1페타바이트 세트가 있는 스토리지 시스템에서 이제 1기가바이트 세트도 저장합니다. 큰 데이터 세트는 다른 작은 데이터 세트를 '끌어당기기' 때문에 큰 데이터베이스는 데이터를 함께 증가시켜 전체 데이터 중력을 더욱 증가시킵니다.
또한 데이터 관리, 분석 및 활성화는 개인 또는 공용 클라우드 공급업체 또는 온 프레미스 데이터 관리 팀에서 제공하는 애플리케이션 및 서비스에 의존합니다. 애플리케이션은 데이터를 수집 및 생성할 뿐만 아니라 소비, 분석 및 집계하는 등 데이터에 대한 많은 작업을 진행해야 합니다. 당연히 데이터 세트가 커질수록 데이터를 관리하거나 활성화하는 데 도움이 되는 애플리케이션 및 서비스에 가깝지 않은 경우 해당 데이터를 사용하기가 더 어렵습니다. 따라서 애플리케이션과 서비스는 종종 데이터 세트 가까이 이동하거나 데이터 세트 근처에 보관하는 경우가 많습니다. 온 프레미스 데이터 센터에서 공용 클라우드 및 엣지 컴퓨팅에 이르기까지 데이터 중력은 IT 인프라 전반의 속성입니다.
그러나 IDC 보고서에 따르면 'IT 환경이 운영 위치와 관계없이 저장된 데이터와 이에 의존하는 애플리케이션 및 서비스를 마이그레이션 및 관리할 수 있도록 설계되지 않는다면 이러한 방대한 데이터 세트는 저장된 데이터, 애플리케이션 및 서비스를 단일 위치에 가두는 블랙홀처럼 될 수 있습니다.'
데이터 중력은 전체 IT 인프라에 영향을 미칠 수 있으므로 데이터 관리 전략을 계획할 때 주요 설계 고려 사항이 되어야 합니다. IDC에 따르면 데이터 에코시스템 설계의 중요한 목표는 '단일 데이터 세트가 나머지 IT 및 애플리케이션 에코시스템에 제어할 수 없는 힘을 가하지 않도록 하는 것'입니다.
IT 아키텍처 전략은 대용량 스토리지와 데이터 이동을 중심으로 수립되어야 합니다. 이는 데이터 위치 최적화로 시작됩니다. 데이터 중심 아키텍처는 시간과 비용이 많이 드는 중앙 집중식 서비스 제공업체와의 대량 데이터 장거리 전송에 의존하지 않고 애플리케이션, 서비스 및 사용자 상호 작용을 데이터가 존재하는 위치에 더 가깝게 제공합니다.
IDC에서는 '데이터 중력의 영향을 완화하는 한 가지 방법은 저장된 데이터가 위치와 관계없이 애플리케이션에 인접하게 배치되도록 하는 것'이라고 말합니다.
이 모델은 여러 개인 클라우드와 공용 클라우드 서비스 제공업체를 한데 모은 공동 데이터 센터를 활용하여 구축할 수 있으며, 기업은 대용량 데이터 스토리지를 애플리케이션, 컴퓨팅 및 네트워킹 요구 사항을 위한 최상의 솔루션과 결합할 수 있습니다.
데이터 중심 아키텍처의 핵심 목표는 데이터 접근성입니다. 접근성은 데이터 파이프라인의 사용 편의성과 원활한 운영을 제고하고, 미래의 비즈니스 혁신에 영향을 미칠 수 있으며, 메타데이터 및 새로운 데이터 세트의 생성 능력을 개선하고, 데이터 검색 및 발견을 지원하며, 데이터 과학자가 머신 러닝 및 AI용 데이터를 배포할 수 있도록 돕습니다.
그러나 IT 아키텍처의 중심에 데이터를 배치하면 애플리케이션 성능 최적화, 전송 지연 문제, 액세스 및 송신비, 보안 및 준수 요구 사항에 긍정적인 영향을 미칠 수 있습니다. 데이터의 전반적인 신뢰성과 내구성도 중요한 이점입니다. 신뢰성은 필요할 때 데이터에 액세스하는 능력이며, 내구성은 장기간에 걸쳐 데이터를 보존하는 능력입니다.
전적으로 이러한 고려 사항은 전체 IT 전략 정의에서 비즈니스 이니셔티브 수립에 이르기까지 엔터프라이즈 데이터 관리 계획에 지대한 영향을 미칩니다. 필요한 작업 부하와 작업을 계획하는 것은 데이터 중력을 고려한다는 의미입니다. 확인할 주요 질문은 다음과 같습니다. 생성되거나 소비되는 데이터의 양은 얼마나 됩니까? 데이터 센터, 개인 클라우드, 공용 클라우드, 엣지 기기, 원격 사무실 및 지사 전체의 데이터 배포 방식은 무엇입니까? 전체 IT 에코시스템에서 전송되는 데이터의 속도는 어떻습니까? 이러한 고려 사항을 해결하면 데이터 인프라의 효율성이 향상되고 비용이 많이 드는 데이터 파이프라인 문제를 줄일 수 있습니다.
IDC는 보고서에서 '단일 작업 부하 또는 운영 위치에서 스토리지 또는 데이터 리소스의 이동을 지시하지 않도록 하십시오.'라고 조언합니다. 데이터에는 중력이 있기 때문에 데이터 인프라는 필요에 따라 스토리지, 컴퓨팅 또는 애플리케이션 리소스를 효율적으로 이동하는 아키텍처를 사용하여 대용량 데이터 세트 또는 대규모 개별 작업 부하가 스토리지 리소스에 지배적인 중력을 가하지 않도록 설계해야 합니다.
즉, 어떤 데이터 세트를 어디에서 가져오고 있는지, 데이터를 이동하는 가장 효율적인 경로는 무엇이며, 이러한 작업 부하가 가장 적절하게 실행되는 데 도움이 되는 요소는 무엇인지 항상 파악하고 있어야 한다는 뜻입니다. 이는 또한 데이터 이동을 자동화하여 스토리지 비용을 줄이거나 즉시 또는 적극적으로 필요하지 않은 저성능 데이터 세트를 이동하는 것을 의미할 수도 있습니다. 자동화된 메타데이터 관리도 고려할 가치가 있습니다. 이를 통해 데이터 저장소 전체에서 검색과 탐색을 수행하여 데이터 접근성을 높일 수 있습니다.
이러한 아이디어를 실행에 옮기는 것은 적응형 데이터 아키텍처, 인프라 및 관리 프로세스를 배포하는 것을 의미합니다. 한 조직에서 현재의 데이터 중력 고려 사항에 대해서는 잘 파악하고 있을 수 있지만 지금부터 5년 후에는 똑같지 않을 수 있습니다.
IDC는 보고서에서 다음과 같이 지적합니다. '모든 기업이 여러 개의 대규모 데이터 세트를 관리하는 것은 아니지만 이미 많은 기업이 관리하고 있습니다.' '또한 비즈니스의 디지털화 속도와 엔터프라이즈 데이터 및 데이터 수집의 가치에 대한 중요성을 고려할 때 많은 조직이 가까운 미래에 대규모 데이터 세트를 관리하게 될 것입니다.'
새로운 데이터 요구 사항을 수용하기 위해 모든 데이터 관리 시스템을 변경할 수 있어야 합니다. 데이터 관리 및 이를 지원하는 데이터 아키텍처는 민첩해야 하며 변화하는 비즈니스 요구 사항과 새로운 기술 기회에 적응할 수 있어야 합니다.
Seagate에서 후원한 IDC의 새로운 보고서인 미래형 스토리지: 하이브리드, 엣지 및 클라우드 에코시스템 전반의 데이터 증가에 대비한 인프라 현대화에서 하이브리드 아키텍처, 네트워크 제약 극복 및 스토리지 관리 복잡성 증가에 대해 자세히 알아보십시오.