Estudo de caso da Academia Sinica
Academia de pesquisas climáticas usa Seagate para resolver problema de dados massivos.
A Academia Sinica é uma proeminente instituição de pesquisas climáticas em Taiwan. Os pesquisadores da instituição preveem que, nos próximos quatro anos, verão um aumento de 16 vezes nos dados, totalizando mais de 10 PB. À medida que os dados usados para simulações se expandem, a equipe precisa de um armazenamento de dados confiável que acompanhe o ritmo. As soluções versáteis e escaláveis da Seagate atendem a essa crescente demanda.
Alcançar o zero líquido até 2050 é um esforço global iminente. Em resposta a esse objetivo, Taiwan está promovendo proativamente a legislação relacionada às mudanças climáticas e reestruturando seus departamentos ambientais como um movimento em direção à transição para zero líquido. A equipe de clima do Centro de Mudanças Ambientais (RCEC) da Academia Sinica, a academia de pesquisa mais proeminente de Taiwan, participou conduzindo pesquisas climáticas relevantes com o desenvolvimento do Modelo do Sistema Terrestre de Taiwan (TaiESM).
O TaiESM participou do Attachd Model Intercomparison Project Phase 6 (CIMP6), que é financiado pelo Programa Mundial de Pesquisa Climática (WCRP), e o modelo foi citado no Sixth Assessment Report (AR6) do Painel Intergovernamental de Mudanças Climáticas das Nações Unidas (IPCC)\ Grupo de Trabalho I (WGI). Os dados de simulação do TaiESM são compartilhados com instituições de pesquisa em vários países por meio do portal de dados alimentado pelos sistemas de armazenamento da Seagate. Atualmente, a equipe de clima do RCEC colabora com muitas equipes acadêmicas, incluindo o Instituto de Oceanografia da Universidade Nacional de Taiwan (IONTU), para continuar aprimorando os processos físicos e químicos no TaiESM.
A primeira fase do TaiESM permitiu que a equipe de clima participasse com sucesso das trocas internacionais de dados, e ainda colocou a equipe entre os países mais bem classificados na maioria das avaliações de desempenho de modelo. A versão atual do TaiESM foi desenvolvida com base no Community Earth System Model (CESM) dos Estados Unidos. Huang-Hsiung Hsu, CEO do Anthropogenic Climate Change Center, disse: “Desenvolver nosso próprio modelo encapsula nossos recursos, especificações, tecnicalidades e resultados distintos. Nossa próxima fase é continuar aperfeiçoando a primeira versão do TaiESM com o objetivo de desenvolver um módulo de previsão climática totalmente independente por uma equipe taiwanesa – de programas centrais a módulos internos – que esteja próximo das necessidades locais e verdadeiramente exclusivo de Taiwan.”
Além do desenvolvimento básico do modelo, o aprimoramento do TaiESM também requer a coleta de dados de simulação climática gerados por outras unidades meteorológicas internacionais para comparação e análise com o TaiESM. Outra meta da equipe é ser uma presença global por meio de colaborações internacionais que produzem e divulgam previsões meteorológicas confiáveis e de longo prazo e usabilidade de dados. Tal presença elevaria sua reputação e reconhecimento em Taiwan e em todo o mundo, aumentando as oportunidades para parcerias globais e trocas de dados.
A equipe de clima do TaiESM precisa de armazenamento de dados de mais de 10 petabytes (PB) em um futuro próximo para manter uma demanda mais alta de dados para modelagem. As taxas de disponibilidade de armazenamento existentes e o espaço limitado do servidor não atendem mais aos requisitos da aplicação e cargas de trabalho. A frequência crescente de trocas de dados e coleta de dados aprimorada significa que a equipe precisa de disponibilidade permanente, velocidade e proteção de dados aprimorada.
Para a segunda fase do TaiESM, o Centro de Pesquisa de Mudanças Ambientais precisa de mais capacidade de armazenamento de dados para permitir análises de dados mais robustas e resoluções visuais mais altas, enquanto gerencia um aumento de dados estruturados que é complicado pelo crescimento e dispersão dos dados.
O espaço, o desempenho e a taxa de disponibilidade do equipamento de armazenamento existente não atendiam mais aos requisitos da aplicação e carga de trabalho da equipe. Para preparar e dimensionar seu armazenamento para o futuro, de modo que possa lidar com mais dados de pesquisa e relatórios de análise, o equipamento de armazenamento precisa de expansão imediata.
O crescimento de dados do Centro de pesquisa excedeu em muito a capacidade de um instituto de pesquisa comum. A capacidade atual de dados de pesquisa no centro de pesquisa de mudanças climáticas é de aproximadamente 3 PB. O centro previu que, nos próximos quatro anos, a quantidade de dados climáticos aumentará em pelo menos mais 10 PB. A equipe de clima simula pelo menos dois a quatro terabytes (TB) de dados por dia, e seus requisitos exigem uma troca contínua de dados climáticos, em vez de dados isolados.
Simultaneamente, há uma necessidade urgente de aprimorar a resolução da modelagem. A versão atual do TaiESM oferecia uma resolução que não é ideal para pesquisa. Para simular com precisão as formas de relevo e as condições meteorológicas, como tufões, a equipe procura melhorar sua resolução horizontal em pelo menos quatro vezes. Esse aumento de quatro vezes na resolução significaria um aumento de pelo menos 16 vezes na quantidade de dados.
Quando se trata de replicar as condições meteorológicas de forma realista e prática no laboratório de pesquisas climáticas, as necessidades da equipe ficam ainda mais desafiadoras. Um obstáculo significativo é simular a média de longo prazo das condições climáticas, à medida que as temperaturas mudam da terra para o oceano. A tecnologia avançou a capacidade das unidades de armazenamento e a precisão da computação, permitindo mais grades ou setorização do terreno e, assim, aprimorando as previsões do modelo. Enquanto o processamento de mais dados brutos leva a maiores oportunidades de recursos, o processamento também cria ainda mais dados.
Para buscar uma resolução visual de até 25 km, a equipe cria de 32 TB a 64 TB de dados por dia. A equipe de clima da Academia Sinica deve ajustar e calibrar continuamente as configurações do módulo e comparar os dados produzidos por cada configuração de módulo diferente, o que gera dados adicionais. O armazenamento de dados eficaz e confiável é crucial para a equipe. Falhas em unidades de disco rígido eram um ponto problemático significativo, muitas vezes exigindo a substituição dispendiosa de quatro a dez unidades defeituosas por mês.
Para a equipe de pesquisa climática, quase não há dados frios. A Academia Sinica precisa de uma solução de armazenamento permanente para todos os dados climáticos. Previsões, análises, retrabalho de previsões e análises e dados multimodelos são disponibilizados por meio de servidores de dados dedicados usando um sistema de arquivos distribuído.
À medida que o volume de dados cresce exponencialmente, a equipe deve considerar cuidadosamente os requisitos de capacidade de armazenamento de dados, eficiência de armazenamento, desempenho de armazenamento, bem como fatores menos óbvios, como o tamanho do hardware e os requisitos físicos associados da planta.
O sistema de armazenamento de dados de alta densidade da Seagate, o Exos X série 5U84, obteve desempenho sequencial de leitura e gravação de 7 GB/s e 5,5 GB/s no estágio atual da pesquisa da equipe de clima. A solução inteligente ultradensa da Seagate também superou as expectativas da equipe com uma redução de 75% no espaço de rack do data center e uma redução de 80% no custo total de propriedade. O ADAPT (Advanced Distributed Autonomic Protection Technology) da Seagate também ajudou a equipe a reduzir 93% do tempo de recriação do armazenamento resultante da falha de disco.
A equipe de pesquisa climática busca a arquitetura versátil da Seagate para implantar uma plataforma de alta capacidade e alto desempenho que atenda ao crescimento extremo de dados e gerencie com eficiência os dados retidos e frios com opções de hierarquização de dados em tempo real. A solução da Seagate permite que a Academia Sinica dimensione seu armazenamento com liberdade de acesso aos dados, simplificando as operações e otimizando os custos.
Menos tempo de inatividade e menores custos de manutenção e TI ajudam o TaiESM a se concentrar em aprimoramentos na previsão climática e a gerenciar dados sem sacrificar o desempenho.
A disponibilidade de cinco noves (99,999%) do Exos X 5U84 ajudou a Academia Sinica a oferecer alta confiabilidade de forma consistente. O chassi 5U de densidade máxima acomoda 84 unidades e pode ser expandido para 336 unidades para até 8 PB de armazenamento. Ele está configurado para maximizar o desempenho das unidades ao protegê-las contra interferência acústica e vibracional, calor e irregularidades na alimentação. Com o ADAPT, ele distribui dados de pesquisa climática entre todos os discos, oferece proteção de dados avançada e fornece recriações rápidas sem sacrificar o desempenho, reduzindo o tempo de inatividade. E menos tempo de inatividade estende o ciclo de vida do produto e reduz os gastos de TI com reparos ou substituições.
Com menos tempo de inatividade e menor custo de TI, o TaiESM pode se concentrar em aprimorar seu modelo de previsão climática. No geral, o Exos X série 5U84 ajuda a equipe de clima a gerenciar com eficiência os dados em massa e a reduzir as pesadas despesas de manutenção de equipamentos de armazenamento, permitindo que a equipe contribua com modelos de climatologia de missão crítica para uma crescente comunidade internacional.
Nossos especialistas em armazenamento estão aqui para ajudar você a encontrar a solução certa para seus desafios de dados.