Discos rígidos

Transição para discos rígidos de formato avançado com setores de 4K

Benefícios e armadilhas de mover de 512 para 4.096 bytes

Índice:

Visão geral

A mudança chegou no setor de disco rígido. Visto que as densidades de armazenamento aumentaram drasticamente ao longo dos anos, um dos aspectos mais elementares do design do disco rígido (o tamanho do formato do bloco lógico conhecido como um setor), manteve-se constante.

Por volta de 2010, as empresas de disco rígido começaram a migrar do tamanho existente de setores de 512 bytes para um tamanho maior e mais eficiente de 4.096 bytes, geralmente referido como setores de 4K, e agora chamado de formato avançado pela IDEMA (International Disk Drive Equipment and Materials Association, Associação internacional de materiais e equipamentos de disco rígido).

Este artigo fornece o contexto para esta migração, bem como aponta os benefícios de longo prazo para clientes e as possíveis armadilhas a serem evitadas na transição de 512 bytes para setores de 4K.

Histórico

Por mais de 30 anos, os dados armazenados em discos rígidos foram formatados em pequenos blocos lógicos chamados setores, comum tamanho de setor legado de 512 bytes. Muitos aspectos dos sistemas de computação modernos ainda têm concepção de design baseado nesse padrão de formato.

O formato do setor existente contém uma seção de intervalo, uma seção de sincronização, uma seção de marca de endereço, uma seção de dados e uma seção de código de correção de erros (ECC) (Figura 1).


Figura 1. Layout de setor legado em mídia de disco rígido

A estrutura deste layout de setor foi concebida da seguinte forma:

  • Seção de intervalo: o intervalo separa os setores.
  • Seção de sincronização: a marca de sincronização indica o início do setor e fornece o alinhamento de tempo.
  • Seção de marca de endereço: a marca de endereço contém dados para identificar a localização e o número do setor. Também fornece o status sobre o próprio setor.
  • Seção de dados: a seção de dados contém todos os dados do usuário.
  • Seção de ECC: a seção de ECC contém códigos de correção de erro que são usados para reparar e recuperar dados que podem ser danificados durante o processo de leitura ou gravação.

Este formato de baixo nível atuou bem na indústria por muitos anos. Contudo, como as capacidades de disco rígido aumentaram, o tamanho do setor se tornou um elemento de design limitador na melhoria das capacidades de disco rígido e na eficiência da correção de erros. Por exemplo, comparando o tamanho do setor com a capacidade total dos discos rígidos anteriores e mais recentes, você pode observar que a resolução do setor tornou-se extremamente pequena. A resolução do setor (a relação de setores como percentual do armazenamento total) tornou-se muito fina e cada vez mais ineficiente (Tabela 1).

Capacidade Setores totais Resolução do setor
40 MB 80.000 0,001%
400 GB 800.000.000 0,0000001%
12 TB 24.000.000.000 0,000000004

Resolução muito fina é boa ao gerenciar quantidades pequenas e discretas de dados. No entanto, aplicações comuns em sistemas modernos de computação gerenciam dados em grandes blocos, muitos maiores do que o tamanho do setor de 512 bytes legado, na realidade.

Mais importante, o pequeno setor de 512 bytes consome uma quantidade cada vez menor de espaço na superfície do disco rígido conforme as densidades da área aumentam. Este é um problema no contexto de correção de erros e dos riscos de defeitos de mídia. Na figura 2, por exemplo, os dados em um setor do disco rígido estão consumindo áreas menores, tornando a correção de erros mais desafiadora visto que os defeitos de mídia do mesmo tamanho podem danificar um percentual mais elevado da carga total de dados e, portanto, exigem mais força de correção de erro.


Figura 2. Defeitos em mídia e densidade de área

Um setor de 512 bytes pode geralmente corrigir um defeito de até 50 bytes de comprimento. Os discos rígidos atuais começaram a pressionar os limites da correção de erros com densidades de área recordes. Como consequência, a migração para setores maiores na indústria do disco rígido é uma necessidade fundamental em relação a conseguir melhorias na correção de erros e alcançar eficiência de formato.

A transição para setores de 4k (formato avançado)

A indústria de armazenamento vem planejando uma transição para formatos de disco rígido com setor maior durante anos; um trabalho significativo da Seagate com nossos colegas na indústria do disco rígido remonta há pelo menos cinco anos (Figura 3). Em dezembro de 2009, através de um esforço coordenado na IDEMA, o formato avançado foi indicado e aprovado como o nome para o padrão de setores de bytes de 4k. Além disso, todos os fabricantes de disco rígido se comprometeram a fornecer novas plataformas de disco rígido para produtos de desktop e notebook com a formatação de formato avançado no início de janeiro de 2011. Mesmo antes dessa data, os discos de formato avançado começaram a ser lançados no mercado. Primeiro, a Seagate distribuiu discos de setor grande para clientes OEM e em produtos de varejo de marca própria.


Figura 3. Principais marcos no desenvolvimento do padrão de formato avançado

O benefício a longo prazo dos setores de 4K

Como todos os fabricantes de disco rígido concordaram com a transição para o design de setor de formato avançado até janeiro de 2011, a indústria se adaptou e adotou esta mudança para reduzir possíveis efeitos colaterais negativos. Embora os benefícios de curto prazo para os usuários finais não sejam drásticos em termos de aumentos imediatos de capacidade, a migração para os setores de tamanho 4K definitivamente forneceram caminhos mais rápidos para densidades de área e capacidades de disco rígido mais altas, bem como correção de erro mais robusta.

Aumento na eficiência de formato reduzindo a quantidade de espaço usado para o código de correção de erro

Na figura 4 é apresentado o layout do setor de 512 bytes existente, onde cada setor de 512 bytes tem sobrecarga não relacionada a dados de 50 bytes para ECC e mais 15 bytes para seções de intervalo, sincronização e marca de endereço. Isso gera uma eficiência de formato setorizado1 de cerca de 88% (512/(512 65)).


Figura 4. Layout do setor de 512 bytes legado

O novo padrão de formato avançado faz a mudança para um setor de bytes de 4K, que basicamente combina setores de 512 bytes em um único setor de bytes de 4K (Figura 5).


Figura 5. Formato avançado: layout do setor de 4K

O padrão de formato avançado usa o mesmo número de bytes para seções de intervalo, sincronização e marca de endereço, mas aumenta o campo de ECC para 100 bytes. Isso gera uma eficiência de formato setorizado 1 de 97% (4.096/(4.096 115)), uma melhoria de quase 10%.

Com o tempo, essas eficiências de formato surtem efeito, ajudando a produzir opções de maior capacidade ao mesmo tempo em que melhora a integridade dos dados.

Confiabilidade e correção de erros

Embora o tamanho físico dos setores em discos rígidos tenha encolhido (consumindo quantidades cada vez menores de espaço), os defeitos de mídia não diminuíram. Examine a Figura 6, que exibe imagens do que poderíamos considerar objetos muito pequenos. Em relação à altura de voo da cabeça de leitura/gravação de um disco rígido, esses objetos são relativamente grandes. Partículas microscópicas muito menores do que aquelas exibidas neste diagrama podem criar defeitos de mídia em um disco rígido.


Figura 6. Representação em pequena escala da altura de voo em discos rígido

O setor de 4K maior no padrão de formato avançado praticamente dobra 2 o tamanho do bloco de ECC de 50 bytes para 100 bytes, proporcionando uma melhoria muito necessária na eficiência de correção de erros e robustez em relação a partículas e defeitos de mídia.

Juntos, os benefícios da melhoria de eficiência de formato e a correção de erros mais robusta fazem valer a pena o esforço da transição para setores de 4K. O gerenciamento correto desta transição para obter os benefícios de longo prazo com efeitos colaterais mínimos tem sido um foco importante para a indústria de disco rígido.

Compreensão dos impactos da transição para 4K

Como observado anteriormente, há muitos aspectos dos sistemas computacionais modernos que continuam a assumir que os setores são sempre de 512 bytes. Fazer a transição de toda a indústria para o novo padrão de 4K e esperar que todos estes pressupostos existentes mudem de repente simplesmente não é realista. Ao longo do tempo, acontecerá a implementação de setores de 4K nativos, onde o host e os dados do disco rígido trocam dados em blocos de 4K. Até então, os fabricantes de disco rígido implementarão a transição do setor de 4K em conjunto com uma técnica chamada de emulação de setor de 512 bytes.

Emulação de setor de 512 bytes

A introdução de setores com 4K de tamanho dependeu muito da emulação de setor de 512 bytes. Este termo se refere ao processo de tradução dos setores físicos de 4k usados no formato avançado para os setores de 512 bytes existentes esperados pelos sistemas de computação host.

A emulação de 512 bytes é aceitável na medida em que não força complexas mudanças em sistemas de computação existentes. Contudo, carrega o potencial para consequências negativas de desempenho, especialmente quando a gravação de dados não corresponde perfeitamente a oito setores existentes traduzidos. Isso fica claro quando se considera o processo de gravação e leitura exigido pela emulação de 512 bytes.

Processos emulados de leitura e gravação

Para ler dados de um disco formatado com setores de 4K em modo de emulação de 512, o processo é muito simples, como mostrado na figura 7.


Figura 7. Possível sequência de leitura para emulação de 512 bytes

O processo de leitura do bloco de 4K de dados e de reformatação do setor virtual específico de 512 bytes solicitado pelo computador host é realizado na memória DRAM do disco e não afeta de modo mensurável o desempenho.

Um processo de gravação pode ser mais complicado, especialmente quando os dados do computador host tentam gravar um subconjunto de um setor de 4K físico. Nesses casos, o disco rígido deve primeiro ler todo o setor de 4K que contém o local de destino da solicitação de gravação de host, mesclar os dados existentes com os novos dados e gravar novamente todo o setor de 4K (Figura 8).


Figura 8. Possível sequência de gravação para emulação de 512 bytes

Dessa forma, o disco rígido deve executar etapas mecânicas adicionais, como ler um setor de 4K, modificar o conteúdo e depois gravar os dados. Este processo é chamado de ciclo de leitura-modificação-gravação, o que é indesejável, porque tem um impacto negativo no desempenho do disco rígido. A redução da probabilidade e da frequência de casos de leitura-modificação-gravação é o aspecto mais importante de fazer a transição suave e indolor para setores de 4k.

Prevenção de leitura-modificação-gravação

  1. Solicitações de gravações que estejam desalinhadas devido ao desalinhamento de partição lógica para física
  2. Solicitações de gravação menores do que 4K em tamanho

Partições de disco rígido desalinhadas versus alinhadas

Até agora não discutimos como sistemas de host e discos rígidos comunicam a localização de setores na mídia. É hora de apresentar o endereçamento de bloco lógico (LBA).

Para cada setor de 512 bytes é atribuído um único LBA, a partir de zero (0) para o número necessário com base no tamanho do disco. O host solicita um bloco específico de dados usando o LBA atribuído. Quando o host solicita gravação de dados, um endereço de LBA é devolvido no final da gravação informando ao host onde os dados estão localizados. Isso se torna importante na transição para setores de 4K já que existem oito possibilidades diferentes por onde iniciam o LBA do host.

Quando LBA 0 é alinhado com o primeiro bloco virtual de 512 bytes no setor físico de 4K, a condição de alinhamento lógico para físico para emulação de 512 bytes é denominada alinhamento 0. Outro alinhamento possível é quando LBA 0 é alinhado ao segundo bloco virtual de 512 bytes no setor físico de 4k. Esta situação é chamada de alinhamento 1 e é mostrada em comparação à condição de alinhamento 0 na figura 9. Há seis possibilidades adicionais para partições desalinhadas que podem resultar em eventos de leitura-modificação-gravação semelhantes à condição de alinhamento 1.


Figura 9. Condições de alinhamento

As condições de alinhamento 0 funcionam muito bem com os setores de 4K no padrão de formato avançado. Isto porque um disco rígido pode facilmente mapear oito setores de 512 bytes contínuos em um único setor de 4K. Isto é conseguido através do armazenamento de solicitações de gravação de 512 bytes no cache do disco rígido até que blocos de 512 bytes contínuos recebidos formem um setor de 4K. Visto que as aplicações de computação moderna lidam com blocos de dados que normalmente são maiores do que 4K, subdesenvolvimentos são extremamente raros. No entanto, a situação do alinhamento 1 é outra questão.

Quando partições do disco rígido criadas têm por efeito uma condição desalinhada como mostrada na figura 9, isso resulta em ciclos de leitura-modificação-gravação que podem diminuir o desempenho do disco rígido. Esta é a condição-chave que deve ser evitada na implementação de discos rígidos de formato avançado e será discutida mais tarde.

Pequenas gravações

Em aplicações de computação moderna, dados como documentos, imagens e transmissões de vídeo são muito maiores do que 512 bytes. Dessa forma, unidades de disco rígido podem armazenar esses pedidos de gravação em cache até que haja blocos de 512 bytes sequenciais suficientes para construir um setor de 4K. Contanto que partições do disco rígido estejam alinhadas, o disco rígido pode facilmente mapear os setores de 512 bytes em setores de 4K sem penalidades de desempenho. Há, contudo, certos processos de baixo nível que podem forçar um disco rígido a lidar com situações de subdesenvolvimento que não estão associadas com partições desalinhadas. Elas ocorrem em casos raros em que o host faz solicitações de gravação discretas que são na verdade menores do que 4K. São tipicamente atividades no nível do SO que lidam com sistemas de arquivos, atividades de baixo nível semelhantes ou diárias. Geralmente estas ocorrem em número pequeno suficiente de modo que o desempenho global não seja significativamente afetado. Ainda assim, é recomendável que os designers de sistemas considerem modificações adequadas para qualquer um desses processos para potencializar o desempenho durante a transição para 4K.

Preparação e gerenciamento da transição para 4K

Agora que entendemos as vantagens de migrar para setores de 4K, bem como os possíveis impactos no desempenho, é hora de analisar qual a melhor forma de administrar esta transição. Este tópico é melhor discutido no contexto dos dois sistemas operacionais mais populares implantados na computação moderna: Windows e Linux.

Gerenciamento de setores de 4K no ambiente Windows

O único aspecto mais importante do gerenciamento da transição para setores de 4K está relacionado com as questões de alinhamento descritas acima. Os discos de formato avançado funcionam bem em uma condição de alinhamento 0, onde a posição inicial física para a lógica é igual. As condições de alinhamento são geradas quando as partições do disco rígido são criadas. As partições são criadas por um software que se divide em duas categorias gerais:

  1. Versões do sistema operacional Windows
  2. Utilitários de particionamento de disco rígido

No caso de partições criadas com o SO Windows, existem três versões deste que merecem discussão: Windows XP, Windows Vista e Windows 7. A Microsoft envolveu-se no planejamento da transição da comunidade para setores maiores. Como resultado, lançou software compatível com setores de 4k, começando com o Windows Vista Service Pack 1. O software que cria partições de alinhamento 0 (aqueles que funcionam bem com o padrão de formato avançado) é referido como "ciente de 4K". A tabela 2 descreve a situação em relação às gerações atuais do SO Microsoft Windows.

Versão do sistema operacional Ciente de 4K? Resultados
Windows XP Não Cria partição primária com a condição de alinhamento 1 (desalinhado)
Windows Vista - anterior ao Service Pack 1 Não Ciente de grande setor mas cria partições de forma incorreta (não alinhado)
Windows Vista - Service Pack 1 ou posterior Sim Cria partições com a condição de alinhamento 0 (alinhado)
Windows 7 Sim Cria partições com a condição de alinhamento 0 (alinhado)
Windows 10 Sim Cria partições com a condição de alinhamento 0 (alinhado)

Claramente, a distribuição dos sistemas de computação com as versões mais recentes do Windows não é uma preocupação com relação ao uso de discos rígidos de formato avançado. Contudo, para sistemas que ainda usam o Windows XP ou Windows Vista (anterior ao Service Pack 1), há o risco significativo de desempenho reduzido em relação às partições criadas pelo sistema operacional.

Além do potencial para partições desalinhadas criadas com versões mais antigas do sistema operacional Windows, existe também uma série de utilitários de software que são amplamente utilizados por fabricantes de sistemas, OEMs, revendedores de valor agregado e gerentes de TI que podem resultar em partições desalinhadas. Na verdade, é mais comum partições serem criadas com estes tipos de utilitários do que com o sistema operacional Windows em si. Assim, é significativo o risco de criar partições desalinhadas e, portanto, um ambiente que possa resultar em desempenho degradado do disco rígido para unidades que usam setores de 4K. Para complicar a questão, discos rígidos fornecidos em sistemas atuais geralmente consistem de várias partições de disco rígido. Isto significa que cada partição no disco rígido deve ser criada com software de particionamento ciente de 4k para certificar-se de que o desempenho e o alinhamento adequados sejam garantidos. A figura 10 mostra possíveis resultados da criação de várias partições do disco rígido com software que não seja ciente de 4K.


Figura 10. Condições de alinhamento e várias partições

Como lidar com condições de desalinhamento

Existem três métodos possíveis para evitar e/ou administrar uma condição de desalinhamento que tenha potencial para afetar o desempenho do disco rígido.

  1. Use uma nova versão do sistema operacional Windows ou trabalhe com seu provedor de utilitário de particionamento para obter uma versão ciente de 4K do software.
  2. Use um utilitário de disco rígido para realinhar partições do disco.
  3. Confie no fornecedor de seu disco rígido para gerenciar desempenho, independentemente da condição de alinhamento.

O uso de uma versão ciente de 4K do Windows para criar partições do disco rígido é um método simples e direto para evitar condições de desalinhamento. Os fornecedores de utilitários de software que criam partições do disco rígido devem poder informar se versões cientes de 4k estão disponíveis. Se assim for, migre para estas versões para evitar preocupação.

Alguns fabricantes de disco rígido estão lidando com esta questão oferecendo utilitários que examinam as partições do disco rígido existentes e realinham conforme a necessidade. Esta alternativa leva tempo adicional e inclui etapas para o processo de atualização ou compilação do sistema.

Em última análise, os fabricantes de disco rígido desenvolverão métodos mais sofisticados para gerenciar condições de desalinhamento ao mesmo tempo em que evitam impactos negativos de desempenho.

Conforme a transição para os discos de formato avançado continua, todos esses métodos têm um papel para maximizar os benefícios da indústria e evitar impactos de desempenho.

Gerenciamento de setores de 4K no ambiente Linux

As principais estratégias no gerenciamento da transição para os setores de 4K em um ambiente Windows também são aplicáveis ao Linux. A maioria dos usuários do sistema Linux tem acesso ao código-fonte, fornecendo a capacidade de personalizar o sistema operacional para atender às suas necessidades específicas. Isso fornece uma oportunidade para atualizar proativamente seu sistema Linux a fim de gerenciar adequadamente os discos rígidos de formato avançado.

Ao fazer modificações no seu sistema Linux, é possível criar adequadamente partições de disco que estejam bem alinhadas aos discos de formato avançado e evitar a redução de gravações de nível de sistema pequeno que possam gerar subdesenvolvimentos independentemente de questões de alinhamento.

Foram feitas alterações no kernel e nos utilitários do Linux para estabelecer compatibilidade com os discos de formato avançado. Estas mudanças garantem que todas as partições em discos de formato avançado estejam devidamente alinhadas em limites de setores de 4K. As versões 2.6.31 e posteriores do kernel já são compatíveis com discos de formato avançado. A compatibilidade com repartição e formatação de discos de formato avançado está disponível nos seguintes utilitários Linux:

Fdisk: GNU Fdisk é um utilitário de linha de comando que particiona discos rígidos. As versões 1.2.3 e posteriores são compatíveis com o formato avançado.

Parted: GNU Parted é um utilitário gráfico para particionamento de discos rígidos. As versões 2.1 e posteriores são compatíveis com o formato avançado.

Conclusão

A transição da indústria dos setores de 512 bytes legados é uma realidade. Os fabricantes de disco rígido concordaram em adotar o padrão de formato avançado no mais tardar em janeiro de 2011 para novos modelos fornecidos para os segmentos de mercado de desktop e notebook.

Os engenheiros de disco rígido continuam produzindo densidades de área aprimoradas e correção de erro mais robusta. Os consumidores se beneficiam conforme os discos rígidos continuam a oferecer maior capacidade, menores custos por gigabyte e níveis de confiabilidade continuada esperada pela tecnologia de disco rígido.

A chave para uma transição suave tem sido uma comunidade de armazenamento bem instruída, de modo que possam ser evitadas possíveis armadilhas de desempenho. O aspecto mais crítico de uma transição suave e bem-sucedida para os setores de 4K usados no formato avançado tem sido promover o uso de ferramentas de particionamento de disco rígido cientes de 4K. Como desenvolvedor de sistemas, OEM, integrador, profissional de TI ou até mesmo usuário final que está criando ou configurando um computador, certifique-se de:

  • Usar o Windows Vista (Service Pack 1 ou posterior), Windows 7 ou versões posteriores para criar partições do disco rígido.
  • Ao usar utilitários ou software de terceiros para criar partições do disco rígido, consulte o fornecedor para confirmar se estão atualizados e são cientes de 4k.
  • Se você tiver clientes que normalmente refazem a imagem dos sistemas, incentive-os para conferirem se os utilitários de imagem são cientes de 4k.
  • Se você estiver usando Linux, verifique com o fornecedor do Linux ou com sua organização de engenharia se seu sistema foi adaptado às mudanças para se tornar ciente de 4K.
  • Fale com seu fornecedor de disco rígido para obter conselhos ou orientação sobre o uso de discos de formato avançado em seus sistemas.

Juntamente com os nossos clientes e colegas da indústria, continuamos a fazer a transição suave e eficiente para o formato avançado de setores de 4K, aproveitando os possíveis benefícios a longo prazo para toda a indústria de armazenamento.

Notas de rodapé

1 O formato setorizado se refere estritamente aos setores de dados e não considera a sobrecarga associada com dados servo e outras ineficiências de layout do setor.

2 Nem toda implementação de um setor de 4K exatamente duplica os bytes de ECC ao se deslocar de setores de 512 bytes para de 4K.