Open

Blog

Charges de travail des centres de données Seagate entièrement prises en charge par des systèmes de stockage hybrides et sur disque dur

Table des matières :

Seagate’s Data Center Workloads Served Entirely by Hybrid and Hard Drive Storage Systems Seagate’s Data Center Workloads Served Entirely by Hybrid and Hard Drive Storage Systems Seagate’s Data Center Workloads Served Entirely by Hybrid and Hard Drive Storage Systems

Dans une ère où la demande de données ne tarit jamais, Seagate est non seulement le premier fabricant de solutions de stockage, mais également une entreprise mondiale de premier plan qui gère d'énormes quantités de données dans ses vastes centres de données. Seagate a compris qu'il était temps de remplacer ses systèmes de stockage 100 % Flash vieillissants et de moderniser sa stratégie pour répondre aux besoins actuels et à la croissance prévisible des données. L'entreprise a choisi de déployer des systèmes de stockage hybrides qui fournissent une capacité élevée via des disques durs et une fine couche Flash, afin de pouvoir faire évoluer efficacement la capacité de données sans nuire aux performances. Plusieurs matrices de stockage InfiniBox d’Infinidat ont été déployées dans différents centres de données Seagate.

Des discussions ont eu lieu récemment pour déterminer si les disques durs ou les SSD étaient plus adaptés aux centres de traitement des données. Ce n’est pas pour rien que les disques durs continuent de répondre à environ 90 % des besoins en stockage ultra-évolutif et dans le cloud. L'expérience de Seagate elle-même le prouve : Grâce à une stratégie bien équilibrée, dans laquelle les disques durs et Flash coexistent et se complètent, tous les besoins en stockage de Seagate, des plus courants aux plus exigeants, sont satisfaits.

Le déploiement de ces systèmes de stockage hybrides par Seagate est un excellent exemple de la façon dont l'association des deux technologies permet de répondre efficacement à la demande des centres de données modernes. Le stockage Flash contribue à améliorer les performances de tâches spécifiques, tandis que les disques durs constituent le socle sur lequel repose la gestion du stockage des données en masse.

Les disques durs et les SSD sont des technologies de stockage essentielles, mais différentes, notamment au niveau de leur méthode de lecture et d'écriture des données. Évidemment, les disques durs présentent un avantage significatif en termes de coût par téraoctet par rapport aux SSD. Une architecture de stockage évolutive requiert un ensemble de périphériques de stockage, optimisés pour répondre aux exigences en matière de budget, de capacité et de performances des charges de travail.

Quels sont les critères qui orientent les décisions relatives à l'architecture de stockage ?

Pour les architectes et opérateurs de centres de données, plusieurs facteurs clés conditionnent les décisions relatives à l'architecture du stockage : haute disponibilité et résilience, performances, capacité, facilité d'entretien et coût global. Ce sont ces éléments qui déterminent si l’infrastructure de stockage peut gérer efficacement des charges de travail diverses et intensives à moindre coût.

Les besoins de Seagate en matière de centre de données sont définis par des objectifs clairs concernant les opérations complexes de l'entreprise, qui englobent la recherche, la conception et la fabrication, ainsi qu'une présence diversifiée sur le marché regroupant les canaux B2B et B2C. Consciente de l'augmentation du volume de données généré par les appareils IoT, l'automatisation et la numérisation dans l'industrie, Seagate a décidé d'optimiser ses capacités de stockage et ses performances à moindre coût. Cette amélioration est essentielle pour tirer parti de l'intelligence artificielle et des analyses de données, qui apportent de la valeur grâce aux données clés extraites de volumes considérables de données non structurées.

Le large éventail d'opérations stratégiques de la société repose sur les éléments suivants :

  • Planification des ressources de l'entreprise (ERP), sur laquelle reposent les opérations essentielles de Seagate, qui vont de la comptabilité à la gestion de la chaîne logistique
  • Bases de données en temps réel, notamment une base de données de 350 To, indispensable au suivi des caractéristiques techniques et des données de fabrication et de test de chaque unité expédiée par Seagate
  • Charges de travail d'analyse permettant à Seagate d'extraire des informations d'ensembles de données volumineux afin de faciliter la prise de décisions stratégiques
  • Machines virtuelles et services de fichiers essentiels pour les opérations informatiques quotidiennes et l'hébergement d'applications

Les analystes ont observé que l'immense majorité des données associées aux charges de travail d'entreprise nécessitaient une capacité élevée et des temps de transferts de données nominaux. Les disques durs répondent à ces besoins et offrent des avantages en matière d'évolutivité et de coût total de possession. Vinod Pasi, vice-président de Seagate et responsable mondial de l’infrastructure informatique, confirme que ce modèle reflète l’expérience de Seagate en matière de conception d’une architecture de stockage de données capable de prendre en charge efficacement les charges de travail de tous les centres de données.

Soutenir les charges de travail de tous les centres de données Seagate

Le déploiement stratégique de systèmes de stockage hybrides par Seagate a été déterminant pour la gestion efficace des charges de travail diverses des centres de données. L'entreprise a identifié des charges de travail spécifiques qui nécessitent des niveaux variables de performances de transfert de données et de capacité de stockage en masse.

Par exemple, les bases de données ne produisant pas de rapports en temps réel, telles que BDW et Informatica, ainsi que les bases de données d'usine telles qu'ODS, TS et PIC, représentent une part significative des besoins de stockage de Seagate. Ces charges de travail, qui comprennent également les machines virtuelles VMware hébergeant des applications Linux et Windows, les services de fichiers (NFS, CIFS, SFTP, FTP), Hadoop HDFS pour plusieurs sites et les clusters de stockage MinIO pour les applications de sauvegarde et d’apprentissage automatique, représentent collectivement environ 90 % de la capacité de stockage de Seagate Ces charges de travail sont principalement soutenues par des disques durs en raison de leurs exigences élevées en matière de capacité et de la rentabilité du stockage sur disque dur.

Pour les charges de travail exigeant des transferts de données en temps réel, telles que les bases de données de support des lignes de production et Citrix VDI, qui représentent 10 % des besoins de stockage de Seagate, les capacités de mise en mémoire cache et de placement de données des systèmes de stockage hybrides garantissent des performances stables. Ces applications bénéficient de la fine couche SSD intégrée aux systèmes hybrides, qui fournit la vitesse et la faible latence requises pour les opérations en temps réel tout en tirant parti des disques durs haute capacité pour la majeure partie du stockage des données.

Les charges de travail des centres de données de Seagate illustrent une tendance plus large du secteur consistant à utiliser des solutions de stockage hybrides pour gérer efficacement l'essentiel des données de l'entreprise. En optimisant l'équilibre entre les disques durs pour le stockage en masse nécessitant des performances de transfert de données en temps nominal à réel, et les SSD pour les tâches intensives nécessitant des transferts de données en temps réel à ultra-réel, les systèmes de stockage hybrides offrent une architecture polyvalente et économique. Cette architecture est capable de gérer des charges de travail de centres de données variées et exigeantes, tout en garantissant des performances élevées et une évolutivité optimale, sans les coûts prohibitifs liés à une infrastructure 100 % Flash.

Concevoir une architecture de stockage répondant aux besoins des charges de travail

Les architectes de stockage ultra-évolutif, dans le cloud et pour les grandes entreprises, ont tendance à opter pour la combinaison de types de stockage qui permet d'optimiser au maximum les coûts, la capacité et les performances. Les matrices de stockage hybrides avancées sont parfaitement adaptées à cet objectif. Les SSD conviennent parfaitement aux charges de travail qui nécessitent des performances d’écriture élevées et des transferts de données en temps ultra-réel, qui représentent une infime partie des charges de travail, tandis que les disques durs offrent l’accès nécessaire aux données en masse et prennent en charge l'immense majorité des charges de travail. Les disques durs gèrent les charges de travail auxquelles le stockage Flash n'est pas adapté, et inversement. Le déploiement de systèmes hybrides avancés permet de simplifier l'architecture et de garantir que chaque support de stockage sera utilisé au moment opportun.

Des solutions de stockage répondant à des besoins opérationnels spécifiques

Les centres de données Seagate utilisent une combinaison de solutions de stockage adaptées à des besoins opérationnels spécifiques.

Auparavant, Seagate utilisait des systèmes 100 % Flash pour satisfaire certains besoins en termes de performances de stockage. Ces systèmes offrent des performances élevées mais ils sont onéreux ; le coût par To des supports Flash est plus de six fois supérieur à celui des disques durs. À la recherche d'une solution plus économique offrant des performances comparables et l'évolutivité nécessaire à une future croissance, Seagate a déployé 17 nouveaux systèmes de stockage hybrides.

Outre les matrices hybrides, Seagate utilise 26 systèmes de stockage basés sur des disques durs Exos pour des fonctions spécifiques, telles que le stockage des données provenant de caméras de sécurité, les cibles de sauvegarde et la conservation des journaux de certification.

La plus grande partie de notre capacité de stockage, plus de 50 pétaoctets, est fournie par des disques durs Seagate Exos, intégrés à la fois dans les systèmes hybrides d’Infinidat et les systèmes de stockage Exos contenant exclusivement des disques durs.

Chaque matrice hybride fournit 4,6 pétaoctets d'espace disque et une fine couche Flash. La technologie de mise en mémoire cache intelligente optimise de façon dynamique la gestion des données entre les divers supports de stockage, en s'adaptant à l'évolution des charges de travail, de sorte que les applications exigeantes de Seagate bénéficient automatiquement de performances optimales. L'architecture répond à la demande de capacité de stockage de données accrue, ce qui permet à l'entreprise de gérer efficacement n'importe quelle charge de travail en optimisant à la fois la capacité et la vitesse d'accès pour les tâches traitant des volumes de données importants, avec un coût total de possession par téraoctet réduit.

Association de disques durs et Flash dans les systèmes hybrides

Les disques durs et les SSD se complètent dans les solutions de stockage. Les SSD répondent aux besoins en matière de vitesse élevée et de latence faible, tandis que les disques durs gèrent les besoins de stockage grande capacité. De manière générale, les SSD sont parfaitement adaptés au stockage par blocs et de fichiers qui nécessite une latence très faible (inférieure à 1 milliseconde). Ils conviennent donc idéalement aux charges de travail hautes performances exigeantes en lecture. Quant aux disques durs, ils sont adaptés à davantage de types de stockage, notamment par blocs, de fichiers et d'objets, en particulier lorsqu'une capacité élevée est essentielle. Les disques durs sont parfaitement adaptés aux applications nécessitant une latence moyenne à élevée, comprise entre 1 et plus de 100 millisecondes.

Comme la plupart des systèmes de stockage hybrides, l'InfiniBox d'Infinidat intègre des disques durs comme supports de stockage principal. Il inclut également une mémoire cache DRAM supérieure à la normale et un niveau SSD qui sert de cache secondaire. La mémoire cache DRAM volumineuse permet de stocker davantage de données à proximité des processeurs, pour des performances optimisées et une efficacité accrue des stratégies de placement des données. La plupart des données du système résident sur des disques durs, sur lesquels reposent les capacités de stockage en masse. En fusionnant intelligemment les données du cache d'écriture et en les écrivant de manière séquentielle, ces systèmes améliorent les performances d'écriture tout en réduisant l'impact sur l'endurance des supports Flash. Les métadonnées du système sont conservées dans la mémoire DRAM à l'aide de structures de données Trie pour un accès rapide et efficace, favorisant ainsi les hautes performances et l'évolutivité du système.

Des algorithmes gèrent intelligemment le placement des données dans une hiérarchie de stockage par niveaux. Ces systèmes utilisent le balisage des métadonnées pour surveiller les mesures, notamment les fréquences d'accès, les tailles de bloc et les fréquences de lecture/écriture, ainsi que les profils d'E/S des applications associées, à l'aide d'informations dynamiques sur les données les plus susceptibles d'être référencées et utilisées ensemble. Le système pré-extrait alors les données de manière efficace, ce qui améliore les taux de réussite du cache en lecture.

Cette approche intégrée montre comment les systèmes de stockage hybrides avancés exploitent les atouts à la fois des disques durs et des SSD pour affecter les charges de travail au stockage capable de les gérer le plus efficacement : stockage en masse sur les disques durs et tâches hautes performances sur les SSD.

Rentabilité et productivité accrues

Le déploiement par Seagate d'une stratégie de stockage hybride a permis d'accroître la productivité et la rentabilité, avec à la clé des coûts par pétaoctet de capacité de stockage réduits, notamment une réduction des coûts d'infrastructure informatique, des délais de sauvegarde et de chargement améliorés, et des taux de transaction accélérés.

Vinod Pasi indique que, selon les tests réalisés par son équipe informatique, les nouveaux systèmes hybrides surpassent les performances des anciennes matrices 100 % Flash et coûtent moins cher, tout en s'adaptant à l'évolution de la capacité et en gérant des charges de travail variées avec une efficacité optimale, des bases de données volumineuses aux analyses en passant par les services de fichiers ou les charges de travail VMware.

Seagate a ainsi pu rationaliser ses opérations de stockage des données, passant de plusieurs matrices 100 % Flash à un système hybride unique pour la gestion de sa base de données essentielle de 350 To. Cette évolution a permis de simplifier l'architecture et de réduire la complexité du support et de la maintenance, ce qui constitue une avancée stratégique vers une gestion plus efficace des données.

 

Sur l'ensemble des charges de travail, l'équipe informatique a constaté des améliorations significatives de plusieurs mesures de performance. Réduction de 90 % des délais de sauvegarde, de quelques heures à quelques minutes. Amélioration de 40 % des temps de chargement. Augmentation de 35 % des taux de transaction. Amélioration de 20 % de la rapidité des requêtes.


Sur l'ensemble des charges de travail, l'équipe informatique a constaté des améliorations significatives de plusieurs mesures de performance. Réduction de 90 % des délais de sauvegarde, de quelques heures à quelques minutes. Amélioration de 40 % des temps de chargement. Augmentation de 35 % des taux de transaction. Amélioration de 20 % de la rapidité des requêtes.

Réduction des dépenses d'investissement et d'exploitation

En regroupant ses matrices de stockage, Seagate a réduit de façon significative ses dépenses d’investissement (CapEx) et ses dépenses d’exploitation (OpEx), pour diviser quasiment par deux ses dépenses globales. L'adoption de ces systèmes hybrides a permis d'optimiser les opérations informatiques de l'entreprise, en simplifiant la gestion et en améliorant la résilience.

Cette transition a permis à Seagate d'atteindre facilement ses objectifs en termes de capacité et de performances. Un seul système hybride peut gérer jusqu'à 17,287 Po de capacité effective. Ainsi, en plus de faciliter aujourd'hui la consolidation de ses charges de travail de travail informatiques, Seagate pourra facilement faire évoluer la capacité de ses systèmes à l'avenir en fonction de multiples facteurs, grâce au déploiement de ses derniers disques durs Exos avec technologie Mozaic 3+ offrant plus de 30 To par disque et 3 To par plateau.

Autre avantage non négligeable pour le centre de données Seagate : la complexité réduite de l'infrastructure. En regroupant des charges de travail variées sur un nombre réduit de systèmes hybrides, Seagate a rationalisé ses opérations, limitant ainsi les frais généraux et les défis logistiques liés à la gestion d'un environnement de stockage hétérogène. Cette simplification s'est traduite par des économies, mais également par une flexibilité opérationnelle accrue, qui permet à l'équipe informatique de Seagate de se concentrer sur l'innovation plus que sur la maintenance. La flexibilité et l'évolutivité des systèmes correspondaient à l'orientation stratégique de Seagate et offraient la possibilité d'adapter la capacité de stockage de façon dynamique au gré de l'évolution des besoins de l'entreprise, en éliminant les inconvénients financiers et logistiques généralement inhérents aux solutions 100 % Flash.

Équilibre entre performances et capacité

Vinod Pasi met l’accent sur le principe fondamental qui est au cœur du processus de prise de décision de Seagate : l’équilibre parfait entre performances et capacité est primordial. Si les matrices 100 % Flash précédemment déployées offraient des performances élevées, les besoins globaux de stockage de grands volumes de données d'entreprises telles que Seagate sont bien réels. Les systèmes de stockage hybrides cochent ces deux cases, en offrant à la fois des performances exceptionnelles et la capacité de stocker plusieurs pétaoctets de données, pour un budget raisonnable. Grâce à cet équilibre, les besoins opérationnels immédiats de Seagate sont satisfaits, et l'entreprise est en position de gérer la croissance des données et les évolutions technologiques futures.

  1. IDC, étude multiclient, Cloud Infrastructure Index 2023: Compute and Storage Consumption by 100 Service Providers, novembre 2023