AI is afhankelijk van massale opslagcapaciteit voor gegevens.

Voor de volgende golf van AI-innovatie is het cruciaal om massale hoeveelheden gegevens op te slaan en te activeren.

Er is een balans nodig om het potentieel van AI maximaal te benutten.

Appontwikkelaars zijn in allerijl AI-modellen aan het trainen en gebruiken. De focus lag op het vinden van de juiste gegevens en het opvoeren van de rekenkracht. Naarmate het aantal AI-modellen en -toepassingen toeneemt, wordt het een urgente opgave om uit te zoeken hoe de enorme hoeveelheden exabytes die ze zullen genereren, moeten worden opgeslagen. De ondersteuning van AI-werkbelastingen vereist een combinatie van belangrijke geheugen- en opslagtechnologieën in de hele AI-gegevensworkflow. Maar uiteindelijk heeft grootschalige AI harde schijven nodig.

Een spectrum aan geheugen en opslag maakt AI mogelijk.

Om AI de gegevens te bieden die het nodig heeft om te leren, te creëren en beter te worden, zijn tal van opslagtechnologieën nodig. Van geheugen met hoge doorvoersnelheid tot harde schijven met hoge opslagcapaciteit, bij het bepalen van de juiste opslagmix voor elke AI-werkbelasting draait het erom de behoefte aan prestaties en schaalbaarheid, en kosten in evenwicht te brengen. 

De meeste AI-gegevens belanden op harde schijven.

AI-rekenclusters trainen, gebruiken en optimaliseren taalmodellen. GPU's, CPU's, NPU's en TPU's zijn nauw gekoppeld aan krachtige geheugenapparaten en bieden een doorvoersnelheid van meerdere terabytes en zelfs petabytes per seconde voor extreme berekeningen. De input- en outputgegevens die ze gebruiken en creëren, stromen naar netwerkopslagclusters waar ze langdurig worden bewaard, meestal op harde schijven, om toekomstige hertraining, kwaliteitsborging en conformiteit te ondersteunen.

De grootste datacenters ter wereld kiezen voor harde schijven.

Momenteel beheren de meest geavanceerde AI-innovators ook 's werelds grootste hyperscale en clouddatacenters. Deze bedrijven kiezen ervoor om 90% van hun online exabytes¹ op harde schijven op te slaan omdat ze de unieke prijs-prestatieverhouding begrijpen die harde schijven bieden voor opslag met massale capaciteit. Hoewel SSD's ook een kritieke technologie zijn, zullen de meeste gegevens nog steeds op harde schijven worden opgeslagen naarmate er meer AI-geoptimaliseerde architecturen worden gebruikt.

Waarom harde schijven ideaal zijn voor AI op grote schaal.

De explosieve gegevenstoename van het AI-tijdperk vraagt om grootschalige opslagcapaciteit. Hoewel solid-state-schijven (SSD's) belangrijk zijn voor werkbelastingen met lage latentie, berust grootschalige AI op harde schijven. Dat ligt aan drie bepalende factoren.

Schaalvoordelen.

Op basis van kosten per TB is het 6× efficiënter om harde schijven aan te kopen dan SSD's. Hierdoor zijn ze dan ook de logische keuze voor het uitbouwen van AI-gegevensopslag.²

Productie op exabyteschaal.

Gemeten in kapitaaluitgaven is de productie van harde schijven 9× efficiënter dan de NAND-industrie.³

Grootschalige duurzaamheid.

Harde schijven gebruiken 4× minder bedrijfsstroom per terabyte en bevatten 10× minder opgenomen koolstof dan SSD's.⁴

Harde schijven vormen de ruggengraat van AI-gegevensopslag.

Harde schijven ondersteunen de volledige workflow van AI-gegevens en spelen daarom een cruciale rol bij het valideren van AI-modellen.

  1. Seagate's analyse van IDC's Multi-Client Study, Cloud Infrastructure Index 2023: Compute and Storage Consumption by 100 Service Providers, november 2023.

  2. Segate-analyse gebaseerd op Forward Insights Q323 SSD Insights, aug. 2023; IDC Worldwide Hard Disk Drive Forecast 2022-2027, apr. 2023, Doc. #US50568323; TRENDFOCUS SDAS Long-Term Forecast, Aug. 2023.

  3. Op basis van totale opgenomen koolstof met een levenscyclus van 5 jaar.

  4. Sara McAllister et al., "A Call for Research on Storage Emissions," Hotcarbon.org, 2024.