Gegevensopslag voor AI
Voor de volgende golf van AI-innovatie is het cruciaal om massale hoeveelheden gegevens op te slaan en te activeren.
Appontwikkelaars zijn in allerijl AI-modellen aan het trainen en gebruiken. De focus lag op het vinden van de juiste gegevens en het opvoeren van de rekenkracht. Naarmate het aantal AI-modellen en -toepassingen toeneemt, wordt het een urgente opgave om uit te zoeken hoe de enorme hoeveelheden exabytes die ze zullen genereren, moeten worden opgeslagen. De ondersteuning van AI-werkbelastingen vereist een combinatie van belangrijke geheugen- en opslagtechnologieën in de hele AI-gegevensworkflow. Maar uiteindelijk heeft grootschalige AI harde schijven nodig.
Om AI de gegevens te bieden die het nodig heeft om te leren, te creëren en beter te worden, zijn tal van opslagtechnologieën nodig. Van geheugen met hoge doorvoersnelheid tot harde schijven met hoge opslagcapaciteit, bij het bepalen van de juiste opslagmix voor elke AI-werkbelasting draait het erom de behoefte aan prestaties en schaalbaarheid, en kosten in evenwicht te brengen.
AI-rekenclusters trainen, gebruiken en optimaliseren taalmodellen. GPU's, CPU's, NPU's en TPU's zijn nauw gekoppeld aan krachtige geheugenapparaten en bieden een doorvoersnelheid van meerdere terabytes en zelfs petabytes per seconde voor extreme berekeningen. De input- en outputgegevens die ze gebruiken en creëren, stromen naar netwerkopslagclusters waar ze langdurig worden bewaard, meestal op harde schijven, om toekomstige hertraining, kwaliteitsborging en conformiteit te ondersteunen.
Momenteel beheren de meest geavanceerde AI-innovators ook 's werelds grootste hyperscale en clouddatacenters. Deze bedrijven kiezen ervoor om 90% van hun online exabytes¹ op harde schijven op te slaan omdat ze de unieke prijs-prestatieverhouding begrijpen die harde schijven bieden voor opslag met massale capaciteit. Hoewel SSD's ook een kritieke technologie zijn, zullen de meeste gegevens nog steeds op harde schijven worden opgeslagen naarmate er meer AI-geoptimaliseerde architecturen worden gebruikt.
Harde schijven ondersteunen de volledige workflow van AI-gegevens en spelen daarom een cruciale rol bij het valideren van AI-modellen.
Om het volledige potentieel van AI te realiseren, zijn gegevens nodig. En de nodige opslag voor al die gegevens.
Mensen en machines zullen op meer manieren en sneller dan ooit creëren naarmate AI zich uitbreidt en enorme hoeveelheden gegevens produceert.
AI verbetert in een opwaartse feedbacklus waarbij gegevens worden verbruikt, nieuwe content wordt gegenereerd en van de prestaties wordt geleerd.
Seagate optimaliseert opslagcapaciteit voor AI en maakt ongekende sprongen voorwaarts in capaciteit om datacenters efficiënt op te zetten en uit te bouwen.
Seagate's analyse van IDC's Multi-Client Study, Cloud Infrastructure Index 2023: Compute and Storage Consumption by 100 Service Providers, november 2023.
Segate-analyse gebaseerd op Forward Insights Q323 SSD Insights, aug. 2023; IDC Worldwide Hard Disk Drive Forecast 2022-2027, apr. 2023, Doc. #US50568323; TRENDFOCUS SDAS Long-Term Forecast, Aug. 2023.
Op basis van totale opgenomen koolstof met een levenscyclus van 5 jaar.
Sara McAllister et al., "A Call for Research on Storage Emissions," Hotcarbon.org, 2024.