Casestudy: Academia Sinica
Klimaatonderzoeksacademie schakelt Seagate in om probleem van massale gegevens op te lossen.
Academia Sinica is een vooraanstaande instelling voor klimaatonderzoek in Taiwan. De onderzoekers van de instelling voorspellen voor de komende vier jaar een zestienvoudige toename van gegevens, wat neerkomt op meer dan 10 PB. Naarmate het aantal gegevens dat voor simulaties wordt gebruikt, toeneemt, heeft het team betrouwbare gegevensopslag nodig die daarmee gelijke tred houdt. De veelzijdige, schaalbare oplossingen van Seagate voldoen aan hun groeiende vraag.
Het bereiken van netto-nul in 2050 is een imminente wereldwijde inspanning. Als reactie op dit doel promoot Taiwan proactief wetgeving in verband met klimaatverandering en herstructureert het zijn milieudepartementen als een stap in de richting van de netto-nul transitie. Het klimaatteam van het Research Center for Environmental Changes (RCEC) van Academia Sinica, de meest vooraanstaande onderzoeksacademie van Taiwan, heeft hieraan bijgedragen door relevant klimaatonderzoek uit te voeren en het Taiwan Earth System Model (TaiESM) te ontwikkelen.
TaiESM heeft deelgenomen aan het Coupled Model Intercomparison Project fase 6 (CIMP6), dat wordt gefinancierd door het World Climate Research Programme (WCRP), en het model werd geciteerd in het zesde Assessment Report (AR6) van het Intergovernmental Panel on Climate Change (IPCC) van de Verenigde Naties \ Working Group I (WGI). De simulatiegegevens van TaiESM worden gedeeld met onderzoeksinstellingen in verschillende landen via het gegevensportal dat werkt op basis van Seagate-opslagsystemen. Op dit moment werkt het klimaatteam van RCEC samen met vele academische teams, waaronder dat van het Institute of Oceanography en de National Taiwan University (IONTU), om de fysische en chemische processen in TaiESM te blijven verbeteren.
De eerste fase van TaiESM stelde het klimaatteam in staat om met succes deel te nemen aan internationale gegevensuitwisselingen, en plaatste het team zelfs in elke score bij de beste landen voor de meeste evaluaties van modelprestaties. De huidige versie van TaiESM is gebaseerd op het Community Earth System Model (CESM) van de Verenigde Staten. Huang-Hsiung Hsu, CEO van het Anthropogenic Climate Change Center zei: “Het ontwikkelen van ons eigen model omvat [onze] eigen kenmerken, specificaties, technische details en successen. Onze volgende fase bestaat erin de eerste versie van TaiESM te blijven verfijnen met als doel een volledig onafhankelijke klimaatvoorspellingsmodule te laten ontwikkelen door een Taiwanees team - van basisprogramma's tot interne modules - die dicht bij de lokale behoeften aansluit en echt exclusief is voor Taiwan.”
Naast de ontwikkeling van het basismodel vereist het verbeteren van TaiESM ook het verzamelen van klimaatsimulatiegegevens die door andere internationale meteorologische eenheden worden gegenereerd voor vergelijking en analyse met TaiESM. Een ander doel van het team is wereldwijd aanwezig zijn door middel van internationale samenwerkingen die betrouwbare weersvoorspellingen op lange termijn en bruikbaarheid van gegevens opleveren en verspreiden. Een dergelijke aanwezigheid zou hun reputatie en erkenning in Taiwan en over de hele wereld vergroten, waardoor de kansen voor wereldwijde partnerschappen en gegevensuitwisselingen toenemen.
Het klimaatteam van TaiESM heeft in de nabije toekomst meer dan 10 petabyte (PB) opslagcapaciteit voor gegevens nodig om de grotere vraag naar gegevens voor modellering aan te kunnen. De beschikbaarheidspercentages van bestaande opslag en de beperkte serverruimte voldoen niet langer aan hun vereisten voor toepassingen en werkbelasting. De toenemende frequentie van gegevensuitwisseling en verbeterde gegevensverzameling betekent dat het team altijd behoefte heeft aan permanente beschikbaarheid, snelheid en verbeterde gegevensbescherming.
Om de tweede fase van TaiESM te realiseren, heeft het Environmental Change Research Center meer gegevensopslagcapaciteit nodig, om krachtigere gegevensanalyses en hogere visuele resoluties mogelijk te maken en tegelijk een gestructureerde gegevenstoename te beheren die wordt bemoeilijkt door gegevensgroei en wildgroei van gegevens.
De bestaande opslagruimte, prestaties en beschikbaarheidsgraad van de opslagapparatuur voldeden niet langer aan de toepassings- en werkbelastingsvereisten van het team. Om hun opslag toekomstbestendig te maken en op te schalen, zodat deze meer onderzoeksgegevens en analyserapporten aankan, moet de opslagapparatuur onmiddellijk worden uitgebreid.
De gegevensgroei van het Research Center is de capaciteit van een gewoon onderzoeksinstituut ver te boven gegaan. De huidige capaciteit voor onderzoeksgegevens bij het Environmental Change Research Center is ongeveer 3 PB. Het centrum voorspelde dat de hoeveelheid klimaatgegevens de komende vier jaar met minstens nog eens 10 PB zal toenemen. Het klimaatteam simuleert ten minste 2 tot 4 terabyte (TB) aan gegevens per dag, en voor hun vereisten is een naadloze uitwisseling van klimaatgegevens nodig in plaats van gegevens in silo's.
Tegelijkertijd moet ook de resolutie van modellering dringend worden verbeterd. De huidige versie van TaiESM bood resoluties die niet ideaal waren voor onderzoek. Om landformaties en weersomstandigheden zoals tyfoons nauwkeurig te simuleren, wil het team zijn horizontale resolutie verhogen met een factor van minstens 4. Deze viervoudige toename van de resolutie zou in ieder geval leiden tot een zestienvoudige toename van de hoeveelheid gegevens.
Als het gaat om het realistisch en praktisch nabootsen van weersomstandigheden in het klimaatonderzoekslaboratorium, worden de behoeften van het team alleen maar lastiger. Een belangrijk obstakel is het simuleren van het langetermijngemiddelde van de weersomstandigheden, aangezien de temperatuur van land tot oceaan verandert. Technologie heeft de opslagcapaciteit en rekennauwkeurigheid verbeterd, waardoor meer rasters of aardsectoren mogelijk zijn en modelvoorspellingen verbeteren. Hoewel het verwerken van meer onbewerkte gegevens leidt tot meer mogelijkheden voor middelen, creëert het verwerken ook nog meer gegevens.
Om een visuele resolutie tot wel 25 km na te streven, genereert het team 32 TB tot 64 TB aan gegevens per dag. Het klimaatteam van Academia Sinica moet voortdurend module-instellingen aanpassen en kalibreren, en gegevens vergelijken die door elke afzonderlijke module-instelling worden geproduceerd, wat op zich ook ook weer gegevens genereert. Effectieve en betrouwbare gegevensopslag is dan ook cruciaal voor het team. Hardeschijfstoringen waren een belangrijk pijnpunt, waarbij vaak vier tot tien defecte eenheden per maand moesten worden vervangen.
Voor het klimaatonderzoeksteam zijn er haast geen inactieve gegevens. Academia Sinica heeft een permanente opslagoplossing nodig voor alle klimaatgegevens. Prognoses, analyses, nabewerking van prognoses en analyses, en multi-modelgegevens worden beschikbaar gesteld via speciale gegevensservers met behulp van een gedistribueerd bestandssysteem.
Aangezien de enorme hoeveelheid gegevens exponentieel groeit, moet het team zorgvuldig rekening houden met de vereisten voor gegevensopslagcapaciteit, opslagefficiëntie, opslagprestaties, evenals minder evidente factoren, zoals de hardwarevoetafdruk en de bijbehorende fysieke fabrieksvereisten.
De Exos X Series 5U84, het gegevensopslagsysteem met hoge dichtheid van Seagate, behaalde sequentiële lees- en schrijfprestaties van 7 GB en 5,5 GB in de huidige fase van het onderzoek van het klimaatteam. De slimme, ultracompacte oplossing van Seagate overtrof ook de verwachtingen van het team door de vereiste rackruimte in het datacenter met 75% te verkleinen en de TCO met 80% te verminderen. De Advanced Distributed Autonomic Protection Technology (ADAPT) van Seagate hielp het team ook om de rebuildtijd van opslag als gevolg van schijfstoringen met 93% in te korten.
Het klimaatonderzoeksteam kiest voor de veelzijdige architectuur van Seagate om een krachtig platform met hoge capaciteit te creëren dat extreme gegevensgroei aanpakt en actieve en inactieve gegevens efficiënt beheert met realtime opties voor gegevenslagen. De oplossing van Seagate stelt Academia Sinica in staat om zijn opslag te schalen met vrijheid van gegevenstoegang, vereenvoudigt hun activiteiten en optimaliseert hun kosten.
Doordat er minder uitvaltijd is en de onderhouds- en IT-kosten lager zijn, kan TaiESM zich beter richten op de verfijning van klimaatvoorspellingen en het beheer van gegevens zonder in te leveren aan prestaties.
De beschikbaarheid van 99,999% van de Exos X 5U84 heeft Academia Sinica geholpen een consistent hoge betrouwbaarheid te leveren. Het 5U-chassis met maximale dichtheid biedt plaats aan 84 schijven en kan worden uitgebreid tot 336 schijven voor tot wel 8 PB aan opslag. Het is erop gericht de schijfprestaties te maximaliseren door bescherming te bieden tegen trillingen en akoestische interferentie, hitte en stroomstoringen. Met ADAPT verdeelt het klimaatonderzoeksgegevens over elke schijf, biedt het geavanceerde gegevensbescherming en zorgt het voor snelle rebuilds zonder concessies aan prestaties, waardoor de uitvaltijd wordt teruggedrongen. En minder uitvaltijd verlengt de levenscyclus van het product en verlaagt de IT-uitgaven voor reparaties of vervangingen.
Met minder uitvaltijd en lagere IT-kosten kan TaiESM zich richten op het verfijnen van zijn klimaatvoorspellingsmodel. Over het algemeen helpt de Exos X Series 5U84 het klimaatteam om massale hoeveelheden gegevens efficiënt te beheren en hoge onderhoudskosten voor opslagapparatuur te verlagen, waardoor het team bedrijfskritieke klimatologiemodellen kan bijdragen aan een groeiende internationale gemeenschap.
Onze opslagspecialisten helpen u de juiste opslagoplossing te vinden voor uw uitdagingen op het gebied van gegevens.