November 22, 2024

PDFS

C'est en forgeant qu'on devient forgeron

Comment le stockage informatique offre des avantages pour les centres de données

7 min read

Le but d’un architecture de stockage informatique est soit de réduire le besoin de déplacer de grands ensembles de données, soit d’alléger les contraintes sur les ressources de calcul ou de stockage existantes, comme dans un déploiement périphérique, par exemple.

L’un des facteurs déterminant le développement du stockage informatique sont les données ou, pour être plus précis, les volumes croissants de données auxquels les organisations doivent de plus en plus faire face. Les organisations se tournent vers la science des données, l’analyse des données et l’apprentissage automatique pour tirer des informations de toutes ces données, mais celles-ci sont très gourmandes en données et ont tendance à être liées par des vitesses d’entrée / sortie (E / S) ou sont sensibles à la latence. Il est donc plus logique de traiter les données aussi près que possible de l’endroit où elles sont stockées, plutôt que de mélanger des gigaoctets ou des téraoctets en mémoire et inversement.

Les entreprises qui développent des produits de stockage informatique ont adopté différentes approches architecturales, allant de l’intégration de processeurs dans des disques à des accélérateurs qui se connectent à un slot PCIe et accèdent aux magasins de données existants via NVMe.

Pour éviter une balkanisation de l’écosystème de stockage informatique naissant dans des gammes de produits mutuellement incompatibles, le Association de l’industrie des réseaux de stockage (SNIA) a formé un Groupe de travail technique sur le stockage informatique (TWG). Le groupe travaille à définir des normes et à développer un modèle de programmation commun qui permettra aux applications de découvrir et d’utiliser toutes les ressources de stockage de calcul pouvant être attachées à un système informatique.

SNIA a divisé le définition du stockage informatique périphériques en processeurs de stockage informatique (CSP), disques de stockage informatique (CSD) et matrices de stockage informatique (CSA). Un CSP contient un moteur de calcul, mais ne contient en fait aucun stockage lui-même. Un CSD (généralement un lecteur à semi-conducteurs/SSD) contient à la fois du calcul et du stockage. Un CSA contient un ou plusieurs moteurs de calcul et périphériques de stockage.

Le modèle SNIA comprend une liste de fonctions de stockage informatique qui peuvent être exécutées par des dispositifs de stockage informatique, tels que la compression et la décompression. Certains produits de stockage informatique ont été conçus pour exécuter des fonctions spécifiques, telles que l’encodage ou le décodage vidéo, tandis que d’autres ont été conçus pour être programmables par l’utilisateur.

Fournisseurs notables

NGD Systems est l’un des fournisseurs de stockage informatique les plus importants. Ses produits sont des CSD selon la définition SNIA, intégrant le traitement de calcul dans un SSD NVMe. Ceci est réalisé grâce à l’utilisation d’un circuit intégré spécifique à l’application (ASIC) personnalisé qui intègre à la fois les fonctions du contrôleur SSD et un bloc CPU Arm Cortex-A53 quadricœur.

Cette architecture présente plusieurs avantages. L’ASIC a un accès direct aux puces flash Nand dans le lecteur via des canaux d’interface flash commune (CFI), et ceux-ci fournissent un accès à bande passante élevée et à faible latence aux données, par rapport au transfert de données en mémoire pour que le processeur hôte les traite .

Grâce à l’embarqué Arm cores, les appareils de NGD peuvent exécuter une version d’Ubuntu Linux, qui simplifie le développement et le déploiement d’applications, ou Azure IoT Edge de Microsoft. Le lecteur lui-même est également accessible en tant que simple SSD standard.

Ce type d’architecture est bien adapté aux déploiements de périphérie, où il n’y a peut-être pas assez d’espace ou de puissance pour un seul serveur de périphérie, mais avec des exigences élevées pour analyser les données en temps réel, comme un flux vidéo d’une caméra de sécurité. NGD a un Présentation de la solution sur son site Web qui décrit comment une base de données MongoDB peut être partagée sur plusieurs disques SSD CSD à l’intérieur d’un seul serveur au lieu de plusieurs nœuds de serveur, réduisant ainsi l’empreinte du centre de données et le coût global tout en offrant une latence plus faible lors de la réplication des données.

NGD cite également comme cas d’utilisation l’intelligence artificielle automobile (IA), les réseaux de diffusion de contenu et datacenters hyperscale, et offre un système de développement de traitement in situ (ISDP) entièrement intégré qui permet aux développeurs et aux intégrateurs de créer et de déployer des applications.

Samsung propose un produit CSD similaire, mais son SmartSSD intègre un réseau de portes programmables sur site (FPGA) Xilinx et un contrôleur SSD Samsung NVMe dans un SSD standard de 2,5 pouces (U.2) avec une capacité allant jusqu’à 4 To. Le produit résultant est commercialisé par Xilinx.

Xilinx fournit une plate-forme de développement, Vitis, qui permet le développement en C, C++ ou OpenCL. Il permet également aux organisations de créer des applications accélérées via un ensemble de bibliothèques open source optimisées pour le FPGA Xilinx dans le SmartSSD. Il existe des bibliothèques Vitis pour accélérer l’inférence de l’IA, l’analyse de données, la finance quantitative, etc. Xilinx affirme qu’en utilisant la couche d’hyper-accélération de Bigstream, SmartSSD peut rendre l’analyse d’Apache Spark 10 fois plus rapide.

Pendant ce temps, les produits NoLoad d’Eideticom sont des CSP, en ce sens qu’ils contiennent un moteur d’accélérateur mais pas de stockage. Au lieu de cela, ils se connectent au stockage et au processeur hôte via NVMe, ce qui permet une mise à l’échelle indépendante du calcul et du stockage. En fait, avec la prise en charge de NVMe-oF, les données pourraient également être conservées dans des baies de stockage externes.

Les périphériques NoLoad utilisent un FPGA comme accélérateur et sont disponibles sous forme de carte PCIe, de facteur de forme U.2 comme un boîtier de disque, ou au format EDSFF, basé sur le format Ruler SSD d’Intel. NoLoad peut prendre en charge une gamme de fonctions, telles que la compression, le cryptage, le codage d’effacement, la déduplication, l’analyse de données et l’apprentissage automatique (ML).

Les appareils NoLoad ont déjà été déployé au Laboratoire national de Los Alamos (LANL) dans le cadre d’un système de stockage de nouvelle génération pour calcul haute performance (HPC). Cela a vu des périphériques NoLoad utilisés pour décharger des tâches de stockage clés dans un système de fichiers Lustre/ZFS, ce qui a permis d’améliorer les performances et de réduire les coûts du système de stockage.

Pliops cible également le stockage, qui utilise une carte PCIe avec un FPGA pour accélérer les opérations clé-valeur utilisées dans des applications telles que les bases de données. Le processeur de stockage Pliops (PSP) implémente une structure de données optimisée pour les opérations de stockage liées à la base de données, telles que l’indexation, la recherche ou le tri, et les accélère sans nécessiter de modifications logicielles de l’application. Pour ce faire, il remplace le moteur de stockage clé-valeur sous-jacent, tel qu’InnoDB, l’option par défaut pour MySQL, par son accélérateur matériel. Pliops affirme que cette implémentation peut fournir 10 fois plus de requêtes par seconde, tout en utilisant plus efficacement l’espace de stockage SSD, offrant une valeur commerciale immédiate.

Les GPU peuvent également faire du stockage de calcul

L’exemple d’accélérateur de stockage informatique le plus extrême est peut-être Nyriad. L’entreprise a développé une stockage défini par logiciel plate-forme appelée Nsulate qui utilise un GPU Nvidia pour accélérer codage d’effacement les fonctions. Il est conçu comme une alternative au RAID pour les déploiements de stockage évolutifs hautes performances nécessitant un haut niveau de fiabilité.

En fait, il est censé être capable de faire face à des dizaines de pannes simultanées de périphériques en temps réel, sans dégradation des performances, car Nsulate peut reconstruire toutes les données manquantes plus rapidement que les données ne peuvent être récupérées à partir du stockage. Cela signifie que le remplacement d’un disque défaillant n’a pas besoin d’être une priorité élevée pour l’équipe informatique. Nyriad affirme que le GPU peut être utilisé simultanément pour d’autres charges de travail telles que l’apprentissage automatique.

Nsulate est actuellement disponible dans le cadre de systèmes pré-construits par des partenaires tels que Boston Limited, qui propose un serveur de stockage Nsulate basé sur Supermicro.

Le stockage informatique est encore à un stade précoce de développement, bien que certains fournisseurs proposent des produits déployables depuis plusieurs années. Les organisations qui l’évaluent pour leur datacenter doivent donc faire preuve de prudence, mais il y a déjà des avantages à tirer de l’utilisation de produits de stockage informatique dans certaines applications. Ils peuvent entraîner une consommation d’énergie globale plus faible et le besoin de moins de cœurs de processeur par nœud de serveur, par exemple, ainsi qu’une augmentation significative des performances dans de nombreux cas.

Leave a Reply

Your email address will not be published. Required fields are marked *