November 23, 2024

PDFS

C'est en forgeant qu'on devient forgeron

Qu’est-ce que c’est? Pourquoi maintenant, pour quoi, pour qui?

8 min read

La gestion des données à la périphérie du réseau n’est pas une idée nouvelle, mais elle devient de plus en plus importante à mesure que les organisations doivent faire face à des volumes de données croissants et à la nécessité de traiter rapidement les informations.

Stockage informatique est, cependant, une manière relativement nouvelle de relever ce défi.

Un facteur clé ici est que les systèmes informatiques conventionnels, avec des composants de calcul, de mise en réseau et de stockage séparés, présentent des goulots d’étranglement inhérents.

Une option est infrastructure hyperconvergée (HCI), où le traitement, le stockage et la mise en réseau sont intégrés dans des nœuds qui peuvent être intégrés dans des clusters.

Le stockage informatique va encore plus loin et place le traitement sur le sous-système de stockage lui-même. Cela, disent ses partisans, offre une efficacité bien plus grande lorsque la croissance des données provient de la prolifération des capteurs et de la Internet des objets (IoT) ou nécessite un traitement rapide pour intelligence artificielle (AI) et apprentissage automatique (ML) cas d’utilisation.

Cependant, la technologie est encore relativement immature, avec seulement une poignée de fournisseurs offrant du matériel de stockage informatique, bien qu’un plus grand nombre fasse partie du Groupe de travail de la SNIA (Storage Network Industry Association).

Qu’est-ce qui motive le besoin de stockage informatique?

Selon le SNIA, «les solutions de stockage informatique ciblent généralement les applications où la demande de traitement de charges de travail de stockage en constante augmentation dépasse les architectures de serveur de calcul traditionnelles». L’organisme de l’industrie cite l’IA, le big data, la livraison de contenu et le ML comme telles charges de travail.

D’autres applications incluent cryptage et décryptage, compression et déduplication des données et gestion du stockage.

La croissance des données est certainement un moteur. Cependant, la poussée ne vient pas seulement de l’augmentation des volumes de données, mais de la nécessité d’accélérer le traitement et de réduire les frais généraux liés aux tâches répétitives.

«Nous assistons à une augmentation progressive des capacités – ce n’est pas une révolution, mais des changements évolutifs», déclare Andrew Larssen, expert en transformation informatique chez PA Consulting. «Au fur et à mesure que cela deviendra plus courant, nous verrons la technologie être utilisée plus largement, dans le prétraitement, la compression, le chiffrement et la déduplication, ou la recherche de données, plutôt que d’avoir à charger les données dans un CPU. »

Sur le papier, un système équipé d’un stockage informatique est moins gourmand en CPU et en énergie que les architectures conventionnelles.

Cela aide à la périphérie du réseau – où le traitement local peut filtrer les données avant de les envoyer à un serveur conventionnel – mais aussi dans le centre de données, où les modules de stockage de calcul prennent certaines charges de travail du processeur.

Dans une architecture de stockage de serveur classique, la CPU demande des données, exécute la tâche et renvoie les données au stockage. Dans un modèle de stockage informatique, la CPU envoie une tâche, telle que le décryptage, au sous-système de stockage «intelligent». La sécurité est un autre avantage, car les données ne doivent jamais quitter le lecteur.

Technologies et options de déploiement

Le stockage informatique est activé par des technologies qui incluent des supports à semi-conducteurs hautes performances, des baies ou cœurs de traitement programmables à faible coût et des interfaces efficaces.

La génération actuelle de systèmes de stockage informatique utilise la mémoire flash, bien que, comme le traitement et le stockage sont séparés, toute technologie de stockage suffisamment performante pourrait fonctionner.

Le système lui-même est généralement un Disque U.2 ou M.2 NVMe ou une carte PCIe. Certains fournisseurs proposent également EDSFF. L’exception est le SmartSSD de Samsung qui, comme son nom l’indique, est basé sur un mécanisme SSD standard de 2,5 pouces. La feuille de route de SNIA favorise NVMe pour CSD (lecteurs de stockage informatique).

Pour fournir la capacité de calcul, les fournisseurs utilisent soit matrices de portes programmables sur site (FPGA) ou système sur puces (SoC) basé sur ARM.

La technologie FPGA est actuellement plus répandue. Les services informatiques peuvent acheter un système FPGA «fixe», avec des fonctionnalités spécifiques programmées, généralement des fonctions de gestion de stockage communes. Les systèmes personnalisés ou programmables permettent aux utilisateurs d’ajouter leurs propres fonctions, via des langages FPGA de bas niveau ou un langage de programmation de haut niveau tel que Xilinx Vitis.

Cependant, les FPGA ne peuvent pas être programmés à la volée. Cela a incité certains fournisseurs à utiliser à la place des SoC de base ARM. Ceux-ci peuvent exécuter Linux et ont le potentiel d’étendre encore plus la capacité de la technologie de stockage informatique.

Par exemple, le SNIA prévoit que les fournisseurs ajoutent Ethernet ou autre réseau pour permettre la communication d’égal à égal entre les périphériques de stockage informatique.

Jusqu’à présent, cependant, un seul fournisseur, NGD, fabrique des périphériques de stockage informatique basés sur ARM.

Parce qu’il existe de nombreuses applications pour le stockage informatique, le marché de la technologie n’est pas homogène. Au lieu de cela, les fournisseurs développent des dispositifs adaptés par application, par interface et par la façon dont ils sont programmés et gérés.

Certains fournisseurs se sont concentrés sur des sous-systèmes dédiés, tandis que d’autres positionnent le stockage informatique comme une mise à niveau potentielle du matériel de stockage existant.

L’industrie définit actuellement les périphériques de stockage de calcul comme: les lecteurs de stockage de calcul (CSD), qui sont du stockage avec des services de calcul ajoutés; les processeurs de stockage de calcul (CSP), qui sont du matériel sans stockage propre mais qui apporte le traitement à une matrice de stockage; et les baies de stockage de calcul (CSA), qui fournissent plusieurs CSD ou disques ordinaires avec un CSP ajouté pour le calcul.

SNIA définit également les services de stockage informatique (CSS) comme la couche de services qui gère la découverte, l’exploitation et, potentiellement, la programmation des périphériques de stockage informatique.

Cas d’utilisation pour le stockage informatique

Le stockage informatique se prête à toute application où le transfert de données du stockage vers le processeur est le goulot d’étranglement. Cela suggère des utilisations gourmandes en données plutôt qu’en calcul. La puissance de traitement disponible dans un FPGA ou un SoC est limitée.

Et comme peu de fournisseurs proposent, pour l’instant du moins, des systèmes SoC capables d’exécuter un système d’exploitation (OS) complet, les CSD fixes se prêtent à des charges de travail fixes prédéterminées telles que la déduplication, la gestion du stockage ou le chiffrement.

Les CSD programmables trouvent leur place dans les applications d’intelligence artificielle et de business intelligence (BI), tout comme les systèmes basés sur SoC. Ils peuvent également être utilisés pour l’accélération de la base de données.

Seuls les systèmes basés sur SoC peuvent être chargés de code directement par un processeur, et même là, cela signifie une compilation croisée de code de X86 vers ARM. Mais cela donne aux utilisateurs la plus grande flexibilité, permettant aux applications de déplacer le traitement vers les CSD en fonction des besoins.

Si les CSD disposent de leur propre réseau natif, ils pourraient également partager des tâches directement et alléger davantage les processeurs, ou permettre un travail plus complexe qui pourrait être trop important pour qu’un seul CSD soit effectué à la périphérie.

«Le stockage est bon marché pour le moment, et il existe des applications avec beaucoup de répétitions, en particulier lorsque vous passez à des quantités de« lac de données »», déclare Larssen de PA Consulting. «Donc, si vous pouvez effectuer la compression et la déduplication [in the storage layer], vous en verrez de gros gains. »

Larssen s’attend à voir l’adoption du stockage informatique par les services de streaming, pour la compression vidéo et les réseaux de distribution de contenu (CDN). Il prédit également la croissance des accélérateurs de bases de données, pour Postgres et MySQL.

«La technologie est toujours un créneau», dit-il. «À moins que cela ne soit fondamental pour votre entreprise, vous n’allez probablement pas le déployer. Il peut être moins coûteux de doubler la quantité de calcul général que vous utilisez. Lorsque cela est irréalisable, c’est à ce moment-là que vous devez sortir des sentiers battus. »

Fournisseurs de stockage informatique

Pliops commercialise son processeur de stockage en tant qu’accélérateur matériel pour les bases de données et autres charges de travail gourmandes en données. Il se concentre sur Postgres et MySQL. Le fournisseur propose une accélération des nœuds de calcul et de stockage, en utilisant la technologie basée sur NVMe.

Samsung propose son Smart SSD, qui utilise une puce FPGA Xilinx. La technologie est disponible via Samsung ou Xilinx. Samsung positionne actuellement la technologie pour la BI, l’intelligence de portefeuille financier et pour l’industrie aéronautique.

NGD est actuellement le seul fournisseur à utiliser un SoC capable d’exécuter un OS pour alimenter son stockage informatique. Il dit que son système est indépendant du flash Nand et exécute Linux 64 bits.

Eideticom propose son processeur de stockage informatique NoLoad. Il est prétendu être le premier CSP NVMe, et est destiné à l’accélération de l’infrastructure des centres de données et à la recherche scientifique, ainsi qu’à la réduction générale des coûts.

Scaleflux propose des lecteurs AIC et U.2. Sa série CSD 2000 prend en charge jusqu’à 8 To (téraoctets) de mémoire flash 3D Nand, avec compression et décompression du chemin de données.

Leave a Reply

Your email address will not be published. Required fields are marked *