L'IA côté périphérique entre dans une période d'explosion, Jiang Bolong « stockage intégré » en tête de l'innovation en stockage pour PC/Smartphones IA et appareils portables

(Source : Elecfans, site d’Electronique)

Du modèle de raisonnement d’IA DeepSeek AI jusqu’à l’agent intelligent OpenClaw AI devenu viral cette année, le marché de l’IA en périphérie a été totalement déclenché. Si l’entraînement des grands modèles d’IA a permis les performances des mémoires HBM à très haut débit, alors l’inférence d’IA en périphérie redéfinira inévitablement le stockage de l’IA en périphérie. Parmi tout cela, « le stockage intégré » de Jiangbo Long, acteur phare du stockage national, est absolument un cas à part.

Lors du sommet CFM|MemoryS2026 sur les mémoires flash récemment organisé, le président et directeur général de Jiangbo Long, Cai Huabo, a prononcé un discours d’orientation, mettant l’accent sur le stockage intégré et l’exploration de l’IA en périphérie. Les deux cadres dirigeants de Jiangbo Long ont également accordé des interviews aux médias pendant le sommet, expliquant en détail les capacités de stockage de Jiangbo Long pour l’IA en périphérie. Dans le même temps, l’annonce par l’entreprise d’une série de nouveaux produits et de technologies de stockage dédiés à l’IA en périphérie a suscité un intérêt élevé de la part de l’extérieur.

Dans son discours, Cai Huabo a indiqué que, avec l’accélération des applications d’inférence IA, les différences de base entre les services de stockage du cloud et ceux de l’IA en périphérie deviennent clairement distinctes à mesure que la mémoire à plusieurs niveaux évolue. À ce stade, l’IA cloud se concentre sur des services de stockage spécialisés pour les GPU, tandis que l’IA en périphérie s’articule autour de trois besoins essentiels : capacité haute performance, intégration et encapsulation SiP au niveau système, et services sur mesure. Ses exigences de stockage présentent une différence fondamentale avec les écosystèmes de stockage standard du passé.

Tout comme les GPU grand public et les GPU dédiés à l’IA appartiennent à des systèmes très différents, le premier s’appuie sur l’écosystème de puces généralistes, tandis que le second vise la fabrication de produits de systèmes d’IA complets. L’IA en périphérie a également besoin de solutions de stockage sur mesure profondément intégrées, et non de produits de stockage standard génériques. Sur la base de cette orientation précise, Jiangbo Long se concentre sur une solution de stockage intégré pour l’IA en périphérie, en ciblant précisément des scénarios variés tels que les téléphones IA, la conduite assistée IA, les appareils portables IA, les PC IA et les robots corporels. Cela ancre une direction de scénario claire pour l’innovation du stockage de l’IA en périphérie, tout en complétant par avantage le stockage de l’IA cloud.

Avec SPU+iSA, optimisation approfondie du stockage des PC IA ; SSD pour approfondir les données tièdes et froides ; réduction massive de la capacité DRAM

Yan Shuyin, vice-président de Jiangbo Long et directeur général de l’activité stockage au niveau entreprise, a déclaré que, avec le développement continu de la technologie AI, le modèle traditionnel de répartition des données à plusieurs niveaux est en train de changer. Auparavant, les données étaient souvent classées en données froides et chaudes ; aujourd’hui, les scénarios de données tièdes deviennent de plus en plus mis en avant. Face à ce changement, Jiangbo Long a lancé SPU (Storage Processing Unit, unité de traitement du stockage), iSA (Intelligence Storage Agent, agent de stockage intelligent) et la technologie de cache avancé HLC (High Level Cache), afin de réaliser des fonctions de planification intelligente, puis a mené un développement conjoint avec les constructeurs hôtes pour approfondir l’optimisation de la collaboration logiciel-matériel.

Contrairement aux contrôleurs SSD classiques, SPU est une unité de traitement dédiée conçue pour une architecture de stockage intelligente. La puce est fabriquée avec un procédé avancé de 5 nm ; la capacité maximale par disque atteint 128 TB. Aujourd’hui, la capacité maximale des cSSD grand public n’atteint que 8 TB environ, tandis que les solutions eSSD à grande capacité coûtent plus cher. SPU équilibre efficacement les problèmes de capacité et de coût : elle peut remplacer de manière efficace les HDD. Cela ouvre de nouvelles possibilités pour aider les clients à explorer des solutions eSSD, tout en réduisant de manière significative le coût total de possession.

Les deux capacités clés du cœur de SPU sont la compression sans perte en mémoire et la technologie de cache avancé HLC (High Level Cache). Le taux de compression moyen de la compression sans perte en mémoire atteint 2:1 : des tests réels montrent une couverture de plusieurs types de données, notamment texte/code et base de données, ce qui permet d’économiser fortement la capacité et le coût du SSD. De plus, via la technologie HLC, les données tièdes et froides peuvent être descendues vers le SSD, économisant près de 40 % des besoins en capacité DRAM.

Sur le salon, l’auteur a vu des données de test réelles où Jiangbo Long et AMD, à partir du poste hôte d’agent basé sur le processeur Ryzen AI Max+ 395, ont optimisé conjointement. Cet appareil réalise le déploiement local d’un modèle ultra-grand de 397B ; dans un scénario de contexte ultra-long de 256K (122B), 128GB de mémoire peuvent fonctionner en douceur. Ainsi, l’occupation de DRAM est réduite d’environ 40 %, ce qui fournit une solution de pratique innovante pour le déploiement local efficace et à grande échelle de modèles ultra-grands.

Yan Shuyin analyse que les données tièdes de type KV Cache sont généralement stockées sur un SSD local ; équilibrer la capacité et la vitesse d’accès est une direction importante pour le stockage de l’IA en périphérie. Sur le segment des PC IA, la technologie HLC repose sur SPU pour réaliser une conception en couches : la couche performance crée une zone de cache rapide dédiée à l’IA, afin de décharger les experts de grands modèles / les paires clé-valeur ; la couche stockage est responsable du système d’exploitation et du stockage de données générique. Grâce à des opérations de lecture/écriture à priorité élevée et à la planification des E/S à priorité faible, tout en optimisant l’expérience IA, on réduit les besoins en capacité DRAM et les coûts du terminal. En termes simples, grâce à la technologie HLC, on planifie intelligemment des disques SSD hétérogènes : on planifie SLC ou QLC selon différents scénarios, afin d’obtenir un meilleur équilibre entre performances et coûts.

Bien sûr, en plus du niveau matériel avec l’unité de traitement du stockage SPU, Jiangbo Long construit, au niveau logiciel, un agent de stockage iSA. Les deux combinés, via une collaboration logiciel-matériel, permettent de boucler la boucle technologique. En tant que « cerveau » de SPU, iSA est un moteur de planification intelligente orienté vers l’inférence d’IA en périphérie. En ciblant des problèmes tels que la masse des paramètres des grands modèles MoE, l’expansion rapide du KV Cache et l’impact de la latence I/O sur la fluidité du raisonnement, iSA résout efficacement les difficultés de planification de stockage pour l’inférence d’IA en périphérie grâce à des algorithmes de déchargement d’experts MoE, de gestion intelligente du KV Cache et de prélecture intelligente. Dans l’exemple d’optimisation conjointe avec un hôte d’agent AMD, une fois que l’hôte installe l’agent de stockage iSA, il peut optimiser en coordination avec le SSD, améliorant la performance globale de l’IA en périphérie lors du fonctionnement de l’ensemble du système.

Stockage des AI phones : technologie HLC en coordination avec UFS ; pour porter des dimensions extrêmes aux bracelets et montres, et s’introduire dans plusieurs grandes marques d’AI lunettes

Dans le domaine embarqué, la technologie de cache avancé HLC et l’intégration profonde à UFS permettent une mise en œuvre du scénario d’IA en périphérie embarquée. D’après les données de test mesurées issues du développement conjoint entre Jiangbo Long et Unisoc (紫光展锐), sur une plateforme de puces Unisoc : avec 4GB de DDR combinée à la technologie HLC, le temps de réponse au lancement de 20 applications n’est que de 851 ms, proche du niveau de configuration normal de DDR 6GB/8GB. En outre, Jiangbo Long, avec le produit UFS 2.2 piloté par le contrôleur WM7200, procédé 14 nm, atteint une vitesse de lecture/écriture séquentielle pouvant aller jusqu’à 1070MB/s et 1000MB/s, et pour les lectures/écritures aléatoires, les IOPS atteignent respectivement jusqu’à 240K et 210K, dépassant le niveau des principaux acteurs du secteur. Tout en garantissant une expérience fluide et la durée de vie des composants, cela réduit efficacement les besoins en capacité DRAM du terminal et optimise les coûts du BOM.

Le vice-président de Jiangbo Long et directeur général de l’activité stockage embarqué, Huang Qiang, a déclaré que, pour les produits embarqués, à l’avenir, les besoins de stockage de l’IA en périphérie se concentrent principalement sur trois axes : haute performance et grande capacité, intégration système de niveau SIP, et services sur mesure.

La gamme de produits portables de Jiangbo Long s’inscrit précisément dans cette tendance : innovation continue et progrès rapides des applications. Selon les informations, en tant que l’un des rares fabricants de stockage en Chine maîtrisant un savoir-faire complet de conception de l’encapsulation au niveau système, Jiangbo Long peut intégrer plusieurs puces dans une seule encapsulation, dont SoC, eMMC/UFS, LPDDR, WiFi, Bluetooth et NFC. Le eMMC 5,8 mm × 6,3 mm présenté ici est actuellement le produit eMMC de plus petite taille publié dans l’industrie. Grâce à une conception d’encapsulation extrême, Jiangbo Long intègre fortement les puces de mémoire flash et le contrôleur conçu en interne. Par rapport au eMMC de taille ultra-réduite de la génération précédente de Jiangbo Long, 7,2 mm × 7,2 mm, l’espace occupé sur la carte mère est de nouveau réduit d’environ 30 %, libérant davantage d’espace précieux pour les structures portables telles que les lunettes intelligentes et les montres.

L’autre produit récent, ePOP5x, empile verticalement un eMMC haute performance et une DRAM LPDDR5x dans une seule encapsulation. Le taux de transfert de la LPDDR5x est de 8533 Mbps, avec une épaisseur de seulement 0,5 mm. Il s’agit d’une autre percée dans le procédé d’encapsulation du stockage embarqué. Sa caractéristique d’extrême finesse lui permet de s’intégrer parfaitement à l’extrémité de la branche de lunettes très légères pour l’IA, tout en permettant un accès高速 aux données et un fonctionnement haute fréquence de la mémoire ; cela apporte un support matériel clé pour offrir une expérience de « port sans sensation » au produit terminal.

En termes de consommation électrique, les deux nouveaux produits intègrent les nouveaux contrôleurs eMMC conçus en interne de la gamme « Hui Yi Wei » (慧忆微) de Jiangbo Long. Grâce à une optimisation approfondie des stratégies de lecture/écriture et de la gestion de l’espace Flash, la consommation statique du nouveau produit est considérablement réduite, d’environ 250 %, par rapport à la génération précédente. Cela atténue efficacement l’anxiété d’autonomie « un jour, une recharge » des appareils de port intelligents, en fournissant une base matérielle solide pour des scénarios toujours actifs tels que l’activation vocale IA en continu et la surveillance de la santé.

Au niveau packaging et test (封测), la filiale de Jiangbo Long, Yuan Cheng Technology, en tant que base de fabrication haut de gamme pour le packaging et les tests, fournit une garantie de bout en bout pour les produits de stockage portables, allant de l’encapsulation au niveau wafer jusqu’aux tests au niveau système. Yuan Cheng Technology dispose d’une ligne dédiée ESAT spécialisée, conçue sur mesure en fonction des caractéristiques des puces portables, capable d’effectuer une encapsulation par empilement en couches ultra-fine et de fabrication par empilement hétérogène. Elle peut réaliser des tests de fiabilité rigoureux sur un large intervalle de température, de -40°C à 125°C. Chaque puce de stockage quittant l’usine est validée par des tests complets des performances électriques, de l’aging, des cycles de température, des chutes, etc., afin de garantir un fonctionnement durable et stable dans des environnements d’utilisation sévères tels que les lunettes extérieures et les montres sportives.

Huang Qiang indique que le développement du stockage embarqué de Jiangbo Long compte déjà quinze ans. Dans le contexte actuel de l’IA, le stockage embarqué passe d’un stockage uniquement standardisé vers une intégration au niveau système. Jiangbo Long, via « contrôleur conçu en interne + algorithmes de firmware + tests d’encapsulation avancés », construit une boucle fermée complète de bout en bout, de la définition de la puce jusqu’au déploiement du produit final. Ce modèle de service Foundry de « personnalisation de l’ensemble de la chaîne d’approvisionnement d’un stockage IA : contrôleur en interne + optimisation firmware + tests d’encapsulation internes » constitue le cœur de la compétitivité de Jiangbo Long, qui le différencie des fabricants de stockage traditionnels. Cela lui permet de coopérer en profondeur avec les clients dès l’étape de définition du produit : en fonction des exigences de calcul, de la consommation électrique et des contraintes structurelles de la plateforme de port spécifique, Jiangbo Long réalise une conception personnalisée de bout en bout allant du wafer au produit final, faisant évoluer « le stockage générique » vers « le stockage défini par le scénario ».

D’après les informations, le stockage portable de Jiangbo Long est déjà entré dans les chaînes d’approvisionnement de plusieurs fabricants majeurs de lunettes IA, et devrait devenir un point de croissance potentiel pour l’entreprise, grâce à la croissance rapide de cette catégorie de best-sellers.

Résumé

Qu’il s’agisse des AI phones, des AI PC ou des boîtiers pour « écrevisses », bien que l’IA en périphérie semble très proche de nous, elle n’est pas encore véritablement à portée de main. Les solutions de stockage à l’échelle du système, capables de supporter l’exécution locale de grands modèles d’IA et d’agents intelligents, sont précisément la direction que le secteur s’efforce d’atteindre. Grâce à des technologies innovantes et à d’excellentes performances, le stockage intégré de Jiangbo Long continuera à alimenter en permanence la vague d’IA en périphérie.

Abondantes informations, analyses précises — le tout dans l’application Sina Finance

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler