Évolution de l'indexation des données Blockchain : des nœuds bruts aux bases de données de chaîne complète habilitées par l'IA
1. Introduction
Depuis la première génération d'applications Blockchain en 2017, les applications décentralisées (dApp) ont prospéré, couvrant plusieurs domaines tels que la finance, les jeux et les réseaux sociaux. À mesure que l'industrie progresse, nous ne pouvons nous empêcher de nous interroger : d'où proviennent réellement les données sur lesquelles reposent ces dApps ?
En 2024, l'intelligence artificielle et le Web3 deviennent des sujets d'actualité. Dans le domaine de l'IA, les données sont comme la source de la vie, nourrissant continuellement la croissance et l'évolution des systèmes. Sans le soutien d'un volume massif de données de qualité, même les algorithmes d'IA les plus sophistiqués peinent à déployer l'intelligence et l'efficacité qu'ils devraient.
Cet article explorera en profondeur l'évolution de l'accessibilité des données sur la Blockchain, analysera l'évolution des techniques d'indexation des données et comparera les similitudes et les différences entre des protocoles majeurs tels que The Graph, Chainbase et Space and Time en matière de services de données et d'architecture des produits, en mettant particulièrement l'accent sur la manière dont ces deux derniers combinent les technologies de l'IA pour fournir des services innovants.
2. La complexité et la simplicité de l'indexation des données : des nœuds Blockchain à la base de données complète
2.1 Source de données : Nœud Blockchain
La blockchain est essentiellement un registre distribué décentralisé, maintenu par de nombreux nœuds. Chaque nœud conserve une copie complète des données de la blockchain, garantissant les caractéristiques décentralisées du réseau. Cependant, les utilisateurs ordinaires qui construisent et maintiennent des nœuds font face à de nombreuses difficultés, nécessitant non seulement des compétences techniques spécialisées, mais aussi des coûts matériels et de bande passante élevés. De plus, la capacité de requête des nœuds ordinaires est limitée, ce qui rend difficile la satisfaction des besoins des développeurs.
Pour résoudre ce problème, les fournisseurs de nœuds RPC ont vu le jour. Ils prennent en charge les coûts d'exploitation des nœuds et offrent aux utilisateurs des services d'accès aux données via des points de terminaison RPC. Bien que les points de terminaison RPC publics soient gratuits, ils sont soumis à des limitations de débit ; les points de terminaison RPC privés offrent de meilleures performances, mais leur efficacité pour des requêtes complexes n'est pas élevée et ils sont difficiles à étendre entre chaînes. Néanmoins, l'interface API standardisée des fournisseurs de nœuds a considérablement réduit le seuil d'accès des utilisateurs aux données sur la chaîne.
2.2 Analyse des données : des données brutes aux données utilisables
Les données brutes fournies par les nœuds de la blockchain sont généralement cryptées et codées, rendant leur utilisation directe très difficile pour les utilisateurs ordinaires et les développeurs. Par conséquent, l'analyse des données devient un élément clé, car elle transforme des données brutes complexes en un format facile à comprendre et à manipuler, augmentant considérablement la disponibilité des données.
2.3 L'évolution des indexeurs de données
Avec l'augmentation massive du volume de données de la Blockchain, la demande pour des indexeurs de données devient de plus en plus pressante. Les indexeurs organisent les données sur la chaîne et les stockent dans une base de données, ce qui les rend faciles à interroger. Ils fournissent une interface de requête unifiée, permettant aux développeurs d'utiliser un langage de requête standardisé ( tel que GraphQL ) pour récupérer rapidement et précisément les informations nécessaires.
Différents types d'indexeurs ont chacun leurs caractéristiques :
Indexeur de nœud complet : extrait directement des données du nœud complet, garantissant l'intégrité des données, mais nécessitant beaucoup de ressources.
Indexeur léger : s'appuie sur des nœuds complets pour obtenir des données à la demande, réduisant les besoins de stockage mais pouvant augmenter le temps de requête.
Indexeur spécialisé : optimisé pour des types de données ou de Blockchain spécifiques, tels que les données NFT ou les transactions DeFi.
Agrégateur d'index: extraire des données de plusieurs blockchains et sources, y compris des informations hors chaîne, pour faciliter les applications multi-chaînes.
Actuellement, les besoins de stockage des nœuds d'archive Ethereum atteignent plusieurs To. Face à un tel volume de données, les protocoles d'indexation mainstream non seulement prennent en charge l'indexation multi-chaînes, mais ont également personnalisé des cadres d'analyse de données en fonction des différentes exigences des applications, comme le "sous-graphe" de The Graph (Subgraph).
Comparé aux points de terminaison RPC traditionnels, l'indexeur améliore considérablement l'efficacité de l'indexation et des requêtes de données. Ils prennent en charge des requêtes complexes, le filtrage des données et l'analyse agrégée, et peuvent intégrer des sources de données inter-chaînes. Grâce à un fonctionnement distribué, l'indexeur offre une sécurité et des performances accrues, réduisant le risque d'interruption.
2.4 Base de données de la Blockchain : alignement prioritaire au flux
Avec des demandes d'application de plus en plus complexes, les API standardisées ont du mal à répondre à la diversité des besoins de requêtes, tels que l'accès inter-chaînes ou la cartographie des données hors chaîne. L'approche "priorité au flux" dans les pipelines de données modernes offre de nouvelles perspectives pour le traitement des données en temps réel, permettant aux organisations de répondre instantanément aux données et de prendre des décisions.
Les fournisseurs de services de données Blockchain se dirigent également vers la construction de flux de données. Les fournisseurs de services d'indexation traditionnels lancent des produits de flux de données en temps réel, tels que Substreams de The Graph, Mirror de Goldsky, etc. Des fournisseurs émergents comme Chainbase et SubSquid offrent des lacs de données en temps réel générés par la Blockchain.
Ces services visent à répondre aux besoins d'analyse en temps réel des transactions Blockchain et de fournir des capacités de requête complètes. En considérant les données Blockchain comme un flux de données plutôt qu'une sortie finale, nous pouvons personnaliser des ensembles de données haute performance pour divers scénarios commerciaux.
3. AI + Base de données ? Comparaison approfondie de The Graph, Chainbase et Space and Time
3.1 The Graph
Le réseau The Graph fournit des services d'indexation et de requête de données multi-chaînes via des nœuds décentralisés. Son produit phare est le marché d'exécution des requêtes de données et le marché de cache d'indexation des données, qui répondent aux besoins de requête des utilisateurs. Le réseau The Graph est composé de quatre rôles : indexeurs, conservateurs, délégataires et développeurs, garantissant le bon fonctionnement du système grâce à des incitations économiques.
L'écosystème The Graph adopte activement la technologie AI. Des outils tels que AutoAgora, Allocation Optimizer et AgentC, développés par Semiotic Labs, améliorent les performances du système en matière de stratégies de tarification, de répartition des ressources et d'expérience utilisateur. L'application de ces outils permet à The Graph d'améliorer encore son niveau d'intelligence et sa convivialité.
3.2 Chainbase
Chainbase est un réseau de données de chaîne complète, intégrant des données multi-chaînes sur une seule plateforme. Ses fonctionnalités uniques incluent :
Lac de données en temps réel : fournit un accès instantané aux flux de données de Blockchain
Architecture à double chaîne : construit sur la couche d'exécution basée sur Eigenlayer AVS, en parallèle avec l'algorithme de consensus CometBFT.
Norme de format de données innovante : introduction de "manuscripts" pour optimiser la structure des données
Modèle du monde cryptographique : combiner la technologie des modèles d'IA pour créer un modèle d'IA capable de comprendre et de prédire les transactions sur la blockchain.
Le modèle AI Theia de Chainbase est son point fort. Theia est basé sur le modèle DORA de NVIDIA, combinant l'analyse de données en chaîne et hors chaîne avec un mode de cryptage, et répond par le raisonnement causal, offrant aux utilisateurs des services de données intelligents.
3.3 Espace et Temps
Space and Time (SxT) s'engage à créer une couche de calcul vérifiable, étendant les preuves à connaissance nulle sur un entrepôt de données décentralisé. Sa technologie de base Proof of SQL garantit l'intégrité et la vérifiabilité des requêtes SQL, fournissant ainsi une base pour les applications de données blockchain dans des secteurs ayant des exigences élevées en matière de fiabilité des données.
SxT collabore avec le laboratoire d'innovation AI de Microsoft pour développer des outils d'IA générative, permettant aux utilisateurs de traiter les données Blockchain par le biais du traitement du langage naturel. Dans Space and Time Studio, l'IA peut automatiquement convertir le langage naturel en SQL et exécuter des requêtes.
Conclusion et perspectives
La technologie d'indexation des données Blockchain est passée des sources de données de nœud initiales, à travers le développement de la解析 des données et des indexeurs, pour finalement évoluer vers des services de données de chaîne complète habilités par l'IA, à travers un processus d'amélioration progressive. Ces avancées technologiques ont non seulement amélioré l'efficacité et l'exactitude de l'accès aux données, mais ont également apporté une expérience utilisateur intelligente.
Dans le futur, avec le développement de nouvelles technologies telles que l'IA et les preuves à divulgation nulle de connaissance, les services de données Blockchain deviendront encore plus intelligents et sécurisés. En tant qu'infrastructure, les services de données Blockchain continueront à fournir un soutien solide à l'innovation sectorielle.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
11 J'aime
Récompense
11
6
Partager
Commentaire
0/400
ChainDoctor
· Il y a 11h
Dis-le plus tôt, les données peuvent directement servir de carburant.
Voir l'originalRépondre0
DataChief
· Il y a 11h
L'IA intègre-t-elle la Blockchain ? Je suis jaloux.
Voir l'originalRépondre0
ZeroRushCaptain
· Il y a 11h
Pff, ça fait tant d'années que l'on creuse encore des trous sous les données ? Toujours le même chemin avec un nouvel emballage !
Voir l'originalRépondre0
MetaverseLandlady
· Il y a 11h
Bientôt 2025, les données off-chain explosent de manière incontrôlable.
Voir l'originalRépondre0
MysteryBoxOpener
· Il y a 11h
Je ne veux plus apprendre, que faire, je suis comme un Débutant.
Évolution de l'indexation des données de Blockchain : des nœuds à une base de données de chaîne entièrement alimentée par l'IA
Évolution de l'indexation des données Blockchain : des nœuds bruts aux bases de données de chaîne complète habilitées par l'IA
1. Introduction
Depuis la première génération d'applications Blockchain en 2017, les applications décentralisées (dApp) ont prospéré, couvrant plusieurs domaines tels que la finance, les jeux et les réseaux sociaux. À mesure que l'industrie progresse, nous ne pouvons nous empêcher de nous interroger : d'où proviennent réellement les données sur lesquelles reposent ces dApps ?
En 2024, l'intelligence artificielle et le Web3 deviennent des sujets d'actualité. Dans le domaine de l'IA, les données sont comme la source de la vie, nourrissant continuellement la croissance et l'évolution des systèmes. Sans le soutien d'un volume massif de données de qualité, même les algorithmes d'IA les plus sophistiqués peinent à déployer l'intelligence et l'efficacité qu'ils devraient.
Cet article explorera en profondeur l'évolution de l'accessibilité des données sur la Blockchain, analysera l'évolution des techniques d'indexation des données et comparera les similitudes et les différences entre des protocoles majeurs tels que The Graph, Chainbase et Space and Time en matière de services de données et d'architecture des produits, en mettant particulièrement l'accent sur la manière dont ces deux derniers combinent les technologies de l'IA pour fournir des services innovants.
2. La complexité et la simplicité de l'indexation des données : des nœuds Blockchain à la base de données complète
2.1 Source de données : Nœud Blockchain
La blockchain est essentiellement un registre distribué décentralisé, maintenu par de nombreux nœuds. Chaque nœud conserve une copie complète des données de la blockchain, garantissant les caractéristiques décentralisées du réseau. Cependant, les utilisateurs ordinaires qui construisent et maintiennent des nœuds font face à de nombreuses difficultés, nécessitant non seulement des compétences techniques spécialisées, mais aussi des coûts matériels et de bande passante élevés. De plus, la capacité de requête des nœuds ordinaires est limitée, ce qui rend difficile la satisfaction des besoins des développeurs.
Pour résoudre ce problème, les fournisseurs de nœuds RPC ont vu le jour. Ils prennent en charge les coûts d'exploitation des nœuds et offrent aux utilisateurs des services d'accès aux données via des points de terminaison RPC. Bien que les points de terminaison RPC publics soient gratuits, ils sont soumis à des limitations de débit ; les points de terminaison RPC privés offrent de meilleures performances, mais leur efficacité pour des requêtes complexes n'est pas élevée et ils sont difficiles à étendre entre chaînes. Néanmoins, l'interface API standardisée des fournisseurs de nœuds a considérablement réduit le seuil d'accès des utilisateurs aux données sur la chaîne.
2.2 Analyse des données : des données brutes aux données utilisables
Les données brutes fournies par les nœuds de la blockchain sont généralement cryptées et codées, rendant leur utilisation directe très difficile pour les utilisateurs ordinaires et les développeurs. Par conséquent, l'analyse des données devient un élément clé, car elle transforme des données brutes complexes en un format facile à comprendre et à manipuler, augmentant considérablement la disponibilité des données.
2.3 L'évolution des indexeurs de données
Avec l'augmentation massive du volume de données de la Blockchain, la demande pour des indexeurs de données devient de plus en plus pressante. Les indexeurs organisent les données sur la chaîne et les stockent dans une base de données, ce qui les rend faciles à interroger. Ils fournissent une interface de requête unifiée, permettant aux développeurs d'utiliser un langage de requête standardisé ( tel que GraphQL ) pour récupérer rapidement et précisément les informations nécessaires.
Différents types d'indexeurs ont chacun leurs caractéristiques :
Actuellement, les besoins de stockage des nœuds d'archive Ethereum atteignent plusieurs To. Face à un tel volume de données, les protocoles d'indexation mainstream non seulement prennent en charge l'indexation multi-chaînes, mais ont également personnalisé des cadres d'analyse de données en fonction des différentes exigences des applications, comme le "sous-graphe" de The Graph (Subgraph).
Comparé aux points de terminaison RPC traditionnels, l'indexeur améliore considérablement l'efficacité de l'indexation et des requêtes de données. Ils prennent en charge des requêtes complexes, le filtrage des données et l'analyse agrégée, et peuvent intégrer des sources de données inter-chaînes. Grâce à un fonctionnement distribué, l'indexeur offre une sécurité et des performances accrues, réduisant le risque d'interruption.
2.4 Base de données de la Blockchain : alignement prioritaire au flux
Avec des demandes d'application de plus en plus complexes, les API standardisées ont du mal à répondre à la diversité des besoins de requêtes, tels que l'accès inter-chaînes ou la cartographie des données hors chaîne. L'approche "priorité au flux" dans les pipelines de données modernes offre de nouvelles perspectives pour le traitement des données en temps réel, permettant aux organisations de répondre instantanément aux données et de prendre des décisions.
Les fournisseurs de services de données Blockchain se dirigent également vers la construction de flux de données. Les fournisseurs de services d'indexation traditionnels lancent des produits de flux de données en temps réel, tels que Substreams de The Graph, Mirror de Goldsky, etc. Des fournisseurs émergents comme Chainbase et SubSquid offrent des lacs de données en temps réel générés par la Blockchain.
Ces services visent à répondre aux besoins d'analyse en temps réel des transactions Blockchain et de fournir des capacités de requête complètes. En considérant les données Blockchain comme un flux de données plutôt qu'une sortie finale, nous pouvons personnaliser des ensembles de données haute performance pour divers scénarios commerciaux.
3. AI + Base de données ? Comparaison approfondie de The Graph, Chainbase et Space and Time
3.1 The Graph
Le réseau The Graph fournit des services d'indexation et de requête de données multi-chaînes via des nœuds décentralisés. Son produit phare est le marché d'exécution des requêtes de données et le marché de cache d'indexation des données, qui répondent aux besoins de requête des utilisateurs. Le réseau The Graph est composé de quatre rôles : indexeurs, conservateurs, délégataires et développeurs, garantissant le bon fonctionnement du système grâce à des incitations économiques.
L'écosystème The Graph adopte activement la technologie AI. Des outils tels que AutoAgora, Allocation Optimizer et AgentC, développés par Semiotic Labs, améliorent les performances du système en matière de stratégies de tarification, de répartition des ressources et d'expérience utilisateur. L'application de ces outils permet à The Graph d'améliorer encore son niveau d'intelligence et sa convivialité.
3.2 Chainbase
Chainbase est un réseau de données de chaîne complète, intégrant des données multi-chaînes sur une seule plateforme. Ses fonctionnalités uniques incluent :
Le modèle AI Theia de Chainbase est son point fort. Theia est basé sur le modèle DORA de NVIDIA, combinant l'analyse de données en chaîne et hors chaîne avec un mode de cryptage, et répond par le raisonnement causal, offrant aux utilisateurs des services de données intelligents.
3.3 Espace et Temps
Space and Time (SxT) s'engage à créer une couche de calcul vérifiable, étendant les preuves à connaissance nulle sur un entrepôt de données décentralisé. Sa technologie de base Proof of SQL garantit l'intégrité et la vérifiabilité des requêtes SQL, fournissant ainsi une base pour les applications de données blockchain dans des secteurs ayant des exigences élevées en matière de fiabilité des données.
SxT collabore avec le laboratoire d'innovation AI de Microsoft pour développer des outils d'IA générative, permettant aux utilisateurs de traiter les données Blockchain par le biais du traitement du langage naturel. Dans Space and Time Studio, l'IA peut automatiquement convertir le langage naturel en SQL et exécuter des requêtes.
Conclusion et perspectives
La technologie d'indexation des données Blockchain est passée des sources de données de nœud initiales, à travers le développement de la解析 des données et des indexeurs, pour finalement évoluer vers des services de données de chaîne complète habilités par l'IA, à travers un processus d'amélioration progressive. Ces avancées technologiques ont non seulement amélioré l'efficacité et l'exactitude de l'accès aux données, mais ont également apporté une expérience utilisateur intelligente.
Dans le futur, avec le développement de nouvelles technologies telles que l'IA et les preuves à divulgation nulle de connaissance, les services de données Blockchain deviendront encore plus intelligents et sécurisés. En tant qu'infrastructure, les services de données Blockchain continueront à fournir un soutien solide à l'innovation sectorielle.