SAP HANA - SAP HANA

SAP HANA
Logo SAP SE
Développeur(s) SAP SE
Première version 2010 ( 2010 )
Version stable 2.0 SPS05 (26 juin 2020 ; il y a 12 mois ) [±] ( 2020-06-26 )
Écrit en C , C++
Système opérateur Linux
Disponible en Anglais
Taper Base de données multi-modèles
Licence Logiciel commercial propriétaire
Site Internet www .sap .com / produits / hana .html

SAP HANA (appliance analytique haute performance) est un système de gestion de base de données relationnelle en mémoire , orienté colonnes , développé et commercialisé par SAP SE . Sa fonction principale en tant que logiciel exécutant un serveur de base de données est de stocker et de récupérer les données demandées par les applications. En outre, il effectue des analyses avancées (analyse prédictive , traitement de données spatiales , analyse de texte, recherche de texte, analyse en continu , traitement de données graphiques ) et comprend des capacités d' extraction, de transformation, de chargement (ETL) ainsi qu'un serveur d'applications .

Histoire

Au début du développement de SAP HANA, un certain nombre de technologies ont été développées ou acquises par SAP SE . Ceux-ci comprenaient le moteur de recherche TREX ( moteur de recherche orienté colonne en mémoire ), P*TIME ( plate-forme de traitement des transactions en ligne en mémoire (OLTP) acquise par SAP en 2005) et MaxDB avec son moteur liveCache en mémoire.

La première démonstration majeure de la plate-forme a eu lieu en 2008 : des équipes de SAP SE , du Hasso Plattner Institute et de l'Université de Stanford ont présenté une architecture d'application pour l'analyse et l'agrégation en temps réel appelée HYRISE. L'ancien cadre de SAP SE, Vishal Sikka , a qualifié cette architecture de "nouvelle architecture de Hasso". Avant que le nom "HANA" ne se stabilise, les gens appelaient ce produit "New Database". Le logiciel s'appelait auparavant "SAP High-Performance Analytic Appliance".

Un premier document de recherche sur HYRISE a été publié en novembre 2010. Le moteur de recherche est ensuite publié en open source en 2013, et a été remanié en 2016 pour devenir HYRISE2 en 2017.

Le premier produit a été expédié fin novembre 2010. À la mi-2011, la technologie avait suscité l'intérêt, mais les clients professionnels plus expérimentés considéraient qu'elle n'en était qu'à ses débuts. La prise en charge de HANA pour SAP NetWeaver Business Warehouse a été annoncée en septembre 2011 pour une disponibilité en novembre.

En 2012, SAP a fait la promotion de certains aspects du cloud computing . En octobre 2012, SAP a annoncé une plate - forme en tant qu'offre de service appelée SAP HANA Cloud Platform et une variante appelée SAP HANA One qui utilisait une plus petite quantité de mémoire.

En mai 2013, une offre de cloud privé géré appelée le service HANA Enterprise Cloud a été annoncée.

En mai 2013, Business Suite sur HANA est devenu disponible, permettant aux clients d'exécuter les fonctions SAP Enterprise Resource Planning sur la plate-forme HANA.

S/4HANA , publié en 2015, écrit spécifiquement pour la plate-forme HANA, combine des fonctionnalités pour ERP , CRM , SRM et autres dans un seul système HANA. S/4HANA est destiné à être une suite métier simplifiée, remplaçant les systèmes ERP de génération précédente . S'il est probable que SAP concentrera ses innovations sur S/4HANA, certains clients utilisant des systèmes non-HANA ont fait part de leurs craintes d'être bloqués dans les produits SAP. Étant donné que S/4HANA nécessite l'exécution d'un système SAP HANA, les clients exécutant des applications SAP Business Suite sur du matériel non certifié par SAP devraient migrer vers une base de données HANA certifiée SAP s'ils choisissent les fonctionnalités offertes par S/4HANA.

Plutôt que de contrôler les versions , le logiciel utilise des service packs , appelés Support Package Stacks (SPS), pour les mises à jour. Les piles de packages de support sont publiées tous les 6 mois.

En novembre 2016, SAP a annoncé SAP HANA 2, qui offre des améliorations dans plusieurs domaines tels que la gestion des bases de données et la gestion des applications et inclut deux nouveaux services cloud : l'analyse de texte et l'analyse d'observation de la Terre. Les clients HANA peuvent passer à HANA 2 à partir de SPS10 et versions ultérieures. Les clients exécutant SPS9 et versions antérieures doivent d'abord effectuer une mise à niveau vers SPS12 avant de passer à HANA 2 SPS01.

Architecture

Aperçu

Les distinctions principales entre les systèmes SAP de génération HANA et antérieures sont qu'il est orientée colonne , la base de données en mémoire , qui combine OLAP et OLTP opérations en un seul système; ainsi, en général, SAP HANA est un système OLTAP. Le stockage des données dans la mémoire principale plutôt que sur le disque permet un accès plus rapide aux données et, par extension, une interrogation et un traitement plus rapides. Bien que le stockage des données en mémoire confère des avantages en termes de performances, il s'agit d'une forme de stockage de données plus coûteuse. En observant les modèles d'accès aux données, jusqu'à 85 % des données d'un système d'entreprise peuvent être rarement consultées. Par conséquent, il peut être rentable de stocker des données fréquemment consultées ou « chaudes » en mémoire tandis que les données « chaudes » moins fréquemment consultées sont stockées sur disque, une approche que SAP a appelée "Dynamic tiering".

Les systèmes orientés colonnes stockent toutes les données d'une seule colonne au même emplacement, plutôt que de stocker toutes les données d'une seule ligne au même emplacement (systèmes orientés lignes). Cela peut permettre d'améliorer les performances des requêtes OLAP sur des ensembles de données volumineux et permet une plus grande compression verticale de types de données similaires dans une seule colonne. Si les temps de lecture des données stockées dans les colonnes sont suffisamment rapides, des vues consolidées des données peuvent être effectuées à la volée , éliminant ainsi le besoin de maintenir des vues agrégées et la redondance des données associée .

Bien que les systèmes orientés lignes aient été traditionnellement privilégiés pour OLTP , le stockage en mémoire ouvre des techniques pour développer des systèmes hybrides adaptés aux capacités OLAP et OLTP , éliminant ainsi le besoin de maintenir des systèmes séparés pour les opérations OLTP et OLAP.

Composants de l'indexeur

Le serveur d'indexation effectue la gestion des sessions, l'autorisation, la gestion des transactions et le traitement des commandes. La base de données possède à la fois un magasin de lignes et un magasin de colonnes. Les utilisateurs peuvent créer des tables à l'aide de l'un ou l'autre des magasins, mais le magasin en colonnes a plus de capacités et est le plus fréquemment utilisé. Le serveur d'indexation gère également la persistance entre les images mémoire mises en cache des objets de base de données, les fichiers journaux et les fichiers de stockage permanents. Le moteur XS permet de créer des applications Web.

La modélisation des informations SAP HANA (également connue sous le nom de modélisation des données SAP HANA) fait partie du développement d'applications HANA. La modélisation est la méthodologie pour exposer les données opérationnelles à l'utilisateur final. Des objets virtuels réutilisables (appelés vues de calcul) sont utilisés dans le processus de modélisation.

MVCC

SAP HANA gère la simultanéité grâce à l'utilisation du contrôle de simultanéité multiversion (MVCC), qui donne à chaque transaction un instantané de la base de données à un moment donné. Lorsqu'une base de données MVCC doit mettre à jour un élément de données, elle n'écrasera pas les anciennes données par de nouvelles données, mais marquera plutôt les anciennes données comme obsolètes et ajoutera la version la plus récente.

Big Data

Dans une échelle sur l' environnement, HANA peut garder les volumes jusqu'à un pétaoctet de données en mémoire pendant le retour des résultats de requête en moins d' une seconde. Cependant, la RAM est toujours beaucoup plus chère que l'espace disque, de sorte que l'approche évolutive n'est réalisable que pour certains cas d'utilisation critiques.

Analytique

SAP HANA comprend un certain nombre de moteurs d'analyse pour divers types de traitement de données. La bibliothèque de fonctions commerciales comprend un certain nombre d'algorithmes mis à disposition pour traiter les algorithmes courants de traitement des données commerciales, tels que l' amortissement des actifs , les prévisions mobiles et la moyenne mobile . La bibliothèque d'analyse prédictive comprend des algorithmes natifs pour le calcul de mesures statistiques courantes dans des domaines tels que le regroupement , la classification et l' analyse de séries chronologiques .

HANA intègre le langage de programmation statistique open source R en tant que langage pris en charge dans les procédures stockées .

La base de données de stockage de colonnes offre des capacités de base de données de graphes . Le moteur graphique traite le langage de requête Cypher et dispose également d'une manipulation graphique visuelle via un outil appelé Graph Viewer. Les structures de données graphiques sont stockées directement dans des tables relationnelles dans le magasin de colonnes de HANA. Les algorithmes prédéfinis dans le moteur graphique incluent la correspondance de modèles, la recherche de voisinage, le chemin le plus court et les composants fortement connectés. Les situations d'utilisation typiques du moteur graphique incluent des exemples tels que la traçabilité de la chaîne d'approvisionnement, la détection des fraudes, la logistique et la planification des itinéraires.

HANA comprend également un moteur de base de données spatiale qui implémente des types de données spatiales et des extensions SQL pour les opérations CRUD sur les données spatiales. HANA est certifié par l' Open Geospatial Consortium et s'intègre au système d'information géographique ArcGIS d' ESRI .

En plus des algorithmes numériques et statistiques, HANA peut effectuer des analyses de texte et une recherche de texte d'entreprise. La capacité de recherche de HANA est basée sur une recherche tolérante aux pannes « floue », un peu comme les moteurs de recherche Web modernes. Les résultats incluent une mesure statistique de la pertinence des résultats de recherche, et les critères de recherche peuvent inclure un seuil d'exactitude des résultats. Les analyses disponibles incluent l'identification d'entités telles que des personnes, des dates, des lieux, des organisations, des demandes, des problèmes, etc. Une telle extraction d'entité peut être adaptée à des cas d'utilisation spécifiques tels que la voix du client (préférences et attentes du client), l'entreprise (c'est-à-dire les fusions et acquisitions, les produits, les organisations) et le secteur public (personnes publiques, événements, organisations). Une extraction personnalisée et des dictionnaires peuvent également être implémentés.

Développement d'applications

Outre les capacités de base de données et d'analyse de données, SAP HANA est un serveur d'applications Web , hébergeant des applications destinées aux utilisateurs étroitement intégrées aux moteurs de base de données et d'analyse de HANA. Le "XS Advanced Engine" (XSA) fonctionne nativement avec les langages et runtimes Node.js et JavaEE . XSA est basé sur l' architecture Cloud Foundry et prend donc en charge la notion de « Bring Your Own Language », permettant aux développeurs de développer et de déployer des applications écrites dans des langages et dans des environnements d'exécution autres que ceux implémentés nativement par XSA, ainsi que de déployer des applications sous forme de microservices . XSA autorise également JavaScript côté serveur (XSJS).

Le serveur d'applications est pris en charge par une suite d'outils de gestion du cycle de vie des applications permettant le déploiement du développement et la surveillance des applications destinées aux utilisateurs.

Déploiement

HANA peut être déployé sur site ou dans le cloud à partir d'un certain nombre de fournisseurs de services cloud .

HANA peut être déployé sur site en tant que nouvelle appliance d'un fournisseur de matériel certifié. Alternativement, les composants matériels existants tels que le stockage et le réseau peuvent être utilisés dans le cadre de la mise en œuvre, une approche que SAP appelle « Tailored Data Center Integration (TDI) ». HANA est certifié pour fonctionner sur plusieurs systèmes d'exploitation, notamment SUSE Linux Enterprise Server et Red Hat Enterprise Linux . Les plates-formes matérielles prises en charge pour le déploiement sur site incluent Intel 64 et POWER Systems . Le système est conçu pour prendre en charge la mise à l'échelle horizontale et verticale .

Plusieurs fournisseurs de cloud proposent SAP HANA sur la base d'une infrastructure en tant que service , notamment :

SAP propose également ses propres services cloud sous la forme de :

Éditions

Les licences SAP HANA sont principalement divisées en deux catégories.

Licence d'exécution :

Utilisé pour exécuter des applications SAP telles que SAP Business Warehouse optimisé par SAP HANA et SAP S/4HANA .

Licence d'utilisation complète :

Utilisé pour exécuter à la fois des applications SAP et non SAP. Cette licence peut être utilisée pour créer des applications personnalisées.

Dans le cadre de la licence d'utilisation complète, les fonctionnalités sont regroupées en éditions ciblant divers cas d'utilisation.

  • Édition de base : fournit des fonctionnalités de base de données de base et des outils de développement, mais ne prend pas en charge les applications SAP
  • Édition de la plate-forme : édition de base plus intégration spatiale, prédictive, serveur R, recherche, texte, analyse, moteurs de graphiques et bibliothèques commerciales supplémentaires.
  • Édition Entreprise : édition de la plate - forme plus des composants groupés supplémentaires pour certaines des capacités de chargement de données et le cadre de règles.

De plus, des fonctionnalités telles que le streaming et l'ETL sont concédées sous licence en tant qu'options supplémentaires.

Depuis le 9 mars 2017, SAP HANA est disponible dans une édition Express ; une version simplifiée qui peut fonctionner sur des ordinateurs portables et d'autres environnements à ressources limitées. La licence pour SAP HANA, édition express est gratuite, même pour une utilisation productive jusqu'à 32 Go de RAM. Des augmentations de capacité supplémentaires peuvent être achetées.

Voir également

Les références

Liens externes