Homepage > Katalog > Informatik - Wirtschaftsinformatik

Predictive Analytics Lösungen für Datenauswertungen mit SAP HANA Express-Edition im Hochschulbetrieb

Name: Predictive Analytics Lösungen für Datenauswertungen mit SAP HANA Express-Edition im Hochschulbetrieb
Price: 36.99 EUR
Availability: InStock
Author: Julius Dold
ISBN: 9783346331762

Bachelorarbeit, 2020

107 Seiten, Note: 1,7

Julius Dold (Autor:in)

Leseprobe

Inhaltsverzeichnis

Abstract

Inhaltsverzeichnis

Abbildungsverzeichnis

Tabellenverzeichnis

Abkürzungsverzeichnis

1 Einleitung
1.1 Motivation und Ziel dieser Arbeit
1.2 Aufbau der Arbeit

2 Überblick SAP HANA
2.1 Historie von SAP HANA
2.2 Architektonische Merkmale
2.3 SAP HANA Express-Edition
2.3.1 Datenauswertungsfunktionalität
2.3.2 Application Function Library (AFL)
2.3.3 Predictive Analysis Library (PAL)
2.3.4 Application Function Modeler (AFM)

3 Demo - Reporting und Datenaufbereitung mit SAP HANA -Express Edition
3.1 Umgebung und Einrichtung der Systeme
3.1.1 Installation von SAP HANA Express-Edition
3.1.2 Test der Installation
3.1.3 Konfiguration von SAP HANA Tools für Eclipse
3.1.4 Einbindung der Datenbank und Konfiguration
3.2 Datengrundlage
3.3 Versuch Algorithmen und Datenauswertung
3.3.1 PAL: Time-Series Analysis Auto Arima und Arima Forecast
3.3.2 PAL: K-Means Clustering

4 Lessons Learned
4.1 Einarbeitung
4.2 Komplexität
4.3 Möglichkeiten
4.4 Einschränkungen
4.5 Laufzeitbeobachtungen
4.5.1 Rechnerkapazitätsauslastung
4.5.2 Vergleich von lokaler und verteilter Architektur
4.5.3 Laufzeitmessungen bei unterschiedlich großen Datenmengen
4.6 Ergebnisse der Laufzeitmessungen und Interpretation

5 Fazit
5.1 Zusammenfassung
5.2 Beantwortung der Forschungsfrage
5.3 Erschaffener Mehrwert
5.4 Limitationen
5.5 Weitere Forschung

Literaturverzeichnis

A. [Anhang]

6 Inhalt Anhang
6.1 AFM JOIN Operation Business Case BRAVO
6.1.1 Snowflake-Schema
6.1.2 Datenimport und Aufbereitung
6.2 Details zu den Laufzeitmessungen
6.3 Zugriffsrecht-Management

7 Danksagung

Abstract

The SAP HANA - Express Edition is a free option for limited use of SAP HANA. SAP promises a wide range of functions and high performance in data processing and analysis, which includes the area of predictive analytics. The documentation around SAP HANA is very comprehensive, but there is no source that provides information on how the SAP HANA Express-Edition can be used in education according to selected criteria. The documentation around SAP HANA is very comprehensive, but there is no source that provides information on how the SAP HANA Express-Edition can be used in education according to selected criteria. In this paper, the usability of the system is investigated using various criteria from education as well as runtime measurements. In order to evaluate the system, besides some installation and configuration steps, the application of algorithms from the field of predictive analytics was carried out. Thereby the necessary induction, the occurring complexity, the possibilities within the system as well as limitations were considered. Furthermore, various findings were determined by explicit runtime tests. Amongst other things, it was found that the induction requires some experience in information technology, the complexity is characterized by alternative paths and object connections, the possibilities with regard to handling and functional scope are very extensive and there are limitations in the transparency of error searches. The runtime measurements show how outsourcing the front-end affects performance, how the system behaves when processing 150 data sets step-by-step up to one million data sets and where the Hardware limits are. The SAP HANA - Express Edition is a very suitable system for use in advanced education of data processing.

Die SAP HANA - Express Edition ist eine kostenlose Möglichkeit, SAP HANA in eingeschränktem Umfang zu verwenden. SAP verspricht einen großen Funktionsumfang und eine hohe Performanz innerhalb der Datenverarbeitung und bei der Analyse, was den Bereich von Predictive Analytics miteinschließt. Die Dokumentation rund um das System ist sehr ausführlich, jedoch gibt es keine Quelle, die darüber informiert, in wie fern sich die SAP HANA Express - Edition in der Lehre anhand ausgewählter Kriterien verwenden lässt. In der vorliegenden Arbeit wird die Verwendbarkeit des Systems anhand verschiedener Kriterien aus der Lehre sowie durch Laufzeitmessungen erforscht. Um das System zu bewerten, wurde neben einigen Installations- und Konfigurationsschritten, die Anwendung von Algorithmen aus dem Bereich Predictive Analytics durchgeführt. Dabei wurde auf die notwendige Einarbeitung, die auftretende Komplexität, die Möglichkeiten innerhalb des Systems sowie auf Beschränkungen geachtet. Weiterhin wurden durch explizite Laufzeittests verschiedene Erkenntnisse ermittelt. Es kam unter Anderem heraus, dass die Einarbeitung einiger Informationstechnologischer Vorerfahrung bedarf, die Komplexität durch Alternativpfade und ObjektZusammenhänge gekennzeichnet ist, die Möglichkeiten hinsichtlich des Handlings und des Funktionsumfangs sehr weitläufig sind und es Einschränkungen bei der Transparenz von Fehlersuchen gibt. Die Laufzeitmessungen zeigen, wie sich die Auslagerung des Front-Ends auf die Performanz auswirkt, wie sich das System bei der Verarbeitung von 150 Datensätzen schrittweise bis zu einer Million Datensätze verhält und wo die Grenzen der Hardware liegen. Die SAP HANA - Express Edition ist ein sehr geeignetes System für den Einsatz in der fortgeschrittenen Lehre der Datenverarbeitung.

Abbildungsverzeichnis

Abbildung 1: SAP HANA Plattform

Abbildung 2: SAP HANA Architektur

Abbildung 3: Leistungsengpässe Hauptspeicher- und Festplattenzugriff (Angepasste Darstellung in Anlehnung an Prassol)

Abbildung 4: CSV-Importdialog

Abbildung 5: Umwandlung der Tabellen am Beispiel von BRAVO Product Attr. (Angepasste Darstellung in Anlehnung Prassol)

Abbildung 6: SAP HANA Architektur, Application Function Library

Abbildung 7: Flowgraph Model, Application Function Modeler

Abbildung 8: Funktionsansicht mit General, BFL und PAL

Abbildung 9: SAP HANA HXE Download Manager

Abbildung 10: Hostsdatei

Abbildung 11: XSEngine Erfolgsmeldung

Abbildung 12: VM Ansicht: XSA Authentifizierung

Abbildung 13: VM: Test WEB IDE

Abbildung 14: WEB IDE

Abbildung 15: Test Cockpit

Abbildung 16: Cockpit

Abbildung 17: System-Database Connection

Abbildung 18: VM: Output HDB Info

Abbildung 19: SystemDB: Administration

Abbildung 20: PAL Installations-Überprüfung

Abbildung 21: Ausschnitt aus Tabelle für Laufzeitmessungen

Abbildung 22: PAL: Stocks-Tabelle

Abbildung 23: Tabellenauswahldialog für Inputdaten

Abbildung 24: Ergebnistabelle des Auto-Arima Algorithmus Spaltenansicht

Abbildung 25: AFM: Auto Arima und Arima Forecast

Abbildung 26: Job Log Erfolgsmeldungen

Abbildung 27: ARIMA RESULTS: Timestamp 0-5

Abbildung 28: ARIMA RESULTS: Timestamp 195-199

Abbildung 29: ARIMA: Analysis Ansicht RESULTS Tabelle

Abbildung 30: PAL: CUSTOMERS

Abbildung 31: K-Means: Standard-Parameter Spaltenansicht

Abbildung 32: K-Means: Angepasste Parameter Spaltenansicht

Abbildung 33: AFM: K-Means

Abbildung 34: Results-Tabelle Spaltenansicht

Abbildung 35: CENTER POINTS Tabelle Spaltenansicht

Abbildung 36: Generiertes SQL-Script aus K-Means-Versuch

Abbildung 37: K-Means RESULT Tabelle

Abbildung 38: K-Means CENTER POINTS Tabelle

Abbildung 39: AFM: CUSTOMERSCLUSTEREDJOIN

Abbildung 40: SQL-Script aus Join-Operation

Abbildung 41: Resultstabelle Raw Data Ansicht

Abbildung 42: Balkendiagramm mit 3 Gruppierungen von Kunden

Abbildung 43: Blasendiagramm mit 3 Gruppierungen

Abbildung 44: Blasendiagramm mit 4 Gruppierungen

Abbildung 45: Streudiagramm mit 4 Gruppierungen für Individuelle Datenpunkte der Kunden

Abbildung 46: Streudiagramm mit Positionen der Center-Points

Abbildung 47: Streudiagramm mit 2 Gruppierungen für individuellen Datenpunkten der Kunden

Abbildung 48: Leistungsübersicht Arbeitsspeicher bei laufender VM

Abbildung 49: Leistungsabfall Arbeitsspeicher nach Beenden der VM

Abbildung 50: BRAVO Dataset - Store-Attr Editoransicht

Abbildung 51: BRAVO Dataset - Store-Text Editoransicht

Abbildung 52: BRAVO Dataset - Region-Attr Editoransicht

Abbildung 53: BRAVO Dataset - Store-Text Editoransicht

Abbildung 54: BRAVO Dataset - Promotion-Attr Editoransicht

Abbildung 55: BRAVO Dataset - Promotion-Text Editoransicht

Abbildung 56: BRAVO Dataset - Product-Attr Editoransicht

Abbildung 57: BRAVO Dataset - Product-Text Editoransicht

Abbildung 58: BRAVO Dataset - Face-Table Verkauf Editoransicht

Abbildung 59: BRAVO Dataset - Fact-Table Kosten-Kampagnen Editoransicht

Abbildung 60: BRAVO Dataset - Slowly-Changing-Dimensions1

Abbildung 61: BRAVO Dataset - Slowly-Changing-Dimensions2

Abbildung 62: Snowflake Schema BRAVO Data

Abbildung 63: Import Properties CSV-File

Abbildung 64: Import CSV-File Manage Table Definition

Abbildung 65: JOIN-Operation Mapping

Abbildung 66: AFM Bravo-Data-Report-JOIN-Operationen

Abbildung 67: Aussschnitt aus generiertem SQL-Script Code

Abbildung 68: Error-Meldung für Zugriffrechte

Tabellenverzeichnis

Tabelle 1: Vergleich der Laufzeiten lokal und verteilt

Tabelle 2: Laufzeiten für K-Means Vorbereitung

Tabelle 3: Laufzeiten für K-Means Auswertungen

Tabelle 4: Laufzeiten Import BRAVO CSV Dateien

Tabelle 5: Laufzeiten K-Means

Tabelle 6: Laufzeiten in Sekunden bei Datenpunktvisualisierungen von unterschiedlich großen Inputmengen

Tabelle 7: Laufzeiten in Sekunden bei Zentroiden-Visualisierungen bei unterschiedlich großen Inputmengen

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1 Einleitung

1.1 Motivation und Ziel dieser Arbeit

„Information is the oil of the 21st Century, and analytics is the combustion engine.“¹ Dieser Satz von Peter Sondergaard, einem Wissenschaftler der Gartner Gruppe, erweitert prägnant, das im Jahr 2009 von Meglena Kuneva ins Leben gerufene, berühmte Statement, worin Daten als das neue Öl bezeichnet werden.² Wenn Daten, die das Fundament einer Digitalisierung sind, als Öl für den Verbrennungsmotor der Analyse - wie von Peter Sonder- gaard - betrachtet werden, liegt es nahe, dass die Datenauswertung eine zentrale Rolle für eine erfolgreiche Digitalisierung bedeutet. 44% der deutschen Unternehmen, konnten ihren Umsatz durch die Digitalisierung stei- gern.³ Wird der Gedanke Sondergaards darum erweitert, dass die ganze Digitalisierung das Auto ist, in dem die Menschen durch das 21. Jahrhundert rasen, lässt sich die Wichtigkeit der Analyse von Daten durch ihre Rolle des Verbrennungsmotor als die primäre Funktion eines Autos, ohne Weiteres einordnen. Ein Anbieter für die Datenanalyse ist die SAP SE. Mit einem Marktanteil von 8,6% am Umsatz im Bereich Business Intelligence- und Analytics-Software, gehört die SAP SE aus Walddorf in Deutschland zu den umsatzstärksten Unternehmen in diesem Bereich. Im Jahr 2018 beläuft sich der weltweite Gesamt-Umsatz hierbei auf 24,09 Milliarden US-Dollar.⁴ Im selben Jahr, so wie in den Jahren 2016 und 2017, belegt die SAP SE jeweils Platz 3 weltweit, für den Gesamtanteil am Umsatz mit Big-Data und AnalyticsSoftware, wo ihr Umsatz jeweils zwischen 5 und 7 Milliarden US-Dollar liegt.⁵ SAP hat mit der HANA Lösung im Jahr 2011 eine Datenbank verfügbar gemacht, wovon sie versprechen, eine High-Performance Analytical Appliance für Echtzeit-Datenanalysen anzubieten, da das System ausnahmslos alle Daten im Arbeitsspeicher hält.⁶ Weiterhin wird mit vielen Funktionen und Anwendungsszenarien geworben. Ein Funktionsumfeld davon ist Predictive Analytics, welche auf Basis vorhandener Datenbestände zukünftige Trends vorhersagen kann.⁷ Laut einer Umfrage, sind 40% der Befragten der Meinung, dass Predictive Analytics im Bereich des Online-Handels in der Zukunft helfen wird, bessere Entscheidungen zu treffen.⁸ SAP stellt mit der SAP HANA Express-Edition eine kostenfreie, beschränkte Version von SAP HANA zur Verfügung.⁹ Das Ziel dieser Arbeit liegt darin, die SAP HANA Express-Edition auf ihre Potenziale hinsichtlich der Kriterien Einarbeitung, Komplexität, Möglichkeiten und Einschränkungen für die Lehre zu erproben. Weiterhin wird in dieser Arbeit erforscht, wie performant die Software bei einer für Studierende verfügbaren Hardware-Umgebung ist. Hierfür werden für unterschiedliche Szenarien Laufzeitenmessungen erhoben, verglichen und interpretiert. Der hohe Stellenwert, den die SAP und Predictive Analytics haben, die Versprechen von SAP bezüglich HANA, sowie mein grundlegendes Interesse für das Thema Business Analytics, begründet meine Aufmerksamkeit für dieses Thema. Das Interesse der Hochschule Furtwangen für diese wissenschaftliche Untersuchung bestärkt meine Forschungsmotivation, welche sich letztlich in den folgenden Forschungsfragen zusammenfassen lässt.

Wie geeignet ist die SAP HANA-Express Edition für die Lehre hinsichtlich der Kriterien Einarbeitung, Komplexität, Möglichkeiten und Einschränken und wie performant ist das System beim Betrieb auf einem für Studierende verfügbaren Computer bei exemplarisch ausgewählten Anwendungen aus dem Bereich Predictive Analytics?

1.2 Aufbau der Arbeit

Die hier vorliegende Arbeit besteht aus sechs Kapiteln. Nach dieser Einleitung werden zunächst werden im Kapitel Überblick HANA eine Reihe theoretischer Grundlagen rund um SAP HANA und im Speziellen um die SAP HANA Express Edition beschrieben, welche für das Verständnis dieser Arbeit notwendig sind. Kapitel drei ist eine Demo, worin der Prozess über die wesentlichen Schritte bei der Arbeit mit dem System im Umgang mit Algorithmen aus dem Predictive-Analytics-Bereich, beschrieben ist. Hierbei werden vereinzelt Schritte dargestellt, welche im Umgang mit der SAP HANA- Express Edition über den Prozess unter anderem von der Installation bis zu verwendbaren Ergebnissen, angewandt werden. Im Kapitel Lessons Learned, werden die Ergebnisse, welcher bei der Recherche und der Demo entstanden sind, festgehalten. Hierbei fließen Erkenntnisse aus dem gesamten Prozess, der Vorbereitung und der Anwendung mit ein. Neben den Erkenntnissen, welche sich auf die beschriebenen Kriterien der Beobachtung beziehen, sind im Kapitel Lessons Learned auch die Ergebnisse und Herleitungsbeschreibungen der Laufzeitmessungen, festgehalten. Anhand dessen wird im fünften Kapitel ein Fazit gezogen, worin diese Arbeit zusammengefasst wird und die Forschungsfragen beantwortet werden. Nachfolgend werden die Limitationen beim Erstellen dieser Arbeit beschrieben sowie Anregungen für weitere Forschungen in diesem Bereich geäußert. Das sechste Kapitel ist der Anhang, auf den in dieser Arbeit wiederholt verwiesen wird.

2 Überblick SAP HANA

SAP beschreibt den Namen des Unternehmens, welches die Software entwickelt und zur Verfügung stellt. Die Abkürzung SAP steht für die Begriffe Systeme, Anwendungen und Produkte. Die offizielle Firmenbezeichnung wird um das Akronym SE erweitert, welche die spezifische Rechtsform für Aktiengesellschaften in der Europäischen Union und im Europäischen Wirtschaftsraum bezeichnet.¹⁰ HANA wird als High Performance Analytical Appliance beschrieben, was in Hochleistungsanalyseanwendung übersetzt werden kann.¹¹ SAP HANA ist eine auf Arbeitsspeicher-orientierte DatenbankPlattform, die es ermöglicht, große Datenmengen in Echtzeit zu verarbei- ten.¹² Der Arbeitsspeicher ist verglichen mit der Festplatte ein Medium für die temporäre Speicherung, in dem Daten nicht persistent gehalten werden. Neben dem Begriff Arbeitsspeicher werden in der Literatur auch die Begriffe Hauptspeicher und Random Access Memory (RAM) als Synonyme verwen- det.¹³ Alle Anwendungsfälle, die sich durch das System abbilden lassen, sind auf diese Datenbank-Architektur ausgerichtet, welche Performanzsteigerungen in Big Data Aktivitäten wie Speicherung, Auslesung und Auswertung großer Datenbestände in Echtzeit erreicht. SAP HANA beschleunigt den Geschäftsbetrieb und vereinfacht die IT-Infrastruktur.¹⁴ In vielen verschiedenen Fällen findet das System in der Geschäftswelt Anwendung. Das liegt unter anderem an den Stärken von HANA hinsichtlich Big Data, Internet of Things und Predictive Analytics. Nicht nur der Funktionsumfang macht SAP HANA in der Unternehmenswelt zu einer angesehenen Lösung für die Datenverarbeitung. Auch andere Gründe sprechen für den Einsatz. Das Programm bringt beispielsweise im Vergleich zu anderen Lösungen einen geringeren Total Cost of Ownership (TCO) mit sich. Das macht sich nicht nur bei der anfänglichen Investition bemerkbar, auch die langfristigen Kosten sind vergleichsweise geringer. Die Erneuerung der Hardware ist günstiger, Speicherres- sourcen werden entlastet und der Wartungsaufwand ist sehr gering. Ein weiterer Grund ist, dass das Programm die Gestaltung der IT-Landschaft vereinfacht. HANA verwendet dieselbe Datenkopie für mehrere Anwendungen und reduziert so Komplexität und Redundanz. Aus konzeptioneller Sicht vereinigt es Systeme für die Online-Transaktionsverarbeitung (OLTP) und die analytische Online-Verarbeitung (OLAP). Um den Nutzen zu erhöhen, können zusätzliche und neue Anwendungen einfach und schnell eingeführt werden und kann der Time-to-Market-Zyklus verkürzt werden. Einige Firmen sind auf schnelle und fortschrittliche Analysefunktionen angewiesen, welche einfache Änderungen in den Geschäftsprozessen mit der Geschwindigkeit ermöglicht, mit der sie auf dem Markt auftreten. Unternehmen, die HANA nutzen sind dadurch in der Lage, sich von ihren Mitbewerbern abzuheben. Das Programm unterstützt auch die Minderung von Risiken, da Unternehmen, die schneller auf Änderungen in der Umwelt reagieren können, was in einer immer höher werdenden Frequenz geschieht, zukünftig eine sichere Stellung genießen, da die Anpassung hierbei durch die Potenziale von HANA einfacher gestaltet werden kann.¹⁵ Durch den Einsatz von Integrationsservices bietet das Programm die Verwendung und Verarbeitung diverser Datenquellen, welche sich in ihrem Ursprung und Struktur deutlich unterscheiden können. Ebenso vielseitig sind die Anwendungen, die auf die HANA Datenbank zugreifen können. Die nachfolgende Abbildung verdeutlicht den Anwendungsbezogenen Plattform-Charakter von SAP HANA.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: SAP HANA Plattform

Wie in den beiden untersten Schichten von Abbildung 1 zu sehen ist, decken die Integrationsservices innerhalb der HANA-Architektur die Verarbeitung von Transaktionsdaten, Maschinendaten, Textdaten, HADOP-Daten, Echtzeitdaten, Ortungsdaten und Anwendungsdaten ab. Die beiden Schichten in der Mitte des Models zeigen einen Überblick über die Möglichkeiten, die das System bietet, um mit den importierten Datenbeständen umzugehen. Diese Möglichkeiten setzen sich aus integrierten Engines, Logiken und Algorithmen zusammen, welche nahezu keine moderne Datenverarbeitungsform vernachlässigen. Beispielsweise bietet die Bibliothek für Predictive Analysis Prozeduren viele verschiedene Algorithmen, welche in dieser Arbeit teilweise vertieft erläutert werden. Der Zugriff auf die verarbeiteten Daten erfolgt durch die Datenbanksprachen SQL, SQL-Script und Java-Script, wie in der obersten Schicht des Modells zu sehen ist. Die Plattform stellt ein voll-umfängliches System für den Zugriff, die Verarbeitung und die Bereitstellung unterschiedlichster Arten da.

2.1 Historie von SAP HANA

Früher waren Analysen auf Basis historischer Daten ausreichend. Doch inzwischen ist die Bereitstellung von Analyseergebnissen in Echtzeit ein wichtiger Faktor für die Entscheidungsfindung in Unternehmen. Mit vielen vorhandenen Data-Warehouse-Systemen kann dies jedoch nicht erfüllt werden, da die Zeitspanne, bis die Daten im Data Warehouse und anschließend ausgewertet sind, zu groß ist. Die Auslöser für die Entwicklung von SAP HANA sind die Themen Big Data und In-Memory-Computing.¹⁶ ¹⁷ Mit der Verarbeitung immer größer werdender Datenmengen, steigt auch gleichzeitig die Priorität der Herausforderung, die Leistungsfähigkeit auf den Datenzugriff zu erhöhen. Hierbei wurden primär Optimierungspotenziale für die Geschwindigkeit des Zugriffs auf die Festplatten gesucht. Beispiele für diese Optimierungen sind die Verringerung der Anzahl der Disk Pages, das Einsetzen von Pufferungen, sowie das Bereitstellen angepasster Datenobjekte, für häufig wiederkehrende Abfragen.¹⁸ Die direkte Datenverarbeitung aus dem Hauptspeicher ist keine neue Technologie. Der Hauptspeicher ist ein unentbehrlicher Bestandteil aller bisherigen Rechner-Architekturen. Ohne Hauptspeicher läuft kein Betriebssystem und der Bildschirm bleibt schwarz. Die Funktionalität des Hauptspeichers als notwenige Komponente für das Betreiben eines Rechners wird durch die Verbesserung der Hardware und durch die Entwicklungen von Architekturen von Systemen wie SAP HANA dahingehend erweitert, dass der Hauptspeicher nun große Datenmengen in Bereichen von Terabytes effizient nutzen kann.¹⁹

2.2 Architektonische Merkmale

Laufende HANA-Systeme bestehen aus mehreren, miteinander kommunizierenden Services, welche sich als Schichten in einem Model beschreiben lassen. Die folgende Abbildung zeigt die Datenbankdienste im Anwendungskontext. große Iterationsschleifen sehr schnell verarbeitet werden. Während klassische Anwendungen dazu neigen, mit SQL nur sehr begrenzte Funktionalitäten in die Datenbank auszulagern, ist durch den Einsatz von SQL-Script auch bei großen Anwendungen der Einsatz von viel Logik innerhalb der Datenbank möglich. SQL und SQL-Script werden unter Verwendung einer gemeinsamen Infrastruktur aus integrierten Daten-Engine-Funktionen implementiert, die Zugriff auf verschiedene Meta-Definitionen haben, z. B. Definitionen von relationalen Tabellen, Spalten, Views und Indizes sowie Definitionen von SQL-Script-Prozeduren. Diese Metadaten werden in einem gemeinsamen Katalog gespeichert. Die Datenbank-Persistenzschicht ist für die Dauerhaftigkeit und Atomarität der Transaktionen verantwortlich. Sie stellt sicher, dass die Datenbank nach einem Neustart in den zuletzt festgeschriebenen Zustand wiederhergestellt werden kann und dass Transaktionen entweder vollständig ausgeführt oder vollständig rückgängig gemacht werden. Der IndexServer verwendet den Präprozessor-Server zur Analyse von Textdaten und zur Extraktion der Informationen, auf denen die Textsuchfunktionen basieren. Der Name-Server ist im Besitz der Informationen über die Topologie des SAP-HANA-Systems. In einem verteilten System speichert und verarbeitet der Name-Server Daten darüber, wo die Komponenten laufen und welche Daten sich auf welchem Server befinden. SAP HANA unterstützt ein Framework, welches die Installation spezialisierter und optimierter Funktionsbibliotheken unterstützt, welche eng mit unterschiedlichen Daten-Engines des Index-Servers integriert sind. Drei dieser Funktionsbibliotheken sind die Business Function Library (BFL) die Predictive Analysis Library (PAL) und die Automated Predictive Library (APL). BFL, PAL und APL Funktionen können direkt aus SQL-Script heraus aufgerufen werden. Sie werden im Kapitel Datenauswertung vertieft beleuchtet. SAP HANA unterstützt auch die Entwicklung von Programmen, die in der Sprache R geschrieben sind. ²⁰ ²¹

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: SAP HANA Architektur

Bei SAP HANA handelt es sich wie zu vor beschrieben um eine In-Memory- Plattform. Der wesentliche Unterschied zu anderen Plattformen oder Datenbankmanagementsystemen liegt hierbei darin, dass die Daten in einer für die Verarbeitung optimierten Form in den Hauptspeicher geladen werden, sodass auf redundante Datenhaltung oder Caching-Mechanismen bei Analysen von Daten, die nicht zu lange in der Vergangenheit liegen, verzichtet werden kann. Bei der Hauptspeicherorientierung der Daten wird eine deutlich schnellere Durchsuchung, Aggregierung und Analyse von Daten erreicht, als das bei der Datenhaltung auf gängigen Festplattenspeichern möglich ist. Reguläre Ansätze von Festplatten werden innerhalb dieser Architektur ausschließlich für die Datensicherung und -wiederherstellung verwendet. Es gibt zwar eine ganze Reihe an Datenbankseitigen Optimierungsmaßnahmen mit dem Zweck der Performanz-Steigerung, jedoch gibt es gegenwärtig ebenso weitläufige Konfigurationen des Arbeitsspeichers. Ein Aspekt hierbei ist die wachsende Orientierung der Hersteller von Computerchips auf Multicore CPU’s und die Realität von Server-Architekturen, welche auf große Hauptspeicher ausgerichtet sind. Der Leistungsengpass liegt bei den In-Memory Architekturen beim Ladevorgang der Daten aus dem Hauptspeicher in den CPU-Cache, und weniger, bei der Durchführung des Zugriffs auf die Festplat- te.²² Die folgende Abbildung zeigt den Aufbau und die gegebenen Leistungsengpässe Neben der Orientierung auf die Nutzung des Hauptspeichers finden sich in der Architektur eine Reihe weiterer technischer Innovationen, die intelligent miteinander verknüpft sind, sodass eine hohe Performanz hinsichtlich vieler Nutzungspotenziale erreicht wird. Hierzu gehört die Auswahl einer Dimension von Daten bei der Verarbeitung in HANA. Datentabellen sind zweidimensional. Sie besitzen Zeilen und Spalten. Weil der Datenfluss in den Arbeitsspeicher auf lineare, eindimensionale Datenstrukturen ausgerichtet ist, werden die Daten im Integrationsprozess entweder in eine Zeilenorientierte Form oder in eine Spaltenorientierte Form umgewandelt. Der Benutzer hat beim Datenimport die Möglichkeit, seine Präferenz der Datenspeicherung festzulegen. Die folgende Abbildung zeigt den Importdialog mit der Auswahlmög lichkeit der Datenhaltung einer CSV-Datei aus dem BRAVO-Data Business- Case, welcher im Anhang beschrieben ist.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3: Leistungsengpässe Hauptspeicher- und Festplattenzugriff (Angepasste Darstellung in Anlehnung an Prassol)

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 4: CSV-Importdialog

Die Auswahl der Art der Speicherung in Spalten- oder Zeilenorientierter Form muss nicht zwangsläufig beim Importieren der Daten wie im Fenster von Abbildung 4 passieren. Es lassen sich auch Einstellungen über bereits vorhandene Datenbestände zwecks der Speicherart vornehmen. Auch lassen durch SQL-Befehle Tabellen erstellen, welche gezielt eine Auswahl treffen, wo nach dem Create Befehl noch die Worte Coloumn Store oder Row Store vor dem Tabellenname gemäß SQL eingefügt werden. Wenn keine Einstellungen vorgenommen werden, sind die Daten standardmäßig in der spaltenorientieren Form abgelegt.

Die nachfolgende Abbildung zeigt exemplarisch, wie eine zweidimensionale Tabelle in eine eindimensionale Tabelle umgewandelt wird.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 5: Umwandlung der Tabellen am Beispiel von BRAVO Product Attr. (Angepasste Darstellung in Anlehnung Prassol)

Bei der zeilenorientierten Form der Datenlagerung übertragen sich die Daten sequenziell. Hierbei hat jeder Eintrag eine Information aus jeder Spalte. Bei der spaltenorientierten Form der Datenlagerung wird jede Spalte nacheinander und vollständig in aufeinanderfolgenden Einheiten im Computerspeicher abgelegt. In gewöhnlichen DBMS wird die Datenablage zeilenorientiert organisiert. Klassische, Festplattenspeicher-orientierte Datenbanken profitieren von der zeilenorientierten Datenablage, da die Performanz hier im Wesentlichen von der Geschwindigkeit der Verarbeitung innerhalb der CPU liegt, wo die zeilenorientierte Form gegenüber der spaltenorientierten Form Vorteile hat. Die Spaltenorientierte Form bringt eine Reihe von Vorteilen hinsichtlich der Laufzeit gegenüber der zeilenorientierten Form, insofern es sich um eine Arbeitsspeicher-orientierte Datenbank handelt.

- Die Beschränkung der für Berechnungen notwendigen Spalten lässt sich vornehmen.
- Die Tabellen werden basierend auf Ausprägungswerten weniger Spalten durchsucht.
- Daten können bei geeigneter Struktur stärker komprimiert werden, da der Faktor für Komprimierungen steigt, wenn die Ausprägungswerte der Spalten geringere Unterschiede haben.
- Die implizite Erstellung eines Indexes für jede Spalte macht eine zusätzliche Indexbildung überflüssig.

Diese Vorteile der spaltenorientierten Datenablage resultieren in einer hohen Performanz für die Durchsuchung von Anwendungen.25 Nicht nur hinsichtlich des Arbeitsspeichers, weist das System gegenüber anderen Datenbankmanagementsystemen einen Performanz-Vorteil auf. Auch die Verarbeitung im Prozessor hat in der HANA-Architektur einen Vorteil. HANA wurde konzipiert, um grundlegende Berechnungen wie analytische Joins, Scans und Aggregationen parallel durchzuführen. Das System nutzt für diese Form der parallelen Verarbeitung auch bei verteilten Systemen die Rechenleistung aus, sodass Gegebenheiten wie viel Arbeitsspeicher und eine große Menge an CPU-Kernen für die Datenauswertung einen vernehmbaren Effekt auf die Geschwindigkeit haben. Bei Verwendung der Spaltenorientierung können die Operationen auf Daten der einzelnen Spalten angewendet werden, wie beispielsweise Suchen, Aggre- gationen oder als Schleife über ein Array, das in zusammenhängenden Speicherplätzen gespeichert ist. Derartige Operationen sind bei gegebener Spaltenorientierung sehr effizient in der Verarbeitung innerhalb des CPU-Caches. Bei zeilenorientierter Speicherung sind dieselben Operationen deutlich langsamer, da die Daten derselben Spalte über den Speicher verteilt sind und die CPU durch Cache-Misses verlangsamt wird. Bei der Spaltenorientierung sind die Daten vertikal partitioniert, was zur Folge hat, dass Operationen auf verschiedenen Spalten leicht parallel verarbeitet werden. Wenn mehrere Spalten durchsucht oder aggregiert werden müssen, kann jede dieser Operationen einem anderen Prozessorkern zugeordnet werden. Darüber hinaus können Operationen auf einer Spalte parallelisiert werden, indem die Spalte in mehrere Abschnitte unterteilt wird, die von verschiedenen Prozessorkernen verarbeitet werden kön- nen.²³ ²⁴ ²⁵ ²⁶

2.3 SAP HANA Express-Edition

Die SAP HANA Express-Edition (HXE) ist eine in seiner Verwendbarkeit beschränkte Einstiegsversion von SAP HANA, die für die Ausführung auf einem persönlichen Laptop oder Desktop-Computer, auf einem Server oder in der Cloud optimiert ist. Die HXE lässt sich als Installationspaket auf einem Computer mit Linux-Betriebssystem oder als virtuelle Maschine in allen Computern, welche einen Hypervisor ausführen können, installieren und ausführen. Weiterhin sind die grundlegenden Hardware-Ressourcen des Computers oder des Servers, auf dem die HXE laufen soll, ein Kriterium für die Verwendbarkeit, welche in Kapitel drei im Abschnitt der Installation vertieft werden. Es können mit der HXE Anwendungen im Bereich von bis zu 32GB Speichervolumen kostenlos entwickelt werden. Bei Bedarf ist es möglich, schrittweise, entgeltlich mehr Speichervolumen bis zu 128 GB Speichervolumen zu buchen. Die HXE ist in ihrem Funktionsumfang zwar sehr vielfältig, verglichen mit der Vollversion jedoch begrenzt. Bei Bedarf von Funktionen, welcher nur in der Vollversion verfügbar sind, lässt sich eine Lizenz erwerben, welche einen fließenden Übergang von der HXE zur Vollversion ermöglicht. Ein Beispiel für eine ergänzende Funktion der Vollversion ist das intelligente Datenstreaming bzw. Smart Data Integration.²⁷

2.3.1 Datenauswertungsfunktionalität

SAP HANA bietet eine Plattform für viele Anwendungen der Datenauswertung. Die HXE ermöglicht die Durchführung für alle Prozeduren innerhalb der limitierten Rahmenbedingungen. Die Datenauswertungsfunktionalität lässt sich in die folgenden Domänen untergliedern:

Data Modeling and Analytics Die Möglichkeiten, welche dieser Domäne zugeordnet sind, lassen sich als analytische Verarbeitungsmodule und erweiterte Datenscheiben, beschreiben, die innerhalb der HANA-DB verwendbar sind. Es lassen sich Ansichten definieren, welche Informationen über die Kombination von vorhandenen Attributen und Kennzahlen aus Transaktions- und Analysedaten beinhalten. Es können hierbei auch bekannte Datenbankspezifische Operationen wie Joins, Aggregationen und Filter getätigt werden mit dem Ergebnis einer neuen Berechnung. Die Daten lassen sich in der Verwendung unter der Visual-Ansicht in graphische Darstellungen anzeigen.

Microservices innerhalb SAP HANA XS Advanced Applications Die Domäne Microservices beschreibt eine Schnittstelle, welche es ermöglicht, nach dem Ansatz von Micro-Services Code an das Programm einzubinden, welcher spezielle, selbsterstellte Funktionalität erfüllt. Hierbei decken die Sprachen Python, Node.js und Java die Standardsprachen für die Microservices ab. Je nach Konfiguration, der von der SAP bereitgestellten BuildPacks lassen sich auch Programme, die in anderen Sprachen programmiert sind, implementieren.

Machine Learning Innerhalb der Machine Learning Domäne können Anwendungen erstellt werden, welche regelbasierte und sich wiederholende Prozesse automatisieren und sich fortlaufend optimieren lassen. Die Machine-Learning-Anwendungen lassen sich hierbei mithilfe XS Advanced und SQL entwickeln.

Geospatial Dieser Domäne sind die Speicherung, Verarbeitung und Visualisierung von speziellen Geodaten, zugeordnet. Hierbei können die erfassten Geodaten mit anderen Daten integriert, gespeichert und weiterverarbeitet werden.

Text Analytics Innerhalb dieser Domäne befinden sich Such-, Textanalyse- und Text-Mining Funktionen für unstrukturierte Textquellen.

Predictive Analytics Innerhalb dieser Domäne befindet sich die Anwendungsbibliothek für Predictive Analytics Algorithmen. Hierbei gibt es durch den Import der Predictive Analysis Library (PAL) eine Verfügbarkeit von einigen unterschiedlichen Algorithmen für vorhersagende Werte für Daten. Dazu gehören Algorithmen der Klassifizierungskategorien Regression, Zeitreihen für die Vorhersage und Erkennung von Ausreißern sowie Datenaufbereitung.

SAP HANA Sreaming Analytics Die Domäne Streaming Analytics erweitert die Plattform um hochleistungsfähige Ereignisstromverarbeitung und Complex Event Processing (CEP). Diese Integration ermöglicht smart-stream-capture und aktive Ereignisüberwachung. Ein weiteres Feature ist die Echtzeit-Streaming-Analyse, mit der die Erstellung von IoT-Anwendungen möglich wird.

Hibernate Diese Domäne ermöglicht die multimodale Analyse. Der Funktionsumfang reicht unter dieser Domäne von Text- und Raumdaten über Hibernate Dialekte, Abstraktionsschichten, Dokumentenspeicher und Grafiken bis zu XMLMapping. Hierbei gibt es für relationale Datenbanken die Bibliothek Hibernate ORM und für nicht-relationale Ansätze die Bibliothek Hibernate OGM.²⁸

Damit die Funktionen unterhalb der Domänen innerhalb der HXE verwendet werden können, sind unterschiedliche Schritte für die Installation, Konfiguration und Einbindung von Schnittstellen und Bibliotheken notwendig.

2.3.2 Application Function Library (AFL)

Die Application Function Library beschreibt ein Archiv, welche mehrere Funktionsbibliotheken beinhaltet. Dazu gehören beispielsweise die Automated Predictive Library (APL), die Business Function Library (BFL) oder die Predictive Analysis Library (PAL). Die Application Function Library ist nach der Installation kein Teil der HANA Appliance, wenn die AFL nicht explizit installiert wird. Eine proaktive Möglichkeit ist die Auswahl der Installation von Server + Application. Die AFL kann auch seperat vom Administrator beziehungsweise vom angemeldeten Datenbank-Master User installiert werden.²⁹ ³⁰ Die nachfolgende Abbildung beschreibt den Sachverhalt der Application Function Library und die Zugehörigkeit der Funktionsbibliotheken.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 6: SAP HANA Architektur, Application Function Library

2.3.3 Predictive Analysis Library (PAL)

SAP liefert entsprechend den beschriebenen Domänen verschiedene Bibliotheken für die Datenauswertung. Darunter fällt die Predictive Analysis Library, welche Funktionen definiert, die aus SQL-Script-Prozeduren heraus aufgerufen werden können, um vorhersagende, analytische Algorithmen auszuführen. Die Prozeduren können auch aus dem Application Function Modeler heraus aufgerufen werden, was nachfolgend theoretisch beschrieben, und im Kapitel drei dieser Arbeit anhand mehrerer Anwendungsbeispiele praktisch nachvollziehbar ist. Die Auswahl der Algorithmen für die PAL wird auf Basis verschiedener Kriterien entschieden. Hierzu zählen beispielsweise die Notwendigkeit für Anwendungen, Verbreitung in der Verwendung sowie die Verwendung in anderen Datenbankprodukten von beispielsweise anderen Herstellern. Die in der PAL enthaltenen Algorithmen werden in unterschiedliche Kategorien aufgeteilt, welche einige Algorithmen der gleichen Domäne beinhalten. Hierzu zählen aktuell die Kategorien Clustering, Classification /Regression, Association Rules, Time Series Analysis, Preprocessing, Statistics, Social Network Analysis und Miscellaneous.

2.3.4 Application Function Modeler (AFM)

Der SAP HANA Application Function Modeller (AFM) oder ist ein grafischer Editor, mit dem Anwendungsfunktionen erstellt werden können. Mit dem AFM können auf benutzerfreundliche Weise Funktionen der importierten Bibliotheken zur AFM-Modelldatei hinzugefügt werden, Parameter- sowie Ein- und Ausgabetabellen durch Textfelder der Funktion zugeordnet werden. Aus den angegebenen Daten und Funktionen lassen sich Prozeduren generieren, ohne SQL-Script oder SQL-Abfragen manuell schreiben zu müssen. Der AFM ist nach der Installation, welche im folgenden Kapitel erläutert wird, in der SAP HANA Entwicklungsperspektive aufrufbar. Es gibt im AFM drei Ansichten. Ein grafischer Bearbeitungsbereich zum Hinzufügen und Verbinden von Anwendungsfunktionen für die gewollten Verfahren. Hierin können Elemente per Drag & Drop eingefügt und miteinander verbunden werden. Eine weitere Ansicht ist ein Textfenster, in dem der SQL-Script Code der vorgenommenen Einstellungen der Anwendungsfunktionen automatisch generiert wird. Für spezielle Änderungen kann hierin der Code angepasst werden. Der Code kann in diesem Fenster auch kopiert werden und beispielsweise für andere Programme verwendet werden, welche die SQL-Script Sprache unterstützen. Des Weiteren gibt es eine Funktionsansicht oder auch Palette genannt, welche die SAP HANA Anwendungsfunktionen innerhalb ihrer Kategorien auflistet. Diese lassen sich mit Drag & Drop in der grafischen Bearbeitungsansicht in das Modell ziehen und hinsichtlich ihrer Daten, Datentypen und Parameter bearbeiten. Je nach Benutzeroberfläche wird der Application Function Modeler auch als Flowgraph Modeller bezeichnet, wie bei der SAP HANA WEB IDE. 31

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 7: Flowgraph Model, Application Function Modeler

Im Rechten Teil der Abbildung ist zu sehen, dass unter Palette neben der Sparte General, welche die generellen Datenmodell und Datenverbindungsoperationen wie beispielsweise Join, Filter und Union beinhaltet, auch die Predictive Analysis Library zu sehen ist. Der hervorgehenden Importschritte durch die nachfolgend beschriebenen SQL-Befehle, haben dies zur Folge. Die folgenden Abbildungen zeigen die Übersicht über die verfügbaren Funktionen der Importieren Bibliotheken.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 8: Funktionsansicht mit General, BFL und PAL

3 Demo - Reporting und Datenaufbereitung mit SAP HANA - Express Edition

In dieser Demo wird der Prozess von der Installation der HXE, über die Verbindung zum Front-End, den Import von Daten bis zu vorhandenen Ergebnissen von ausgewählten Algorithmen aus der Predictive Analysis Library, beschrieben. Hierbei werden verschiedene Aspekte aufgegriffen, welche für die im späteren Kapitel der Ergebnisse von Relevanz bezüglich der Forschungsfrage sind. Beschrieben wird nachfolgend die Systemumgebung, welche bei Fragen hinsichtlich der Performanz gemessen in Laufzeit eine zentrale Rolle spielt, da eine andere Hardware auch andere Ergebnisse erzielen kann. Weiterhin wird in diesem Kapitel die Installation und Einrichtung der Systeme beschrieben, sodass dieser Prozess ebenfalls auf die beschriebenen Bewertungskriterien untersucht werden kann. Es werden nachfolgend die Vorgehensweisen bei der Verwendung und Ausführung der ausgewählten Algorithmen Auto Arima in Verbindung mit Arima Forecast und K-Means beschrieben, woraus sich die Erkenntnisse zur Beantwortung der Forschungsfrage ableiten.

3.1 Umgebung und Einrichtung der Systeme

Damit die SAP HANA Express-Edition in der VM auf einem Rechner installiert und betrieben werden kann, werden für die Server-only-VM 8 GB, und für die Server+Application VM 16 GB Arbeitsspeicher als Mindestvoraussetzung benötigt. Es wird JRE 8 (64-bit for Windows/Linux) benötigt, welche den Download-Manager unterstützt. Damit das funktioniert, muss die Systemvariable JAVA_HOME mit dem Path für das JRE hinterlegt werden. Eine korrekte Path-Angabe sowie die Auswahl der richtigen Java-Version zum Zeitpunkt der Installation ist hierbei von entscheidender Bedeutung, damit der Download Manager der SAP HXE gestartet werden kann. Es werden für beide Installationsvarianten mindestens 120 GB HDD Speicher sowie 2 reale Cores mit 4 logischen Cores in der CPU benötigt.

3.1.1 Installation von SAP HANA Express-Edition

Die Installationsdatei, mit der Bezeichnung SAP HANA, Express Edition Download Manager wird von SAP auf der entsprechenden Webseite kostenlos zur Verfügung gestellt.³¹ ³²

Wenn die Systemumgebung gemäß den Spezifikationen für die Installation eingestellt wurde, lässt sich der SAP HANA, Express Edition Download Manager starten. Nach dem Doppelklick auf den Download Manager öffnet sich das folgende Fenster.

[...]

¹ Vgl. Haupt unter: https://medium.com/project-2030/data-is-the-new-oil-a-ludicrous- proposition-1d91bba4f294 Zugriff am 10.08.2020

² Vgl.https://www.wirtschaftsdienst.eu/pdf- download/jahr/2018/heft/7/beitrag/datenkapitalismus-eine-oekonomische-betrachtung.html Zugriff am: 10.08.2020

³ Vgl. https://de.statista.com/statistik/daten/studie/814982/umfrage/umfrage-zur-auswirkung- der-digitalisierung-auf-den-umsatz-deutscher-untemehmen/_Zugriff am: 10.08.2020

⁴ Vgl. https://de.statista.com/statistik/daten/studie/259969/umfrage/umsatz-mit-business- intelligence-und-analytics-software-weltweit/ Zugriff am: 10.08.2020

⁵ Vgl. https://de.statista.com/statistik/daten/studie/780780/umfrage/umsatz-mit-big-data-und- analytics-software-weltweit/ Zugriff am: 26.08.2020

⁶ Vgl. https://news.sap.com/germany/2015/09/ist-eigentlich-sap-hana/_Zugriff am: 10.08.2020

⁷ https://de.wikipedia.org/wiki/Predictive_analytics_Zugriff am: 10.08.2020

⁸ Vgl. https://de.statista.com/statistik/daten/studie/529006/umfrage/bedeutung-von- predicitve-analytics-fuer-den-online-handel-in-deutschland/_Zugriff am: 10.08.2020

⁹ https://www.sap.com/cmp/td/sap-hana-express-edition.html Zugriff am: 16.08.2020

¹⁰ Vgl. Aschermann: Über SAP - was heißt das?: Unter https://praxistipps.chip.de/sap-was- heisst-das-die-abkuerzung-einfach-erklaert_50511 Zugriff am 16.05.2020

¹¹ Vgl. https://de.wikipedia.org/wiki/SAP_HANA Zugriff am 26.08.2020

¹² Vgl. Fröschle et al. 2016, S.200

¹³ Vgl. Preuss 2017, S.133

¹⁴ Vgl. Preuss 2017, S.2

¹⁵ Vgl. Preuss 2017, S.7

¹⁶ Vgl. Prassol 2015, S.362

¹⁷ Vgl. Preuss, 2017, S.133

¹⁸ Vgl. Fasel et. al, 2016, S.199

¹⁹ Vgl. Fasel et. al, 2016, S.201

²⁰ Vgl. SAP SE, 2014, S.14

²¹ Vgl. SAP SE, 2014, S.14

²² Vgl. Prassol, 2015, S. 363

²³ Vgl. Prassol, 2015, S. 363

²⁴ Vgl. Prassol, 2015, S.65

²⁵ Vgl. Prassol, 2015, S.365

²⁶ Vgl. SAP SE, 2014, S.12

²⁷ Vgl. SAP SE, 2016, S 1ff.

²⁸ Vgl. SAP: SAP HANA unter: https://www.sap.com/germany/products/hana/features/app- development.html Zugriff am 15.06.2020

²⁹ Vgl. SAP: https://help.sap.com/viewer/aa94b47610d545f28dd90711580350d6/2.0.00/en- US/1075a25a03c349d18b36be9ab6de02cc.html: Zugriff am 20.06.2020

³⁰ Vgl. SAP SE unter: https://blogs.sap.com/2015/03/02/what-is-the-sap-automated-

³¹ predictive-library-apl-for-sap-hana/ Zugriff am 15.08.2020

³² Vgl. SAP SE unter: https://www.sap.com/cmp/td/sap-hana-express-edition.html Zugriff am: 19.08.2020

Ende der Leseprobe aus 107 Seiten

Details

Titel: Predictive Analytics Lösungen für Datenauswertungen mit SAP HANA Express-Edition im Hochschulbetrieb
Hochschule: Hochschule Furtwangen
Note: 1,7
Autor: Julius Dold (Autor:in)
Jahr: 2020
Seiten: 107
Katalognummer: V961362
ISBN (eBook): 9783346331762
Sprache: Deutsch
Schlagworte: Predictive Analytics, Big Data, SAP HANA, SAP HANA Express Edition

Arbeit zitieren: Julius Dold (Autor:in), 2020, Predictive Analytics Lösungen für Datenauswertungen mit SAP HANA Express-Edition im Hochschulbetrieb, München, GRIN Verlag, https://www.grin.com/document/961362

Kommentare

Noch keine Kommentare.

Predictive Analytics Lösungen für Datenauswertungen mit SAP HANA Express-Edition im Hochschulbetrieb

Bachelorarbeit, 2020

107 Seiten, Note: 1,7

Julius Dold (Autor:in)

Inhaltsverzeichnis

Abstract

Abbildungsverzeichnis

Tabellenverzeichnis

Abkürzungsverzeichnis

1 Einleitung

1.1 Motivation und Ziel dieser Arbeit

1.2 Aufbau der Arbeit

2 Überblick SAP HANA

2.1 Historie von SAP HANA

2.2 Architektonische Merkmale

2.3 SAP HANA Express-Edition

2.3.1 Datenauswertungsfunktionalität

2.3.2 Application Function Library (AFL)

2.3.3 Predictive Analysis Library (PAL)

2.3.4 Application Function Modeler (AFM)

3 Demo - Reporting und Datenaufbereitung mit SAP HANA - Express Edition

3.1 Umgebung und Einrichtung der Systeme

3.1.1 Installation von SAP HANA Express-Edition

Ähnliche Arbeiten

Big Data In-Memory Analytics explained by SAP HANA

Entwicklungsziele und Strategieziele der SAP HANA

Datenverarbeitung mit der SAP HANA In-Memory-Plattform der SAP

Predictive Analytics im Bereich Human Resources. Chancen und Hürden für die P...

Predictive Analytics im Finanzcontrolling. Ist der Einsatz von Predictive Ana...

Predictive Analytics im Controlling deutscher Unternehmen. Auswirkungen auf P...

Einsatz von Predictive Analytics im Controlling. Grundlagen und Definitionen

Evaluierung von Nutzen und Einsatzmöglichkeiten von Predictive Analytics in a...

Auswirkungen der Umstellung eines SAP Business Warehouse auf SAP HANA

Predictive Analytics als Data-Mining-Verfahren in der Industrie 4.0. Gute Dat...

Predictive Analytics im Controlling

Relevanz und Bewertungskriterien für Predictive Analytics Tools im Customer R...

Predictive-Analytics-Methoden im Business-to-Business-Vertrieb. Konvergierend...

Predictive Analytics im Controlling. Grundlagen, Nutzenpotenziale und praktis...

Künstliche Intelligenz im Marketing. Predictive Analytics zur Vorhersage von ...

Zahlungsorientierte Finanzplanung mit Hilfe von Predictive Analytics

Predictive Analytics. Nutzungspotential im Forecasting und die Rolle des Cont...

Nutzungspotentiale von Predictive Analytics für das Controlling im Rahmen der...

Erfolgsfaktoren von Business-Intelligence-Technologien: Eine empirische Studie