Get fresh updates from Hortonworks by email

Once a month, receive latest insights, trends, analytics, offering information and knowledge of the Big Data.

cta

Erste Schritte

Cloud

Sind Sie bereit?

Sandbox herunterladen

Wie können wir Ihnen helfen?

SchließenSchaltfläche „Schließen“
cta

Apache Hadoop Data Warehouse-Architektur
zur EDW-Optimierung

Kostenreduzierung durch Übertragung von Daten auf Hadoop®

Cloud Hortonworks is a leader. Read the Forrester Wave.

DOWNLOAD Report

Was ist ein EDW?

Das Enterprise Data Warehouse (EDW) ist der zentrale Datenspeicher eines Unternehmens, der dazu dient, Geschäftsentscheidungen zu unterstützen. Das EDW enthält Daten zu Bereichen, die das Unternehmen analysieren möchte. Für einen Hersteller können das Daten zum Kunden, zum Produkt oder zu einer Stückliste sein. Das EDW wird erstellt, indem Daten aus mehreren Betriebssystemen extrahiert werden. Bei der Einspeisung der Daten ins EDW werden sie konvertiert, neu formatiert oder zusammengefasst, damit das Unternehmen eine einheitliche Ansicht erhält. Die Daten werden im Laufe der Zeit in Form von Schnappschüssen zum Data Warehouse hinzugefügt. In der Regel enthält ein EDW Daten aus einem Zeitraum von 5 bis 10 Jahren.

EDW-Optimierung

Probleme mit einem typischen EDW

Die Datenarchitekturen von Unternehmen umfassen heute standardmäßig ein Enterprise Data Warehouse. Allerdings leidet die Effizienz bestehender EDW-Lösungen unter dem Umfang und der Komplexität neuer Datenströme.

Ob das transformative Potenzial von Big Data ausgeschöpft wird, hängt maßgeblich davon ab, ob ein Unternehmen bei der Verarbeitung dieser komplexen Daten richtig vorgeht und dabei Datenquellen verschiedener Art – aus sozialen Netzwerken, dem Internet, dem iOT und mehr – verwendet. Die Integration neuer Datenquellen in bestehende EDW-Systeme ermöglicht es Unternehmen, tiefgreifendere Analysen durchzuführen und so aussagekrätigere Einblicke zu erlangen. Vor allem aber gelingt es herkömmlichen EDW-Technologien immer weniger, die Brücke zwischen Kosteneffizienz und optimaler Leistung, Skalierbarkeit und Flexibilität zu schlagen.

Lösungselemente

Hortonworks Data Platform

*

Hadoop bietet Ihnen leistungsstarke Open-Source-Funktionen zur Optimierung von Daten-Governance, Datenzugriff, Sicherheit und Betriebsabläufen, die speziell für eine nahtlose Integration mit Ihren bestehenden Rechenzentrumstechnologien konzipiert wurden. Mehr erfahren

Syncsort

*

Leistungsstarke ETL-Software für einen einfachen Zugriff und ein problemloses Onboarding traditioneller Unternehmensdaten auf HDP. Mehr erfahren

AtScale

*

Die Hadoop-Benutzeroberfläche für Unternehmen bietet eine schnelle Business-Intelligence-Lösung (BI), um es Unternehmensnutzern zu ermöglichen, ihre Daten optimal zu nutzen. Mehr erfahren

Professional Services

*

Unsere Experten stehen Ihnen mit Rat und Tat zur Seite, damit Sie im Handumdrehen von den Vorteilen Ihrer neuen Architektur profitieren und den Mehrwert der vollständig getesteten und validierten Hortonworks-Lösung zur Optimierung von Datenarchitekturen maximal ausschöpfen können. Mehr erfahren

Optimierung des EDW mit Apache Hadoop ®

Flexibel

*

Daten können in HDP geladen werden, ohne dass ein Datenmodell erforderlich ist

*

Datenmodell lässt sich anhand der von den Daten gestellten Fragen anwenden (Schema-on-Read)

*

HDP wurde entwickelt, um Fragen zu beantworten, sobald sie beim Benutzer auftreten

Effizient

*

100 % der Daten stehen detailliert für die Analyse zur Verfügung

*

HDP kann sowohl strukturierte als auch unstrukturierte Daten speichern und analysieren

*

Daten lassen sich auf vielfältige Art und Weise analysieren (Unterstützung unterschiedlicher Anwendungsfälle)

Kosteneffizient

*

HDP (Hortonworks Data Platform) ist 100 % offen – es fällt keine Lizenzgebühr für Software an

*

HDP läuft auf Standard-Hardware

*

Neue Daten lassen sich in HDP ablegen und in Tagen oder sogar Stunden nutzen

Anwendungsfälle mit EDW-Optimierung

ANWENDUNGSFALL 1
media img

Schnelle Business-Intelligence mit Hadoop

Proprietäre EDW-Systeme wurden als schnelle Business-Intelligence- und detaillierte Analytics-Lösungen konzipiert. Allerdings sind die Kosten solcher Systeme auf Dauer zu hoch, ganz zu schweigen davon, dass sie aktuellen Herausforderungen auf dem Gebiet von Big Data, etwa in Bezug auf unstrukturierte Daten oder Analytics in großem Umfang, nicht gewachsen sind.

Mit Hortonworks wird schnelle Business-Intelligence zur Realität: Wir kombinieren eine schnelle, in den Datenspeicher integrierte SQL-Engine zur Erstellung von Data Marts mit einer Engine zur Erstellung von OLAP-Würfeln, damit Sie auch umfangreiche Datensätze in Sekundenschnelle durchsuchen können. So haben Sie die Möglichkeit, voraggregierte Daten mit maximaler Leistung in Rekordschnelle zu durchsuchen oder eine verlustfreie Suche durchzuführen, wenn Sie eine detailliertere Analyse wünschen. Der Zugriff ist über sämtliche gängigen BI-Tools möglich, die ODBC, JDBC oder MDX unterstützen.

Mehr erfahren

ANWENDUNGSFALL 2
media img

ONBOARDING VON ETL-PROZESSEN AUF HADOOP

Ein herkömmliches EDW-System verbringt zwischen 45 und 60 Prozent seiner CPU-Zyklen mit der ETL-Verarbeitung. Diese vergleichsweise unwichtigen ETL-Aufgaben verbrauchen wertvolle Ressourcen, was unter Umständen zu SLA-Verstößen führen kann, wenn unternehmenskritische Workloads nicht durchgeführt werden können. Diese ETL-Aufgaben können mit minimalem Migrationsaufwand und zu wesentlich geringen Kosten auf Hadoop übertragen werden, wodurch Sie nicht nur Geld sparen, sondern auch Ressourcen für wichtigere Analyse-Workloads freigeben. Dank anwenderfreundlicher und leistungsstarker ETL-Tools, einem SQL-Engine und Integrationen mit sämtlichen großen BI-Anbietern ist Hortonworks die richtige Wahl für jedes Unternehmen.

Mehr erfahren

ANWENDUNGSFALL 3
media img

DATEN IN HADOOP ARCHIVIEREN

Angesichts stetig wachsender Datenmengen und immer höheren Kosten sehen sich viele Unternehmen gezwungen, alte Daten auf Magnetbändern zu archivieren – allerdings macht dies Analysen zu einem späteren Zeitpunkt geradezu unmöglich oder zumindest äußerst kostspielig.

Mit Hadoop zahlen Sie pro Terabyte genauso viel wie für ein Magnetband. Dieses unschlagbare Preis-Leistungs-Verhältnis ermöglicht es Ihnen, Jahre statt Monaten an Daten ohne zusätzliche Kosten zu speichern. Alle Ihre Unternehmensdaten können mithilfe derselben Tools, die Sie bereits aus traditionellen EDW-Systemen kennen, zu jeder Zeit aufgerufen, durchsucht und bis ins kleinste Detail analysiert werden

Mehr erfahren