Get fresh updates from Hortonworks by email

Once a month, receive latest insights, trends, analytics information and knowledge of Big Data.

cta

Erste Schritte

Cloud

Sind Sie bereit?

Sandbox herunterladen

Wie können wir Ihnen helfen?

SchließenSchaltfläche „Schließen“
cta

Apache Hadoop Data Warehouse Architecture for EDW Optimization

Reduce Costs by Moving Data and Processing to Hadoop®

Cloud Hortonworks ist ein führendes Unternehmen. Lesen Sie die Forrester Wave.

Bericht herunterladen

Was ist ein EDW?

Enterprise Data Warehouse (EDW) is an organization’s central data repository that is built to support business decisions. EDW contains data related to areas that the company wants to analyze. For a manufacturer, it might be customer, product or bill of material data. EDW is built by extracting data from a number of operational systems. As the data is fed into EDW it is converted, reformatted and summarized to present a single corporate view. Data is added into the data warehouse over time in the form of snapshots and normally an enterprise data warehouse contains data spanning 5 to 10 years. A Hadoop data warehouse architecture enables deeper analytics and advanced reporting from these diverse sets of data.

EDW-Optimierung

Probleme mit einem typischen EDW

The Enterprise Data Warehouse has become a standard component of the corporate data architectures. However, the complexity and volume of data has posed some interesting challenges to the efficiency of existing EDW solutions.

Realizing the transformative potential of Big Data depends on the corporations’ ability to manage complexity while leveraging data sources of all types such as social, web, IoT and more. The integration of new data sources into the existing EDW system will empower corporations more and deeper analytics and insights. More importantly, EDW optimization using Hadoop provides a highly cost-efficient environment with optimal performance, scalability and flexibility.

Lösungselemente

Hortonworks Data Platform

*

Powerful open Hadoop data warehouse architecture with capabilities for data governance and integration, data management, data access, security and operations—designed for deep integration with your existing data center technology. Learn More

Syncsort

*

EDW offload to Hadoop - High-performance ETL software to access and easily onboard traditional enterprise data to HDP. Learn More
 
 

Professional Services

*

Unsere Experten stehen Ihnen mit Rat und Tat zur Seite, damit Sie im Handumdrehen von den Vorteilen Ihrer neuen Architektur profitieren und den Mehrwert der vollständig getesteten und validierten Hortonworks-Lösung zur Optimierung von Datenarchitekturen maximal ausschöpfen können. Mehr erfahren

EDW optimization with Apache Hadoop ®

Flexibel

*

Data can be loaded in HDP without having a data model in place

*

Datenmodell lässt sich anhand der von den Daten gestellten Fragen anwenden (Schema-on-Read)

*

HDP wurde entwickelt, um Fragen zu beantworten, sobald sie beim Benutzer auftreten

Effizient

*

100 % der Daten stehen detailliert für die Analyse zur Verfügung

*

HDP kann sowohl strukturierte als auch unstrukturierte Daten speichern und analysieren

*

Daten lassen sich auf vielfältige Art und Weise analysieren (Unterstützung unterschiedlicher Anwendungsfälle)

Kosteneffizient

*

HDP (Hortonworks Data Platform) ist 100 % offen – es fällt keine Lizenzgebühr für Software an

*

HDP läuft auf Standard-Hardware

*

Neue Daten lassen sich in HDP ablegen und in Tagen oder sogar Stunden nutzen

Anwendungsfälle mit EDW-Optimierung

ANWENDUNGSFALL 1
media img

Schnelle Business-Intelligence mit Hadoop

Proprietäre EDW-Systeme wurden als schnelle Business-Intelligence- und detaillierte Analytics-Lösungen konzipiert. Allerdings sind die Kosten solcher Systeme auf Dauer zu hoch, ganz zu schweigen davon, dass sie aktuellen Herausforderungen auf dem Gebiet von Big Data, etwa in Bezug auf unstrukturierte Daten oder Analytics in großem Umfang, nicht gewachsen sind.

Mit Hortonworks wird schnelle Business-Intelligence zur Realität: Wir kombinieren eine schnelle, in den Datenspeicher integrierte SQL-Engine zur Erstellung von Data Marts mit einer Engine zur Erstellung von OLAP-Würfeln, damit Sie auch umfangreiche Datensätze in Sekundenschnelle durchsuchen können. So haben Sie die Möglichkeit, voraggregierte Daten mit maximaler Leistung in Rekordschnelle zu durchsuchen oder eine verlustfreie Suche durchzuführen, wenn Sie eine detailliertere Analyse wünschen. Der Zugriff ist über sämtliche gängigen BI-Tools möglich, die ODBC, JDBC oder MDX unterstützen.

Mehr erfahren

ANWENDUNGSFALL 2
media img

ONBOARDING VON ETL-PROZESSEN AUF HADOOP

A typical EDW spends between 45 to 65 percent of its CPU cycles on ETL processing.These lower-value ETL jobs compete for resources with more business-critical workloads and can cause SLA misses. Hadoop can EDW offload these ETL jobs with minimal porting effort and at substantially lower cost, saving money and freeing up capacity on your EDW for higher-value analytical workloads. Hortonworks makes it easy by providing high-performance ETL tools, a powerful SQL engine and integration with all major BI vendors.

Mehr erfahren

ANWENDUNGSFALL 3
media img

DATEN IN HADOOP ARCHIVIEREN

Angesichts stetig wachsender Datenmengen und immer höheren Kosten sehen sich viele Unternehmen gezwungen, alte Daten auf Magnetbändern zu archivieren – allerdings macht dies Analysen zu einem späteren Zeitpunkt geradezu unmöglich oder zumindest äußerst kostspielig.

A Hadoop data warehouse architecture offers cost per terabyte on par with tape backup solutions. Because of the appealing cost, you can store years of data rather than months. All of your enterprise data remains available for retrieval, query and deep analytics with the same tools you use on existing EDW systems.

Mehr erfahren