Get fresh updates from Hortonworks by email

Once a month, receive latest insights, trends, analytics information and knowledge of Big Data.

cta

Erste Schritte

Cloud

Sind Sie bereit?

Sandbox herunterladen

Wie können wir Ihnen helfen?

SchließenSchaltfläche „Schließen“
cta

Skalierbare Big-Data-Lösungen mit Spark für Unternehmen

HORTONWORKS LIEFERT SPARK FÜR UNTERNEHMENSIMPLEMENTIERUNGEN

Cloud Hortonworks ist ein führendes Unternehmen. Lesen Sie die Forrester Wave.

Bericht herunterladen

Überblick

Apache™ Spark Overview

Hortonworks is unleashing the power of the Apache Spark big data processing framework for enterprise scale, unifying the capabilities of open enterprise Apache Hadoop® and the in-memory analytic capabilities of Apache Spark to maximize organizational value.

Spark is Better as Part of the Platform
Spark is certified as YARN-ready and is part of Hortonworks Data Platform. Memory and CPU-intensive enterprise Spark-based applications can coexist with other workloads deployed in a YARN-enabled cluster. Spark has first class support for external data sources, it can run directly on the cluster in YARN, and that is where enterprises want to perform their data analysis. This approach avoids the need to create and manage dedicated enterprise Spark clusters and allows for more efficient resource use within a single cluster. 

Spark Requires Enterprise-Grade Security and Governance
As part of the HDP platform, Spark has access to the same governance, security and management policies as other components of the HDP stack. The Spark big data processing framework is one the fastest moving projects in the Big Data ecosystem and its libraries remain at different levels of maturity. Hortonworks investigates, validates, certifies and then supports each of the components in the Spark project. This approach is key to the way we add value for our customers.

Notebooks Makes Spark and Data Science Easier to Consume & Share
Web-based notebooks bring data ingestion, exploration, visualization, sharing and collaboration capabilities to Hadoop and Spark. Hortonworks is making a substantial investment in Apache Zeppelin; we plan to make Zeppelin ready for production use by making it easier to use, while adding security, stability and R support.

By delivering a unified Apache Spark and Hadoop, we combine Spark-driven Agile Analytic workflows with the vast-data set and economics of Hadoop. With Hortonworks, enterprises can deploy the Apache Spark big data processing framework with the industry’s best security, governance, and operations capabilities.

AUF WELCHE STRATEGIE SETZT HORTONWORKS BEI SPARK?

Mit dem Release von Spark 1.6 möchte Hortonworks Kunden dabei helfen, die Datenforschung zu beschleunigen, einen nahtlosen Zugriff auf Daten zu gewährleisten und die Innovation im Kern voranzutreiben.

Spark als Teil der offenen Unternehmenslösung von Hadoop ermöglicht es Unternehmen, Spark zu skalieren – für noch mehr Mehrwert im Unternehmen.

Administrator

Schnellere Erforschung von Daten

Höhere Data Science-Produktivität durch optimiertes Apache Zeppelin und durch zusätzliche Spark-Algorithmen und -Pakete, mit denen die Entwicklung von Schlüssellösungen vereinfacht wird.

Zum Beispiel: Project Magellan – Raumbezogene Analytics in Apache Spark, eine Open-Source-Bibliothek zur Analyse von raumbezogenen Daten, die raumbezogene Anfragen vereinfacht und auf Spark basiert, um Probleme beim Umgang mit raumbezogenen Daten in großem Umfang zu bewältigen.

Administrator

Nahtloser Datenzugriff

Spark SQL bietet SQL und Data Frame-APIs, um auf strukturierte Daten zugreifen zu können, während Spark Streaming Entwicklern die Möglichkeit gibt, ganz einfach eine skalierbare, fehlertolerante Verarbeitung von Live-Datenströmen mit hohem Durchsatz zu entwickeln.

Hortonworks hat die Integration von Spark mit YARN, HDFS, Hive, HBase und ORC optimiert. Wir glauben außerdem daran, dass wir den Datenzugriff über die neue Data Source-API noch weiter verbessern können.

Administrator

Innovation im Kern

Aktivieren Sie RDD-Sharing mit der Speicherschicht von HDFS.

Tragen Sie weitere Algorithmen für maschinelles Lernen bei

Enhance enterprise Spark’s security, governance, operations, and readiness

cta

Sie möchten mehr über die spannende Spark-Innovation wissen?

WERFEN SIE EINEN BLICK AUF UNSERE APACHE SPARK-SEITE.

SEITE ANZEIGEN

WIE STARTET MAN IN GROSSEM UMFANG MIT APACHE SPARK DURCH?

Hören Sie sich unser letztes Seminar an: Spark in großem Umfang mit Hadoop