Spark简介
概述
Apache Spark是用于大规模数据分析的统一引擎。是一个分布式内存计算框架。
大规模数据:海量数据。
分析:处理、计算。
统一引擎:支持多种语言、多种模式运行。
商业版Spark: 提到Spark,就不得不提databrick公司,俗称砖厂,是由UC Berkeley实验室的成员创立的公司,也是Spark背后的商业公司。
Databrick官网:Learn About Databricks Spark | Databricks
如下:
与开源Spark相比: 比开源Spark块了5倍
Apache官网首页:Apache Spark™ - Unified Engine for large-scale data analytics
如下: