主要翻译自官网I,存储Systemspark部署在尽可能靠近数据的地方是因为大多数Spark工作可能需要从外部存储systems(如Hadoop文件系统或HBase)读取输入。Spark已经取代Hadoop成为最活跃的开源大型数据项目,但是,在选择大型数据框架时,企业不应厚此薄彼,著名专家BernardMarr在一篇文章中分析了Spark和Hadoop的异同,Hadoop和Spark都是big数据框架,都提供了一些工具来执行常见的big数据任务,但恰恰,它们执行的是不同的任务。虽然据说Spark在某些情况...
更新时间:2024-12-15标签: 存储spark数据Android包括spark本地数据存储 全文阅读