Presto是一种工具,旨在使用分布式查询来有效查询大量数据。 如果您使用TB或PB的数据,则可能会使用与Hadoop和HDFS交互的工具。 Presto旨在替代使用MapReduce作业的管道(例如Hive或Pig)查询HDFS的工具的替代方案,但Presto不仅限于访问HDFS。 Presto可以并且已经扩展为可以在包括传统关系数据库和其他数据源(例如Cassandra)在内的各种数据源上运行。
Presto旨在处理数据仓库和分析:数据分析,汇总大量数据并生成报告。 这些工作负载通常被归类为在线分析处理(OLAP)。
https://blog.csdn.net/cakexuexi/article/details/80820170