当前位置：主页 > 查看内容

Hadoop-Impala优化十大指导原则和最佳实践(二)

发布时间：2021-07-29 00:00| 有位朋友查看

简介：5.???? 根据执行计划进行性能优化及最佳实践 5.1.??????????使用解释计划进行性能调整解释语句为您提供了一个查询将执行的逻辑步骤的概要例如如何将工作分配在节点之间以及如何将中间结果合并到生成最终结果集。在实际运行查询之前您可以看到这些详细信……

5.????根据执行计划进行性能优化及最佳实践 5.1.??????????使用解释计划进行性能调整

解释语句为您提供了一个查询将执行的逻辑步骤的概要例如如何将工作分配在节点之间以及如何将中间结果合并到生成最终结果集。在实际运行查询之前您可以看到这些详细信息。您可以使用此信息来检查查询将不会在一些非常意想不到的或低效的方式操作。

[impalad-host:21000] explain select count(*) from customer_address;

----------------------------------------------------------

| ExplainString|

----------------------------------------------------------

| EstimatedPer-Host Requirements: Memory 42.00MB VCores 1 |

|?|

|03:AGGREGATE [MERGE FINALIZE]|

| |? output: sum(count(*))???? |

| |??????|

|02:EXCHANGE [PARTITION UNPARTITIONED]????? |

| |??????|

|01:AGGREGATE???|

| |? output: count(*)?? |

| |??????|

| 00:SCANHDFS [default.customer_address]???|

|??? partitions 1/1 size 5.25MB|

----------------------------------------------------------

从下到上阅读解释计划

该计划的最后一部分显示了低级别的细节如预期的数据量将被读取在那里你可以判断你的分区策略的有效性并估计将需要多长时间扫描一个表的基础上总的数据大小和大小的集群。

然后你看到的操作将每个节点执行并行的impala。

在更高的层次您可以看到当中间结果集合并和从一个节点发送到另一个节点时数据流如何。

看到关于explain_level查询选项的详细信息explain_level查询选项它允许您自定义显示解释计划取决于你正在做的高级或低级调谐多少细节处理查询的逻辑或物理方面。

解释计划还打印在使用性能调整的查询配置文件中所描述的查询配置文件的开始处以便于检查并排的查询的逻辑和物理方面的便利性。

在解释输出的explain_level查询选项控制显示细节的数量。你通常会增加这个设置从正常的冗长或从0到1 时仔细检查表和列数据时性能调优或当估计查询资源使用与CDH 5资源管理功能的结合。

1.2.??????????使用性能调整的总结报告

在impala-shell解释器摘要命令给你一个容易消化的时间概述用于查询执行的不同阶段。像解释计划一样很容易看到潜在的性能瓶颈。像配置文件输出它是可用的查询后运行所以显示实际的时间数。

摘要报告还打印在使用性能调整的查询配置文件中所描述的查询概要报告的开始处以便于检查并排的查询的高级和低级方面的问题。

例如这里是一个包含聚合函数的查询在一个单一的节点上的虚拟机。的查询和他们的时间的不同阶段表现卷起所有节点以及估计值与实际值用于规划查询。在这种情况下该avg()功能为每个节点上的数据的一个子集计算 01级然后汇总结果从所有节点结合在年底 03期。你可以看到哪个阶段花了最多的时间以及是否有任何估计值与实际的数据分布有明显的不同。在检查的时间值可以考虑后缀如我们毫秒、微秒和毫秒而不是寻找最大的数字。

[localhost:21000] select avg(ss_sales_price) from store_sales wheress_coupon_amt

---------------------

|avg(ss_sales_price) |

---------------------

|37.80770926328327?? |

---------------------

[localhost:21000] summary;

-------------- -------- ---------- ---------- ------- ------------ ---------- --------------- -----------------

-------------- -------- ---------- ---------- ------- ------------ ---------- --------------- -----------------

|03:AGGREGATE | 1????? | 1.03ms?? | 1.03ms??| 1???? | 1?? | 48.00 KB | -1 B?? | MERGE FINALIZE? |

|02:EXCHANGE? | 1????? | 0ns?????| 0ns????? | 1???? | 1?? | 0 B????? | -1 B?? | UNPARTITIONED?? |

|01:AGGREGATE | 1????? | 30.79ms? | 30.79ms?| 1???? | 1?? | 80.00 KB | 10.00 MB????? |?? |

| 00:SCANHDFS | 1????? | 5.45s??? | 5.45s???| 2.21M | -1? | 64.05 MB |432.00 MB???? | tpc.store_sales |

-------------- -------- ---------- ---------- ------- ------------ ---------- --------------- -----------------

请注意查询最长的初始相位的测量单位是秒 s 而后期工作在较小的中间结果进行测量毫秒 ms 甚至纳秒 ns 。

这里有一个例子从一个更复杂的查询因为它会出现在配置文件输出

Operator#Hosts?? Avg Time??Max Time??? #Rows? Est. #Rows?Peak Mem? Est. Peak Mem? Detail

------------------------------------------------------------------------------------------------------------------------

09:MERGING-EXCHANGE 1??79.738us?? 79.738us 5??? 5? 0 -1.00 B?UNPARTITIONED

05:TOP-N???? 3?? 84.693us??88.810us 5??? 5?12.00 KB120.00 B

04:AGGREGATE 3??? 5.263ms???6.432ms 5??? 5?44.00 KB10.00 MB? MERGE FINALIZE

08:AGGREGATE 3?? 16.659ms??27.444ms?? 52.52K???? 600.12K??3.20 MB15.11 MB? MERGE

07:EXCHANGE? 3??? 2.644ms?????5.1ms?? 52.52K???? 600.12K? 00?HASH(o_orderpriority)

03:AGGREGATE 3? 342.913ms?966.291ms?? 52.52K???? 600.12K?10.80 MB15.11 MB

02:HASHJOIN?3???2s165ms??? 2s171ms? 144.87K????600.12K? 13.63 MB????? 941.01 KB?INNER JOIN, BROADCAST

|--06:EXCHANGE????? 3??? 8.296ms???8.692ms?? 57.22K????? 15.00K? 00?BROADCAST

|? 01:SCAN HDFS???? 2???1s412ms??? 1s978ms ??57.22K?????15.00K? 24.21 MB????? 176.00 MB?tpch.orders o

00:SCANHDFS 3??? 8s032ms???8s558ms??? 3.79M???? 600.12K?32.29 MB????? 264.00 MB? tpch.lineitem l

5.3.??????????使用性能调整的查询配置文件

profile语句在impala-shell解释器产生一个详细的报告显示低水平的最新查询被执行。不同于使用解释计划进行性能调整的解释计划此信息仅在查询完成后才可用。它显示物理细节如读取字节数、最大内存使用量等每个节点的物理细节。您可以使用此信息来确定如果查询是I/O密集型或CPU绑定的是否有网络条件实施的瓶颈是否放缓是影响而不是其他的一些节点并检查推荐配置设置如短路本地读取效果。

默认情况下配置文件输出的时间值反映了操作所采取的墙上时钟时间。指示系统的时间或用户的时间值测量单位是反映在指标的名字如scannerthreadssystime或scannerthreadsusertime。例如一个多线程的I / O操作可能会显示一个小的数字墙上的时钟时间而相应的系统时间是较大的代表的总和所采取的每一个线程的中央处理器时间。或是一个墙时钟的时间可能会更大因为它计算时间等待时间而相应的系统和用户的时间数字只测量时间而操作正在积极使用的处理器周期。

该解释计划也打印在查询简要表报告的开始处以便于检查并排的查询的逻辑和物理方面的便利性。的explain_level查询选项的解释也控制输出的打印命令的详细资料。

这里是一个查询配置文件的例子从一个相对简单的查询一个单一的节点的伪分布式集群保持输出相对较短。

[localhost:21000] profile;

QueryRuntime Profile:

Query(id 6540a03d4bee0691:4963d6269b210ebd):

? Summary:

??? Session ID:ea4a197f1c7bf858:c74e66f72e3a33ba

??? Session Type: BEESWAX

??? Start Time: 2013-12-02 17:10:30.263067000

??? End Time: 2013-12-02 17:10:50.932044000

??? Query Type: QUERY

??? Query State: FINISHED

??? Query Status: OK

??? Impala Version: impalad version 1.2.1RELEASE (build edb5af1bcad63d410bc5d47cc203df3a880e9324)

??? User: cloudera

??? Network Address: 127.0.0.1:49161

??? Default Db: stats_testing

??? Sql Statement: select t1.s, t2.s from t1join t2 on (t1.id t2.parent)

??? Plan:

----------------

EstimatedPer-Host Requirements: Memory 2.09GB VCores 2

PLANFRAGMENT 0

? PARTITION: UNPARTITIONED

? 4:EXCHANGE

???? cardinality: unavailable

???? per-host memory: unavailable

???? tuple ids: 0 1

PLANFRAGMENT 1

? PARTITION: RANDOM

? STREAM DATA SINK

??? EXCHANGE ID: 4

??? UNPARTITIONED

? 2:HASH JOIN

? |? joinop: INNER JOIN (BROADCAST)

? |? hashpredicates:

? |???t1.id t2.parent

? |?cardinality: unavailable

? |?per-host memory: 2.00GB

? |?tuple ids: 0 1

? |

? |----3:EXCHANGE

? |??????cardinality: unavailable

? |??????per-host memory: 0B

? |??????tuple ids: 1

? |

? 0:SCAN HDFS

???? table stats_testing.t1 #partitions 1/1size 33B

???? table stats: unavailable

???? column stats: unavailable

???? cardinality: unavailable

???? per-host memory: 32.00MB

???? tuple ids: 0

PLANFRAGMENT 2

? PARTITION: RANDOM

? STREAM DATA SINK

??? EXCHANGE ID: 3

??? UNPARTITIONED

? 1:SCAN HDFS

???? table stats_testing.t2 #partitions 1/1size 960.00KB

???? table stats: unavailable

???? column stats: unavailable

???? cardinality: unavailable

???? per-host memory: 96.00MB

???? tuple ids: 1

----------------

??? Query Timeline: 20s670ms

- Start execution: 2.559ms (2.559ms)

- Planning finished: 23.587ms (21.27ms)

- Rows available: 666.199ms (642.612ms)

- First row fetched: 668.919ms (2.719ms)

- Unregister query: 20s668ms (20s000ms)

? ImpalaServer:

???? - ClientFetchWaitTimer: 19s637ms

???? - RowMaterializationTimer: 167.121ms

? Execution Profile6540a03d4bee0691:4963d6269b210ebd:(Active: 837.815ms, % non-child: 0.00%)

??? Per Node Peak Memory Usage: impala-1.example.com:22000(7.42MB)

???? - FinalizationTimer: 0ns

??? Coordinator Fragment:(Active: 195.198ms, %non-child: 0.00%)

????? MemoryUsage(500.0ms): 16.00 KB, 7.42 MB,7.33 MB, 7.10 MB, 6.94 MB, 6.71 MB, 6.56 MB, 6.40 MB, 6.17 MB, 6.02 MB, 5.79MB, 5.63 MB, 5.48 MB, 5.25 MB, 5.09 MB, 4.86 MB, 4.71 MB, 4.47 MB, 4.32 MB,4.09 MB, 3.93 MB, 3.78 MB, 3.55 MB, 3.39 MB, 3.16 MB, 3.01 MB, 2.78 MB, 2.62MB, 2.39 MB, 2.24 MB, 2.08 MB, 1.85 MB, 1.70 MB, 1.54 MB, 1.31 MB, 1.16 MB,948.00 KB, 790.00 KB, 553.00 KB, 395.00 KB, 237.00 KB

????? ThreadUsage(500.0ms): 1

- AverageThreadTokens: 1.00

- PeakMemoryUsage: 7.42 MB

-PrepareTime: 36.144us

- RowsProduced: 98.30K (98304)

- TotalCpuTime: 20s449ms

- TotalNetworkWaitTime: 191.630ms

- TotalStorageWaitTime: 0ns

????? CodeGen:(Active: 150.679ms, % non-child:77.19%)

? - CodegenTime: 0ns

??- CompileTime: 139.503ms

? - LoadTime: 10.7ms

? - ModuleFileSize: 95.27 KB

????? EXCHANGE_NODE (id 4):(Active: 194.858ms,% non-child: 99.83%)

? - BytesReceived: 2.33 MB

? - ConvertRowBatchTime: 2.732ms

? - DataArrivalWaitTime: 191.118ms

? - DeserializeRowBatchTimer: 14.943ms

? - FirstBatchArrivalWaitTime: 191.117ms

? - PeakMemoryUsage: 7.41 MB

? - RowsReturned: 98.30K (98304)

? - RowsReturnedRate: 504.49 K/sec

? - SendersBlockedTimer: 0ns

? - SendersBlockedTotalTimer(*): 0ns

??? Averaged Fragment 1:(Active: 442.360ms, %non-child: 0.00%)

????? split sizes:? min: 33.00 B, max: 33.00 B, avg: 33.00 B,stddev: 0.00

????? completion times: min:443.720ms? max:443.720ms?mean: 443.720ms? stddev:0ns

????? execution rates: min:74.00 B/sec? max:74.00 B/sec? mean:74.00 B/sec? stddev:0.00 /sec

????? num instances: 1

- AverageThreadTokens: 1.00

- PeakMemoryUsage: 6.06 MB

- PrepareTime: 7.291ms

- RowsProduced: 98.30K (98304)

- TotalCpuTime: 784.259ms

- TotalNetworkWaitTime: 388.818ms

- TotalStorageWaitTime: 3.934ms

????? CodeGen:(Active: 312.862ms, % non-child:70.73%)

? - CodegenTime: 2.669ms

? - CompileTime: 302.467ms

? - LoadTime: 9.231ms

? - ModuleFileSize: 95.27 KB

????? DataStreamSender (dst_id 4):(Active:80.63ms, % non-child: 18.10%)

? - BytesSent: 2.33 MB

? - NetworkThroughput(*): 35.89 MB/sec

??- OverallThroughput: 29.06 MB/sec

? - PeakMemoryUsage: 5.33 KB

? - SerializeBatchTime: 26.487ms

? - ThriftTransmitTime(*): 64.814ms

? - UncompressedRowBatchSize: 6.66 MB

????? HASH_JOIN_NODE (id 2):(Active: 362.25ms,% non-child: 3.92%)

? - BuildBuckets: 1.02K (1024)

? - BuildRows: 98.30K (98304)

? - BuildTime: 12.622ms

? - LoadFactor: 0.00

? - PeakMemoryUsage: 6.02 MB

? - ProbeRows: 3

? - ProbeTime: 3.579ms

? - RowsReturned: 98.30K (98304)

? - RowsReturnedRate: 271.54 K/sec

?EXCHANGE_NODE (id 3):(Active:344.680ms, % non-child: 77.92%)

??? - BytesReceived: 1.15 MB

??? - ConvertRowBatchTime: 2.792ms

??? - DataArrivalWaitTime: 339.936ms

??? - DeserializeRowBatchTimer: 9.910ms

??? - FirstBatchArrivalWaitTime:199.474ms

??? - PeakMemoryUsage: 156.00 KB

??? - RowsReturned: 98.30K (98304)

??? - RowsReturnedRate: 285.20 K/sec

??? - SendersBlockedTimer: 0ns

??? - SendersBlockedTotalTimer(*): 0ns

????? HDFS_SCAN_NODE (id 0):(Active: 13.616us,% non-child: 0.00%)

? - AverageHdfsReadThreadConcurrency:0.00

? - AverageScannerThreadConcurrency:0.00

? - BytesRead: 33.00 B

? - BytesReadLocal: 33.00 B

? - BytesReadShortCircuit: 33.00 B

? - NumDisksAccessed: 1

? - NumScannerThreadsStarted: 1

? - PeakMemoryUsage: 46.00 KB

? - PerReadThreadRawHdfsThroughput:287.52 KB/sec

? - RowsRead: 3

? - RowsReturned: 3

? - RowsReturnedRate: 220.33 K/sec

? - ScanRangesComplete: 1

? -ScannerThreadsInvoluntaryContextSwitches: 26

? - ScannerThreadsTotalWallClockTime:55.199ms

??? - DelimiterParseTime: 2.463us

??? - MaterializeTupleTime(*): 1.226us

??? - ScannerThreadsSysTime: 0ns

??? - ScannerThreadsUserTime: 42.993ms

? -ScannerThreadsVoluntaryContextSwitches: 1

? - TotalRawHdfsReadTime(*): 112.86us

??- TotalReadThroughput: 0.00 /sec

??? Averaged Fragment 2:(Active: 190.120ms, %non-child: 0.00%)

????? split sizes:? min: 960.00 KB, max: 960.00 KB, avg: 960.00KB, stddev: 0.00

????? completion times: min:191.736ms? max:191.736ms?mean: 191.736ms? stddev:0ns

????? execution rates: min:4.89 MB/sec? max:4.89 MB/sec? mean:4.89 MB/sec? stddev:0.00 /sec

????? num instances: 1

- AverageThreadTokens: 0.00

- PeakMemoryUsage: 906.33 KB

- PrepareTime: 3.67ms

- RowsProduced: 98.30K (98304)

- TotalCpuTime: 403.351ms

- TotalNetworkWaitTime: 34.999ms

- TotalStorageWaitTime: 108.675ms

????? CodeGen:(Active: 162.57ms, % non-child:85.24%)

? - CodegenTime: 3.133ms

? - CompileTime: 148.316ms

? - LoadTime: 12.317ms

? - ModuleFileSize: 95.27 KB

????? DataStreamSender (dst_id 3):(Active:70.620ms, % non-child: 37.14%)

? - BytesSent: 1.15 MB

? - NetworkThroughput(*): 23.30 MB/sec

? - OverallThroughput: 16.23 MB/sec

? - PeakMemoryUsage: 5.33 KB

? - SerializeBatchTime: 22.69ms

? - ThriftTransmitTime(*): 49.178ms

? - UncompressedRowBatchSize: 3.28 MB

????? HDFS_SCAN_NODE (id 1):(Active: 118.839ms,% non-child: 62.51%)

? - AverageHdfsReadThreadConcurrency:0.00

? - AverageScannerThreadConcurrency:0.00

? - BytesRead: 960.00 KB

? - BytesReadLocal: 960.00 KB

? - BytesReadShortCircuit: 960.00 KB

? - NumDisksAccessed: 1

? - NumScannerThreadsStarted: 1

? - PeakMemoryUsage: 869.00 KB

? - PerReadThreadRawHdfsThroughput:130.21 MB/sec

? - RowsRead: 98.30K (98304)

? - RowsReturned: 98.30K (98304)

? - RowsReturnedRate: 827.20 K/sec

? - ScanRangesComplete: 15

? -ScannerThreadsInvoluntaryContextSwitches: 34

? - ScannerThreadsTotalWallClockTime:189.774ms

??? - DelimiterParseTime: 15.703ms

??? - MaterializeTupleTime(*): 3.419ms

??? - ScannerThreadsSysTime: 1.999ms

??? - ScannerThreadsUserTime: 44.993ms

? -ScannerThreadsVoluntaryContextSwitches: 118

? - TotalRawHdfsReadTime(*): 7.199ms

? - TotalReadThroughput: 0.00 /sec

??? Fragment 1:

????? Instance6540a03d4bee0691:4963d6269b210ebf (host impala-1.example.com:22000):(Active:442.360ms, % non-child: 0.00%)

?Hdfs split stats ( volumeid : # splits / split lengths ): 0:1/33.00 B

?MemoryUsage(500.0ms): 69.33 KB

?ThreadUsage(500.0ms): 1

? - AverageThreadTokens: 1.00

? - PeakMemoryUsage: 6.06 MB

? - PrepareTime: 7.291ms

? - RowsProduced: 98.30K (98304)

? - TotalCpuTime: 784.259ms

? - TotalNetworkWaitTime: 388.818ms

? - TotalStorageWaitTime: 3.934ms

?CodeGen:(Active: 312.862ms, %non-child: 70.73%)

??? - CodegenTime: 2.669ms

??? - CompileTime: 302.467ms

??? - LoadTime: 9.231ms

??? - ModuleFileSize: 95.27 KB

?DataStreamSender (dst_id 4):(Active:80.63ms, % non-child: 18.10%)

??? - BytesSent: 2.33 MB

??? - NetworkThroughput(*): 35.89 MB/sec

??? - OverallThroughput: 29.06 MB/sec

??? - PeakMemoryUsage: 5.33 KB

??? - SerializeBatchTime: 26.487ms

??? - ThriftTransmitTime(*): 64.814ms

??? - UncompressedRowBatchSize: 6.66 MB

?HASH_JOIN_NODE (id 2):(Active:362.25ms, % non-child: 3.92%)

?? ExecOption: Build Side Codegen Enabled,Probe Side Codegen Enabled, Hash Table Built Asynchronously

??? - BuildBuckets: 1.02K (1024)

??? - BuildRows: 98.30K (98304)

??? - BuildTime: 12.622ms

??? - LoadFactor: 0.00

??? - PeakMemoryUsage: 6.02 MB

??? - ProbeRows: 3

??? - ProbeTime: 3.579ms

??? - RowsReturned: 98.30K (98304)

??? - RowsReturnedRate: 271.54 K/sec

?? EXCHANGE_NODE (id 3):(Active:344.680ms, % non-child: 77.92%)

????? - BytesReceived: 1.15 MB

??????- ConvertRowBatchTime: 2.792ms

????? - DataArrivalWaitTime: 339.936ms

????? - DeserializeRowBatchTimer:9.910ms

????? - FirstBatchArrivalWaitTime:199.474ms

????? - PeakMemoryUsage: 156.00 KB

????? - RowsReturned: 98.30K (98304)

????? - RowsReturnedRate: 285.20 K/sec

????? - SendersBlockedTimer: 0ns

????? - SendersBlockedTotalTimer(*): 0ns

?HDFS_SCAN_NODE (id 0):(Active:13.616us, % non-child: 0.00%)

?? Hdfs split stats ( volumeid : # splits / split lengths ): 0:1/33.00 B

?? Hdfs Read Thread Concurrency Bucket:0:0% 1:0%

?? File Formats: TEXT/NONE:1

?? ExecOption: Codegen enabled: 1 out of1

??? - AverageHdfsReadThreadConcurrency:0.00

? ??- AverageScannerThreadConcurrency: 0.00

??? - BytesRead: 33.00 B

??? - BytesReadLocal: 33.00 B

??? - BytesReadShortCircuit: 33.00 B

??? - NumDisksAccessed: 1

??? - NumScannerThreadsStarted: 1

??? - PeakMemoryUsage: 46.00 KB

??? - PerReadThreadRawHdfsThroughput:287.52 KB/sec

??? - RowsRead: 3

??? - RowsReturned: 3

??? - RowsReturnedRate: 220.33 K/sec

??? - ScanRangesComplete: 1

??? -ScannerThreadsInvoluntaryContextSwitches: 26

??? - ScannerThreadsTotalWallClockTime:55.199ms

????? - DelimiterParseTime: 2.463us

????? - MaterializeTupleTime(*): 1.226us

????? - ScannerThreadsSysTime: 0ns

????? - ScannerThreadsUserTime: 42.993ms

??? -ScannerThreadsVoluntaryContextSwitches: 1

??? - TotalRawHdfsReadTime(*): 112.86us

??? - TotalReadThroughput: 0.00 /sec

??? Fragment 2:

????? Instance6540a03d4bee0691:4963d6269b210ec0 (host impala-1.example.com:22000):(Active: 190.120ms,% non-child: 0.00%)

?Hdfs split stats ( volumeid : # splits / split lengths ): 0:15/960.00 KB

? - AverageThreadTokens: 0.00

? - PeakMemoryUsage: 906.33 KB

? - PrepareTime: 3.67ms

? - RowsProduced: 98.30K (98304)

? - TotalCpuTime: 403.351ms

? - TotalNetworkWaitTime: 34.999ms

? - TotalStorageWaitTime: 108.675ms

?CodeGen:(Active: 162.57ms, % non-child:85.24%)

??? - CodegenTime: 3.133ms

??? - CompileTime: 148.316ms

??? - LoadTime: 12.317ms

??? - ModuleFileSize: 95.27 KB

?DataStreamSender (dst_id 3):(Active:70.620ms, % non-child: 37.14%)

??? - BytesSent: 1.15 MB

??? - NetworkThroughput(*): 23.30 MB/sec

??? - OverallThroughput: 16.23 MB/sec

??? - PeakMemoryUsage: 5.33 KB

??? - SerializeBatchTime: 22.69ms

??? - ThriftTransmitTime(*): 49.178ms

??? - UncompressedRowBatchSize: 3.28 MB

?HDFS_SCAN_NODE (id 1):(Active:118.839ms, % non-child: 62.51%)

?? Hdfs split stats ( volumeid : # splits / split lengths ): 0:15/960.00 KB

?? Hdfs Read Thread Concurrency Bucket:0:0% 1:0%

?? File Formats: TEXT/NONE:15

?? ExecOption: Codegen enabled: 15 outof 15

??? - AverageHdfsReadThreadConcurrency:0.00

??? - AverageScannerThreadConcurrency:0.00

??? - BytesRead: 960.00 KB

??? - BytesReadLocal: 960.00 KB

??? - BytesReadShortCircuit: 960.00 KB

??? - NumDisksAccessed: 1

??? - NumScannerThreadsStarted: 1

??? - PeakMemoryUsage: 869.00 KB

??? - PerReadThreadRawHdfsThroughput:130.21 MB/sec

??? - RowsRead: 98.30K (98304)

??? - RowsReturned: 98.30K (98304)

??? - RowsReturnedRate: 827.20 K/sec

??? - ScanRangesComplete: 15

??? -ScannerThreadsInvoluntaryContextSwitches: 34

??? - ScannerThreadsTotalWallClockTime:189.774ms

????? - DelimiterParseTime: 15.703ms

????? - MaterializeTupleTime(*): 3.419ms

??????- ScannerThreadsSysTime: 1.999ms

????? - ScannerThreadsUserTime: 44.993ms

??? -ScannerThreadsVoluntaryContextSwitches: 118

??? - TotalRawHdfsReadTime(*): 7.199ms

??? - TotalReadThroughput: 0.00 /sec

6.??基准Impala查询最佳实践

Impala 像其他的Hadoop组件目的是在分布式环境中处理大量的数据进行性能测试使用真实的数据和集群配置。使用一个多节点的集群而不是一个单一的节点对运行中包含数据而不是数十GB百万兆字节表查询。用Impala的并行处理技术是最适合的工作负载超出单个服务器的能力。

当您运行查询返回大量的行时该处理器的时间花费到漂亮的打印输出是实质性的给一个不准确的测量的实际查询时间。考虑使用-B选项的Impala-shell命令关掉漂亮的打印输出和任选的-o选项来存储查询结果文件中而不是打印到屏幕上。看到Impala-shell配置选项的详细信息。

7.???? 控制资源使用最佳实践

有时平衡原始查询性能对可扩展性需要限制的资源量如内存或中央处理器使用一个单一的查询或组查询。Impala可以使用多种机制有助于消除负荷重的同时使用时产生更快的整体查询时间和资源在Impala查询 MapReduce工作共享以及其他在CDH集群工作负载

Impala的接纳控制功能使用快速、分布式机制来阻止超过并行查询或使用的内存量的限制查询。查询是排队的并执行其他查询完成和资源可用。您可以控制并发限制并为不同的用户组指定不同的限制根据不同类别的用户的优先级来划分群集资源。这个功能是新的Impala1.3 并与CDH 4和CDH5。查看接纳控制和查询队列的详细信息。

你可以限制内存Impala的储备量在查询执行过程中通过指定的impalad守护的mem_limit选项。看到修改细节Impala的启动选项。此限制仅适用于内存的查询直接引用 Impala储备额外的内存在启动时例如举行缓存元数据。

生产部署 Cloudera的建议你实现资源隔离使用机制如C组您可以使用Cloudera管理。详情在Cloudera管理文档查看静态资源池。

8.??impala 优化之HDFS缓存最佳实践 8.1.??????????HDFS缓存的impala的概述

?CDH 5.1高 Impala可以使用缓存功能更有效的利用内存的HDFS 这样反复查询可以利用数据“钉”在记忆中无论多少数据进行整体。HDFS的缓存功能允许您指定的一个子集的频繁访问的数据被永久的记忆其余的在多个查询缓存不被驱逐。该技术适用于表或分区是经常访问的小到可以完全在HDFS存储缓存。例如您可以指定要在缓存中固定的几个维度表以加快引用它们的许多不同的联接查询。或在一个分区表你可能销分区保存数据从最近一段时间因为数据将查询集中然后下一组数据时你可以脱离以前的分区和分区的新数据持销。

因为这辆车的性能特征依赖于HDFS的基础设施它只适用于Impala表使用HDFS的数据文件。HDFS缓存Impala不适用于HBase表 S3表、Kudu表或 Isilon 表。

8.2.??????????设置缓存为HDFS的Impala

使用HDFS的缓存与Impala 首先建立你的CDH聚类特征

决定把每个主机上的HDFS的缓存内存的多少。请记住可用的缓存数据的总内存是所有主机上的缓存大小的总和。默认情况下任何数据块只缓存在一个主机上虽然您可以通过增加复制因子来缓存一个跨多个主机的块。

问题cacheadmin HDFS命令来设置一个或多个缓冲池由同一用户为impalad守护进程通常是Impala 。例如:

hdfscacheadmin -addPool four_gig_pool -owner impala -limit 4000000000

关于HDFS cacheadmin命令的详细信息参见CDH文档。

一旦HDFS启用高速缓存和一个或多个池看到使HDFS的Impala表和分区缓存如何选择Impala的数据加载到HDFS的缓存。在Impala的一面你指定的缓冲池的名字在Impala的DDL语句使HDFS为表或分区缓存HDFScacheadmin命令定义如创建表…在池或更改表中缓存…集合缓存池。

8.3.??????????使用HDFS的Impala表和分区缓存

首先通过选择要缓存的表或分区。例如这些可能是由许多不同的连接查询访问的查找表或对应于由不同的报告或临时查询分析的最新的时间段的分区。

在你的SQL语句您指定的逻辑分区如表和分区缓存。Impala将这些请求到HDFS级指令适用于特定的目录和文件。例如给定一个分区键列的分区表普查您可以选择缓存所有或部分数据如下

在Impala 2.2 /CDH5.4高可选复制条款创建表和修改表允许您指定一个复制因子缓存相同的数据块上的主机的数量。当Impala过程缓存的数据块其中缓存复制因子大于1 Impala随机选择一个主机一个数据块的缓存副本。这种优化避免过多的在同一个主机上的多个处理器的使用当相同的缓存数据块被处理的倍数。Cloudera建议指定一个值大于或等于HDFS块复制因子。

-- Cachethe entire table (all partitions).

alter tablecensus set cached in pool_name

-- Removethe entire table from the cache.

alter tablecensus set uncached;

-- Cache aportion of the table (a single partition).

-- If thetable is partitioned by multiple columns (such as year, month, day),

-- theALTER TABLE command must specify values for all those columns.

alter tablecensus partition (year 1960) set cached in pool_name

-- Cache the data from one partition on up to 4 hosts, tominimize CPU load on any

-- single host when the same data block is processedmultiple times.

alter table census partition (year 1970)

? set cached in pool_name with replication

-- At eachstage, check the volume of cached data.

-- Forlarge tables or partitions, the background loading might take some time,

-- so youmight have to wait and reissue the statement until all the data

-- hasfinished being loaded into the cache.

show tablestats census;

------- ------- -------- ------ -------------- --------

------- ------- -------- ------ -------------- --------

| 1900? | -1???| 1????? | 11B? | NOT CACHED??| TEXT?? |

| 1940? | -1???| 1????? | 11B? | NOT CACHED??| TEXT?? |

| 1960? | -1???| 1????? | 11B? | 11B??| TEXT?? |

| 1970? | -1???| 1????? | 11B? | NOT CACHED??| TEXT?? |

| Total |-1??? | 4????? | 44B?| 11B?? | |

------- ------- -------- ------ -------------- --------

创建表的考虑

?HDFS缓存功能影响Impala创建表的语句如下

你可以把一个缓存的pool_name”条款和可选的复制 number_of_hosts条款在CREATE TABLE语句自动缓存表的全部内容包括任何分区的后面添加。是的pool_name池以前设置了HDFS cacheadmin命令。

一旦一个表指定缓存通过HDFS创建表的语句如果新分区添加后通过修改表…添加分区语句将这些新分区中的数据自动缓存在同一个池中。

如果你想在从一个大的表格数据的子集进行重复查询而不是对HDFS缓存指定整个表或特定的分区实用你可以创建一个新的缓存表是数据的一个子集利用创建表…缓存在pool_name”选择…哪里....当您完成从这个子集的数据生成报告删除表和数据文件和缓存在内存中的数据被自动删除。

其他内存考虑

某些DDL操作如修改表…设置位置而底层的HDFS的目录包含缓存文件受阻。你必须uncache文件第一改变位置之前删除表等等。

当请求被固定在内存中时该进程发生在后台而不阻塞访问数据而缓存正在进行中。从磁盘加载数据可能需要一段时间。ImpalaHDFS数据块从内存中读取每一个如果已经把已经或从磁盘如果没有寄托呢。当文件被添加到一个表或分区的内容进行缓存 impala自动检测这些变化和执行自动刷新一次相关数据缓存。

你可以销每个节点通过缓存机制是受配额是由底层的HDFS服务执行HDFS的数据量。在请求一个内存中的impala表或分区销检查它的大小不超过此限额。

注由于HDFS缓存由组合的记忆从集群中所有的数据节点缓存表或分区可以大于HDFS缓存在任何单一主机的数量。

8.4.??????????加载和HDFS启用缓存删除数据

当HDFS缓存启用额外的处理发生在的背景当你添加或删除数据通过报表如插入和删除表。

插入或加载数据

?Impala执行表或分区缓存插入或加载数据表时新的数据文件自动缓存和Impala自动承认事实。

如果你执行插入或加载数据通过hive 一如既往 Impala只承认新的数据文件后刷新在Impala table_name声明。

如果缓存池完全是满的或已满之前所有请求的数据可以缓存 Impala的DDL语句将返回一个错误。这是为了避免情况下只有一些所请求的数据可以被缓存。

当HDFS缓存是一个表或分区启用新的数据文件缓存时自动添加到HDFS相应的目录无需刷新语句在Impala的需要。Impala自动执行刷新一次新的数据加载到HDFS的缓存。

丢弃表、分区或缓存池

?HDFS缓存功能的Impala表相互作用并改变表…删除分区语句如下

当你发出了一个表完全缓存表或有一些分区缓存删除表成功所有的缓存指令提交表Impala从HDFS系统缓存删除。

同样适用于修改表…删除分区。操作成功并删除任何缓存指令。

和总是一样如果删除表是一个内部表或者删除的分区在其内部表的默认位置则删除基本的数据文件。如果删除表是一个外部表或如果丢弃的分区在非默认位置则单独留下数据文件。

如果你指定的数据文件缓存通过HDFS cacheadmin命令和数据文件在以前的项目描述留守保持缓存数据文件。Impala只删除提交的Impala通过创建表的缓存指令或ALTER TABLE语句。可以有多个冗余的高速缓存指令属于同一个文件指令都有独特的身份标识和所有者使系统可以告诉他们分开。

如果你把一个HDFS的缓存池通过HDFScacheadmin命令所有的Impala的数据文件保存只是不再缓存。随后刷新后显示表的统计报告0字节缓存每个相关的Impala表或分区。

将一个表或分区

?HDFS缓存功能与Impala的交互修改表…设置位置语句如下

如果您指定了一个表或分区通过创建表或更改表语句缓存随后试图通过一个更改表重新定位表或分区…设置位置语句将失败。您必须发出一个更改表…设置被声明为表或分区第一。否则会失去一些Impala缓存数据文件没有办法uncache以后。

8.5.??????????HDFS的缓存管理和Impala

HDFS的缓存管理和Impala

这是指导方针和步骤来检查或更改HDFS数据缓存状态的Impala

HDFScacheadmin命令

如果你把一个缓冲池与HDFS cacheadmin命令对相关的数据文件的Impala查询仍然会工作通过落回从磁盘中读取文件。执行刷新后放在桌上 Impala报道字节缓存0所有相关表和分区数。

你可以使用HDFS cacheadmin得到一个现有的缓存池该池或详细信息如下

hdfscacheadmin -listDirectives? #Basic info

Found 122entries

? ID POOL??????REPL EXPIRY? PATH

?123 testPool????? 1 never??/user/hive/warehouse/tpcds.store_sales

?124 testPool????? 1 never??/user/hive/warehouse/tpcds.store_sales/ss_date 1998-01-15

?125 testPool????? 1 never??/user/hive/warehouse/tpcds.store_sales/ss_date 1998-02-01

...

hdfscacheadmin -listDirectives -stats? # Moredetails

Found 122entries

? ID POOL??????REPL EXPIRY? PATH??????BYTES_NEEDED? BYTES_CACHED? FILES_NEEDED?FILES_CACHED

?123 testPool????? 1 never??/user/hive/warehouse/tpcds.store_sales???? 0????? 0????? 0????? 0

?124 testPool????? 1 never??/user/hive/warehouse/tpcds.store_sales/ss_date 1998-01-15? 143169 143169????? 1????? 1

?125 testPool????? 1 never??/user/hive/warehouse/tpcds.store_sales/ss_date 1998-02-01? 112447 112447????? 1????? 1

...

Impala SHOW 语句

每个表或分区显示表数据或显示分区表显示当前缓存的字节缓存功能的HDFS的数量。如果没有为该表或分区放置的缓存指令则不会缓存结果集显示的结果集。一个值为0 或一个较小的数字比表或分区的整体大小表明缓存请求已提交但数据还没有完全加载到内存中。查看显示详细信息。

?Cloudera管理

您可以启用或禁用缓存通过HDFS Cloudera管理使用配置设置最大内存用于HDFS的缓存服务。这种控制集dfs_datanode_max_locked_memoryHDFS配置参数它指定缓存大小对HDFS的每个节点的上限。

所有的缓存设置HDFS的其他操作如文件的缓存通过命令行完成无论是Impala的DDL语句或Linux HDFS cacheadmin命令。

?Impala的内存限制

?Impala HDFS缓存功能与Impala的内存限制为相互作用如下

每个HDFS的缓存池的最大大小是指定外部的Impala 通过HDFScacheadmin命令。

所有的内存用于缓存从HDFS impalad守护进程地址空间的分离与不计入的mem_limit启动选项的限制 mem_limit查询选项或进一步限制通过纱线资源管理或Linux cgroups机制。

因为访问HDFS的缓存数据避免了内存到内存复制操作包括缓存数据的查询需要在Impala边记忆比缓存数据的等效查询不。除了在一个单一的用户环境中的任何性能优势减少内存有助于提高高并发工作负载下的可扩展性。

8.6.??????????HDFS的缓存与Impala性能考虑

在 Impala 1.4.0及更高的版本 Impala 支持高效的读取被固定在内存中缓存数据通过HDFS。 Impala 利用HDFS API和从存储器读取数据而不是从磁盘的数据文件是否在使用Impala DDL语句或使用命令行机制您指定HDFS路径。

当你检查impala-shell 汇总命令的输出或期待中的impalad守护进程的报告你看到多少字节从HDFS缓存读取。例如这是从查询资料说明所有的数据读取一个特定的查询阶段来自HDFS的缓存因为bytesread和bytesreaddatanodecache值是相同的。

HDFS_SCAN_NODE(id 0):(Total: 11s114ms, non-child: 11s114ms, % non-child: 100.00%)

?- AverageHdfsReadThreadConcurrency:0.00

?- AverageScannerThreadConcurrency:32.75

- BytesRead: 10.47 GB (11240756479)

- BytesReadDataNodeCache: 10.47 GB (11240756479)

?- BytesReadLocal: 10.47 GB(11240756479)

?- BytesReadShortCircuit: 10.47 GB(11240756479)

?- DecompressionTime: 27s572ms

对于涉及较小的数据查询或在单用户的工作负载您可能没有注意到一个与或查询的响应时间差异没有HDFS缓存。即使HDFS缓存关闭对于查询的数据可能仍然在Linux操作系统的缓存。的好处变得更清晰的数据量的增加特别是随着系统处理更多的并发查询。HDFS的缓存可以提高整体系统的可扩展性。那就是它可以防止查询性能下降时的工作量超过了Linux操作系统的缓存容量。

由于HDFS的局限零拷贝读取不支持加密。不建议使用HDFS Cloudera在加密区Impala数据文件缓存。查询在查询执行过程中返回到正常的读取路径这可能会导致一些性能开销。

选择的考虑

ImpalaHDFS缓存功能与SELECT语句和查询性能如下

Impala自动从内存读取任何数据已被指定为缓存和实际加载到HDFS的缓存。它可能需要一段时间后初始请求完全填充缓存的表与大尺寸或多个分区的加速比来自两个方面从内存读取而不是磁盘并访问数据直接从高速缓存区而不是从一个内存区复制到另一个。这第二个方面产生进一步的性能改进的标准的操作系统缓存机制这仍然会导致内存复制缓存数据的内存。

对于少量的数据查询加速可能不明显在墙上的时钟时间。的性能可能与HDFS的缓存打开或关闭大致相同由于最近使用的数据是在Linux操作系统的缓存举行。差异更为明显

数据卷对于同时运行的所有查询超过了超高速缓存的大小。

一个繁忙的集群运行许多并发查询其中在内存中的复制和整体内存使用的内存减少在查询结果中更大的可扩展性和吞吐量。

因此要真正在开发环境中练习和基准此功能您可能需要模拟现实的工作负载和与您的生产环境相匹配的并发查询。

在轻负载模拟系统的工作量的方法之一是冲洗操作系统缓冲区高速缓存每个DataNode 对相同的表或分区之间的迭代查询

$ sync

$ echo 1 /proc/sys/vm/drop_caches

Impala的查询利用HDFS的缓存数据无论是否缓存指令是由Impala或外部通过HDFS cacheadmin发出的命令例如外部表的缓存数据文件可能是由几个不同的Hadoop组件访问。

如果您的查询返回一个大的结果集则报告查询的时间可能会被打印在屏幕上的结果所需的时间所占。为了衡量标的查询时间查询的结果集的count()大不一样的处理只能打印一条直线到屏幕。

本文转自网络，原文链接：https://developer.aliyun.com/article/785926
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：开源OpenIM：高性能、可伸缩、易扩展的即时通讯架构 下一篇：还不会使用分布式锁？从零开始基于 etcd 实现分布式锁

随机推荐

RDS PostgreSQL 安全最佳实践

一、PostgreSQL行业位置一行业位置首先我们看一看RDS PostgreSQL在整个行业当...
云计算市场在2020年取得突破性增长

2020年对于云计算行业来说是突破性的一年，因为公共云供应商增加了收入，而疫情...
MySQL Case-索引key对select count(*)的

查看表结构，sbtest1有主键、k_1二级索引、i_c二级索引 CREATE TABLE `sbtest1` ...
VPS主机和租用服务器优势分析

在TOP云（zuntop.com）科技租赁过服务器的站长都知道独立服务器在价格上比VPS主...
JavaScript之深入理解this

定义 this是函数运行时自动生成的内部对象，即调用函数的那个对象。（不一定很准...
Nacos或者Config是怎么实现配置热刷新的

本文转载自网络，原文链接：https://mp.weixin.qq.com/s/vlOUg46B5bcmToX-fjavJQ...
在DevOps中整合“安全即代码”文化

最近，DevOps的采用导致了企业计算的重大转变。除无服务器计算，动态配置和即付...
阿里云发布工业大脑3.0，满足一站式开发

9月17日，2020云栖大会上，阿里云正式发布工业大脑3.0。阿里云智能资深产品专家...
华瑞银行金融一朵云安全建设实践，智慧银

中国最?好的一朵云飘进了华瑞银行。阿里云将进一步助力华瑞银行All in Cloud。 -...
关于现代包管理器的深度思考-为什么现在

很长时间没有更新原创文章了，但是还一直在思考和沉淀当中，后面公众号会更频繁...

Hadoop-Impala优化十大指导原则和最佳实践(二)

推荐图文

2021年值得关注的8种边缘计算趋势

P2P鼻祖收购四字母域名LCAM.com！梦工厂、百事均有

租用云服务器一年大概的费用

新零售行业优质解决方案分享【智能语音点餐机解决方

服务器托管节省开支节省费用

尽管获三千万融资，该域名也换得了吧！

随机推荐

RDS PostgreSQL 安全最佳实践

云计算市场在2020年取得突破性增长

MySQL Case-索引key对select count(*)的

VPS主机和租用服务器优势分析

JavaScript之深入理解this

Nacos或者Config是怎么实现配置热刷新的

在DevOps中整合“安全即代码”文化

阿里云发布工业大脑3.0，满足一站式开发

华瑞银行金融一朵云安全建设实践，智慧银

关于现代包管理器的深度思考-为什么现在

关于我们