# Histogram

# 函数简介

本函数用于计算单列数值型数据的分布直方图。

函数名: HISTOGRAM

输入序列: 仅支持单个输入序列,类型为 INT32 / INT64 / FLOAT / DOUBLE。

参数:

  • start:表示所求数据范围的下限,默认值为-Double.MAX_VALUE。
  • end:表示所求数据范围的上限,默认值为Double.MAX_VALUE,start的值必须小于或等于end
  • count: 表示直方图分桶的数量,默认值为1,其值必须为正整数。

输出序列: 直方图分桶的值,其中第i个桶(从1开始计数)表示的数据范围下界为,数据范围上界为

提示:

  • 如果某个数据点的数值小于start,它会被放入第1个桶;如果某个数据点的数值大于end,它会被放入最后1个桶。
  • 数据中的空值、缺失值和NaN将会被忽略。

# 使用示例

输入序列:

+-----------------------------+---------------+
|                         Time|root.test.d1.s1|
+-----------------------------+---------------+
|2020-01-01T00:00:00.000+08:00|            1.0|
|2020-01-01T00:00:01.000+08:00|            2.0|
|2020-01-01T00:00:02.000+08:00|            3.0|
|2020-01-01T00:00:03.000+08:00|            4.0|
|2020-01-01T00:00:04.000+08:00|            5.0|
|2020-01-01T00:00:05.000+08:00|            6.0|
|2020-01-01T00:00:06.000+08:00|            7.0|
|2020-01-01T00:00:07.000+08:00|            8.0|
|2020-01-01T00:00:08.000+08:00|            9.0|
|2020-01-01T00:00:09.000+08:00|           10.0|
|2020-01-01T00:00:10.000+08:00|           11.0|
|2020-01-01T00:00:11.000+08:00|           12.0|
|2020-01-01T00:00:12.000+08:00|           13.0|
|2020-01-01T00:00:13.000+08:00|           14.0|
|2020-01-01T00:00:14.000+08:00|           15.0|
|2020-01-01T00:00:15.000+08:00|           16.0|
|2020-01-01T00:00:16.000+08:00|           17.0|
|2020-01-01T00:00:17.000+08:00|           18.0|
|2020-01-01T00:00:18.000+08:00|           19.0|
|2020-01-01T00:00:19.000+08:00|           20.0|
+-----------------------------+---------------+

用于查询的SQL语句:

select histogram(s1,"start"="1","end"="20","count"="10") from root.test.d1

输出序列:

+-----------------------------+-----------------------------------------------------------------+
|                         Time|histogram(root.test.d1.s1, "start"="1", "end"="20", "count"="10")|
+-----------------------------+-----------------------------------------------------------------+
|1970-01-01T08:00:00.000+08:00|                                                                2|
|1970-01-01T08:00:00.001+08:00|                                                                2|
|1970-01-01T08:00:00.002+08:00|                                                                2|
|1970-01-01T08:00:00.003+08:00|                                                                2|
|1970-01-01T08:00:00.004+08:00|                                                                2|
|1970-01-01T08:00:00.005+08:00|                                                                2|
|1970-01-01T08:00:00.006+08:00|                                                                2|
|1970-01-01T08:00:00.007+08:00|                                                                2|
|1970-01-01T08:00:00.008+08:00|                                                                2|
|1970-01-01T08:00:00.009+08:00|                                                                2|
+-----------------------------+-----------------------------------------------------------------+

# Zeppelin示例

链接: http://101.6.15.213:18181/#/notebook/2GC1HE97R (opens new window)