使用LOD函数解决impala去重计数报错问题
问题说明: impala不支持同一条select中多字段去重统计
解决方法有两个,推荐用第二种:
1)修改APPX_COUNT_DISTINCT参数
APPX_COUNT_DISTINCT=true
开启参数后,相当于使用了ndv(函数),会得到不那么精确的结果
2)使用LOD函数通过子查询绕过impala的限制
示例:
将度量【去重计数有效会员数】改为ATTR({INCLUDE : COUNTD([有效会员数])})
用第二种方法实现:
使用LOD函数通过子查询绕过impala的限制:
每新增一个去重统计的计算字段,在新增的计算字段里增加一重include的嵌套,如下
流失会员数:ATTR({INCLUDE: COUNTD([流失会员数])})
新增会员数:ATTR({INCLUDE:ATTR({INCLUDE: COUNTD([新增会员数])})})
有效会员数:ATTR({INCLUDE:ATTR({INCLUDE:ATTR({INCLUDE : COUNTD([有效会员数])})})})