Hive SQL - group by 1, 2, 3
Post
원문 보기 →Hive SQL - group by 1, 2, 3
Hive, Impala에서 group by/order by 를 많이 사용하는데, 숫자가 많아질 경우 이걸 일일이 쓰기가 어렵다. 특히나 case when 구문을 쓰게 될 경우 서브쿼리로 작성해야 하는 경우가 많아서 번거롭다. 이럴때 편리하게 사용할 수 있는 것이 바로 아래 기능이다. SET hive.groupby.orderby.position.alias=true; 이렇게 해놓으면 변수를 일일이 나열하지 않아도 편리하게 SQL을 짤 수 있다. 옆에 과장님을 보니 임팔라에서는 기본적으로 되어 있는 것 같은데 하이브는 아닌 것 같다. 속도를 위해서 최적화 되어 있는, Impala를 메인으로 쓰고 싶지만 date 포맷을 지원하지 않으므로 어쩔 수 없이 하이브를 쓰는데 속도 면에서 많이 느리다. 임팔라는 정말



