클라우데라 임팔라

클라우데라 임팔라를 실제 업무에 사용중이면서 느끼는 점을 간단히 나마 정리해 보고자 한다. 1. 왜 임팔라인가? 어찌 보면 가장 큰 느낀점이다. 내가 만난 개발자들은 임팔라가 하이브나 스파크에 비해서 딱히 장점이라고 할만한 것이 없다고 말하고는 한다. 개발자 입장에서 업무를 배치 처리한다면 가능한 말씀이라고 생각된다. 오히려 임팔라의 제약이나 한계가 그들에게는 더 와닿을 수도 있다. 내가 임팔라를 산택한 하나의 이유는 바로, "속도" 그 하나이다. 나는 개발자가 아니고, Data Analyst이고 우리들은 그때그때 필요한 자료를 뽑기 위해서 쿼리를 날리고 그 자료을 정리해서 보고서를 만들고 분석한다. 그래서 아무리 강력하고 성능이 좋고 다양한 함수를 지원한다고 해도, 그 자료를 만드