뒤돌아 보지 않는다, 후회하지 않는다, 길을 만든다.

Sources

Posts

120 posts

역시 사람은 기술이 있어야.

회사에서 분석 플랫폼과 언어를 바꾸려고 하고 있습니다. 기존에는 SAS라는 통계 패키지를 전적으로 의존했다면, 지금은 서로 다른 다양한 프로그래밍 언어와 솔루션을 도입했습니다. 3개의 서로 다른 팀이 각자의 툴을 선택했고, 제가 맡은 팀은 임팔라라는 것을 택했고 다른 한 팀은 하이브 그리고 다른 한 팀은 기존 툴을 계속 사용했습니다. 하이브를 선택한 팀은 스파크 엔진을 이용해서 잘 사용하고 있었지만, 저는 디지털 데이터를 분석하는데 속도가 안나와서 임팔라를 쓰고 있습니다. 다른 것은 몰라도 속도 하나만큼은 끝내주게 좋거든요. 다른 팀에서는 파이썬을 쓴다고는 하던데 진도가 안나가고 해서 각자 자기 방식으로 일을 하고 있었죠. 저는 원래 R을 주력으로 사용하려고 했으나 시간이 흘러서 결국 주력은 임팔라로

Netflix - Punisher : 주인공이 왠지

주인공이 Person of Interest의 John Reese(Jim Cabizen)를 많이 닮았다. 솔직히 말하면 넷플릭스의 주인공인 Frank Castle은 해병대 특수부대의 정예요원이기 때문에 닥치고 돌진은 정말 잘한다. 그러나 POI의 존은 기본적으로 격투, 사격, 저격, 교란 및 암살과 같은 다양한 정보요원으로서의 경력도 있기 때문에 좀더 다양한 일을 한다고 볼 수 있다. 그에 비해서 프랭크는 계속해서 싸우고 죽이고 또 죽여야만 한다. 그래서 죽도록 뛰고 총을 쏘고는 하지만, 머리 쓰는 일은 좀 많이 떨어진다고 볼 수 있다. POI가 후속편이 나와주면 정말 눈물을 흘리며 좋아할텐데 말이다. 가끔 보면 루트, 핀치, 푸스코, 카터, 루트 모두 보고 싶다. 가장 좋아하는 사람은 존

개발자 팟캐스트 재미있네

개발자 팟캐스트 재미있네

예전에 개발자 사이트 들어가면 내가 일하는 분야와 많은 차이가 있었다. 그러나 빅데이터, 머신러닝, 딥러닝이 나오면서 생각보다 경계가 허물어지기 시작했다. 파이썬이 본격적으로 도입되면서 R이라는 통계언어의 장벽이 없어졌고, 드디어 개발자들이 우리 분야에서 쏟아져 들어오기 시작했다. 좋은 점은 이제 제대로 된 분석을 할만한 환경이 구성되어 있고, 현업이라고 해서 굳이 고생해서 모든 것을 할 필요가 없어졌다는 것이다. 나쁜점은 경계가 허물어지면서 새로운 언어와 환경에 적응하지 못하는 분석가(나름)들은 조만간 퇴출각이거나 기존에 해왔던 일을 요구하는 회사에서 기존의 플랫폼(SAS/RDBMS) 환경에서 일해야 한다는 것이다. 여튼 요즘 개발자 팟캐스트라는 책을 이북으로 읽고 있는데, 와닿는 구절이 있는 글

이번에도 노트북은 물건너 갔다.

이번에는 제대로된 노트북을 사보고 싶어서 알아보다 보니, 한성에서 새로운 노트북 브랜드가 나왔다고 한다. 그램을 따라한 흔적이 역력한 underkg라고 하는데, 동일 이름의 유튜버가 있는데도 과감히 출시했다고 한다. 시작하자마자 배터리 용량을 잘못 기입해서 사과문을 올렸다네. 원래는 이 노트북을 사고 좀더 자유롭게 공부도 하고 책도 보려고 했으나, 계속 되는 집안 가구 및 물품 구매로 인해서 물건너 가버렸다. 지마켓, 옥션에서 빅스마일데이로 이넘을 사면 거의 20만원 가까운 할인을 받을 수 있었지만, 이번에 수납장이랑 옷장을 사고 나니 남는 돈이 하나도 없다. 할부가 너무 쌓여서 고생했던 과거 경험으로 꼭 필요한 물건을 일시불로만 산다는게 내 생각이라서, 결국 아래 아이템은 포기하고 말았다. 사무실을

클라우데라 임팔라

클라우데라 임팔라를 실제 업무에 사용중이면서 느끼는 점을 간단히 나마 정리해 보고자 한다. 1. 왜 임팔라인가? 어찌 보면 가장 큰 느낀점이다. 내가 만난 개발자들은 임팔라가 하이브나 스파크에 비해서 딱히 장점이라고 할만한 것이 없다고 말하고는 한다. 개발자 입장에서 업무를 배치 처리한다면 가능한 말씀이라고 생각된다. 오히려 임팔라의 제약이나 한계가 그들에게는 더 와닿을 수도 있다. 내가 임팔라를 산택한 하나의 이유는 바로, "속도" 그 하나이다. 나는 개발자가 아니고, Data Analyst이고 우리들은 그때그때 필요한 자료를 뽑기 위해서 쿼리를 날리고 그 자료을 정리해서 보고서를 만들고 분석한다. 그래서 아무리 강력하고 성능이 좋고 다양한 함수를 지원한다고 해도, 그 자료를 만드