SAS와 R의 가장 큰 차이점

Posts

SAS와 R의 가장 큰 차이점

SAS는 하드디스크의 공간을 잡아 먹는다. 하드만 크고 견고하다면 대량의 데이터를 핸들링 하는데 메모리의 크기는 절대적이지 않다. 시간이 오래 걸리고 디스크가 깨져서 그렇지 대용량 데이터를 돌리면 답은 나온다. 그러나 R은 모든 데이터가 일단은 램에 올라가야 한다. 요즘에야 램값이 싸지만 R을 처음 접했던 2000년대 중반은 그러하지 않았다. R에서 뭔가 대용량 작업을 하려면 메모리를 올려야 하는데 쉬운 결정은 아니었고 그래서 다들 R은 서버에서나 올려야 하는 것으로 생각했다. 물론 대학교나 대학원에서 배우는 이론에서는 왠만한 것들은 다 올라가지만, 실제 회사에서 사용하는 간단한 데이터도 올려서 돌리기 시작하면 벡터가 간단하게 몇 GB를 잡아 먹는다. R에서 퍼포먼쓰를 위해서 SQL을 쓰지 말라는 것은