Lab 1-1. R과 RStudio의 설치
By Toy Lake | 2017년 11월 15일 |
![Lab 1-1. R과 RStudio의 설치](https://img.zoomtrend.com/2017/11/15/c0238655_5a055606c2149.png)
저희가 빅데이터 분석을 위해 사용할 분석 엔진은 R입니다. R을 편하게 사용하기 위한 개발 도구로 R Studio (IDE, 통합 개발 환경)가 있습니다. 이번 시간에는 R과 R studio를 설치해보겠습니다. 설치 순서는 R (https://www.r-project.org)를 설치한 후 RStudio (https://www.rstudio.com)를 설치하겠습니다. <R 설치 과정>1. https://www.r-project.org 사이트로 이동하셔서,2. Download R 링크를 클릭합니다. 3. 지역별로 여러 mirror사이트가 나오는데 이중 하나로 이동합니다. (한국 서버도 있습니다.)4. 각자 저희 OS에 맞는 링크를 클릭합니다.5. install R for the first
R/Rstudio 운영 팁
By 블루오션 [BLUE OCEAN] | 2017년 8월 29일 |
Rstudio서버 운영 시 발생할 수 있는 사항을 정리했다.실제 많이 발생하는 내용이다. [ Rstudio Java메모리 늘리기 ]1. 파일에 등록(디폴트 적용) options(java.parameters = "-Xmx8192m") /usr/lib64/R/library/base/R/Rprofile 2. R 콘솔에서 적용(일회성) options(java.parameters = "-Xmx8192m") 3. 개인별 적용(디폴트 적용) options(java.parameters = "-Xmx8192m") ~/.Rprofile [ 메모리 삭제 ]아래 3가지 방식을 모두 실행한다. # 숨은 객체까지 모두 삭제rm(list = ls(all.names = TRUE)) # 세션 재시작(명령어 앞
빅데이터 분석의 개론
By Toy Lake | 2017년 11월 10일 |
![빅데이터 분석의 개론](https://img.zoomtrend.com/2017/11/10/c0238655_5a0506877ede3.png)
빅데이터는 기존 소프트웨어나 데이터베이스로 처리할 수 없는 크기의 데이터를 처리하는 기술을 말합니다.[1] 무엇이 데이터를 빅데이터로 만드는가? 그것은 데이터의 크기 방대함 (volume), 종류의 다양함 (variety), 발생하는 속도 (velocity)에 의해 결정됩니다. 빅데이터가 뜨게 된 결정적인 이유는 Hadoop 의 등장 때문입니다. 대용량의 데이터에 대해 분산 저장하고 분산 처리하기 때문에, 과거처럼 사양이 높은 서버급 컴퓨터의 추가 증설없이 대용량 데이터를 처리할 수 있게되었습니다. 빅데이터 분석의 과정은 과거 전통적인 데이터 분석과 크게 다르지 않습니다. 데이터 분석의 라이프 사이클[2]은 아래와 같습니다. 이 과정 중 여전히 데이터를 전처리(preprocessing)하는데에 많