Lab 1-2. RStudio 살펴보기
By Toy Lake | 2017년 11월 15일 |
![Lab 1-2. RStudio 살펴보기](https://img.zoomtrend.com/2017/11/15/c0238655_5a0b9d8b84385.png)
R과 RStudio를 설치하면, 아래 그림과 같은 화면이 나타납니다. R은 interpreter 언어기 때문에 콘솔창의 > 이 표시 옆에 코드를 타이핑 해서 데이터 분석이 가능합니다. 예를 들어 아래와 같이 입력하면 2가 출력되게 됩니다.> 1+1 코드의 재활용을 수월하게 하기 위해서는 스크립트로 저장해야 하는데, 아래 그림 처럼 스크립트 입력 창을 띄울 수 있습니다. 이 화면에서 코드를 실행시키려면, 실행 시키려는 코드를 두고 run을 누르시거나 컨트롤+엔터(맥북은 cmd+enter)를 누르시면 됩니다. <새로운 R 스크립트 생성> 작업을 하다보면 어떤 변수를 선언했는지 어떤 데이터가 있는지 궁금하실텐데, 오른쪽 상단에 Environment 창에서 확인하실 수 있
주식 투자를 위한 재무제표 R로 읽기
By Toy Lake | 2017년 12월 12일 |
![주식 투자를 위한 재무제표 R로 읽기](https://img.zoomtrend.com/2017/12/12/c0238655_5a2b4c7e6cf9d.png)
아래 코드는 https://github.com/mrchypark/sejongFinData 에서 발췌하였습니다. 세종 기업 데이터에서 재무제표를 웹에 게시하고 있습니다. 여기서 삼성 전자를 검색해보니 1997년 데이터부터 제공을 하고 있더라고요. 일단, 기업의 종목번호 정보를 파악해야 합니다. http://www.sejongdata.com/query/value.html 여기에 보면 기업명과 종목번호정보 및 시가총액 등의 정보를 파악할 수 있습니다. 아래는 이 테이블을 R로 읽어오기 위한 코드입니다. if (!require("rvest")) install.packages("rvest")if (!require("stringi")) install.packages("stringi")install.packa
Lab 6-1. Clustering
By Toy Lake | 2017년 12월 13일 |
오늘은 군집화(clustering) 방법에 대해서 실습해 보겠습니다. partitioning 방법으로 k-means와 k-medoid를 이용하여 iris 데이터를 이용하여 종을 군집화 하는 방법을 알아보겠습니다. k-means는 패키지 설치 없이 사용할 수 있습니다. 그리고 k-medoid는 fpc 패키지를 이용하시면 됩니다. kmeanCluster<-kmeans(iris[,1:4], 3, nstart=20) library(fpc)pamkCluster<-pamk(iris[,1:4], 3, ns=20) 계층적 클러스터링 기법과 밀도 기반 클러스터링 기법을 실습해보겠습니다. hClusters<-hclust(dist(iris[,1:4]), method='average')clust