ANALYTICS

포스트: 22
Tags

Posts

22 posts

Lab 6-1. Clustering

Toy Lake|2017년 12월 13일

오늘은 군집화(clustering) 방법에 대해서 실습해 보겠습니다. partitioning 방법으로 k-means와 k-medoid를 이용하여 iris 데이터를 이용하여 종을 군집화 하는 방법을 알아보겠습니다. k-means는 패키지 설치 없이 사용할 수 있습니다. 그리고 k-medoid는 fpc 패키지를 이용하시면 됩니다. kmeanCluster

6. Machine Learning: Clustering

Toy Lake|2017년 12월 13일

강의 내용은 추후 업데이트 예정입니다. 강의 자료 다운 받기:

주식 투자를 위한 재무제표 R로 읽기

주식 투자를 위한 재무제표 R로 읽기

Toy Lake|2017년 12월 12일

아래 코드는 https://github.com/mrchypark/sejongFinData 에서 발췌하였습니다. 세종 기업 데이터에서 재무제표를 웹에 게시하고 있습니다. 여기서 삼성 전자를 검색해보니 1997년 데이터부터 제공을 하고 있더라고요. 일단, 기업의 종목번호 정보를 파악해야 합니다. http://www.sejongdata.com/query/value.html 여기에 보면 기업명과 종목번호정보 및 시가총액 등의 정보를 파악할 수 있습니다. 아래는 이 테이블을 R로 읽어오기 위한 코드입니다. if (!require("rvest")) install.packages("rvest")if (!require("stringi")) install.packages("stringi")install.packa

Lab 5-2 built-in 시각화 함수

Lab 5-2 built-in 시각화 함수

Toy Lake|2017년 12월 6일

어제 진행한 built-in 함수를 이용한 시각화 방법에 대해서 다시 살펴보겠습니다. plot 함수를 이용해 1차원 데이터 (벡터), 2차원 데이터 (행렬) 그리고 데이터프레임의 시각화 방법을 실습합니다. 벡터 x를 만들고 시각화 해보겠습니다. x <- 3*x + 2 + rnorm(length(x), sd=20) 뒤에 rnorm은 랜덤값을 생성하는데 그 값들이 정규분포를 따르도록 하는 함수 입니다. rnorm(평균, 표준편차) 라고 생각하시면 됩니다.그리고 plot을 하면 아래와 같은 그림이 출력됩니다. plo