Lab 6-1. Clustering

Toy Lake|2017년 12월 13일
Posts

Lab 6-1. Clustering

Toy Lake|2017년 12월 13일

오늘은 군집화(clustering) 방법에 대해서 실습해 보겠습니다. partitioning 방법으로 k-means와 k-medoid를 이용하여 iris 데이터를 이용하여 종을 군집화 하는 방법을 알아보겠습니다. k-means는 패키지 설치 없이 사용할 수 있습니다. 그리고 k-medoid는 fpc 패키지를 이용하시면 됩니다. kmeanCluster

Related Posts

3 posts
데이터분석 / 데이터마이닝 / R프로그래밍 : 차이점과 관계 이해

데이터분석 / 데이터마이닝 / R프로그래밍 : 차이점과 관계 이해

데이터분석 / 데이터마이닝 / R프로그래밍 : 차이점과 관계 이해 데이터는 21세기의 원유라고 불릴 만큼 해를 거듭할수록 그 중요성이 커지고 있다. 원유는 땅속에서 채취된 상태 그대로의 액체 탄화수소 혼합물을 뜻한다. 이걸 정제하여 만든 휘발유, 경유, 등유 등의 다양한 제품을 석유라고 총칭하는 게 일반적이다. 석유는 20세기 산업화와 경제 성장의 핵심 동력이 됐다. 데이터 역시 마찬가지다. 분석 과정을 거쳐야 비로소 의미 있는 가치로 바뀐다. 데이터분석 (Data analysis) 데이터를 분석하여 유용한 정보를 만드는 모든 과정을 의미한다. 목적에 따라서 데이터를 모으고 정리한 뒤 각종 모델을 적용해 패턴을 찾고 결과를 해석해 새.......

데이터 사이언스 vs 데이터마이닝 차이 빅데이터 분석전문가 되려면?

데이터 사이언스 vs 데이터마이닝 차이 빅데이터 분석전문가 되려면?

데이터 사이언스 vs 데이터마이닝 차이 빅데이터 분석전문가 되려면? 데이터가 중요해진 시대에서 데이터 사이언스(Data Science)와 데이터 마이닝(Data Mining)은 자주 언급되는 개념이에요. 하지만 두 개념이 비슷해 보이면서도 다소 차이가 있어 헷갈리는 경우가 많죠. 오늘은 두 개념의 차이점과 실제 활용법을 쉽게 설명해볼게요. 1. 데이터 사이언스란? 데이터 사이언스는 데이터를 분석하고 인사이트를 도출하는 광범위한 분야예요. 단순히 데이터를 수집하고 분석하는 것뿐만 아니라, 통계학, 머신러닝, 인공지능(AI) 등의 다양한 기술을 활용하여 데이터를 해석하고 의미 있는 결론을 도출하는 것이 목표예요. 데이터 사이언스의 주요 역.......

텍스트마이닝 & NLP 알고리즘

텍스트마이닝 & NLP 알고리즘

텍스트마이닝 & NLP 알고리즘 : 언어 데이터 속 인사이트를 찾아서 디지털 시대에 텍스트 데이터는 폭발적으로 증가하고 있습니다. 소셜 미디어 게시물, 이메일, 고객 리뷰, 뉴스 기사 등 다양한 형태의 텍스트 데이터를 분석하고 활용하는 것이 중요해졌습니다. 이런 과정에서 핵심 역할을 하는 것이 텍스트마이닝과 자연어 처리(NLP, Natural Language Processing) 알고리즘입니다. 이번 포스팅에서는 텍스트마이닝 & NLP 개념 그리고 주요 알고리즘에 대해 살펴보겠습니다. ▶ 텍스트마이닝 & NLP 알고리즘 목차 1. 텍스트마이닝과 NLP의 개념 2. 텍스트마이닝과 NLP의 주요 알고리즘 3. 텍스트마이닝과 NLP의 활용 사례 4. 텍스.......