표준편차

Category
아이템: 
포스트 갯수2

datamash - 리눅스에서 합, 평균, 표준편차 계산

By 반달가면 | 2022년 5월 24일 | 
리눅스에서 텍스트 파일에 저장된 수자들로부터 합, 평균, 표준편차 등을 계산하고 싶을 때 datamash를 활용할 수 있다. 설치는 터미널창에서 아래와 같이 진행한다. 데비안/우분투 기준이다. # S/W 저장소 정보 갱신 sudo apt-get update # datamash 설치 sudo apt-get install datamash 예를 들어 과일의 개수를 저장한 fruits.txt 파일의 내용이 아래와 같다고 가정하자. apple 10 banana 24 grapes 17 첫번째 항목은 명칭이고 두번째 항목은 개수이다. 전체 과일의 개수는 아래와 같이 계산할 수 있다. # 두번째 항목의 합 cat fruits.txt | datamash sum 2 "sum 2"

[bash:awk] awk를 이용한 분산/표준편차 계산

By 반달가면 | 2020년 2월 11일 | 
awk를 이용해서 파일에 저장된 값들의 분산(variance)과 표준편차(standard deviation)를 계산하는 방법이다. 표준편차를 계산하려면 우선 평균을 알아야 한다. awk를 이용한 평균값 계산은 이전 게시물을 참고하자. 여기로 전에 사용한 것과 동일한 예시를 사용해서 표준편차를 계산해 보자. data.txt 파일에 저장된 자료는 아래와 같다. # data.txt 내용 확인 cat data.txt john 12.35 jane -34.5 thomas 3.9 우선 평균을 계산하여 변수 mean에 할당한다. # 평균값을 계산하여 변수 mean에 할당 mean=`awk '{ sum += $2; cnt++ } END { print sum/cnt }' data.txt`