[R 실습] 01-3 서울시 지역별 미세먼지 농도 차이 비교하기

2024-03-13 최대 1 분 소요

# 엑셀 파일 가져오기

library(readxl)
dustdata <- read_excel("C:/Rstudy/dustdata.xlsx")

View(dustdata)
str(dustdata)

# 성북구와 중구 데이터만 추출하기

library(dplyr)
dustdata_anal <- dustdata[, c("날짜", "성북구", "중구")]
View(dustdata_anal)

# 결측치 확인하기

is.na(dustdata_anal)

sum(is.na(dustdata_anal))

# 지역별 미세먼지 농도의 기술통계량 구하기

library(psych)

describe(dustdata_anal$성북구)
describe(dustdata_anal$중구)

# 성북구와 중구 미세먼지 농도 상자 그림 그리기

boxplot(dustdata_anal$성북구, dustdata_anal$중구,
        main = "finedust_compare", xlab = "AREA", names = c("성북구", "중구"),
        ylab = "FINEDUST_PM", col = c("blue", "green"))

# f 검정으로 지역별 미세먼지 농도의 분산 차이를 검정하기

var.test(dustdata_anal$중구, dustdata_anal$성북구)

# t 검정으로 지역별 미세먼지 농도의 평균 차이를 검정하기

t.test(dustdata_anal$중구, dustdata_anal$성북구, var.equal = T)

## 세 개 이상의 집단 간 평균 차이 검정하기: 분산분석

# 엑셀 파일 가져오기

library(readxl)
exdata1 <- read_excel("C:/Rstudy/Sample1.xlsx")
exdata1

# 경기, 서울, 제주 지역 Y20_CNT를 상자 그림으로 그리기

boxplot(formula = Y20_CNT ~ AREA, data = exdata1)

# 분산분석으로 세 집단 간 평균 차이 검정하기(1)

anova(lm(Y20_CNT ~ AREA, data = exdata1))

# 분산분석으로 세 집단 간 평균 차이 검정하기(2)

oneway.test(data = exdata1, Y20_CNT ~ AREA, var.equal = T)

Twitter Facebook LinkedIn

Sieun Kim

[R 실습] 01-3 서울시 지역별 미세먼지 농도 차이 비교하기

공유하기

참고

[CS] 1.1 디자인 패턴

[BIGDATA] 3-2 쿼리 엔진

[BIGDATA] 3-1 대규모 분산 처리의 프레임워크

[SQL] 08-3 GUI 응용 프로그램