최대 1 분 소요

# 엑셀 파일 가져오기

library(readxl)
dustdata <- read_excel("C:/Rstudy/dustdata.xlsx")

View(dustdata)
str(dustdata)


# 성북구와 중구 데이터만 추출하기

library(dplyr)
dustdata_anal <- dustdata[, c("날짜", "성북구", "중구")]
View(dustdata_anal)


# 결측치 확인하기

is.na(dustdata_anal)

sum(is.na(dustdata_anal))


# 지역별 미세먼지 농도의 기술통계량 구하기

library(psych)

describe(dustdata_anal$성북구)
describe(dustdata_anal$중구)


# 성북구와 중구 미세먼지 농도 상자 그림 그리기

boxplot(dustdata_anal$성북구, dustdata_anal$중구,
        main = "finedust_compare", xlab = "AREA", names = c("성북구", "중구"),
        ylab = "FINEDUST_PM", col = c("blue", "green"))


# f 검정으로 지역별 미세먼지 농도의 분산 차이를 검정하기

var.test(dustdata_anal$중구, dustdata_anal$성북구)


# t 검정으로 지역별 미세먼지 농도의 평균 차이를 검정하기

t.test(dustdata_anal$중구, dustdata_anal$성북구, var.equal = T)





## 세 개 이상의 집단 간 평균 차이 검정하기: 분산분석

# 엑셀 파일 가져오기

library(readxl)
exdata1 <- read_excel("C:/Rstudy/Sample1.xlsx")
exdata1


# 경기, 서울, 제주 지역 Y20_CNT를 상자 그림으로 그리기

boxplot(formula = Y20_CNT ~ AREA, data = exdata1)


# 분산분석으로 세 집단 간 평균 차이 검정하기(1)

anova(lm(Y20_CNT ~ AREA, data = exdata1))


# 분산분석으로 세 집단 간 평균 차이 검정하기(2)

oneway.test(data = exdata1, Y20_CNT ~ AREA, var.equal = T)