# 엑셀 파일 가져오기
library(readxl)
dustdata <- read_excel("C:/Rstudy/dustdata.xlsx")
View(dustdata)
str(dustdata)
# 성북구와 중구 데이터만 추출하기
library(dplyr)
dustdata_anal <- dustdata[, c("날짜", "성북구", "중구")]
View(dustdata_anal)
# 결측치 확인하기
is.na(dustdata_anal)
sum(is.na(dustdata_anal))
# 지역별 미세먼지 농도의 기술통계량 구하기
library(psych)
describe(dustdata_anal$성북구)
describe(dustdata_anal$중구)
# 성북구와 중구 미세먼지 농도 상자 그림 그리기
boxplot(dustdata_anal$성북구, dustdata_anal$중구,
main = "finedust_compare", xlab = "AREA", names = c("성북구", "중구"),
ylab = "FINEDUST_PM", col = c("blue", "green"))
# f 검정으로 지역별 미세먼지 농도의 분산 차이를 검정하기
var.test(dustdata_anal$중구, dustdata_anal$성북구)
# t 검정으로 지역별 미세먼지 농도의 평균 차이를 검정하기
t.test(dustdata_anal$중구, dustdata_anal$성북구, var.equal = T)
## 세 개 이상의 집단 간 평균 차이 검정하기: 분산분석
# 엑셀 파일 가져오기
library(readxl)
exdata1 <- read_excel("C:/Rstudy/Sample1.xlsx")
exdata1
# 경기, 서울, 제주 지역 Y20_CNT를 상자 그림으로 그리기
boxplot(formula = Y20_CNT ~ AREA, data = exdata1)
# 분산분석으로 세 집단 간 평균 차이 검정하기(1)
anova(lm(Y20_CNT ~ AREA, data = exdata1))
# 분산분석으로 세 집단 간 평균 차이 검정하기(2)
oneway.test(data = exdata1, Y20_CNT ~ AREA, var.equal = T)