[R 실습] 02-6 직업별 월급 차이
어떤 직업이 월급을 가장 많이 받을까?
#### 직업별 월급 차이 - "어떤 직업이 월급을 가장 많이 받을까?"
### 직업 변수 검토 및 전처리하기
## 변수 검토하기
class(welfare$code_job)
table(welfare$code_job)
## 전처리
library(readxl)
list_job <- read_excel("C:/Rstudy/Koweps_Codebook.xlsx", col_names = T, sheet = 2)
head(list_job)
## job 변수를 welfare에 결합하기
welfare <- left_join(welfare, list_job, by = "code_job")
welfare %>%
filter(!is.na(code_job)) %>%
select(code_job, job) %>%
head(10)
### 직업별 월급 차이 분석하기
## 직업별 월급 평균표 만들기
job_income <- welfare %>%
filter(!is.na(job) & !is.na(income)) %>%
group_by(job) %>%
summarise(mean_income = mean(income))
head(job_income)
## 월급을 내림차순으로 정렬하고 상위 10개 추출하기
top10 <- job_income %>%
arrange(desc(mean_income)) %>%
head(10)
top10
## 그래프 만들기
ggplot(data = top10, aes(x = reorder(job, mean_income), y = mean_income)) +
geom_col() +
coord_flip()
## 월급이 하위 10위에 해당하는 직업 추출하기
# 하위 10위 추출
bottom10 <- job_income %>%
arrange(mean_income) %>%
head()
bottom10
# 그래프 만들기
ggplot(data = bottom10, aes(x = reorder(job, -mean_income),
y = mean_income)) +
geom_col() +
coord_flip() +
ylim(0, 850)