본문 바로가기

KT AIVLE DX 3기

[KT AIVLE SCHOOL_DX] 7주차 후기 (3/13 ~ 3/17)

728x90
일자 교육내용
3/13 성능예측(2), Random Search, Grid Search
3/14 앙상블
3/15 3차 미니프로젝트
3/16 3차 미니프로젝트
3/17 3차 미니프로젝트

# 3/13 성능예측(2), Random Search, Grid Search, 3차 미니프로젝트 조원발표

오늘은 모델의 성능을 예측하는 방법과 성능을 향상시키기 위한 옵션을 찾는 방법인 Random Search와 Grid Search에 대해 배웠습니다. 알고리즘을 사용하여 모델링을 할 때, 모델을 최적화하기 위해 조절할 수 있는 옵션을 하이퍼파리미터라고 합니다. 이 하이퍼파라미터 값을 어떻게 설정하느냐에 따라 모델의 성능이 달라집니다. 따라서 최적의 값을 찾는 다양한 시도를 해야 하는데, 그 방법이 바로 Random Search와 Grid Search입니다. 그중 Random Search의 경우, 파라미터 값 범위를 모두 사용하는 Grid Search 와는 달리 파라미터 값 중에서 일부를 선택하여 학습하기 때문에 n_iter옵션을 지정해주어야 한다는 점을 알았습니다.
오늘은 수요일부터 시작되는 3차 미니프로젝트의 조원이 발표되었습니다.  이번 미니 프로젝트는 대면으로 진행하기로 조원들과 결정하여 처음으로 대면 교육장을 예약하게 되었습니다. 수도권 반의 경우, 교육장이 분당과 ICT이노베이션스퀘어 두 곳으로 나뉘는데, ICT이노베이션스퀘어 같은 경우는 수용인원이 적어 마감이 빨리되었습니다. 그래서 저희 조는  분당교육장으로 예약했습니다.


# 3/14 앙상블_보팅, 배깅, 스태킹

오늘은 앙상블 기법에 대해 배웠습니다.
앙상블은 여러 개의 모델을 결합하여 더 성능이 좋은 모델을 생성하는 기법으로 그 방법에는 보팅과 배깅, 부스팅, 스태킹 등이 있습니다. 이론 설명을 들은 후, 실습수업에서는 배깅의 가장 대표적인 알고리즘인 랜덤포레스트와 부스팅의 알고리즘인 XGBoost,  LightGBM 알고리즘으로 모델링하고, 성능을 비교했습니다.


# 3/15 3차 미니프로젝트_탐색적 데이터 분석, Feature 분석

오늘부터 3차 미니프로젝트가 시작되었습니다.
처음으로 대면 교육장에 가보게 되었는데, 정자역 3번 출구로 나오면 바로 kt본사로 가는 노선의 마을버스가 있어서 오는 것이 편했습니다. 본사에 도착한 후, 로비에 있는 안내데스크에서 신분증을 제출하고, 출입증과 바꾼 뒤 3층에 위치한 교육장으로 향했습니다.

분당 교육장

오늘 진행된 프로젝트에서는 주어진 데이터를 6가지로 분류하는 AI 모델링을 수행한 뒤 모델 성능 평가 지표를 출력하였으며, Random Forest 알고리즘을 사용한 모델링을 통해 중요도가 상/하위인 feature 들을 선별하고 해당 feature의 데이터 분포와 중요도를 확인하는 실습을 진행했습니다.


# 3/16 3차 미니프로젝트_다양한 모델, 모델 튜닝

오늘은 전날 프로젝트에서 사용했던 데이터와 동일한 데이터를 가지고, SVM과 KNN, Logistic Regression, GBM, XGBoost 알고리즘을 사용하여 모델링하고 정확도를 비교해 보았습니다. 분석 결과, XGBoost 알고리즘이 선택되었습니다. 선택한 XGBoost 알고리즘을 가지고, 'Hyper Parameter Tuning' 튜닝기법과 'Feature Selection' 튜닝기법을 사용해 더 높은 정확도를 가지는 모델을 만드는 실습을 진행하였습니다.

AI모델 별 accuracy_score, f1_score

 


# 3/17 3차 미니프로젝트_모델 검증, 행동 추론 

오늘은 test 데이터셋을 사용하여 그동안 만들고 튜닝해 온 모델에 데이터를 학습시켜 정확도를 확인하는 실습을 진행하였습니다. 전날 튜닝까지 마친 튜닝한 XGBoost 알고리즘을 사용해 모델을 생성하고, 시각화를 통해 train 데이터셋 학습결과와 비교하였습니다. 또한 6가지 중 한 가지를 특정해 분류하는 모델을 만들어 해당 모델의 정확도와 데이터를 정리하였습니다.


[7주차 후기]

3차 미니프로젝트가 시작되고, 처음으로 분당 교육장에 가보았습니다. 집에서부터 교육장까지 왕복 3시간 반 정도 걸리는 것은 학교를 다니면서 익숙해졌다고 생각했는데, 오랜만이라 그런지 꽤 힘들었습니다. 아무래도 대학에서는 9시부터 5시까지 풀타임으로 수업이 진행되지 않았기 때문인 것 같습니다. 그래도 이번 3차 미니프로젝트는 저번에 진행되었던 2차 미니프로젝트에 비해 수월해서 다행이었습니다.

728x90