본문 바로가기

KT AIVLE DX 3기

[KT AIVLE SCHOOL_DX] 3주차 후기 (2/13 ~ 2/17)

728x90
일자 교육내용
2/13 판다스 데이터프레임 변경(1), (2)
2/14 판다스 데이터프레임 변경(2), (3), 종합실습
2/15 미니프로젝트 (개인)
2/16 미니프로젝트 (개인&조별)
2/17 미니프로젝트 (개인&조별)

# 2/13 

오늘은 새로운 수업을 시작하기 전, 구글 코랩을 사용하는 방법을 간단히 배우며 지난주 수업 내용을 복습하는 시간을 가졌습니다. 그리고 수업은 지난주까지 사용했던 주피터 노트북이 아닌 주피터랩을 사용해 실습을 진행했습니다. 사용법은 비슷한 것 같았지만 다양한 개발환경을 접할 수 있어서 좋았습니다.

이번 수업에서는 데이터프레임의 열을 편집하고, 데이터가 연속값인 경우, 구간을 나누어 범주값으로 표현하는 방법을 배웠으며, 이를 시각화하는 경험을 했습니다. 그리고 데이터프레임 내에 있는 결측치를 찾아 이를 처리하는 방법을 배웠습니다.

수업이 끝날 때쯤, 미니프로젝트의 조편성이 발표되었습니다. 한 조당 7명씩 배정되었으며, 해당 조로 수요일부터 3일간 프로젝트를 진행된다는 공지사항을 지난주에 확인했었기 때문에 수요일이 기대되었습니다.

그리고 오늘부터 1차 코딩 마스터스가 시작되었습니다. 총 100개의 알고리즘 문제를 약 한 달의 기간 동안 푸는 것인데, 오늘이 첫날인데도 이미 많은 문제를 푸신 에이블러님들이 계셔서 놀랐습니다. 저는 아직 기한이 많이 남아서 천천히 풀어보아야겠습니다.


# 2/14

오늘은 전날에 배운 데이터프레임 변경 수업을 이어서 데이터프레임의 범주형 데이터를 가변수화하고, 여러 개의 데이터프레임을 합치는 방법을 배웠습니다. 그리고 지금까지 배운 내용을 모두 활용하여 데이터를 탐색하고, 전처리 한 뒤, 분석하여 시각화하는 종합실습을 진행했습니다. 배운 지 조금 지났다고 잊은 부분이 있어서 조금 시간이 걸리기는 했지만, 배운 내용을 다시 복습할 수 있어서 좋았습니다. 

오늘로 데이터 다듬기 과정이 종료되었고, 또다시 셀프테스트가 있었습니다. 저번 테스트와 같이 객관식 10문제가 출제되었고, 개념 부분에 대한 문제는 조금 헷갈렸지만, 이번에는 저번처럼 실수하지 않기 위해 문제를 꼼꼼하게 보려고 노력했습니다.


# 2/15

오늘부터 1차 미니프로젝트가 시작되었습니다. 미니프로젝트가 시작되면서 새로운 강사님이 오셨고, 첫날은 개인 프로젝트로만 진행되어 따로 조별 활동은 없었습니다.

지금까지는 강사님이 수업 실습을 위해 어느 정도 정리가 되어있는 데이터를 제공해 주셔서 이를 사용했었지만, 미니 프로젝트에서는 서울 열린 데이터광장에서 실제로 제공하는 공공데이터를 다운로드하여 수업이 진행되었습니다. 그렇다 보니 데이터의 양이 비교도 안될 정도로 많았습니다. 이후 다운로드한 데이터를 연도별로 스케일링하고, 이상치를 처리하는 실습을 진행했습니다. 정해진 시간 동안 실습을 자율적으로 진행하다 보니 저는 이상치나 결측치가 있는 행을 무조건 삭제해 버렸는데, 나중에 삭제가 아닌 다른 방법으로 처리해 달라는 강사님의 말씀이 있으셔서 다시 처음부터 데이터를 가지고 와 수정해야 했습니다.

수업이 끝난 후, 전날 보았던 셀프테스트의 결과가 나왔습니다. 이번에는 저번 테스트와 달리 모든 문제를 맞혀 기분이 좋았습니다. 다음에 있을 테스트에서도 이번처럼 좋은 결과를 얻을 수 있으면 좋겠습니다.

 

https://data.seoul.go.kr/


# 2/16

오늘부터 조원들과 함께하는 프로젝트가 시작되었습니다.

오전에는 강사님의 설명과 함께 개인별로 실습을 진행했으며, 오후에는 조별로 실습을 진행하면서 중간에 들어오시는 튜터님께 궁금한 점을 질문하는 방식으로 진행되었습니다. 조별로 실습 진행방식이 다를 것 같긴 하지만 저희 조의 경우, 비대면으로 진행하다 보니 조별 실습시간 중 일정 시간 동안 혼자서 문제를 풀어보고, 이후에 모르는 부분을 공유해 서로 도와주는 방식으로 진행했습니다. 오전에 들었던 수업 내용과 비슷했고, 이마저도 강사님께서도 거의 모두 힌트를 주셨기 때문에 실습문제의 난이도가 많이 높지는 않아 수월하게 진행할 수 있었습니다. 문제를 풀고 나서 조원분들과 토의를 진행했는데, 조원분들의 수준 높은 질문에 조금 놀랐습니다. 실습 중 pivot_table을 활용하여 데이터를 집계하는 문제가 있었는데, 자료형이 int였던 열이 pivot_table로 집계된 후에는 float타입으로 변환되어 반환된다는 부분이었습니다.

저는 이런 부분이 있었다는 것을 전혀 모르고 있었는데, 조원분들 중 여러 명이 해당 부분을 인지하고 계셨고, 해결방안데 대해 생각하고 계셨습니다. 그래서 해당 부분에 대해 의견을 나누다가 나중에 들어오신 튜터님께 질문을 드렸습니다.

저는 큰 문제가 없다면 무언가에 대한 의문점을 가지지도 않고, 스스로 찾으려고도 하지 않는 편인데, 이렇게 의문점을 찾고 스스로 탐구하시는 조원분들을 보면서 많이 배웠습니다.


# 2/17

오늘도 어제와 같이 오전에는 강사님과 실습을 진행하고, 오후에는 조별로 실습을 진행하는 시간을 가졌습니다.

저희 조는 전날처럼 시간을 정해두고, 혼자서 문제를 푸는 시간을 가졌는데, 튜터님께서 중간에 들어오셔서 전날 질문의 답변을 해주셨습니다. float타입으로 반환된 이유는 해당 열의 결측치가 있기 때문인데, 이를 해결하기 위해 해당 열의 자료형을 결측치 처리가 가능한 확장된 정수 형식인 Int64로 변환시킨 후  pivot_table을 구하면 정수값으로 반환된다고 하셨습니다. 해결방법과 이유뿐만이 아니라 관련된 참고문헌까지 꼼꼼하게 제시해 주셔서 감사했습니다.

오늘로써 1차 미니프로젝트 종료되었고, 3일간 실습한 내용에 대한 셀프테스트가 진행되었습니다. 이번에는 실습에서 사용했던 데이터를 사용해 코드를 돌려야 답을 얻을 수 있는 문제들이 있다 보니 전에 진행했던 셀프테스트보다 시험 시간이 길었습니다. 하나씩 꼼꼼하게 풀었지만, 조금 이해가 안 되는 문제가 있었기 때문에 다음 주에 나올 결과가 궁금해졌습니다.


[3주차 후기]

처음으로 진행된 미니 프로젝트로 인해 즐거웠습니다.

연습용 데이터가 아닌 실제 공공데이터를 사용해 보니 새로웠고, 같은 반 분들과 조별로 나뉘어 활동을 진행해 많은 것을 배울 수 있는 시간이었습니다. 종합실습과 프로젝트를 진행하면서 배운 지 오래되지 않았는데도 잊어버리는 내용이 꽤 있다는 것에 조금 충격을 받았습니다.

해당 부분을 개선하기 위해 배운 내용을 정리해야겠다고 생각했고, 강사님께서도 cheat sheet를 만들어 보는 것을 추천해 주셨기 때문에 노션을 사용해 보기로 정했습니다. 첫 수업부터 배운 내용을 다시 복습하면서 조금씩 정리하고 있는데, 앞으로 진행될 수업 진도에 맞추기 위해서 틈날 때마다 정리해야 할 것 같습니다.

728x90