본문 바로가기
기타/학습일지

[Upstage AI Lap 2기] 5주차

by whybe 2024. 1. 11.

5주차에는 EDA 프로젝트를 진행하기 위한 파이썬의 대표적인 라이브러리 4가지를 배웠다. 각 라이브러리의 용도를 간략하게 표현하면 다음과 같다.

  • pandas : 데이터프레임을 다루기 위한 라이브러리
  • numpy : 수치 계산을 위한 라이브러리
  • seaborn & matpliotlib : 데이터 시각화를 위한 라이브러리 

사실 직전학기에도 다뤘던 내용들이고 직전학기 뿐만 아니라 데이터사이언스와 인공지능을 공부하면서 여러번 다뤘던 라이브러리들이라 이번 주차에는 새로운 내용을 얻어가지는 못했다. 다만 필요할 때마다 사용하는 라이브러리들이라 익숙해지면 좋다는 생각에 집중하려고 노력했다. 강의 내용과 기존 지식을 바탕으로 이번 EDA 프로젝트로 축구 데이터를 분석해보기로 했다. 프로젝트를 진행하면서 나온 결과들은 다음과 같다. (15-16 시즌 EPL 우승팀인 레스터시티를 중점으로 다뤘다.)

시각화를 잘하지는 못하지만 내가 생각했던대로 시각화가 이루어졌을 때 나름 뿌듯했다. 시각화는 결국 데이터를 이해하기 위한 목적에서 이루어지는데, 데이터를 다루면서 왜 도메인이 중요한지를 이번 프로젝트를 진행하면서 체감했다. 도메인의 특성이나  도메인에서 사용하는 통계치 등을 이해해야 각 변수 간의 연관성을 파악하거나 어떤 방법을 시각화하는 것이 적합한지를 선택할 수 있는 거 같다. 한편으로는 EDA 프로젝트가 끝나고 나서야 통계 이론을 공부하는데 통계에 대한 지식이 있는 수강생들은 상관없지만 통계를 전혀 배우지 않은 수강생들에게 있어 통계 이론을 먼저 배우고 EDA를 진행했다면 통계에서 배우는 기법들을 적용할 수 있는 기회가 되지 않았을까 하는 아쉬움이 들었다.

강의자료의 일부

'기타 > 학습일지' 카테고리의 다른 글

[Upstage AI lab 2기] 10주차  (0) 2024.02.16
[Upstage AI lab 2기] 8주차  (0) 2024.02.02
[Upstage AI Lap 2기] 7주차  (0) 2024.01.24
[Upstage AI Lap 2기] 1주차 - (2)  (0) 2023.12.13
[Upstage AI Lap 2기] 1주차 - (1)  (0) 2023.12.12