데이터 처리 및 시각화 한번에 끝내기

Data Science with Python

데이터 처리 및 시각화 한번에 끝내기
Online Book

데이터 처리 및 시각화 한번에 끝내기

Data Science with Python

이수안
2024-02-01

소개

데이터 사이언스는 데이터를 수집, 처리, 분석하여 가치 있는 인사이트를 도출하는 분야입니다. 파이썬은 풍부한 라이브러리 생태계로 데이터 사이언스에 가장 적합한 언어입니다.

목차

1장: 데이터 사이언스 개요

  • 데이터 사이언스란?
  • 데이터 사이언스 프로세스
  • 필수 라이브러리 소개 (NumPy, Pandas, Matplotlib)
  • 개발 환경 설정

2장: NumPy 기초

  • 배열(Array) 생성
  • 배열 인덱싱과 슬라이싱
  • 배열 연산
  • 브로드캐스팅
  • 선형대수 연산

3장: Pandas 데이터 처리

  • Series와 DataFrame
  • 데이터 로딩 (CSV, Excel, JSON)
  • 데이터 선택과 필터링
  • 결측치 처리
  • 데이터 변환과 정제

4장: 데이터 시각화

  • Matplotlib 기초
  • 다양한 차트 유형 (선, 막대, 산점도, 히스토그램)
  • Seaborn을 이용한 통계 시각화
  • Plotly 인터랙티브 시각화

5장: 탐색적 데이터 분석 (EDA)

  • 기술 통계량
  • 분포 분석
  • 상관관계 분석
  • 이상치 탐지
  • 피처 엔지니어링

6장: 웹 크롤링과 데이터 수집

  • requests와 BeautifulSoup
  • Selenium을 이용한 동적 크롤링
  • API를 통한 데이터 수집
  • 데이터 저장 및 관리

7장: 통계 분석

  • 기술 통계
  • 추론 통계
  • 가설 검정
  • 회귀 분석
  • 분산 분석 (ANOVA)

8장: 실전 프로젝트

  • 공공데이터 분석
  • 소셜 미디어 데이터 분석
  • 시계열 데이터 분석
  • 보고서 작성

관련 강의