데이터 처리 및 시각화 한번에 끝내기
Data Science with Python

Online Book
데이터 처리 및 시각화 한번에 끝내기
Data Science with Python
이수안
2024-02-01
소개
데이터 사이언스는 데이터를 수집, 처리, 분석하여 가치 있는 인사이트를 도출하는 분야입니다. 파이썬은 풍부한 라이브러리 생태계로 데이터 사이언스에 가장 적합한 언어입니다.
목차
1장: 데이터 사이언스 개요
- 데이터 사이언스란?
- 데이터 사이언스 프로세스
- 필수 라이브러리 소개 (NumPy, Pandas, Matplotlib)
- 개발 환경 설정
2장: NumPy 기초
- 배열(Array) 생성
- 배열 인덱싱과 슬라이싱
- 배열 연산
- 브로드캐스팅
- 선형대수 연산
3장: Pandas 데이터 처리
- Series와 DataFrame
- 데이터 로딩 (CSV, Excel, JSON)
- 데이터 선택과 필터링
- 결측치 처리
- 데이터 변환과 정제
4장: 데이터 시각화
- Matplotlib 기초
- 다양한 차트 유형 (선, 막대, 산점도, 히스토그램)
- Seaborn을 이용한 통계 시각화
- Plotly 인터랙티브 시각화
5장: 탐색적 데이터 분석 (EDA)
- 기술 통계량
- 분포 분석
- 상관관계 분석
- 이상치 탐지
- 피처 엔지니어링
6장: 웹 크롤링과 데이터 수집
- requests와 BeautifulSoup
- Selenium을 이용한 동적 크롤링
- API를 통한 데이터 수집
- 데이터 저장 및 관리
7장: 통계 분석
- 기술 통계
- 추론 통계
- 가설 검정
- 회귀 분석
- 분산 분석 (ANOVA)
8장: 실전 프로젝트
- 공공데이터 분석
- 소셜 미디어 데이터 분석
- 시계열 데이터 분석
- 보고서 작성
