이 과정에서는 학습자에게 람다, csv 파일 읽기 및 조작, numpy 라이브러리와 같은 기본적인 파이썬 프로그래밍 기술을 포함하여 파이썬 프로그래밍 환경의 기본 사항을 소개합니다. 이 과정에서는 인기 있는 python pandas 데이터 과학 라이브러리를 사용하여 데이터 조작 및 정리 기술을 소개하고 데이터 분석을 위한 중심 데이터 구조로 Series 및 DataFrame의 추상화를 소개하고 groupby, merge 및 pivot 테이블 같은 함수를 효과적으로 사용하는 방법에 대한 튜토리얼을 제공합니다. 이 과정이 끝나면 학생들은 표 형식의 데이터를 가져와 정리하고 조작하고 기본 추론 통계 분석을 실행할 수 있습니다.
이 과정은 다른 ‘파이썬을 사용한 응용 데이터 과학’ 과정보다 먼저 수강해야 합니다. 파이썬의 응용 플로팅, 차트 및 데이터 표현, 파이썬의 응용 머신 러닝, 파이썬의 응용 텍스트 마이닝, 파이썬의 응용 소셜 네트워크 분석.
Overview
Syllabus
- 파이썬을 사용한 데이터 조작의 기초
- 이번 주에는 데이터 과학 분야를 소개하고, 데이터 과학자가 사용하는 일반적인 파이썬 기능 및 특징을 검토하고, 강의를 위해 Coursera Jupyter Notebook을 소개합니다. 채점, 전제 조건 및 기대치에 대한 모든 코스 정보는 강의 계획서에 있으며 과정 리소스 페이지에서 Jupyter Notebook에 대한 자세한 정보를 찾을 수 있습니다.
- pandas를 사용한 기본 데이터 처리
- 이번 주 과정에서는 파이썬이 데이터 정리 및 처리를 위해 가지고 있는 가장 중요한 툴킷 중 하나인 pandas의 기초를 배우게 됩니다. DataFrame 구조로 데이터를 읽는 방법, 이러한 구조를 쿼리하는 방법, 이러한 구조에 대한 세부 정보가 인덱싱되는 방법을 배우게 됩니다.
- pandas로 더 많은 데이터 처리
- 이번 주에는 DataFrame을 병합하고, 요약 테이블을 생성하고, 데이터를 논리적 조각으로 그룹화하고, 날짜를 조작하는 방법을 학습하여 python pandas 라이브러리에 대한 이해를 심화할 것입니다. 또한 데이터 규모에 대한 이해를 새롭게 하고 분석을 위한 메트릭 생성과 관련된 문제에 대해 논의합니다. 일주일은 더 중요한 프로그래밍 과제로 끝납니다.
- 지저분한 데이터로 질문에 답하기
- 이번 주 과정에서는 분포, 샘플링 및 t-검정과 같은 다양한 통계 기법을 소개합니다. 한 주가 과학에 대한 두 가지 토론과 네 번째 패러다임인 데이터 기반 발견의 부상으로 마무리됩니다.
Taught by
Nora Duong