코드잇_데이터 사이언스

데이터 과학이란 무엇입니까?

중요: 어떤 문제가 어떤 영역에 존재하는지 아는 능력

  1. 문제 정의

  2. 데이터 수집

  3. 데이터 다듬기

  4. 데이터 분석

  5. 데이터 시각화

개발 환경

  1. IDE(단순/어려움, 높은 종속성, 높은 구현 어려움)

  2. Jupyter Notebook(동시 시각화)

  3. 텍스트 편집기+명령줄(가벼움)

주피터 노트북 소개

핫키

Ctrl+엔터 : 같은 셀을 복사하여 붙여넣기

셀 선택 : 상단에 새 셀 추가

” +비 : 아래에

d+d : 선택한 셀 삭제

Alt+Enter : 현재 셀을 실행하고 아래 셀을 추가합니다.

  • 모든 세포는 동일한 환경을 공유합니다.

실시간으로 연습

https://stackedit.io/app#

청각 장애인

수치 계산을 위한 Python 툴킷

  • ndarray: n차원 배열
    변수명=numpy.array(리스트)
    변수명=numpy.full(n,m) :n에서 m
    변수명=numpy.zeros(총개수,dtype=int): 모든 값을 0으로 설정
    변수명=numpy.ones(총개수,dtype=int): 모든 값을 1로 설정
    변수명=numpy.random.random(개수)
    변수명=numppy.arange(f): 0에서 f-1까지의 값을 포함
    변수명=numpy.arange(n,m): n에서 m-1까지의 값을 포함합니다.
    변수명=numpy.arange(n,m,s): n에서 m-1까지 최대 s 간격
    변수명.shape: numpy 배열 차원
    변수명.size: 총 항목 수
  • 인덱싱 → 변수 이름
  • 슬라이싱 → 변수명(s:f)
  • 요소 값에 대한 4가지 산술 연산이 가능합니다. 변수명* n
  • 배열 간에 4개의 산술 연산이 가능합니다. array1*array2
  • 부울 연산 가능
  • np.where

    방법

    • 최소 최대
    • 평균
    • 중앙값
    • 기본값, 변수


코드잇_데이터 사이언스 1