데이터 과학이란 무엇입니까?
중요: 어떤 문제가 어떤 영역에 존재하는지 아는 능력
-
문제 정의
-
데이터 수집
-
데이터 다듬기
-
데이터 분석
-
데이터 시각화
개발 환경
-
IDE(단순/어려움, 높은 종속성, 높은 구현 어려움)
-
Jupyter Notebook(동시 시각화)
-
텍스트 편집기+명령줄(가벼움)
주피터 노트북 소개
핫키
Ctrl+엔터 : 같은 셀을 복사하여 붙여넣기
셀 선택 : 상단에 새 셀 추가
” +비 : 아래에
d+d : 선택한 셀 삭제
Alt+Enter : 현재 셀을 실행하고 아래 셀을 추가합니다.
- 모든 세포는 동일한 환경을 공유합니다.
티
실시간으로 연습
청각 장애인
수치 계산을 위한 Python 툴킷
- ndarray: n차원 배열
변수명=numpy.array(리스트)
변수명=numpy.full(n,m)
:n에서 m변수명=numpy.zeros(총개수,dtype=int)
: 모든 값을 0으로 설정변수명=numpy.ones(총개수,dtype=int)
: 모든 값을 1로 설정변수명=numpy.random.random(개수)
변수명=numppy.arange(f)
: 0에서 f-1까지의 값을 포함변수명=numpy.arange(n,m)
: n에서 m-1까지의 값을 포함합니다.변수명=numpy.arange(n,m,s)
: n에서 m-1까지 최대 s 간격변수명.shape
: numpy 배열 차원변수명.size
: 총 항목 수 - 인덱싱 → 변수 이름
- 슬라이싱 → 변수명(s:f)
- 요소 값에 대한 4가지 산술 연산이 가능합니다.
변수명* n
- 배열 간에 4개의 산술 연산이 가능합니다.
array1*array2
- 부울 연산 가능
- np.where
방법
- 최소 최대
- 평균
- 중앙값
- 기본값, 변수