Python - numpy 기본 복습, 개념정리

October 18, 2021 2 분 소요

numpy란?

— 고성능 수치계산을 위해 C언어로 구현된 파이썬 라이브러리. numpy란 이름은 ‘Numerical Python’의 줄임말.

— numpy에서 사용되는 다차원 리스트 데이터 타입 객체

파이썬 리스트는 연속되지 않은 물리적 메모리로 이루어져 있는데 (참조값들을 사용한 명시적 loop 사용), ndarray는 연속된 메모리 vectorization을 사용하기 때문에 속도가 더 빠르다.

np.array() : 리스트를 아규먼트로 받아 ndarray 객체 생성
np.arange() : 입력된 정수값에 따라 해당 길이의 넘파이 리스트 생성. 시작값과 끝값, 간격을 파라미터로 이용할 수도 있다.
np.ones() : 입력된 shape의 1 로만 이루어진 넘파이 리스트 생성
np.zeros() : 입력된 shape의 0 으로만 이루어진 넘파이 리스트 생성
np.empty() : 입력된 shape의 초기화된 값들로 이루어진 넘파이 리스트 생성
np.full() : 입력된 shape과 채울 값에 따라 넘파이 리스트 생성
np.eye() : 단위 행렬(unit matrix) 또는 항등 행렬(identity matrix)라 불리는 주대각 원소가 모두 1이고 나머지는 모두 0인 n x n 정사각 행렬 생성
np.linsapce() : 시작값, 끝값, 원소수를 파라미터로 받아 시작값부터 끝값까지 입력된 원소수만큼 균등한 간격으로 나눠진 넘파이 리스트 생성
np.reshape() : 기존 넘파이 리스트의 형태, 차원을 바꾸기 위해 사용. 단, 기존 리스트의 원소수가 바꾸려는 형태로 나뉘어 떨어질 수 있어야만 가능.

np.random.rand() : 0, 1 사이의 실수 분포로 랜덤한 ndarray 생성
np.random.randn() : 정규분포(normal distribution)로 샘플링된 랜덤 ndarray 생성
np.random.randint() : 특정 정수 사이에서 랜덤하게 샘플링
np.random.seed() : 랜덤값을 동일하게 생성하기 위한 시드. 랜덤 서브모듈 함수 실행 전 사용
np.random.choice() : 아규먼트로 주어진 1차원 ndarray로부터 랜덤샘플링. 정수를 입력하면 np.arange(해당숫자)로 간주
np.random.uniform() : 균등분포 기준으로 샘플링하여 넘파이 리스트 생성
np.random.normal() : randn() 과 파라미터만 다르고 동일하게 정규분포 기준으로 샘플링하여 넘파이 리스트 생성

np.reshape()
ravel(), np.ravel() : 다차원배열을 1차원으로 변경. order 파라미터 값을 ‘C’로 하면 row 우선 변경, ‘F’로 하면 column 우선 변경
flatten() : 마찬가지로 다차원배열을 1차원으로 변경
ravel과 flatten의 차이 : ravel은 얕은카피를 하여 참조값을 사용하기 때문에 원본 데이터에 영향을 주고, flatten은 딥카피를 하기 때문에 원본에 영향이 없음.

— 브로드캐스팅이 가능하며 배열의 모양에 유의하여 사용. 일반 연산기호로도 연산이 가능하다.