✉️

numpy, pandas 코드 정리

Tags
Python
ID matched
Created
Jan 6, 2023 09:34 AM
Last Updated
Last updated July 15, 2023
 
 
 

라이브러리 및 데이터 불러오기

import numpy as np import pandas as pd
 
 

Numpy

  • 데이터 불러오기
    • items = np.array([[20, 12.34, True, "A"], [12, 34.1, False, "B"], [43, 55.3, True, "A"], [45, 64.2, False, "C"], [23, 65.1, False, "E"], [65, 22.3, True, "A"], [9, 44.1, True, "B"], [122, 67.1, False, "C"], [567, 34.2, False, "C"]], dtype=object) items
      notion image
  • 모양 출력
    • items.shape
      notion image
  • 모양 변경
    • new_items = items.reshape((1,36)) print("shape:", new_items.shape) print("*" * 10) new_items
      notion image
  • 행렬 전치
    • items = items.transpose() print("shape:", items.shape) print("*" * 10) items
      notion image
  • 최솟값 및 최댓값 출력
    • min(items[0]), max(items[0])
      notion image
 
 

Pandas

  • 데이터 불러오기
    • df = pd.DataFrame([{"a": 20, "b": 12.34, "c": True, "d": "A"}, {"a": 12, "b": 34.1, "c": False, "d": "B"}, {"a": 43, "b": 55.3, "c": True, "d": "A"}, {"a": 45, "b": 64.2, "c": False, "d": "C"}, {"a": 23, "b": 65.1, "c": False, "d": "E"}, {"a": 65, "b": 22.3, "c": True, "d": "A"}, {"a": 9, "b": 44.1, "c": True, "d": "B"}, {"a": 122, "b": 67.1, "c": False, "d": "C"}, {"a": 567, "b": 34.2, "c": False, "d": "C"},]) df
      notion image
  • 데이터 프레임 정보 보기
    • df.info()
      notion image
  • 데이터 프레임 통계적 정보 보기
    • df.describe()
      notion image
  • 행 목록
    • df.index
      notion image
  • 열 목록
    • df.columns
      notion image
  • 인덱스에 의해 값 추출
    • df.iloc[:, :-1]
  • 열 추출 (Series 형태)
    • value = df['a'] print("type:", type(value)) print("*" * 10) value
      notion image
  • 열 추출 (DataFrame 형태)
    • value = df[['a']] print("type:", type(value)) print("*" * 10) value
      notion image
  • 여러 열 추출 (DataFrame 형태)
    • value = df[['a', 'c']] print("type:", type(value)) print("*" * 10) value
      notion image
  • 열의 분포값 확인
    • df['d'].unique()
      notion image
  • 열의 분포 확인
    • df[['d']].value_counts()
      notion image
  • 조건 하의 데이터 추출
    • df[df['b'] > 50]
      notion image
  • 데이터 프레임 병합 (열)
    • new_data = ["hello", "bye", "nice", "good", "apple", "banana", "tomato", "keyboard", "mouse"] pd.concat([df, pd.DataFrame(new_data, columns=['e'])], axis=1)
      notion image
  • 데이터 프레임 병합 (행)
    • new_data = {"a": 73, "b": 65.1, "c": True, "d": "B"} pd.concat([df, pd.DataFrame([new_data])], axis=0)
      notion image