Python 연습/1. Python 설치와 실습 - 아나콘다

Q_01_06. 통계분석에서 자주 사용되는 파이썬 라이브러리는?

Python통컨 2025. 3. 20. 17:13

통계분석에서 자주 사용되는 대표적인 라이브러리는 다음과 같습니다:

  1. Pandas: 데이터 처리와 분석을 위한 라이브러리로, 데이터 프레임을 다루기 위한 다양한 기능을 제공합니다.
  2. NumPy: 수치 데이터를 처리하기 위한 라이브러리로, 특히 다차원 배열을 효과적으로 다룰 수 있습니다.
  3. SciPy: 고급 수학, 과학 및 공학 계산을 위한 라이브러리로, 통계 함수와 확률 분포 등을 제공합니다.
  4. Statsmodels: 통계 모델을 만들고, 회귀 분석, 시계열 분석, 가설 검정 등을 수행하는 데 사용됩니다.
  5. Matplotlib: 데이터 시각화를 위한 라이브러리로, 그래프와 플롯을 그릴 때 사용됩니다.
  6. Seaborn: Matplotlib 기반의 고급 시각화 라이브러리로, 통계적 플롯을 쉽게 그릴 수 있습니다.
  7. scikit-learn: 머신러닝 라이브러리지만, 통계적 분석 및 데이터 전처리에도 많이 사용됩니다.

이 라이브러리들은 파이썬을 사용하는 통계 분석가들이 자주 활용하는 도구입니다.

Numpy

Numerical Python 의 준말
수학, 과작 연산작업을 위한 라이브러리로 수치해석 및 통계관련 기능을 구현할 때 기본적으로 사용됩니다. Numpy 는 C, Fortran으로 작성되어 실행 속도가 빠른 편자료의 기본적인 배열 구조를 제공하며 행렬 연산 등을 지원합니다
Pandas, Matplolib, Scipy, Sklearn 등 여러 라이브러리와 같이 사용되는 경우가 많음
넘파이 사이트 – www.numpy.org, 넘파이와 관련 정보를 구함

Pandas

pandas.pydta.org
맥컴 수학전공 재무분석
데이터 분석 및 통계
DataFrame 과 Series 객체를 제공
R의 data.frame 과 비슷 – 테이블 형태

Matplotlib

그래프나 2차원 데이터 등 시각화 하는 기능을 지원합니다.
matplotlib.org

Statmodels

 

통계적인 모델 분석에 대한 기능을 제공합니다.
www.statmodels.org/stable/index.html

Scipy

수학 및 과학 기술 분야의 다양한 연산 등을 지원하는 라이브러리.
미적, 적분, 방정식 해를 구하는 등에 사용평균, 표준편차, 사분위수 등 기술통계량과 다향 통계분석을 지원 www.scipy.org

Scikit-learn

기계학습 라이브러리 https://scikit-learn.org/stable/
각 알고리즘에 대한 상세한 정보와 다양한 옵션
문서사용자 가이드 https://scikit-learn.org/stable/user_guide.html
API 문서 https://scikit-learn.org/stable/modules/classes.html
Numpy 와 Scipy를 사용합니다.

버전 살펴보기

import sys
sys.version

import pandas as pd
pd.version

import matplotlib as plt;
plt.version

import numpy as np;
np.version
import scipy as sp;sp.version