728x90
반응형

data 3

🔥 ARIMA (AutoRegressive Integrated Moving Average) 모델 개요

ARIMA(자동 회귀 누적 이동 평균, AutoRegressive Integrated Moving Average)는 시계열 데이터 예측에 널리 사용되는 통계적 모델입니다. 주로 트렌드와 패턴을 분석하여 미래 값을 예측하는 데 사용됩니다.✅ 1. ARIMA 모델의 구성 요소ARIMA 모델은 3가지 주요 요소로 구성됩니다:AR (AutoRegressive, 자기회귀) - p과거 데이터(시간 t 이전의 값)를 사용하여 현재 값을 예측하는 모델예: y(t) = ϕ₁ y(t-1) + ϕ₂ y(t-2) + ... + ε(t)과거 값이 현재 값에 영향을 미치는 정도를 조정하는 p (시차 개수) 결정I (Integrated, 차분) - d데이터가 비정상성(Non-stationary, 시간에 따라 평균과 분산이 변하는 ..

Data Analysis Log 2025.03.10

[Day 2] SQL을 활용한 데이터 추출 및 가공

📌 개요SQL(Structured Query Language)은 관계형 데이터베이스에서 데이터를 저장, 조회, 수정, 삭제하는 표준 언어입니다. 데이터 사이언스와 머신러닝 프로젝트에서도 데이터 전처리 과정에서 필수적으로 사용됩니다. 이번 포스팅에서는 SQL의 기본 문법과 실전에서 활용할 수 있는 쿼리 기법을 살펴보겠습니다.1️⃣ SQL이란?SQL은 관계형 데이터베이스(RDB)에서 데이터를 다루기 위한 언어로, MySQL, PostgreSQL, SQLite, Oracle 등 다양한 DBMS에서 사용됩니다.🔹 SQL의 주요 기능데이터 조회 (SELECT)데이터 삽입 (INSERT)데이터 수정 (UPDATE)데이터 삭제 (DELETE)테이블 생성 및 구조 변경 (CREATE, ALTER, DROP)2️⃣ ..

Daily Data Log 2025.03.07

[Day 1] Pandas로 데이터 핸들링 기본기 다지기

📌 개요Pandas는 데이터 분석과 조작을 위한 강력한 Python 라이브러리로, 데이터 사이언스 및 머신러닝 프로젝트에서 필수적으로 사용됩니다. 이번 포스팅에서는 Pandas의 핵심 기능을 정리하고, 실습을 통해 기본적인 데이터 핸들링 방법을 익혀보겠습니다.1️⃣ Pandas란?Pandas는 표 형태(테이블) 데이터 처리를 위한 라이브러리로, DataFrame과 Series라는 두 가지 주요 데이터 구조를 제공합니다.Series: 1차원 배열 구조 (index + value)DataFrame: 2차원 테이블 구조 (행과 열로 구성됨)import pandas as pdimport numpy as np# Series 예제s = pd.Series([10, 20, 30, 40], index=['a', 'b'..

Daily Data Log 2025.03.06
728x90
반응형