반응형

분류 전체보기 103

제로베이스 데이터사이언스 스쿨 - Part 04. 기초 통계-7

Chapter 01. 기초통계_기초과정 모집단 · 표본 · 표본분포 개념 요약모집단(Population): 전체 대상의 집합표본(Sample): 모집단에서 추출한 일부 데이터표본추출(Sampling): 모집단에서 표본을 뽑는 과정표본분포(Sampling distribution): 표본으로 계산된 통계량이 이루는 분포중심극한정리(CLT): 표본의 크기가 충분히 크면 표본평균은 정규분포를 따른다불균형 데이터(Imbalanced data): 클래스 비율 차이로 발생하는 문제Sampling 기법: Oversampling / Undersampling 등1. 모집단(Population)과 표본(Sample)모집단과 표본의 개념모집단(Population)우리가 알고 싶은 전체 데이터의 집합평균: μ분산: σ²표본(..

데이터 2025.11.14

제로베이스 데이터사이언스 스쿨 - Part 04. 기초 통계-6

Chapter 01. 기초통계_기초과정 연속형 확률분포 완전 정리 (pdf · cdf · 균일 · 정규 · 지수) 1. 주요 개념 요약확률밀도함수(pdf)연속형 확률변수 X의 “확률 분포 형태”를 나타내는 함수모든 x에 대해 f(x) ≥ 0전체 면적 = 1구간 확률은 면적P(X = a) = 0 → 경계 포함 여부는 중요하지 않다.누적분포함수(cdf)“특정 값 이하일 확률”pdf의 적분구간 확률 균일분포(Uniform)X ~ U(a, b) pdf 평균, 분산​정규분포(Normal)X ~ N(μ, σ²) pdf특징종 모양, 대칭자연계 대부분의 값이 근사적으로 따름평균 μ, 분산 σ²로 완전히 결정표준정규변환​이항분포의 정규 근사n이 충분히 크면지수분포(Exponential)X ~ Exp(λ)어떤 사건이 “..

데이터 2025.11.13

제로베이스 데이터사이언스 스쿨 - Part 04. 기초 통계-5

Chapter 01. 기초통계_기초과정 연속형 확률분포 (Continuous Probability Distributions) 주요 개념연속형 확률변수란 셀 수 없는 실수 범위의 값을 가질 수 있는 변수를 말한다.예를 들어 사람의 키, 체중, 시간, 거리, 온도 등은 연속형 데이터다.이때 확률은 단일 값이 아닌 구간으로 계산되며,이를 위해 확률밀도함수(Probability Density Function, PDF)를 사용한다.1. 확률밀도함수 (PDF, Probability Density Function)연속형 확률변수 X의 확률분포는 확률밀도함수 f(x)로 정의된다.f(x)는 아래 조건을 만족해야 한다. 1. 모든 X에 대해 f(x) ≥ 02. 전체 구간의 확률합은 13. 구간 [a, b]의 확률은 즉, ..

데이터 2025.11.12

제로베이스 데이터사이언스 스쿨 - Part 04. 기초 통계-4

Chapter 01. 기초통계_기초과정 이산형 확률분포 (Discrete Probability Distributions) 주요 개념이산형 확률분포는 확률변수가 ‘셀 수 있는 값(정수형)’을 가지는 분포이다.즉, 주사위 눈, 동전 던지기, 고객 수처럼 결과가 유한하거나 셀 수 있는 경우를 다룬다.이 단원에서는 세 가지 대표적인 이산형 분포를 다룬다:1️⃣ 이항분포 (Binomial Distribution)2️⃣ 포아송분포 (Poisson Distribution)3️⃣ 기하분포 (Geometric Distribution)1. 이항분포 (Binomial Distribution)정의:n번의 독립된 시행에서 사건 A가 한 번 성공할 확률이 p일 때,성공 횟수 X의 확률분포를 이항분포라 한다.X ~ B(n, p..

데이터 2025.11.11

제로베이스 데이터사이언스 스쿨 - Part 04. 기초 통계-3

Chapter 01. 기초통계_기초과정 확률과 확률변수 (Probability & Random Variables) 주요 개념이번 단원은 데이터 분석의 수학적 기반이 되는 확률(Probability)과 확률변수(Random Variable)를 다룬다.확률은 사건이 일어날 가능성을 수치로 표현한 것이며,확률변수는 그 사건의 결과를 수치로 대응시키는 함수이다.즉,“확률은 사건의 가능성, 확률변수는 사건을 수로 표현한 것.”1. 확률의 기본 개념확률(Probability): 어떤 사건이 일어날 가능성을 0에서 1 사이의 값으로 표현한 것. 표기P(A) = 사건 A가 일어날 확률0 ≤ P(A) ≤ 1P(A) = 0 → 사건 A는 절대 일어나지 않음P(A) = 1 → 사건 A는 반드시 일어남P(A) = 0.5 →..

데이터 2025.11.10

제로베이스 데이터사이언스 스쿨 - Part 04. 기초 통계-2

Chapter 01. 기초통계_기초과정 데이터의 이해 - 그래프와 기초 통계 주요 개념 요약데이터 분석의 출발점은 데이터의 구조와 특성을 이해하는 것이다.이를 위해 먼저 데이터를 구분하고, 시각화(그래프)를 통해 탐색한 뒤,수치적 요약(통계량)으로 데이터를 해석한다.즉,데이터 → 탐색(EDA) → 시각화 → 통계적 요약이 흐름이 데이터 분석의 기본 골격이다.1. 변수(Variable)와 데이터의 종류변수(Variable): 관측된 데이터에서 변화 가능한 속성이나 특징을 의미한다.통계에서는 관측된 값들을 변수로, 그 값들의 모음을 데이터(Data)라고 부른다. 변수의 구분구분설명세부 유형질적 자료(Qualitative)숫자의 크기에 의미가 없는 범주형 데이터명목형 (성별, 지역) / 순서형 (만족도, ..

데이터 2025.11.09

제로베이스 데이터사이언스 스쿨 - Part 03. 기초 수학-21, Part 04. 기초 통계-1

Part 03. 기초 수학 Chapter 02. 기초수학 문제풀이 확률(Probability) & 기초 통계(Statistics) 주요 개념이번 수업에서는 경우의 수와 확률의 기본 개념을 실제 파이썬 코드로 구현하고,이를 기반으로 통계 분석의 출발점을 학습했다.확률은 특정 사건이 일어날 가능성을 전체 경우의 수 중 일부의 비율로 표현한다.즉,확률 = (유리한 사건의 수) / (전체 경우의 수)이 개념이 이후 통계의 모든 계산 — 평균, 분산, 회귀, 머신러닝 확률모델 — 의 기초가 된다.1. 확률 실습 문제 (꽝·선물 예제)💡 문제 요약박스에 ‘꽝’ 6장, ‘선물’ 4장이 있을 때3장을 뽑아 ‘꽝 3장’ 혹은 ‘선물 3장’을 뽑을 확률(%)을 구하라. 즉, 10장의 전체 조합 중 특정 조합(꽝 3장 ..

데이터 2025.11.08

제로베이스 데이터사이언스 스쿨 - Part 03. 기초 수학-20

Chapter 02. 기초수학 문제풀이 순열과 조합 (Python 수학 알고리즘 실습) 주요 개념이번 학습에서는 경우의 수를 계산하는 기본 개념인순열(Permutation) 과 조합(Combination) 을 Python 코드로 구현했다.순열 : 서로 다른 n개 중 r개를 순서 있게 나열하는 경우의 수→ 수식: nPr = n! / (n - r)!조합 : 서로 다른 n개 중 r개를 순서 상관없이 선택하는 경우의 수→ 수식: nCr = n! / (r! × (n - r)!)두 개념 모두 팩토리얼 연산을 기반으로 계산된다.1. 순열 (Permutation)💡 개념 정리예를 들어 9개의 수 중 4개를 순서 있게 배열하는 경우의 수는9P4 = 9 × 8 × 7 × 6 = 3024즉, 앞에서부터 r개만 곱하는 구조..

데이터 2025.11.07

제로베이스 데이터사이언스 스쿨 - Part 03. 기초 수학-19

Chapter 02. 기초수학 문제풀이 피보나치수열, 팩토리얼, 군수열 (Python 반복문·재귀 심화) 주요 개념이번 학습에서는 반복문과 재귀 구조의 차이를 이해하고,수학적 규칙이 있는 수열을 Python 코드로 구현하는 실습을 진행했다.다룬 주제는 다음 세 가지다.1️⃣ 피보나치 수열 — 이전 두 항의 합으로 이루어진 수열2️⃣ 팩토리얼 — 재귀 호출과 반복문의 차이 이해3️⃣ 군수열 — 규칙적인 분수 형태의 합을 조건부로 계산1. 피보나치 수열 (Fibonacci Sequence)피보나치 수열은1, 1, 2, 3, 5, 8, 13, 21, …처럼 앞의 두 항을 더해 다음 항이 만들어지는 수열이다.수학적 정의는 다음과 같다.F₁ = 1, F₂ = 1Fₙ = Fₙ₋₁ + Fₙ₋₂ (n ≥ 3)코드 예시..

데이터 2025.11.07

제로베이스 데이터사이언스 스쿨 - Part 03. 기초 수학-18

Chapter 02. 기초수학 문제풀이 등비수열, 시그마, 계차수열 (Python 기초 수열 실습) 개념 요약이번 강의에서는 세 가지 수열 개념을 프로그래밍으로 구현해보았다.등비수열(Geometric Sequence) : 일정한 비율로 증가·감소하는 수열시그마(Sigma) : 수열의 합을 기호로 나타낸 것계차수열(Difference Sequence) : 항의 차이가 일정한 패턴으로 변하는 수열수학적 개념을 직접 코드로 변환하면서, 수열의 규칙성을 반복문으로 표현하는 연습을 했다.1. 등비수열 (Geometric Sequence)등비수열은 항이 일정한 비율 r(공비) 로 곱해지는 수열이다.예: {2, 6, 18, 54, 162, 486, …}→ 첫째항 a₁ = 2, 공비 r = 3공식:일반항: aₙ = ..

데이터 2025.11.05
반응형