반응형

전체 글 103

제로베이스 데이터사이언스 스쿨 - Part.02 데이터 분석을 위한 SQL-6

SQL 함수 1. 단일행 함수 (Single Row Function)각 행마다 개별적으로 적용되어, 행 수가 변하지 않고 그대로 유지된다.주요 종류는 다음과 같다.구분예시 함수설명숫자형ABS, ROUND, MOD절대값, 반올림, 나머지 계산문자형UPPER, LOWER, LEFT, RIGHT, LENGTH, CONCAT대/소문자 변환, 문자열 조작, 연결날짜형YEAR, MONTH, DAY, DATE_ADD, TIMESTAMPDIFF날짜 계산, 차이 연산형변환CAST, DATE_FORMAT데이터 형식 변환일반 함수CASE WHEN, IFNULL조건 분기, NULL 처리예시 SELECT TIMESTAMPDIFF(YEAR, BIRTH_DATE, '2025-01-01') AS AGEFROM CUSTOMER;→ 기..

데이터 2025.10.05

제로베이스 데이터사이언스 스쿨 - Part.02 데이터 분석을 위한 SQL-5

연산자1. 연산자 종류SQL의 연산자는 크게 다섯 가지로 분류된다.비교 연산자=, >, =, 두 값의 크기 또는 동일 여부 비교논리 연산자AND, OR, NOT조건식을 결합하거나 반전특수 연산자BETWEEN, IN, LIKE, IS NULL범위, 집합, 패턴, NULL 여부 판별산술 연산자+, -, *, /수치형 연산 수행집합 연산자UNION, UNION ALLSELECT 결과를 결합 (중복 여부 선택 가능) 예시WHERE PRICE BETWEEN 10000 AND 20000WHERE NAME LIKE '%deluxe%'WHERE HOTEL IS NULLSELECT * FROM A UNION SELECT * FROM B 2. 실무에서 자주 사용하는 연산자기간 필터링:BETWEEN 또는 NOT BETWE..

데이터 2025.10.04

제로베이스 데이터사이언스 스쿨 - Part.02 데이터 분석을 위한 SQL-4

테이블조인1. 테이블 관계와 ERD관계형 데이터베이스 테이블 관계1:1, 1:N, N:N 관계회원과 주문(1:N), 주문과 상세 주문(1:N), 학생과 수업(N:N) 예시ERD(Entity Relationship Diagram)테이블 간 관계를 도식화하여 JOIN 조건을 설계할 때 활용2. 테이블 조인(JOIN) 종류Inner Join: 조인 조건에 맞는 데이터만 결합Left Join: 왼쪽 테이블 전체 + 매칭 데이터Right Join: 오른쪽 테이블 전체 + 매칭 데이터비회원(9999999)이나 가입만 하고 주문 없는 회원 등 상황별 차이 확인3. WHERE vs ONON: 조인 조건 지정 (테이블 결합을 위한 조건)WHERE: 결합된 데이터에서 필터링같은 조건을 WHERE에 두느냐 ON에 두느냐에 ..

데이터 2025.10.04

제로베이스 데이터사이언스 스쿨 - Part.02 데이터 분석을 위한 SQL-3

SQL 기본 문법1. SQL 문법과 실행 순서SQL 문법 순서:SELECT → FROM → WHERE → GROUP BY → HAVING → ORDER BYSQL 실행 순서:FROM → WHERE → GROUP BY → HAVING → SELECT → ORDER BY문법 순서와 실행 순서가 다르므로, HAVING에서 별칭 사용이 제한될 수 있음.2. GROUP BY와 집계 함수집계 함수: COUNT, SUM, AVG, MIN, MAXGROUP BY: 데이터를 특정 기준으로 그룹화Excel 피벗 테이블과 유사한 개념예: 성별 회원 수, 가입 연도별 집계, 생년월별 회원 수 등 3. WHERE vs HAVINGWHERE: GROUP BY 이전 데이터 필터링HAVING: 그룹화 이후 집계된 데이터 필터링예시:..

데이터 2025.10.03

제로베이스 데이터사이언스 스쿨 - Part.02 데이터 분석을 위한 SQL-2

2. SQL 기본 문법과 테이블 조인 1. SQL 명령어 분류데이터 정의어 (DDL)CREATE, ALTER, TRUNCATE, DROP테이블 생성/변경/삭제데이터 조작어 (DML)INSERT, SELECT, UPDATE, DELETE데이터 삽입/조회/수정/삭제데이터 제어어 (DCL)GRANT, REVOKE데이터 접근 권한 관리2. 테이블 구조 및 제약조건데이터 타입숫자형: INT, FLOAT날짜형: DATE, DATETIME문자형: CHAR, VARCHAR제약조건PK: 각 행을 고유하게 식별NOT NULL: 반드시 값이 있어야 함3. SQL 명령어 특징대소문자 구분 없음띄어쓰기와 들여쓰기에 제약 없음 4. 테이블 생성 예시 1. TEST 테이블 생성 (수강번호, 이름, 나이, 가입일자)수강번호: INT..

데이터 2025.10.02

제로베이스 데이터사이언스 스쿨 - Part.02 데이터 분석을 위한 SQL-1

1. 데이터베이스 데이터베이스와 SQL 기초 1. 데이터베이스에 대하여RDB (관계형 데이터베이스)행과 열로 구성된 테이블들의 집합SQL 사용예: MySQL, Oracle, MS-SQLNoSQL (비관계형 데이터베이스)비정형/반정형 데이터 저장SQL을 사용하지 않거나 유사 언어 사용예: MongoDB, Redis, DynamoDB테이블 간 관계1:1 관계 → 한 명이 한 배우자와만 결혼1:N 관계 → 회원 한 명이 여러 주문 가능N:N 관계 → 학생과 강의처럼 서로 다대다 관계PK(Primary Key) & FK(Foreign Key)PK: 테이블 내 유일값 (NULL 불가)FK: 다른 테이블의 PK 참조, 참조 무결성 유지2. SQL에 대하여SQL (Structured Query Language)관계형..

데이터 2025.10.01

제로베이스 데이터사이언스 스쿨 - Part 01. 데이터 분석을 위한 Python_Chapter 03-3

Chapter 03. 데이터 시각화를 위한 matplotlib과 seaborn Pandas에서 그래프 그리기 1. plot 함수란?시리즈: 인덱스를 x축, 값을 y축으로 사용데이터프레임: 각 컬럼이 개별 선 또는 막대 그래프로 표현Matplotlib을 내부적으로 사용하기 때문에, plot을 통해 간단히 시각화 가능series.plot()df.plot() 2. 주요 매개 변수Pandas의 plot 메서드는 다양한 인자를 지원합니다.kind: 그래프 종류 지정 (기본 'line')가능 값: 'line', 'bar', 'barh', 'hist', 'box', 'kde', 'scatter', 'pie'x, y: x축과 y축에 사용할 열 지정title: 그래프 제목xlabel, ylabel: 축 이름figsiz..

데이터 2025.09.30

제로베이스 데이터사이언스 스쿨 - Part 01. 데이터 분석을 위한 Python_Chapter 03-2

Chapter 03. 데이터 시각화를 위한 matplotlib과 seaborn Matplotlib로 그래프 그리기 1. 그래프 환경 설정rc 함수: 그래프의 전역 스타일 설정rc('font', family='Malgun Gothic') → 한글 깨짐 방지rc('figure', dpi=값) → 해상도 설정rc('figure', figsize=(가로, 세로)) → 기본 크기 설정폰트 관리: font_manager로 시스템 폰트 확인 가능마이너스 깨짐 방지:plt.rcParams['axes.unicode_minus'] = False 2. 선 그래프 (Line Plot)plot(x, y)로 기본 선 그래프 작성스타일 인자색상: color='r', HEX 코드도 가능선 스타일: linestyle='--'선 두께..

데이터 2025.09.28

제로베이스 데이터사이언스 스쿨 - Part 01. 데이터 분석을 위한 Python_Chapter 03-1

Chapter 03. 데이터 시각화를 위한 matplotlib과 seaborn Matplotlib 기초 1. Matplotlib란?데이터 시각화 라이브러리로 다양한 그래프와 도형 지원특징다양한 포맷 지원 (PNG, PDF, SVG 등)다른 라이브러리와 호환성 높음 (seaborn, pandas 등)상태 기반 인터페이스(pyplot)와 객체 지향 인터페이스 모두 제공축, 레이블, 스타일 등 세부 요소까지 고급 커스터마이징 가능pyplot 모듈간단한 그래프 작성에 사용주요 함수: plot(), bar(), scatter(), title(), xlabel(), ylabel(), legend(), show(), savefig()2. 간단한 그래프 그리기Matplotlib의 그래프는 여러 요소(축, 제목, 범례..

데이터 2025.09.27

제로베이스 데이터사이언스 스쿨 - Part 01. 데이터 분석을 위한 Python_Chapter 02-6

Chapter 02. 데이터 핸들링을 위한 Numpy와 Pandas 기타 데이터 전처리 (Numpy와 Pandas) 1. 문자열 데이터 처리 (String Accessor: .str)접근자(Accessor): 특정 타입에 특화된 기능을 제공하는 속성/메서드.str: 문자열 데이터 처리.dt: 날짜 데이터 처리.cat: 카테고리 데이터 처리 (이번 강의에서는 생략)문자열 접근자는 Series의 타입이 문자열일 때만 사용 가능하며, 벡터화를 지원하므로 반복문 없이 빠르게 처리 가능주요 메서드:대소문자 변환: upper(), lower(), capitalize(), title()공백 제거: strip(), lstrip(), rstrip()문자열 교체: replace(pat, repl)포함 여부: contai..

데이터 2025.09.26
반응형