본문 바로가기
728x90
반응형

diffusion9

[생성모델] Score-Based Diffusion (2) - Probability Flow and Neural ODE, Controllable Generation Probability Flow and Neural ODERecap: VE SDE, VP SDE, sub-VP SDE논문 섹션 3.4(와 Appendix B)에 결과만 나열하면 3가지 SDE는 다음과 같다.SDEsFormulaForward SDEVariance Exploding SDE(VE SDE)Variance Preserving SDE(VP SDE)sub-VP SDEProbability Flow and ODE모든 diffusioin process는 SDE와 동일한 주변분포(marginal distribution) $\{ p_t(x) \}_{t=0}^{T}$를 공유하는 궤적을 가진 상응하는 결정론적 과정이 존재한다.그리고 그 결정론적 과정은 ODE로 존재하고, 이를 "probability flow ODE.. 2026. 1. 15.
[생성모델] Score-Based Diffusion (1) - Denoising Score Matching (DSM) & Predictor-Corrector Sampling Score-Based Continuous-time Diffusion ModelsMotivation이전까지 생성모델은 크게 likelihood-based model, implicit generative model 두가지로 나뉜다. Likelihood-based model(근사적으로) 최대우도법(MLE)를 통해 데이터 분포를 직접 학습하는 방법론Autoregressive model, Normalizing flows, Energy-based model, VAE 등이 해당된다.단점으로, 정규화 상수(전체 확률값을 1로 만들기 위한 보정값)를 처리해야하므로 모델 구조에 제약이 강하고 대리 목적 함수(Surrogate Objectives)에 의존한다. Implicit generative model확률분포가 샘플링 .. 2026. 1. 13.
[생성모델] Langevin Dynamics, Generative Models (랑주뱅 동역학부터 생성모델까지) Langevin Dynamics부터 생성모델까지Motivation: 복잡한 분포에서 샘플링 하는 방법복잡한 분포 $p(x)$에서 샘플을 뽑고 싶다. 그런데 정규화 상수($Z = \int \tilde{p}(x) dx$)도 모르고 식도 복잡하다.이때 분포를 직접 계산하는 대신, 그 분포에서 샘플이 나오도록하는 dynamics를 설계할 수 있다. 물리학에서 비슷한 문제를 Langevin dynamics(랑주뱅 동역학)로 풀었다.핵심 질문은 이렇다."Energy Landscape에서 시간이 충분히 지나면 입자는 어떤 위치에 얼마나 자주 머무는가?" ※ Energy Landscape: 포텐셜 에너지 표면, 에너지 풍경이에 대한 답으로 Langevin dynamics (랑주뱅 동역학) 이다.에너지(보통 $U(x)$.. 2026. 1. 11.
[생성모델] Diffusion Model - DDIM (3) PyTorch Code DDIM code for Google ColabOverviewDDPM과 DDIM을 구현하여 둘의 샘플링(생성)을 비교한다.사용할 데이터는 FashionMNIST와 Oxford Flowers 102 이다. Datasetget_transform이미지를 diffusion model에 맞게 변환한다.[0, 1]로 변환한 후에 다시 [-1, 1]로 정규화.Oxford flowers의 경우, resize(img_size * 1.5) - centerCrop(img_size)로 이미지 비율 유지하면서 크기 조정ModulesSinusodialPositionalEmbeddingstimestep을 고차원으로 임베딩각 timestep을 고유하게 표현하여 모델이 현재 노이즈 레벨을 인식할 수 있게 한다. SinusoidalPo.. 2026. 1. 10.
[생성모델] Diffusion Model - DDIM (2) Accelerated Generation Process (고속 생성 과정) DDIM: Accelerated Generation ProcessNotation1. 여기서 다루는 대부분의 확률변수는 다변수이므로 원칙적으로는 벡터나 행렬을 Bold체로 표기해야 하지만($\mathbf{x}$, $\mathbf{I}$), 본문에서는 원활한 타이핑과 가독성을 위해 별도의 구분 없이 표기합니다. (너무 귀찮아요😉)2. $X | Y, Z$는 $Y$와 $Z$가 주어졌을때의 $X$의 조건부 확률/분포를 의미한다. ($X | Y$와 $Z$의 결합분포가 아니다.)Generalized Generative Process$L_1$을 목적함수로 사용하면 DDPM에서 제안한 마르코프과정 뿐만 아니라 앞에서 설계한 $\sigma$로 매개변수화된 여러 non-markovian forward process에 대응.. 2026. 1. 7.
[생성모델] Diffusion Model - DDIM (1) Non-Markovian Process, Objective (DDIM의 확률과정, 목적함수 정리) DDIM: Denoising Diffusion Implicit ModelsIntroduction & MotivationDDPM은 적대적 학습 없이도 고품질의 이미지 생성에 성공했다.하지만 모델 학습 이후에 샘플을 생성하기 위해 Markov Chain을 연쇄적으로 계산해야하므로 샘플링 속도가 매우 느리다.DDIM의 저자들은, 비마르코프 과정(non-Markovian process)을 통해 DDPM을 일반화한다.이러한 비마르코프 과정은 결정론적 생성 과정에 대응하여 고품질 샘플을 훨씬 빠르게 생성할 수 있다. ※ 학습 과정(training)은 DDPM과 동일하다. DDIM은 샘플링에 대한 내용이다.TL;DR: 모델을 새로 학습하지 않고도 샘플링 과정을 결정론적(Determinisic)으로 바꾸어 샘플링 속도.. 2026. 1. 6.
728x90
반응형