class: title-slide, center, middle # Introduction to DLMs and DLNMs ---- #### 가천대 길병원 G-ABC #### 방태모 #### 2021-06-21 --- # 목차 <br> <span style="font-size: 1.5em"> 1 Introduction </span> <br> <span style="font-size: 1.5em"> 2 모형식 소개 </span> <br> <span style="font-size: 1.5em"> 3 기대 결과 </span> --- class: title-slide, center, middle # 1 Introduction --- # 1 Introduction * DLMs과 DLNMs은 **시계열 회귀모형**에 속함 + 시계열을 여러 시계열들로 모형화하는데, **같은 시점**뿐만이 아닌 **이전 시점**의 값도 포함시켜 모델링 + 시간에 **지연되는(delayed) 효과** 반영 가능 * DLNMs는 DLMs을 **비선형으로 확장**시킨 모형에 해당 + `\(X\)`들의 비선형적 효과까지 반영함으로써 좀 더 **유연한(flexible) 적합**을 가능하게 해줌 * 이러한 두 모형이 가장 많이 사용되는 도메인은 바로 **생태학적 연구 영역** + **환경적 요인(stressor)**들로 어떤 outcome을 모델링하고자 할 때 + 특정 예측변수 `\(X\)`(**exposure**)의 효과는 관측 시점 당시 뿐만이 아닌 **시간에 지연되는(delayed) 효과**가 빈번히 존재 + 이러한 상황에 **DLMs**과 **DLNMs**은 **꼭 필요로 되는 모형** --- class: title-slide, center, middle # 2 모형식 소개 --- # 2 모형식 소개 * 길이 `\(n\)`( `\(t=1, \cdots, n\)` )인 시계열 `\(Y\)`를 **1개의 exposure**, **1개의 covariate**로 모델링(lag = 1까지 고려) * **Distributed lag non-linear models** `$$g( \mu_t ) = \alpha + s_1(x_{t}; {\boldsymbol{\beta}_1}) + s_2(x_{t-1}; {\boldsymbol{\beta}_2}) + \gamma u_t,$$` + 여기서 `\(\mu \equiv E(Y)\)`, `\(g\)`는 **단조 연결 함수(monotonic link function)** <!-- + covariate으로 **휴일 효과(holiday effects)** 또한 반영 가능 --> <!-- + **시간(time)**을 모형에 포함시킴으로써 **추세**, **계절성** 반영 가능 --> + **시계열 회귀**를 이용해 **환경 요인에 관한 연구** 수행 시, 대부분 outcome은 **count data**에 해당 + 여기서 `\(s\)`는 **기저 함수(basis function)** + **예측변수 `\(X\)`의 공간**과 ** `\(X\)`의 lag dimension에서의 공간**에 따른 outcome과의 관계를 **동시에** 표현 + 이를 **교차 기저(cross-basis)**라고 칭함 + 교차 기저를 정의함으로써 `\(X\)`가 `\(Y\)`에 미치는 **효과 및 지연 효과**를 동시에 선형 또는 비선형으로 모델링 + `\(s_1\)`, `\(s_2\)`를 단순 선형 회귀, 2차 다항회귀(polynomial regression)에 관한 함수로 설정시: `$$s_1(x_{t}; \beta_1) = \beta_{1} x_{t}, \ \ s_2(x_{t-1}; {\boldsymbol{\beta}_2}) = \beta_{21} x_{t-1} + \beta_{22} x^2_{t-1}$$` `$$s_1(x_{t}; {\boldsymbol{\beta}_1}) = \beta_{11} x_{t} + \beta_{12} x^2_{t}, \ \ s_2(x_{t-1}; \beta_2) = \beta_{2} x_{t-1}$$` --- class: title-slide, center, middle # 3 기대 결과 --- # 3 기대 결과 * 1987-2000년까지 시카고의 **일별 사망자 수**를 **기온**을 예측변수( `\(X\)` )로 **DLNMs**을 이용해 모델링 * **기온 및 지연에 따른 RR 값의 변화**를 표현한 그림: <!-- + 과산포 포아송 분포를 가정 --> <img src="Introduction_dlm,dlnm_files/figure-html/unnamed-chunk-1-1.svg" width="30%" style="display: block; margin: auto;" /> + **RR**의 추정은 **21°C(reference value)**를 기준으로 이루어짐 + **기온이 낮은** 경우 **2~3일의 지연효과(lag 2~3)**에서 사망의 RR이 피크에 도달 + **기온이 높은** 경우 **지연 효과 없이 거의 즉시** 사망의 RR이 피크에 도달 + **높은 기온에서 2~3일 정도의 지연효과**가 발생 시, 사망의 RR이 **가장 높아 보임** --- # 3 기대 결과 * **predictor-specific(-20°C, 0°C, 27°C, 33°C) lag-response** 곡선 <img src="Introduction_dlm,dlnm_files/figure-html/unnamed-chunk-2-1.svg" width="40%" style="display: block; margin: auto;" /> --- # 3 기대 결과 * **lag-specific(0, 5) predictor-response** 곡선 <img src="Introduction_dlm,dlnm_files/figure-html/unnamed-chunk-3-1.svg" width="40%" style="display: block; margin: auto;" /> --- # 3 기대 결과 * **Overall cumulative association** + **lag 30까지의 지연효과**를 누적 + 즉, 기온에 따른 **전반적인 상대위험도**를 나타냄 <img src="Introduction_dlm,dlnm_files/figure-html/unnamed-chunk-4-1.svg" width="40%" style="display: block; margin: auto;" /> --- class: title-slide, center, middle # References --- # References [1] Gasparrini, Antonio, Benedict Armstrong, and M.G. Kenward. “Distributed Lag Non-Linear Models.” Statistics in Medicine 29 (September 20, 2010): 2224–34. [2] Gasparrini, Antonio. "Distributed Lag Linear and Non-Linear Models in R: The Package Dlnm." Journal of Statistical Software 43 (July 1, 2011): 1–20.