전체 글 43

Computer Age Statistical Inference (ch6)

 이런 오류가 발생하는 이유는?: tbl_df() 함수는 이용할수 없는..?X∼Beta(α0,β0)α0: 성공 횟수에 대한 가중치, β0: 실패 횟수에 대한 가중치Xk: 보험 계약자 k에 의해 1년 안에 제기될 주장의 수Yk: 1년 동안 9461명의 자동차 보험 가입자들이 청구한 건수 θk​:  Xk​의 기대값 1) 왜 파라메트릭 최대 우도 분석은 왜 감마 분포 사용? 2) 파라메트릭 최대 우도 분석에서는 감마 분포를 사용하여 포아송 분포의 평균을 추정합니다. 감마 분포를 통해 포아송 분포의 불확실성을 모델링하고, 보다 정밀하고 안정적인 예측을 가능하게 하는 이유? 3) 식(6.1) θk는 왜 포아송 분포?E[θ∣x]는 E[X∣x] 와 같기 때문 (θ가 X의 기대값이기 때문). 4) why? (..

SURE Estimates for a Heteroscedastic Hierarchical Model

EBMLE for θ :estimate based on the marginal distribution (Equation) is the moment estimateif λˆML =λˆMM+:the positive-part James-Stein estimator (these two estimators are closely related)Stein’s unbiased risk est-imate(SURE) :underthesumofsquared-error loss l_p(θ,θˆ) =1/p ∑(θˆi −θi)^2corresponding SURE estimate for θ :oracle loss (OL) hyperparameter: we removed from the analysis the players whos..

시계열 3장

평활법: 시계열시스템(DGP)이 시간애 따라 약간씩 변화한다고 가정하면 최근자료에 비중을 더 높게 하여 예측하는 것이 합리적1. 지수평활법: 최근 자료에 더 큰 가중값, 과거로 갈수록 지수적으로 줄여 나가는 방법- 변화에 쉽게 대처 가능하며 계산이 쉽고 많은 자료의 저장이 필요 없다.- 예측이 주목적단순지수평활법: 로컬상수 모형$$ Z_t=\beta_{0,t}+\epsilon_t $$국지적으로 동일한 평균수준을 갖지만, 전체적으로는 평균 수준이 변화 가능한 모형이다. (B0의 추정값이 변화하는 추정값)시점 n에서의 단순지수평활값:$$ S_n^{(1)}=wZ_n+(1-w)S_{n-1}^{(1)} $$- 평활값 Sn(1)은 관측값 Zn과 직전 시점 평활값 Sn-1(1)의 가중평균- 평활값 Sn(1)은 B0의..

통계/시계열 2025.03.23

시계열 2장(3)

1. 다항추세모형- 1) 불규칙성분(오차)만을 갖는 경우: 상수 평균 모형=> 어떤 일정한 수준에 머물면서 불규칙성분에 의한 변화만을 보여주는 경우 사용상수평균모형:$$ Z_t=\beta_0+\epsilon_t $$오차항의 가정 만족, B^0=1/n(Z)시점 n을 예측원점으로 했을때, l-시차 후의 mmse예측값:$$ Z_t(l)=E(Z_{n+l}|Z_n,Z_{n-1},...,Z_1)=\beta_0, l=1,2,... $$2) 추세요인만을 갖는 경우: 선형추세 또는 2차 추세모형선형 추세모형: 직선형인 추세를 가지고 증가하는 경우$$ Z_t=\beta_0+\beta_1t+\epsilon_t $$이차 추세모형: 추세요인이 이차 곡선형태를 따르는 경우$$ Z_t=\beta_0+\beta_1t+\beta_2t..

통계/시계열 2025.03.19

Rebayes an R package for empirical bayes mixture methods

Q1. why not -∫ϕ(xi,θ)dF(θ)?A1. 확률밀도함수를 나타내는데 이는 음수 X, 반면 log-liklihood를 최대화할때는 logg(xi)는 음수이므로 (-)를 곱해서 양수로 바꿔줘야한다. → 원자들이 각 위치에서 가지는 질량과 그 분포를 나타내는 확률 측도를 찾는 문제→ ∑ νiϕ(Yi,µ) => the constraint functionpar(mfrow = c(1,3))x 1. par(): 3개의 그래프2. (-5,6) 0.05간격3. dnorm(x,0): 평균이 0인 정규분포 4. GLmix(y): 혼합분포를 추정하는 NPMLE 방법5. plot(x, predict(z,x), type = "l", ylab = expression(delta(x))): z에서 예측된것을 기반으로 x에..

Introduction to Empirical Bayes- Examples from Baseball Statistics

The number of hits a player gets out of his at-bats is an example of a binomial distribution, which models a count of successes out of a total.2 Since it’s a binomial, the best way to represent the prior expec- tations is with the beta distribution.Q1. Why?A) 이항분포의 안타일 확률 p를 모델링하는데 적합 & 베이지안 추론을 통해 사전 지식 반영library(dplyr)num_trials rbeta → beta(81,219)생성rbinom → rbinom()은 R에서 이항분포(Binomial Distri..