학부 연구생/논문 공부 4

Computer Age Statistical Inference (ch6)

 이런 오류가 발생하는 이유는?: tbl_df() 함수는 이용할수 없는..?X∼Beta(α0,β0)α0: 성공 횟수에 대한 가중치, β0: 실패 횟수에 대한 가중치Xk: 보험 계약자 k에 의해 1년 안에 제기될 주장의 수Yk: 1년 동안 9461명의 자동차 보험 가입자들이 청구한 건수 θk​:  Xk​의 기대값 1) 왜 파라메트릭 최대 우도 분석은 왜 감마 분포 사용? 2) 파라메트릭 최대 우도 분석에서는 감마 분포를 사용하여 포아송 분포의 평균을 추정합니다. 감마 분포를 통해 포아송 분포의 불확실성을 모델링하고, 보다 정밀하고 안정적인 예측을 가능하게 하는 이유? 3) 식(6.1) θk는 왜 포아송 분포?E[θ∣x]는 E[X∣x] 와 같기 때문 (θ가 X의 기대값이기 때문). 4) why? (..

SURE Estimates for a Heteroscedastic Hierarchical Model

EBMLE for θ :estimate based on the marginal distribution (Equation) is the moment estimateif λˆML =λˆMM+:the positive-part James-Stein estimator (these two estimators are closely related)Stein’s unbiased risk est-imate(SURE) :underthesumofsquared-error loss l_p(θ,θˆ) =1/p ∑(θˆi −θi)^2corresponding SURE estimate for θ :oracle loss (OL) hyperparameter: we removed from the analysis the players whos..

Rebayes an R package for empirical bayes mixture methods

Q1. why not -∫ϕ(xi,θ)dF(θ)?A1. 확률밀도함수를 나타내는데 이는 음수 X, 반면 log-liklihood를 최대화할때는 logg(xi)는 음수이므로 (-)를 곱해서 양수로 바꿔줘야한다. → 원자들이 각 위치에서 가지는 질량과 그 분포를 나타내는 확률 측도를 찾는 문제→ ∑ νiϕ(Yi,µ) => the constraint functionpar(mfrow = c(1,3))x 1. par(): 3개의 그래프2. (-5,6) 0.05간격3. dnorm(x,0): 평균이 0인 정규분포 4. GLmix(y): 혼합분포를 추정하는 NPMLE 방법5. plot(x, predict(z,x), type = "l", ylab = expression(delta(x))): z에서 예측된것을 기반으로 x에..

Introduction to Empirical Bayes- Examples from Baseball Statistics

The number of hits a player gets out of his at-bats is an example of a binomial distribution, which models a count of successes out of a total.2 Since it’s a binomial, the best way to represent the prior expec- tations is with the beta distribution.Q1. Why?A) 이항분포의 안타일 확률 p를 모델링하는데 적합 & 베이지안 추론을 통해 사전 지식 반영library(dplyr)num_trials rbeta → beta(81,219)생성rbinom → rbinom()은 R에서 이항분포(Binomial Distri..