Transcript PASW17.0
PASW 17.0 활용하기 일시 : 2009.07.15, (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2) 내용 자료 입력하기, 저장하기 엑셀로 입력된 자료 불러오기 실제 분석 절차 및 결과 제시 S/W : PASW (Predictive Analytics Software) 17.0 초기 화면 자료 입력 및 저장하기 PASW에서 Data 직접 입력하기 입력한 변수 정보 확인하기 Data 저장하기 자료 입력 하기 PASW에서 Data 직접 입력하기 Step1 Step2 Step2 Step2 클릭 !!! Step2 Step2 Step2 Tip. 문자형 자료 입력하기 클릭 !!! Tip. 문자형 자료 입력하기 Tip. 문자형 자료 입력하기 Tip. 문자형 자료 입력하기 입력한 변수 정보 확인하기 파일 > 데이터 파일 정보 표시 > 작업 파일 Data 저장하기 -> ***.sav Step1 파일 > 저장 Step2: 경로 지정 Step3 : 파일 이름 입력 Tip. Excel로 저장하기 저장 유형을 (*.xls)로 바꿔 준다 자료 불러오기 엑셀로 입력된 자료 불러오기 엑셀 자료 Step1 파일 > 열기 > 데이터 Step2 : 파일 유형 지정 Step3 : 불러올 파일 이름 지정 -> 열기 Step4 : 워크시트 지정 -> 확인 연관성 분석 Example 1-1 Ex) 흡연상태(C, P, N)와 폐암 발생간 연관성 환자군 정상군 total C 28 (80%) (53%) 7 (20%) (22%) 35 P 20 (67%) (38%) 10 (33%) (31%) 30 N 5 (25%) (9%) 15 (75%) (47%) 20 total 53 32 85 가설 : 흡연 상태간 폐암 발생 비율이 차이가 있다. 가설 : 폐암군과 정상군간 흡연상태 비율이 차이가 있다. -> Chi-square test, Fisher’s exact test 수행 분석할 자료 불러오기 분석 절차 1. 가중치 부여하기 2. Chi-Square test or Fisher’s Exact test 수행 가중치 부여: Step1 데이터 > 가중 케이스 가중치 부여: Step2 가중치 부여: Step2 Output Chi-square test, Fisher’s exact test :Step1 분석 > 기술통계량 > 교차분석 Chi-square test, Fisher’s exact test :Step2 Chi-square test, Fisher’s exact test :Step2 클릭 !!! Chi-square test, Fisher’s exact test :Step3 Chi-square test, Fisher’s exact test :Step4 클릭 !!! Chi-square test, Fisher’s exact test :Step4 Output : 빈도분포표 Output : 카이제곱 검정 결과 Example 1-2 Ex) 하루 흡연량(0, <=10/day, >10/day)과 폐암 발생 여부간 연관성 Example 1-2 가설 : 세 군(흡연량)간 폐암 발생 비율이 다르다. 가설 : 폐암군과 정상군간 흡연량 비율이 다르다. 가설 : 하루 흡연량이 많을수록 폐암 발생 비율이 높다. 가설 : 폐암군은 정상군보다 흡연량이 많다. 가설 : 세 군(흡연량)간 폐암 발생 비율이 다르다. 가설 : 폐암군과 정상군간 흡연량 비율이 다르다. Chi-square test, Fisher’s exact test 가설 : 하루 흡연량이 많을수록 폐암 발생 비율이 높다. Cochran-Armitage test 분석 절차 1. 문자형 변수 Group(정상군, 환자군)을 숫자형 변수 로 바꾸기 2. 가중치 부여하기 3. Cochran-Armitage test 수행 데이터 변환 - 문자 -> 숫자: Step1 변환 > 다른 변수로 코딩변경 데이터 변환 - 문자 -> 숫자 : Step2 데이터 변환 - 문자 -> 숫자 : Step2 데이터 변환 - 문자 -> 숫자 : Step3 데이터 변환 - 문자 -> 숫자 : Step3 Data 변환 결과 가중치 부여:Step1 데이터 > 가중 케이스 가중치 부여:Step2 가중치 부여:Step2 Output Cochran-Armitage test: Step1 분석 > 기술통계량 > 교차분석 Cochran-Armitage test: Step2 Cochran-Armitage test: Step2 클릭 !!! Cochran-Armitage test: Step3 Cochran-Armitage test: Step4 클릭 !!! Cochran-Armitage test: Step5 Output : 빈도분포표 Output : 분석결과 카이제곱 검정 Pearson 카이제곱 값 16.769a 점근 유의확률 (양측검정) 자유도 2 .000 우도비 16.880 2 .000 선형 대 선형결합 14.976 1 .000 유효 케이스 수 85 a. 0 셀 (.0%)은(는) 5보다 작은 기대 빈도를 가지는 셀입니다. 최소 기대빈도는 7.53입니다. 가설 : 폐암군은 정상군보다 흡연량이 많다. Mann-Whitney test 분석 절차 1. 가중치 부여하기 2. Mann-Whitney test 수행 Mann-Whitney test: Step1 분석 > 분산분석 > 비모수적 검정 > 독립 2 표본 Mann-Whitney test: Step2 Mann-Whitney test: Step2 Mann-Whitney test: Step3 클릭 !!! Output Example 1-3 Ex) 하루 흡연량(0, <=10/day, >10/day)과 BP level (SBP; <130, 130<= < 150, >=150)간 연관성 가설 : 세 군(흡연량)간 BP level 비율이 다르다 가설 : 흡연량이 많을수록 BP level이 높은가 가설 : 세 군(흡연량)간 BP level 비율이 다르다. Chi-square test, Fisher’s Exact test -> 기대돗수 check If expected count less than 5, Fisher’s Exact test 분석 절차 1. 가중치 부여하기 2. Fisher’s Exact test 수행 Fisher’s exact test: Step1 분석 > 기술통계량 > 교차분석 Fisher’s exact test: Step2 클릭 !!! Fisher’s exact test: Step3 Fisher’s exact test: Step4 클릭 !!! Fisher’s exact test: Step5 Fisher’s exact test: Step6 클릭 !!! Fisher’s exact test: Step7 Output Output 가설 : 흡연량이 많을수록 BP level이 높은가 Spearman’s correlation analysis 분석 절차 1. 가중치 부여하기 2. Spearman’s correlation analysis 수행 Spearman’s correlation analysis: Step1 분석 > 상관분석 > 이변량 상관계수 Spearman’s correlation analysis: Step2 클릭 !!! Spearman’s correlation analysis: 결과 Example 1-4 Ex) Venography와 Thermography간 진단결과 비교 (Paired design) 가설 :Venography의 양성 비율과 Thermography의 양성비율이 다르다. …………………… -> McNemar’s test 적용 McNemar’s Test: Step1 분석 > 기술통계량 > 교차분석 McNemar’s Test: Step2 클릭 !!! McNemar’s Test: Step3 클릭 !!! McNemar’s Test: 분석결과 Example 2-1(1) Ex) 폐암 발생 여부와 하루 흡연량(개피/day)간 연관성 가설 : 폐암 환자군과 정상군간 하루 흡연량이 다른가 Two sample t-test, Mann-Whitney test 정규성 체크! - If yes, Two-sample t-test 적용 - If no, Mann-Whitney test 적용 정규성 check/ 기술통계: Step1 분석 > 기술통계량 > 데이터 탐색 정규성 check / 기술통계: Step2 클릭 !!! 정규성 check / 기술통계: Step3 정규성 check / 기술통계: Step4 클릭 !!! 정규성 check / 기술통계: Step5 정규성 check / 기술통계: 분석결과 정규성 check / 기술통계: 분석결과 각 군에서 자료값들이 정규 분포를 따르는가 -> yes 모수적 방법인 Two Sample t-test 적용 T-test: Step1 분석 > 평균 비교 > 독립 표본 T 검정 T-test: Step2 T-test: Step3 T-test: 분석결과 Example 2-1(2) Ex) 폐암 발생 여부와 하루 흡연량(개피/day)간 연관성 가설 : 폐암 환자군과 정상군간 하루 흡연량이 다른가 Two sample t-test, Mann-Whitney test 정규성 체크! -> If no, Mann-Whitney test 적용 Mann-Whitney test: Step1 분석 > 분산분석 > 비모수적 검정 > 독립 2 표본 Mann-Whitney test: Step2 Error !!! 문자 속성을 가진 Group변수는 활성화 되지 않음 -> 숫자로 변환 Data 변환: Step1 변환 > 다른 변수로 코딩변경 Data 변환: Step2 클릭 !!! Data 변환: Step3 클릭 !!! Mann-Whitney test: Step2 Mann-Whitney test: Step3 Mann-Whitney test: 분석 결과 Example 2-2 Ex) 해열제 투여 여부(투여전, 투여후)와 체온간 연관성 (Paired design) 가설 : 투여 전후 간 체온이 다르다. 투여전후간 차이값들이 정규분포를 따르는지 check -> If yes, Paired t-test -> If no, Wilcoxon’s signed rank test Diff(=before-after)계산: Step1 변환 > 변수 계산 Diff(=before-after)계산: Step2 정규성 check/ 기술통계: Step1 분석 > 기술통계량 > 데이터 탐색 정규성 check / 기술통계: Step2 클릭 !!! Diff에 대한 정규성 check/기술통계: Step3 Diff에 대한 정규성 check/기술통계: 분석결과 Diff에 대한 정규성 check/기술통계: 분석결과 각 쌍의 차이값들이 정규 분포를 따르는가 -> yes Paired t-test 적용 Paired t-test: Step1 분석 > 평균 비교 > 대응 표본 T 검정 Paired t-test: Step2 Paired t-test: Step3 Paired t-test: 분석결과 Example 2-3(1) Ex) BP level(<130, 130<= <150, >=150)과 하루 흡연량 (개피/day)간 연관성 가설 : 세 군(BP level)간 하루 흡연량이 다르다 -> One-way ANOVA or Kruskal-Wallis test -> 정규성 check 등분산성 check 정규성 및 등분산성 check / 기술통계 : Step1 분석 > 기술통계량 > 데이터 탐색 정규성 및 등분산성 check / 기술통계 : Step2 클릭 !!! 정규성 및 등분산성 check / 기술통계 : Step3 정규성 및 등분산성 check / 기술통계 : 분석 결과 정규성 및 등분산성 check / 기술통계 : 분석 결과 정규성 및 등분산성 check / 기술통계 : 분석 결과 각 군에서 자료값들이 정규 분포를 따르는가 : Yes 네 군의 분산들이 모두 같은가 : No Kruskal-Wallis test Kruskal –Wallis Test: Step1 분석 > 비모수 검정 > 독립 K - 표본 Kruskal –Wallis Test: Step2 Kruskal –Wallis Test: Step3 클릭 !!! Kruskal –Wallis Test: 분석결과 비모수적 다중비교: Step1 (Tukey test using ranks) 변환 > 순위변수 생성 비모수적 다중비교: Step2 (Tukey test using ranks) ………… 비모수적 다중비교: Step3 (Tukey test using ranks) 분석 > 평균 비교 > 일원배치 분산분석 비모수적 다중비교: Step4 (Tukey test using ranks) 비모수적 다중비교: Step5 (Tukey test using ranks) 클릭 !!! 비모수적 다중비교: Step6 (Tukey test using ranks) Tukey의 방법 비모수적 다중비교: 결과 (Tukey test using ranks) 1 vs 2 : P-value = 0.024 1 vs 3 : P-value = <0.001 2 vs 3 : P-value = 0.072 Example 2-3(2) Ex) BP level(<130, 130<= <150, >=150)과 하루 흡연량 (개피/day)간 연관성 가설 : 하루 흡연량이 많을수록 BP level이 높다. 순서형 변수와 연속형 변수간 상관성 분석 Spearman’s correlation analysis Spearman’s correlation analysis: Step1 분석 > 상관분석 > 이변량 상관계수 Spearman’s correlation analysis: Step2 Spearman’s correlation analysis: Step3 Spearman’s correlation analysis: 분석결과 Example 2-4 Ex) 다이어트제 종류와 체중간 연관성; 세군간 체중 비교 (Matched design) - Control (No diet) - Diet제 A - Diet제 B 가설 : 그룹 간에 6개월 후 체중이 다르다. 정규성 check -> If yes, Two-way ANOVA Two way ANOVA: Step1 분석 > 일반선형모형 > 일변량 Two way ANOVA: Step2 Two way ANOVA: Step2 클릭 !!! Two way ANOVA: Step3 Two way ANOVA: Step3 Two way ANOVA: Step4 클릭 !!! Two way ANOVA: Step5 Two way ANOVA: Step9 Two way ANOVA: 분석결과 Two way ANOVA: 분석결과 다중비교 결과 Example 3-1 Ex) 하루 흡연량과 SBP간 상관성이 있다. 가설 : 하루 흡연량과 SBP간 상관성이 있다. 자료 탐색 - 산점도 정규성 가정 check -> If yes, Pearson’s correlation analysis -> If no, Spearman’s correlation analysis 산점도: Step1 그래프 > 레거시 대화 상자 > 산점도/점도표 산점도: Step2 산점도: Step3 산점도: 분석결과 정규성 check: Step1 분석 > 기술통계량 > 데이터 탐색 정규성 check: Step2 클릭 !!! 정규성 check: Step3 정규성 check: 분석결과 Spearman correlation analysis:Step1 분석 > 상관분석 > 이변량 상관계수 Spearman correlation analysis:Step2 Spearman correlation analysis: 분석결과 Example 4-1 Ex) 종속변수(y) : SBP of infants 독립변수(x) : birthweight of infants, age in days of infants, sex Multiple linear regression (다중선형회귀) analysis Multiple linear regression: Step1 분석 > 일반선형모형 > 일변량 Multiple linear regression: Step2 Multiple linear regression: Step2 클릭 !!! Multiple linear regression: Step3 Multiple linear regression: 분석결과 Example 5-1 Ex) 종속변수(y) : CHD (1, 0) 독립변수(x) : 연령, 흡연유무 Logistic regression model Logistic regression model: Step1 분석 > 회귀분석 > 이분형 로지스틱 Logistic regression model : Step2 Logistic regression model : Step2 Logistic regression model : Step3 클릭 !!! Logistic regression model : Step4 Logistic regression model : Step5 클릭 !!! Logistic regression model : Step6 Logistic regression model : 분석결과 Example 6-1 Ex) 우울증 환자들을 대상 으로 특정 치료제의 효 과를 알아보기 위해 동 일한 환자들을 대상으 로 투약전과 투약후 2 주, 4주 등의 간격으로 HAMD를 측정 id age HAMD (baselin e) HAMD HAMD (week2 (week ) 4) 1 39 16 13 12 2 72 18 12 10 3 56 21 13 12 4 52 20 20 14 5 58 17 8 5 6 41 16 14 13 … … … … … 가설1: HAMD 점수가 시간에 따라 변화가 있다. 가설2: 50세 미만과 50세 이상 군간에 HAMD 점수 변화 양상이 다르다 가설3: 각 시점에서 50세 미만 군과 50세 이상 군간 HAMD 점수가 다르다. 가설1: HAMD 점수가 시간에 따라 변화가 있다. Repeated Measures ANOVA(반복측정자료의 분산분석법) 에서 HAMD에 대한 time effect 검정 Repeated measures ANOVA: Step1 분석 > 일반선형 모형 > 반복측정 Repeated measures ANOVA: Step2 Repeated measures ANOVA: Step2 Repeated measures ANOVA: Step2 클릭 !!! Repeated measures ANOVA: Step2 Repeated measures ANOVA: Step3 클릭 !!! Repeated measures ANOVA: Step4 클릭 !!! Repeated measures ANOVA: Step5 Repeated measures ANOVA: Step6 Repeated measures ANOVA: Step7 Repeated measures ANOVA: Step8 클릭 !!! Repeated measures ANOVA: Step9 Repeated measures ANOVA: 분석결과 Repeated measures ANOVA: 분석결과 (time_1 =1 -> baseline, time_1 =2 -> Week2, time_1 =3 ->Week4) Bonferroni’s correction Week2 vs baseline : P = < 0.0001 *2 = < 0.0001 Week4 vs baseline : P = < 0.0001 *2 = < 0.0001 Tip. 구형성 가정 가설2: 50세 미만과 50세 이상군간에 HAMD 점수 변화 양상이 다르다 Repeated Measures ANOVA(반복측정자료의 분산분석 법)에서 HAMD에 대한 age 군과 time간 교호작용 효과 - (Interaction effect) 검정 Data 변환: Step1 변환 > 다른 변수로 코딩변겅 Data 변환: Step2 Data 변환: Step3 Data 변환: Output Data 변환: Output Repeated measures ANOVA Interaction effect: Step1 분석 > 일반선형 모형 > 반복측정 Repeated measures ANOVA Interaction effect: Step2 Repeated measures ANOVA Interaction effect: Step2 Repeated measures ANOVA Interaction effect: Step3 클릭 !!! Repeated measures ANOVA Interaction effect: Step4 Repeated measures ANOVA Interaction effect: Step5 Repeated measures ANOVA Interaction effect: 분석결과 가설3: 각 시점에서 50세 미만 군과 50세 이상 군간 HAMD 점수가 다르다. 각 시점에서 두 군간 연속형 변수 비교 검정 At baseline: 각 연령군에서 HAMD가 정규분포를 따르는지 check > yes, Two-sample t-test At week2, Week4에서도 동일한 절차 적용 T-test: Step1 분석 > 평균 비교 > 독립 표본 T-검정 T-test: Step2 분석결과 분석결과 Bonferroni’s correction At baseline : P = 0.481 *3 = 1.000 At week2 : P = 0.324 *3 = 0.972 At week4 : P = 1.000 *3 = 1.000 Example 6-2 Ex) Outcome (normal, abnormal) repeated outcome; 범주형 가설 : 농도간에 abnormal 비율이 다르다 Data transpose: Step1 데이터 > 구조변환 Data transpose: Step2 Data transpose: Step3 Data transpose: Step4 Data transpose: Step5 Data transpose: Step6 Data transpose: Step7 Data transpose: Step8 Data transpose: Step9 Data transpose: 분석결과 ……… GEE (Generalized Estimating Equation): Step1 분석 > 일반화 선형 모형 > 일반화 추정 방정식 GEE: Step2 GEE: Step3 GEE: Step4 GEE: Step5 클릭 !!! GEE: Step6 GEE: Step7 클릭 !!! GEE: Step8 GEE: Step9 GEE: 분석결과 Bonferroni’s correction 농도(5) – 농도(10) ; p = 0.056 *2 = 0.1114 농도(5) – 농도(15) ; p = 0.003 *2 = 0.006 Example 7-1 Ex) 만성 간염환자 44명을 확률화에 의해 프레드니솔론 투여군과 비투여군으로 할당 가설 : 두 군간 생존곡선이 다르다 -> 생존율 및 생존곡선 추정 : Kaplan-Meier estimation 방법 이용 -> 두 생존곡선 비교 : 로그순위 검정법 생존율 추정/생존곡선 비교: Step1 분석 > 생존분석 > 생명표 분석 생존율 추정/생존곡선 비교: Step2 생존율 추정/생존곡선 비교: Step3 클릭 !!! 생존율 추정/생존곡선 비교: Step4 생존율 추정/생존곡선 비교: Step5 클릭 !!! 생존율 추정/생존곡선 비교: Step6 K-M 생존율 추정: 분석결과 ……………………….. 생존곡선: 분석결과 생존곡선 비교: 분석결과 Example 7-2 Ex) Data on 43 bone marrow transplants for HD and NHL Event = death or relapse 독립변수 : Graft type, Disease type Karnofsky score, Waiting time to transplat -> Cox의 비례위험 모형 ( Cox’s proportional hazards model) Cox의 비례위험모형: Step1 분석 > 생존확률 > Cox 회귀모형 Cox의 비례위험모형: Step2 Cox의 비례위험모형: Step3 클릭 !!! Cox의 비례위험모형: Step4 클릭 !!! Cox의 비례위험모형: Step5 클릭 !!! Cox의 비례위험모형: Step6 Cox의 비례위험모형: 분석결과 참고 문헌 김선우 저(2004). 간호연구를 위한 기초통계 방법론, 자유아카데미 김선우 저(2005). 의학연구를 위한 기초통계 방법론, 교우사