ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • SPSS 일반화 부스팅 Generalized boosted models ~처럼
    카테고리 없음 2020. 2. 22. 05:16

    >


    안녕하세요. 오핸시는 오랜만에 SPSS에 대한 포스팅하게 되었습니다. SPSS 하나반불 부스팅 Generalized boosted models입니다. AdaBoost알고리즘의 1개 반화와 생각하세요. CART의 나무 분류를 더욱 업데이트 한 것입니다. 단일반화부스팅알고리즘은적합한부정확도를줄이는방향으로예측함수를여러차례보정하는학습알고리즘이라고생각해주시기바랍니다. 우선 내가 SPSS에서 이런 고급 통계를 많이 최대한 올리는 이유는 R이나 SAS 등에서도 가능하다. 하지만 코딩이라는 큰 산이 있습니다. 빅데이터라면 저 프로그램을 추천하지만 그렇지 않은 이상 작은 수의 샘플은 오히려 SPSS가 편하다. 같은 분석은요. 그리고 가능한 한 시간이 있을 때 올리고 있습니다. 먼저 데이터를 이렇게 읽습니다. 종속변수와독립변수를요.


    >


    그리고 분석을 보면 일반화 선형 모형에 일반화 부스팅 회귀(Generalized boosted model)라는 것이 있습니다.


    >


    클릭하면, 향후의 화면이 표시됩니다. 일반 선형 회귀 분석과 같이 옮기면 됩니다. 종속변수와독립변수를요. 그리고 아랫사람을 보면 뭐가 뭔지 모르는 칸이 있습니다. 다른 것은 크게 사용하지 않기 때문에, 당신으로서는 상호작용 레벨은 목하본인무의 깊이라고 생각하면 됩니다. 하나로 하면, 예측 모델에서 독립 변수에만 2에서는 현재 요인 간의 2차 상호 작용이 같이 포함이 됩니다.


    >


    옵션을 보면 요즘 또 뭐가 많이 있어요. 수축, 적합하게 만드는 나쁘지 않다, 무수, 최소 노드 크기, 학습에 사용되는 케이스 부분, 다음에 나쁘지 않은 무를 고르는데 사용되는 학습 세트 부분, 교차 검증 중복수


    >


    수축은 우선 감사의 학습률을 의미합니다. 적합하게 만드는 본인 무수는 업데이트 해야 하는 타입입니다. 최소 노드의 크기는 예기형 산에서 최소의 노드 크기를 지정해 주는 것입니다. 학습에 사용되는 케이스는 부표본의 추출률을 예기합니다. 향후 본인 춤을 선택하는 데 사용되는 학습 세트 브붕눙 0.5위 기준입니다. 교차로는 예기형 씨로 교차평가의 복수를 지정하는 것이라고 생각해 주십시오. ​


    >


    그리고 결과에 제시할 부분을 고릅니다. 최적의 반복 계산 수의 주천방 법은 3개가 있습니다. holdout data 같은 테스트 데이터 자체 교차검증이 있는데 이 교차검증을 선택하면 됩니다.


    >


    그러면 이런 결과가 나쁘지 않아요. 특별한 것은 없습니다.조금 전에 지정한 것을 다시 정리표로 표시합니다. 틀림없고 틀린 곳은 없는지 한번 보시면 됩니다.


    >


    이렇게해서이것은독립변수의상대적인중요성을보여주고있습니다. x2가 가장 중요하고 x3이 가장 덜 중요한 것으로 쟈싱타 났네요. 색깔부터가 다르네요. R에서 불러왔기 때문입니다.


    >


    ​ 여기 23을 사용할 때는 최적 반복, 본인의 무수가 따로 표가 히트했지만,입니다. 이번에 SPSS 26새 버전으로 바꾼 후에는 이 나쁜 안 보이네요. 400근처만 알지요. 히가시 1기로 해도 그렇군요. ​


    >


    이것을 저장하면 다음에 포스팅되는 Prediction을 할 수 있습니다. 저는 저장했습니다. ​ SPSS 1밴 파인 부스팅 Generalized boosted models에 대해서 알아봤습니다. 조금이라도 자기에게 도움이 된다면 저는 정말 감사하겠습니다.


    댓글

Designed by Tistory.