PARTNER
검증된 파트너 제휴사 자료

앙상블 비모수적 변수 선택 방법 (Ensemble nonparametric variable selection method)

한국학술짿에서 제공하는 국내 최고 수준의 학술 데이터베이스를 통해 다양한 논과 학술지 정보를 만나보세요.
14 페이짿
기타파일
최초등록일 2025.05.16 최종젿작일 2023.04
14P 미보기
앙상블 비모수적 변수 선택 방법
  • 미보기

    서정뵖

    · 발행기관 : 한국자료분석학회
    · 수록지 정보 : Journal of The Korean Data Analysis Society / 25권 / 2호 / 523 ~ 536페이짿
    · 저자명 : 신웅섭, 조형준

    초록

    앙상블 기법은 다수의 개별 모델을 조합하여 하나의 최적 모델로 일반화하는 방법으로, 높은 예측 성능을 보인다. 회귀 및 분류 문제에서 모두 활용 가능하다는 장점이 있으나 블랙박스(black-box)적인 특성으로 모델의 해석이 어렵다는 단점이 있다. 이러한 단점을 변수중요도라는 척도를 제시하여 설명력을 보완하고 있으나 이는 설명변수 간의 상대적인 수치일 뿐, 각 변수의 유의성 여부는 확인할 수 없다는 한계가 존재한다. 반면, 회귀모형의 경우 p-value, 벌점화 등을 통해 변수의 유의성 검정이 가능하다. 본 연구는 앙상블 기법에서 주어지는 변수중요도를 기반으로 유의한 설명변수를 선택하는 비모수적 변수 선택 방법을 제안하였다. 모의실험은 8가지 모형으로 진행하였으며 민감도, 특이도 결과를 방법론별로 비교하였다. 모의실험 결과, 앙상블 비모수적 변수 선택 방법은 8가지 모형에서 기존 회귀모형에서의 변수 선택 방법들보다 우수한 분류 성능을 보여주었다. 또한, 사례 분석을 통해 랜덤포레스트 비모수적 변수 선택 방법이 설명변수 간 강한 상관관계가 있는 경우에도 유의하다고 판단되는 변수를 올바르게 선택한다는 것을 확인하였다.

    영어초록

    Ensemble techniques are a method of generalizing multiple individual models to one optimal model, showing high predictive performance. It has the advantage of being available in both regression and classification problems, but it has the disadvantage that it is difficult to interpret the model due to its black-box characteristics. These shortcomings are supplemented by presenting a measure of variable importance, but this is only a relative value between explanatory variables, and there is a limit that the significance of each variable cannot be confirmed. On the other hand, in the case of the regression model, it is possible to test the significance of the variable through p-value and penalty. This study proposed a nonparametric variable selection method that tests the significance of explanatory variables based on the variable importance given in the ensemble technique. The simulation was conducted with eight models, and the results of sensitivity and specificity were compared by methodology. As a result of the simulation, the ensemble nonparametric variable selection showed better classification performance than the variable selection in the existing regression model in eight models. In addition, through case analysis, it was confirmed that the random forest nonparametric variable selection showed excellent performance even when there was a strong correlation between variables.

    참고자료

    · 없음
  • 자주묻는질의 답변을 확인해 주세요

    해피캠퍼스 FAQ 더보기

    꼭 알아주세요

    • 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
      자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
      저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객비바카지노 Viva의 저작권침해 신고비바카지노 Viva를 이용해 주시기 바랍니다.
    • 해피캠퍼스는 구매자왿 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.
      파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
      파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료왿 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학껓, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

“Journal of The Korean Data Analysis Society”의 다른 논도 확인해 보세요!

문서 초안을 생성해주는 EasyAI
안녕하세요. 해피캠퍼스의 방대한 자료 중에서 선별하여 당신만의 초안을 만들어주는 EasyAI 입니다.
저는 아래왿 같이 작업을 도왿드립니다.
- 주제만 입력하면 목차부터 본문내용까지 자동 생성해 드립니다.
- 장문의 콘텐츠를 쉽고 빠르게 작성해 드립니다.
- 스토어에서 무료 캐시를 계정별로 1회 발급 받을 수 있습니다. 지금 바로 체험해 보세요!
이런 주제들을 입력해 보세요.
- 유아에게 적합한 문학작품의 기준과 특성
- 한국인의 가치관 중에서 정신적 가치관을 이루는 것들을 문화적 문법으로 정리하고, 현대한국사회에서 일어나는 사건과 사고를 비교하여 자신의 의견으로 기술하세요
- 작별인사 독후감
해캠 AI 챗봇과 대화하기
챗봇으로 간편하게 상담해보세요.
2025년 06월 08일 일요일
AI 챗봇
안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
9:13 오후