기업조회

본문 바로가기 주메뉴 바로가기

보고서

연구보고서 기본정보

행렬 데이터의 모형화 및 분석기법 개발

연구보고서 개요

기관명, 공개여부, 사업명, 과제명, 과제고유번호, 보고서유형, 발행국가, 언어, 발행년월, 과제시작년도 순으로 구성된 표입니다.
기관명 NDSL
공개여부
사업명
과제명(한글)
과제명(영어)
과제고유번호
보고서유형 report
발행국가
언어
발행년월 2016-06-01
과제시작년도

연구보고서 개요

주관연구기관, 연구책임자, 주관부처, 사업관리기관, 내용, 목차, 초록, 원문URL, 첨부파일 순으로 구성된 표입니다.
주관연구기관 고려대학교
연구책임자
주관부처
사업관리기관
내용
목차
초록 본연구에서는 데이터에 내재된 행렬구조를 고려한 통계방법론을 개발하였으며 핵심 연구주제는 평균벡터 및 공분산행렬의 동시 모형화, 리만구조를 가지는 행렬데이터에 대한 자율학습론 및 지도학습론으로 구성된다. 첫 번째 주제는 평균벡터 및 공분산행렬의 동시 모형화이다. 다변량데이터의 평균벡터와 공분산행렬이 동일한 입력변수들에 의해 설명되는 모형을 설정하였으며 특히 공분산행렬이 항상 양정치가 되게 하는 모형을 도입하였다. 모수적 추론에서는 제안된 추정량의 대표본성질을 규명하기 위하여 기존 연구에서 더 나아가 최소한의 정칙조건 하에서 바하두어 재표현과 점근정규성을 증명하였다. 모수적 추론 결과를 기반으로 변수선택 문제와 비모수적 함수추정 방법으로서 스플라인 방법론에 대하여 확장 연구를 진행하였다. 두 번째 주제는 리만구조를 가지는 행렬데이터에 대한 자율학습론이다. 통계학을 포함한 여러 분야에서 관측되는 데이터는 양정치 행렬인 경우가 많으므로 양정치 행렬의 군집화에 대해 연구하였다. 양정치 행렬들은 유클리드 공간이 아닌 리만구조를 가지는 대칭 공간인 콘에 속하게 되며 이는 다양체 공간의 한예가 된다. 본 과제에서는 양정치 행렬이 가지는 리만구조에 의해 정의되는 거리들이 유클리드 거리와는 개념적으로 다르고, 산술평균이 다양체에서는 여러 형태의 평균들로 확장될 수 있다는 사실들을 고려한 군집화 방법론을 개발하였다. 세 번째 주제는 리만구조를 가지는 행렬데이터에 대한 지도학습론이다. 의료영상의 확산텐서영상데이터 분석을 포함한 여러 분야에서 반응변수가 양정치 행렬데이터 형태로 관측되는 경우 적절한 설명변수에 의해 정의되는 회귀함수 추정문제가 중요하게 연구되었다. 본 과제에서는 회귀함수 행렬이 양정치가 되도록 하는 모형을 도입하였다. 제안된 모형에 대해 스플라인 추정법을 적용하였으며 대표본 성질로서 스플라인 추정량의 수렴속도가 최소최대 하한과 같게 된다는 사실에 대하여 연구하였다. 설명변수의 수가 많은 경우에 대해서는 해석 및 추정의 어려움이 생기는 다차원의 저주를 극복하기 위해 함수형분산분해 기반 스플라인 방법론에 대해 연구하였다. 본 연구 결과에 대한 기대효과는 다음과 같다. 최근 여러 과학 및 기술 분야에서 이루어지고 있는 데이터 분석에서는 데이터의 행렬구조를 모형화 및 분석하고자 하는 방법론이 중요하게 인식되고 있다. 본 연구에서 개발된 행렬구조를 가지는 데이터의 모형화 및 분석을 위한 새로운 통계적 방법론은 기존의 많은 연구들이 개별적인 상황에서 임시방편적인 해결책을 모색하고 있다는 한계점을 극복할 수 있으며 특히 행렬구조를 고려한 고차원데이터의 모형화 및 분석에 대한 새로운 패러다임을 제시할 수 있을 것으로 기대된다. 새로운 통계학 분야를 창출할 수 있다는 점에서 통계 이론 발전 및 응용성 제고에 크게 기여할 수 있으며 개발된 원천기술은 빅데이터 분석, 확산텐서영상 분석 등 다양한 응용분야에 적용될 수 있을 것이다. 본 연구의 결과를 활용하여 향후 과제로서 능형(Ridge) 회귀, LASSO와 같은 벌점화를 적용하여 변수를 선택하는 것을 고려해 볼 수 있으며, 또한 경시적 자료, 기상학, 생명역학, 의료영상, 위험관리 및 포트폴리오 할당 등 많은 분야에 적용될 수 있을것이라고 기대한다. (출처 : 연구결과 요약문 3p)
원문URL http://click.ndsl.kr/servlet/OpenAPIDetailView?keyValue=03553784&target=REPORT&cn=TRKO201700013603
첨부파일

추가정보

과학기술표준분, ICT 기술분류, 주제어 (키워드) 순으로 구성된 표입니다.
과학기술표준분류
ICT 기술분류
주제어 (키워드)