기업조회

본문 바로가기 주메뉴 바로가기

보고서

연구보고서 기본정보

텍스트 마이닝 분석을 활용한 예산배분조정 전략과 예산의 연계성에 관한 연구

연구보고서 개요

기관명, 공개여부, 사업명, 과제명, 과제고유번호, 보고서유형, 발행국가, 언어, 발행년월, 과제시작년도 순으로 구성된 표입니다.
기관명 NDSL
공개여부
사업명
과제명(한글)
과제명(영어)
과제고유번호
보고서유형 report
발행국가
언어
발행년월 2019-01-01
과제시작년도

연구보고서 개요

주관연구기관, 연구책임자, 주관부처, 사업관리기관, 내용, 목차, 초록, 원문URL, 첨부파일 순으로 구성된 표입니다.
주관연구기관 한국과학기술기획평가원
연구책임자
주관부처
사업관리기관
내용
목차
초록 5. 결론 1) 연구결과의 요약 연구개발전략의 성과는 다양한 배경, 요인들에 의해 복합적으로 영향을 받으며 성과 기획, 수행, 관리하는 주체들의 노력, 의지 등의 개별적인 원인보다 전략을 구성하는 구조(Architecture), 절차(Process), 인력(People), 포트폴리오(Portfolio)간의 일관성(Consistency), 정합성(Coherence), 연계성(Alignment)이 영향을 미친다(Pisano, 2012) 이에 동 연구는 연구개발예산배분조정결과 절차에서 생산되는 문서를 대상으로 중점추진분야의 일관성 분석방법을 알아보고 중점추진분야와 예산투자의 연계성을 분석하였다. 세부적인 분석결과는 다음과 같다. 첫째, 투자방향·기준과 예산배분조정결과 중 중점추진분야를 대상으로 자연어 처리과정을 수행하였다. 수행결과 핵심단어를 추출하고 핵심단어에 대한 빈도, 연결중심성, 매개중심성을 분석하였다. 분석결과, 연결중심성은 원천기술, 환경, 수요, 인력양성, 해양, 소재부품, 대학, 안전, IT, 협력 등의 순으로 나타난 반면, 매개 중심성은 원천기술, 환경, IT, 수요, 소재부품, 부처협업, 해양, 안전, 기초연구, 인프라 등의 순으로 나타났다. 연결중심성과 매개중심성에 공통적으로 상위에 나타난 단어는 원천기술, 환경, 수요, 소재부품, 안전, IT 등으로 나타났다. 이러한 결과로 볼 때 원천기술, 환경, 수요, 소재부품, 안전, IT 등이 연구개발 정책에서 강조하고 있음을 알 수 있다. 둘째, 네트워크분석의 유사도를 이용하여 일관성을 분석하였다. 분석방법은 네트워크를 구성하는 단어간의 관계, 단어쌍간의 관계, 토픽의 분포변화를 이용한 세 가지 방법으로 분석하였다. 유사도 분석 결과, 핵심단어의 출현빈도나 단어쌍의 공출현 관계를 이용한 유사도는 낮게 나타난 반면 토픽의 확률분포를 이용한 유사도의 값은 비교적 높게 나타났다. 이러한 결과는 문서의 양, 핵심단어의 빈도, 단어쌍의 공출현 빈도만을 고려하여 문서의 유사도를 평가하는 것보다 토픽분석이 문서 간의 의미적 유사성을 비교할 때 많이 사용된다는 선행연구(Jang et al., 2016; Shao & Qin, 2014)를 고려할 때 토픽분석을 이용한 일관성 분석이 적절한 것을 알 수 있다. 셋째, 연구개발예산은 과학기술분야에 대한 정부의 정책의지를 정량적으로 반영한 결과로서 일반적으로 정책기조의 변화가 예산투자에 반영된다. 이에 토픽분석으로 산출된 토픽 분포의 변화가 예산과 연계되었는지를 살펴보았다. 이를 위하여 2차·3차 과학기술기본계획 대상 시기에 해당하는 투자방향 및 기준과 예산배분조정결과 중 중점추진분야에 해당하는 부분에 대하여 토픽분석을 수행하였다. 토픽분석 결과, 토픽을 삶의 질, 인프라 구축, 창업·기업지원, 산업기술개발, 인력양성으로 명명하였다. 토픽에 해당하는 과제정보를 국가과학기술지식정보서비스(NTIS)에서 수집하고 토픽의 분포변화에 따른 투자규모와 비중의 변화를 살펴보았다. 분석 결과, 예산규모 측면에서는 삶의 질, 인프라 구축 분야는 토픽 분포의 출현확률이 증가함에 따라 예산 규모도 같이 증가하였다. 창업·기업지원은 토픽분포의 출현확률은 크게 변하지 않았으나 투자규모만은 증가한 것으로 나타났다. 반면에 인력양성, 산업기술개발 분야는 토픽분포의 출현확률은 낮아 졌으나 투자규모는 증가한 것으로 나타났다. 이러한 결과는 연구개발 절대 규모가 증가함으로서 투자규모가 증가하여 발생한 것으로 판단된다. 투자비중 측면에서 비교분석하였다. 분석결과, 인프라 구축 분야는 토픽의 분포에 따라 투자비중도 증가하였다. 삶의 질은 토픽분포의 출현확률이 증가하였으나 투자비중은 적은 폭으로 증가하였으며 인력양성은 토픽분포의 출현확률은 감소하였으나 투자비중은 적은 폭으로 증가한 것으로 나타났다. 이러한 결과는 인력양성에서 우수인재양성 또는 융합인재양성 등으로 정책이 다변화하였으나 자연어 처리의 한계로 동일한 토픽으로 분류되지 못한 것이 원인으로 판단된다. 특히 산업기술개발은 토픽분포의 출현확률이 감소함에 따라 감소하였고 창업·기업지원의 경우 토픽분포 출현확률의 변화가 적었으나 투자비중은 급격히 감소하는 모습을 보여주었다. 이러한 결과는 산업기술개발분야의 많은 부분을 차지하고 있는 개발 연구의 비중 감소와 연계되어 축소된 것으로 판단된다, 창업·기업지원의 경우에도 대기업에 대한 지원이 축소됨에 따라 그 비중이 축소된 것으로 판단된다. 2) 연구의 시사점 동 연구는 연구개발 효율성의 원인을 연구개발배분조정 절차의 측면에서 분석하고자 하였다. 이에 예산배분조정을 위해 수립하는 투자방향·기준과 배분조정결과의 일관성 분석방법을 탐색하여 도출하고, 정책적 의지를 기술하는 중점투자분야와 예산의 연계성을 분석하였다. 하지만 매년 변화하고 있는 토픽출현확률에 따라 투자규모가 연계되어 변화하는 뚜렷한 모습을 찾기는 어려웠다. 이에 첫해와 마지막 연도를 중심으로 투자비중의 변화를 살펴본 결과 삶의 질, 인프라 구축, 산업기술개발은 토픽의 변화에 따라 투자비중이 연계하여 변화하는 모습을 보여 주었다. 반면에 창업·기업지원, 인력양성의 경우에는 자연어 처리과정, 과제분류의 한계 등으로 긍정적으로 연계되어 변화되는 모습을 볼 수는 없었다. 이러한 결과를 기반으로 연구개발 투자방향과·기준과 예산배분조정결과의 일관성, 그리고 예산배분조정전략과 예산투자의 연계성이 충분하다고 주장하기에는 한계가 있다. 이에 연구개발전략의 측면에서의 효율성을 종합적·객관적으로 분석하고 그 문제점과 개선방안을 도출하여 이행할 필요가 있다. 3) 연구의 의의 및 한계 동 연구의 의의는 다음과 같다. 첫째 연구개발 예산배분조정절차에서 일관성을 분석하고, 예산배분조정전략과 예산투자와의 연계성을 분석하였다는 정책적 의의가 있다. 둘째, 텍스트 네크워크 분석을 동향분석에 활용하는 대부분의 선행연구와 달리 정책의 일관성 분석에 활용하였다는 학문적인 의의가 있다. 그리고 과학기술정책 분야의 텍스트 분석을 위하여 유의어, 지정어, 불용어 등의 사전을 구축하여 텍스트네트워크분석 방법의 가용성을 제고하였다는 실무적 의의가 있다. 이러한 연구의 의의에도 불구하고 다음과 같은 한계가 있다. 첫째, 시기별로 자료의 구성 및 내용에 차이가 있어서 직접적으로 비교하기 어렵다는 한계가 있다. 또한 분석대상이 되는 자료는 시기별로 그 구성, 목차, 분량의 차이가 있고 공통적으로 제시되어 있는 부분이 제한되어 있어 직접적으로 비교분석하기에는 한계가 있다. 둘째, 기술되어 있는 용어가 시기에 따라 다르게 표현하고 있다는 한계가 있다. 이를 위하여 유의어, 지정어 사전 등을 구축하였으나 모든 용어에 대한 사전을 구축하지 못하였다는 한계가 있다. 셋째, 안건간의 유사도 분석을 통하여 시기에 따라서 일관성과 차별성이 있음을 보여 주었으나 그 차이의 정도를 구체적으로 제시하고 있지 못한다는 한계가 있다. 넷째, 과학기술정책 분야에 활용되는 공식적인 사전이 구축되어 있지 않아 연구자의 판단에 의존적이라는 한계가 있다. 텍스트 네트워크 분석은 사전의 충실한 구축인 분석 결과의 신뢰도에 중요한 영향을 줄 수 있어 유의어, 지정어, 불용어 등의 사전구축에 전문가의 판단이 중요한 영향을 미친다. 4) 향후 연구방향 첫째, 연구개발 효율성에 관하여 연구개발 전략의 종합적 측면에서 효율성을 점검하고, 합리적인 개선방안을 제시할 필요가 있다. 둘째, 텍스트 네트워크 측면에서는 과학기술정책의 텍스트 분석을 위한 지정어, 유의어, 불용어 사전 등을 보완하여 가장 많은 시간이 소요되는 자연어 처리 과정을 효율화하여 분석을 용이하게 할 필요가 있다. 셋째 동 연구에서 유사도를 활용한 토픽 분석을 수행하여 일관된 방향성과 예산과의 연계성을 보여주었으나 유의미한 정량적인 수치는 제시하지 못하였다. 향후 연구에서는 유사한 정도를 검증할 수 있는 분석방법에 대한 모색이 필요하다. (출처 : 요약문 11p)
원문URL http://click.ndsl.kr/servlet/OpenAPIDetailView?keyValue=03553784&target=REPORT&cn=TRKO201900002578
첨부파일

추가정보

과학기술표준분, ICT 기술분류, 주제어 (키워드) 순으로 구성된 표입니다.
과학기술표준분류
ICT 기술분류
주제어 (키워드)