기업조회

본문 바로가기 주메뉴 바로가기

보고서

연구보고서 기본정보

텍스트마이닝 기법을 활용한 기술과 산업분류 코드 연계모형 구축

연구보고서 개요

기관명, 공개여부, 사업명, 과제명, 과제고유번호, 보고서유형, 발행국가, 언어, 발행년월, 과제시작년도 순으로 구성된 표입니다.
기관명 NDSL
공개여부
사업명
과제명(한글)
과제명(영어)
과제고유번호
보고서유형 report
발행국가
언어
발행년월 11/01/2015
과제시작년도

연구보고서 개요

주관연구기관, 연구책임자, 주관부처, 사업관리기관, 내용, 목차, 초록, 원문URL, 첨부파일 순으로 구성된 표입니다.
주관연구기관 동국대학교
연구책임자 이영섭
주관부처
사업관리기관
내용
목차
초록 한국산업분류(KSCI) 설명집에 대한 텍스트 크롤링 및 전처리 실시 - J열: 출판, 방송통신 및 정보서비스업에 대한 설명집 크롤링 및 전처리 실시 - C열: 제조업에 대한 설명집 크롤링 및 전처리 실시 형태소 분석을 위한 관련 분야 한글 사전 정리 형태소 분석기를 이용한 명사추출 실시 추출된 명사 목록을 이용하여 불용어 처리 등 텍스트 처리 기법을 활용한 정확도 향상 구축된 토픽과 새로 입력되는 설명(Query) 사이의 매칭 알고리즘 개발 - 텍스트 벡터 사이의 코사인 유사도 산출 방법 연구 - 토픽 모형 사후확률을 반영한 코사인 유사도 산출 방법 연구 C열 (제조업)에 대한 토픽 모형 구축 완료 새롭게 입력되는 산업분류 모형에 대해 토픽 모형을 활용한 유사도 매칭 방안 제안
원문URL http://click.ndsl.kr/servlet/OpenAPIDetailView?keyValue=03553784&target=REPORT&cn=TRKO201600000569
첨부파일

추가정보

과학기술표준분, ICT 기술분류, 주제어 (키워드) 순으로 구성된 표입니다.
과학기술표준분류
ICT 기술분류
주제어 (키워드)