발간자료

머신러닝 기법을 적용한 재정데이터 활용
제목 머신러닝 기법을 적용한 재정데이터 활용
작성자 김민경 등록일 2023-12-31 조회수 2255
내용

 ☞ '분석보고서 23-10 소개 영상' 바로가기


머신러닝 기법을 적용한 재정데이터 활용


1. 배경 및 목적 

 본 보고서는 dBrain+에 탑재된 재정데이터 활용의 확장 가능성 모색을 위해 인공지능 기술 중 머신러닝 기법을 중심으로 논의한 것이다. 본 보고서에서는 먼저 인공지능-머신러닝-딥러닝으로 이어지는 개념을 살펴보고 그 중에서도 본 분석에서 활용될 머신러닝의 여러 알고리즘에 관한 이론적 논의를 분석적 측면을 중심으로 논의하였다. 이론적 논의 이후에는 실제로 공공부문을 중심으로 국내외 머신러닝 기법 실제 활용사례를 분석하여 재정데이터에 활용될 수 있는 방향에 대해 논의하고 시사점을 도출하였다. 다음으로 분석 대상인 dBrain+ 데이터의 특성에 대해 논의하고 앞서 살펴본 머신러닝 알고리즘을 적용하기 위해 전제되어야 할 데이터 측면에서의 선결조건을 제시하였다. 그리고 논의를 바탕으로 활용 가능성 제시를 위해 실제 dBrain+ 데이터를 대상으로 텍스트 분석을 예시적으로 실시하여 가능성을 탐색하여 개선방안을 제시하였다. 이러한 과정을 통해서 향후 머신러닝 기법을 적용한 dBrain+ 데이터 분석이 활용될 수 있는 가능성과 dBrain+ 시스템 발전에도 기여할 수 있는 시사점을 제시해보고자 하였다.



2. 주요 내용

 머신러닝 기법은 정형데이터 및 비정형데이터, 다변수 고려에 특화되어 있다는 점에서 재정데이터 분석에 활용하기에 적합하다고 볼 수 있었다. 첫 번째로는 dBrain+에 탑재되어 있는 텍스트 정보와 같은 비정형데이터의 활용도를 높이는 것이다. 두 번째로는 예측을 통한 정책지원으로 머신러닝 기법이 갖고 있는 강점인 다변수와 빅데이터를 활용한 예측 모델링으로 재정분야에서 전망 기능을 수행하는 것이다. 세 번째로는 부적정 집행 탐지와 같은 이상치 탐지 영역이다. 공공부문에서는 각종 부정수급 탐지 및 부적정 지출 스크리닝 및 적발에 활용 가능할 것으로 보인다. 재정정보 활용에 있어 머신러닝 기법을 적용하기 위해서는 먼저 선결되어야 할 조건들이 존재한다. 우선 예측 및 전망에 있어 다양한 변수를 활용할수록 일반적으로 예측력이 높아지는 머신러닝 기법의 특성상, 유관 타 DB와의 연동을 통한 수혜자 속성 변수 확충 및 재정사업 정보 보완을 통해 분석에 활용할 데이터를 확보하는 것이 필요하다. 두 번째는 텍스트 분석의 기초 작업인 ‘재정 말뭉치’, ‘재정분석 사전’ 구축 작업이다. 세 번째로는 재정사업 속성정보 정비 및 확충 이다. 이는 앞서 언급한 수혜자 정보 중심의 타 DB와의 연계와 유사한데, 다만 재정사업은 분석에 있어 변수 및 분류 인자로 작용할 특성을 속성화하여 메타 정보화 하는 작업이 필요할 것으로 보인다. 



3. 목차


 Ⅰ. 서론

   1. 분석 배경 및 목적

   2. 분석 내용


 Ⅱ. 머신러닝 기법의 공공부문에서의 활용

   1. 머신러닝 기법 개요

   2. 지도학습

   3. 비지도학습

   4. 머신러닝 기법의 공공부문 활용사례

   

 Ⅲ. 머신러닝 기법 적용 가능성 탐색

   1. 머신러닝 기법의 재정 데이터 활용 가능성

   2. dBrain+ 데이터를 활용한 텍스트 분석

    

 Ⅳ. 머신러닝 분석기반 확충을 위한 선결조건

   1. 타 DB와의 연계를 통한 데이터 변수 추가

   2. 재정 말뭉치를 통한 텍스트 정보 활용 기반 조성

   3. 속성정보 정비를 통한 데이터 확충

   

 Ⅴ. 결론 


 <참고문헌>

첨부파일
이전 글&다음 글
이전 글 국고보조사업 성과정보 관리⸱활용 방안
다음 글 다음글이 없습니다.


  • 담당부서 : 정보분석지원팀
  • 전화번호 : 02-6908-8153
  • 담당자 : 정희민

Q. 이 페이지에서 제공하는 정보에 대하여 어느 정도 만족하셨습니까?

평균 4.7점 / 38명 참여