한민일보 서울포커스 윤민경 기자 | # ‘서울시 지역별 산업변화’에 대한 논문을 준비하고 있는 A씨는 자치구별 산업활동에 대한 자료를 조사하기 위해 자료를 검색하던 중 ‘서울시 열린데이터광장’에서 자치구별 지역내총생산(GRDP) 데이터를 확보할 수 있다는 사실을 알게 됐다. 그러나 해당 포털에서 검색되는 자료가 너무 방대해 어떤 자료를 봐야 할지 알 수 없었고 통계와 분석 자료도 복잡해 이해하기 어려워 자료를 활용하는 데 애를 먹었다.
“서울에서 금요일 저녁, 가장 붐비는 지하철역 상위 5개를 알려줘”, “서울에 사는 외국인의 행복지수는?”, “자치구별 지역내총생산 규모를 알고 싶어” 등 내년부터 서울시가 보유하고 있는 방대한 공공 데이터를 질문형으로 검색, 답변받는 서비스를 이용할 수 있게 된다.
서울시는 지자체 최초 초거대AI(언어모델) 기반 대시민 검색서비스를 선보이기 위한 ‘빅데이터서비스플랫폼 구축’에 들어간다고 밝혔다. 검색서비스가 구축되면 데이터 전문가가 아닌 서울시민 누구나 공공 데이터를 쉽게 찾고 생활에 활용할 수 있게 된다.
이에 따라 기존에 시가 제공해 온 API(인터페이스) 중심의 데이터 서비스에서 나아가 앞으로는 인공지능(AI) 챗봇을 활용한 ‘자연어 검색’으로 데이터를 쉽게 요구하고 그래프․차트 형태로 시각화된 통계 및 분석 자료를 받아볼 수 있게 된다.
시가 구축할 ‘빅데이터서비스플랫폼’ 서비스는 한국어에 특화된 초거대AI를 활용해 자연스러운 검색과 답변을 제공한다. 시민들은 일상 생활 속 궁금증부터 고급 데이터 분석까지, 자연어로 질문하고 원하는 정보를 쉽게 얻을 수 있다.
예컨대 “남산 근처 주차장 위치를 알려줘”와 같은 질문에는 서울시 공식 홈페이지 내 주차장 정보를 편집해 안내하고 “남산에 편의시설은 어떤 게 있지?”와 같이 ▴연계된 추가 질문도 가능해 정보를 빠르게 종합해 안내받을 수 있다.
또 “서울에 사는 외국인의 행복지수는 어떻게 되지?”, “자치구별 지역내총생산 규모를 알려줘”와 같이 서울서베이, 서울 지역내총생산 등 ▴통계치 기반 정보나 “강서구 전년 대비 지역내총생산 성장률과 1인당 규모는 얼마인가?”와 같은 ▴복합 질문도 가능하다.
“환경차 보급확산 추세에 맞춰 서울 시내 전기차 관련 데이터를 찾아줘”와 같이 요청하면 서울시가 보유한 데이터 중 ‘전기차’ 키워드를 포함한 대기환경 정보, 온실가스 배출량 등 ▴관련된 데이터를 모두 모아 분석에 활용할 수 있게끔 제공할 예정이다.
답변은 그동안 서울시에 쌓인 공공 데이터, 통계, 인구․교통․물류 등 ‘도시 빅데이터’를 기반으로 제공되며, 외부 데이터가 필요한 경우 검색 방법까지도 상세하게 제공하는 등 ‘자연어 검색’에 최적화된 서비스로 제공할 계획이다.
아울러 서울시는 시민에게 필요한 행정 또는 민간 데이터 검색 외에도 ▴데이터 분류체계․데이터 간 연관관계 등을 시각화한 ‘데이터 맵’ ▴주제별 데이터 분석 결과를 인포그래픽 형태로 제공하는 ‘주제 시각화’ 서비스도 함께 제공할 예정이다.
또 원본 데이터 조회 및 다운로드, 데이터 설명서 등도 제공해 데이터 분석을 원하는 시민이 자료를 보다 편리하게 확인할 수 있도록 도움 줄 계획이다.
한편 시는 초거대AI 기반 검색서비스 구현을 위해서는 빅데이터 수집과 분석 역량이 중요한 만큼 공공클라우드를 도입하고 서울시 직원 대상 인공지능(AI) 분석 교육을 진행, 데이터 분석 역량도 강화해 나간다.
어린이도 쉽게 이해할 수 있는 자료를 제공하기 위해 3차원 가상 융합관을 조성, 공공 데이터에 대한 접근성과 흥미도 높인다.
윤충식 서울시 빅데이터담당관은 “경제․산업․문화 등 모든 분야에 폭넓게 확산되고 있는 ‘대화형 AI’를 활용해 공공데이터 가치와 사용성을 높이기 위해 새로운 검색서비스 플랫폼을 구축하게 됐다”며 “시민이 방대한 공공데이터에 편리하게 접근하고 사용할 수 있도록 앞으로도 데이터 기반 행정 강화를 위한 노력을 지속할 것”이라고 말했다.