활용 가치가 큰 빅데이터의 80%가 위치와 관련 있는 지리공간 빅데이터라는 통계가 있을 정도로 위치 기반한 빅데이터 분석은 매우 중요합니다. 솔트룩스는 의미기반 지리공간 모델링과 GIS 연동 가능한 빅데이터 융합 분석 솔루션을 제공하고 있으며, 소셜 빅데이터와의 연계를 통한 지역별 이슈 및 평판 분석, 실시간 마케팅 분석과 이상징후 조기 감지 등의 심층 분석을 지원합니다.
지리공간정보의 시맨틱 활용은 지리적 특징, 지리기하학적 특징, 지리인문학적 특징 등과 같은 지리와 관련한 다양한 계층의 데이터들이 위치좌표를 중심으로 연계되고 추론 처리하여 새로운 지리정보를 제공할 수 있는 활용사례들입니다.
지리공간정보는 위치좌표를 가진 지리적 정보를 바탕으로 지형학, 생물학, 유전병학, 사회학, 인구통계학, 통계학 등의 연관 정보를 가진 정보입니다. 위치좌표는 이동형 단말장치의 센서정보를 이용하여 수집된 WGS84 좌표정보입니다. WGS84는 구체의 중심으로부터 지구표면에 대해 위도, 경도로 표시됩니다.
시맨틱 기술은 데이터에 대해 사람과 기계가 이해하고 공유 및 추론할 수 있게 하는 기술입니다. 이를 위해서는 프로그램들 간 공유하는 데이터 집합이 가진 데이터들 간에 관계를 추가, 변경하고 상호 연계시킬 수 있도록 데이터 모델링을 합니다.
데이터 모델링은 데이터의 개념을 체계화하고 개념들 간의 관계를 정의하고 관계에 해당하는 실체들을 정의합니다. 이는 웹상의 자원들을 표현하는 RDF를 기반으로 온톨로지로 나타냅니다. 온톨로지를 저장하는 시맨틱 저장소는 RDF의 형태로 저장하며 Subject, Predicate, Object의 하나의 트리플 형태로 문장 단위로 저장합니다.
프로그램이 처리를 위해 필요로 하는 데이터를 시맨틱 저장소에서 질의를 하기 위해 SPARQL이라는 질의언어를 사용하여 질의를 수행합니다. 질의 내용 중 지식그래프 내에 표현된 데이터들의 관계성에 따라 값이 지정되지 않은 질의 내 변수는 추론기의 추론을 통해 변수 값을 조회해볼 수 있습니다.
추론처리는 개념과 속성들의 상하관계의 정의에 따른 규칙인 Axiom 기반 추론과 개념 및 속성을 SWRL 규칙언어를 이용하여 정의하여 규칙에 맞는 값을 찾아내는 Rule 기반 추론이 있습니다.다. 또한 데이터의 관계들을 미리 추론하는 Forward chaining 추론과 데이터들이 자주 변경되어 질의 시 추론 처리되는 Backward chaining 추론이 있습니다.
솔트룩스는 지리정보 Open Street Map(www.openstreetmap.org), 서울지역 Point Of Interest(POI)와 건설기술연구원의 서울범위 도로표지판을 바탕으로 온톨로지를 모델링하고 데이터 처리 및 응용처리를 위한 추론 처리결과를 보여주는 서울 도로교통표지판 관리시스템을 구축하였습니다.
도로표지판 관리시스템에서 추론을 적용한 사례는 다음과 같습니다.