지식 저장소 엔진 STORM

STORM은 시맨틱 빅데이터의 변환, 저장, 관리뿐 아니라 온톨로지 기반의 SPARQL 질의와 추론이 가능한 시맨틱 빅데이터 저장소 입니다. STORM은 외부의 LOD(Linked Open Data) 수집, 통합뿐 아니라 다양한 고객 DB와 문서로부터 대규모 RDF 트리플(triple)을 자동 변환, 저장하고 의미 기반 검색과 질의, 논리적 추론과 오픈데이터 퍼블리싱 (Sparql Endpoint)을 지원하는 최고의 제품입니다.


STORM은 온톨로지 기반 대규모 지식베이스 구축을 위한 방법론과 도구를 제공하고 있으며 시맨틱 웹과 IoT(Internet of Things) 환경에서의 지능형 상황인지 서비스와 빅데이터 기반 질의응답(Deep QA) 시스템 구현을 위한 핵심 엔진입니다. 특히 STORM의 LOD 퍼블리싱 기능은 RDF 기반의 공공데이터 통합과 개방 시스템을 일괄 구현함으로 진정한 정부3.0 구현과 지식네트워크 분석을 통한 e-Discovery 체계 구현을 가능하게 합니다.

STORM 주요 특징


대용량 그래프/트리플 저장소

20억 트리플 이상의 초대용량 시맨틱 그래프 저장과 고속의 분산 SPARQL 질의가 가능

RDF(S) 및 OWL 지원과 강력한 추론

W3C 표준의 RDF(S)와 OWL 지식표현 체계를 지원하며, OWL DL과 F-Logic, Horn logic 등의 강력한 추론 기능 포함

SPARQL Endpoint와 LOD 퍼블리싱

RESTful 기반의 SPARQL Endpoint 서비스를 제공함으로 웹 상에서의 손쉬운 LOD 퍼블리싱 가능

온톨로지 모델링과 자동 변환

STORM은 플랫폼과 대규모 온톨로지와 지식베이스 구축을 위한 방법론과 데이터 자동 변환 도구를 제공

지식네트워크 분석

사회관계망을 통해 유통되는 정보를 의미적으로 구조화함으로 지식 생산과 유통, 지식인 간의 관계 분석이 가능

정부 3.0과 공공데이터 포털

공공데이터의 Linked Data 형태로의 개방은 데이터 활용과 융합을 위해 매우 중요. STORM은 LOD 기반 공공데이터 포털의 자동 구축을 지원

시맨틱 기술 기반의 소프트웨어 개발을 위한 통합 방법론

STORM은 시맨틱 기술 기반의 서비스 시스템 개발과 운영을 위한 5가지 관점의 전체 과정을 보다 효과적이고 경제적으로 진행할 수 있도록 통합하고 체계화시킨 사용자 중심의 서비스 지향형 시맨틱 통합 방법론입니다. 이를 통해 고객은 다양한 시맨틱 응용 시스템 개발에 있어서 신뢰성 있는 절차를 확보할 수 있습니다.


STORM의 통합 절차 구조는 각각의 관점별 프로세스 간에 유기적으로 연결이 되어 있습니다. 서비스 전략 기획과 서비스 상세 기획으로부터 도출된 요구사항들은 서비스 지식 개발과 서비스 시스템 개발을 거쳐 서비스 시스템 운영 및 관리까지 추적성을 가지고 투명하게 연계되도록 설계되었습니다. 시맨틱 서비스 시스템 구축과 라이프 사이클을 총괄하는 STORM은 5개 모듈로 구성되어 있으며, 효과적인 지식 베이스 구축과 추론 규칙, 질의 구현 등을 망라합니다.

SSP (Service Strategy Planning)
시맨틱 기반의 서비스 개발 전략 수립을 위해 비즈니스 목적에 적합한 실행 가능한 서비스와 구체화된 서비스 시나리오 도출을 지원
SOM (System Operation and Management)
전통적인 시스템 운영 및 관리 방안과 함께 지속적으로 성장하는 서비스 지식 체계에 대한 체계적인 운영 및 관리 방안을 제시
SKD (Service Knowledge Development)
서비스를 제공하는 데에 필요한 지식 체계를 정의하고 지식 관리와 처리를 위한 시스템을 구현하는 체계적인 방법을 지원
SSD (Service System Development)
서비스를 효과적으로 제공하기 위한 서비스 지향적 시스템 개발과 통합을 위한 절차와 방법을 지원
DSP (Detailed Service Planning)
도출된 각각의 서비스 시나리오에 대해 시맨틱 활용을 위한 적합한 사용자 경험(User Experience), 정보의 획득과 지능화, 관련 기술 시나리오의 도출을 지원

통합절차 구조

STORM의 통합 절차 구조는 각각의 모듈별 프로세스 간에 유기적으로 연결이 되어 있으며, 서비스 전략 기획과 서비스 상세 기획으로부터 도출된 요구사항들이 서비스 지식 개발과 서비스 시스템 개발을 거쳐 서비스 시스템 운영 및 관리까지 추적성을 가지고 투명하게 연계되도록 설계 되었습니다.


세부 절차 개요

STORM의 개발 단계까지의 세부 절차는 아래와 같습니다.


Service Strategy Panning (SSP, 서비스 전략 기획)

서비스 전략 기획은 비즈니스 관점의 서비스 개발 전략을 수립하는 단계로서 다양한 방식의 컨설팅 기법(전략 기획 기법)으로 대치되거나 혼용될 수 있습니다.

Service Knowledge Development (SKD, 서비스 지식 개발)

서비스 요구사항 중 서비스 지식 요구사항을 중심으로 지식체계의 설계와 구축 및 검증, 이를 이용한 지식 시스템의 구축이 목적입니다. 지식 모델링 절차 Ontology 101의 기본적이 가이드라인과 함께 OntoKnowledge 방법론을 응용하여 체계화 하였습니다.

Detailed Service Planning (DSP, 서비스 상세 기획)

서비스 상세 기획은 목표 서비스에 대해 구체적인 서비스 요건들을 정의하는 단계로서 시스템에 대한 상세한 요구사항 도출이 목적입니다.

Service System Development (SSD, 서비스 시스템 개발)

실제 서비스를 실행할 시스템을 구축하는 방법으로 CBD와 SOA 기반의 시스템 구축 절차와 연동할 수 있습니다.

초대용량 트리플 저장∙질의∙추론 엔진

STORM은 시맨틱 메타데이터의 생성 및 저장, 관리, 질의와 추론을 가능하도록 하는 초대용량 시맨틱 컴퓨팅 프레임워크입니다. 20억 트리플 이상의 분산 대용량 처리가 가능하며, 다양한 트리플 저장소들과의 통합을 통한 확장을 지원합니다.


STORM은 시맨틱 메타데이터 공급 및 관리, 시맨틱 어플리케이션 구축을 위한 개발 프레임워크로, 다양한 분야에서 발생되는 컨텍스트(context)에 대해서 온톨로지 기반 스키마(Schema)와 인스턴스(Instance)의 통합 관리가 가능합니다. STORM은 시맨틱 기술을 이용한 어플리케이션 또는 시스템 구축에서 온톨로지 데이터의 생성부터 질의, 추론 그리고 운영까지 모든 프로세스를 포함하여 높은 안정성과 생산성의 효과를 보장합니다.

본 시스템은 대용량 트리플 데이터의 저장 및 관리와 룰(Rule) 기반의 실시간 추론이 가능하며, 운영중인 레거시(Legacy) DBMS의 데이터들을 효과적이고 빠르게 트리플 데이터로 변환이동이 가능합니다. 또한 유연한 구조로 실시간 인덱싱(Incremental Indexing)이 가능하며 SPARQL, Prolog, F-logic의 쿼리언어를 지원합니다. 그리고 웹 기반의 시스템 기동, 시스템 모니터링, 로그관리, 작업 스케줄 관리 등을 통하여 운영의 편리성을 고려하였습니다.

  • W3C 시맨틱웹 표준 준수
  • RDF(S), OWL, F-Logic 지원
  • 20억 트리플 이상의 분산 대용량 처리
  • OWL DL, DLP 수준의 추론 기능 제공
  • COMET과 연동 가능
  • 강력한 자원 관리 및 운용 기능
  • 트리플 인스턴스 자동 생성, 관리 기능

STORM 상세 특징


SOR Knowledge Network Analyzer
수집된 네트워크 데이터를 분석하여 관계 주체에 대해 다각적으로 분석을 수행하며, SNA 알고리즘-연결성(closeness), 중심성(centrality), 동시발생(co-occurence) 분석과, KSNA 알고리즘-확장 분석(보유지식관점) 이 가능하며, 원천 데이터의 형태나 위치에 관계없는 독립적인 기능을 구현합니다.
트리플 데이터 생성의 편리성
약 20억 개의 대용량 트리플 데이터 저장과 고속 처리가 가능하며, RDMS, 비정형 문서, 웹 사이트 등 다종의 데이터와 온톨로지 스키마, XML스크립트(Script) 작성을 통한 연결 (Instantiation)이 가능합니다.
웹 기반의 시스템 운영
STORM은 웹 기반 환경하에서 시스템의 운영 관리가 가능합니다. 크게 코어엔진(core engine) 관리, 작업(Task)관리, 로그관리, 성능관리, 시스템 환경 설정으로 구성되어 있습니다.
SOR Instantiator
인스턴시에이션 룰(Instantiation Rule) 기반의 온톨로지 인스턴스를 생성하며, 데이터베이스(Database) 또는 파일(File) 형태의 데이터를 온톨로지 인스턴스로 매핑, File 형태로 결과 저장 또는 Object 결과를 전달합니다.
다양한 쿼리 및 추론
지식 저장소(RDF Triple)에 접속하여 질의와 추론을 통하여 질의에 대한 결과를 얻습니다. 시맨틱 웹 표준인 RDF 및 OWL-DL 수준에 기반한 매우 강력하고 효과적인 표현의 SPAQL, Prolog, RDFS++ Reasoning, F-logic(Rule Based Reasoning) 등의 쿼리 언어와 추론 기능을 지원합니다.
Instantiation Agent
인스턴시에이션 에이전트는 운영 중인 레거시(legacy) 시스템의 DB와 온톨로지 스키마(ontology schema)와의 맵핑(mapping) 설계를 통하여 트리플 인스턴스(triple instance)의 생성∙추가∙삭제 업무를 특정한 시간에 자동으로 수행하는 데몬 서버(daemon server)입니다. DB 접속정보와 SQL 문, 스케줄 정보 그리고 모델링 된 온톨로지 스키마의 정보를 구조화된 XML 형태로 에이전트에 전송하면 이를 분석하여 해당하는 작업을 수행합니다.
유연하고 확장 가능한 아키텍처
S작업(Task)관리 시 배치 색인(Batch Indexing)과 원본 데이터의 변경 사항에 따른 동적 증분 색인(Incremental Indexing)을 지원하며, 대용량 고성능 트리플 저장/관리 및 쿼리 시스템인 알레그로그래프(Allegro Graph), 온톨로지 및 규칙 기반 추론엔진(OntoBroker)의 개별 및 통합 탑재가 가능합니다.

STORM 상세기능


시멘틱 저장소 관리
대용량 시맨틱 데이터 저장
Driver 형태의 저장소 엔진 탑재
Multi Repository 관리
다양한 인터페이스 제공
Triple Data 저장 관리
Model 기반 인스턴스 관리
정형 데이터로부터의 인스턴스 자동 변환
트리플 데이터 파일 저장 및 백업
Full-Text 검색을 위한 색인 생성
질의 및 추론
SPARQL Query 지원(SPARQL 1.1 지원)
OWL-DL 수준의 결론
SPARQL 질의 확장
SPARQL Endpoint
Web기반 관리 도구
서버관리
온톨로지 브라우징 및 인스턴스 관리
Query 및 규칙 관리
사용자 및 권한 관리

결연

STORM은 시맨틱 기술 기반의 서비스 사업의 기획부터 서비스 개발 및 운영까지의 전체 절차를 보다 효과적이고 경제적으로 진행할 수 있도록 통합되고 체계화된 솔트룩스만의 방법론입니다. 이를 통해 고객은 다양한 시맨틱 응용 시스템 개발에 있어서 신뢰성 있는 절차를 확보할 수 있습니다.