시맨틱 검색 엔진 DISCOVERY

GS 인증, 행정업무용 SW 인증, 신SW 상품대상, 대한민국SW대상 대통령상 수상!

DISCOVERY는 클라우드 기반 시맨틱 검색 및 마이닝 엔진입니다. DISCOVERY는 기업 내에 분산된 많은 양의 DB뿐 아니라 소셜 빅데이터, 센서 및 로그 데이터, DOC, PPT, XLS, HWP 등의 오피스 문서를 포함한 방대한 비정형 빅데이터를 실시간 인덱싱합니다. 또한, ECM, EP, KM 등에 축적된 대규모 콘텐츠에 대한 수집, 시맨틱 질의, 색인, 텍스트마이닝이 포함된 비정형 분석을 수행하는 빅데이터 전용 검색 엔진입니다. 300여 세계적 기관들이 사용하고 있는 DISCOVERY가 새로운 패러다임의 빅데이터 세상을 열겠습니다.


DISCOVERY는 기업 내 다양한 정보 포털에서의 통합 검색뿐 아니라 시맨틱 검색을 포함한 비정형 분석 결과를 시각적으로 제공합니다. DISCOVERY의 시맨틱 통합검색 기능은 고정밀 언어처리와 분산 색인 기술이 적용되어 탁월한 검색 성능과 랭킹 품질을 제공할 뿐 아니라 패싯 필터, 문서 군집 및 개인화와 강력한 접근제어 기능을 포함하고 있습니다. DISCOVERY는 문서 중앙화, 고객목소리 분석, 지식경영 시스템, 정보공개 시스템, 온라인 상품 검색 등에 사용되고 있으며 전세계 800여 고객이 세계 최고 수준의 시맨틱 검색과 비정형 분석 기술을 경험하고 있습니다.

DISCOVERY 주요 특징

고정밀 다국어 언어분석기와 고품질 문서 필터를 자체 내장하고 문서 특징 추출, 자동 요약, 유사문서 검색과 그래프, 그림 등의 비정형 문서 개체 검색 기능을 제공하는 세계 최고 수준의 강력한 통합 검색 엔진입니다. 분산, 병렬처리 아키텍처와 중복 문서 처리 기술은 10억건 이상의 문서와 비정형 데이터에 대한 실시간 색인과 검색 성능을 제공하며 조직 내외부의 비정형 지식 자산을 관리, 운용할 수 있는 방법을 제공할 뿐만 아니라 획기적인 기능과 안정성, 클라우드 기반의 높은 확장성과 가용성을 제공함으로써 실질적인 ROI 향상에 큰 기여를 할 것입니다.


시맨틱 통합 검색

매우 강력하고 유연한 색인 구조의 설계가 가능하며 다중 색인으로부터 의미기반 통합 검색과 시각화 지원

강력한 비정형 분석(텍스트마이닝)

솔트룩스는 국내 최초로 텍스트마이닝 기술을 상용화 시켰으며, DISCOVERY는 세계 최고 성능의 자동분류, 군집, 정보/이벤트 추출 기능을 내장

패싯 필터와 강력한 질의 처리

풍부한 검색 조건 설정과 강력한 질의 언어를 통해 고품질 심층 검색을 제공하며, 패싯 필터를 통한 동적인 검색 네비게이션 기능을 내장

대규모 분산 병렬처리

DISCOVERY는 대용량 실시간 처리를 위한 분산 병렬 색인과 검색, 분석 기능을 제공하고 있으며, 클라우드 및 하둡 기반 빅데이터분석 환경을 지원

다양한 데이터 소스

오라클을 포함한 현존하는 거의 모든 데이터베이스와 IBM Notes, EMC, SharePoint 등의 플랫폼, HWP, DOC, PPT, PDF를 포함한 거의 모든 종류의 문서 수집과 색인을 지원

강력한 접근 제어와 보안

문서 등급과 데이터 소스, 조직에 따른 검색 및 분석 결과의 접근 제한 기능을 제공하며, 인덱스 암호화 등 강력한 보안 기증 적용이 가능

숨겨져 있는 정보를, 가치 있는 지식 자산으로!

DISCOVERY는 자체 클라우드 컴퓨팅 기능 및 의미 기반 초대용량(Volume) 정보 검색, 텍스트마이닝과 지식 표현, 추론 기술이 융합 적용된 세계 최고의 비정형 데이터 시맨틱 검색 엔진입니다. DISCOVERY는 가장 진보된 시맨틱 기술을 적용하였으며 손쉬운 연동 및 확장이 가능한 시스템으로 초대용량 분산 클라우드를 지원합니다.


디스커버리 엔진 개념도

문서 개체 검색과 네비게이션
텍스트뿐만 아니라 본문에 포함되어 있는 그래프, 도표, 차트 및 이미지 검색이 가능하며, 문서 내의 해당 개체 위치로 자동 이동, 하일라이팅(반전 표시)하는 기능을 포함합니다.
강력한 접근 및 보안 관리
각 기업의 조직 및 보안 정책에 맞출 수 있는 유연한 ACL 체계를 제공합니다. 특히 DRM연동과 우수한 LDAP, Active-Directory 연계 기능을 지원합니다.
편리한 검색어 자동 완성
검색 과정의 편의성 향상과 정보 접근성 강화를 위해 검색어 자동완성 기능이 내장되어 있습니다. AJAX 기술이 적용된 고성능 검색어 자동 완성 기능은 개체명 추천, 다국어 및 개인화 기능으로 확장 가능합니다.
인덱스 가상화와 클라우드 대응
DISCOVERY는 현존하는 통합 검색 엔진 중 가장 강력한 빅데이터 처리 성능을 확보하고 있습니다. 대용량 데이터에 대한 실시간 분석, 분산 인덱싱과 검색뿐 아니라 인덱스 가상화와 n-way 복제, 인덱스 자동 복구 기능을 통해 안정된 검색 클라우드 구현이 가능합니다.
인기, 연관 검색어 자동 추천
검색 로그를 자동 분석하여 인기 검색어를 추천하며 사용자 검색어와 관련도 높은 연관 검색어를 자동 추천함으로써 보다 빠르고 정확하게 검색이 가능해 집니다.
유연한 커스텀 랭킹과 정렬
검색에서 랭킹 품질은 가장 중요한 고객 만족 요소 중 하나입니다. DISCOVERY는 각 고객 환경과 검색 목적에 따라 유연한 커스텀 랭킹 설정이 가능하며 지정 필드에 대한 고성능 검색 결과 정렬 기능을 제공합니다.
지능형 인덱스 에이전트
DISCOVERY에는 지능형 인덱스 에이전트가 내장되어 있어 KM, EDM, ERM, EP 등의 기업 어플리케이션 및 Legacy DB에 자동 연동하여 다양한 인덱싱 정책에 따라 지능적으로 분산된 정보를 수집, 통합하며, Lotus Notes, SAP 등 중요 벤더 플랫폼과의 커넥터를 제공합니다.
문서 자동 요약과 유사문서 검색
검색된 문서로부터 핵심 키워드를 자동 추출하고 자동 요약문을 생성, 제공함으로써 일일이 문서를 열어보지 않고도 올바른 문서를 바로 선택할 수 있습니다. 또한 검색된 문서와 연관도가 높은 유사문서를 자동으로 검색 하는 기능을 내장하고 있습니다.

DISCOVERY 엔진 개요

DISCOVERY는 시맨틱검색과 텍스트마이닝 기능을 통합 제공하는 세계 최고의 컨텐트 인텔리전스(Content Intelligence) 엔진입니다. DISCOVERY 엔진은 클라우드 컴퓨팅 및 의미 기반 대용량 정보 검색, 자동 분류와 군집 등의 텍스트마이닝 기술, 지식 표현과 추론을 포함한 시맨틱 웹 기술이 융합 적용 되었으며 DISCOVERY, DOR, HBC, SearchBox의 총 4가지 제품으로 구성되어 있습니다.

DISCOVERY DOR :
클라우드 기반 통합 검색 엔진

DISCOVERY DOR은 4.0 버전을 통해 자체 클라우드 컴퓨팅 기능, 고성능 병렬 처리와 더욱 강력해진 관리자 기능, 맞춤형 랭킹 등의 더욱 혁신적인 기술들을 탑재하였습니다.

DISCOVERY HBC :
하이브리드 자동 분류 엔진

HBC(HyBrid Classifier)는 매우 복잡한 다단계, 다차원 분류 체계에 대해 방대한 문서를 고속으로 자동 분류합니다. HBC는 기계학습과 규칙기반 분류를 융합 적용함으로 95%이상의 정확도를 보장합니다.

DISCOVERY CORE :
시맨틱 검색 엔진 (모바일 기능 강화)

디스커버리는 의미기반 검색, 트랜드 및 이슈 분석, 연관정보 분석과 시각화 등 매우 강력한 시맨틱 통합검색 기능을 제공하는 세계 최고의 기업용 시맨틱 검색 엔진입니다. 디스커버리 박스를 통한 차별화된 인터페이스와 스마트 폰, 태블릿 등의 모바일 환경 지원이 강화되었습니다.

DISCOVERY SearchBox :
하드웨어 일체형 사내 검색 포털

일반인이 간단히 설치함으로 조직 내 공유 디스크, 파일서버, 개인 PC 내의 문서를 공유, 검색할 수 있는 어플라이언스 제품입니다. 강력한 보안 기능과 문서 버전관리, 문서 저장소 기능을 포함합니다.

DISCOVERY 엔진 특장점

DISCOVERY 엔진 상세기능

DISCOVERY 엔진이 제공하는 의사결정 지원체계

DISCOVERY는 기업 내부 및 외부의 비정형 데이터에 대한 의미기반 검색, 정보 재조직화, 다차원 분석을 수행함으로, 숨은 지식을 발견하고 올바른 의사결정을 하도록 돕습니다.

DISCOVERY 엔진 도입효과

조직 내 외부 지식의 융합과 실시간 통합 접근
DISCOVERY의 시맨틱 검색과 텍스트 마이닝 기능은 기업 내외부에 존재하는 정형/비정형 데이터를 효과적으로 통합, 분석함으로 필요한 지식정보에 빠르고 정확하게 접근할 수 있도록 돕습니다.
문제 해결 통찰력 확보와 의사 결정 지원
DISCOVERY의 다차원 분석 및 시각화 도구들은 정보의 관계성을 이해하고 숨은 지식을 발견하도록 도우며, 이를 통해 핵심 문제에 빠르게 접근, 통찰력 있는 의사 결정과 문제 해결이 가능하도록 합니다.
고객 목소리, 시장 트랜드 이해를 통한 경쟁 전략 확보
DISCOVERY의 VOC 분석과 소셜 이슈, 오피니언 마 이닝 기능은 고객의 다양한 목소리와 시장, 경쟁자, 기술 트랜드를 통합적으로 분석함으로 기업 위치의 올바른 이해와 경쟁 전략 확보를 가능케 합니다.
지식 유통 구조와 조직 관계망 분석을 통한 지식 경영
DISCOVERY의 시맨틱 엔진을 통해 조직 내외부의 지식 유통 구조와 관계망을 분석, 지식 허브, 브로커, 전문가를 찾아 소통 경로를 단축하고 상호 업무 협력을 강화함으로 신속한 문제 해결이 가능해 집니다.
시스템 운영 및 확장 경제성 확보
DISCOVERY가 제공하는 클라우드 기반 분산 검색과 인덱스 가상화 등의 빅데이터 처리 기술은 시스템 운영과 향후 확장에 대한 경제성을 보장합니다.
클라우드 및 모바일 환경 지원과 스마트 오피스 구현
DISCOVERY는 시스템 가상화, 분산 병렬처리를 제공하는 클라우드 컴퓨팅 기술이 자체 내장되어 있으며, HTML5 기반의 전용 스마트폰 어플리케이션을 통해 스마트 오피스 구현을 지원합니다.
빅데이터 통합 관리
조직 내외부에서 수집된 정형, 비정형 빅데이터의 통합과 효율적 관리 체계 확보가 가능해 집니다.
일관된 정보 접근성 확보
검색이라는 일관되고 익숙한 인터페이스를 통해 방대하고 이질적인 정보에의 통합된 접근과 공유가 가능해 집니다.
지식 공유와 재활용 촉진
조직 내외부의 암묵적 지식을 관리하고 공유할 수 있도록 돕습니다. 또한, 연관 지식을 추천함으로써 숨겨진 지식의 통합적 재활용이 용이해 집니다.

DISCOVERY 엔진 Architecture

DISCOVERY 주요기능

DISCOVERY는 비정형 콘텐츠의 의미기반 검색, 트랜드 및 이슈 분석, 연관정보 분석과 시각화 등의 매우 강력한 시맨틱 통합 검색과 분석이 가능합니다. 또한 심층 분석 솔루션으로도 확장됩니다. 숨은 지식의 발견과 통합적 이해를 통한 전략적 의사결정 및 위험 관리와 사업 최적화, 내∙외부 지식의 연계와 지식 활동 강화, 유∙무형 지식의 자산화를 통해 기업 내 지식자산의 재활용 비용 절감에 큰 장점이 있습니다.

패싯 필터링 – 검색 결과 줄이기
문서의 메타정보를 분석하여 검색 결과에 대한 필터링을 제공함으로 사용자가 원하는 부분에 대한 정보 내비게이션을 지원합니다.
스마트 워프
검색 카테고리를 스마트 워프에 추가하여 빠르게 해당 카테고리로 이동하여 검색 결과를 확인할 수 있으며, 특정 문서의 위치를 저장하여 필요 시 사용자가 빠르게 찾아서 활용이 가능합니다.
토픽 트렌드 분석
검색어와 관련된 연관 토픽 별 월 동향 분석(상승/하락)을 통해 트렌드를 분석할 수 있습니다. 또한 두 개 이상의 토픽을 상호 비교함으로 지식 활동 동향을 깊게 이해할 수 있습니다.
TopN – 지식동향분석
세상 지식의 동향을 분석할 수 있습니다. 월별 지식 세상에서 주요한 이슈가 무엇인지를 분석(상승/하락)할 수 있으며 지식의 흐름을 파악할 수 있습니다. 또한 이슈들을 상호 비교하여 지식과 웹의 흐름을 깊게 이해 할 수 있습니다.
지식 트렌드 분석
사용자들의 지식 소비 패턴을 분석합니다. 특히 다수의 검색 키워드들과 유통 문서량이 시간에 따라 어떤 패턴을 보이는지, 조직/인물 별로 어떤 소비 패턴을 가지는지, 특이점에서는 어떤 이슈들이 있었는지를 파악/분석할 수 있습니다.
지식 네트워크 분석
특정 주제 및 업무에 대한 전사적 지식네트워크를 분석하고, 이들의 협력 네트워크 구조를 이해하고 전문가와 커넥터를 발견할 수 있습니다.
DFS와 클라우드 시스템 관리
플랫폼 가상화를 통하여 10억 건 이상의 초대용량 분산 검색이 가능하도록 하며, 편리한 웹 환경에서의 관리/운용할 수 있도록 지원해줍니다.
스마트/모바일 오피스 지원
모바일 디바이스에 최적화된 UX/UI, 검색 편의성을 구현하였고, 기업 외부에서도 자유로운 사내 지식 활용이 가능한 스마트/모바일 오피스 지원이 가능합니다.
문서 자동군집
디스커버리2는 텍스트마이닝의 모든 기능을 포함하고 있습니다. 보다 진보된 알고리즘이 적용된 자동군집엔진은 방대한 비정형콘텐트를 재조직화 하고, 보다 빠르고 정확하게 핵심정보에 접근, 관리할 수 있도록 합니다.
시맨틱 네비게이터
검색 키워드와 관련한 온톨로지 트리플 정보를 통해 상호 관계의 논리적 추론이 가능합니다. 속성별로 분류된 정보를 통해 새로운 정보 접근과 지식을 한 눈에 조망할 수 있는 쉽고 강력한 시맨틱 내비게이션입니다. 특히 비정형 정보와 의미 기반 정형 메타데이터를 통합해 더 정확한 정보를 찾아갈 수 있도록 LOD(Linked Open Data)를 적용하였습니다.
소셜 네트워크 분석
외부 관련 정보와 이용자의 프로파일 및 콘텍스트를 이용하여 이용자들 간의 연결망을 분석, 시각화하여 전문가 검색, 인물관계망 관계 검색, 인물관계망 지도 등 소셜 네트워크 분석이 가능합니다. 시맨틱웹 기술을 적용하여 인물정보 및 관계 정보를 온톨로지 기반 지식베이스로 구축하고, 이를 통해 이용자 프로파일 및 특성을 활용하여 개인 맞춤형 검색, 추천 서비스 등을 할 수 있습니다.
스마트 매쉬업
내외부 지식 융합 다양한 외부 정보 (구글, 야후, 유튜브, 트위터, 플리커, 서적, 논문, 특허 등) 를 내부 정보와 연계, 융합, 검색, 분석할 수 있습니다. 내부 정보량의 부족으로 인해 발생하는 검색 결과 만족도 문제를 해결 할 수 있습니다. 서비스별로 설정에 따라 통합 검색 화면에 노출할 수 있으며, 또한 목적에 따라 다양한 외부 정보/서비스를 추가 할 수 있습니다.
지식카트 – 지식 관리/공유/재활용
지식카트를 통해 사장되던 관심 검색 결과를 지식으로 축적/관리할 수 있으며 카테고리별 검색 문서를 저장하여 재활용할 수 있습니다. 지식은 타인과 공유가 가능하고 축적된 문서와 유사한 문서를 손쉽게 찾을 수 있습니다.
하이브리드 문서 자동 분류
규칙기반 기계분류 인력으로 관리 분류하던 비정형콘텐트를 하이브리드 자동 분류는 조직 표준 체계에 따라 학습 및 규칙기반으로 자동 분류합니다., 콘텐트간의 관계를 명시할 수 있으며 지식 자산의 활용도 및 정보로의 접근 속도를 높여줍니다.
가상조직과 인맥관리
업무 협력자들과 가상 조직을 구성, 정보를 공유, 재활용할 수 있습니다. 또한, 외부 인물 정보를 등록함으로 해당 인물 관련한 뉴스, 연관 지식 등을 자동 수집 분석할 수 있으며, 누적된 외부 인맥 정보는 조직 내 자산으로 재활용 됩니다.
개인화-마이페이지
개인별 관심정보에 대하여 개인 스크랩을 설정하면 관련된 최근 관심 키워드에 따른 내외부의 문서를 자동 추천해주며, 또한 내/외부 관련인물을 추천해줍니다.

DISCOVERY 도입 효과

유∙무형 지식의 자산화, 재활용 비용 절감
‘디스커버리’의 시맨틱 검색과 분석 기능은 분산 지식을 자산화하고, 이를 체계적으로 관리 접근할 수 있는 환경을 제공합니다. 지식의 전사적 공유 체계는 지식경영 비용을 절감하고, 지속 가능한 혁신 기반을 제공합니다.
내∙외부 지식 연계와 지식 활동 강화
스마트 매시업과 디스커버리 박스를 통해 외부 정보를 기업 내부 정보와 연계, 통합하고 체계화 함으로 조직의 지식 활동 범위를 확대, 활성화 하는 것이 가능합니다.
위험 관리와 사업 최적화
조직 내외부 데이터의 실시간 분석을 통해 위험을 조기 감지하고, 사전 대응할 수 있도록 합니다. 또한 VOC, SCRM, eDiscovery 시스템과 연동하여 사업 최적화에 기여할 것입니다.
숨은 지식의 발견과 통합적 이해
의미기반 시맨틱 검색과 비정형 빅 데이터 분석을 통해 기업 내 파편화된 정보와 그 패턴를 한 눈에 파악하고, 연관 지식을 손쉽게 발견하도록 돕습니다. 궁극적으로 당면한 문제와 그 상황을 통합적으로 이해, 해결하는 것이 가능해질 것입니다.
전략적 의사결정을 위한 인사이트 확보
지식 생산/유통/소비 분석, 연관 지식 동향 분석, 지식/소셜 네트워크 분석, 고객 목소리(VOC) 분석 등, 비정형 빅 데이터의 심층 분석을 통해 전략적 의사 결정이 가능해 집니다.