주요 특징

솔트룩스는 지난 20년간 대규모 데이터의 실시간 처리와 지능화를 위해 자연언어처리, 텍스트마이닝, 기계학습, 시맨틱과 같은 인공지능 기술과 빅데이터 수집, 인메모리 분석, 시각화와 같은 스마트 데이터 원천 기술 확보를 위한 끊임없는 연구 개발을 수행해 오고 있습니다.


자연언어처리
자연언어처리(NLP)는 글로 된 인간 언어를 컴퓨터를 통해 처리하기 위한 기술입니다. 형태소 분석, 구문 분석, 개체명 인식 등의 기술을 포함합니다. 솔트룩스의 LEA와 OM 솔루션을 통해 세계 최고수준의 다국어 자연언어처리 기술을 경험해 보십시오.
빅데이터 수집
세계 최고의 빅데이터 수집 엔진인 토네이도는 웹 크롤링을 넘어 트위터, 패이스북과 같은 스트림형 소셜 데이터의 실시간 수집과 AJAX, 자바스크립트 처리가 가능한 포커스드 크롤링(focused crawling), 필요한 데이터만 추출 가능한 랩퍼(wrapper) 기술을 내장하고 있습니다.
텍스트 마이닝(Text mining)
대규모 텍스트 말뭉치로부터 의미 있는 정보를 추출, 패턴을 분석하는 기술입니다. 기계 학습 기반의 통계적 방법과 규칙 기반의 방법이 있으며, 최근에는 이들이 하이브리드 형태로 결합되어 사용됩니다. 자동 분류, 군집 기능 외에 감성(평판) 분석과 같은 기능 구현에 텍스트 마이닝은 필수적입니다.
클라우드 컴퓨팅과 NoSQL
스마트 데이터 플랫폼 구축을 위해서는 초 대용량 데이터의 저장과 관리, 운영이 가능한 클라우드 컴퓨팅 기술이 기본이며, 특히 Hadoop, HBase, Casandra, MongoDB와 같은 NoSQL 기술이 적절히 활용되어야 합니다. 솔트룩스의 및 BigO 플랫폼은 하둡과 얀(Yarn), Kafka-Storm, Spark 그리고 다양한 NoSQL 기술을 활용하고 있습니다.
시각화(Visualization)
분석된 결과의 통찰력 있는 이해를 위해 데이터 시각화는 점점 더 중요해지고 있습니다. 그래프와 같이 기본적인 시각화로부터 네트워크 표현, 지도와의 매시업 등 그 표현 유형과 분석가와의 상호작용 기술이 빠르게 발전하고 있습니다. 레인보우(RAINBOW)는 30종 이상의 강력한 시각화와 대시보드 생성 기능을 제공하고 있습니다.
의미기반 정보검색
빅데이터의 병렬 분산 색인과 검색뿐 아니라 자동 군집과 분류, 패싯 필터링 기술을 연계하고 온톨로지와 같은 시맨틱 기술을 융합함으로 의미기반 검색 기술을 구현합니다. 'DISCOVERY'는 국내 최고의 의미기반 정보검색 기술을 내장하고 있습니다.
기계학습(Machine Learning)과 인공신경망
기계 학습은 충분한 학습 데이터로부터 모델을 생성하고, 해당 모델을 통해 대용량 데이터를 자동 분석, 귀납 추론하는 시스템을 의미합니다. 솔트룩스는 CRF, SVM, Deep Learning을 포함한 다양한 기계학습 모델을 지원하고 있으며, LEA와 OM, HBC 엔진 등은 최첨단 기계학습 기술에 기반하고 있습니다.
시맨틱(온톨로지)
심층 분석을 위해서는 데이터에 대한 의미적 분석이 매우 중요합니다. 시맨틱 기술은 시맨틱 메타데이터 자동 추출, 시맨틱 네트워크 생성, 지식 베이스 구축, 온톨로지의 활용, 논리 및 통계적 추론 등을 포함합니다. 솔트룩스의 스톰(STORM)은 비정형 데이터와 정형 데이터를 의미적으로 연결하고, 분석하기 위한 세계 최고의 시맨틱 기술을 내장하고 있습니다.
CEP, 인메모리 분석
CEP(Complex Event Processing)는 실시간 발생되는 복합적인 이벤트를 식별하고 특정패턴을 발견해내는 기술입니다. 실시간 빅데이터에 대한 CEP와 시계열 분석을 위해서는 인메모리 기술이 필수적입니다. 솔트룩스의 는 인메모리 기반의 CEP와 강력한 실시간 스트림 데이터 분석 기능을 지원하고 있습니다.
통계 기술(R)
빅데이터에서 통계적 의미를 찾고, 그 패턴을 분석하기 위해서 강력한 통계 기능을 필요로 합니다. 솔트룩스의 , 등의 여러 제품들은 통계 패키지인 R과의 연동을 지원하고 있습니다.