문의하기

데이터 사이언스란?

데이터의 분석과 활용이 개인과 조직의 새로운 힘이 되고 경쟁력이 되는 시대입니다. 데이터 사이언스는 데이터 수집, 큐레이션, 통계 분석과 기계학습 등의 다양한 기술과 지식을 활용하여 복잡한 데이터로부터 인사이트를 얻거나 지능화된 시스템을 구현하기 위한 모든 업무를 총칭합니다.


데이터 사이언스 절차

전형적 데이터 사이언스의 절차는 데이터 수집, 정제에서 시작해 기계학습 및 분석 모델의 선정과 최적화, 예측과 지능화 결과에 대한 평가와 시각화 과정이 반복적으로 수행됩니다. DataMixi의 데이터 사이언스 서비스는 솔트룩스의 지난 20년 동안 축적된 인지분석과 기계학습의 성공 경험과 전문가들의 참여를 통해 수행됩니다.


이중나선 방법론

탁월한 수준의 심층 데이터 분석과 서비스 지능화를 위해서는 사람과 기계의 적극적인 협력(human-in-loop)이 필요합니다. DataMixi의 데이터 사이언스 체계는 알고리즘/도구와 전문가가 적극적으로 상호 협력하는 이중나선 방법론(dual spiral methodology)에 기반하고 있습니다.


데이터 큐레이션

데이터 과학자들이 심층 분석과 기계학습 수행 시에 겪는 가장 큰 고충은 오류를 포함한 대규모 데이터에 대한 정제와 학습 데이터의 부족에 있습니다. 데이터 큐레이션은 각 분석과 지능화 목적에 부합되는 프로세스와 도구 그리고 훈련된 전문가를 통해 수행되어야 합니다.


기계학습 과 딥러닝

최근 데이터 사이언스의 핵심 주제가 기계학습과 딥러닝이라 해도 과언이 아닐 것 입니다. DataMixi의 데이터 사이언스 서비스는 전통적 통계 분석뿐 아니라 CRF와 SVM과 같은 다양한 기계학습 기술과 CNN, RNN과 같은 심층신경망 기반의 딥러닝 기술을 활용한 데이터 심층 분석을 수행합니다.


데이터 분석 과 기계학습 플랫폼

DataMixi의 데이터 사이언스 서비스는 DataMixi의 인지분석포털을 중심으로 1천여 글로벌 고객과 100여 특허로 검증된 솔트룩스의 다양한 분석 엔진들과 R, TensorFlow와 같은 강력한 오픈소스를 융합, 활용하고 있습니다.