Data & AI/뉴스 & 마켓인사이트

[Cloud Forum2020] Data&AI 트랜드와 기술요소 / 차세대 빅데이터 플랫폼 / DataOps / MLOps … CP4D 부스를 다녀와서

K JinSol 2020. 7. 31. 16:36

IBM Cloud Forum 2020 온라인 컨퍼런스에 참석했습니다. 여러 IBM 파트너사에서 온라인 부스를 진행했으며, 저는 '펜타시스템의 CP4D 부스'를 다녀왔습니다.

빅데이터와 AI의 기술요소, 차세대 분석 플랫폼, DataOps와 MLOps, 그리고 데모 영상까지 한 곳에서 만나볼 수 있었고 주요 내용을 정리해봤습니다.

목차

1. Data&AI 추세와 기술요소

2. 차세대 Data-AI 플랫폼을 위한 통합 솔루션 "IBM Cloud Pak for Data

3. Cloud Pak for Data의 DataOps와 MLOps

4. IBM Cloud Pak for Data 데모 영상


1. Data & AI 추세와 기술요소

IBM 리서치에서 2020년 3가지 주요 테마가 AI 기술 발전을 이끌 것이라고 예측함

1. AI 모델을 생성하고 배포, 운영할 수 있는 'AI 자동화'

2. 일상 언어를 분석할 수 있는 '자연어 처리 (NLP)'

3. AI 모델을 어떻게 투명하고 설명 가능하게 운영할 수 있을지에 대한 'AI 신뢰성 확보'

 

그 외에도 다양한 기술 동향이 시장에서 확인되고 있음

- 데이터 관리는 여전히 난제임

- 데이터 사일로는 지속적으로 확장

- 스트리밍 분석이 중요한 시기

- 데이터 거버넌스가 중요해짐

- 클라우드와 쿠버네티스를 고려해야 함/ 새로운 기술들의 발현

 

 

2. 차세대 Data-AI 플랫폼을 위한 통합 솔루션 "IBM Cloud Pak for Data"

2-1. 차세대 분석 플랫폼을 위한 기술 요소

차세대 데이터 분석 플랫폼의 주요 기술 요소

- 플랫폼 현대화: 클라우드와 쿠버네티스와 같은 현대적인 플랫폼을 수용해야 함

- 데이터 관리: 컴퓨팅과 스토리지를 분리하여 유연한 확장성을 확보

- 데이터 거버넌스 (DataOps): 데이터 생산자와 소비자 간의 협업을 지원하는 데이터 거버넌스가 필요함

- AI 운영 관리: 분석 모델을 생성, 관리, 거버닝 할 수 있는 AI 운영기술이 필요함

2-2. AI Ladder (AI 사다리) 접근법

'Information Architecture (IA 정보 아키텍처) 없이는 AI가 없다'는 개념의 데이터 수집부터 AI 모델 개발 및 운영까지의 전반적인 AI 라이프 사이클을 지원하는 통합 플랫폼이 바로 Cloud Pak for Data입니다.

 

2-3. 필요한 서비스만 선별적으로 구성할 수 있는 MSA(Microservice Architecture) 기반 플랫폼

플랫폼 전체를 꼭 한번에 구현할 필요는 없습니다. IBM Cloud Pak for Data는 필요한 서비스로만 구성할 수 있는 MSA 기반의 플랫폼이며 단계에 따라 확장할 수 있는 유연성을 갖고 있습니다.

>> 예를 들어 데이터를 collect(수집)하고 organize(거버넌스)하는 단계까지만 서비스를 구성해서 운영할 수 있습니다

 

3. Cloud Pak for Data의 DataOps와 MLOps

하나의 통합된 플랫폼으로서 DataOps(데이터옵스)와 MLOps를 연속적으로 운영할 수 있는 서비스를 환경을 제공합니다

DataOps - 데이터 관리 체계 고도화

-  데이터가상화와 수집을 통해 데이터를 발견(Discover)

- 산업에 맞게 데이터를 이해할 수 있도록 정리 (Understand)

- 데이터 전처리와 정제를 통한 데이터 준비 (Prepare)

- 실제 데이터사이언티스트가 분석/소비할 수 있도록 만들고 데이터를 카탈로깅함 (Consume)

 

MLOps - 준비되어 있는 데이터를 가지고 실제 모델을 개발하는 과정
- AI 모델을 훈련, 테스트, 배포, 그리고 제대로 운영되는지 모니터링하고 재훈련을 자동화

- 모델이 산출해내는 리포트를 대시보드 형태로 결과들을 확인하고 인사이트를 얻을 수 있는 플랫폼
- 특히 AI 라이프사이클 자동화 부분은 Watson Knowledge Catalog와 Watson Studio, Watson Machine Learning, Openscale등을 기업에서 효과적으로 사용할 수 있게 제공

- Openscale (오픈스케일)은 현재 대두되고 있는 모델의 투명성과 신뢰성에 기반한 운영을 도울 수 있는 솔루션

 

 

4. IBM Cloud Pak for Data 데모 영상

IBM Cloud Pak for Data의 전체 기능을 영상을 통해 확인하실 수 있습니다

영상 바로가기>> www.youtube.com/watch?v=QQG9qzNGVxI

 

 


IBM Cloud Pak for Data (CP4D) 관련하여 소개자료, 사례, 유스 케이스 등을 더 알고 싶다면?

- 김진솔 영업대표  kjinsol@kr.ibm.com / 02-3781-5150