본문 바로가기
Data & AI/뉴스 & 마켓인사이트

[Cloud Forum2020] Data&AI 트랜드와 기술요소 / 차세대 빅데이터 플랫폼 / DataOps / MLOps … CP4D 부스를 다녀와서

by K JinSol 2020. 7. 31.

IBM Cloud Forum 2020 온라인 컨퍼런스에 참석했습니다. 여러 IBM 파트너사에서 온라인 부스를 진행했으며, 저는 '펜타시스템의 CP4D 부스'를 다녀왔습니다.

빅데이터와 AI의 기술요소, 차세대 분석 플랫폼, DataOps와 MLOps, 그리고 데모 영상까지 한 곳에서 만나볼 수 있었고 주요 내용을 정리해봤습니다.

목차

1. Data&AI 추세와 기술요소

2. 차세대 Data-AI 플랫폼을 위한 통합 솔루션 "IBM Cloud Pak for Data

3. Cloud Pak for Data의 DataOps와 MLOps

4. IBM Cloud Pak for Data 데모 영상


1. Data & AI 추세와 기술요소

IBM 리서치에서 2020년 3가지 주요 테마가 AI 기술 발전을 이끌 것이라고 예측함

1. AI 모델을 생성하고 배포, 운영할 수 있는 'AI 자동화'

2. 일상 언어를 분석할 수 있는 '자연어 처리 (NLP)'

3. AI 모델을 어떻게 투명하고 설명 가능하게 운영할 수 있을지에 대한 'AI 신뢰성 확보'

 

그 외에도 다양한 기술 동향이 시장에서 확인되고 있음

- 데이터 관리는 여전히 난제임

- 데이터 사일로는 지속적으로 확장

- 스트리밍 분석이 중요한 시기

- 데이터 거버넌스가 중요해짐

- 클라우드와 쿠버네티스를 고려해야 함/ 새로운 기술들의 발현

 

 

2. 차세대 Data-AI 플랫폼을 위한 통합 솔루션 "IBM Cloud Pak for Data"

2-1. 차세대 분석 플랫폼을 위한 기술 요소

차세대 데이터 분석 플랫폼의 주요 기술 요소

- 플랫폼 현대화: 클라우드와 쿠버네티스와 같은 현대적인 플랫폼을 수용해야 함

- 데이터 관리: 컴퓨팅과 스토리지를 분리하여 유연한 확장성을 확보

- 데이터 거버넌스 (DataOps): 데이터 생산자와 소비자 간의 협업을 지원하는 데이터 거버넌스가 필요함

- AI 운영 관리: 분석 모델을 생성, 관리, 거버닝 할 수 있는 AI 운영기술이 필요함

2-2. AI Ladder (AI 사다리) 접근법

'Information Architecture (IA 정보 아키텍처) 없이는 AI가 없다'는 개념의 데이터 수집부터 AI 모델 개발 및 운영까지의 전반적인 AI 라이프 사이클을 지원하는 통합 플랫폼이 바로 Cloud Pak for Data입니다.

 

2-3. 필요한 서비스만 선별적으로 구성할 수 있는 MSA(Microservice Architecture) 기반 플랫폼

플랫폼 전체를 꼭 한번에 구현할 필요는 없습니다. IBM Cloud Pak for Data는 필요한 서비스로만 구성할 수 있는 MSA 기반의 플랫폼이며 단계에 따라 확장할 수 있는 유연성을 갖고 있습니다.

>> 예를 들어 데이터를 collect(수집)하고 organize(거버넌스)하는 단계까지만 서비스를 구성해서 운영할 수 있습니다

 

3. Cloud Pak for Data의 DataOps와 MLOps

하나의 통합된 플랫폼으로서 DataOps(데이터옵스)와 MLOps를 연속적으로 운영할 수 있는 서비스를 환경을 제공합니다

DataOps - 데이터 관리 체계 고도화

-  데이터가상화와 수집을 통해 데이터를 발견(Discover)

- 산업에 맞게 데이터를 이해할 수 있도록 정리 (Understand)

- 데이터 전처리와 정제를 통한 데이터 준비 (Prepare)

- 실제 데이터사이언티스트가 분석/소비할 수 있도록 만들고 데이터를 카탈로깅함 (Consume)

 

MLOps - 준비되어 있는 데이터를 가지고 실제 모델을 개발하는 과정
- AI 모델을 훈련, 테스트, 배포, 그리고 제대로 운영되는지 모니터링하고 재훈련을 자동화

- 모델이 산출해내는 리포트를 대시보드 형태로 결과들을 확인하고 인사이트를 얻을 수 있는 플랫폼
- 특히 AI 라이프사이클 자동화 부분은 Watson Knowledge Catalog와 Watson Studio, Watson Machine Learning, Openscale등을 기업에서 효과적으로 사용할 수 있게 제공

- Openscale (오픈스케일)은 현재 대두되고 있는 모델의 투명성과 신뢰성에 기반한 운영을 도울 수 있는 솔루션

 

 

4. IBM Cloud Pak for Data 데모 영상

IBM Cloud Pak for Data의 전체 기능을 영상을 통해 확인하실 수 있습니다

영상 바로가기>> www.youtube.com/watch?v=QQG9qzNGVxI

 

 


IBM Cloud Pak for Data (CP4D) 관련하여 소개자료, 사례, 유스 케이스 등을 더 알고 싶다면?

- 김진솔 영업대표  kjinsol@kr.ibm.com / 02-3781-5150