본문 바로가기
Data & AI/Case Study & Use Case

[Case Study #1] 미국 Fifth Third 은행의 데이터 사이언스 환경 구축 (Watson Studio)

by K JinSol 2020. 1. 28.

안녕하세요, K Jinsol입니다.

앞으로는 다양한 케이스 스터디를 통해 어떻게 기업들이 성공적인 Data & AI Tranformation을 이뤄내고 있는지 알아보고자 시리즈물로 포스팅할 예정입니다.

 

한글로 번역하는 과정에서 이해를 돕기 위해 일부 에디팅 (설명 추가, 패러프레이징, 일부 생략 등)을 했습니다. 저작권은 원문에 귀속됩니다: https://www.ibm.com/case-studies/fifth-third-bank-hybrid-cloud-data-science

 

첫 번째 케이스 스터디는 Fifth Third Bank 은행 사례로 시작해보겠습니다!

출처: Unsplash

0. Fifth Third Bank 

오하이오 주 신시내티에 본사를 둔 금융 서비스 회사입니다. 2018년 3월 31일 현재, 오하이오, 켄터키, 인디애나, 미시간, 일리노이, 플로리다, 테네시, 웨스트 버지니아, 조지아, 노스캐롤라이나에서 1153개의 풀서비스 뱅킹 센터와 2459개의 ATM을 운영하고 있습니다. 

 

경쟁이 치열해질수록 은행들은 마케팅을 고도화하여 고객 참여(engagement)와 고객 유지(retain)에 더 힘써야 합니다. Fifth Third Bank는 마케팅 분석을 최적화하기 위한 최첨단 데이터 사이언스 도구의 잠재력을 보아 IBM Watson Studio (구 IBM Data Science Experience)를 사용하여 매우 민감한 은행 데이터로 머신러닝을 수행할 수 있는 오픈소스 기술을 사용할 수 있는 통제된 환경을 만들었습니다. 

1. Business Challenge 

오늘날 가장 발전되고 흥미로운 데이터 사이언스 기술은 오픈 소스 커뮤니티에서 나옵니다. Fifth Third Bank는 이러한 도구들을 안전한 IT 환경에 안전하게 통합해야 하는 과제를 안고 있었습니다.

 

기업 관점에서 볼 때 놀랍게도, 데이터 사이언스 도구의 혁신 중 상당 부분이 오픈 소스 커뮤니티에서 비롯됩니다. 오늘날 대학을 졸업하는 데이터 사이언티스트들의 주요 전문 지식은 기존 레거시 통계 소프트웨어가 아닌 R 및 Python과 같은 오픈소스 언어, Tensor Flow 및 Keras와 같은 프레임 워크, Jupyter Notebook과 같은 개발 도구에 있습니다.

 

Fifth Third Bank의 Decision Sciences Group (DSG)은 마케팅 분석 최적화와 데이터 사이언스 인재를 유치하기 위한 경쟁력을 오픈소스 소프트웨어를 통해 확보할 수 있는 가능성을 빠르게 캐치했습니다.

 

은행이 데이터 사이언스 관행을 개편하기로 결정했을 때, DSG 팀은 오픈소스를 적용할 수 있는 최적의 기회라고 생각했습니다. 레거시 모드에 맞춰 수천 줄의 코드를 다시 작성하는 대신, 팀은 기존의 레거시 모델링 플랫폼이 아닌 Python과 R에서 처음부터 모델을 다시 작성하기로 결정했습니다.

 

하지만 아직 보안이라는 숙제가 남아있었습니다. 많은 산업에서 데이터 사이언티스트들은 최신 프레임 워크를 무료로 다운로드하여 모델을 즉시 구축할 수 있습니다. 그러나 데이터 거버넌스가 엄격한 규제를 받는 금융 서비스 환경에서는 고객 데이터 사용을 위해 훨씬 더 엄격한 보호 수단을 강구해야 했습니다.

 

은행의 주요 응용 프로그램 개발자 인 Brian Robinson은 다음과 같이 말합니다. “은행으로서 오픈소스 소프트웨어를 안전하게 활용하여 최첨단 모델을 구축하는 방법은 무엇일까? 우리는 데이터 사이언티스트들이 이러한 도구에 액세스 할 수 있는 능력을 갖추면서도 IT 보안 표준을 준수해야 하는 통제된 환경을 만들어야 했습니다.”

 

출처: Unsplash

2. Transformation 

Fifth Third Bank는 IBM Watson Studio를 사용하여 IT 보안 요구 사항을 충족하면서 Jupyter Notebook, R 및 Python 라이브러리에 액세스 할 수 있는 강력하고 확장 가능한 환경을 구축했습니다.

 

Fifth Third Bank는 빅데이터 분석을 지원하고 모델을 효율적으로 훈련하기 위해 Hadoop 클러스터를 구축하기로 결정했습니다. 은행은 온프레미스 환경에서 클러스터를 구축함으로써 중요한 모든 데이터가 항상 자체 방화벽 내에 유지되도록 하여 IT 보안 정책을 준수했습니다.

 

Decision Sciences Group의 수석 데이터 사이언티스트인 Jeffrey Allard는 다음과 같이 말합니다. “우리는 여러 벤더의 다양한 Hadoop 제품을 살펴보았지만 빅데이터 인프라 자체는 중요하게 생각하지 않았습니다. 우리의 주요 요구 사항은 데이터 사이언트 툴링과 보안이었습니다.”

 

이러한 요구 사항을 충족할 수 있는 잠재력을 IBM Watson Studio 데모를 보고 신속하게 파악했습니다. Watson Studio는 데이터 사이언스 팀이 데이터 준비에서 모델 개발에 이르는 전체 데이터 과학 라이프 사이클을 포괄하는 광범위한 오픈 소스 및 엔터프라이즈 도구에 액세스 할 수 있는 플랫폼입니다. 하이브리드 솔루션으로서 온프레미스로 구축하거나 퍼블릭 또는 프라이빗 클라우드를 통해 접근할 수 있습니다.

 

Jeffrey Allard는 “처음에는 Watson Studio 클라우드 버전에서 개인 계정을 설정하고 모델 개발을 위해 Jupyter Notebook을 사용하는 방법으로 접근했습니다. Watson Studio Local를 온프레미스로 구축할 수 있다면 실제 은행 데이터로 모델을 구축하는 데 필요한 제어된 환경을 제공할 수 있습니다."라고 말했습니다.

 

이 은행은 IBM과 협력하여 세 개의 노드로 소규모 IBM Watson Studio Local 클러스터를 구성했습니다. DSG 팀이 더 많은 모델 교육 워크로드를 플랫폼으로 이동하기 시작하면서 9개에서 11개 노트 클러스터로 빠르게 성장했습니다.

 

Watson Studio를 사용하면 Fifth Third Bank의 DSG 팀과 다른 팀들은 제어된 환경에서 필요한 데이터와 오픈소스 도구 그리고 필요한 프레임 워크에 모두 액세스 할 수 있습니다. 데이터 사이언티스트가 악성 코드에 감염되어 있을 가능성이 있는 임의의 패키지를 자신의 PC에 다운로드하는 대신, 각 패키지는 중앙에서 다운로드되어 사전에 은행의 보안 팀에 의해 스캔됩니다.

 

DSG 팀은 이미 Watson Studio에서 Jupyter Notebook을 사용하여 광범위한 마케팅 및 고객 분석 문제를 해결하기 위한 새로운 모델을 구축했습니다. 예를 들어 직접 마케팅 팀이 잠재 고객 데이터베이스에서 올바른 잠재 고객을 타겟팅하고, 신규 고객 계정의 잔액 및 수익을 예측하고, 향후 5년간 고객 이탈 가능성을 평가할 수 있습니다.

 

Jeffrey Allard는 “기존의 통계 모델 외에도 머신러닝 및 딥러닝 기술도 사용하고 있습니다. 예를 들어, 우리는 신경망을 사용하여 고객 가치 분석 및 마케팅 최적화를 위한 예측 및 시퀀스 모델링을 지원하고 있습니다."라고 말했습니다.

 

"Watson Studio의 자연어 처리 프레임 워크에 액세스 하면 기존 플랫폼으로는 불가능했던 방식으로 구조화되지 않은 텍스트를 분석할 수 있습니다."

 

출처: Unsplash

3. Result

Fifth Third Bank는 IBM Watson Studio를 사용하여 기존 플랫폼보다 높은 정확도와 훨씬 빠른 트레이닝 시간을 달성하고 있습니다.

"새로운 오픈 소스 툴을 통해 얻을 수 있는 성능은 상당히 크다. 노트북에서 모델링을 할 때도 해당된다. IBM Watson Studio 클러스터에서 대규모 트레이닝 작업을 실행하면 상대할 경쟁자가 없다는 걸 느낄 수 있다. 새로운 플랫폼은 더 많은 모델을 탐색하고 더 많은 반복 작업을 동시에 실행할 수 있어 비즈니스에 필요한 결과를 신속하게 얻을 수 있도록 도와준다."

더욱 중요한 것은 DSG 팀은 데이터 거버넌스 및 보안 문제에 대한 걱정 없이 새로운 오픈 소스 툴과 프레임워크를 자신 있게 활용할 수 있다는 점이다. IBM Watson Studio에서 이용 가능한 모든 패키지는 은행의 보안 전문가들에 의해 철저히 검사되고 감사되어 위험을 줄이고 정보보안 정책의 준수를 돕는다.

또한 은행은 인프라 비용을 크게 늘리지 않고도 환경을 성장시킬 수 있을 것으로 기대한다. Brian Robinson은 "클러스터의 각 노드는 가상 리눅스 서버일 뿐이며, 이러한 서버는 일반 하드웨어에서 실행될 수 있다. 결과적으로 새로운 노드를 추가하는 것은 기존 플랫폼을 지원하는 엔터프라이즈급 서버를 업그레이드하는 것보다 훨씬 비용이 적게 든다."

향후 DSG 팀은 IBM Watson Studio의 자동화된 모델 배치와 같은 다양한 기능을 활용할 예정이다. 이 팀은 새로운 플랫폼으로 모델을 이전하고 기술과 데이터를 보다 효과적으로 공유할 수 있도록 기업 내 다른 팀들에게 교육을 제공할 계획이다.

"IBM Watson Studio는 Fifth Third Bank의 데이터 사이언스 팀의 미래를 그려나가는 데 사용할 수 있는 강력한 플랫폼을 제공한다. IBM Watson Studio는 안전하고 빠르며 확장 가능한 환경에서 최신 오픈소스 툴에 액세스 할 수 있도록 함으로써 고객 분석을 혁신하고 새로운 세대의 데이터 사이언티스트들을 Fifth Third Bank에서 경력을 쌓아하는 데 도움을 주고 있다."

 


<참고 링크>

Watson Studio: https://www.ibm.com/kr-ko/cloud/watson-studio

 

Watson Studio - 개요

프로그램 액세스 및 버전 제어와 같은 프로젝트 협업 기능을 갖춘 Jupyter Notebook과 같은 오픈 소스 도구를 사용하여 이상적인 프로덕션 모델을 찾을 때까지 매개변수를 세부적으로 조정할 수 있습니다.

www.ibm.com

Watson Studio 무료 체험 30일: https://www.ibm.com/account/reg/kr-ko/signup?formid=urx-19947

 

Register

IBM registration

www.ibm.com

 

 

Fifth Third Bank 사례 원문: https://www.ibm.com/case-studies/fifth-third-bank-hybrid-cloud-data-science

 

Fifth Third Bank

About Fifth Third Bank Fifth Third Bancorp is a diversified financial services company headquartered in Cincinnati, Ohio. As of March 31, 2018, the Company had $142 billion in assets and operated 1,153 full-service Banking Centers and 2,459 ATMs with Fifth

www.ibm.com