2024-03-26 [ 뉴스 ] 인터뷰 : 클라우드 기반 데이터 패브릭으로 데이터 활용 체계 수립

인터뷰 : 클라우드 기반 데이터 패브릭으로 데이터 활용 체계 수립


(설명 : 엠클라우드브리지 정진우 MS 데이터 & AI 팀장)



Q. 클라우드 기반 데이터 패브릭의 강점은 무엇인가.


A. 클라우드의 장점을 오롯이 살려 데이터 패브릭을 구현할 수 있다. 일반적으로 온프레미스 기반 데이터 패브릭 솔루션의 경우 서버 스팩과 보안 패치 등을 모두 준수해야 한다. 통상적으로 데이터 패브릭을 구상하기 위해서는 서버의 스팩도 요구된다. 도입 후 최소 10년에서 최대 15년까지 이용하는 국내 기업들의 서버 스팩상 데이터 패브릭을 구상하기에 어려움이 따르는 곳이 많다. 그렇다고 이를 위해 억 단위의 비용을 투자할 수는 없는 노릇이다.


아울러 보안 패치도 중요하다. 가령 각 기업마다 설치된 보안 프로그램이 존재하는데 이 영역 안으로 들어와 데이터 패브릭 솔루션이 등록돼야 한다. 이는 보안 프로그램의 요구사항을 벗어날 수도 있다. 일례로 금융사의 경우 일반 기업들이 이용하는 보안 프로그램보다 더 많은 비용을 지불하고 고스팩의 최신 보안 프로그램을 이용한다. 이 보안 프로그램의 영역 안으로 데이터 패브릭 솔루션이 들어가기 위해서는 번거로운 작업을 수행해야 한다. 이러한 상황을 타개할 수 있는 방법이 바로 클라우드 기반 데이터 패브릭이다.



Q. 데이터 가상화가 데이터 패브릭 구현에 중요한 이유와 이에 맞춘 데이터 관리 전략은.


A. 데이터 가상화가 중요한 이유는 다양한 데이터 원본을 효율적으로 관리하고 활용하기 위해 일관된 접근성과 유연성을 제공하기 때문이다. 복잡한 ETL 프로세스를 줄여 비용을 절감하고 데이터 보안과 규정 준수 요건을 강화할 수 있다.


데이터 관리 전략은 운영계 시스템(ERP, CRM 등)과 분석계/정보계 시스템 등 2가지 관점에서 설명할 수 있다. 먼저 운영계 시스템 측면에서 데이터 관리 전략은 기업의 운영 시스템에서 관리되는 기준정보(마스터 데이터)에 대한 정비가 우선돼야 한다. 이종 간의 기간계 시스템에 대한 통합 관점에서의 기준정보 통합이 아닌, 하나의 시스템 내에서도 해당 운영계 시스템 구축시에는 기준정보 등을 잘 셋업하고 운영하면서 업데이트나 유지보수가 되지 않아 각 기업이 가지고 있는 기준정보와 실제 트랜잭션 데이터가 불일치하는 사례가 많다.


업무 프로세스의 복잡도나 운영계 시스템에 대한 지속적인 투자와 관심, 실제 업무 프로세스와 운영계 시스템의 밀접도에 영향을 받기 때문에 기준정보 관리가 되지 않는 기업들이 의외로 많다. 이러한 기준정보는 분석계/정보계 시스템으로 통합된다고 하더라도 ‘알아서 잘 딱 깔끔하고 센스있게’ 인공지능(AI)이 통합하는 것이 아니므로 운영계 시스템에서부터 기준정보 관리는 일관성 있게 고품질로 관리돼야 한다.


다음은 분석계/정보계 시스템에서의 데이터 관리 전략이다. 분석계/정보계 시스템에서는 이종 간의 운영계 시스템의 데이터를 통합하고자 하는 요구가 크다. 때문에 비즈니스 요구사항 분석과 조직 내 각 부서와의 협력과 커뮤니케이션이 필요하다. 특정한 부서 관점에서만 데이터가 통합된다면 조직 내 다른 부서에서는 데이터의 통합화/중앙화가 아니라 부서별 별도의 데이터 패브릭이 생성될 가능성이 있다.


또한 데이터 문서화와 메타데이터에 대한 관리가 필요하다. 데이터의 출처, 의미 및 관계를 명확하게 문서화하고 이를 통해서 어떠한 관점에서 데이터가 통합됐는지 조직 내 사용자들이 이해도를 높이고 유지보수를 용이하게 만들어야 관리의 효율성을 극대화할 수 있다.



Q. 클라우드 기반 데이터 패브릭을 구축할 때 유의할 점은.


A. 기업의 데이터를 잘 정돈해야 한다는 점을 강조하고 싶다. 현재 데이터 레이크, 데이터 패브릭, 또는 AI 기반 머신러닝 모델 구축과 같은 IT 환경에서 혁신적인 기술과 방법론이 쏟아져 나오고 있다. 특히 국내 기업들은 MS의 ‘파워 BI’ 혹은 태블로의 BI 등을 통해서 데이터 활용에 중점을 두고 데이터의 활용을 위한 기업 가치 향상을 꾀하고 있다.


그러나 이러한 데이터 활용을 위한 기업 가치 향상도 기업의 데이터가 잘 정리 또는 정제돼 있어야 최적의 분석 환경을 만들 수 있다. 기업은 업무용 시스템을 1~2개 정도가 아닌 다중의 시스템을 사용하고, 각 시스템이 사일로하기에 기업의 실무 담당자 입장에서 데이터를 활용할 수 있는 환경 자체를 잘 구축해 놓는 것이야 말로 데이터를 분석하고 활용할 수 있는 환경을 만드는 것이다. 이러한 기업의 데이터 분석 환경이 선행돼야 빅데이터 기반 분석 및 미래 예측이 가능한 AI/ML 환경을 구축할 수 있다.


출처 및 원문보기 - http://www.itdaily.kr/news/articleView.html?idxno=220835 < IT DAILY 박재현 기자>