국내 No.1 에너지 IT기업 ‘해줌’의 컨플루언트 클라우드 도입 스토리 | 알아보고 등록하기

White Paper

스트리밍 데이터 품질 가이드북

Ebook 받기

스트림 거버넌스 모범 사례를 통해 데이터 품질 저하로부터 다운스트림 시스템과 애플리케이션을 보호하는 방법을 소개하는 종합 가이드입니다.

데이터 품질을 높은 수준으로 유지하는 것은 언제나 필수였지만, 이제 AI/ML의 부상과 함께 그 중요성이 더욱 더 커지고 있습니다. '콩 심은 데 콩 나고 팥 심은 데 팥 난다'는 말이 있듯, 데이터 품질이 저하되면 다운스트림이 부정적인 영향을 받아 비용이 많이 드는 운영 중단과 시스템 장애, 보고서의 정확도 저하, 잘못된 의사 결정을 초래할 수 있습니다.

Apache Kafka®와 그 밖의 데이터 스트리밍 기술을 사용하면 불량 데이터가 더 멀리, 더 빠르게 퍼지면서 데이터 품질 문제가 증폭될 수 있습니다. 이벤트 기반 시스템에서는 불량 데이터가 애플리케이션 및 서비스의 에코시스템 전체를 쉽게 중단시킬 수 있습니다. 그렇다면 어떻게 해야 조직이 스트리밍 아키텍처의 이점을 활용하면서, 데이터 팀에 데이터 품질을 높게 유지할 수 있는 지속 가능하고 확장 가능한 방안을 제공할 수 있을까요?

거버넌스를 고려한 데이터 스트리밍 관련 모범 사례를 이 데이터 품질 가이드북에서 확인하세요. 일반적으로 주의해야 할 불량 데이터의 범주와 예방 조치를 마련하는 방법을 소개합니다. 데이터 품질을 높은 수준으로 유지하기 위해 실행할 수 있는 조치들을 알아보고 데이터 계약 체결, 데이터 제품 개발, 조직 전반의 데이터 소유권 및 관리를 위한 분산형 데이터 메시 방식 수용 등의 주제도 다룹니다. Confluent의 Stream Governance 제품군을 통해 이 모든 것을 간편하고 수월하게 구현하는 방법을 보여드리기 때문에 데이터 스트리밍 초보자와 전문가 여러분께 모두 알찬 정보가 될 것입니다.

지금 다운로드해서 읽어보기:

  • 일반적인 스키마 문제와 잘못된 값의 원인 식별하기
  • Schema Registry로 데이터 계약 정의 및 공유하기
  • 분산형 모델에서 데이터 스트림을 찾고, 이해하고, 신뢰하기