宣布事件智商,蒙特卡罗的根本原因分析工作流程的数据团队

事故智商为数据工程师和分析师提供了一个集中的平台, 用于对数据管道进行事件管理和根本原因分析的一体化解决方案. 蒙特·卡罗提供的视频.

今天, 蒙特卡罗很高兴地宣布事件智商的发布, 推荐一个正规滚球网站的一体化事故管理解决方案,允许数据团队协作识别, 警报在, 并在关键数据问题影响下游系统和最终用户之前纠正其根本原因. 

通过将同类应用程序性能监视解决方案的类似工作流和端到端事件管理功能应用到数据管道, 蒙特卡罗现在可以帮助数据团队实现对数据健康状况的全面可见性. 

事故智商是第一个全自动的, 端到端解决方案,在管道的每个阶段对数据问题和更改进行根本原因分析, 从数据仓库或湖泊的摄取到商业智能仪表板的分析. 帮助公司消除”数据停机时间导致失踪, 错误或不准确的数据, Incident IQ自动生成关于数据的历史洞察力,以识别查询日志中的模式, 触发调查性后续查询结果, 并监视上游依赖关系的更改,以精确地找出问题发生的原因. 

以下是它的工作原理: 

报警 & 路由

当出现数据问题时, 警报通过Slack发送, PagerDuty, Opsgenie, 电子邮件, 或者向那些需要知道的人提供网络链接,这样他们就可以为观察员更新事件状态并采取行动. 

事件管理的中央UI 

Incident IQ为数据团队提供了一个集中的UI,用于实时故障排除和解决数据事件. 蒙地卡罗提供的视频.

收到警告的各方可以进入蒙特卡罗应用程序,并通过一个中央UI访问事件报告,该UI提供:

  • An 事件时间表 这使得查看受影响的表变得很容易, 以及为管理和解决这一事件所采取的每一个行动
  • 综合查询日志 显示定期的ETL查询, 临时/回填查询, 查询模式的更改, 以及更多的提示,帮助团队确定数据事件的根本原因. 
  • 访问样本数据, 帮助用户立即了解事故中涉及的数据是什么样子的, 典型的数据是什么样的. 
  • ML-generated见解 帮助查明数据中导致事件发生的特定群体和子集.. 
  • 自动的,端到端的血统 该映射将下游BI仪表盘影响到最远的上游表, 帮助团队缩小根本原因调查的焦点. 
  • 快速链接到可以玩滚球的正规app的血统,历史事件,管道,和目录 这些特性使得从同一个接口很容易识别、找到根本原因和修复数据问题. 

沟通 & 协作

事件智商(Incident IQ)为数据工程师提供了事件发展状态的快速更新, 包括事件数, 关键资产的影响, 主人, 事件严重程度. 图片由蒙特卡罗提供.

一旦出现一个根本原因(或多个原因)!)已被确定, 事件管理人员可以使用incident IQ提供关于问题状态的更新, 以及分诊和合作,以同时解决事件. 功能包括: 

  • An 事件状态栏 这样,数据工程师和分析师就可以将事故状态标记为正在调查, 固定, 预期, 不需要行动, 并根据问题的严重程度加以解决, 以及委派事件所有者. 当用户改变状态时, 老板, 或严重性, 额外的条目将自动被捕获到事件的时间轴上,以供事后分析和未来了解.
  • 自动运行簿和工作流 使事件的解决和分流过程变得容易, 快, 以及数据工程师和分析师之间的合作. 
  • 实时通知事件状态 通过相关的团队渠道,包括Slack、PagerDuty、Opsgenie、电子邮件和webhook. 

事件的决议 & 预防

事件智商为团队提供了过去事件的历史日志, 过滤的严重性, 老板, 管道, 团队, 和更多的. 图片由蒙特卡罗提供.

在事件解决之后, Incident IQ将提醒相关利益相关者,并记录有关问题的重要信息,以帮助数据工程团队预防未来的事故. 

  • 事件趋势: 与每个事件相关的度量在UI中很容易获得,以帮助团队根据严重程度跟踪总事件, 老板, 管道, 团队, 和更多的.

客户已经从丰富的洞见中受益, 事件提醒, 事件智商的根本原因分析能力. 他们是这么说的: 

  • “事件智商”真的很棒!——领先的保险科技初创公司的数据工程师
  • 我看到了新的事件页面,很喜欢!——财富50强食品公司数据工程主管 & 饮料公司
  • 解决问题, 我希望看到所有受影响的表, 他们的查询日志, 以及推荐一个正规滚球网站调查过的所有他们过去的问题. 现在,推荐一个正规滚球网站把这些都放在一个地方!是一家拥有2000名员工的电子商务公司的数据工程师

可用性

蒙特卡罗事件智商目前可供合格的组织使用. 一定要退房 推荐一个正规滚球网站的现场产品演示 2021年7月15日12:00.m. 东部标准时间/ 9:00 a.m. PST了解更多.

有兴趣了解更多关于事件智商和蒙特卡罗的端到端数据观察平台? 请求一个演示!