今天,PagerDuty 推出了一个新的 AIOps 解决方案,以利用人工智能的力量,提供内置自动化并建立在公司的基础数据模型之上,以转变企业的现代运营。PagerDuty 长期以来一直抑制噪音以帮助分布式开发团队集中注意力。现在,PagerDuty AIOps 通过全球事件编排(现已普遍可用)和全球警报分组(2023 年下半年的 EA)解决了 ITOps、指挥中心、NOC 和 SRE 团队的大规模事件关联、压缩和自动化需求。除了事件管理之外,PagerDuty AIOps 还可以帮助组织更高效地工作,包括让他们能够执行端到端、事件驱动的自动化。
我们的早期访问客户已经看到了 PagerDuty AIOps 的成果,包括平均降噪 87%、部署的自动事件响应比现有解决方案快 9 倍,以及MTTR 快14% 。
正如 Riskified 的技术主管 Kiril Yurovnik 所说:“随着事件数量的增加,减少噪音和工作量势在必行,尤其是当组织旨在在当前的经济环境中优化其 IT 流程时。我们一直在使用 PagerDuty 的全局事件编排作为早期可用性计划的一部分,结果非常好。Riskified 已经能够扩展降噪,尤其是在非生产环境中,这为我们的团队节省了宝贵的时间,让他们可以花时间在下一步的创新上。”
您可以通过我们的产品导览了解 PagerDuty AIOps 的实际应用。
什么是 PagerDuty AIOps?
根据 PagerDuty 平台数据,事件量同比增长 70% 。结果,当他们的响应团队在混乱的手动响应过程中苦苦挣扎时,企业承受着太多的噪音和太多的辛劳。
当充当事件第一响应者的 ITOps 和 SRE 团队无法访问关键上下文和整个系统的可见性时,他们无法采取下一步最佳行动。这种运营效率低下会产生复合效应。它增加了运营成本,降低了整个技术组织的生产力,并减少了增值工作。
在资源受限的环境中,团队不能等待长达一年的实施,他们现在需要帮助。组织正在寻找一种能够快速实现价值、与现有系统集成并提供快速投资回报的解决方案。
PagerDuty AIOps可帮助团队减少噪音,有效地进行分类以推动正确的行动以解决问题,并从事件响应过程中删除手动、重复的工作。PagerDuty AIOps 开箱即用,无需长时间实施或繁重的持续维护。组织继续看到一流的结果。根据用户行为学习和调整的 ML 模型可以减少噪音,这意味着团队总体上看到的事件更少。端到端事件驱动的自动化可确保更快地解决问题,并减少增值工作所需人员的投入。
“利用 PagerDuty 的全球事件编排对于确保我们的事件路由流程高效且可扩展以优化 IT 运营和支出至关重要,”Hyland 的云基础设施工程师 Brian Long 说。“借助 Global Event Orchestration,我们的组织能够从我们的通知中检测到“已解决”条件,以作为解决方案执行,并将需要配置这些条件的地方数量减少至少三倍。这让我们有时间专注于创新,而不是配置。”
以下是 PagerDuty AIOps 包括的内容:
事件关联、噪声压缩和分类上下文功能,将站点可靠性工程师和信息技术团队从管理多个供应商和手动流程中解放出来,转而使用一个强大的解决方案来快速解决问题。
端到端自动化,从事件摄取到自动修复,通过在关键事件成为破坏价值的事件之前捕获并采取行动,帮助团队从被动转变为主动。
高级降噪功能(在我们的抢先体验计划中提供)可跨服务对警报进行分组,并允许客户利用定义的规则和机器学习来仅显示重要事件。
一个可视化控制台,为运营团队提供单一事实来源,以便在对业务、IT 和财务产生广泛影响的重大事件发生之前监控和快速管理所有事件。
全局事件编排,一个强大的决策引擎,用于丰富和控制路由或触发自我修复操作。
借助 PagerDuty Operations Cloud 平台上的 700 多个集成,团队可以信任我们以自动化为主导、以人为本的 AIOps 解决方案来帮助节省时间和金钱。
PagerDuty AIOps 是如何工作的?
PagerDuty AIOps 具有一系列功能,可帮助组织在所有团队和服务中标准化和扩展事件最佳实践。并且,它带有为 ITOps、指挥中心、NOC 和 SRE 团队定制的新功能。
减少噪音事件:通过点击按钮减少事件噪音,无论是在服务内还是跨服务与全球警报分组。使用内置的 ML 模型,或创建您自己的逻辑。并结合智能 ML 和基于规则的警报分组方法以实现可自定义的分组功能。按内容、时间或其他符合组织需求的降噪标准对警报进行分组。
加快分类时间并推动行动:利用 ML 立即为响应者呈现最重要的信息。当事件发生时,响应者可以快速发现事件的可能起源,事件是否以前发生过,以及变化是否是可能的原因。
自动化冗余:利用事件编排强大的决策引擎来丰富和控制路由,或根据事件条件触发自我修复操作,跨 PagerDuty 中的任何或所有服务与 Global Event Orchestration。
可视化重要事项:创建一个自定义仪表板,提供跨服务的运营状况的综合视图。此外,您将获得对事件数据的完全可见性,以便您可以确定获取和处理的内容的优先级,并完全透明地了解您的事件使用情况。
