IBM 案例研究
![]()
“我们一直在寻找一种既易于维护,又能让服务团队完全掌控所有方面的解决方案。我们于 2022 年初使用 Knative Eventing(由 Knative Kafka Broker 支持)为我们的 watsonx Assistant 用例构建了一个原型系统。我们的初步结果在各个层面上都超出了我们现有的基准。在投入足够的时间使其投入生产后,我们在六个地理区域的所有生产 IBM 云集群中将其推广。”
|
IBM watsonx Assistant 使用 Knative Eventing 训练机器学习模型随着 IBM 在云方面的战略发展并向私有云和混合云迁移,IBM Cloud Pak for Data 和托管云服务提供商 (MCSP) 等解决方案现在需要能够在客户硬件、私有基础设施和 IBM 无法访问的数据存储提供商上运行的高度可移植的 watsonx 服务。我们现有的机器学习训练基础设施最初是几年前以公有云基础设施为重点设计的,后来进行了升级以确保与各种云基础设施解决方案的兼容性。但是,随着我们的客户群在这些平台上扩展,相关的运营成本也增加了。与此同时,越来越大的压力要求缩短机器学习训练时间,以改善客户体验。随着时间的推移,我们对我们的意图识别算法和训练基础设施堆栈进行了大量优化,将训练时间从 3.5 分钟缩短到令人印象深刻的 90 秒。然而,进一步的优化带来了挑战,包括在分布式环境中与资源利用和背压处理相关的问题。认识到对全面解决方案的需求,我们开始进行范式转变,以重新定义我们的整个 ML 训练基础设施。请在 CNCF 网站上阅读完整的案例研究了解更多 |