跳到内容

Knative Serving 指标

管理员可以根据每个 Serving 组件公开的指标来监控 Serving 控制平面。指标列在下面。

激活器

以下指标可以帮助您了解应用程序在流量通过激活器时如何响应。例如,在从零开始扩展时,较高的请求延迟可能意味着请求需要花费过长时间才能完成。

指标名称 描述 类型 标签 单位 状态
request_concurrency 路由到激活器的并发请求
这些是并发报告器报告的请求,可能尚未完成。
这是报告期内的平均并发。
Gauge configuration_name
container_name
namespace_name
pod_name
revision_name
service_name
无量纲 稳定
request_count 路由到激活器的请求数。
这些是已从激活器处理程序中完成的请求。
Counter configuration_name
container_name
namespace_name
pod_name
response_code
response_code_class
revision_name
service_name
无量纲 稳定
request_latencies 已完成路由请求的响应时间(毫秒)。 Histogram configuration_name
container_name
namespace_name
pod_name
response_code
response_code_class
revision_name
service_name
毫秒 稳定

自动伸缩器

自动伸缩器组件公开了一些与每个修订的决策相关的指标。例如,在任何给定时间,您可以监控自动伸缩器希望为服务分配的所需 Pod 数、稳定窗口期间每秒的平均请求数,或者自动伸缩器是否处于恐慌模式 (KPA)。

指标名称 描述 类型 标签 单位 状态
desired_pods 自动伸缩器希望分配的 Pod 数 Gauge configuration_name
namespace_name
revision_name
service_name
无量纲 稳定
excess_burst_capacity 在稳定窗口期间超额提供的额外突发容量 Gauge configuration_name
namespace_name
revision_name
service_name
无量纲 稳定
stable_request_concurrency 稳定窗口期间每个观察到的 Pod 的平均请求计数 Gauge configuration_name
namespace_name
revision_name
service_name
无量纲 稳定
panic_request_concurrency 恐慌窗口期间每个观察到的 Pod 的平均请求计数 Gauge configuration_name
namespace_name
revision_name
service_name
无量纲 稳定
target_concurrency_per_pod 每个 Pod 的所需并发请求数 Gauge configuration_name
namespace_name
revision_name
service_name
无量纲 稳定
stable_requests_per_second 稳定窗口期间每个观察到的 Pod 的平均每秒请求数 Gauge configuration_name
namespace_name
revision_name
service_name
无量纲 稳定
panic_requests_per_second 恐慌窗口期间每个观察到的 Pod 的平均每秒请求数 Gauge configuration_name
namespace_name
revision_name
service_name
无量纲 稳定
target_requests_per_second 每个 Pod 的所需每秒请求数 Gauge configuration_name
namespace_name
revision_name
service_name
无量纲 稳定
panic_mode 如果自动伸缩器处于恐慌模式,则为 1,否则为 0 Gauge configuration_name
namespace_name
revision_name
service_name
无量纲 稳定
requested_pods 自动伸缩器从 Kubernetes 请求的 Pod 数 Gauge configuration_name
namespace_name
revision_name
service_name
无量纲 稳定
actual_pods 当前已分配且处于就绪状态的 Pod 数 Gauge configuration_name
namespace_name
revision_name
service_name
无量纲 稳定
not_ready_pods 当前未就绪的 Pod 数 Gauge configuration_name=
namespace_name=
revision_name
service_name
无量纲 稳定
pending_pods 当前处于挂起状态的 Pod 数 Gauge configuration_name
namespace_name
revision_name
service_name
无量纲 稳定
terminating_pods 当前正在终止的 Pod 数 Gauge configuration_name
namespace_name
revision_name
service_name<br>
无量纲 稳定
scrape_time 自动伸缩器从服务 Pod 采集指标所花费的时间(毫秒)。 Histogram configuration_name
namespace_name
revision_name
service_name
毫秒 稳定

控制器

以下指标由任何实现控制器逻辑的组件发出。指标显示有关协调操作和工作队列行为的详细信息,协调请求是在工作队列中排队的。

指标名称 描述 类型 标签 单位 状态
work_queue_depth 工作队列的深度 Gauge reconciler 无量纲 稳定
reconcile_count 协调操作次数 Counter reconciler
success
无量纲 稳定
reconcile_latency 协调操作的延迟 Histogram reconciler
success
毫秒 稳定
workqueue_adds_total 工作队列处理的添加总数 Counter name 无量纲 稳定
workqueue_depth 工作队列的当前深度 Gauge reconciler 无量纲 稳定
workqueue_queue_latency_seconds 项目在被请求之前在工作队列中停留的时间(秒)。 Histogram name 稳定
workqueue_retries_total 工作队列处理的重试总数 Counter name 无量纲 稳定
workqueue_work_duration_seconds 从工作队列处理项目所花费的时间(秒)。 Histogram name 稳定
workqueue_unfinished_work_seconds 未完成的工作队列项目在飞行中的时间(总计)(秒)。 Histogram name 稳定
workqueue_longest_running_processor_seconds 最长的未完成工作队列项目在飞行中的时间(秒)。 Histogram name 稳定

Webhook

Webhook 指标报告有关操作的有用信息。例如,如果大量操作失败,这可能表明用户创建的资源存在问题。

指标名称 描述 类型 标签 单位 状态
request_count 路由到 Webhook 的请求数 Counter admission_allowed
kind_group
kind_kind
kind_version
request_operation
resource_group
resource_namespace
resource_resource
resource_version
无量纲 稳定
request_latencies 响应时间(毫秒)。 Histogram admission_allowed
kind_group
kind_kind
kind_version
request_operation
resource_group
resource_namespace
resource_resource
resource_version
毫秒 稳定

Go 运行时 - memstats

每个 Knative Serving 控制平面进程都发出一些 Go 运行时内存统计信息(如下所示)。作为监控目的的基线,用户可以从指标子集开始:当前分配 (go_alloc)、总分配 (go_total_alloc)、系统内存 (go_sys)、mallocs (go_mallocs)、frees (go_frees) 和垃圾回收总暂停时间 (total_gc_pause_ns)、下一个 GC 目标堆大小 (go_next_gc) 和垃圾回收周期数 (num_gc)。

指标名称 描述 类型 标签 单位 状态
go_alloc 分配的堆对象字节数(与 heap_alloc 相同)。 Gauge name 无量纲 稳定
go_total_alloc 为堆对象累积分配的字节数 Gauge name 无量纲 稳定
go_sys 从操作系统获取的总内存字节数 Gauge name 无量纲 稳定
go_lookups 运行时执行的指针查找次数 Gauge name 无量纲 稳定
go_mallocs 分配的堆对象累积计数 Gauge name 无量纲 稳定
go_frees 释放的堆对象累积计数 Gauge name 无量纲 稳定
go_heap_alloc 分配的堆对象字节数 Gauge name 无量纲 稳定
go_heap_sys 从操作系统获取的堆内存字节数 Gauge name 无量纲 稳定
go_heap_idle 空闲(未用)跨度中的字节数 Gauge name 无量纲 稳定
go_heap_in_use 正在使用的跨度中的字节数 Gauge name 无量纲 稳定
go_heap_released 返回给操作系统的物理内存字节数 Gauge name 无量纲 稳定
go_heap_objects 分配的堆对象数 Gauge name 无量纲 稳定
go_stack_in_use 堆栈跨度中的字节数 Gauge name 无量纲 稳定
go_stack_sys 从操作系统获取的堆栈内存字节数 Gauge name 无量纲 稳定
go_mspan_in_use 分配的 mspan 结构的字节数 Gauge name 无量纲 稳定
go_mspan_sys 从操作系统获取的用于 mspan 结构的内存字节数 Gauge name 无量纲 稳定
go_mcache_in_use 分配的 mcache 结构的字节数 Gauge name 无量纲 稳定
go_mcache_sys 从操作系统获取的用于 mcache 结构的内存字节数 Gauge name 无量纲 稳定
go_bucket_hash_sys 配置文件桶哈希表中的内存字节数。 Gauge name 无量纲 稳定
go_gc_sys 垃圾回收元数据中的内存字节数 Gauge name 无量纲 稳定
go_other_sys 各种非堆运行时分配中的内存字节数 Gauge name 无量纲 稳定
go_next_gc 下一个 GC 周期的目标堆大小 Gauge name 无量纲 稳定
go_last_gc 上次垃圾回收完成的时间,以 1970 年(UNIX 纪元)以来的纳秒数表示 Gauge name 纳秒 稳定
go_total_gc_pause_ns 程序启动以来 GC 停止世界暂停的累积纳秒数 Gauge name 纳秒 稳定
go_num_gc 已完成的 GC 周期数。 Gauge name 无量纲 稳定
go_num_forced_gc 由应用程序调用 GC 函数强制执行的 GC 周期数。 Gauge name 无量纲 稳定
go_gc_cpu_fraction 程序启动以来 GC 使用的该程序可用 CPU 时间的比例 Gauge name 无量纲 稳定

注意

名称标签为空。

我们使用分析和 Cookie 来了解网站流量。有关您使用我们网站的信息将与 Google 共享,用于该目的。了解更多。