Knative Serving 指标¶
管理员可以根据每个 Serving 组件公开的指标来监控 Serving 控制平面。指标列在下面。
激活器¶
以下指标可以帮助您了解应用程序在流量通过激活器时如何响应。例如,在从零开始扩展时,较高的请求延迟可能意味着请求需要花费过长时间才能完成。
指标名称 | 描述 | 类型 | 标签 | 单位 | 状态 |
---|---|---|---|---|---|
request_concurrency |
路由到激活器的并发请求 这些是并发报告器报告的请求,可能尚未完成。 这是报告期内的平均并发。 |
Gauge | configuration_name container_name namespace_name pod_name revision_name service_name |
无量纲 | 稳定 |
request_count |
路由到激活器的请求数。 这些是已从激活器处理程序中完成的请求。 |
Counter | configuration_name container_name namespace_name pod_name response_code response_code_class revision_name service_name |
无量纲 | 稳定 |
request_latencies |
已完成路由请求的响应时间(毫秒)。 | Histogram | configuration_name container_name namespace_name pod_name response_code response_code_class revision_name service_name |
毫秒 | 稳定 |
自动伸缩器¶
自动伸缩器组件公开了一些与每个修订的决策相关的指标。例如,在任何给定时间,您可以监控自动伸缩器希望为服务分配的所需 Pod 数、稳定窗口期间每秒的平均请求数,或者自动伸缩器是否处于恐慌模式 (KPA)。
指标名称 | 描述 | 类型 | 标签 | 单位 | 状态 |
---|---|---|---|---|---|
desired_pods |
自动伸缩器希望分配的 Pod 数 | Gauge | configuration_name namespace_name revision_name service_name |
无量纲 | 稳定 |
excess_burst_capacity |
在稳定窗口期间超额提供的额外突发容量 | Gauge | configuration_name namespace_name revision_name service_name |
无量纲 | 稳定 |
stable_request_concurrency |
稳定窗口期间每个观察到的 Pod 的平均请求计数 | Gauge | configuration_name namespace_name revision_name service_name |
无量纲 | 稳定 |
panic_request_concurrency |
恐慌窗口期间每个观察到的 Pod 的平均请求计数 | Gauge | configuration_name namespace_name revision_name service_name |
无量纲 | 稳定 |
target_concurrency_per_pod |
每个 Pod 的所需并发请求数 | Gauge | configuration_name namespace_name revision_name service_name |
无量纲 | 稳定 |
stable_requests_per_second |
稳定窗口期间每个观察到的 Pod 的平均每秒请求数 | Gauge | configuration_name namespace_name revision_name service_name |
无量纲 | 稳定 |
panic_requests_per_second |
恐慌窗口期间每个观察到的 Pod 的平均每秒请求数 | Gauge | configuration_name namespace_name revision_name service_name |
无量纲 | 稳定 |
target_requests_per_second |
每个 Pod 的所需每秒请求数 | Gauge | configuration_name namespace_name revision_name service_name |
无量纲 | 稳定 |
panic_mode |
如果自动伸缩器处于恐慌模式,则为 1,否则为 0 | Gauge | configuration_name namespace_name revision_name service_name |
无量纲 | 稳定 |
requested_pods |
自动伸缩器从 Kubernetes 请求的 Pod 数 | Gauge | configuration_name namespace_name revision_name service_name |
无量纲 | 稳定 |
actual_pods |
当前已分配且处于就绪状态的 Pod 数 | Gauge | configuration_name namespace_name revision_name service_name |
无量纲 | 稳定 |
not_ready_pods |
当前未就绪的 Pod 数 | Gauge | configuration_name= namespace_name= revision_name service_name |
无量纲 | 稳定 |
pending_pods |
当前处于挂起状态的 Pod 数 | Gauge | configuration_name namespace_name revision_name service_name |
无量纲 | 稳定 |
terminating_pods |
当前正在终止的 Pod 数 | Gauge | configuration_name namespace_name revision_name service_name<br> |
无量纲 | 稳定 |
scrape_time |
自动伸缩器从服务 Pod 采集指标所花费的时间(毫秒)。 | Histogram | configuration_name namespace_name revision_name service_name |
毫秒 | 稳定 |
控制器¶
以下指标由任何实现控制器逻辑的组件发出。指标显示有关协调操作和工作队列行为的详细信息,协调请求是在工作队列中排队的。
指标名称 | 描述 | 类型 | 标签 | 单位 | 状态 |
---|---|---|---|---|---|
work_queue_depth |
工作队列的深度 | Gauge | reconciler |
无量纲 | 稳定 |
reconcile_count |
协调操作次数 | Counter | reconciler success |
无量纲 | 稳定 |
reconcile_latency |
协调操作的延迟 | Histogram | reconciler success |
毫秒 | 稳定 |
workqueue_adds_total |
工作队列处理的添加总数 | Counter | name |
无量纲 | 稳定 |
workqueue_depth |
工作队列的当前深度 | Gauge | reconciler |
无量纲 | 稳定 |
workqueue_queue_latency_seconds |
项目在被请求之前在工作队列中停留的时间(秒)。 | Histogram | name |
秒 | 稳定 |
workqueue_retries_total |
工作队列处理的重试总数 | Counter | name |
无量纲 | 稳定 |
workqueue_work_duration_seconds |
从工作队列处理项目所花费的时间(秒)。 | Histogram | name |
秒 | 稳定 |
workqueue_unfinished_work_seconds |
未完成的工作队列项目在飞行中的时间(总计)(秒)。 | Histogram | name |
秒 | 稳定 |
workqueue_longest_running_processor_seconds |
最长的未完成工作队列项目在飞行中的时间(秒)。 | Histogram | name |
秒 | 稳定 |
Webhook¶
Webhook 指标报告有关操作的有用信息。例如,如果大量操作失败,这可能表明用户创建的资源存在问题。
指标名称 | 描述 | 类型 | 标签 | 单位 | 状态 |
---|---|---|---|---|---|
request_count |
路由到 Webhook 的请求数 | Counter | admission_allowed kind_group kind_kind kind_version request_operation resource_group resource_namespace resource_resource resource_version |
无量纲 | 稳定 |
request_latencies |
响应时间(毫秒)。 | Histogram | admission_allowed kind_group kind_kind kind_version request_operation resource_group resource_namespace resource_resource resource_version |
毫秒 | 稳定 |
Go 运行时 - memstats¶
每个 Knative Serving 控制平面进程都发出一些 Go 运行时内存统计信息(如下所示)。作为监控目的的基线,用户可以从指标子集开始:当前分配 (go_alloc)、总分配 (go_total_alloc)、系统内存 (go_sys)、mallocs (go_mallocs)、frees (go_frees) 和垃圾回收总暂停时间 (total_gc_pause_ns)、下一个 GC 目标堆大小 (go_next_gc) 和垃圾回收周期数 (num_gc)。
指标名称 | 描述 | 类型 | 标签 | 单位 | 状态 |
---|---|---|---|---|---|
go_alloc |
分配的堆对象字节数(与 heap_alloc 相同)。 | Gauge | name |
无量纲 | 稳定 |
go_total_alloc |
为堆对象累积分配的字节数 | Gauge | name |
无量纲 | 稳定 |
go_sys |
从操作系统获取的总内存字节数 | Gauge | name |
无量纲 | 稳定 |
go_lookups |
运行时执行的指针查找次数 | Gauge | name |
无量纲 | 稳定 |
go_mallocs |
分配的堆对象累积计数 | Gauge | name |
无量纲 | 稳定 |
go_frees |
释放的堆对象累积计数 | Gauge | name |
无量纲 | 稳定 |
go_heap_alloc |
分配的堆对象字节数 | Gauge | name |
无量纲 | 稳定 |
go_heap_sys |
从操作系统获取的堆内存字节数 | Gauge | name |
无量纲 | 稳定 |
go_heap_idle |
空闲(未用)跨度中的字节数 | Gauge | name |
无量纲 | 稳定 |
go_heap_in_use |
正在使用的跨度中的字节数 | Gauge | name |
无量纲 | 稳定 |
go_heap_released |
返回给操作系统的物理内存字节数 | Gauge | name |
无量纲 | 稳定 |
go_heap_objects |
分配的堆对象数 | Gauge | name |
无量纲 | 稳定 |
go_stack_in_use |
堆栈跨度中的字节数 | Gauge | name |
无量纲 | 稳定 |
go_stack_sys |
从操作系统获取的堆栈内存字节数 | Gauge | name |
无量纲 | 稳定 |
go_mspan_in_use |
分配的 mspan 结构的字节数 | Gauge | name |
无量纲 | 稳定 |
go_mspan_sys |
从操作系统获取的用于 mspan 结构的内存字节数 | Gauge | name |
无量纲 | 稳定 |
go_mcache_in_use |
分配的 mcache 结构的字节数 | Gauge | name |
无量纲 | 稳定 |
go_mcache_sys |
从操作系统获取的用于 mcache 结构的内存字节数 | Gauge | name |
无量纲 | 稳定 |
go_bucket_hash_sys |
配置文件桶哈希表中的内存字节数。 | Gauge | name |
无量纲 | 稳定 |
go_gc_sys |
垃圾回收元数据中的内存字节数 | Gauge | name |
无量纲 | 稳定 |
go_other_sys |
各种非堆运行时分配中的内存字节数 | Gauge | name |
无量纲 | 稳定 |
go_next_gc |
下一个 GC 周期的目标堆大小 | Gauge | name |
无量纲 | 稳定 |
go_last_gc |
上次垃圾回收完成的时间,以 1970 年(UNIX 纪元)以来的纳秒数表示 | Gauge | name |
纳秒 | 稳定 |
go_total_gc_pause_ns |
程序启动以来 GC 停止世界暂停的累积纳秒数 | Gauge | name |
纳秒 | 稳定 |
go_num_gc |
已完成的 GC 周期数。 | Gauge | name |
无量纲 | 稳定 |
go_num_forced_gc |
由应用程序调用 GC 函数强制执行的 GC 周期数。 | Gauge | name |
无量纲 | 稳定 |
go_gc_cpu_fraction |
程序启动以来 GC 使用的该程序可用 CPU 时间的比例 | Gauge | name |
无量纲 | 稳定 |
注意
名称标签为空。