VXiaoZhi Blog

「离开世界之前 一切都是过程」

vLLM

vLLM

vLLM vLLM 是一个快速且易于使用的库,用于 LLM 推理和服务,和 HuggingFace 无缝集成。区别于 chatglm.cpp 和 llama.cpp,仅是在 GPU 上的模型推理加速,没有 CPU 上的加速。 在吞吐量方面,vLLM 的性能比 HuggingFace Transformers (HF) 高出 24 倍,文本生成推理 (TGI) 高出 3.5 倍。 可以...

解决Linux操作系统下Terminal中光标消失的问题

解决Linux操作系统下Terminal中光标消失的问题

解决Linux操作系统下Terminal中光标消失的问题 使用Terminal时会偶尔遇到光标消失的问题。 显示光标 1 echo -e "\033[?25h" 隐藏光标 1 echo -e "\033[?25l"

Linux cron 定时任务

Linux cron 定时任务

Linux cron 定时任务 1 2 3 4 5 6 7 8 ┌──────────── [optional] seconds (0 - 59) | ┌────────── minute (0 - 59) | | ┌──────── hour (0 - 23) | | | ┌────── day of month (1 - 31) | | | | ┌──── month (1 - 12)...

如何在 K8s 上运行 Spark

如何在 K8s 上运行 Spark

如何在 K8s 上运行 Spark Operators Spark Operator 参考 Running Spark on Kubernetes

使用 KubeRay 在 Kubernetes 中托管 Ray 工作负载

使用 KubeRay 在 Kubernetes 中托管 Ray 工作负载

使用 KubeRay 在 Kubernetes 中托管 Ray 工作负载 参考 KubeRay 使用 KubeRay 和 Kueue 在 Kubernetes 中托管 Ray 工作负载

K8s 源码阅读

K8s 源码阅读

K8s 源码阅读 参考 Kubeedge源码分析之总体介绍

k8s 服务网格(Service Mesh)

k8s 服务网格(Service Mesh)

k8s 服务网格(Service Mesh) 希腊语言中大概是风帆的意思, 发音 [iːst’iəʊ] ,相当于中文的 伊斯特亿欧。 如果用一句话来解释什么是服务网格,可以将它比作是应用程序或者说微服务间的 TCP/IP,负责服务之间的网络调用、限流、熔断和监控。 服务网格有如下几个特点: 应用程序间通讯的中间层 轻量级网络代理 应用程序无感知 解耦应用程序的重试...

Kmesh 技术

Kmesh 技术

Kmesh 技术 背景 像 Istio 这样的服务网格已成为管理复杂微服务架构的核心,提供流量管理、安全性和可观测性等功能。Sidecar 模型,即在每个服务实例旁运行一个代理,已成为主要方法。虽然功能有效,但这种架构引入了显著的延迟和资源开销。 传统 Sidecar 架构的局限性 延迟开销:增加 Sidecar 代理会导致网络跳数和上下文切换增加,每次服务调用引入额外 2 至...

k8s 服务网格(Service Mesh)

k8s 服务网格(Service Mesh)

k8s 服务网格(Service Mesh) 希腊语言中大概是风帆的意思, 发音 [iːst’iəʊ] ,相当于中文的 伊斯特亿欧。 1. 为何使用服务网格?(Why) 服务网格并没有给我们带来新功能,它是用于解决其他工具已经解决过的问题,只不过这次是在云原生的 Kubernetes 环境下的实现。 MVC 三层 Web 应用程序架构下,服务之间的通讯并不复杂,在应用程序...

K8s 服务网格配置发现协议

K8s 服务网格配置发现协议

K8s 服务网格配置发现协议 MCP MCP是基于订阅的配置分发API。 配置使用者(即sink)从配置生产者(即source)请求更新资源集合.添加,更新或删除资源时,source会将资源更新推送到sink. sink积极确认资源更新,如果sink接受,则返回ACK,如果被拒绝则返回NACK,例如: 因为资源无效。 一旦对先前的更新进行了ACK/NACK,则源可以推送...