T
traeai
登录

概念

什么是 Kubernetes

也叫:K8s

用于容器编排的开源系统,支持自动化部署、扩展和管理容器化应用。

为什么现在值得关注?

最近变化

2026-06-11 · 使用Project-as-a-Service可通过单个YAML文件快速创建环境。

Kubernetes 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。

📰 Kubernetes 最新动态

已收录 20 篇与「Kubernetes」相关的 AI 资讯和分析。

Building and Scaling a Platform with Project-as-a-Service

Building and Scaling a Platform with Project-as-a-Service

InfoQ1178 字 (约 5 分钟)
85

平台通过Project-as-a-Service实现自动化和标准化,提升团队效率与一致性。

入选理由:使用Project-as-a-Service可通过单个YAML文件快速创建环境。

精选文章#Kubernetes#DevOps#平台架构#自动化英文
Article: Two Misconfigurations That Caused Spark OOM Failures on Kubernetes

在Kubernetes上运行Spark时的内存溢出问题

InfoQ3243 字 (约 13 分钟)
85

本文讨论了在Kubernetes上运行Spark时,由于两个基础设施设置不当导致的内存溢出问题。这两个设置分别是:将`spark.kubernetes.local.dirs.tmpfs=true`设置为RAM-backed local scratch directories,以及使用硬`podAffinity`规则将所有executor强制放置在同一个节点上。这些设置导致shuffle spill占用节点内存而非磁盘,从而引发内存溢出问题。通过调整这些设置,可以解决此问题。

入选理由:设置`spark.kubernetes.local.dirs.tmpfs=true`将所有shuffle spill数据存储在节点内存中,可能导致内存溢出。

精选文章#Spark#Kubernetes#内存管理#基础设施设置中文
聊一聊 Agent 的存算分离架构设计👇

一个有灵魂,有记忆的 Agent,一次任务的生命周期包括以下步骤

1. 用户输入 query(text + files)
2. Agent 读取提示词文...

聊一聊 Agent 的存算分离架构设计👇

idoubi(@idoubicc)1610 字 (约 7 分钟)
85

Agent 的存算分离架构通过将存储与计算解耦,实现云端 Agent 的可扩展性与安全性,关键在于使用 kv、db、向量数据库和对象存储分层管理数据,并结合 sandbox 和 serverless 模式提升效率。

入选理由:Agent 的生命周期包含读取提示词、工具、记忆、构建上下文、执行 Loop 并交付结果等步骤。

精选推文#Agent#存算分离#Serverless#Kubernetes#LLM中文
我年初开始做 OpenClaw 托管服务,在一套 k8s 集群部署了 500 个 Pod,每个 Pod 限制 4g 的运行内存。日常开着 18 台 4c16g 的服务器作为节点池,一个月成本将近 5k...

作者将 OpenClaw 托管服务从自建 Kubernetes 集群(18 台 4c16g 服务器,月成本 5k 美元)迁移至 FastClaw 架构,通过存算分离实现 Agent 按需启动,服务器减少至 3 台,运营成本降至 1/6,MRR 超 8k 美元但利润低,迁移后有望盈利。

入选理由:OpenClaw 托管服务原部署于 18 台 4c16g 服务器的 k8s 集群,500 个 Pod 每个限 4G 内存,月成本近 5k 美元。

精选推文#Kubernetes#云原生#Agent 运行框架#FastClaw#OpenClaw中文
freeCodeCamp.org 图标

The Tradeoff That Slows Production Teams Down: Flexibility vs Actually Shipping

freeCodeCamp.org1512 字 (约 7 分钟)
85

过度追求基础设施灵活性会拖慢产品交付速度,企业应优先优化实际交付能力而非理论上的灵活性。

入选理由:文章指出,80%的生产团队因过度定制化基础设施而延迟产品交付。

精选文章#软件工程#产品交付#基础设施英文
ITBench-AA: Frontier Models Score Below 50% on the First Benchmark for Agentic Enterprise IT Tasks — by Artificial Analysis and IBM

ITBench-AA 是一个针对企业级自动化 IT 任务的新基准测试,首次评估前沿模型在 Site Reliability Engineering 任务中的表现,结果显示所有前沿模型得分低于 50%,其中 Claude Opus 4.7 表现最佳,为 47%。

入选理由:Claude Opus 4.7 在 ITBench-AA 中表现最佳,得分为 47%

精选文章#ITBench-AA#Site Reliability Engineering#前沿模型#IBM#Kubernetes中文
🆕Daytona’s Agent-Native Compute: 60ms sandboxes, 50K startups in 75 sec, 850K daily runs, RL/evals,...

Daytona's Agent-Native Compute platform is designed for AI agents, offering ultra-fast sandboxes, high startup rates, and massive daily runs, making it ideal for reinforcement learning and evaluations. The platform has pivoted from human developer environments to focus on agent sandboxes, emphasizing bare metal performance and stateful snapshots. With RL workloads accounting for nearly half of its usage, Daytona is redefining the AI cloud landscape, potentially shifting it towards a model similar to Stripe rather than AWS.

入选理由:Daytona's Agent-Native Compute provides 60ms sandboxes and can start up 50,000 instances in 75 seconds, handling 850,000 daily runs.

精选推文#AI Agents#Compute Platform#Reinforcement Learning#Cloud Computing#Daytona中文
Giving Agents Computers — Ivan Burazin, Daytona

为代理提供计算机——Ivan Burazin,Daytona

Latent Space18182 字 (约 73 分钟)
85

Daytona通过提供可组合、状态化的沙盒环境,解决了AI代理对动态计算资源的需求,其技术架构支持从零到10万CPU的弹性扩展,并成为AI基础设施的关键组件。

入选理由:Daytona的沙盒能在60毫秒内启动,支持每天85万次沙盒运行,满足AI代理的高并发需求。

精选文章#AI代理#沙盒环境#Daytona#强化学习#云基础设施英文
Agent Sandbox on GKE is now available for everyone, and a first look at Agent Substrate

GKE Agent Sandbox现已全面可用,并首次亮相Agent Substrate

Google Cloud Blog1011 字 (约 5 分钟)
85

Google Cloud正式发布GKE Agent Sandbox并推出开源项目Agent Substrate,提供安全高效的AI代理执行环境及超大规模调度解决方案。

入选理由:GKE Agent Sandbox GA支持每秒300个沙盒分配,90%在200ms内完成,成本降低30%

精选文章#GKE Agent Sandbox#Agent Substrate#Google Cloud#Kubernetes#Agentic AI英文
Article: Kernel-Level Ground Truth: Why eBPF is Replacing User-Space Agents for Security Observability

eBPF通过在内核层直接附加探针,为安全可观测性提供了用户空间代理无法匹敌的可见性和防护能力,即使攻击者获得容器root权限也无法禁用内核探针,同时可降低60-80%的安全相关CPU开销。

入选理由:eBPF探针直接附加在Linux内核系统调用接口上,禁用探针需要逃逸到主机内核,这比运行`kill -9`困难得多

精选文章#eBPF#安全可观测性#Kubernetes#Linux内核#Falco英文
Docker Full Course 2026

Docker 全程课程 2026

freeCodeCamp.org105162 字 (约 421 分钟)
82

这门 Docker 课程由资深讲师 Isa 主讲,从零开始系统讲解容器化技术,覆盖基础概念到高级部署,适合求职准备。

入选理由:课程涵盖虚拟机对比、Dockerfile、镜像构建、Docker Hub 使用等内容。

精选视频#Docker#容器化#云计算#DevOps英文
freeCodeCamp.org 图标

如何避免为每个新项目重建基础设施

freeCodeCamp.org1481 字 (约 6 分钟)
82

PaaS平台服务能够避免团队为每个新项目重复构建基础设施,将开发重点从基础设施搭建转向客户价值交付,显著提升工程效率并减少运营复杂性。

入选理由:PaaS将起点从'重建基础'转变为'开始交付',让新项目更接近客户价值而非基础设施组装

精选文章#PaaS#基础设施#工程效率#DevOps英文
Mission Control: A decoupled, in-cluster application for deploying, configuring, observing, & troubl...

Mission Control: 一个解耦的集群内应用程序

LangChain(@LangChainAI)85 字 (约 1 分钟)
80

LangChain 发布 Mission Control,一个解耦的集群内应用程序,用于部署、配置、观察和调试自托管的 LangSmith 和相关 LangChain 基础设施。

入选理由:Mission Control 运行在 Kubernetes 内部,本地访问。

精选推文#LangChain#Kubernetes#Mission Control#自托管#LangSmith中文
David Heinemeier Hansson 图标

David Heinemeier Hansson分享的有趣问题

David Heinemeier Hansson344 字 (约 2 分钟)
75

David Heinemeier Hansson分享了他作为37signals CEO的有趣问题,包括从云迁移到Kubernetes、Ruby on Rails的起源以及与苹果的Mac exclusivity争议。他强调了成功企业应提供机会,让创始人有更多时间专注于刺激的项目,而不是日常琐事。

入选理由:David Heinemeier Hansson分享了他作为37signals CEO的有趣问题,包括从云迁移到Kubernetes、Ruby on Rails的起源以及与苹果的Mac exclusivity争议。他强调了成功企业应提供机会,让创始人有更多时间专注于刺激的项目,而不是日常琐事。

精选文章#Ruby on Rails#Kubernetes#Apple#Linux#Omarchy中文
Stack Overflow Blog 图标

没有愚蠢的问题:什么是云计算以及为什么大家都在用它?

Stack Overflow Blog2732 字 (约 11 分钟)
75

文章解释了云计算的基本概念及其广泛应用的原因,强调其如何简化基础设施管理并降低启动成本。

入选理由:云计算本质上是使用他人计算机资源,无需自建数据中心。

精选文章#云计算#AWS#Docker英文
Platform Engineering Labs Expands formae with Kubernetes Support, Native Helm Integration

InfoQ 发布了一篇关于 Platform Engineering Labs 扩展其平台 formae 以支持 Kubernetes 和原生 Helm 集成的文章。

入选理由:formae 现在支持 Kubernetes 和原生 Helm 集成。

精选文章#Platform Engineering Labs#formae#Kubernetes#Helm#软件开发中文

与「Kubernetes」经常一起出现的 AI 术语。

💡 想追踪「Kubernetes」的长期趋势?去 实体雷达 · Kubernetes 查看详细分析和跨材料问答。

AI 可能会生成不准确的信息,请核实重要内容