OpenSearch架构重构:AWS智能体工作负载应对
摘要
AWS重构AmazonOpenSearchServerless架构,实现存储与计算彻底分离,空闲时可缩减至零成本,运营
AWS 近日正式推出了其托管搜索与向量引擎的全面重构版本。此次升级的核心目标非常明确:为智能体时代的复杂工作负载提供最佳支撑。

最直观的变化体现在成本模型上:新一代 Amazon OpenSearch Serverless 在空闲状态下可真正缩至零资源占用,从而实现零运行成本。与始终满负荷运转的预置集群相比,运营成本最高可降低 60%。这一数据背后有扎实的架构支撑,并非空谈。
大幅优化的根本原因在于智能体的工作负载特征——它们往往表现为“突发高峰、长时间静默”的脉冲式访问模式。这种特性完全推翻了 AWS 此前为 OpenSearch Serverless 设计的架构假设。旧架构在面对此种流量时,根本无法高效响应。
AWS OpenSearch 总经理 Tia White(今年 2 月履新)在接受 The New Stack 采访时坦言:“这次重建的规模非常惊人,约 97% 的代码由托管服务团队工程师从零编写。部分模块来自开源仓库,但凡是具备核心创新或构成知识产权的内容,我们不会通过开源项目释放。”
架构层面最根本的变化是存储与计算的彻底解耦。White 解释道,OpenSearch 现在运行在一个全新的专有存储层之上:“集群现在可以真正缩容到零,即当资源未被使用时,用户无需支付任何费用。同时,为应对智能体引发的突增工作负载,集群可在数秒内重新启动——我们力求消除冷启动延迟。”
新版服务的自动扩缩容速度相比上一代提升 20 倍,并且在发布之初就同时支持搜索和向量两种集合类型。计费按 OpenSearch 计算单元进行,覆盖索引、搜索及 GPU 加速环节。此外,本次发布还包括与 Vercel 及 AWS 自家 IDE Claude 的原生集成,以及一套 OpenSearch 智能体技能包,开发者可使用 Claude Code、Cursor 等主流工具进行开发。
60% 的成本节省主要来自两个维度:一是新专有存储层内置的高效压缩功能,二是自动扩缩容机制的极速响应——一旦流量下降,系统能在数秒内迅速释放冗余容量。White 直言:“因为我们能预判需求并快速完成扩缩,用户自然能省下成本。”
谈及重构背景,White 坦诚交底:“过去的 OpenSearch 像一把瑞士军刀,什么都能干,但什么都不精通。去年我们甚至尝试转型做 SIEM(安全信息与事件管理)。”然而该转型未能落地。现在的定位清晰了许多:将 OpenSearch 最擅长的传统搜索与日志分析相结合,并围绕智能体工作负载重新定义产品方向。
这一“双支柱”战略转型背后,White 在采访中同步披露了产品路线图。
智能体长期记忆功能预计 2026 年下半年推出,且从第一天起就内置评估与治理机制。White 对此看得透彻:“评估——也可视为治理的一部分——既是艺术,也是科学。什么内容值得保留,什么内容该清除,这种持续的反馈循环本身就极具挑战性。”
她特别强调,安全护栏绝不能事后补充:“打造以智能体为核心的平台,这些能力必须从第一天就具备,不能作为事后补丁或附加功能。”
与此同时,AWS 正在持续完善 OpenSearch Serverless 在知识图谱和语义层方面的能力,并推进 White 所说的“面向搜索特定工作负载的高级推理模型”。
一个值得关注的信息是:一项重大的日志分析功能将于 6 月正式发布,这意味着 AWS 将重返当前由 Datadog、Splunk 和 Grafana 主导的市场。紧接着,TIMESERIES 集合类型会在 AWS 纽约峰会上亮相,进一步将 OpenSearch Serverless 推向更多可观测性场景。
White 还抛出了一个引人深思的问题:“当精准度足够高、Token 消耗足够优化后,我们不得不思考——大语言模型是否会取代 OpenSearch 这类工具?”但 AWS 的答案是:不会。OpenSearch Serverless 乃至整个 OpenSearch 体系,定位是成为大语言模型调用的关键语义层,而非被其替代。
Q&A
Q1:Amazon OpenSearch Serverless 新版本的成本为何能降低 60%?
A:成本节省主要来源于两处:一是新专有存储层内置压缩功能,显著降低存储开销;二是自动扩缩容机制响应极快,能在流量下降后数秒内迅速缩减容量。此外,集群空闲时可真正缩至零,用户无需为不活跃资源付费。与始终满负荷运行的预置集群相比,综合成本最高可降 60%。
Q2:Amazon OpenSearch Serverless 新架构相比旧架构最核心的变化是什么?
A:最核心的变化是存储与计算的彻底分离。新版本引入全新专有存储层,使集群能真正缩至零,并在数秒内快速启动,避免冷启动问题。自动扩缩容速度较上一代提升 20 倍,专门针对智能体“突发高峰、长时静默”的使用模式优化。此外,约 97% 的代码由工程师从零重建,是一次全面的架构级升级,而非局部修补。
Q3:Amazon OpenSearch Serverless 未来有哪些新功能规划?
A:根据路线图,智能体长期记忆功能预计 2026 年下半年推出,且从上线首日起内置评估与治理机制。重大日志分析功能将于近期发布,帮助 AWS 重返 Datadog、Splunk 和 Grafana 主导的市场。TIMESERIES 集合类型将在 AWS 纽约峰会上亮相,覆盖更多可观测性场景。此外,知识图谱、语义层以及面向搜索的高级推理模型也在持续建设中。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。