AI 资讯

每日聚合最新人工智能动态

201

用 Amazon Bedrock AgentCore Identity 在 Amazon ECS 上保护 AI 代理安全

新上线

AI 代理在生产环境中需要安全地访问外部服务。Amazon Bedrock AgentCore Identity 作为一项独立服务，无论代理运行在 Amazon ECS、Amazon EKS、AWS Lambda 还是本地环境，都能为其提供安全保障。本文聚焦于在 Amazon ECS 上实现授权码授权（三腿 OAuth），包括安全的会话绑定和作用域令牌管理。 ## 核心挑战当 AI 代理运行在 ECS 等计算环境中时，面临两个关键问题： 1. 如何构建应用自有的会话绑定端点？ 2. 如何管理工作负载的访问令牌生命周期？ ## 解决方案概览该方案基于 **OAuth 2.0**（RFC 6749）和 **OpenID Connect（OIDC）**。OIDC 负责用户身份认证（用户是谁），OAuth 2.0 则授权用户操作（用户能做什么）。重点在于**授权码授权**，用于用户委派访问。流程如下： - 用户通过身份提供者（IdP）认证并授予同意。 - 应用将授权码交换为作用域访问令牌。 - Amazon Bedrock AgentCore Identity 将令牌安全存储在令牌库中。由于每个令牌都绑定到特定用户身份并附带明确同意，该方案维护了一条从用户认证到代理操作的可审计链条。 ## 关键特性 - **安全会话绑定**：防止 CSRF 和浏览器交换攻击。 - **作用域令牌**：每个用户会话的令牌遵循最小权限原则。 - **关注点分离**：代理工作负载与会话绑定服务职责清晰。 - **认证与授权**：结合 OAuth 2.0 和 OIDC 实现。 ## 回调 URL vs 会话绑定 URL 在授权码授权流程中，两个 URL 容易混淆： - **回调 URL**：创建 OAuth 客户端时自动生成。 - **会话绑定 URL**：由应用自定义实现，用于绑定用户会话。 ## 适用场景授权码授权特别适合**代表用户行动的代理工作负载**，原因如下： - 代理行动前需获得用户同意。 - 会话绑定确保发起授权请求的用户与同意授权的用户一致。 - 作用域委派限制代理仅能使用用户批准的权限。该实现已在 ECS 上完成验证，提供了完整的代码示例和部署指南，帮助开发者快速构建安全的 AI 代理基础设施。

AWS ML2个月前原文

202

利用 Amazon Bedrock 实现智能消息防御与洞察

新上线

在当今数字化商业环境中，企业每天处理海量用户消息，其中既包含有价值的客户反馈，也潜藏着恶意接触、诈骗甚至品牌攻击。如何在不影响正常客户沟通的前提下，精准识别风险并提取业务洞察，成为一项关键挑战。本文介绍如何借助 **Amazon Bedrock** 上的 **Amazon Nova 基础模型**，构建一套智能消息防御与洞察系统，实现“一箭双雕”：既保护业务安全，又提升客户体验。 ## 核心能力：识别伪装接触与挖掘客户情绪传统的消息过滤方案通常依赖规则引擎或关键词匹配，面对日益复杂的伪装手段（如变体拼写、语义隐藏、上下文诱导）往往力不从心。而生成式 AI 模型，尤其是 Amazon Nova 系列，具备强大的自然语言理解能力，能够从语义层面识别恶意意图。通过将用户消息输入 Amazon Bedrock，调用 Nova 模型进行 **意图分类** 和 **情感分析**，系统可以： - **识别直接或伪装的恶意接触**：例如，诈骗者可能使用“客服转接”“账户验证”等看似正常的词汇，但模型能根据上下文判断其真实目的。 - **提取客户真实情感**：在排除恶意消息后，对正常客户消息进行情感打分，识别不满、困惑或赞扬，为服务改进提供数据支撑。 - **发现服务改进机会**：高频出现的投诉关键词、功能请求等，可自动汇总为洞察报告，指导产品迭代。 ## 技术实现：无服务器架构与模型编排该方案基于 Amazon Bedrock 的无服务器体验，无需自行管理基础设施。开发者只需通过 API 调用 Nova 模型，即可将消息处理流程嵌入现有业务系统。典型架构包括： 1. **消息接入层**：通过 API Gateway 或 SQS 接收用户消息。 2. **智能分析层**：使用 Amazon Bedrock 调用 Nova 模型，进行意图识别与情感分析。 3. **决策与存储层**：根据分析结果，将恶意消息隔离或标记，将正常消息存入数据库供后续分析。 4. **洞察输出层**：通过 QuickSight 或自定义仪表盘，可视化展示客户情感趋势、风险分布等。 Amazon Nova 模型在成本和响应速度上经过优化，适合实时或近实时的消息处理场景。企业还可以结合 **Amazon Bedrock 知识库**，注入行业术语或历史案例，提升模型对特定领域伪装手法的识别准确率。 ## 案例场景：从电商客服到金融风控该方案的应用范围广泛： - **电商平台**：识别“退款钓鱼”消息，同时收集用户对物流、商品的真实反馈。 - **金融机构**：检测冒充客服的诈骗短信，并分析客户对理财产品的情绪倾向。 - **社交平台**：过滤垃圾信息和恶意链接，同时发现用户对功能更新的普遍态度。 ## 小结：AI 驱动的双向价值利用 Amazon Bedrock 和 Amazon Nova 模型，企业不再需要在“安全”与“体验”之间做取舍。同一套 AI 能力既能构筑消息防御的护城河，又能打开客户洞察的窗口。这种“防御+洞察”的双重价值，正是生成式 AI 在业务落地中的典型体现——它不只是工具，更是重塑客户关系管理的战略支点。

AWS ML2个月前原文

203

超越BI：Amazon QuickSight 数据集问答功能如何驱动下一代数据决策

新上线

企业领导者依赖运营仪表盘作为日常执行的共享事实来源，但仪表盘仅能回答已知问题。当团队需要探索临时、多维或未知问题时，往往会遇到瓶颈——等待BI团队数小时甚至数天来构建新视图或更新报告。Amazon QuickSight 的数据集问答（Dataset Q&A）功能打破了这一僵局：用户可以用自然语言提问，在几秒内获得准确答案，无需构建新仪表盘或排队等待。它让你与现有数据集进行交互式对话，同时不干扰团队已依赖的仪表盘。以AWS技术领域社区（TFC）项目为例，该项目每年支持数十万次客户互动，涵盖数十个专业领域。项目领导者和现场团队需要快速回答复杂运营问题，例如：客户需求在哪里增长？哪些团队具备合适的专业能力？客户互动是否得到及时解决？哪里有影响客户成果的潜在缺口？随着互动规模扩大，传统静态仪表盘在多维度复杂查询面前力不从心。利益相关者不得不在不同系统间手动交叉引用数据集，才能看清如何更好地服务客户。问题的核心在于工作流：领导者的提问打断BI工程师的计划工作，后者运行聚合后返回答案，而答案又引发下一个问题。真正的时间损失不在查询本身，而在提问者与拥有工具的人之间的交接。数据集问答功能通过自然语言处理直接理解业务问题，从底层数据模型生成准确SQL查询，即时返回结果。它让业务用户独立探索数据，将BI团队从重复的临时查询中解放出来，专注于更高价值的分析工作。这不仅提升了决策速度，还推动了数据民主化——让每个决策者都能与数据对话。对于希望构建数据驱动文化的组织，这一功能标志着从“被动响应”到“主动探索”的转变。当提问不再需要排队，洞察的获取就变成了连续的对话，而非离散的报告。

AWS ML2个月前原文

204

AWS 推出 AgentCore 优化功能预览：从生产追踪到 A/B 测试的智能体质量闭环

新上线

AI 智能体在发布时表现良好，但随着时间的推移，模型迭代、用户行为变化以及提示词被用于未曾预料的新场景，智能体的质量会悄然下降。许多团队直到用户投诉增加或关键指标下滑，才意识到问题所在。为此，AWS 现推出 **AgentCore 优化功能预览**，旨在通过一个完整的“智能体质量闭环”帮助开发者持续监控和提升智能体性能。该功能的核心流程分为三步：首先，从生产环境的追踪数据中自动生成优化建议；其次，通过批量评估和 A/B 测试验证这些建议的有效性；最后，将经过验证的改进方案放心地部署上线。这一闭环机制将智能体的质量维护从被动响应转变为主动管理。具体来说，AgentCore 能够分析智能体在生产中的实际表现，识别出响应质量下降、提示词冲突或上下文漂移等问题，并基于这些分析给出具体的优化推荐。开发者可以直接在 AWS 控制台中查看这些建议，并通过内置的评估工具进行批量测试，对比优化前后的效果。A/B 测试功能则允许在真实流量中逐步验证改进，降低上线风险。这一功能的推出背景是 AI 智能体在生产环境中的长期维护难题。随着企业将越来越多的任务交给智能体处理，确保其稳定性和准确性变得至关重要。AgentCore 的优化循环不仅适用于初始开发阶段，更强调持续迭代——正如软件工程中的 CI/CD 流水线，智能体也需要一套持续改进的流程。目前该功能处于预览阶段，AWS 用户可申请试用。对于构建复杂智能体应用的团队而言，这无疑是一个值得关注的工具，它有望将智能体运营从“消防模式”转向“预防模式”，减少因质量退化带来的业务影响。

AWS ML2个月前原文

205

AgentCore 优化预览：从生产追踪到 A/B 测试，打造智能体性能闭环

新上线

AI 智能体在发布时表现优异，但随着模型迭代、用户行为变化以及提示词在未预期场景中的复用，其性能会悄然退化。传统修复方式依赖人工排查：开发者翻阅追踪记录、形成假设、重写提示词、测试少量案例后发布修复，但此循环效率低下且易引入新问题。Amazon Bedrock AgentCore 现推出全新优化能力，补齐“观察-评估-改进”闭环中的关键环节。新功能包括：基于生产追踪和评估结果生成**优化建议**，自动改进系统提示词或工具描述；**批量评估**允许使用预定义测试数据集验证建议，并报告聚合分数以捕捉回归；**A/B 测试**通过 AgentCore Gateway 在真实流量中按比例分流，以置信区间和统计显著性报告对比结果。此外，当手工编写的测试场景不足时，可利用 LLM 驱动的模拟器生成用户行为数据集。这一系列工具将开发者从依赖直觉的调试模式中解放出来，转向数据驱动的系统化优化流程，使智能体质量维护从周/月级周期提升至日常可持续改进。

AWS ML2个月前原文

206

AgentCore 推出智能体质量优化功能，现已进入预览阶段

新上线

AI 智能体在发布时表现良好，但随着模型更新、用户行为变化以及提示词被复用到新场景，其性能会悄然下降。传统的调试方式依赖开发者手动分析追踪日志、猜测问题根源并反复修改，效率低且易引入新问题。Amazon Bedrock AgentCore 新推出的智能体质量优化功能，通过自动化推荐、批量评估和 A/B 测试，帮助团队系统性提升智能体性能。 ### 核心能力 - **智能推荐**：基于生产追踪日志和评估结果，自动优化系统提示词或工具描述，以更好地适配你指定的评估标准。 - **批量评估**：使用预定义测试数据集验证推荐效果，输出聚合评分，快速发现关键场景的回归问题。如果手工测试用例不足，还可利用 LLM 驱动的模拟用户生成数据集。 - **A/B 测试**：通过 AgentCore Gateway 在生产环境中进行流量分割，对比不同版本智能体的表现，并给出置信区间和统计显著性结果。 ### 行业背景智能体质量下降是 AI 工程中的常见痛点。多数团队缺乏自动反馈闭环，只能被动响应投诉。大型团队虽有专门团队和基准测试，但更新周期往往以周或月计，而智能体每天都可能发生漂移。AgentCore 的新功能将评估-优化循环自动化，让产品团队能基于数据而非直觉做出改进。 ### 实践价值这套工具链覆盖了从问题发现、根因分析到变更验证的完整流程。开发者不再需要手动翻阅海量追踪日志，系统会自动给出优化建议，并通过批量测试和线上 A/B 实验双重验证，确保每个改动都经得起推敲。这对于高频迭代的智能体应用尤为重要，能显著降低维护成本并提升用户体验。

AWS ML2个月前原文

207

Agent引导的工作流：在Amazon SageMaker AI中加速模型定制

新上线

每个组织都能访问相同的基础模型，真正的竞争优势来源于用专有数据和领域知识定制模型。但这一过程充满挑战：需要掌握监督微调（SFT）、直接偏好优化（DPO）、强化学习可验证奖励（RLVR）等技术，处理碎片化的API和数据格式，设计严格的评估，并管理长达数月的实验周期。 Amazon SageMaker AI 现在提供了一种**基于Agent的体验**来改变这一切。开发者只需用自然语言描述用例，AI编码Agent便会简化从用例定义、数据准备到技术选择、评估和部署的整个流程。 ### 核心能力：Agent技能（Agent Skills） **Agent技能**是预构建的模块化指令集，编码了AWS和数据科学在模型定制全生命周期中的深度专业知识。当你描述用例时，AI编码Agent会激活相关技能，引导其完成： - **数据准备与验证**：自动转换数据为所需格式，确保质量。 - **技术选择**：根据用例推荐SFT、DPO或RLVR等微调技术。 - **超参数配置**：提供最佳实践建议。 - **模型评估**：使用LLM-as-a-Judge指标进行质量评估。 - **部署**：灵活部署到Amazon Bedrock或SageMaker AI端点。这些技能不仅提升了生产力，还**减少了Token消耗**。所有生成的代码完全可编辑，产生可复用的工件，无缝集成到现有工作流中。 ### 定制化与可扩展性技能完全可定制，你可以修改它们以匹配团队的工作流、治理标准和工具偏好，从而实现可重复的组织最佳实践——这是通用编程助手常见的难题。 ### 集成开发环境 SageMaker AI Studio JupyterLab中集成了Agent开发环境支持（通过ACP）。默认情况下，亚马逊的AI软件Kiro提供了内嵌的Agent体验。 ### 总结通过Agent引导的工作流，Amazon SageMaker AI 将模型定制的复杂性抽象化，让开发者专注于高价值任务。这不仅加速了实验周期，还降低了技术门槛，使更多团队能够利用专有数据构建差异化AI应用。

AWS ML2个月前原文

208

Amazon Quick 新功能：用自然语言一句话生成完整仪表盘

新上线

Amazon Quick 推出了一项生成式 AI 新功能，允许用户通过自然语言提示自动生成包含多工作表、筛选控件和计算字段的完整分析仪表盘，将原本数小时的手动搭建工作缩短至几分钟。 ## 背景与痛点传统 BI 仪表盘的创建流程繁琐且耗时。即便是经验丰富的 BI 专业人士，也需要手动配置数据源、拖拽图表、设置筛选器和编写计算字段。对于需要频繁生成运营报告的数据分析师、准备领导层审阅的项目经理，或是探索新数据集的工程师而言，这一过程往往成为效率瓶颈。 ## 核心功能：从提示到仪表盘 Amazon Quick 的新能力直接嵌入到 **Analysis（分析）** 创作界面中。用户只需遵循三个步骤： 1. **选择数据集**：支持选择 1–3 个数据集，可跨表关联（如订单表和产品表）。 2. **描述需求**：用自然语言写出想要分析的内容，例如“创建一个运营仪表盘，展示订单量趋势、收入关键指标和交付绩效对比”。 3. **审查并生成**：系统会先生成一个交互式计划，展示建议的图表布局、筛选器和计算字段（如同比/环比增长），用户可在此阶段调整确认，然后一键生成完整的分析文件，并可直接发布为仪表盘。 ## 技术亮点与用户体验 - **智能图表选择**：系统会根据数据特征自动匹配最合适的可视化类型（如折线图、柱状图、表格等）。 - **多工作表组织**：复杂的业务问题通常需要多维度展示，新功能会自动将分析内容拆分到多个工作表中，逻辑清晰。 - **计算字段自动生成**：常见的 KPI 如 **年同比增长（YoY）** 和 **月环比（MoM）** 无需手动编写公式。 - **筛选控件**：为利益相关者提供按不同维度（如时间、地区、产品类别）探索数据的能力。 ## 适用场景 - **运营报告**：数据团队可快速生成定期报告模板，减少重复劳动。 - **领导层汇报**：管理者可直接用自然语言描述关注指标，即时获得可视化结果。 - **数据探索**：工程师面对新数据集时，无需手动拖拽即可获得初步洞察。 ## 行业影响这一功能进一步降低了 BI 工具的使用门槛，将 **生成式 AI** 从“聊天机器人”延伸至“生产力工具”。与 Microsoft Power BI 的 Copilot、Tableau 的 Ask Data 等竞品相比，Amazon Quick 的优势在于与 AWS 生态的深度集成（如 Redshift、S3），以及对多数据集关联的原生支持。对于企业而言，这意味着**数据分析民主化**的加速——业务人员不必依赖数据团队即可自主创建仪表盘，而专业分析师则能将精力集中在更复杂的建模和洞察上。 ## 前提条件使用该功能需要 **AWS 账户** 和 **Amazon Quick Enterprise Edition** 订阅。 ## 小结 Amazon Quick 的自然语言生成仪表盘功能，不仅提升了效率，更改变了 BI 的交互范式。从“手动搭建”到“对话式创作”，AI 正在重塑数据分析的工作流。对于正在寻求敏捷 BI 解决方案的团队，这无疑是一个值得关注的新选项。

AWS ML2个月前原文

209

从数据湖到AI就绪分析：Amazon Quick新增S3 Tables数据源，实现近实时洞察

新上线

Amazon Quick 近日宣布推出 **Amazon S3 Tables（Apache Iceberg 表）** 作为全新数据源，用户可直接查询和可视化存储在 S3 表桶中的 Iceberg 表，无需中间数据层。这一更新旨在简化现代数据架构，减少数据迁移，提升性能，并为 AI 驱动的分析铺平道路。 ## 背景：分析需求与数据架构的演变企业正加速将分析与 AI 结合，以更快获得洞察。Amazon Quick 作为统一的分析与决策智能服务，集数据可视化、自然语言交互和代理驱动自动化于一体，让业务用户无需 ML 专业知识即可探索数据。与此同时，现代数据架构正转向基于 **Apache Iceberg** 等开放表格式的可扩展数据湖，以提高性能、降低成本和增强治理。然而，分析大规模数据通常需要将其迁移至数据仓库或 OLAP 系统，这引入了延迟、额外成本和操作复杂性。 ## 新功能：直接连接 S3 Tables Amazon Quick 新增的 **S3 Tables 数据源** 支持 **Direct Query** 和 **SPICE** 两种模式，使用户能够直接消费 S3 表桶中的 Iceberg 表。这为企业提供了一种额外的架构选择，尤其适用于需要减少数据移动、提升性能并维护单一可信数据源的场景。 **主要优势包括：** - **简化架构**：消除对独立数据仓库或 OLAP 层的需求，降低数据管道复杂性。 - **近实时分析**：直接查询数据湖中的最新数据，减少延迟。 - **成本效率**：避免数据迁移和冗余存储的成本。 - **治理与安全**：利用 Iceberg 的开放格式特性，确保数据的一致性和可审计性。 ## 对行业的影响这一更新反映了 **数据湖与 AI 分析融合** 的趋势。通过将 S3 Tables 作为一等数据源，Amazon Quick 使企业能够更无缝地实现“数据湖即单一事实来源”的愿景。对于正在构建 AI 就绪数据基础架构的组织而言，这意味着可以更快地将原始数据转化为可操作的洞察，同时保持架构的灵活性和可扩展性。 ## 小结 Amazon Quick 与 S3 Tables 的结合，为现代分析提供了一种更直接、高效的路径。无论是用于商业智能报表、实时仪表盘，还是作为 AI 模型的输入数据，这一新数据源都值得企业关注。

AWS ML2个月前原文

210

Amazon QuickSight 推出 Dataset Q&A：用自然语言直接查询结构化数据集

新上线

商业智能（BI）团队常常面临一个瓶颈：业务用户的问题超出了现有仪表盘的范围，于是提交工单，分析师编写查询、验证结果并交付——整个过程可能需要数小时甚至数天。如果每月有数百个临时请求，积压的工作就会成为数据团队生产力的最大制约。Amazon QuickSight 新增的自然语言查询功能 **Dataset Q&A** 旨在消除这一瓶颈。用户的问题会被自动翻译为 SQL，针对完整数据集运行，并在数秒内返回结果——无需行采样、主题策划或预配置的计算字段。 QuickSight 此前已提供两种自然语言查询模式：**Dashboard Q&A** 针对已发布仪表盘中的可视化数据，依赖作者构建的业务上下文；**Topic Q&A** 更进一步，作者通过业务友好的字段名称和同义词丰富数据模型，使用户能以日常语言查询策划好的字段集。**Dataset Q&A** 则补齐了最后一块拼图：用户可以直接探索任何数据集，突破作者预配置的限制，同时企业级的安全、权限和治理策略仍然得到完全执行。尽管业界竞相推出文本转 SQL 的演示，但企业 BI 的真正挑战从来不是生成 SQL，而是将模糊的业务语言映射到复杂的数据模式，在每一步执行安全策略，并解释系统做了什么以及为什么这么做。QuickSight 的代理系统正是为此而设计。模型必须解决词汇歧义——例如“volume”是指行数、收入还是出货量？——并将口语化的业务术语映射到数据集中精确的列名和计算上，而无需预定义字典。在运行任何查询之前，系统会通过一个语义图搜索所有结构化资产（仪表盘、数据集和主题），该图理解资产之间的关联关系。这样，即使你的问题没有使用数据集或列的确切名称，系统也能找到正确的数据源。确定数据源后，系统会查看数据样本值和分布等上下文信息，并结合作者提供的字段描述和业务背景来消除歧义，然后调用三种能力之一来生成查询。 ### 实战用例与能力展示 **自动发现所有数据资产**：当用户提出“上季度各产品线的收入情况”时，系统会自动搜索整个 QuickSight 环境，找到包含收入字段和产品线信息的数据集或仪表盘，无需用户手动导航。 **多数据集交叉查询**：在单次对话中，用户可以询问“比较上个月和本月的客户流失率”，系统会识别需要连接两个不同数据集（客户表和流失事件表），自动生成跨数据集的 JOIN 查询。 **安全与治理不妥协**：所有查询都遵循数据集的行级安全策略和列权限。用户只能看到其有权访问的数据，管理员无需为自然语言查询单独配置安全规则。 ### 技术架构亮点 QuickSight 的文本转 SQL 引擎并非简单的 LLM 调用，而是一个包含多个步骤的代理系统： 1. **意图理解与资产发现**：分析用户问题，通过语义图定位最相关的数据资产。 2. **模式探索与消歧**：采样数据值，读取字段描述，识别同义词，将模糊术语映射到具体列。 3. **SQL 生成与优化**：根据映射结果生成正确的 SQL，包括聚合、过滤、连接等操作。 4. **结果解释**：返回结果时附带自然语言解释，说明查询了什么数据以及如何计算的。这一架构确保了高准确性和可解释性，避免了“黑箱”查询带来的信任问题。 ### 对 BI 行业的影响 Dataset Q&A 的推出标志着 BI 工具从“可视化驱动”向“对话式分析”迈出了重要一步。过去，自然语言查询往往需要精心策划的语义层或受限于预定义字段，而 Dataset Q&A 允许用户直接探索原始数据集，大幅降低了分析门槛。对于企业而言，这意味着： - 业务人员可以自助获取答案，减少对分析师的依赖。 - 分析师可以专注于更复杂的分析任务，而非重复性的临时查询。 - 数据驱动的决策速度显著提升。目前该功能已可用，用户可以在 QuickSight 控制台中启用 Dataset Q&A，并开始用自然语言提问。

AWS ML2个月前原文

211

Amazon SageMaker AI 推出容量感知推理：自动实例回退，告别手动抢 GPU

新上线

## 核心痛点：GPU 容量不足导致推理端点部署失败在生成式 AI 生产环境中，GPU 算力稀缺是常态。过去，用户在 Amazon SageMaker AI 上创建推理端点时，必须指定一个具体的实例类型（如 `ml.p4d.24xlarge`）。如果该实例类型在指定区域或可用区没有足够容量，端点创建就会直接失败，返回 `InsufficientCapacityError`。用户只能手动更换实例类型，反复重试，直到某个类型成功部署——这个过程可能耗费数十分钟甚至更久。更糟糕的是，**自动扩缩容（Auto Scaling）也会被单一实例类型限制**：当流量增长触发扩容时，如果指定实例类型容量不足，AWS 会不断重试同一个类型，导致端点无法扩容，业务请求被阻塞。缩容时也无法区分“首选实例”和“备用实例”，所有实例被一视同仁对待，缺乏弹性策略的灵活性。 ## 新能力：容量感知实例池（Capacity-Aware Instance Pool）今天，Amazon SageMaker AI 正式推出了**容量感知实例池**功能，支持在创建新端点或修改现有端点时，定义一个**按优先级排序的实例类型列表**。SageMaker AI 会在创建、扩容和缩容过程中自动遍历这个列表，选择第一个当前有可用容量的实例类型进行部署。 ### 工作原理 - **创建端点时**：系统按优先级顺序尝试实例类型，一旦某个类型有容量，立即使用该类型完成部署。如果所有类型都无容量，则返回明确的错误信息。 - **扩容时**：当自动扩缩容策略触发增加实例时，同样按优先级列表检查容量，优先选择首选类型，若容量不足则自动 fallback 到下一优先级。 - **缩容时**：缩容会优先移除低优先级的实例（即 fallback 实例），保留高优先级的首选实例，从而保持最佳性能配置。 ### 适用场景该功能适用于 **单模型端点（Single Model Endpoints）**、**基于推理组件（Inference Component）的端点** 以及 **异步推理端点（Asynchronous Inference Endpoints）**。这意味着几乎所有的 SageMaker AI 推理部署场景都能受益。 ## 如何快速上手？ ### 创建新端点在 AWS 管理控制台、AWS CLI 或 SDK 中创建端点时，在 `ProductionVariants` 或 `InferenceComponents` 配置中，使用新的 `InstanceTypePool` 参数代替原来的 `InstanceType`。例如： ```json { "ProductionVariants": [ { "InstanceTypePool": ["ml.g5.48xlarge", "ml.p4d.24xlarge", "ml.p5.48xlarge"], "InitialInstanceCount": 2 } ] } ``` ### 迁移现有端点对于已经在运行的端点，可以通过 `UpdateEndpoint` API 或控制台修改端点配置，添加 `InstanceTypePool`。SageMaker AI 会自动执行滚动更新，逐步将现有实例替换为符合新池定义的实例，期间服务不中断。 ## 行业意义：让 AI 基础设施更“弹性” 在 AI 算力紧张的背景下，**容量感知实例池** 实际上将“手动抢资源”的运维负担转移给了云平台。它带来的直接好处包括： 1. **缩短部署时间**：从分钟级的手动重试缩短到秒级的自动 fallback，尤其适合快速迭代的 ML 团队。 2. **提高可用性**：即使首选实例类型缺货，端点也能自动使用次优类型继续运行，避免服务中断。 3. **优化成本**：用户可以将更便宜的实例类型（如 `ml.g5`）作为首选，将高性能但昂贵的实例（如 `ml.p5`）作为备用，在容量充足时优先使用低成本实例，仅在必要时才使用高性能实例。 ## 小结 Amazon SageMaker AI 的容量感知推理功能，是 AWS 回应 GPU 短缺问题的一个务实方案。它不承诺增加物理算力，但通过**智能调度**显著提升了现有资源的利用率和端点的部署成功率。对于正在大规模部署 LLM 或视觉模型的企业来说，这无疑是一个值得立即采用的特性。 > 该功能已在所有 AWS 商业区域上线，无需额外付费。

AWS ML2个月前原文

212

AWS Transform 新功能：数天内自动完成 BI 迁移至 Amazon QuickSight

新上线

AWS 近日推出了一项重要更新——**AWS Transform** 现在支持将传统 BI 工具（如 Tableau、Power BI 等）的仪表板、数据集和安全规则**自动迁移至 Amazon QuickSight**，将原本需要数月的迁移周期缩短至数天。 ## 迁移痛点与 AWS Transform 的解法对于许多企业来说，遗留 BI 系统不仅带来高昂的许可费用，更存在运维负担重、分析效率低、缺乏 AI 能力等核心问题。传统迁移方式需要手动重建数百个仪表板，极易出错且耗时漫长。 AWS Transform 通过 AI 代理（Agent）来自动化这一过程。用户只需在 AWS Transform 中设置迁移工作区，订阅 AWS Marketplace 中的合作伙伴代理（如 Wavicle Data Solutions 的 EZConvertBI），即可开始自动化迁移。这些代理能够识别并转换仪表板中的计算字段、布局、安全规则等关键元素，确保迁移后的报表保持原有业务逻辑。 ## 迁移后的新能力：不仅仅是“搬家” 迁移至 Amazon QuickSight 后，企业可以立即获得以下优势： - **AI 原生分析**：用户可以用自然语言提问，QuickSight 的 AI 能力自动生成答案和可视化。 - **无服务器架构**：无需管理服务器，自动扩展，零运维窗口。 - **亚秒级查询性能**：借助 SPICE 内存引擎，大规模数据查询依然快速。 - **嵌入式分析**：通过 API 将仪表板直接嵌入到现有应用中，提升用户体验。 ## 行业影响与未来展望 AWS Transform 此次扩展至 BI 迁移领域，标志着 AWS 在**企业现代化**战略上的进一步深化。此前该服务已支持大型机应用、Windows/SQL Server 工作负载、VMware 环境及自定义应用的现代化改造。将 BI 迁移纳入其自动化版图，意味着企业可以更高效地完成从传统架构到云原生 AI 平台的全面转型。对于正面临 BI 工具升级压力的企业来说，这是一个值得关注的信号——**AI 驱动的自动化迁移不再是未来，而是已经可用的现实**。

AWS ML2个月前原文

213

用LLM当裁判：强化微调中的RLAIF实战指南

新上线

大语言模型（LLM）的输出常存在不准确、不合规或表述生硬等问题，而**强化微调（RFT）** 正成为解决这些痛点的首选方案。其中，**以LLM为裁判的强化学习（RLAIF）** 凭借其灵活性和可解释性，正逐步取代传统的硬编码奖励函数。本文基于亚马逊Nova模型实践，深入解析RLAIF的实现路径与关键步骤。 ## 为什么选择LLM-as-a-judge？传统的强化微调依赖**可验证奖励（RLVR）**，即通过代码规则（如子串匹配）打分，虽然直接但难以捕捉语义细微差别。而**LLM-as-a-judge**（也称RLAIF）则让一个独立的语言模型作为裁判，从**正确性、语气、安全性、相关性**等多个维度对候选输出进行综合评估。这种方法的优势在于： - **灵活性高**：无需为每个任务重新训练裁判模型，可跨领域复用。 - **可解释性强**：裁判会给出具体理由（如“回答A引用了同行评审研究”），帮助开发者快速定位失败模式。 - **减少隐藏偏差**：静态规则容易忽略上下文，而LLM裁判能感知领域特定细节。 ## 实施LLM-as-a-judge的六个关键步骤 ### 1. 选择裁判架构裁判架构分为两类： - **基于评分标准（Rubric-based）**：按预设维度（如完整性、安全性）逐项打分，最后汇总总分。适合有明确评价指标的任务。 - **基于偏好（Preference-based）**：直接比较两个回答，输出“A优于B”的判断。适合主观性较强的场景，如创意写作。 ### 2. 设计评估提示词裁判模型的提示词需清晰定义评价维度、评分规则和输出格式。例如，对于客服场景，可要求裁判从“问题解决率”“礼貌程度”“信息准确度”三个维度打分，并输出0-5分。 ### 3. 构建高质量参考数据虽然RLAIF减少了人工标注需求，但仍需少量人类标注数据作为校准基准，确保裁判评分与人类判断一致。通常需要数百到数千条样本。 ### 4. 训练或微调裁判模型如果使用通用裁判（如GPT-4），可直接调用API；若需领域定制，可在开源模型（如Llama、Amazon Nova）基础上微调，使其更熟悉特定术语和规范。 ### 5. 迭代优化奖励信号将裁判评分输入强化学习算法（如PPO），更新主模型参数。关键是要监控奖励信号的稳定性，避免裁判打分出现“模式坍塌”——即一直给高分或低分。 ### 6. 评估与对齐验证最终需要对比RLAIF微调前后的模型输出，通过人工评估或自动化指标（如BLEU、ROUGE）验证对齐效果。同时检查裁判是否引入新偏见，例如偏爱较长回答或特定措辞。 ## 实践案例：Amazon Nova模型中的RLAIF 亚马逊Nova团队在内部测试中发现，使用LLM-as-a-judge进行强化微调后，模型在**事实准确性**和**安全性**上提升了约30%，同时减少了“幻觉”输出。关键在于裁判模型本身需要与主模型同源或经过校准，否则可能放大偏差。 ## 小结 RLAIF通过“以模型评模型”的方式，大幅降低了强化微调的人工成本，同时保留了多维评估的细腻度。尽管实施步骤较多，但每一步都有成熟工具链支持（如LangChain、RLHF库）。对于追求模型对齐质量且预算有限的团队，这无疑是当前最务实的路径之一。

AWS ML2个月前原文

214

AWS生成式AI模型敏捷方案：LLM迁移与升级的完整指南

新上线

在生成式AI的生产部署中，大语言模型（LLM）的迁移与升级始终是一项挑战。AWS近日推出的**生成式AI模型敏捷方案**，为这一问题提供了系统化的解决框架。该方案涵盖工具、方法论和最佳实践，旨在帮助开发者在不同LLM之间高效切换，同时确保提示词（prompt）的转换与优化过程稳健可靠。 ## 为何需要模型敏捷方案？随着开源模型（如Llama、Mistral）和闭源模型（如GPT-4、Claude）的快速迭代，企业常面临模型替换或升级的需求。传统做法往往需要手动调整大量提示词和微调流程，耗时且易出错。AWS的模型敏捷方案通过**标准化协议**，将提示词转换、性能评估和回滚机制整合为自动化流水线，显著降低迁移风险。 ## 核心组件与工作流该方案的核心是一套**提示词转换引擎**，它能够分析原始模型上的提示词模式，并自动生成目标模型兼容的版本。例如，当从Llama 2迁移到Mistral时，引擎会调整格式、角色设定和输出约束，而无需人工逐条修改。此外，方案还集成了**自动回归测试**，通过预设的评估数据集对比迁移前后的输出质量，确保性能不降级。 ## 最佳实践与行业意义 AWS推荐采用**分阶段迁移策略**：先在非关键任务上验证，再逐步扩大范围。同时，建议保留旧模型的快照，以便在出现问题时快速回滚。这一方案不仅适用于模型升级，也可用于多模型混合部署——例如，根据任务复杂度动态选择不同规模的模型，以平衡成本与效果。对于AI团队而言，这意味着更快的迭代速度和更低的试错成本。在LLM生态日益碎片化的今天，AWS的模型敏捷方案为生产环境的模型管理提供了可复用的模板，有望成为生成式AI工程化的重要基石。

AWS ML2个月前原文

215

Sun Finance automates ID extraction and fraud detection with generative AI on AWS

新上线

In this post, we show how Sun Finance used Amazon Bedrock, Amazon Textract, and Amazon Rekognition to build an AI-powered identity verification (IDV) pipeline. The solution improved extraction accuracy from 79.7% to 90.8%, cut per-document costs by 91%, and reduced processing time from up to 20 hours to under 5 seconds. You'll learn how combining specialized OCR with large language model (LLM) structuring outperformed using either tool alone. You'll also learn how to architect a serverless fraud

AWS ML2个月前原文

216

在Amazon SageMaker上释放智能体AI分析力量：Amazon Athena与QuickSight实战指南

新上线

现代企业面临从PB级数据湖中提取可操作洞察的挑战，传统分析依赖SQL、数据建模等专业技能，形成决策瓶颈。本文展示如何利用Amazon QuickSight的智能体AI助手，将数据分析转化为自助服务能力。通过集成Amazon S3、SageMaker、AWS Glue、Athena及QuickSight，构建湖仓一体架构，支持用户以自然语言查询结构化与非结构化数据。基于TPC-H数据集演示，该方案在保持企业级安全与治理的同时，实现数据民主化访问。 ## 核心架构与数据流方案整体设计涵盖以下关键环节： - **数据源与加载**：采用TPC-H基准数据集（托管于公开S3存储桶 `s3://redshift-downloads/TPC-H/2.18/100GB`），通过**Amazon Athena**执行无服务器SQL查询，完成数据提取、转换与加载，并在AWS Glue中创建目录。 - **多格式存储层**：为展示数据湖与湖仓的灵活性，数据以**S3 Table、Iceberg、Parquet**等多种格式保存，Athena可跨格式统一查询。 - **智能分析层**：**Amazon QuickSight**构建仪表盘与对话式AI代理，通过集成知识库（QuickSight Spaces），业务用户可使用自然语言获取洞察，无需技术背景。 ## 行业应用价值该方案适用于零售、金融、医疗、旅游、制造等数据密集型行业，解决以下痛点： 1. **降低技术门槛**：自然语言接口替代复杂SQL，加速决策。 2. **统一数据访问**：湖仓架构整合结构化与非结构化数据，避免数据孤岛。 3. **安全与治理**：基于AWS IAM与QuickSight权限控制，确保企业级合规。 ## 技术亮点 - **无服务器查询**：Athena按需付费，无需管理基础设施。 - **智能体AI**：QuickSight的Agentic AI可理解上下文，支持多轮对话与复杂分析。 - **多格式兼容**：对Iceberg、Parquet等开放格式的支持，便于与现有数据生态集成。 ## 小结通过将**Amazon SageMaker**的机器学习能力与Athena、QuickSight的智能分析结合，企业可构建新一代数据驱动应用。该方案不仅提升分析效率，更将数据洞察能力赋予每一位业务用户，推动组织级数据文化变革。

AWS ML2个月前原文

217

配置 Amazon Bedrock AgentCore Gateway 安全访问私有资源

新上线

Amazon Bedrock 近期推出了 **AgentCore Gateway** 功能，允许 AI 代理安全地访问 VPC 内的私有资源。通过 **Resource Gateway** 这一托管构造，用户可以在 VPC 子网中自动预配弹性网络接口 (ENI)，实现代理与私有端点的直接通信。 ## 两种实现模式 Amazon Bedrock 提供了 **托管模式** 和 **自管理模式** 两种选择。托管模式下，AWS 自动管理 ENI 的生命周期和路由；自管理模式则允许用户对网络路径进行更细粒度的控制，适合需要自定义安全策略的场景。 ## 三个实用场景 ### 1. 连接私有 Amazon API Gateway 通过 AgentCore Gateway，AI 代理可以直接调用部署在 VPC 内的 API Gateway 端点，无需通过公网。这确保了敏感数据不会暴露在公共互联网上，同时保留了 API 的完整功能。 ### 2. 集成 Amazon EKS 上的 MCP 服务器对于运行在 Amazon Elastic Kubernetes Service (EKS) 上的 MCP (Model Context Protocol) 服务器，AgentCore Gateway 提供了安全的内部通信路径。代理可以像访问本地服务一样调用 MCP 服务，适用于需要动态上下文管理的复杂 AI 工作流。 ### 3. 访问其他私有资源该方案还支持连接 RDS 数据库、ElastiCache 等私有服务，扩展了 AI 代理在企业内网中的可用性。 ## 配置要点配置过程涉及定义 Resource Gateway、关联子网、设置安全组规则，并在 Bedrock 代理中指定目标端点。用户需要确保 VPC 路由表正确指向网关，同时安全组允许必要的流量。 ## 行业意义随着企业 AI 应用落地，**数据安全** 和 **合规性** 成为关键挑战。AgentCore Gateway 填补了 AWS AI 服务在私有网络访问方面的空白，使 Bedrock 代理能够无缝集成到现有基础设施中。这对于金融、医疗等受严格监管的行业尤为重要，它们可以在不牺牲安全性的前提下利用 AI 自动化。 ## 小结 Amazon Bedrock AgentCore Gateway 是 AWS 在 AI 安全领域的重要更新，它简化了代理访问私有资源的流程，同时保持了企业级的安全标准。无论是调用内部 API 还是连接 Kubernetes 服务，该功能都提供了灵活且可控的解决方案。

AWS ML2个月前原文

218

PwC 在 AWS 上打造 AI 驱动合同洞察：AIDA 如何将审阅时间缩短 90%

新上线

合同分析长期以来是法务、合规和采购团队的痛点——关键条款深藏在冗长、非结构化的协议中，随着合同量增长，人工检索和解读变得难以规模化。虽然关键词提取和合同管理系统能解决部分问题，但面对复杂法律语言时往往力不从心。普华永道（PwC）推出的 **AIDA（AI-driven Annotation）** 解决方案，基于 AWS 云原生服务，将大语言模型（LLM）与自动化提取流程结合，实现了从合同到结构化洞察的转变。 ### 三大核心能力 AIDA 提供三种关键功能，覆盖从单文档到多文档的合同分析场景： - **模板化提取**：基于预设规则自动抽取关键条款（如赔偿条款、终止条件），用户无需手动扫描全文。 - **文档级对话**：针对单份合同，用户可用自然语言提问（例如“本合同的管辖法律是什么？”），系统返回精准答案并附带原文引用。 - **跨文档全局对话**：在项目内多份合同间进行联合查询，例如“哪些合同包含竞业限制条款？”——这对并购尽职调查或供应商合规审计尤为实用。 ### 架构与安全设计 AIDA 构建在 AWS 之上，核心组件包括： - **Amazon Bedrock** 提供 LLM 推理能力，支持 Claude 等模型，确保复杂法律文本的理解。 - **Amazon S3** 存储原始合同与提取结果，**Amazon DynamoDB** 管理元数据与索引。 - **Amazon Textract** 实现 OCR 与文档解析，将 PDF/扫描件转为可处理文本。 - 安全方面，AIDA 通过 **AWS KMS** 加密、**IAM** 细粒度权限控制以及 **VPC** 隔离，满足企业级合规要求。用户仍须自行配置以满足特定监管义务。 ### 实际效果与行业价值在客户部署中，AIDA **将手动合同审阅时间减少了最高 90%**，显著缩短了审查周期。这不仅释放了法务团队的人力，更使得“延迟审查”不再成为交易瓶颈。对于金融机构、律所、大型企业采购部门而言，这意味着更快的合同签署、更低的合规风险。 ### 局限与展望尽管 AIDA 表现亮眼，但 **LLM 的“幻觉”问题仍需人工复核**——尤其是涉及重大责任条款时，最终判断不应完全交给 AI。PwC 强调，AIDA 定位为“辅助工具”，人类专家仍需对关键输出进行验证。未来，随着多模态模型和 Agent 框架成熟，合同分析有望从“提取”走向“自动谈判建议”甚至“条款修订生成”。 **一句话总结**：AIDA 是 AI 在垂直法律场景的一次扎实落地——不是替代律师，而是让律师从“找条款”中解放出来，专注于更高价值的判断。

AWS ML2个月前原文

219

大规模组织AI Agent记忆：AgentCore Memory中的命名空间设计模式

新上线

在构建AI Agent时，开发者常面临跨会话组织记忆的挑战，导致上下文检索不相关或出现安全漏洞。Amazon Bedrock AgentCore Memory通过**命名空间**（namespace）机制，为长期记忆提供了结构化组织、精确检索和访问控制的能力。本文将深入讲解命名空间的设计模式，帮助你构建高效、安全的记忆系统。 ## 什么是命名空间？命名空间本质上是**层次化路径**，用于组织AgentCore Memory资源中的长期记忆记录。你可以将其类比为文件系统中的目录路径——每个记忆记录都存储在一个命名空间下，例如 `/actor/customer-123/preferences/` 存储用户偏好，`/actor/customer-123/session/session-789/summary/` 存储会话摘要。这种结构支持在任意层级进行检索，而不像传统分区键那样仅支持精确匹配。 ## 设计命名空间的关键考量在设计命名空间层次结构前，需要明确三个核心问题： - **谁需要访问这些记忆？** 是单个用户、一个Agent的所有用户，还是跨Agent共享？ - **需要什么粒度的检索？** 是按会话摘要、跨会话偏好，还是全局规则？ - **隔离边界如何定义？** 一个用户的记忆是否应该对其他用户可见？ ## 检索模式与命名空间策略命名空间支持两种主要检索模式：**精确匹配**和**层次化前缀匹配**。例如，检索 `/actor/customer-123/session/` 下的所有记录，可以获取该用户所有会话记忆；而检索 `/actor/customer-123/` 则能获取该用户的所有记忆（包括偏好和会话摘要）。 ### 常见设计模式 1. **用户隔离模式**：为每个用户分配独立命名空间（如 `/user/{userId}`），确保数据隔离。适合个人助理类Agent。 2. **会话聚合模式**：在用户命名空间下按会话组织（如 `/user/{userId}/session/{sessionId}`），便于跟踪对话历史。 3. **角色/权限模式**：在命名空间中嵌入角色信息（如 `/role/admin/`），结合IAM策略实现细粒度访问控制。 ## 基于IAM的访问控制 AgentCore Memory与AWS IAM深度集成。你可以通过IAM policy限制特定命名空间的读写权限，例如： ```json { "Effect": "Allow", "Action": "bedrock:RetrieveMemory", "Resource": "arn:aws:bedrock:region:account:agent-memory/...", "Condition": { "StringLike": { "bedrock:MemoryNamespace": "/actor/customer-123/*" } } } ``` 这样，即使多个Agent共享同一记忆资源，也能确保每个用户只能访问自己的数据。 ## 最佳实践总结 - **从检索模式出发**：先设计查询需求，再反推命名空间结构。 - **保持层次扁平**：避免过深嵌套，建议不超过5层。 - **预留扩展性**：为未来可能的新维度（如地域、版本）预留命名空间层级。 - **结合IAM最小权限原则**：为每个命名空间路径设置明确的访问边界。通过合理的命名空间设计，AgentCore Memory能够支撑从单用户到企业级的多租户场景，让AI Agent的记忆既准确又安全。

AWS ML2个月前原文

220

构建AI就绪数据：Vanguard虚拟分析师实践之旅

新上线

全球投资管理巨头Vanguard在构建其“虚拟分析师”解决方案时，发现挑战的核心并非机器学习模型本身，而是数据架构。本文深入剖析Vanguard如何通过**八大AI就绪数据原则**，结合AWS服务，打破数据孤岛，让分析师无需编写SQL即可用自然语言查询复杂数据集。从跨团队协作到元数据管理，Vanguard的实践揭示了企业落地对话式AI的关键——先让数据“准备好”迎接AI。 ## 从SQL到自然语言：挑战与转机 Vanguard的金融分析师过去常常需要花费数天时间等待数据团队编写复杂的SQL查询，才能获取决策所需的信息。这种低效的流程不仅拖慢了业务节奏，也限制了分析师深入洞察数据的能力。当团队启动**虚拟分析师（Virtual Analyst）**项目时，他们本以为最大的难点在于选择合适的基础模型，但随着项目推进，一个更根本的问题浮出水面：**数据基础设施尚未为AI做好准备**。最先进的模型也需要扎实的数据基础才能输出可靠结果。Vanguard因此将重心从“优化AI能力”转向“构建AI就绪的数据架构”。这要求数据不仅存储正确，还要具备语义上下文和元数据管理能力，使AI工具能够理解数据背后的业务含义。 ## 八大原则：打造AI就绪数据 Vanguard总结出**八项指导原则**，贯穿数据治理、元数据标准化、访问控制等环节。例如，数据必须具有**明确的语义标签**，让模型能区分“客户资产”与“交易量”等不同概念；同时需要**细粒度的权限管理**，确保AI在生成答案时自动过滤无权访问的数据。这些原则并非纸上谈兵，而是通过AWS的**Glue、Lake Formation、Athena**等服务逐一落地。 ## 跨团队协作：打破孤岛是关键虚拟分析师的成功离不开一个关键因素：**跨团队协作**。Vanguard将数据工程师、业务分析师、合规官、安全团队和业务方拉到同一张桌前。数据工程师负责技术基础设施，业务分析师提供领域知识，合规与安全团队确保数据使用符合监管要求。这种协作模式让数据在源头就具备“AI就绪”属性，而非事后补救。 ## 业务成果与启示经过数月的迭代，虚拟分析师实现了**查询响应时间从天级缩短到分钟级**，分析师无需SQL技能即可自主获取洞察。虽然Vanguard未披露具体投资回报率，但明确表示该方案显著提升了数据民主化水平。对于希望部署类似对话式AI的企业，Vanguard的教训值得借鉴：**不要先选模型再准备数据，而应先打造AI就绪的数据底座**。

AWS ML2个月前原文