在今年的 **Google I/O** 大会上,谷歌描绘了搜索的未来图景:一个由 **AI 代理**驱动、高度个性化且自动化的全新体验。谷歌搜索负责人 **Liz Reid** 表示,用户将能直接在搜索中创建、定制和管理多个 AI 代理,用于处理各种任务——例如设置一个代理来追踪股市趋势,并在条件满足时主动推送提醒。 这一转变的核心是“信息代理”概念:搜索不再只是被动应答,而是能持续为你工作,甚至在你离线时也保持活跃。例如,你可以要求 AI 模式“随时更新我喜欢的运动员发布的联名鞋款”,谷歌便会生成一个专属代理,持续监测相关信息,一旦有新品发布(如 A'ja Wilson 的粉色 Nike),就会推送通知并附带购买链接。该功能将于今年夏天首先面向 **AI Pro 和 Ultra** 订阅用户开放。 此外,谷歌还推出了 **Gemini 3.5 Flash** 作为 AI 模式回答的默认底层模型,并改进了搜索框的响应能力。这些“代理式”体验还包括预订代理等自动化功能,尽管此前类似 Duplex 的项目已停止运营,但谷歌显然在探索更深入的自动化路径。 **行业影响**:这一动向标志着搜索从“信息检索工具”向“任务执行平台”的转型。对于普通用户,这意味着更少的主动操作和更智能的预测服务;但对于依赖搜索流量的网站和广告商,用户与页面的直接交互减少可能带来挑战。同时,隐私与数据安全也成为焦点——代理需要持续访问用户数据才能发挥作用,谷歌如何在便利与信任之间平衡,将是关键考验。
Google 在 I/O 2026 大会上对其 AI 订阅计划进行了重大调整,推出了一款月费 100 美元的“AI Ultra”低价版,同时将完整版 Ultra 计划的价格从 250 美元降至 200 美元。此外,AI Pro 等计划也新增了 YouTube Premium Lite 等福利。 ## 新低价 Ultra 计划:面向开发者和创意人士 新推出的 **AI Ultra(低价版)** 月费 100 美元,主要面向开发者、技术工作者和创意专业人士。该计划包括: - 在 Gemini 应用和 AI 驱动开发工具 **Google Antigravity** 中,使用额度为 AI Pro 计划的 **5 倍** - 优先访问 Google Antigravity - 集成 **Gemini 3.5 Flash**,用于更快速的代码测试和调试 - 20TB 云存储空间 - 包含 **YouTube Premium 个人版**(无广告) ## 完整 Ultra 计划降价 原本月费 250 美元的 **完整版 AI Ultra** 计划现已降至 **200 美元**。该计划提供 Gemini 应用和 Antigravity 中 **20 倍** 的使用额度,以及其他高级功能。 ## 所有计划的新功能 Google 还推出了 **Gemini Spark**,一个可自主执行复杂任务的 AI 代理,目前仅在美国可用。该功能本周向测试者开放,下周将进入 Beta 阶段。 此外,部分 AI Pro 订阅用户将免费获得 **YouTube Premium Lite**,该服务提供无广告观看体验。 ## 如何选择? - **普通用户**:AI Pro 计划性价比高,适合日常使用。 - **开发者/创意人士**:若需更高额度与存储,100 美元的低价 Ultra 计划更划算。 - **重度用户/企业**:完整 Ultra 计划降价后吸引力大增,尤其适合需要极高使用限额的团队。 Google 此次调整意在覆盖更广泛的用户群,同时保持与 OpenAI 等对手的竞争力。
谷歌近日在 AI 开发者平台悄然更新了 Gemini 3.5 Flash 模型,这是继 Gemini 2.5 Flash 之后又一款主打“速度与效率”的轻量级模型。虽然官方尚未大规模宣传,但文档页面已明确列出该模型的关键参数与定价,引发了开发者社区的广泛关注。 ## 核心参数与定价 根据谷歌 AI 开发者文档,**Gemini 3.5 Flash** 在多项基准测试中表现出色,尤其擅长需要快速响应的任务场景。其上下文窗口提升至 **1,048,576 tokens**(约 100 万 token),足以处理长篇文档或复杂对话。输入价格为 **每百万 token 0.35 美元**,输出价格为 **每百万 token 1.05 美元**,相比前代 Gemini 2.5 Flash(输入 0.15 美元、输出 0.60 美元)有所上涨,但考虑到性能提升,性价比依然突出。 ## 性能与适用场景 Gemini 3.5 Flash 在 **MMLU**(大规模多任务语言理解)和 **HumanEval**(代码生成)等基准上均实现了显著进步。它特别适合以下场景: - **实时聊天机器人**:低延迟响应,适合客服、虚拟助手等交互式应用。 - **内容摘要与信息提取**:处理长文档时,能够快速生成结构化摘要。 - **代码辅助**:在代码补全、调试建议等任务中,准确率与速度兼备。 此外,该模型支持多模态输入(文本、图像、音频),但输出仍为文本形式,延续了 Flash 系列的“输入多模态、输出文本”特色。 ## 行业背景与竞争格局 Gemini 3.5 Flash 的推出恰逢大模型“轻量化”浪潮。OpenAI 的 GPT-4o mini、Anthropic 的 Claude 3 Haiku 等竞品同样聚焦低成本、高速度场景。谷歌此举意在巩固其在开发者生态中的地位——通过提供高性价比的 API,吸引更多中小企业和独立开发者使用 Gemini 平台。 值得注意的是,Gemini 3.5 Flash 的定价虽高于自家 2.5 Flash,但依然远低于 Gemini 1.5 Pro 等旗舰模型。这种“分层定价”策略让用户可以根据任务复杂度灵活选择:简单任务用 Flash,复杂推理用 Pro。 ## 开发者反响与未来展望 目前,Gemini 3.5 Flash 已在 Google AI Studio 和 Vertex AI 中可用。早期测试者反馈其生成速度“几乎实时”,且在数学推理和代码生成方面优于 2.5 Flash。不过,也有开发者指出,该模型在处理多轮对话时偶尔会出现“遗忘”早期上下文的问题,但整体表现符合预期。 随着谷歌计划在 2025 年推出更强大的 Gemini 3.5 Pro,Flash 版本作为“轻骑兵”的角色将更加明确——它不追求全能,而是专注于用最低成本完成 80% 的日常任务。对于预算敏感或需要高频调用的应用而言,Gemini 3.5 Flash 无疑是一个值得关注的新选项。
电子垃圾(e-waste)正成为全球增长最快的废弃物流之一。据联合国统计,2022年全球产生了约6200万吨电子垃圾,但只有不到四分之一被妥善回收。大多数电路板最终被粉碎、焚烧或填埋,不仅浪费了宝贵的稀有金属,也失去了其中的可复用元件。 一家名为 **Tuurny** 的初创公司正试图改变这一现状。他们的核心思路很简单:在电路板被送入粉碎机之前,先用机器人将仍可使用的 **RAM 内存芯片** 和其他高价值元件拆解下来。 ## 机器人拆解:精准“拆弹”而非暴力粉碎 Tuurny 的解决方案是一套配备机械臂的自动化拆解系统。机械臂通过视觉识别和机器学习算法,能够定位电路板上的 IC 芯片(如内存颗粒、处理器等),并使用热风枪或精密夹具将其安全取下。与传统回收流程中整板粉碎后再进行化学提炼不同,这种“先拆后碎”的方式可以保留元件的功能完整性,使其能够直接进入二手市场或用于维修。 对于内存芯片而言,这种拆解尤其有价值。因为许多旧设备中的 RAM 模块虽然技术规格落后,但对于工业控制、嵌入式系统或某些特定场景(如老式服务器、ATM机等)来说仍是刚需。从电子垃圾中回收的“遗产芯片”(legacy chips)可以有效缓解供应链短缺问题,同时降低对全新芯片的依赖。 ## 商业模式与经济性 Tuurny 的商业模式是向电子垃圾回收商或大型企业提供拆解服务,或直接出售回收来的二手芯片。据该公司估算,一块典型的 PC 主板上包含价值数美元的可复用芯片,而机器人拆解的成本远低于人工拆解(人工不仅慢,而且容易损坏元件)。随着全球芯片短缺的持续,二手芯片的市场需求正在上升,这为 Tuurny 提供了商业可行性。 不过,该技术目前仍面临挑战:不同品牌、不同年代的电路板布局差异巨大,机器人需要不断学习新的“拆解策略”;此外,部分芯片被胶水或封装材料固定,拆解过程中可能受损。Tuurny 表示正在通过更精细的视觉算法和柔性夹爪来提升成功率。 ## 行业背景与意义 电子垃圾回收长期以来是“粗放型”产业,主要关注贵金属(金、银、铜、钯)的提炼,而忽略了功能元件的再使用。Tuurny 的思路代表了 **“精细化回收”** 的升级方向——将电子垃圾视为一座“城市矿山”,不仅提取原材料,更直接复用其中的“半成品”。 从环保角度看,复用芯片避免了制造新芯片所需的巨大能耗和水资源消耗(制造一枚芯片的碳排放可达其重量的数百倍)。从产业安全角度看,回收遗产芯片有助于减少对特定国家或厂商的供应链依赖。 当然,Tuurny 并非唯一一家探索此方向的初创公司。例如,荷兰的 **Closing the Loop** 和美国的 **ERI** 也在尝试类似技术。但 Tuurny 的差异化在于专注于 **高精度、高价值芯片** 的拆解,而非泛泛的整机回收。 ## 小结 机器人拆解电子垃圾以回收内存芯片,听起来像是一个“古老”的创意,但直到近年 AI 视觉和柔性抓取技术的成熟,才使其具备商业可行性。Tuurny 的尝试如果成功,可能推动整个电子垃圾回收行业从“炼金术”转向“芯片再造”。对于消费者而言,这意味着未来的旧手机、旧电脑或许能“死而复生”,成为另一台设备的零件来源。
ZDNET 于 2026 年 5 月 19 日正式发布“大竞猜”比赛的官方规则。该活动由 Ziff Davis, LLC 主办,面向美国 50 州及哥伦比亚特区年满 18 周岁的合法居民。比赛时间为 2026 年 5 月 19 日东部时间中午 12:01 至 2026 年 9 月 1 日东部时间晚上 11:59。参与者无需购买即可参赛,但需通过 CNET 集团旗下网站完成三轮竞猜问题。每轮问题因站点而异,但题目可重复。每位参与者仅限一次有效提交。 ## 参赛资格与限制 比赛明确排除以下人群:在选拔日期前 9 个月内曾获得主办方任何比赛奖项者;过去 6 个月内受雇于主办方或其关联机构的人员(包括员工、顾问、独立承包商、实习生);以及上述人员的直系亲属(父母、继父母、法定监护人、子女、继子女、兄弟姐妹、继兄弟姐妹、配偶)和同住家庭成员(每年同住至少 3 个月者)。 ## 比赛流程与裁决 参赛者需在比赛期间通过指定网站提交答案。每轮问题的具体内容未在规则中详列,但暗示可能与科技趋势、产品发布或行业预测相关。所有裁决由主办方做出,且为最终决定。 ## 行业背景与意义 此类竞猜活动在科技媒体中常见,旨在提升用户参与度和社区互动。通过预测性问答,主办方不仅能收集用户兴趣数据,还能增强品牌粘性。对于 ZDNET 而言,这可能是其年度内容营销策略的一部分,利用游戏化机制吸引读者关注 AI、云计算等前沿话题。规则中的严格限制(如排除近期获奖者和雇员)体现了合规性,避免法律风险。 总体而言,该比赛规则清晰,流程简单,但核心的竞猜题目和奖品细节有待后续公布。参与者应关注 CNET 集团网站以获取最新信息。
近年来,越来越多的学校在毕业典礼上引入 AI 播报系统,用以自动念出走上台的学生姓名。这项技术本意是为了解决人工播报时可能出现的发音不准、节奏不佳等问题,但实际效果却远未达到预期。最近多场毕业典礼上,AI 播报员频频出错,要么念错名字的发音,要么直接跳过某些学生的姓名,导致现场陷入尴尬,也引发了公众对 AI 在重要仪式上可靠性的质疑。 ### 技术初衷与现实落差 毕业典礼是学生生涯的重要时刻,每位学生都希望自己的名字被准确、庄重地念出。传统上,学校会安排教师或专业播音员担任播报员,但人工播报难免因不熟悉多文化姓氏、紧张或疲劳而出现卡顿或误读。AI 播报系统正是为此而生——通过语音合成和文本转语音技术,理论上可以做到每个名字都发音清晰、节奏一致。 然而,现实却给了这项技术一记响亮的耳光。据媒体报道,在近期几所大学的毕业典礼上,AI 播报系统出现了多种故障:有的名字被错误地重读或音节拆分,有的学生名字直接被系统跳过,导致学生上台后一片寂静,只能尴尬等待。更糟糕的是,系统有时会随机插入不相关的音效或词语,进一步破坏了仪式感。 ### 技术瓶颈:多语言与个性化发音仍是难题 AI 播报的核心挑战在于名字的多样性。美国等多元文化国家的学生姓名往往来自不同语言背景,包含非英语的发音规则、声调甚至特殊字符。虽然现代语音合成模型(如 Tacotron、WaveNet)在标准英语上已接近真人水平,但对于罕见姓氏、非英语拼写或复合名字,模型仍缺乏足够的训练数据,导致发音偏差。 此外,许多 AI 系统依赖文本到语音的映射,但同一拼写在不同语言中可能有截然不同的读法。例如,“Nguyen”在越南语中发音近似“文”,而 AI 可能按英语规则读成“努根”。系统若无法识别姓名来源并调用相应发音库,就极易出错。 ### 学校与学生的反应 面对 AI 播报的失误,学校方面态度不一。部分学校表示将优化系统,增加人工审核环节;也有学校认为 AI 出错概率低于人工,仍将继续使用。但学生们显然不太买账——社交媒体上充斥着对“AI 翻车”的吐槽,有人调侃“连 AI 都读不对我的名字,看来我爸妈起名太有创意了”,更多人则表达了对重要时刻被破坏的失望。 ### 行业展望:AI 需要“人情味” 毕业典礼播报只是 AI 在仪式场景应用的一个缩影。从婚礼司仪到体育赛事解说,AI 语音正试图进入更多需要“人情味”的场合。但当前的技术水平表明,AI 在处理非标准化、高情感价值的信息时仍显笨拙。要解决这一问题,可能需要融合多模态信息(如预先录制学生自己的发音样本)、引入实时人工监督,或者干脆回归人工播报,让 AI 仅作为辅助工具。 无论如何,这次事件给 AI 行业提了个醒:技术不能只追求效率,更要尊重场景的严肃性和个体的独特性。否则,再先进的算法也可能成为尴尬的制造者。
著名 AI 研究员 Andrej Karpathy 已正式加入 Anthropic,负责预训练相关工作。Karpathy 在 X 平台上宣布了这一消息,称“未来几年 LLM 前沿将尤为关键”,并表示非常兴奋能重返研发一线。 Karpathy 本周已开始在 Anthropic 工作,在团队负责人 Nick Joseph 的带领下参与预训练任务。预训练是赋予 Claude 核心知识与能力的关键阶段,也是构建前沿模型中最昂贵、计算最密集的环节之一。Anthropic 发言人透露,Karpathy 将组建一支新团队,专门利用 Claude 来加速预训练研究。 Karpathy 是少数能够打通 LLM 理论与大规模训练实践的顶尖研究者。Anthropic 邀请他组建这样的团队,释放出明确信号:其认为 AI 辅助研究(而非纯算力堆砌)才是与 OpenAI、Google 竞争的关键。 回顾 Karpathy 的职业生涯:他曾是 OpenAI 的创始成员之一,专注于深度学习和计算机视觉,2017 年离开加入特斯拉,领导了全自动驾驶(FSD)和 Autopilot 项目。2022 年离开特斯拉后,他重返 OpenAI 工作一年,2024 年再次离开并创立 Eureka Labs,致力于将 AI 助手应用于教育。虽然 Karpathy 表示仍对教育充满热情,并计划未来继续推进相关项目,但目前 Eureka Labs 进展不明。他还开设了在线课程《神经网络:从零到英雄》,并运营一个定期发布 LLM 和 AI 讲座的 YouTube 频道。 与此同时,Anthropic 还聘请了网络安全资深专家 Chris Rohlf 加入其前沿红队。该团队负责对高级 AI 模型进行压力测试,以应对严重威胁。Rohlf 拥有超过 20 年网络安全经验,曾任职于雅虎著名的“偏执狂”安全团队,并在 Meta 工作六年。他还曾是乔治城大学安全与新兴技术中心的研究员,专注于 CyberAI 项目。 Karpathy 的加入无疑将强化 Anthropic 在预训练领域的技术实力,也预示着 AI 行业人才争夺战进一步升级。
在构建语音代理时,延迟、实时音频管理以及多代理协调是常见挑战。本文介绍了如何利用 **Amazon Nova Sonic**、**Amazon Bedrock AgentCore** 和 **Strands BidiAgent** 来设计可扩展且低延迟的语音代理系统。文章重点探讨了三种主流架构模式:**工具模式**、**代理即工具(子代理)模式** 和 **会话分割模式**,并分析了各自的权衡与最佳实践。 ## 关键组件概览 - **Amazon Nova Sonic**:一种基础模型,支持实时、自然的语音到语音对话,能理解语气并保持流畅交互。 - **Amazon Bedrock AgentCore Runtime**:无服务器托管环境,提供双向 WebSocket 流、微 VM 级会话隔离(避免“吵闹邻居”延迟尖峰)、基于 MCP 协议的共享工具托管以及持久化内存。 - **Strands BidiAgent**:开源框架中的集成类,负责管理双向流生命周期、路由工具调用和处理会话管理,简化与 Nova Sonic 的对接。 ## 三种架构模式详解 ### 1. 工具模式(Tool Pattern) 将功能封装为独立工具,代理通过调用工具执行具体任务。这种模式适合功能明确、调用链简单的场景,易于维护和测试。 ### 2. 代理即工具模式(Agent-as-Tool / Sub-Agent) 将子代理作为工具集成到主代理中。每个子代理拥有独立的提示词、记忆和权限,适合处理复杂子任务(如订单查询、退款处理)。主代理负责路由请求,子代理专注执行,从而降低单个代理的复杂度。 ### 3. 会话分割模式(Session Segmentation) 通过隔离不同会话的提示词、内存和权限,避免上下文污染和权限泄露。AgentCore 的微 VM 隔离天然支持此模式,确保每个会话独立运行,提升安全性与并发性能。 ## 最佳实践:降低延迟 - **使用 WebSocket 流**:避免 HTTP 轮询,减少往返时间。 - **微 VM 隔离**:防止高负载代理影响其他会话。 - **工具预加载**:通过 AgentCore Gateway 共享工具实例,减少冷启动。 - **异步处理**:非关键操作(如日志记录)异步执行,不阻塞对话流。 ## 小结 通过组合这三种模式,团队可以构建出既灵活又高性能的语音代理系统。Amazon Nova Sonic 提供实时语音能力,Bedrock AgentCore 解决托管和隔离问题,Strands BidiAgent 简化集成。对于需要处理复杂工作流的企业,这些设计模式是实现规模化语音交互的关键。
## 当终端遇上记忆:Kiro CLI如何借助Amazon Bedrock实现上下文感知对话 在AI Agent快速迭代的当下,**对话记忆**已成为衡量智能助手成熟度的关键指标。近日,AWS发布了一项技术实践:通过自定义**模型上下文协议(MCP)** 服务器,将**Amazon Bedrock AgentCore Memory**与**Kiro CLI**深度集成,让终端内的AI对话不再“失忆”。 ### 痛点:终端里的“金鱼记忆” Kiro CLI作为一款命令行工具,允许开发者直接与Kiro的AI Agent交互。然而,传统CLI模式下的会话往往是“一次性”的——每次对话都被视为独立事件,无法保留上下文。例如,当用户询问“刚才提到的那个API端点是什么?”时,Agent可能一脸茫然。这种**无状态交互**严重限制了复杂任务链的构建,比如多轮调试、配置迭代或跨会话项目管理。 ### 解法:MCP服务器与托管记忆的联姻 Amazon Bedrock AgentCore Memory是AWS推出的**全托管记忆服务**,专为AI Agent设计。它能够自动存储、检索和更新来自历史对话的关键信息,使Agent具备“长期记忆”。而MCP则是一种标准化协议,用于定义Agent与外部工具或数据源之间的交互方式。 在这套方案中,开发者需要做的是: 1. **构建一个自定义MCP服务器**,作为Kiro CLI与Bedrock AgentCore Memory之间的桥梁。 2. 在MCP服务器中实现**记忆读写接口**,将Kiro CLI生成的对话内容同步至Bedrock的托管记忆存储。 3. 当新对话开始时,Agent通过MCP服务器自动检索相关历史记忆,实现上下文延续。 ### 落地价值:从“单次问答”到“持续协作” 集成后,Kiro CLI的使用体验将发生本质变化: - **跨会话连贯性**:用户可以在不同时间点继续同一话题,Agent能准确引用之前的结论或代码片段。 - **任务断点续传**:若调试过程中终端意外关闭,重新启动后Agent仍能“记住”之前的错误日志和修复步骤。 - **个性化适应**:Agent能根据用户长期的使用习惯(如偏好某种代码风格、常用命令组合)给出更贴切的建议。 ### 行业视角:记忆是Agent走向“智能体”的必由之路 当前,AI Agent正从“工具调用者”向“自主工作者”演进,而**持久化记忆**正是这一跃迁的核心基础设施。无论是OpenAI的Assistants API中的线程机制,还是LangChain的记忆模块,业界都在试图解决同一个问题:如何让AI在长时间跨度内保持一致的“人格”与知识状态。 AWS此次通过MCP协议将托管记忆能力开放给Kiro CLI,本质上是在**降低记忆功能的集成门槛**——开发者无需自建向量数据库或管理会话状态,即可为命令行工具赋予企业级的记忆能力。这对于运维自动化、DevOps流水线、以及需要长期上下文支持的开发辅助场景,具有显著的实际意义。 ### 总结 Kiro CLI + Amazon Bedrock AgentCore Memory的组合,展示了**托管服务+标准化协议**在AI工程化中的典型应用模式。对于追求高效与智能的开发者而言,让终端记住每一次对话,或许就是下一轮生产力提升的起点。
亚马逊云科技今日宣布,**SageMaker Python SDK v3.8.0** 为 SageMaker Feature Store 带来三项新能力,旨在帮助数据科学家和工程师更高效地构建、管理和使用机器学习特征管道。这些新功能聚焦于简化特征工程工作流、增强数据治理以及提升查询性能。 ### 新能力一:与 AWS Lake Formation 集成,强化数据治理 第一项新能力是 **SageMaker Feature Store 与 AWS Lake Formation 的深度集成**。通过这一集成,用户可以在特征组(Feature Group)级别应用细粒度的访问控制策略。Lake Formation 提供基于属性的访问控制(ABAC)和行级安全,使得团队能够安全地共享特征数据,同时遵守合规要求。例如,数据管理员可以设定规则,仅允许特定用户或角色访问包含敏感信息的特征列,而其他列则对更广泛的团队开放。 ### 新能力二:支持 Apache Iceberg 表属性,优化存储与查询 第二项能力是 **SageMaker Feature Store 现在支持 Apache Iceberg 表属性**。Iceberg 是一种开源表格式,专为大规模数据分析设计,支持 ACID 事务、快照和模式演进。通过在 Feature Store 中启用 Iceberg 表属性,用户可以享受以下好处: - **更快的查询性能**:Iceberg 的分区修剪和列式存储优化可显著减少扫描数据量。 - **时间旅行查询**:能够回溯到特定时间点的特征数据版本,便于模型调试和重现。 - **自动表维护**:Iceberg 的压缩和清理机制减少了存储成本并提高了查询效率。 ### 新能力三:增强的 Python SDK 功能,简化开发体验 第三项新能力体现在 **SageMaker Python SDK v3.8.0 的更新**,包括更简洁的 API、更好的错误处理以及更丰富的文档。例如,现在可以通过更少的代码行创建和管理特征组,并直接与 Iceberg 表交互。此外,SDK 还支持将特征数据直接写入 S3 中的 Iceberg 格式,无需额外配置。 ### 实际应用场景与价值 这些新能力对机器学习团队意味着什么?以金融风控场景为例,特征工程团队需要频繁更新欺诈检测模型的特征,同时确保敏感客户数据不被滥用。通过 Lake Formation 集成,可以轻松定义哪些分析师能访问哪些特征;而 Iceberg 支持则让历史特征回滚变得简单,便于模型审计。 对于希望快速上手的用户,亚马逊云科技提供了 **完整的端到端示例笔记本**(位于 SageMaker Python SDK 仓库中),涵盖 Lake Formation 治理配置和 Iceberg 表属性设置。开发者可以直接克隆这些笔记本,在自己的 AWS 环境中进行测试。 ### 小结 此次更新标志着 **SageMaker Feature Store 在数据治理和性能优化上迈出重要一步**。随着机器学习模型对特征质量和时效性的要求日益提高,这些工具能帮助团队减少基础设施管理负担,将更多精力投入到特征创新和模型迭代中。建议用户升级到最新 SDK,并参考官方笔记本探索新功能。
在 AI 应用开发中,让大语言模型(LLM)能够自主调用外部工具是释放其能力的关键。Amazon Bedrock 近期推出的编程式工具调用(Programmatic Tool Calling, PTC)功能,正为开发者提供了一条更灵活、可控的路径。本文将通过三种实现方式,展示如何利用 PTC 构建可执行代码的 AI 代理。 ## 什么是编程式工具调用? 传统的工具调用中,模型仅返回工具名称和参数,由应用层负责执行。而 **PTC 允许模型直接生成可执行的代码片段(如 Python 脚本)**,并在安全沙箱中运行,从而实现更复杂的逻辑,比如数据处理、API 调用链或动态决策。 ## 三种实现路径对比 ### 1. 自托管 Docker 沙箱(ECS) - **适用场景**:需要完全控制执行环境、网络策略或使用自定义运行时。 - **实现方式**:在 Amazon ECS 上部署 Docker 容器作为沙箱,通过 Bedrock 的响应触发容器内的代码执行。 - **优势**:最大灵活性,可集成私有库、GPU 资源等。 - **代价**:需自行维护基础设施,处理安全隔离和扩缩容。 ### 2. 托管解决方案(Bedrock AgentCore Code Interpreter) - **适用场景**:希望快速集成,无需管理底层环境。 - **实现方式**:直接使用 Bedrock 内置的 **AgentCore Code Interpreter**,模型生成的代码在 AWS 托管的沙箱中自动执行。 - **优势**:零运维,自动安全隔离,支持 Python 标准库。 - **限制**:无法安装第三方包或访问外部网络(默认配置)。 ### 3. Anthropic SDK 兼容代理 - **适用场景**:团队已使用 Anthropic SDK(如 Claude API),希望迁移到 Bedrock 但保持开发体验一致。 - **实现方式**:通过一个轻量级代理层,将 Bedrock 的 PTC 响应转换为 Anthropic SDK 格式,使得现有代码无需大改即可接入。 - **优势**:降低迁移成本,复用已有工具链。 - **注意**:代理层需自行维护,可能引入额外延迟。 ## 实践建议与思考 从行业趋势看,**PTC 正在模糊“模型”与“应用”的边界**。过去,LLM 仅作为推理引擎,现在它开始直接操控计算资源。这种转变对安全性和可观测性提出了更高要求: - **安全隔离**:无论采用哪种方式,代码执行环境必须与生产环境隔离。Docker 沙箱或托管解释器都应限制文件系统、网络和系统调用。 - **错误处理**:模型生成的代码可能出错,需设计重试、回退或人工审核机制。 - **成本控制**:代码执行消耗算力,尤其是长时间运行的任务,建议设置超时限制。 对于大多数团队,**推荐从托管 Code Interpreter 开始**,快速验证 PTC 在业务场景中的价值。当需求超出托管环境的能力(如需要 GPU 或私有包)时,再迁移到自托管方案。而 Anthropic 兼容代理更适合已有深度绑定 Anthropic 生态的团队。 ## 小结 Amazon Bedrock 的 PTC 功能为 AI 代理的开发提供了更多选择。从自托管到托管,再到兼容代理,开发者可以根据安全、成本和运维偏好灵活设计架构。随着 LLM 编码能力的提升,这种“模型即执行者”的模式将成为构建智能应用的重要范式。
AI 社区迎来一则重磅消息:著名人工智能科学家、前 OpenAI 联合创始人及特斯拉 AI 高级总监 **Andrej Karpathy** 在 X(原 Twitter)上宣布,他已正式加入 AI 初创公司 **Anthropic**。这一动态迅速引发行业热议,被视为 Anthropic 在 AI 人才争夺战中取得的标志性胜利。 ## 从 OpenAI 到特斯拉再到 Anthropic:一位 AI 领袖的轨迹 Karpathy 在 AI 领域履历耀眼。他曾在 **OpenAI** 担任研究科学家,是 GPT-2 等早期大模型项目的核心贡献者;随后加入特斯拉,领导 **Autopilot 计算机视觉团队**,推动自动驾驶技术落地。2023 年,他短暂重返 OpenAI,但数月后再度离开,此次加入 Anthropic 意味着他将与 OpenAI 前同事兼竞争对手正面交锋。 ## Anthropic 的“人才磁铁”效应 Anthropic 由前 OpenAI 研究高管 **Dario Amodei** 和 **Daniela Amodei** 于 2021 年创立,以“安全 AI”为核心理念,致力于构建可靠、可解释的 AI 系统。公司旗下模型 **Claude** 系列在安全性和诚实性上独树一帜。Karpathy 的加入进一步强化了 Anthropic 的研究实力,尤其在 **深度学习、大规模模型训练** 及 **AI 对齐** 等方向。 行业观察人士指出,Anthropic 正通过吸纳顶尖人才来缩小与 OpenAI 的差距。此前,公司已从谷歌、DeepMind 等机构挖来多位高级研究员,而 Karpathy 的加盟无疑将提升其在大模型竞赛中的话语权。 ## 对 AI 格局的潜在影响 Karpathy 的转会可能从三方面重塑行业: - **研究路线**:Karpathy 在计算机视觉和多模态学习上的经验,或将推动 Claude 模型向更丰富的感知能力扩展,挑战 GPT-4V 等竞品。 - **人才流动**:作为 AI 社区的“顶流”,Karpathy 的选择可能引发更多人才向 Anthropic 倾斜,改变硅谷 AI 人才分布。 - **安全 vs 效率**:Anthropic 强调 AI 安全优先,Karpathy 的加入可能促使业界更重视模型的可控性与伦理约束,而非单纯追求性能提升。 ## 结语 Karpathy 在声明中表示:“Anthropic 在构建安全、有益 AI 方面的承诺与我的价值观高度契合。” 这一表态暗示,未来 AI 行业的竞争不仅是技术之争,更是理念与安全标准之争。随着 Karpathy 的加入,Anthropic 与 OpenAI 之间的对抗将更加激烈,而整个 AI 社区或将迎来更注重安全与对齐的新阶段。
两位前OpenAI员工与多家AI安全非营利组织联合致信投资者,警告称埃隆·马斯克的AI实验室xAI的安全记录不佳,可能成为SpaceX史上最大IPO的“未定价风险”。 ## 核心警告:xAI的安全隐患 信中指出,xAI在安全实践方面“几乎全面落后”于OpenAI、Google DeepMind和Anthropic等前沿AI开发者。联合签署人、前OpenAI政策顾问Page Hedley在采访中直言,xAI的安全记录是行业最差的。这种状况可能导致SpaceX面临更高的监管和诉讼风险,从而影响其估值和IPO进程。 ## 要求披露关键信息 信件要求SpaceX向投资者披露以下内容: - xAI是否计划继续开发前沿AI模型。 - 如果继续,必须发布公开的安全与治理计划。 - 近期SpaceX将大量GPU产能出售给Anthropic的交易,使得xAI在母公司内的定位变得模糊——它是否仍是前沿AI竞争者,还是沦为基础设施提供者? ## 行业背景与影响 SpaceX以约**750亿美元**估值筹备IPO,此前以超**1万亿美元**的私有估值收购了xAI。马斯克曾宣称要将数据中心发射到太空为AI服务,但安全倡导者认为,这种激进策略可能掩盖了xAI在安全实践上的系统性缺陷。 新的AI安全监管组织**Guidelight AI Standards**(由前OpenAI安全研究员Steven Adler和Hedley联合创立)是信件的主要签署方之一。该组织获得私人捐助者支持,旨在推动前沿AI公司的安全标准提升。其他签署方包括Legal Advocates for Safe Science and Technology、Encode AI和The Midas Project。 ## 结论 这封信凸显了AI安全在资本市场的分量——当一家AI公司被并入即将IPO的实体时,其安全实践不再是内部技术问题,而是直接影响投资者信心的财务风险。SpaceX和xAI尚未回应置评请求,但投资者显然需要更多透明度。
一项要求社交网络快速删除性深度伪造及其他非自愿色情内容的法律现已全面生效。但专家警告,该政策可能对受害者帮助甚微,最坏情况下甚至可能助长网络审查。去年5月,总统特朗普签署了《Take It Down Act》,旨在应对非自愿私密影像(NCII)。该法立即将传播NCII(无论是真实还是AI生成的内容)定为犯罪,许多州已至少部分实施。但其同名的移除条款更为广泛——自2026年5月19日起,要求在线平台在48小时内移除NCII,否则面临罚款。联邦贸易委员会主席Andrew Ferguson在截止日期前致函十几家科技公司,包括亚马逊、Alphabet、苹果、Meta、微软、TikTok等。FTC要求平台提供便捷的移除请求流程,并在48小时内删除违规内容及任何“已知的相同副本”。违规每次可能面临超过5.3万美元的民事罚款。Meta、微软、谷歌、TikTok和Snap等主要平台支持该法案,并表示有信心遵守。但专家指出,法律对“亲密影像”的定义可能过于宽泛,且缺乏对虚假举报的惩罚,可能被滥用于压制合法言论。此外,许多受害者面临举报流程复杂、二次伤害等问题。该法案的实际效果仍有待观察。
美国最大电力公司 NextEra Energy 与第六大公司 Dominion 的拟议合并,不仅是资本市场的重磅交易,更折射出数据中心需求激增如何重塑整个电力行业。这笔价值 **670亿美元** 的并购案,将缔造一个在发电总量、天然气发电和可再生能源领域均占据领先地位的超级企业。然而,消费者权益倡导者和分析师警告,合并后的巨无霸可能对消费者和环境产生负面影响。 ## 数据中心:合并的核心驱动力 此次合并的关键在于 Dominion 的战略位置——它正是 **北弗吉尼亚** 的本地电力供应商,而该地区拥有全球最密集的数据中心集群。随着 AI 和云计算爆发,数据中心用电需求急剧攀升,NextEra 希望通过收购 Dominion 快速切入这一高增长赛道。Morningstar 股票分析师 Andrew Bischof 指出,这笔交易让 NextEra 能利用 Dominion 的专长和关系“加速其数据中心中心枢纽计划”,此前 NextEra 在监管同行中已落后。 ## 监管与消费者权益的隐忧 哈佛法学院电力法倡议主任 Ari Peskoe 直言:“合并是为了股东,而非消费者。” Dominion 股东将以溢价出售股份,高管也将因促成交易获得巨额回报,而“费率支付者都是事后才想到的”。合并后的公司市值仅次于埃克森美孚和雪佛龙,其巨大的财务和政治影响力将使有效监管变得异常困难。 ## 交易细节与未来走向 根据周一公布的提案,合并后的公司沿用 NextEra Energy 名称,由 NextEra CEO John W. Ketchum 领导。交易尚需州和联邦监管批准。对于普通家庭和企业而言,这意味着电价可能上涨:垄断性电力公司往往将数据中心基础设施成本转嫁给用户,而缺乏竞争的市场结构进一步削弱了消费者的议价能力。 ## 行业变局:AI 时代的能源博弈 这笔交易标志着电力公用事业进入新阶段:数据中心的能源需求正从技术问题演变为战略资产。NextEra 与 Dominion 的联姻,本质上是对未来计算基础设施控制权的争夺。但正如批评者所担忧的,当一家公司同时掌握发电、电网和数据中心资源时,如何在效率与公平之间取得平衡,将成为监管机构面临的严峻考验。
微软最新推出的第12代 Surface Pro 商用版,凭借 5G 连接、英特尔最新处理器和卓越屏幕,再次巩固了其在高端便携二合一设备领域的领先地位。本文基于实际测试,深入分析这款设备的升级亮点、行业定位及对企业用户的实际价值。 ## 核心升级:5G 与性能齐头并进 第12代 Surface Pro 商用版最引人注目的变化是**首次加入 5G 蜂窝网络支持**。对于经常出差、需要在移动中保持高效工作的商务人士而言,这一升级意味着不再依赖不稳定的公共 Wi-Fi,随时随地获得高速网络连接。此外,设备搭载了**英特尔最新的 Series 3 处理器**,在性能与功耗之间取得了更好的平衡,足以应对日常办公、视频会议和多任务处理。 屏幕方面,微软延续了 Surface 系列一贯的高标准。13英寸 PixelSense 显示屏不仅色彩精准、亮度充足,还**内置了隐私屏幕功能**,可限制侧面视角,有效防止在公共场合泄露敏感信息——这一点对企业用户尤其重要。 ## 使用体验:轻薄机身,全能表现 在实际使用中,Surface Pro 商用版保持了系列标志性的轻薄设计,**重量仅约 900 克**,搭配可调节支架和键盘盖,可在笔记本和平板模式间无缝切换。5G 连接的实际体验令人满意,下载大文件、视频会议均无明显延迟。配合 Windows 11 的**高级触觉反馈**支持,触控笔书写和触控操作更加自然精准。 续航方面,官方宣称可达 15 小时,实测在混合使用场景下(网页浏览、文档编辑、视频播放)约 12-13 小时,足以覆盖一个工作日。 ## 行业视角:企业移动办公的新标杆 从 AI 行业趋势来看,**5G 与边缘计算的结合正在重塑企业办公模式**。Surface Pro 商用版凭借 5G 连接,可更高效地接入云端 AI 服务,例如实时语音转写、智能文档翻译等,而无需本地部署高功耗硬件。同时,英特尔 Series 3 处理器集成的 AI 加速单元,也能在本地运行轻量级 AI 模型,如背景虚化、智能降噪等,提升视频会议体验。 与同类产品相比,Surface Pro 商用版在**安全性、可管理性和生态整合**上具有优势。它预装 Windows 11 Pro,支持 BitLocker 加密、Windows Hello 面部识别,并可通过 Microsoft Intune 进行集中管理,满足企业对数据安全和 IT 部署的严格要求。 ## 小结 第12代 Surface Pro 商用版并非革命性产品,但它通过**5G 连接、隐私屏幕和最新处理器**等务实升级,补齐了此前企业用户最关心的短板。对于追求移动生产力、注重数据安全且预算充足的企业用户来说,这可能是目前最值得考虑的 Windows 二合一设备。
## 现代网络犯罪:从散兵游勇到工业化军团 HPE 威胁实验室最新发布的《In the Wild 报告》指出,2025 年网络犯罪正经历一场深刻的工业化变革。攻击者不再是小作坊式的个体或松散团伙,而是采用**自动化工具、AI 技术以及企业级层级管理**,实现了规模化、快速化和结构化的攻击行动。 ### 五大因素塑造当今网络安全格局 报告认为,当前动态的网络安全环境由五个关键因素驱动,它们相互交织,共同构成了企业面临的复杂挑战: 1. **日益增长的网络依赖与期望**:企业数字化转型深入,网络承载的设备、人员和业务量激增。用户期望网络随时可用、性能稳定,但往往缺乏足够的安全意识,成为攻击链中最薄弱的环节。 2. **漏洞利用的工业化**:攻击者普遍使用自动化脚本和 AI 辅助工具,针对那些长期存在、但未被修补的漏洞发起攻击。这种“规模化狩猎”方式大大降低了攻击成本,提高了成功率。 3. **攻击者的企业化组织**:许多犯罪团伙模仿合法公司,设立了 CEO、HR、研发等部门,分工明确,甚至实行 KPI 考核。这种结构提升了攻击效率,也使得追踪和打击更加困难。 4. **内部与外部威胁的交织**:内部威胁(如员工失误、恶意内部人员)与外部攻击(如勒索软件、供应链攻击)相互叠加,使得防御策略必须同时兼顾“人”和“技术”两个维度。 5. **监管与合规压力**:全球各地数据保护法规日趋严格,企业在满足合规要求的同时,还需应对不断演变的攻击手法,这对安全团队提出了更高要求。 ### 企业的应对之道 面对这种“工业化”的对手,企业不能仅靠单点产品应对。HPE 建议采取**深度防御与主动威胁狩猎**相结合的策略: - **持续暴露管理**:定期扫描并修复已知漏洞,缩小攻击面。 - **AI 驱动的威胁检测**:利用机器学习识别异常行为,在攻击造成实质损害前进行拦截。 - **员工安全意识培训**:将“人”作为安全体系的关键一环,降低钓鱼攻击成功率。 - **分层安全架构**:在网络、端点、应用和数据层分别部署防护,形成纵深防御。 ### 小结 网络犯罪的工业化是 2025 年最显著的趋势之一。企业必须认识到,传统的被动防御已经失效,只有采用同样具备“工业化”能力的智能安全体系,才能在这场不对等的对抗中占据主动。
摩尔定律是否已死?这是半导体行业多年来争论不休的话题。但比利时微电子研究中心(Imec)的最新预测给出了一个明确的答案:**摩尔定律将以新的形式继续演进,至少在未来15年内仍有路可走**。 ## 从FinFET到CFET:晶体管结构的革命 Imec认为,我们正处在晶体管技术的关键转折点。目前主流的FinFET结构将在未来几年内被**全环绕栅极(GAA)**技术取代,而更远期的目标是**互补场效应晶体管(CFET)**。CFET将n型和p型晶体管垂直堆叠,极大提升集成密度。 根据Imec的路线图,**2028年**左右,3纳米节点之后,GAA将全面铺开;而到**2032年前后**,CFET有望进入量产。这意味着,从今天算起,我们离下一代晶体管架构的成熟还有大约7年时间。 ## 关键挑战:互连与功耗 随着晶体管尺寸逼近原子尺度,互连延迟和功耗成为比晶体管开关速度更棘手的瓶颈。Imec指出,**背面供电网络(BSPD)**和**新型互连材料**(如钌或钴)将成为突破方向。此外,**高数值孔径(High-NA)极紫外光刻**技术被视作实现更小线宽的关键工具,ASML已开始交付首批High-NA EUV光刻机。 ## 摩尔定律的新定义:从“缩微”到“系统集成” 传统摩尔定律强调晶体管数量的翻倍,但Imec认为,未来摩尔定律的驱动力将更多来自**3D堆叠、异构集成和专用加速器**。例如,将逻辑芯片与存储芯片、传感器甚至光子器件垂直集成,可以在不依赖极端线宽的情况下提升性能。这种“超越摩尔”的思路,实际上是将系统级优化纳入摩尔定律的范畴。 ## 对AI与计算产业的启示 对于AI芯片而言,这一路线图意义重大。当前大模型训练和推理对算力的需求呈指数级增长,而传统工艺微缩带来的性能增益正在放缓。Imec的预测表明,**未来AI芯片的竞争将更多体现在先进封装和架构创新上**,而非单纯依赖制程节点。台积电、三星和英特尔都在积极布局3D封装技术,这与Imec的路线图方向一致。 ## 小结 Imec的15年预测并非宣告摩尔定律的终结,而是描绘了一个更复杂、更多维的演进路径。从FinFET到CFET,从平面到3D,从单一缩微到系统集成,**半导体产业正进入一个“多重创新”时代**。对于从业者而言,关注晶体管结构变化的同时,更需留意互连、封装和材料领域的突破——这些才是决定未来15年算力增长的关键变量。
## 概述 来自德州仪器(Texas Instruments)的AI总监Antoine Zambelli近日开源了**Forge**,这是一个专为自托管LLM工具调用设计的可靠性层。Forge通过一系列护栏机制(guardrails)和上下文管理策略,显著提升了小型本地模型在复杂智能体工作流中的表现。据项目介绍,结合Ministral-3 8B Instruct Q8模型和llama-server后端,Forge在26个场景的评估套件中取得了**86.5%**的平均成功率,在最高难度层级上也能达到**76%**——而未经优化的同模型基线仅为53%左右。 ## 核心能力 Forge的核心思路是**用工程手段弥补模型能力的不足**。它通过以下机制提升可靠性: - **救援解析(Rescue Parsing)**:当模型输出格式错误或无法解析时,自动尝试纠正或重试。 - **重试提示(Retry Nudges)**:在模型偏离轨道时给出温和的引导提示,帮助其回到正确路径。 - **步骤强制(Step Enforcement)**:确保智能体按预定顺序执行必要步骤,避免跳过关键操作。 - **错误恢复(Error Recovery)**:在工具调用失败或上下文溢出时,自动进行恢复处理。 - **VRAM感知上下文管理**:通过分层压缩(Tiered Compaction)和预算控制,在显存受限环境下维持长上下文能力。 ## 四种使用方式 Forge提供了灵活的使用模式,适应不同开发需求: 1. **WorkflowRunner**:定义工具集、选择后端,运行结构化智能体循环。Forge管理完整生命周期:系统提示、工具执行、上下文压缩和护栏机制。 2. **SlotWorker**:通过优先级队列实现共享推理槽的访问,支持自动抢占——适合多智能体架构中多个专业工作流共享GPU的场景。 3. **护栏中间件(Guardrails Middleware)**:将Forge的可靠性栈作为可组合中间件集成到自己的编排循环中。开发者控制循环,Forge负责验证响应、纠正格式错误的工具调用、强制必需步骤。 4. **代理服务器(Proxy Server)**:运行`python -m forge.proxy`启动一个兼容OpenAI API的代理服务器,透明地插入在客户端(如opencode、Continue、aider)和本地模型服务器之间。客户端会感觉模型“变聪明了”。 ## 技术亮点 Forge的设计充分考虑了**实际部署的痛点**。例如,在上下文管理方面,它采用VRAM感知的分层压缩策略:当上下文接近显存上限时,自动对早期对话进行压缩保留关键信息,同时丢弃冗余细节。这种机制使得8B模型也能处理需要多轮交互的复杂任务。 评估方面,Forge构建了包含26个场景的测试套件,覆盖从简单工具调用到多步骤推理的各种难度。当前最佳配置(Ministral-3 8B Instruct Q8 + llama-server)得分86.5%,而未经护栏的基线模型仅为53%左右,改进幅度超过30个百分点。 ## 部署与兼容性 Forge要求**Python 3.12+**,支持多种后端: - **llama-server(推荐)**:在评估中表现最佳,建议使用Q8量化版本。 - **Ollama**:设置更简单,但高难度任务性能稍弱。 - **Anthropic API**:无需本地GPU,适合快速原型验证。 安装方式:`pip install forge-guardrails`(核心版)或`pip install "forge-guardrails[anthropic]"`(含Anthropic支持)。 ## 行业意义 Forge的出现反映了AI工程领域的一个重要趋势:**在模型规模与部署成本之间寻找平衡点**。8B模型虽然能力有限,但通过精心的工程加固,可以在特定智能体任务中接近甚至媲美更大模型的表现。这对于资源受限的企业和开发者而言,意味着更低的硬件门槛和更可控的部署成本。 同时,Forge的模块化设计(中间件、代理服务器等)也降低了集成门槛——开发者无需重写整个框架,即可将护栏能力嵌入现有系统。这种“增量式改进”的思路,或许比等待模型本身的飞跃更具现实可行性。 ## 小结 Forge是一个**务实且高效**的开源项目,它不追求模型能力的突破,而是通过系统化的工程手段解决小模型在智能体任务中的可靠性问题。对于正在构建或维护本地AI代理工作流的团队,Forge提供了一套立即可用的工具箱。
## 马斯克诉OpenAI案败诉:一场关于“非营利”的时间之战 埃隆·马斯克对OpenAI的诉讼近日以败诉告终。**陪审团认定马斯克起诉过晚,其主张被诉讼时效限制所禁止**。核心争议在于OpenAI何时开始向营利结构转型:公司方称早在2017年已有迹象,马斯克则声称直到2022年才知晓。尽管此案未对OpenAI是否违反非营利使命做出实质裁决,但围绕其公司结构的法律攻防远未结束。 ## 战场上的智能眼镜:Anduril与Meta联手打造军用AR头显 国防科技公司Anduril披露了与Meta合作开发的军用增强现实头显新细节。**该设备可通过眼动追踪和语音指令实现无人机打击调度**。项目负责人、前陆军特种作战司令部成员Quay Barnett表示,目标是优化“作为武器系统的人类”。这引发了对智能眼镜如何改变战争形态的深度思考。 ## Google I/O 2024:在不利格局中寻求突破 Google年度开发者大会I/O本周开幕,但**其在基础模型竞赛中已明显落后于Anthropic和OpenAI**。模型声誉如今主要取决于编码能力,而Google的编码工具数月来被Claude Code和Codex压制。不过,Google在AI for Science等前沿领域仍有优势。本次大会将有三大看点值得密切关注。 ## AI能否学会理解世界? 随着大语言模型局限性的凸显,研究人员正探索新的方向,让AI真正理解物理世界。这或许是下一代AI突破的关键。