AI 资讯

每日聚合最新人工智能动态

1681

安卓手机即将能识别假冒来电和深度伪造诈骗

新上线

谷歌在6月的安卓功能更新中，推出了针对深度伪造电话诈骗的自动防护功能。这项新功能主要针对“冒充诈骗”——根据FTC数据，2024年美国这类诈骗造成的损失接近30亿美元。随着AI语音克隆工具的进步，骗子更容易模仿熟人的声音和号码进行诈骗。谷歌的解决方案基于其此前为金融电话验证推出的系统，现在扩展到所有联系人。当来电显示为联系人时，手机会通过Google Phone、Google Messages和Google通讯录三款应用协同验证。具体机制是：骗子通常使用在线中继来伪造号码，而真正的来电会包含一个来自Google拨号应用的确认信号。如果该信号缺失，系统会通过Messages向被冒充的联系人发送一个经过认证的RCS消息，确认其是否正在拨打该电话。若对方回复未拨打电话，则判定为诈骗。该功能适用于Android 12及以上设备，但需要安装谷歌的三款通讯应用。Pixel和摩托罗拉手机预装这些应用，三星也已全面转向Google Messages。不过，由于三星自有拨号应用用户众多，实际覆盖范围可能受限。此外，本次更新还包括其他功能：类似AirDrop的快速分享改进、更多AI集成等。谷歌正通过系统级防护应对AI诈骗威胁，但用户仍需保持警惕，因为技术手段并非万能。

Ars Technica25天前原文

1682

微软 Scout 上线：永不掉线的 AI 同事，帮你搞定无聊的办公室杂务

新上线

在微软 Build 开发者大会上，微软正式推出 **Scout**，一个基于 Teams 的始终在线 AI 代理。Scout 可以访问你的工作消息、日历和邮件，自动执行任务、重新安排冲突的会议、起草专业的回复。它本质上是企业版的 OpenClaw，专为办公室白领设计，你可以像对待人类同事一样在 Teams 中直接给它发指令。 Scout 是微软“代理优先”转型的一部分，旨在自动化知识工作者的软件使用方式。微软企业副总裁 Omar Shahine 表示：“Scout 就像一个私人助理，你下班了它还在工作。”当你闲聊休息时，Scout 会忙着为下周全员会议锁定时间、基于最新消息生成发言要点。目前 Scout 已面向小部分客户开放，并计划扩大范围。除了 Teams 集成，微软还测试一款桌面应用，今日起面向选择“前沿”功能访问权限的订阅者推出，但需同时拥有 GitHub Copilot 订阅。用户可设置目标和偏好，让 Scout 主动分配任务。例如，Shahine 告诉 Scout 永远保护家庭晚餐时间，因此当会议被安排在晚餐时段时，代理会自动标记并向同事建议重新安排。Scout 还能根据邮件和消息创建承诺清单，发送提醒并起草跟进计划。当然，早期版本可能会有些粗糙。

WIRED AI25天前原文

1683

微软 Scout 全新 AI 个人助理登场：基于 OpenClaw 构建，比 Copilot 更强大

新上线

微软在 Build 2026 大会上正式推出 **Microsoft Scout**，这是一款基于 OpenClaw 构建的 **始终在线 AI 个人助理**，不同于现有的 Copilot，Scout 能够主动监控日历、交通、邮件和 Teams 对话，为用户提供日程建议、费用报告、邮件草稿等全方位协助。 ## 什么是 Scout？ Scout 被微软称为“首款真正的个人助理”。它与 Microsoft 365 深度集成，但能力远不止于聊天。Scout 可以 **主动打电话提醒用户出发时间**，根据实时路况和日程安排建议最佳出门时机，还能在后台阅读 Teams 线程和邮件，自动提炼重要事项。 ## 与 Copilot 有何不同？ | 特性 | Copilot | Scout | |------|---------|-------| | 交互方式 | 被动聊天 | 主动通知与通话 | | 感知范围 | 当前文档/应用 | 日历、交通、邮件、Teams | | 运行模式 | 应用内嵌入 | 桌面客户端 + 云端始终在线 | Scout 更像一位 **真人助理**，不仅回答问题，还会主动“操心”你的日程与任务。 ## 当前进展与未来计划 - 本周起向美国 **Frontier 客户** 提供桌面预览版 - 未来几个月将推出更广泛的云版本 - 内部已有 **3000 多名微软员工** 在使用，用于安排会议、预订旅行、填写表单等微软高管 Omar Shahine 表示：“很多人用它成为更好的自己——我们都有想达成的目标，但常常没时间去做，Scout 帮你找回时间。” ## 行业意义 Scout 的推出标志着 AI 助手从“被动响应”走向“主动服务”。在 Google 推出类似 OpenClaw 助手的背景下，微软希望借助 Scout 在 **企业级个人助理市场** 占据先机。未来，Scout 可能成为微软 365 生态中不可或缺的“数字员工”。

The Verge25天前原文

1684

微软推出新标准，让开发者更精准控制AI代理行为

新上线

随着AI代理能力不断增强，企业在将其部署到各种应用、工作流和产品中时，面临一个新挑战：如何确保代理在不同环境下按预期行动。微软正通过一项名为 **Agent Control Specification (ACS)** 的新开源标准来解决这一问题，旨在为开发者提供更一致、更细粒度的方式来控制AI代理的允许行为。 ACS本质上允许开发者、合规和安全团队为代理定义自己的策略。这些规则可以规定代理可以做什么、禁止做什么、何时需要人工审批操作，以及应记录哪些证据供后续审查。当代理执行任务时，策略文件会在多个拦截点被检查，确保其不越界。当前，开发者通常通过系统提示词、应用代码中的自定义检查或分类器来管控AI行为，但这些方法往往导致控制碎片化，难以审计和跨框架复用。ACS将这些控制整合到一个通用治理层中。微软表示，该规范可在代理工作流的多个节点检查其是否遵守护栏——包括接收输入前、调用工具前、工具返回结果后以及最终响应发送给用户前。策略可以允许、阻止操作，编辑敏感信息，甚至请求人工批准。开发者还可以插入输入输出分类器、用LLM作为策略裁判，以及检查工具调用、工具选择、输入准确性、输出使用和响应的逻辑。由于这些策略可以写成单个文件，因此可以随代理一起打包，使安全策略能跨不同框架和环境跟随代理。ACS现以SDK形式发布，并提供了针对LangChain、OpenAI Agents SDK和Anthropic Agents SDK的插件。 ## 行业背景与意义 AI代理的自主性提升带来了新的治理需求。工具误用或意外操作可能导致级联故障，企业急需标准化的控制手段。ACS的推出填补了这一空白，它将分散的控制点统一为可移植的策略文件，降低了合规风险，也使得代理行为更可预测。对于采用多框架的企业而言，ACS的跨平台特性尤为关键——策略可以一次定义，随处执行。 ## 小结微软ACS为AI代理治理提供了一种标准化、可扩展的方案。通过将安全策略与代理捆绑，企业可以在不牺牲灵活性的前提下，实现对代理行为的精细化管控。这一举措有望推动AI代理在企业级应用中的安全落地。

TechCrunch25天前原文

1685

谷歌电话 App 新增防诈骗功能：AI 识别冒充联系人的诈骗电话

新上线

谷歌正在为其 Phone by Google 应用推出一项新功能，旨在保护用户免受 AI 冒充诈骗的侵害。当用户接到一个看似来自联系人、但实际为诈骗分子伪装的电话时，应用会弹出警告提示，帮助用户及时挂断。该功能是谷歌 6 月 Android 更新的一部分，默认在运行 Android 12 及更高版本的 Pixel 手机上启用。 ## 诈骗威胁日益严峻随着 AI 技术的发展，冒充诈骗已成为一个严重问题。据 FBI 报告，仅 2025 年一年，美国人因 AI 诈骗损失超过 **8.93 亿美元**。诈骗者通常会伪造联系人的电话号码，并利用 AI 技术模仿其声音，冒充亲友或权威人物进行诈骗。 ## 工作原理 Phone by Google 的防诈骗功能基于 **端到端加密的富通信服务（RCS）** 技术。当用户和某个信任的联系人双方都使用 Phone by Google 时，联系人的设备会发送一个“静默确认信号”来验证电话的真实性。如果诈骗者试图伪造该号码，这个确认信号就会缺失，应用便会向用户发出警告。通知会显示“**可能有人正冒充您的联系人给您打电话**”，并提供挂断选项。谷歌表示，该功能默认开启，且其他应用也可以采用这一技术。 ## 更广泛的 Android 更新除了电话防诈骗功能，谷歌 6 月的 Android 更新还包括： - 为更多设备（包括三星 Galaxy S25 系列）增加对 Apple AirDrop 的支持 - 将个人安全应用开放给 13 岁以下儿童 - 在 Google Photos 中广泛推出 AI 服装试穿功能 - 通过 Circle to Search 查找衣物中物品的功能扩展到更多用户该功能目前仅适用于同时使用 Phone by Google 的双方，但谷歌计划未来让更多应用和平台受益。随着 AI 诈骗手段日益复杂，这一功能无疑为用户提供了一层重要的安全防护。

The Verge25天前原文

1686

谷歌推出“虚假来电检测”功能，防范AI深度伪造冒充诈骗

新上线

谷歌于周二宣布，Android系统将推出**虚假来电检测**功能，以防范利用AI深度伪造技术进行的冒充诈骗。该功能本月起通过“电话 by Google”应用向Android 12+设备全球推送，Pixel设备将率先获得更新。随着人们越来越拒绝接听陌生号码来电，诈骗分子开始转变策略，通过伪造可信电话号码并使用AI深度伪造技术伪装成权威人士、家人或雇主。例如，用户可能接到显示为“妈妈”的来电，声音也完全模仿其母亲，但实际上是诈骗者利用AI工具冒充，以虚假紧急情况为由索要钱财。这项新功能默认开启，并在后台自动运行。谷歌解释称，其工作原理类似于设备间的**数字握手**。当联系人拨打电话且双方均使用“电话 by Google”时，联系人手机会向用户设备发送一个静默确认信号，以验证通话真实来自该联系人。如果诈骗者试图冒充该联系人，初始确认信号将缺失，用户设备会立即察觉并主动向联系人真实设备核实。若真实设备回应“我当前未发起通话”，用户屏幕将弹出警告，建议立即挂断。谷歌强调，该功能基于**富通信服务（RCS）**构建，使得其他应用和公司也能采用这一技术。此次虚假来电检测的发布，是Android多项更新之一。其他更新包括： - **Google Photos**推出新“衣柜”功能，可识别照片库中用户穿着的衣物并生成快照，方便浏览。该功能下周向美国、印度和巴西的Android 10+用户开放。 - **Google Play Books**新增“快速回顾”功能，帮助用户通过摘要快速回到故事主线，并支持选中段落提问。该功能即日起面向部分英文图书上线。 - **Circle to Search**功能升级，可一次性搜索整套穿搭中的所有单品，无需逐一查找。

TechCrunch25天前原文

1687

在 AMD MI300X 上部署 DeepSeek-V4-Flash：一份亲历者记录

新上线

## 为什么是 MI300X？在 AI 算力持续紧缺的当下，AMD MI300X 以其 192GB HBM3 显存、接近 H100 的 FP8 算力以及仅为后者一半的标价，成为不少推理部署团队眼中的“性价比之选”。但理想很丰满，现实很骨感——软件生态的鸿沟让这颗芯片在实际落地中充满挑战。 ## 硬件亮眼，软件扎心 MI300X 发布于 2023 年底，是 AMD 对标 NVIDIA H100/H200 的产品。它拥有 **192GB HBM3**，远高于 H100 的 80GB；FP8 算力与 H100 相当，而租赁价格却低得多。然而，当 H100 租赁价格在五个月内上涨 40%、按需容量全面售罄时，MI300X 依然“随租随有”。原因只有一个：**软件**。 AMD 在 MI350X、MI355X 等新芯片上的软件支持已有改善，但对 MI300X 这一代产品的优化似乎被遗忘了。截至 2026 年 5 月初，**vLLM 搭配 DeepSeek-V4-Flash 在 MI300X 上根本无法正常运行**——而这个组合本应是推理场景的黄金搭档。 ## FP8 标准之争的后遗症问题的根源之一，是 FP8 数据格式的**标准分裂**。在低精度计算成为趋势后，业界对 FP8 的规范产生了分歧： - **Graphcore 与 AMD** 联合 Qualcomm，在 2022 年提出了一套标准； - **Arm、Intel 与 NVIDIA** 则通过 Open Compute Project 推出了另一套。两派互不相让，导致不同厂商的硬件对 FP8 的理解和执行存在微妙差异。MI300X 作为 AMD 首批支持 FP8 的加速器，采用的正是前一套标准，而这与主流 AI 框架（如 vLLM）所依赖的 NVIDIA 生态并不兼容。 ## 部署路上的“暗坑” 在尝试让 DeepSeek-V4-Flash 在 MI300X 上跑通的过程中，我们遇到了大量**非预期问题**： - ROCm 软件栈对特定算子的支持缺失或行为异常； - 显存管理策略与 NVIDIA 生态不同，导致 KV Cache 分配失败； - 社区提供的 Docker 镜像和安装脚本往往过时，且缺少针对 MI300X 的详细文档。每一次看似接近成功，都会被一个新的错误打断。这并非硬件能力不足，而是**软件适配的碎片化**让本应简单的部署变得异常曲折。 ## 小结：性价比背后的隐形成本 MI300X 的硬件规格令人心动，但当前软件生态的不成熟，使得它更适合**愿意投入工程力量进行深度适配**的团队。对于追求快速部署、开箱即用的用户而言，NVIDIA 生态仍是更稳妥的选择。但我们相信，随着 AMD 持续补足软件短板，MI300X 这类“高性价比”芯片的价值终将被释放。届时，今天的这份“踩坑记录”或许会成为一份有意义的参考。

Hacker News12025天前原文

1688

亚马逊因Ring面部识别功能面临集体诉讼

新上线

亚马逊旗下智能门铃品牌Ring因“熟悉面孔”（Familiar Faces）功能再次陷入隐私争议。近日，弗吉尼亚州居民Charles Sigwalt在华盛顿州西雅图提起集体诉讼，指控该功能在未经路人同意的情况下收集并存储其面部识别数据。 ## 事件背景 “熟悉面孔”功能于去年9月首次公布，允许Ring用户通过AI面部识别技术识别常访客，如家人、邮递员或邻居，并推送定制化通知（例如“爸爸在门口”而非“有人门口”）。该功能于12月正式上线，用户需主动选择启用。尽管Ring声称面部数据经过加密且从不共享，未识别的人脸数据会在30天后自动删除，但隐私倡导组织（如EFF）及参议员Ed Markey此前已提出强烈反对，认为路过Ring摄像头的人并未同意被扫描。 ## 诉讼核心诉讼指出，“数百万其他美国人经过Ring安全摄像头，却在不知情的情况下被收集了面部识别信息。”原告要求赔偿并阻止该功能的继续使用。目前亚马逊未回应置评请求。 ## 隐私前科 Ring在用户隐私方面早有劣迹。2023年，亚马逊因Ring员工和承包商不当访问女性客户的私人视频，与美国联邦贸易委员会（FTC）达成和解并支付**580万美元**罚款；FTC投诉称，每位员工均可无限制访问所有客户视频，即便无实际工作需求。此外，Ring曾与执法部门保持密切关系，一度允许警方在无搜查令的情况下向用户索取录像。今年，Ring因在超级碗投放“Search Party”AI功能广告（利用Ring录像寻找走失宠物）而遭遇反弹，随后取消了与监控公司Flock Safety的合作——后者被曝向移民及海关执法局（ICE）等联邦机构提供录像。 ## 行业影响此案再次引发对AI面部识别技术边界的讨论。在公共空间部署面部识别系统，即使企业声称数据匿名化，未经明确同意的数据采集仍可能违反隐私法规。Ring的案例表明，智能家居厂商在追求功能创新的同时，需更谨慎地平衡用户便利与第三方权益。目前诉讼尚在早期阶段，最终结果或将对整个行业的数据采集实践产生示范效应。

TechCrunch25天前原文

1689

Amazon Nova Forge 超参数优化：艺术与科学的平衡之道

新上线

在 AI 模型微调领域，一个核心挑战始终存在：如何在提升特定任务性能的同时，不牺牲模型原有的通用能力？AWS 最新发布的 Amazon Nova Forge 平台为这一难题提供了系统化的解决方案。本文基于官方技术博客，深入解析超参数优化的关键策略与实践要点。 ## 微调的本质：一场精妙的平衡游戏微调并非简单的“再训练”，而是在已有预训练模型基础上，通过少量领域数据调整参数，使其适应特定任务。然而，过度聚焦于单一任务往往会导致“灾难性遗忘”——模型在目标领域表现优异，却在其他通用任务上能力大幅下降。Amazon Nova Forge 的设计哲学正是围绕这一平衡点展开，通过精细化的超参数控制，帮助开发者在专业性与通用性之间找到最优解。 ## 关键超参数：决定微调成败的四个杠杆 **学习率（Learning Rate）** 是影响最大的参数之一。过大的学习率可能导致模型参数剧烈震荡，破坏已学到的知识；过小则收敛缓慢，甚至陷入局部最优。Nova Forge 推荐采用 **学习率预热（Warm-up）** 策略，在训练初期逐步提高学习率，避免模型在初始阶段产生过大波动。 **批次大小（Batch Size）** 同样需要谨慎权衡。较小的批次（如 16-32）能带来更好的泛化能力，但训练速度较慢；较大的批次（如 64-128）可加速训练，却可能降低模型对细节的捕捉能力。Nova Forge 的自动化调优工具会根据数据规模和任务复杂度，动态推荐批次大小范围。 **检查点（Checkpointing）** 是防止训练失败的“安全网”。通过定期保存模型状态，开发者可以在训练中断时从最近检查点恢复，避免从头再来。更关键的是，不同检查点的性能对比能直观反映过拟合或欠拟合趋势，为参数调整提供依据。 ## 常见误区：那些浪费训练轮次的“坑” 许多团队在微调中容易陷入几个典型误区： - **盲目增加训练轮次**：认为“训练越多越好”，实则可能导致过拟合。Nova Forge 的 **早停（Early Stopping）** 机制通过监控验证集损失，在性能不再提升时自动终止训练，有效节省计算资源。 - **忽视数据质量**：只关注参数调整，却忽略训练数据的噪声和偏差。事实上，数据清洗与标注质量对最终效果的影响往往大于超参数本身。 - **一次性调参**：试图在一次训练中找到完美参数组合。更高效的做法是采用 **网格搜索（Grid Search）** 或 **贝叶斯优化**，分阶段探索参数空间。 ## 策略选择：从数据出发的定制化路径 Amazon Nova Forge 提供了多种微调策略，开发者需根据数据规模和任务类型做出选择： - **全参数微调（Full Fine-Tuning）**：适用于数据量充足（通常 >10 万样本）且任务与预训练领域差异较大的场景。所有模型参数都会更新，但计算成本最高。 - **参数高效微调（PEFT）**：如 LoRA、Adapter 等方法，仅更新少量参数（通常占总参数的 1-5%），适合数据有限或需快速迭代的场景。Nova Forge 内置了多种 PEFT 方法，并自动配置关键参数。 - **混合策略**：先使用 PEFT 快速验证任务可行性，再根据结果决定是否进行全参数微调。 ## 小结超参数优化本质上是 **经验与科学的结合**：既有基于数学原理的规则可循（如学习率衰减策略），也需要根据实际任务进行实验性调整。Amazon Nova Forge 的价值在于，它将常见的优化策略平台化、自动化，降低了对开发者经验的门槛。对于正在探索模型微调的团队而言，理解这些核心参数的作用机制，远比盲目追求“最佳设置”更为重要。在 AI 模型能力日益趋同的今天，微调技术将成为区分产品竞争力的关键因素。掌握超参数优化的艺术与科学，或许正是打开这一能力之门的钥匙。

AWS ML25天前原文

1690

使用 Amazon Nova 2 Lite 实现物体检测：从部署到可视化完整指南

新上线

物体检测是计算机视觉领域的核心任务之一，广泛应用于制造、农业和物流等行业。本文将带你一步步实现基于 **Amazon Nova 2 Lite** 的物体检测应用，涵盖从模型部署、后端集成到结果可视化的全流程。 ## 技术栈概览整个方案依赖 **Amazon Bedrock** 作为模型推理平台，**AWS Lambda** 处理业务逻辑，**Amazon API Gateway** 提供 RESTful 接口。Amazon Nova 2 Lite 是亚马逊推出的轻量级视觉模型，专为高效物体检测设计，支持结构化 JSON 输出，便于开发者直接解析。 ## 关键步骤 ### 1. 提示词工程有效的提示词是成功的一半。你需要明确指定检测目标、输出格式（例如 JSON 数组）以及置信度阈值。例如： > "Detect all objects in the image. Return a JSON array with each object's label, bounding box (x, y, width, height), and confidence score above 0.5." ### 2. 部署与集成 - 在 **Amazon Bedrock** 中启用 Nova 2 Lite 模型。 - 创建 **Lambda 函数**，编写 Python 代码调用 Bedrock API，处理图像输入（Base64 编码或 S3 引用），并解析模型返回的 JSON。 - 通过 **API Gateway** 暴露 HTTP 端点，支持图片上传或 URL 传入。 ### 3. 结果可视化模型返回的边界框坐标需要映射到原始图像。你可以使用 Python 的 OpenCV 或 Pillow 库在服务器端绘制矩形框和标签，再返回带标注的图像。或者在前端（如 React）用 Canvas 直接渲染。 ## 行业应用场景 - **制造业**：质检流水线上检测产品缺陷，如划痕、变形。 - **农业**：无人机航拍图像中识别作物病害或杂草分布。 - **物流**：仓库中自动识别包裹位置和分类，优化分拣路径。 ## 优势与注意事项 Amazon Nova 2 Lite 的优势在于 **低延迟** 和 **成本效益**，特别适合实时或近实时场景。但需注意： - 模型对复杂背景和遮挡情况可能误检，建议结合数据增强优化。 - 确保 Lambda 函数超时设置合理（推荐 30 秒以上），并启用预留并发避免冷启动。 ## 小结通过 Amazon Nova 2 Lite 结合无服务器架构，你可以快速搭建一个生产级的物体检测系统。本文提供的流程可复用至其他 AWS 视觉模型，如 Amazon Rekognition，灵活适配不同业务需求。

AWS ML25天前原文

1691

微软 Project Solara 亮相：专为 AI 智能体设备打造的操作系统

新上线

在 Build 2026 大会上，微软正式发布了 **Project Solara**——一个专为运行 AI 智能体的设备量身打造的全新操作系统。微软将其描述为“一个从零开始构建、驱动智能体体验的新平台”。与外界预期不同，Solara 基于 **Android** 而非 Windows 构建，采用名为“Microsoft Device Ecosystem Platform”的定制版本，旨在支持更小、更低功耗的设备，同时保留企业级管理与安全功能。 ## 两大概念设备：桌面终端与可穿戴徽章微软在大会现场展示了两款概念设备，作为 Solara 的参考设计： - **桌面概念设备（Desk）**：外观类似 Amazon Echo Show，配备面部识别解锁功能，可快速调用 AI 智能体。它更像一个家庭或办公场景中的智能信息中枢。 - **徽章概念设备（Badge）**：一款可穿戴工牌，内置摄像头和指纹扫描仪，一键唤醒 AI 智能体。演示中，用户轻触即可录制对话并实时转写，摄像头还能让智能体“看到”用户所见的场景。微软明确表示，这两款设备不会直接量产，而是作为 **参考设计** 提供给硬件合作伙伴，希望他们能基于此开发出真正的商用产品。 ## 生态合作与行业前景据 GeekWire 报道，多家知名企业已计划启动基于 Solara 硬件的试点项目，包括 **AccuWeather、Best Buy、CVS Healthcare 和 Target**。微软研究员 Steven Bathiche 强调，Solara 平台“高度灵活”，能够适应不同形态的设备需求。目前该项目仍处于早期阶段，但微软显然希望提前布局 AI 硬件赛道。随着 **Google、Meta** 等传统竞争对手纷纷推出 AI 设备，以及 **OpenAI** 与 Jony Ive 合作开发硬件，AI 原生设备的市场热度正在快速上升。微软的 Solara 试图通过开放参考设计和 Android 生态的低门槛，吸引更多硬件厂商加入，从而在 AI 硬件领域占据一席之地。 ## 小结：微软的 AI 硬件野望 Project Solara 的发布标志着微软在 AI 硬件操作系统层面迈出了关键一步。基于 Android 而非 Windows 的选择，体现了微软对低功耗、灵活性和生态兼容性的务实考量。虽然 Solara 的最终形态和市场规模仍有待观察，但它为 AI 智能体设备提供了一个从底层系统到参考硬件的完整方案，有望加速这一新兴品类的普及。

The Verge25天前原文

1692

Work IQ：微软押注“智能体优先”企业IT，但疑问重重

新上线

## 微软 Work IQ：一场“智能体优先”的企业IT豪赌微软近日推出的 **Work IQ**，被视为其对企业软件架构的一次根本性重构。核心思路是：从“应用+数据”的传统模式，转向“智能体优先”（agent-first）的架构——AI智能体在运行时动态发现数据结构和工具，自主决策如何完成任务。 ### 从“人写代码连接”到“智能体动态编排” 过去几十年，企业软件生态由独立的应用程序和数据组成，它们通过API或数据传输协议相互连接，但每一次集成都需要人工编码。这意味着整合新系统需要大量的协调、开发和测试。微软认为，2026年正是从“人类驱动”转向“AI智能体驱动”的转折点。Work IQ 正是为此而生：智能体不再依赖预定义的集成，而是实时决定调用哪些工具、访问哪些数据。 ### 三大核心疑问：成本、治理与数据暴露尽管愿景宏大，但这一转变带来了严肃的挑战： - **成本失控风险**：智能体动态调用资源，可能产生不可预测的计算和API调用费用，企业预算管理面临新难题。 - **治理与合规**：当智能体自主决策时，如何确保其行为符合企业政策、行业法规（如GDPR）？审计和追溯难度大幅上升。 - **数据暴露**：动态发现数据意味着智能体可能访问到不应触及的敏感信息，安全边界变得模糊。 ### 微软的回应：仍在探索中 ZDNET 有机会采访了微软商业应用与智能体副总裁 Bryan Goode。针对上述疑虑，Goode 承认这些问题至关重要，并表示微软正在从设计层面加强治理工具，例如提供更细粒度的权限控制、运行时监控和成本预算告警。但他也坦言，智能体自主性的“度”需要行业共同摸索。 ### 行业影响与展望 Work IQ 的推出标志着微软在AI agent领域的重大押注。如果成功，它将极大降低企业集成复杂度，加速业务流程自动化。但若治理和成本问题得不到有效解决，企业可能陷入“智能体混乱”。未来几个月，微软能否拿出令人信服的解决方案，将决定这一理念是成为新标杆，还是沦为又一个过度承诺。

ZDNet AI25天前原文

1693

微软造出了高通没能做成的迷你 Surface 开发机

新上线

微软在刚刚过去的周末发布了全新 Surface Laptop Ultra，紧接着又亮出了一款面向开发者的迷你 Surface PC——**Surface RTX Spark Dev Box**。这款设备搭载英伟达基于 Arm 架构的 **RTX Spark 芯片**，与 Surface Laptop Ultra 同源，但针对持续负载和本地 AI 任务做了专门优化。 ## 外观与散热：Xbox Series X 的“顶盖”设计 Surface RTX Spark Dev Box 的外观酷似 Xbox Series X 主机的顶部，采用 **铝合金机身兼作散热片**，整机热设计功耗（TDP）达到 **100 瓦**，高于 RTX Spark 笔记本常见的 45-80 瓦范围。这意味着它在长时间高负载场景下能维持更稳定的性能释放，对 AI 模型训练和推理尤为关键。 ## 性能配置：128GB 统一内存，本地运行 120B 参数模型最引人注目的规格是 **128GB 统一内存**，这使得开发者可以在本地直接运行参数量高达 **1200 亿（120B）** 的大语言模型，无需依赖云端 API。对于注重数据隐私和低延迟的本地 AI 开发场景，这一能力极具吸引力。微软为这款设备预装了 **Visual Studio Code、GitHub Copilot** 等开发工具，并定制了 Windows 11 Pro 镜像——默认启用深色主题、简化任务栏、移除小组件、开启勿扰模式与开发者模式，并将 PowerShell 7 设为默认终端。 ## 行业背景：填补高通留下的空白 Surface RTX Spark Dev Box 的出现，直接对标的是 **高通此前取消的 Snapdragon Dev Kit**。两年前，高通曾计划推出一款面向 Windows on Arm 的迷你开发套件，帮助开发者将应用迁移到 Arm 平台，但因硬件质量问题最终流产。微软此次携手英伟达，不仅为 Windows on Arm 生态提供了更可靠的开发硬件，也标志着 **RTX Spark 芯片** 正在从笔记本扩展到桌面台式机形态。 ## 市场定位与展望目前微软尚未公布完整的规格表与定价，仅确认该设备将于 **今年晚些时候** 在美国微软官方商城开售。可以预见，它将与华硕、联想等 OEM 厂商基于 RTX Spark 的迷你 PC 形成竞争，共同推动本地 AI 开发工具的普及。对于希望在 Arm 平台上高效调试大模型、优化推理管线的开发者来说，Surface RTX Spark Dev Box 可能是今年最值得关注的硬件之一。

The Verge25天前原文

1694

特朗普签署修订版AI行政令，行业反对后改为自愿审查

新上线

美国总统唐纳德·特朗普于周二签署了一项关于人工智能监管的行政令，要求部分AI公司在发布强大模型前自愿提交给政府进行测试或评估。与之前要求提前90天进行审查的草案不同，最终版本将审查期缩短至30天，且完全基于自愿原则。此前，行业内部人士强烈反对更严格的审查要求，认为这会阻碍美国在AI领域对中国的领先地位。行政令明确表示：“本节内容不得被解释为授权对新型AI模型的开发、发布或分发设立强制性政府许可、预先批准或许可要求。”该命令还指示司法部将AI辅助黑客攻击和未经授权访问等犯罪行为列为高优先级执法领域。这并非特朗普首个AI相关行政令。去年12月，他签署了一项命令，要求制定统一的“国家AI政策框架”，以取代各州分散的AI法规。此次修订版的签署，反映出白宫在AI监管上寻求平衡——既希望确保安全，又不愿过度束缚行业发展。值得注意的是，特朗普原计划与多位硅谷顶级CEO共同签署该命令，但最终私下完成了签署。行业观察人士认为，这一变化凸显了科技巨头对政策的影响力。

TechCrunch25天前原文

1695

OpenAI 发布全新 Codex 工具，瞄准白领工作场景

新上线

OpenAI 正加速向企业市场进军。本周二，这家 AI 实验室为旗下智能编程工具 Codex 推出了一系列新功能，旨在将其应用场景从软件工程扩展到更广泛的办公室工作。与此同时，OpenAI 还发布了一份内部报告，揭示了 Codex 在知识工作领域的实际使用情况——其用途远不止写代码。 ### 用户增长与结构变化报告显示，Codex 的周活跃用户已超过 **500 万**，较 2 月桌面版发布时增长了 **6 倍**。虽然开发者仍是最大用户群体，但知识工作者（非技术人员）目前已占用户总数的 **20%**，且增长速度是开发者的 **3 倍**以上。这一趋势表明，AI 辅助工具正从程序员专属走向全员办公助手。 ### 六大行业插件：开箱即用为吸引更多白领用户，OpenAI 一口气发布了 **六款专用插件**，分别针对数据分析、创意制作、销售、产品设计、股权投资和投资银行等岗位。这些插件内置于 Codex 应用内，集成了对应岗位所需的集成、指令和上下文信息，让 Codex 能够“模拟”特定职业的工作方式。OpenAI 强调，虽然插件会随着用户自定义而变得更高效，但开箱即用时就已具备实用价值。这一动作紧跟 Anthropic 的步伐——后者在 2 月推出了企业代理程序（Enterprise Agents），5 月又发布了针对金融领域的代理工具。相比之下，长期专注消费级市场的 OpenAI 在企业客户争夺上稍显迟缓，直到今年 3 月才为 Codex 引入插件支持。 ### 新功能：Sites 与 Annotations 除了行业插件，OpenAI 还推出了 **Sites** 功能，允许 Codex 将工作成果直接输出为托管的交互式网站，而不再是本地文件。这意味着用户可以通过链接分享实时数据看板、产品原型或投资分析报告。为支撑这一功能，OpenAI 已与 **Wix、Base44、Replit、Lovable、Figma 和 Emergent** 等平台达成合作，并计划构建更大的合作伙伴生态。另一项新功能 **Annotations** 则让用户能够在文档或文件内标记特定部分，从而实现更精准的指令和上下文操作——这对需要处理长文档的知识工作者来说尤为实用。 ### 企业战略加速此次新功能的发布，距离 OpenAI 成立企业联合体 **OpenAI Deployment Company** 仅三周。该合资公司获得了全球投资机构超过 **40 亿美元** 的资金支持，旨在将 OpenAI 的工具更深入地整合到全球企业的业务流程中。OpenAI 首席营收官 Denise Dresser 表示：“AI 正在组织中承担越来越有意义的工作。” 从 Codex 的这步棋来看，OpenAI 显然希望让“有意义的工作”不仅限于写代码，更包括数据洞察、创意输出和商业决策。 ### 小结从开发者工具到白领生产力平台，OpenAI 正在重新定义 Codex 的定位。六款行业插件降低了非技术用户的使用门槛，而 Sites 和 Annotations 则让输出形式更加灵活。随着企业联合体数十亿美元资金的注入，以及合作伙伴生态的完善，Codex 有望成为企业 AI 助手的核心入口。不过，面对 Anthropic 等对手的激烈竞争，OpenAI 仍需在定制化、安全性和行业深度上持续发力。

TechCrunch25天前原文

1696

微软 Build 2026 大会：Windows、AI、RTX Spark 等重磅发布汇总

新上线

## 微软 Build 2026 大会开幕：AI 新模型、Copilot 超级应用与量子芯片齐亮相微软年度开发者大会 Build 2026 于 6 月 2 日在旧金山正式拉开帷幕，主题演讲于美国东部时间中午 12:30 / 太平洋时间上午 9:30 进行直播。本次大会聚焦 AI 与 Windows 生态的深度融合，预计将发布多项重磅更新。 ### AI 模型与代理工具：MAI-Thinking-1 与 OpenClaw 代理微软在大会首日推出了自研的“旗舰”AI 模型 **MAI-Thinking-1**，这是一款高级推理模型，标志着微软在模型自研道路上迈出关键一步。此前微软主要依赖 OpenAI 的模型，但双方近期已重新谈判合作协议，关系有所松动。此外，微软还发布了基于 **OpenClaw** 的代理工具，以及一款名为 **Microsoft Scout** 的 AI 个人助手，进一步丰富其 AI 代理生态。同时，**Copilot“超级应用”** 的推出将整合多项功能，成为用户与 AI 交互的核心入口。 ### Windows 与硬件更新：Surface Laptop Ultra 与 RTX Spark 微软发布了搭载 **Nvidia RTX Spark** 的全新 **Surface Laptop Ultra**，这不仅是 Surface 产品线的重大升级，也预示着 Windows on ARM 生态的进一步扩展。此外，微软展示了 **Project Solara**——一个专为 AI 代理设备打造的操作系统，以及一款 **迷你 Surface 开发机**，为开发者提供更高效的硬件平台。 ### 量子计算突破：Majorana 2 芯片可靠性提升 1000 倍微软在量子计算领域取得重大进展，发布了第二代拓扑量子芯片 **Majorana 2**。该芯片的量子比特（qubits）可靠性比上一代 **提升了 1000 倍**，这得益于新材料堆叠和微软 Discovery 的代理 AI 辅助。微软表示，这一突破将加速实用量子计算的到来。 ### 开发者体验升级：更拥抱 Linux 的 Windows 微软还推出了针对开发者优化的 Windows 版本，进一步整合 Linux 支持，让开发者能够在 Windows 上更顺畅地运行 Linux 工具和应用程序。 ### 如何观看与后续报道主题演讲直播已结束，但后续还有更多分会场和技术分享。The Verge 将持续报道 Build 2026 的最新动态，包括更多 AI 模型细节、Windows 11 重大更新以及 RTX Spark 的实测表现。 > 一句话总结：微软正在从“OpenAI 依赖者”转变为“AI 全栈自研者”，同时通过硬件、量子计算和开发者生态巩固其技术护城河。

The Verge25天前原文

1697

亚马逊将这款75英寸海信电视降至850美元以下——我强烈推荐

新上线

海信 U6 Pro 是一款扎实的中端 Mini LED 电视，而在这个价位上更是不二之选。 ## 核心亮点 - **75英寸大屏**：适合客厅或家庭影院，沉浸感十足。 - **Mini LED 技术**：相比传统 LED，Mini LED 能提供更高的对比度和亮度，黑色更深邃，亮部更生动。 - **价格优势**：原价通常接近千元，如今降至 **$850 以下**，性价比突出。 ## 适合谁买？如果你是预算有限但追求画质的用户，U6 Pro 是绝佳选择。它不支持顶级游戏特性如 120Hz 高刷或 HDMI 2.1，但日常观影、流媒体和轻度游戏完全够用。对于非发烧友而言，这个价格买一台 75 英寸 Mini LED 电视，几乎找不到对手。 ## 行业视角电视市场正加速向 Mini LED 和 OLED 分化。海信凭借 U6 Pro 在中端市场精准卡位，以实惠价格普及先进显示技术。亚马逊此次降价进一步拉低了入手门槛，可能带动新一轮换机潮。相比之下，同价位竞品多为传统 LED 或小尺寸 OLED，U6 Pro 在尺寸和画质之间取得了很好的平衡。 ## 小结如果你正在寻找一台大尺寸、画质好且价格合理的电视，海信 U6 Pro 的这次促销值得关注。建议尽快下单，因为这类优惠通常限时。

ZDNet AI25天前原文

1698

Baz 如何借助 Amazon Bedrock AgentCore 将 AI 代码审查精度提升至新高度

新上线

传统的代码审查往往停留在语法层面，难以验证功能是否真正满足产品需求。Baz 通过构建基于 Amazon Bedrock 和 AgentCore 的 Spec Review 智能体，实现了从“代码是否编译通过”到“功能是否符合设计意图”的跨越。 ## 痛点：代码与产品意图之间的鸿沟在传统流程中，开发者能检查代码能否运行，却无法判断其是否实现了所有功能和设计要求。QA 团队不得不花费大量时间手动点击预览环境，验证功能行为是否与设计一致。这种人工验证不仅拖慢了交付节奏，还带来了不一致性和回归风险。随着开发速度的提升，Baz 希望自动化这一缺失的验证环节，将意图、行为和实现整合到同一个审查流程中。 ## 方案：多阶段验证流水线 Baz 的 Spec Review 智能体设计了一套精密的多阶段验证流程： 1. **需求聚合阶段**：当收到 Webhook 或手动触发后，智能体通过 MCP 协议并发查询 Figma 设计稿，并通过 REST API 从 Jira 拉取需求文档，聚合技术、产品和设计三方面的完整规格。 2. **并行验证阶段**：系统为每个需求生成独立的子智能体。这些子智能体结合**源代码仓库**的静态检查与 **Amazon Bedrock AgentCore 的浏览器工具**进行动态运行时验证——与临时环境交互，执行 DOM 检查、事件模拟和视觉比对。 ## 关键技术决策 - **选择 Bedrock AgentCore 而非自建框架**：Baz 认为，利用托管服务可以大幅降低维护成本，同时获得 AWS 原生的安全与扩展能力。 - **子智能体隔离机制**：每个需求独立验证，避免了不同测试间的相互干扰，也便于并行加速。 - **动态环境集成**：通过浏览器工具直接操作真实渲染页面，捕捉视觉和交互层面的偏差，这是传统静态分析无法做到的。 ## 业务成果采用该方案后，Baz 实现了： - **审查效率提升 70%**：原本需要 QA 团队数小时的手动验证，现在在几分钟内完成。 - **缺陷提前发现率提高 40%**：在代码合并前就能捕捉到设计实现偏差，减少了后期返工。 - **审查标准统一**：智能体严格遵循从 Figma 和 Jira 提取的规格，消除了人工判断的主观差异。 ## 行业启示 Baz 的实践展示了 **AI Agent 在软件工程质量保障中的新范式**——从“检查代码是否正确”转向“验证体验是否符合预期”。随着 Amazon Bedrock AgentCore 等工具降低智能体开发门槛，更多团队将能构建类似的能力，让代码审查真正成为产品意图的最后一道防线。

AWS ML25天前原文

1699

获OpenAI注资后，Opal转型打造AI音频硬件

新上线

以高端网络摄像头闻名的Opal Camera，在获得OpenAI和三星等机构4000万美元融资后，正式更名为Opal Electronics，并宣布向AI消费硬件领域全面转型。公司目前正秘密研发一款AI音频设备，预计未来三至四个月内发布，已由OpenAI CEO Sam Altman、xAI、Anthropic等高管内测。 ## 从摄像头到AI硬件：Opal的转型之路 Opal Camera最初以设计精良的C1网络摄像头走红，但公司并不满足于此。2022年，OpenAI CEO Sam Altman作为早期用户造访Opal办公室，询问能否将Whisper语音转录模型本地运行于摄像头以实现Zoom实时字幕。正是在这次会面中，OpenAI向Opal团队展示了ChatGPT预览版——这一演示彻底改变了公司的方向。Opal团队深受震撼，随即决定转型为研究实验室，并开始研发AI驱动的音频产品。 ## 4000万美元融资与明星投资阵容 Opal的转型得到了资本市场的强力支持。公司完成了4000万美元的B轮融资，领投方正是OpenAI。其他投资者包括三星、Peter Thiel、Alexis Ohanian的Seven Seven Six，以及知名科技YouTuber Marques Brownlee（MKBHD）。此轮融资于2025年第一季度完成，Opal估值约为2.75亿美元。值得注意的是，Altman本人正是因这款音频产品才决定投资Opal。 ## 神秘音频设备：是耳机还是智能音箱？ Opal正在开发的AI音频设备具体形态尚未公开，但据知情人士透露，它属于“熟悉的产品类别”，且并非直接与iPhone竞争。目前该设备正在Altman、OpenAI研究人员以及xAI、Thinking Machines、Anthropic等公司高管手中测试。外界普遍猜测，它可能是一款智能耳机或类似智能音箱的设备。这与OpenAI与Jony Ive的LoveFrom合作探索个人硬件设备的传闻不谋而合——OpenAI的首款硬件产品据称也是类似智能音箱的形态。 ## 行业风向：AI硬件的新战场 Opal的转型折射出AI行业的一个新趋势：软件巨头正加速向硬件渗透。OpenAI不仅投资了Opal，还与苹果前设计总监Jony Ive联手，而xAI、Anthropic等公司也在积极布局硬件。Opal的野心是成为“消费电子界的索尼”——以设计和文化为核心，而非单纯比拼技术参数。不过，AI硬件赛道已十分拥挤：Rabbit R1、Humane AI Pin等产品相继遇冷，市场对“AI原生硬件”的接受度仍有待验证。Opal能否凭借其设计基因和OpenAI的技术背书突围，未来几个月将见分晓。

WIRED AI25天前原文

1700

Anthropic 将 Claude Mythos 扩展至 15 国关键基础设施

新上线

Anthropic 正在扩大其联合行业安全漏洞计划 Project Glasswing，将 Claude Mythos 的访问权限授予 15 个以上国家的约 150 家新组织。这些组织覆盖电力、水务、医疗、通信和硬件等关键基础设施领域，一旦遭受网络攻击，可能影响超过 1 亿人。此前 Anthropic 已向包括美国政府在内的 50 家初始合作伙伴开放了 Mythos Preview，用于扫描代码库漏洞。新加入的合作伙伴包括 Okta、三星、SK 海力士、SK 电信、北约及欧盟网络安全局 ENISA 等。Anthropic 表示，Mythos 是其最强大的模型，能在数周内识别数千个零日漏洞。公司预计其他 AI 公司很快会推出同等能力的模型，因此正通过 Project Glasswing 加速建立安全防护机制。此举紧随 Anthropic 秘密提交 IPO 申请及获得 650 亿美元融资、估值近万亿美元之后。

TechCrunch25天前原文