SheepNav

AI 资讯

每日聚合最新人工智能动态

安卓手机即将能识别假冒来电和深度伪造诈骗

谷歌在6月的安卓功能更新中,推出了针对深度伪造电话诈骗的自动防护功能。这项新功能主要针对“冒充诈骗”——根据FTC数据,2024年美国这类诈骗造成的损失接近30亿美元。随着AI语音克隆工具的进步,骗子更容易模仿熟人的声音和号码进行诈骗。 谷歌的解决方案基于其此前为金融电话验证推出的系统,现在扩展到所有联系人。当来电显示为联系人时,手机会通过Google Phone、Google Messages和Google通讯录三款应用协同验证。具体机制是:骗子通常使用在线中继来伪造号码,而真正的来电会包含一个来自Google拨号应用的确认信号。如果该信号缺失,系统会通过Messages向被冒充的联系人发送一个经过认证的RCS消息,确认其是否正在拨打该电话。若对方回复未拨打电话,则判定为诈骗。 该功能适用于Android 12及以上设备,但需要安装谷歌的三款通讯应用。Pixel和摩托罗拉手机预装这些应用,三星也已全面转向Google Messages。不过,由于三星自有拨号应用用户众多,实际覆盖范围可能受限。 此外,本次更新还包括其他功能:类似AirDrop的快速分享改进、更多AI集成等。谷歌正通过系统级防护应对AI诈骗威胁,但用户仍需保持警惕,因为技术手段并非万能。

Ars Technica25天前原文
微软 Scout 上线:永不掉线的 AI 同事,帮你搞定无聊的办公室杂务

在微软 Build 开发者大会上,微软正式推出 **Scout**,一个基于 Teams 的始终在线 AI 代理。Scout 可以访问你的工作消息、日历和邮件,自动执行任务、重新安排冲突的会议、起草专业的回复。它本质上是企业版的 OpenClaw,专为办公室白领设计,你可以像对待人类同事一样在 Teams 中直接给它发指令。 Scout 是微软“代理优先”转型的一部分,旨在自动化知识工作者的软件使用方式。微软企业副总裁 Omar Shahine 表示:“Scout 就像一个私人助理,你下班了它还在工作。”当你闲聊休息时,Scout 会忙着为下周全员会议锁定时间、基于最新消息生成发言要点。 目前 Scout 已面向小部分客户开放,并计划扩大范围。除了 Teams 集成,微软还测试一款桌面应用,今日起面向选择“前沿”功能访问权限的订阅者推出,但需同时拥有 GitHub Copilot 订阅。用户可设置目标和偏好,让 Scout 主动分配任务。例如,Shahine 告诉 Scout 永远保护家庭晚餐时间,因此当会议被安排在晚餐时段时,代理会自动标记并向同事建议重新安排。Scout 还能根据邮件和消息创建承诺清单,发送提醒并起草跟进计划。当然,早期版本可能会有些粗糙。

WIRED AI25天前原文

微软在 Build 2026 大会上正式推出 **Microsoft Scout**,这是一款基于 OpenClaw 构建的 **始终在线 AI 个人助理**,不同于现有的 Copilot,Scout 能够主动监控日历、交通、邮件和 Teams 对话,为用户提供日程建议、费用报告、邮件草稿等全方位协助。 ## 什么是 Scout? Scout 被微软称为“首款真正的个人助理”。它与 Microsoft 365 深度集成,但能力远不止于聊天。Scout 可以 **主动打电话提醒用户出发时间**,根据实时路况和日程安排建议最佳出门时机,还能在后台阅读 Teams 线程和邮件,自动提炼重要事项。 ## 与 Copilot 有何不同? | 特性 | Copilot | Scout | |------|---------|-------| | 交互方式 | 被动聊天 | 主动通知与通话 | | 感知范围 | 当前文档/应用 | 日历、交通、邮件、Teams | | 运行模式 | 应用内嵌入 | 桌面客户端 + 云端始终在线 | Scout 更像一位 **真人助理**,不仅回答问题,还会主动“操心”你的日程与任务。 ## 当前进展与未来计划 - 本周起向美国 **Frontier 客户** 提供桌面预览版 - 未来几个月将推出更广泛的云版本 - 内部已有 **3000 多名微软员工** 在使用,用于安排会议、预订旅行、填写表单等 微软高管 Omar Shahine 表示:“很多人用它成为更好的自己——我们都有想达成的目标,但常常没时间去做,Scout 帮你找回时间。” ## 行业意义 Scout 的推出标志着 AI 助手从“被动响应”走向“主动服务”。在 Google 推出类似 OpenClaw 助手的背景下,微软希望借助 Scout 在 **企业级个人助理市场** 占据先机。未来,Scout 可能成为微软 365 生态中不可或缺的“数字员工”。

The Verge25天前原文

随着AI代理能力不断增强,企业在将其部署到各种应用、工作流和产品中时,面临一个新挑战:如何确保代理在不同环境下按预期行动。微软正通过一项名为 **Agent Control Specification (ACS)** 的新开源标准来解决这一问题,旨在为开发者提供更一致、更细粒度的方式来控制AI代理的允许行为。 ACS本质上允许开发者、合规和安全团队为代理定义自己的策略。这些规则可以规定代理可以做什么、禁止做什么、何时需要人工审批操作,以及应记录哪些证据供后续审查。当代理执行任务时,策略文件会在多个拦截点被检查,确保其不越界。 当前,开发者通常通过系统提示词、应用代码中的自定义检查或分类器来管控AI行为,但这些方法往往导致控制碎片化,难以审计和跨框架复用。ACS将这些控制整合到一个通用治理层中。微软表示,该规范可在代理工作流的多个节点检查其是否遵守护栏——包括接收输入前、调用工具前、工具返回结果后以及最终响应发送给用户前。策略可以允许、阻止操作,编辑敏感信息,甚至请求人工批准。开发者还可以插入输入输出分类器、用LLM作为策略裁判,以及检查工具调用、工具选择、输入准确性、输出使用和响应的逻辑。 由于这些策略可以写成单个文件,因此可以随代理一起打包,使安全策略能跨不同框架和环境跟随代理。ACS现以SDK形式发布,并提供了针对LangChain、OpenAI Agents SDK和Anthropic Agents SDK的插件。 ## 行业背景与意义 AI代理的自主性提升带来了新的治理需求。工具误用或意外操作可能导致级联故障,企业急需标准化的控制手段。ACS的推出填补了这一空白,它将分散的控制点统一为可移植的策略文件,降低了合规风险,也使得代理行为更可预测。对于采用多框架的企业而言,ACS的跨平台特性尤为关键——策略可以一次定义,随处执行。 ## 小结 微软ACS为AI代理治理提供了一种标准化、可扩展的方案。通过将安全策略与代理捆绑,企业可以在不牺牲灵活性的前提下,实现对代理行为的精细化管控。这一举措有望推动AI代理在企业级应用中的安全落地。

TechCrunch25天前原文

谷歌正在为其 Phone by Google 应用推出一项新功能,旨在保护用户免受 AI 冒充诈骗的侵害。当用户接到一个看似来自联系人、但实际为诈骗分子伪装的电话时,应用会弹出警告提示,帮助用户及时挂断。该功能是谷歌 6 月 Android 更新的一部分,默认在运行 Android 12 及更高版本的 Pixel 手机上启用。 ## 诈骗威胁日益严峻 随着 AI 技术的发展,冒充诈骗已成为一个严重问题。据 FBI 报告,仅 2025 年一年,美国人因 AI 诈骗损失超过 **8.93 亿美元**。诈骗者通常会伪造联系人的电话号码,并利用 AI 技术模仿其声音,冒充亲友或权威人物进行诈骗。 ## 工作原理 Phone by Google 的防诈骗功能基于 **端到端加密的富通信服务(RCS)** 技术。当用户和某个信任的联系人双方都使用 Phone by Google 时,联系人的设备会发送一个“静默确认信号”来验证电话的真实性。如果诈骗者试图伪造该号码,这个确认信号就会缺失,应用便会向用户发出警告。 通知会显示“**可能有人正冒充您的联系人给您打电话**”,并提供挂断选项。谷歌表示,该功能默认开启,且其他应用也可以采用这一技术。 ## 更广泛的 Android 更新 除了电话防诈骗功能,谷歌 6 月的 Android 更新还包括: - 为更多设备(包括三星 Galaxy S25 系列)增加对 Apple AirDrop 的支持 - 将个人安全应用开放给 13 岁以下儿童 - 在 Google Photos 中广泛推出 AI 服装试穿功能 - 通过 Circle to Search 查找衣物中物品的功能扩展到更多用户 该功能目前仅适用于同时使用 Phone by Google 的双方,但谷歌计划未来让更多应用和平台受益。随着 AI 诈骗手段日益复杂,这一功能无疑为用户提供了一层重要的安全防护。

The Verge25天前原文

谷歌于周二宣布,Android系统将推出**虚假来电检测**功能,以防范利用AI深度伪造技术进行的冒充诈骗。该功能本月起通过“电话 by Google”应用向Android 12+设备全球推送,Pixel设备将率先获得更新。 随着人们越来越拒绝接听陌生号码来电,诈骗分子开始转变策略,通过伪造可信电话号码并使用AI深度伪造技术伪装成权威人士、家人或雇主。例如,用户可能接到显示为“妈妈”的来电,声音也完全模仿其母亲,但实际上是诈骗者利用AI工具冒充,以虚假紧急情况为由索要钱财。 这项新功能默认开启,并在后台自动运行。谷歌解释称,其工作原理类似于设备间的**数字握手**。当联系人拨打电话且双方均使用“电话 by Google”时,联系人手机会向用户设备发送一个静默确认信号,以验证通话真实来自该联系人。如果诈骗者试图冒充该联系人,初始确认信号将缺失,用户设备会立即察觉并主动向联系人真实设备核实。若真实设备回应“我当前未发起通话”,用户屏幕将弹出警告,建议立即挂断。 谷歌强调,该功能基于**富通信服务(RCS)**构建,使得其他应用和公司也能采用这一技术。 此次虚假来电检测的发布,是Android多项更新之一。其他更新包括: - **Google Photos**推出新“衣柜”功能,可识别照片库中用户穿着的衣物并生成快照,方便浏览。该功能下周向美国、印度和巴西的Android 10+用户开放。 - **Google Play Books**新增“快速回顾”功能,帮助用户通过摘要快速回到故事主线,并支持选中段落提问。该功能即日起面向部分英文图书上线。 - **Circle to Search**功能升级,可一次性搜索整套穿搭中的所有单品,无需逐一查找。

TechCrunch25天前原文

## 为什么是 MI300X? 在 AI 算力持续紧缺的当下,AMD MI300X 以其 192GB HBM3 显存、接近 H100 的 FP8 算力以及仅为后者一半的标价,成为不少推理部署团队眼中的“性价比之选”。但理想很丰满,现实很骨感——软件生态的鸿沟让这颗芯片在实际落地中充满挑战。 ## 硬件亮眼,软件扎心 MI300X 发布于 2023 年底,是 AMD 对标 NVIDIA H100/H200 的产品。它拥有 **192GB HBM3**,远高于 H100 的 80GB;FP8 算力与 H100 相当,而租赁价格却低得多。然而,当 H100 租赁价格在五个月内上涨 40%、按需容量全面售罄时,MI300X 依然“随租随有”。 原因只有一个:**软件**。 AMD 在 MI350X、MI355X 等新芯片上的软件支持已有改善,但对 MI300X 这一代产品的优化似乎被遗忘了。截至 2026 年 5 月初,**vLLM 搭配 DeepSeek-V4-Flash 在 MI300X 上根本无法正常运行**——而这个组合本应是推理场景的黄金搭档。 ## FP8 标准之争的后遗症 问题的根源之一,是 FP8 数据格式的**标准分裂**。 在低精度计算成为趋势后,业界对 FP8 的规范产生了分歧: - **Graphcore 与 AMD** 联合 Qualcomm,在 2022 年提出了一套标准; - **Arm、Intel 与 NVIDIA** 则通过 Open Compute Project 推出了另一套。 两派互不相让,导致不同厂商的硬件对 FP8 的理解和执行存在微妙差异。MI300X 作为 AMD 首批支持 FP8 的加速器,采用的正是前一套标准,而这与主流 AI 框架(如 vLLM)所依赖的 NVIDIA 生态并不兼容。 ## 部署路上的“暗坑” 在尝试让 DeepSeek-V4-Flash 在 MI300X 上跑通的过程中,我们遇到了大量**非预期问题**: - ROCm 软件栈对特定算子的支持缺失或行为异常; - 显存管理策略与 NVIDIA 生态不同,导致 KV Cache 分配失败; - 社区提供的 Docker 镜像和安装脚本往往过时,且缺少针对 MI300X 的详细文档。 每一次看似接近成功,都会被一个新的错误打断。这并非硬件能力不足,而是**软件适配的碎片化**让本应简单的部署变得异常曲折。 ## 小结:性价比背后的隐形成本 MI300X 的硬件规格令人心动,但当前软件生态的不成熟,使得它更适合**愿意投入工程力量进行深度适配**的团队。对于追求快速部署、开箱即用的用户而言,NVIDIA 生态仍是更稳妥的选择。 但我们相信,随着 AMD 持续补足软件短板,MI300X 这类“高性价比”芯片的价值终将被释放。届时,今天的这份“踩坑记录”或许会成为一份有意义的参考。

Hacker News12025天前原文

亚马逊旗下智能门铃品牌Ring因“熟悉面孔”(Familiar Faces)功能再次陷入隐私争议。近日,弗吉尼亚州居民Charles Sigwalt在华盛顿州西雅图提起集体诉讼,指控该功能在未经路人同意的情况下收集并存储其面部识别数据。 ## 事件背景 “熟悉面孔”功能于去年9月首次公布,允许Ring用户通过AI面部识别技术识别常访客,如家人、邮递员或邻居,并推送定制化通知(例如“爸爸在门口”而非“有人门口”)。该功能于12月正式上线,用户需主动选择启用。尽管Ring声称面部数据经过加密且从不共享,未识别的人脸数据会在30天后自动删除,但隐私倡导组织(如EFF)及参议员Ed Markey此前已提出强烈反对,认为路过Ring摄像头的人并未同意被扫描。 ## 诉讼核心 诉讼指出,“数百万其他美国人经过Ring安全摄像头,却在不知情的情况下被收集了面部识别信息。”原告要求赔偿并阻止该功能的继续使用。目前亚马逊未回应置评请求。 ## 隐私前科 Ring在用户隐私方面早有劣迹。2023年,亚马逊因Ring员工和承包商不当访问女性客户的私人视频,与美国联邦贸易委员会(FTC)达成和解并支付**580万美元**罚款;FTC投诉称,每位员工均可无限制访问所有客户视频,即便无实际工作需求。此外,Ring曾与执法部门保持密切关系,一度允许警方在无搜查令的情况下向用户索取录像。今年,Ring因在超级碗投放“Search Party”AI功能广告(利用Ring录像寻找走失宠物)而遭遇反弹,随后取消了与监控公司Flock Safety的合作——后者被曝向移民及海关执法局(ICE)等联邦机构提供录像。 ## 行业影响 此案再次引发对AI面部识别技术边界的讨论。在公共空间部署面部识别系统,即使企业声称数据匿名化,未经明确同意的数据采集仍可能违反隐私法规。Ring的案例表明,智能家居厂商在追求功能创新的同时,需更谨慎地平衡用户便利与第三方权益。目前诉讼尚在早期阶段,最终结果或将对整个行业的数据采集实践产生示范效应。

TechCrunch25天前原文

在 AI 模型微调领域,一个核心挑战始终存在:如何在提升特定任务性能的同时,不牺牲模型原有的通用能力?AWS 最新发布的 Amazon Nova Forge 平台为这一难题提供了系统化的解决方案。本文基于官方技术博客,深入解析超参数优化的关键策略与实践要点。 ## 微调的本质:一场精妙的平衡游戏 微调并非简单的“再训练”,而是在已有预训练模型基础上,通过少量领域数据调整参数,使其适应特定任务。然而,过度聚焦于单一任务往往会导致“灾难性遗忘”——模型在目标领域表现优异,却在其他通用任务上能力大幅下降。Amazon Nova Forge 的设计哲学正是围绕这一平衡点展开,通过精细化的超参数控制,帮助开发者在专业性与通用性之间找到最优解。 ## 关键超参数:决定微调成败的四个杠杆 **学习率(Learning Rate)** 是影响最大的参数之一。过大的学习率可能导致模型参数剧烈震荡,破坏已学到的知识;过小则收敛缓慢,甚至陷入局部最优。Nova Forge 推荐采用 **学习率预热(Warm-up)** 策略,在训练初期逐步提高学习率,避免模型在初始阶段产生过大波动。 **批次大小(Batch Size)** 同样需要谨慎权衡。较小的批次(如 16-32)能带来更好的泛化能力,但训练速度较慢;较大的批次(如 64-128)可加速训练,却可能降低模型对细节的捕捉能力。Nova Forge 的自动化调优工具会根据数据规模和任务复杂度,动态推荐批次大小范围。 **检查点(Checkpointing)** 是防止训练失败的“安全网”。通过定期保存模型状态,开发者可以在训练中断时从最近检查点恢复,避免从头再来。更关键的是,不同检查点的性能对比能直观反映过拟合或欠拟合趋势,为参数调整提供依据。 ## 常见误区:那些浪费训练轮次的“坑” 许多团队在微调中容易陷入几个典型误区: - **盲目增加训练轮次**:认为“训练越多越好”,实则可能导致过拟合。Nova Forge 的 **早停(Early Stopping)** 机制通过监控验证集损失,在性能不再提升时自动终止训练,有效节省计算资源。 - **忽视数据质量**:只关注参数调整,却忽略训练数据的噪声和偏差。事实上,数据清洗与标注质量对最终效果的影响往往大于超参数本身。 - **一次性调参**:试图在一次训练中找到完美参数组合。更高效的做法是采用 **网格搜索(Grid Search)** 或 **贝叶斯优化**,分阶段探索参数空间。 ## 策略选择:从数据出发的定制化路径 Amazon Nova Forge 提供了多种微调策略,开发者需根据数据规模和任务类型做出选择: - **全参数微调(Full Fine-Tuning)**:适用于数据量充足(通常 >10 万样本)且任务与预训练领域差异较大的场景。所有模型参数都会更新,但计算成本最高。 - **参数高效微调(PEFT)**:如 LoRA、Adapter 等方法,仅更新少量参数(通常占总参数的 1-5%),适合数据有限或需快速迭代的场景。Nova Forge 内置了多种 PEFT 方法,并自动配置关键参数。 - **混合策略**:先使用 PEFT 快速验证任务可行性,再根据结果决定是否进行全参数微调。 ## 小结 超参数优化本质上是 **经验与科学的结合**:既有基于数学原理的规则可循(如学习率衰减策略),也需要根据实际任务进行实验性调整。Amazon Nova Forge 的价值在于,它将常见的优化策略平台化、自动化,降低了对开发者经验的门槛。对于正在探索模型微调的团队而言,理解这些核心参数的作用机制,远比盲目追求“最佳设置”更为重要。 在 AI 模型能力日益趋同的今天,微调技术将成为区分产品竞争力的关键因素。掌握超参数优化的艺术与科学,或许正是打开这一能力之门的钥匙。

AWS ML25天前原文

物体检测是计算机视觉领域的核心任务之一,广泛应用于制造、农业和物流等行业。本文将带你一步步实现基于 **Amazon Nova 2 Lite** 的物体检测应用,涵盖从模型部署、后端集成到结果可视化的全流程。 ## 技术栈概览 整个方案依赖 **Amazon Bedrock** 作为模型推理平台,**AWS Lambda** 处理业务逻辑,**Amazon API Gateway** 提供 RESTful 接口。Amazon Nova 2 Lite 是亚马逊推出的轻量级视觉模型,专为高效物体检测设计,支持结构化 JSON 输出,便于开发者直接解析。 ## 关键步骤 ### 1. 提示词工程 有效的提示词是成功的一半。你需要明确指定检测目标、输出格式(例如 JSON 数组)以及置信度阈值。例如: > "Detect all objects in the image. Return a JSON array with each object's label, bounding box (x, y, width, height), and confidence score above 0.5." ### 2. 部署与集成 - 在 **Amazon Bedrock** 中启用 Nova 2 Lite 模型。 - 创建 **Lambda 函数**,编写 Python 代码调用 Bedrock API,处理图像输入(Base64 编码或 S3 引用),并解析模型返回的 JSON。 - 通过 **API Gateway** 暴露 HTTP 端点,支持图片上传或 URL 传入。 ### 3. 结果可视化 模型返回的边界框坐标需要映射到原始图像。你可以使用 Python 的 OpenCV 或 Pillow 库在服务器端绘制矩形框和标签,再返回带标注的图像。或者在前端(如 React)用 Canvas 直接渲染。 ## 行业应用场景 - **制造业**:质检流水线上检测产品缺陷,如划痕、变形。 - **农业**:无人机航拍图像中识别作物病害或杂草分布。 - **物流**:仓库中自动识别包裹位置和分类,优化分拣路径。 ## 优势与注意事项 Amazon Nova 2 Lite 的优势在于 **低延迟** 和 **成本效益**,特别适合实时或近实时场景。但需注意: - 模型对复杂背景和遮挡情况可能误检,建议结合数据增强优化。 - 确保 Lambda 函数超时设置合理(推荐 30 秒以上),并启用预留并发避免冷启动。 ## 小结 通过 Amazon Nova 2 Lite 结合无服务器架构,你可以快速搭建一个生产级的物体检测系统。本文提供的流程可复用至其他 AWS 视觉模型,如 Amazon Rekognition,灵活适配不同业务需求。

AWS ML25天前原文

在 Build 2026 大会上,微软正式发布了 **Project Solara**——一个专为运行 AI 智能体的设备量身打造的全新操作系统。微软将其描述为“一个从零开始构建、驱动智能体体验的新平台”。与外界预期不同,Solara 基于 **Android** 而非 Windows 构建,采用名为“Microsoft Device Ecosystem Platform”的定制版本,旨在支持更小、更低功耗的设备,同时保留企业级管理与安全功能。 ## 两大概念设备:桌面终端与可穿戴徽章 微软在大会现场展示了两款概念设备,作为 Solara 的参考设计: - **桌面概念设备(Desk)**:外观类似 Amazon Echo Show,配备面部识别解锁功能,可快速调用 AI 智能体。它更像一个家庭或办公场景中的智能信息中枢。 - **徽章概念设备(Badge)**:一款可穿戴工牌,内置摄像头和指纹扫描仪,一键唤醒 AI 智能体。演示中,用户轻触即可录制对话并实时转写,摄像头还能让智能体“看到”用户所见的场景。 微软明确表示,这两款设备不会直接量产,而是作为 **参考设计** 提供给硬件合作伙伴,希望他们能基于此开发出真正的商用产品。 ## 生态合作与行业前景 据 GeekWire 报道,多家知名企业已计划启动基于 Solara 硬件的试点项目,包括 **AccuWeather、Best Buy、CVS Healthcare 和 Target**。微软研究员 Steven Bathiche 强调,Solara 平台“高度灵活”,能够适应不同形态的设备需求。 目前该项目仍处于早期阶段,但微软显然希望提前布局 AI 硬件赛道。随着 **Google、Meta** 等传统竞争对手纷纷推出 AI 设备,以及 **OpenAI** 与 Jony Ive 合作开发硬件,AI 原生设备的市场热度正在快速上升。微软的 Solara 试图通过开放参考设计和 Android 生态的低门槛,吸引更多硬件厂商加入,从而在 AI 硬件领域占据一席之地。 ## 小结:微软的 AI 硬件野望 Project Solara 的发布标志着微软在 AI 硬件操作系统层面迈出了关键一步。基于 Android 而非 Windows 的选择,体现了微软对低功耗、灵活性和生态兼容性的务实考量。虽然 Solara 的最终形态和市场规模仍有待观察,但它为 AI 智能体设备提供了一个从底层系统到参考硬件的完整方案,有望加速这一新兴品类的普及。

The Verge25天前原文

## 微软 Work IQ:一场“智能体优先”的企业IT豪赌 微软近日推出的 **Work IQ**,被视为其对企业软件架构的一次根本性重构。核心思路是:从“应用+数据”的传统模式,转向“智能体优先”(agent-first)的架构——AI智能体在运行时动态发现数据结构和工具,自主决策如何完成任务。 ### 从“人写代码连接”到“智能体动态编排” 过去几十年,企业软件生态由独立的应用程序和数据组成,它们通过API或数据传输协议相互连接,但每一次集成都需要人工编码。这意味着整合新系统需要大量的协调、开发和测试。微软认为,2026年正是从“人类驱动”转向“AI智能体驱动”的转折点。Work IQ 正是为此而生:智能体不再依赖预定义的集成,而是实时决定调用哪些工具、访问哪些数据。 ### 三大核心疑问:成本、治理与数据暴露 尽管愿景宏大,但这一转变带来了严肃的挑战: - **成本失控风险**:智能体动态调用资源,可能产生不可预测的计算和API调用费用,企业预算管理面临新难题。 - **治理与合规**:当智能体自主决策时,如何确保其行为符合企业政策、行业法规(如GDPR)?审计和追溯难度大幅上升。 - **数据暴露**:动态发现数据意味着智能体可能访问到不应触及的敏感信息,安全边界变得模糊。 ### 微软的回应:仍在探索中 ZDNET 有机会采访了微软商业应用与智能体副总裁 Bryan Goode。针对上述疑虑,Goode 承认这些问题至关重要,并表示微软正在从设计层面加强治理工具,例如提供更细粒度的权限控制、运行时监控和成本预算告警。但他也坦言,智能体自主性的“度”需要行业共同摸索。 ### 行业影响与展望 Work IQ 的推出标志着微软在AI agent领域的重大押注。如果成功,它将极大降低企业集成复杂度,加速业务流程自动化。但若治理和成本问题得不到有效解决,企业可能陷入“智能体混乱”。未来几个月,微软能否拿出令人信服的解决方案,将决定这一理念是成为新标杆,还是沦为又一个过度承诺。

ZDNet AI25天前原文

微软在刚刚过去的周末发布了全新 Surface Laptop Ultra,紧接着又亮出了一款面向开发者的迷你 Surface PC——**Surface RTX Spark Dev Box**。这款设备搭载英伟达基于 Arm 架构的 **RTX Spark 芯片**,与 Surface Laptop Ultra 同源,但针对持续负载和本地 AI 任务做了专门优化。 ## 外观与散热:Xbox Series X 的“顶盖”设计 Surface RTX Spark Dev Box 的外观酷似 Xbox Series X 主机的顶部,采用 **铝合金机身兼作散热片**,整机热设计功耗(TDP)达到 **100 瓦**,高于 RTX Spark 笔记本常见的 45-80 瓦范围。这意味着它在长时间高负载场景下能维持更稳定的性能释放,对 AI 模型训练和推理尤为关键。 ## 性能配置:128GB 统一内存,本地运行 120B 参数模型 最引人注目的规格是 **128GB 统一内存**,这使得开发者可以在本地直接运行参数量高达 **1200 亿(120B)** 的大语言模型,无需依赖云端 API。对于注重数据隐私和低延迟的本地 AI 开发场景,这一能力极具吸引力。微软为这款设备预装了 **Visual Studio Code、GitHub Copilot** 等开发工具,并定制了 Windows 11 Pro 镜像——默认启用深色主题、简化任务栏、移除小组件、开启勿扰模式与开发者模式,并将 PowerShell 7 设为默认终端。 ## 行业背景:填补高通留下的空白 Surface RTX Spark Dev Box 的出现,直接对标的是 **高通此前取消的 Snapdragon Dev Kit**。两年前,高通曾计划推出一款面向 Windows on Arm 的迷你开发套件,帮助开发者将应用迁移到 Arm 平台,但因硬件质量问题最终流产。微软此次携手英伟达,不仅为 Windows on Arm 生态提供了更可靠的开发硬件,也标志着 **RTX Spark 芯片** 正在从笔记本扩展到桌面台式机形态。 ## 市场定位与展望 目前微软尚未公布完整的规格表与定价,仅确认该设备将于 **今年晚些时候** 在美国微软官方商城开售。可以预见,它将与华硕、联想等 OEM 厂商基于 RTX Spark 的迷你 PC 形成竞争,共同推动本地 AI 开发工具的普及。对于希望在 Arm 平台上高效调试大模型、优化推理管线的开发者来说,Surface RTX Spark Dev Box 可能是今年最值得关注的硬件之一。

The Verge25天前原文

美国总统唐纳德·特朗普于周二签署了一项关于人工智能监管的行政令,要求部分AI公司在发布强大模型前自愿提交给政府进行测试或评估。与之前要求提前90天进行审查的草案不同,最终版本将审查期缩短至30天,且完全基于自愿原则。此前,行业内部人士强烈反对更严格的审查要求,认为这会阻碍美国在AI领域对中国的领先地位。 行政令明确表示:“本节内容不得被解释为授权对新型AI模型的开发、发布或分发设立强制性政府许可、预先批准或许可要求。”该命令还指示司法部将AI辅助黑客攻击和未经授权访问等犯罪行为列为高优先级执法领域。 这并非特朗普首个AI相关行政令。去年12月,他签署了一项命令,要求制定统一的“国家AI政策框架”,以取代各州分散的AI法规。此次修订版的签署,反映出白宫在AI监管上寻求平衡——既希望确保安全,又不愿过度束缚行业发展。 值得注意的是,特朗普原计划与多位硅谷顶级CEO共同签署该命令,但最终私下完成了签署。行业观察人士认为,这一变化凸显了科技巨头对政策的影响力。

TechCrunch25天前原文

OpenAI 正加速向企业市场进军。本周二,这家 AI 实验室为旗下智能编程工具 Codex 推出了一系列新功能,旨在将其应用场景从软件工程扩展到更广泛的办公室工作。与此同时,OpenAI 还发布了一份内部报告,揭示了 Codex 在知识工作领域的实际使用情况——其用途远不止写代码。 ### 用户增长与结构变化 报告显示,Codex 的周活跃用户已超过 **500 万**,较 2 月桌面版发布时增长了 **6 倍**。虽然开发者仍是最大用户群体,但知识工作者(非技术人员)目前已占用户总数的 **20%**,且增长速度是开发者的 **3 倍**以上。这一趋势表明,AI 辅助工具正从程序员专属走向全员办公助手。 ### 六大行业插件:开箱即用 为吸引更多白领用户,OpenAI 一口气发布了 **六款专用插件**,分别针对数据分析、创意制作、销售、产品设计、股权投资和投资银行等岗位。这些插件内置于 Codex 应用内,集成了对应岗位所需的集成、指令和上下文信息,让 Codex 能够“模拟”特定职业的工作方式。OpenAI 强调,虽然插件会随着用户自定义而变得更高效,但开箱即用时就已具备实用价值。 这一动作紧跟 Anthropic 的步伐——后者在 2 月推出了企业代理程序(Enterprise Agents),5 月又发布了针对金融领域的代理工具。相比之下,长期专注消费级市场的 OpenAI 在企业客户争夺上稍显迟缓,直到今年 3 月才为 Codex 引入插件支持。 ### 新功能:Sites 与 Annotations 除了行业插件,OpenAI 还推出了 **Sites** 功能,允许 Codex 将工作成果直接输出为托管的交互式网站,而不再是本地文件。这意味着用户可以通过链接分享实时数据看板、产品原型或投资分析报告。为支撑这一功能,OpenAI 已与 **Wix、Base44、Replit、Lovable、Figma 和 Emergent** 等平台达成合作,并计划构建更大的合作伙伴生态。 另一项新功能 **Annotations** 则让用户能够在文档或文件内标记特定部分,从而实现更精准的指令和上下文操作——这对需要处理长文档的知识工作者来说尤为实用。 ### 企业战略加速 此次新功能的发布,距离 OpenAI 成立企业联合体 **OpenAI Deployment Company** 仅三周。该合资公司获得了全球投资机构超过 **40 亿美元** 的资金支持,旨在将 OpenAI 的工具更深入地整合到全球企业的业务流程中。OpenAI 首席营收官 Denise Dresser 表示:“AI 正在组织中承担越来越有意义的工作。” 从 Codex 的这步棋来看,OpenAI 显然希望让“有意义的工作”不仅限于写代码,更包括数据洞察、创意输出和商业决策。 ### 小结 从开发者工具到白领生产力平台,OpenAI 正在重新定义 Codex 的定位。六款行业插件降低了非技术用户的使用门槛,而 Sites 和 Annotations 则让输出形式更加灵活。随着企业联合体数十亿美元资金的注入,以及合作伙伴生态的完善,Codex 有望成为企业 AI 助手的核心入口。不过,面对 Anthropic 等对手的激烈竞争,OpenAI 仍需在定制化、安全性和行业深度上持续发力。

TechCrunch25天前原文

## 微软 Build 2026 大会开幕:AI 新模型、Copilot 超级应用与量子芯片齐亮相 微软年度开发者大会 Build 2026 于 6 月 2 日在旧金山正式拉开帷幕,主题演讲于美国东部时间中午 12:30 / 太平洋时间上午 9:30 进行直播。本次大会聚焦 AI 与 Windows 生态的深度融合,预计将发布多项重磅更新。 ### AI 模型与代理工具:MAI-Thinking-1 与 OpenClaw 代理 微软在大会首日推出了自研的“旗舰”AI 模型 **MAI-Thinking-1**,这是一款高级推理模型,标志着微软在模型自研道路上迈出关键一步。此前微软主要依赖 OpenAI 的模型,但双方近期已重新谈判合作协议,关系有所松动。 此外,微软还发布了基于 **OpenClaw** 的代理工具,以及一款名为 **Microsoft Scout** 的 AI 个人助手,进一步丰富其 AI 代理生态。同时,**Copilot“超级应用”** 的推出将整合多项功能,成为用户与 AI 交互的核心入口。 ### Windows 与硬件更新:Surface Laptop Ultra 与 RTX Spark 微软发布了搭载 **Nvidia RTX Spark** 的全新 **Surface Laptop Ultra**,这不仅是 Surface 产品线的重大升级,也预示着 Windows on ARM 生态的进一步扩展。此外,微软展示了 **Project Solara**——一个专为 AI 代理设备打造的操作系统,以及一款 **迷你 Surface 开发机**,为开发者提供更高效的硬件平台。 ### 量子计算突破:Majorana 2 芯片可靠性提升 1000 倍 微软在量子计算领域取得重大进展,发布了第二代拓扑量子芯片 **Majorana 2**。该芯片的量子比特(qubits)可靠性比上一代 **提升了 1000 倍**,这得益于新材料堆叠和微软 Discovery 的代理 AI 辅助。微软表示,这一突破将加速实用量子计算的到来。 ### 开发者体验升级:更拥抱 Linux 的 Windows 微软还推出了针对开发者优化的 Windows 版本,进一步整合 Linux 支持,让开发者能够在 Windows 上更顺畅地运行 Linux 工具和应用程序。 ### 如何观看与后续报道 主题演讲直播已结束,但后续还有更多分会场和技术分享。The Verge 将持续报道 Build 2026 的最新动态,包括更多 AI 模型细节、Windows 11 重大更新以及 RTX Spark 的实测表现。 > 一句话总结:微软正在从“OpenAI 依赖者”转变为“AI 全栈自研者”,同时通过硬件、量子计算和开发者生态巩固其技术护城河。

The Verge25天前原文

海信 U6 Pro 是一款扎实的中端 Mini LED 电视,而在这个价位上更是不二之选。 ## 核心亮点 - **75英寸大屏**:适合客厅或家庭影院,沉浸感十足。 - **Mini LED 技术**:相比传统 LED,Mini LED 能提供更高的对比度和亮度,黑色更深邃,亮部更生动。 - **价格优势**:原价通常接近千元,如今降至 **$850 以下**,性价比突出。 ## 适合谁买? 如果你是预算有限但追求画质的用户,U6 Pro 是绝佳选择。它不支持顶级游戏特性如 120Hz 高刷或 HDMI 2.1,但日常观影、流媒体和轻度游戏完全够用。对于非发烧友而言,这个价格买一台 75 英寸 Mini LED 电视,几乎找不到对手。 ## 行业视角 电视市场正加速向 Mini LED 和 OLED 分化。海信凭借 U6 Pro 在中端市场精准卡位,以实惠价格普及先进显示技术。亚马逊此次降价进一步拉低了入手门槛,可能带动新一轮换机潮。相比之下,同价位竞品多为传统 LED 或小尺寸 OLED,U6 Pro 在尺寸和画质之间取得了很好的平衡。 ## 小结 如果你正在寻找一台大尺寸、画质好且价格合理的电视,海信 U6 Pro 的这次促销值得关注。建议尽快下单,因为这类优惠通常限时。

ZDNet AI25天前原文

传统的代码审查往往停留在语法层面,难以验证功能是否真正满足产品需求。Baz 通过构建基于 Amazon Bedrock 和 AgentCore 的 Spec Review 智能体,实现了从“代码是否编译通过”到“功能是否符合设计意图”的跨越。 ## 痛点:代码与产品意图之间的鸿沟 在传统流程中,开发者能检查代码能否运行,却无法判断其是否实现了所有功能和设计要求。QA 团队不得不花费大量时间手动点击预览环境,验证功能行为是否与设计一致。这种人工验证不仅拖慢了交付节奏,还带来了不一致性和回归风险。随着开发速度的提升,Baz 希望自动化这一缺失的验证环节,将意图、行为和实现整合到同一个审查流程中。 ## 方案:多阶段验证流水线 Baz 的 Spec Review 智能体设计了一套精密的多阶段验证流程: 1. **需求聚合阶段**:当收到 Webhook 或手动触发后,智能体通过 MCP 协议并发查询 Figma 设计稿,并通过 REST API 从 Jira 拉取需求文档,聚合技术、产品和设计三方面的完整规格。 2. **并行验证阶段**:系统为每个需求生成独立的子智能体。这些子智能体结合**源代码仓库**的静态检查与 **Amazon Bedrock AgentCore 的浏览器工具**进行动态运行时验证——与临时环境交互,执行 DOM 检查、事件模拟和视觉比对。 ## 关键技术决策 - **选择 Bedrock AgentCore 而非自建框架**:Baz 认为,利用托管服务可以大幅降低维护成本,同时获得 AWS 原生的安全与扩展能力。 - **子智能体隔离机制**:每个需求独立验证,避免了不同测试间的相互干扰,也便于并行加速。 - **动态环境集成**:通过浏览器工具直接操作真实渲染页面,捕捉视觉和交互层面的偏差,这是传统静态分析无法做到的。 ## 业务成果 采用该方案后,Baz 实现了: - **审查效率提升 70%**:原本需要 QA 团队数小时的手动验证,现在在几分钟内完成。 - **缺陷提前发现率提高 40%**:在代码合并前就能捕捉到设计实现偏差,减少了后期返工。 - **审查标准统一**:智能体严格遵循从 Figma 和 Jira 提取的规格,消除了人工判断的主观差异。 ## 行业启示 Baz 的实践展示了 **AI Agent 在软件工程质量保障中的新范式**——从“检查代码是否正确”转向“验证体验是否符合预期”。随着 Amazon Bedrock AgentCore 等工具降低智能体开发门槛,更多团队将能构建类似的能力,让代码审查真正成为产品意图的最后一道防线。

AWS ML25天前原文
获OpenAI注资后,Opal转型打造AI音频硬件

以高端网络摄像头闻名的Opal Camera,在获得OpenAI和三星等机构4000万美元融资后,正式更名为Opal Electronics,并宣布向AI消费硬件领域全面转型。公司目前正秘密研发一款AI音频设备,预计未来三至四个月内发布,已由OpenAI CEO Sam Altman、xAI、Anthropic等高管内测。 ## 从摄像头到AI硬件:Opal的转型之路 Opal Camera最初以设计精良的C1网络摄像头走红,但公司并不满足于此。2022年,OpenAI CEO Sam Altman作为早期用户造访Opal办公室,询问能否将Whisper语音转录模型本地运行于摄像头以实现Zoom实时字幕。正是在这次会面中,OpenAI向Opal团队展示了ChatGPT预览版——这一演示彻底改变了公司的方向。Opal团队深受震撼,随即决定转型为研究实验室,并开始研发AI驱动的音频产品。 ## 4000万美元融资与明星投资阵容 Opal的转型得到了资本市场的强力支持。公司完成了4000万美元的B轮融资,领投方正是OpenAI。其他投资者包括三星、Peter Thiel、Alexis Ohanian的Seven Seven Six,以及知名科技YouTuber Marques Brownlee(MKBHD)。此轮融资于2025年第一季度完成,Opal估值约为2.75亿美元。值得注意的是,Altman本人正是因这款音频产品才决定投资Opal。 ## 神秘音频设备:是耳机还是智能音箱? Opal正在开发的AI音频设备具体形态尚未公开,但据知情人士透露,它属于“熟悉的产品类别”,且并非直接与iPhone竞争。目前该设备正在Altman、OpenAI研究人员以及xAI、Thinking Machines、Anthropic等公司高管手中测试。外界普遍猜测,它可能是一款智能耳机或类似智能音箱的设备。这与OpenAI与Jony Ive的LoveFrom合作探索个人硬件设备的传闻不谋而合——OpenAI的首款硬件产品据称也是类似智能音箱的形态。 ## 行业风向:AI硬件的新战场 Opal的转型折射出AI行业的一个新趋势:软件巨头正加速向硬件渗透。OpenAI不仅投资了Opal,还与苹果前设计总监Jony Ive联手,而xAI、Anthropic等公司也在积极布局硬件。Opal的野心是成为“消费电子界的索尼”——以设计和文化为核心,而非单纯比拼技术参数。不过,AI硬件赛道已十分拥挤:Rabbit R1、Humane AI Pin等产品相继遇冷,市场对“AI原生硬件”的接受度仍有待验证。Opal能否凭借其设计基因和OpenAI的技术背书突围,未来几个月将见分晓。

WIRED AI25天前原文

Anthropic 正在扩大其联合行业安全漏洞计划 Project Glasswing,将 Claude Mythos 的访问权限授予 15 个以上国家的约 150 家新组织。这些组织覆盖电力、水务、医疗、通信和硬件等关键基础设施领域,一旦遭受网络攻击,可能影响超过 1 亿人。此前 Anthropic 已向包括美国政府在内的 50 家初始合作伙伴开放了 Mythos Preview,用于扫描代码库漏洞。新加入的合作伙伴包括 Okta、三星、SK 海力士、SK 电信、北约及欧盟网络安全局 ENISA 等。Anthropic 表示,Mythos 是其最强大的模型,能在数周内识别数千个零日漏洞。公司预计其他 AI 公司很快会推出同等能力的模型,因此正通过 Project Glasswing 加速建立安全防护机制。此举紧随 Anthropic 秘密提交 IPO 申请及获得 650 亿美元融资、估值近万亿美元之后。

TechCrunch25天前原文