AI 资讯

每日聚合最新人工智能动态

1661

亏损中估值飙至120亿美元，网络安全公司Cyera以80倍ARR融资

新上线

## 融资概览：估值翻倍，亏损依旧据知情人士透露，数据安全初创公司 **Cyera** 即将完成由 **Evolution Equity Partners** 领投的新一轮融资，金额至少 **3 亿美元**，估值达到 **120 亿美元**。这一估值较其五个月前 90 亿美元的估值增长了约 33%，而当时该公司刚完成由 Blackstone 领投的 4 亿美元 F 轮融资。 ## 财务数据：高增速背后的隐忧 Cyera 当前年经常性收入（ARR）已超过 **1.5 亿美元**，这意味着本次估值的市销率高达 **80 倍**——这一倍数甚至超过了许多高速增长的 AI 初创公司。然而，消息人士透露，公司仍在亏损，且支出增速快于收入增速，部分成本用于大规模招聘销售团队。据 PitchBook 数据，Cyera 今年已新增 **500 个岗位**。 Cyera 发言人声称相关数字“事实性严重不准确”，但未提供具体更正。Evolution Equity Partners 则未予置评。 ## 行业背景：AI 安全赛道火热 Cyera 成立于 2021 年，主要为企业提供数据安全平台，帮助客户抵御利用 AI 工具发起的攻击。在 F 轮融资时，公司宣称其客户已覆盖 **五分之一** 的《财富》500 强企业，2025 年收入增长超过 **3 倍**。本轮融资后，Cyera 累计融资额将至少达到 **20 亿美元**。公司近期还利用资金收购了 Index Ventures 支持的 Ryft 以及成立不到一年的 Genie Security，加速技术整合。 ## 小结 Cyera 的高估值反映了市场对 AI 安全赛道的强烈信心，但 80 倍 ARR 的估值倍数也使其面临盈利压力。在烧钱扩张的同时，能否尽快实现盈利将成为投资者关注的焦点。

TechCrunch24天前原文

1662

微软 Project Solara：一个为 AI 代理而非应用设计的 Android 操作系统

新上线

微软在移动应用时代屡屡受挫，如今正将赌注押在 AI 代理上。在 Build 2026 大会上，微软发布了一款全新的基于 Android 的操作系统——**Project Solara**。该公司表示，Solara 是专为运行 AI 代理而非传统应用而设计的。 Solara 并非要立即取代现有应用，而是针对一系列概念硬件和软件，等待未来“魔法代理”的到来。其愿景是让 Solara 运行在多种专用设备上，界面由 AI 即时生成，所有功能由微软及其他公司坚信即将出现的爆炸性智能模型驱动。据微软介绍，Solara 是一个从芯片到云端的平台，旨在让代理摆脱对单一界面的依赖。微软指出，新的计算形态一直需要专业化，而这一过程复杂且昂贵。移动计算转型中，微软在应用可用性、安全性和长期支持上多次落后。但微软设想，如果有一群 AI 代理能基于上下文构建所需内容，这些问题将不复存在。 Project Solara 基于谷歌 Android 开源项目（AOSP）构建。底层操作系统被称为 **Microsoft Device Ecosystem Platform**，包含微软多项企业技术，以及一个可与多个 AI 代理交互的 shell。微软不能将其称为 Android，因为它并非授权软件包。 Solara 围绕一个名为**即时 UI**（just-in-time UI）的概念设计。不同于为手表、桌面显示器或智能眼镜手动设计界面和内容，Solara 将使用代理即时创建适合当前场景的界面。例如，一个运行完整 Android 系统的工作证牌可能只显示极简界面，而在智能显示器上，相同功能会包含更多数据和特性。不过，微软明确表示，这目前仍只是一个概念。所有这些尚未实现，但微软承诺将投入资金进行研发。

Ars Technica24天前原文

1663

AI 智能体需要 RSS 协议，就像播客离不开它一样

新上线

2013 年 Google Reader 关闭时，许多人宣告 RSS 已死。但事实证明，RSS 从未停止运转——它只是从人类阅读器转向了幕后管道。如今，AI 智能体（Agent）正在成为 RSS 的新主人。 ## RSS 的“死亡”是一次误诊 Google Reader 的关闭让 RSS 从大众视野中消失，取而代之的是社交算法推送。算法提供的“随机奖励”对人类具有成瘾性，但对 AI 智能体毫无意义。一个需要监控竞品发布、跟踪法规变化或总结研究论文的智能体，**不需要惊喜，它需要确定性和结构化**。 RSS 恰好满足智能体的四个关键需求： - **确定性列表**：只提供新内容，没有冗余干扰； - **可解析格式**：XML 结构清晰，无需猜测； - **无速率限制**：不依赖广告关系，没有 API 调用配额； - **无认证墙**：公共内容可直接访问，无需登录。相比之下，社交平台 API 几乎无法做到以上任何一点。它们频繁变更、收费，甚至直接关闭访问权限。 ## 播客行业的 250 亿美元证明 RSS 从未真正死去的最好证据是播客。**2022 年播客行业规模已达 250 亿美元**，而它的底层协议依然是 2002 年发布的 RSS。Spotify、Apple Podcasts、Overcast 等所有播客应用都通过 RSS 获取节目文件和元数据。为什么没有人“颠覆”RSS？因为它太完美了：开放、免费、无中间商、无需谈判访问权限。每一集内容的 URL 就在 feed 里，始终如此。 ## 智能体时代：RSS 的第二次生命同样的逻辑将扩展到所有需要被智能体可靠消费的文字内容。无论是为查询检索上下文的语言模型，还是检查新文件的监控智能体，或是摄入新闻通讯的摘要工具——它们都需要一个**可预测、结构化、按时间顺序排列的新内容列表**。而这正是 RSS 的全部定义。问题在于：你的内容是否以这种方式可达？还是被困在设计用于人类注意力、主动阻碍程序化访问的系统中？ ## 行动建议如果你还没有为内容提供 RSS feed，请立即行动。在你的细分领域，智能体会在算法依赖的页面之前，先找到结构化的 feed。 > 如果你在社交平台上发布内容，AI 智能体和聚合器可能无法可靠地触及它们。 **RSS 不是过去的遗产，而是 AI 时代的基础设施。** 它简单、开放、稳定，恰好填补了智能体与数据源之间的关键空白。

Hacker News8524天前原文

1664

Microsoft Build 2026 重磅发布：7 大 AI 亮点全解析

新上线

微软 Build 2026 开发者大会今日拉开帷幕，CEO 萨提亚·纳德拉与多位高管登台，带来了一系列以 AI 为核心的重大发布。从专为 AI 开发打造的迷你 Surface PC，到始终在线的个人助手，再到跨设备连接 AI 代理的操作系统，本届大会几乎完全围绕 AI 展开。以下是 7 大核心亮点速览。 ## 1. Surface RTX Spark Dev Box：专为 AI 开发者打造的迷你 PC 微软发布了 **Surface RTX Spark Dev Box**，这是一款面向开发者的迷你 PC，旨在运行本地 AI 模型。它搭载了英伟达全新的 Arm 架构 **Spark RTX 芯片**，配备 **128GB 统一内存**，并预装了 Visual Studio Code 和 GitHub Copilot 等开发工具。设备预配置了 Windows 11 Pro，默认启用深色模式，任务栏简化，无小部件。微软尚未公布定价与完整规格，但表示将于今年晚些时候在美国上市。 ## 2. 面向开发者的 Windows 更新：原生 Linux 工具与智能终端微软为 Windows 11 增加了 **Coreutils**，即“原生运行的类 Linux 命令行工具”。同时，通过 Windows Subsystem for Linux (WSL)，开发者可创建、运行和交互 Linux 容器。全新的 **Intelligent Terminal** 则能为开发者偏好的 AI 代理提供上下文支持，进一步提升开发效率。 ## 3. Project Solara：连接 AI 代理的跨设备操作系统微软展示了 **Project Solara**，一个基于 Android 的操作系统，旨在跨设备运行 AI 代理。微软与高通和联发科合作开发，该系统可作为 PC 的伴侣，或在设备间无缝交接任务。演示中出现了桌面集线器和原型设备，但距离实际产品可能还有一段时间。 ## 4. 始终在线的 AI 个人助手微软推出了一款“始终在线”的个人 AI 助手，能够持续感知上下文，主动提供提醒、日程管理和信息检索。该助手深度集成于 Windows 及微软生态，代表了从“被动响应”到“主动服务”的转变。 ## 5. 微软自研 AI 模型全面升级大会还更新了微软自研的 AI 模型系列，包括语言、视觉和多模态模型。新模型在推理效率、上下文窗口和指令遵循方面均有显著提升，并已集成到 Azure AI 和 Copilot 服务中。 ## 6. Copilot 能力扩展：从代码到全场景 GitHub Copilot 获得重大更新，不仅支持更多编程语言，还能理解整个代码库的上下文，提供更精准的代码建议。此外，Copilot 的能力扩展至 Microsoft 365 办公套件，可自动生成文档摘要、分析 Excel 数据、设计 PowerPoint 演示文稿。 ## 7. 企业级 AI 安全与治理工具微软发布了全新的 AI 安全与治理套件，帮助企业监控 AI 模型的使用、检测偏见、确保合规。该工具集包括模型审计日志、数据脱敏接口和策略自动化引擎，旨在降低企业部署 AI 的风险。 > **小结：** 本届 Build 大会清晰地展示了微软的 AI 战略：从硬件（Surface Dev Box）、系统（Project Solara）、开发工具（Windows 更新、Copilot）到模型与服务，构建一个完整的 AI 生态系统。开发者将成为这一生态的核心驱动力。

The Verge24天前原文

1665

Uber 员工 AI 支出超标：年度预算四个月花光，公司紧急设限

新上线

Uber 近期对员工 AI 使用设置了每人每月 1500 美元的支出上限，此前该公司曾鼓励员工尽可能多地使用 AI 工具，结果在四个月内就花光了全年预算。此举反映出 AI 成本高企和投资回报不明朗的行业困境。 ## 预算超标与紧急限流据 Bloomberg 报道，Uber 新规要求每位员工每月在每款 AI 编码工具（如 Anthropic 的 Claude Code 或 Cursor）上的支出不得超过 **1500 美元**。公司通过内部仪表盘追踪使用情况，员工如需超额需申请批准。这一限流措施并不令人意外——今年 4 月，Uber 首席技术官透露，该公司的年度 AI 预算在短短四个月内就已耗尽。此前，Uber 曾鼓励员工“尽可能多用 AI”，甚至在公司内部排行榜上对使用量进行排名，以激发竞争。如今，过度热情的使用直接导致了预算失控。 ## 高管质疑 AI 投资回报 Uber 首席运营官 Andrew Macdonald 近期在播客中公开质疑 AI 的生产力影响，称“很难在 AI 使用和新消费者功能之间划清界限”。他的发言与公司收紧预算的动作形成呼应，也折射出整个科技行业面临的共同难题：**AI 投资回报（ROI）在哪里？** 尽管企业纷纷向 AI 投入巨额资金，但 ROI 至今仍是一个“理论现象”，大家都在期望它最终会实现，但等待的过程中已有人开始焦虑。 ## 行业启示：AI 狂欢后的冷静期 Uber 的案例并非孤例。随着 AI 应用从实验阶段进入规模化部署，成本控制问题日益凸显。企业在鼓励创新和维持财务纪律之间需要找到平衡点。Uber 的做法——设定明确上限、提供透明度、保留例外通道——或许为其他公司提供了一个参考模板。 **AI 不是免费的午餐**，当技术热情遭遇预算红线，如何让每一分钱都产生可衡量的价值，将是下一阶段竞争的关键。

TechCrunch24天前原文

1666

AI模型发布追踪：Opus 4.8的失调率与Claude Mythos预览版相当

新上线

AI实验室正以惊人速度推出新模型，但并非每次更新都如宣传般是重大突破。ZDNET的**模型发布追踪器**帮助读者在竞争格局中评估每款模型的真实价值。最新追踪显示，Anthropic于2026年5月28日发布的**Claude Opus 4.8**，其失调率与之前的Claude Mythos预览版相似，引发行业关注。 ### Opus 4.8：更快、更便宜，但并非全能 Opus 4.8 作为Opus 4.7的替代品，以**相同价格**提供更快的推理模式，推理成本降低**三分之一**。Anthropic表示，该模型在编码基准测试中超越前代，但仍未完全击败OpenAI的GPT 5.5。此外，Anthropic强调其在“亲社会特质”上达到新高度，如支持用户自主性和以用户最佳利益行事，尽管这些定义仍显模糊。 ### 安全与诚实：Anthropic的差异化策略 Anthropic一直将模型安全与可解释性作为核心，Opus 4.8进一步强化了这一标准。Opus 4.7的诚实率已达**92%**，而4.8在减少谄媚和幻觉方面更优。然而，其失调率与Claude Mythos预览版相当，表明在控制模型行为一致性方面仍有挑战。 ### 行业背景：模型竞争白热化 2026年以来，各大AI公司密集发布新模型，但真正的突破寥寥。Opus 4.8的发布反映了行业趋势：在性能提升边际递减的背景下，**成本优化**和**安全特性**成为差异化重点。对于开发者而言，选择模型需权衡能力、成本和可靠性。 ### 追踪器价值：去伪存真 ZDNET的追踪器并非测试所有模型，而是提供关键背景信息，帮助读者判断哪些模型值得深入探索。例如，Opus 4.8的编码能力虽强，但若用户更看重创意写作或多模态能力，可能需要考虑其他选择。总之，Opus 4.8是Anthropic在安全与效率上的一次稳健迭代，但并非革命性更新。在模型泛滥的时代，保持批判性视角，结合具体场景评估模型，比盲目追逐最新发布更为重要。

ZDNet AI24天前原文

1667

微软推出新工具：用文字描述就能为AI行为测试“一键生成”

新上线

微软近日发布了名为 **ASSERT**（Adaptive Spec-driven Scoring for Evaluation and Regression Testing）的开源框架，旨在帮助开发者通过简单的自然语言描述，快速生成针对特定应用场景的AI行为测试。该工具填补了通用评估工具在应用级定制化测试方面的空白，让开发者能够更轻松地确保AI系统在具体产品中按照预期运行。 ## 从“一句话”到“一套测试”的自动化流水线 ASSERT的核心能力在于**将高层级的自然语言描述转化为结构化的测试用例**。开发者只需用文字描述AI系统应有的行为规范（例如“不要向公司外部人员发送邮件”“对机密信息仅限C级高管查看”），ASSERT便会自动执行以下步骤： 1. 将描述解析为可接受与不可接受的行为集合； 2. 生成对应的测试场景和问题； 3. 对目标AI系统运行测试并打分； 4. 记录系统的中间动作和工具调用路径，便于开发者定位失败环节。此外，开发者还可以额外提供系统上下文、工具集和约束条件，进一步定制评估范围。 ## 为什么需要应用特定的AI测试？微软负责任AI首席产品官 **Sarah Bird** 指出：“评估对于做出正确决策至关重要。如果不了解AI系统的实际行为，就很难判断它是否达到了组织的标准。”她强调，通用评估虽然能覆盖安全、合规等宏观维度，但**真正值得信赖的系统需要针对应用场景进行更多维度的测试**。例如，一个文档研究AI助手，其行为规范可能包括：信息保密级别、摘要风格、引用来源方式等，这些细节往往无法被通用评估工具捕捉。ASSERT的出现正是为了解决这一“最后一公里”问题。 ## 从开发到运维的全周期覆盖 ASSERT不仅适用于开发阶段的测试，还能在**部署后乃至持续监控**中发挥作用。这意味着开发者可以在AI系统的整个生命周期内，持续验证其行为是否符合预期。随着AI应用日益复杂——从聊天机器人到企业级自动化代理——这种动态测试能力变得愈发关键。 ## 行业背景与趋势当前，AI评估领域正从“模型能力测试”转向“应用行为验证”。OpenAI、Google等公司也在推出类似工具，但ASSERT的开源属性降低了定制化门槛。微软此举既是对自身生态的补充（如Azure AI Studio），也反映了行业对**可解释、可审计的AI行为**的迫切需求。对于开发者而言，ASSERT提供了一种低成本、高效率的方式，将抽象的政策转化为可量化的测试，从而减少“AI意外行为”带来的风险。 ## 小结 ASSERT的发布标志着AI测试工具进入“自然语言驱动”阶段。它让非AI专家也能参与行为验证，同时为专业开发者提供了深度调试的能力。随着更多组织将AI嵌入核心业务，这种从“通用评估”到“场景化测试”的进化，或将成为AI工程化落地的关键一环。

TechCrunch24天前原文

1668

Build 2026：微软 MDASH 正式发布，100+ 专业威胁狩猎 AI 代理上线

新上线

在 Build 2026 上，微软宣布其安全 AI 代理系统 **MDASH**（Microsoft Security 多模型代理扫描工具）结束预览，正式投入生产环境。该系统集成了超过 **100 个** 专业威胁狩猎 AI 代理，能够自动发现真实可利用的漏洞，并将其直接关联到 **Defender**、**GitHub 代码安全**、**Agent 365** 和 **Purview** 等企业安全组件中，帮助开发者更快地修复问题。 ## 从“噪音”到“信号”：MDASH 的核心价值长期以来，安全自动化工具面临的一大难题是 **信噪比过低**——扫描器可能产生数百甚至数千条告警，但其中真正需要紧急响应的漏洞寥寥无几。MDASH 的设计思路类似 **战场分诊**：AI 代理首先快速评估每个潜在风险的严重性和可利用性，然后优先处理那些最危险、最有可能被攻击者利用的漏洞，而不是让安全团队淹没在海量告警中。微软首席安全架构师 Aleš Holeček 表示：“AI 漏洞发现已从研究好奇心转变为生产级防御，而持久的优势在于围绕模型的代理系统，而非模型本身。”这意味着 MDASH 的成功不仅依赖底层大模型的能力，更依赖于 **代理编排、上下文关联和自动化响应** 的完整闭环。 ## 代理生态：100+ 专业代理各司其职 MDASH 此次发布的 100 多个代理并非通用型 AI，而是针对不同威胁场景专门训练的 **专业代理**。例如，某些代理专注于 **Web 应用漏洞**（如 SQL 注入、XSS），另一些则擅长 **云配置错误检测** 或 **供应链依赖分析**。这些代理可以并行工作，相互协作，甚至能根据扫描结果自动调整攻击路径模拟，以验证漏洞的实际可利用性。这种 **多代理协作** 模式显著降低了误报率。微软内部测试显示，与传统单一扫描器相比，MDASH 将需要人工介入的告警数量减少了 **70% 以上**，同时将真实漏洞的发现速度提升了 **3 倍**。 ## 融入企业安全控制平面 MDASH 的正式发布不仅仅是功能成熟，更标志着微软将其整合进更大的 **企业安全控制平面**。通过连接 Defender for Cloud、GitHub Advanced Security、Microsoft Purview 以及新推出的 Agent 365 代理管理平台，MDASH 的发现结果可以自动触发工作流——例如在 GitHub 中创建 Issue、在 Defender 中生成事件、或通过 Purview 标记敏感数据泄露风险。这种 **端到端自动化** 对于大型企业尤为重要。安全团队无需在不同工具之间切换，即可从漏洞发现到修复跟踪实现全链路闭环。微软还计划在后续版本中引入 **自适应修复建议**，即 AI 代理不仅指出问题，还能直接生成补丁代码或配置修改方案。 ## 行业影响与展望 MDASH 的发布标志着 **AI 安全代理** 从实验性工具走向企业级主流。与 CrowdStrike、Palo Alto Networks 等竞争对手的纯规则或单一模型方案不同，微软押注于 **代理生态的多样性** 和 **系统集成深度**。其优势在于： - **微软生态绑定**：Azure、GitHub、Office 365 用户可无缝接入 - **持续学习**：代理会基于实际攻击模式自动更新 - **开放扩展**：第三方安全厂商可开发自定义代理不过，MDASH 也面临挑战：代理数量越多，系统复杂度越高，**编排与协调** 将成为关键瓶颈。此外，AI 代理本身的安全性（即“守护代理的代理”）也需要持续投入。总体而言，Build 2026 的 MDASH 发布是微软在 **AI 驱动安全** 领域的重要里程碑，它让“AI 代理”不再只是概念，而是真正可落地、可规模化的企业安全基础设施。

ZDNet AI24天前原文

1669

微软在 Build 大会发布 7 款 AI 模型，首款推理模型 MAI-Thinking-1 亮相

新上线

微软在年度 Build 开发者大会上发布了 7 款新 AI 模型，其中包括其首款推理模型 **MAI-Thinking-1**。该模型拥有 **350 亿参数**，在盲测中表现优于 Anthropic 的 Sonnet 4.61，并在 SWE Bench Pro 编码基准上对齐 Opus 4.6。微软强调 MAI-Thinking-1 使用“企业级、干净且商业许可的数据”训练，以回应版权争议。该模型面向多步骤任务，目前已通过 Microsoft Foundry 提供私人预览。另一款重磅模型是 **MAI-Code-1**，专为编码优化，号称“超高效”并针对 GitHub 调优，即日起集成到 Copilot 和 VS Code 中，加入顶级编码模型竞争。此外，微软还推出了 **MAI-Image-2.5** 及其闪速版本，这是其首个文本到图像和图像到图像模型，据称在 ELO 评分上超越了 Nano Banana Pro。新模型还包括语音模型，共同构建了更完整的 AI 能力矩阵。微软 AI CEO Mustafa Suleyman 在主题演讲中重申了“人文主义超级智能”的愿景。此次发布标志着微软在基础模型领域的全面发力，从推理到编码再到多模态，旨在与 OpenAI、Anthropic 等对手正面竞争。

ZDNet AI24天前原文

1670

特朗普签署行政令：AI 模型发布前需接受政府审查，但企业可自愿选择

新上线

美国总统特朗普于 2026 年 6 月 2 日签署一项行政命令，要求建立“自愿框架”，让 AI 公司在发布前沿模型前与联邦政府共享信息，以“促进安全创新并加强关键基础设施的网络安全”。该命令承认美国 AI 产业的成功部分源于“拒绝用过度繁重的监管扼杀创新”，但同时也指出新 AI 能力伴随安全风险。命令指示多个联邦机构制定框架，在模型公开发布前“评估 AI 模型的高级网络能力”。企业可自行决定是否在发布前与政府共享模型，若选择共享，将获得特定的保密保护。此外，命令还要求联邦政府为 AI 准备网络防御，特别是针对关键基础设施。该行政令的出台背景颇为曲折。此前特朗普曾推迟一项原计划的行政令，担心其可能“妨碍”与中国的竞争。据《纽约时报》报道，早期版本允许 AI 公司自愿在发布前 14 至 90 天共享模型，而当前版本将时间缩短为发布前 30 天。值得注意的是，**Google、微软和 xAI 已于上月同意接受商务部 AI 标准与创新中心（CAISI）的发布前审查**。OpenAI 和 Anthropic 早在 2024 年拜登总统任期内就已同意与 CAISI 共享模型，作为拜登推动 AI 安全护栏的一部分。然而，特朗普政府此前在 AI 安全问题上一直采取低调态度。在前白宫 AI 顾问 David Sacks 的领导下，该政府曾采取不干预方针。此次签署的行政令明确表示不应被视为强制要求，而是自愿参与。 **行业分析**：这项行政令标志着美国 AI 监管政策的微妙转向。特朗普政府此前一直强调放松管制以促进创新，但面对 AI 模型日益强大的网络攻击能力，尤其是对关键基础设施的潜在威胁，政府不得不寻求一种平衡。自愿框架的设计既避免了强制监管可能带来的创新抑制，又为政府提供了了解前沿模型安全性的窗口。然而，企业是否自愿参与仍是未知数——尤其对于希望保持技术领先优势的公司而言，提前披露模型细节可能带来竞争风险。 **关键看点**： - **时间窗口缩短**：从早期版本的 14-90 天缩短至 30 天，降低了企业的披露负担，但也可能使政府审查时间不足。 - **企业参与分化**：头部公司如 Google、微软、xAI、OpenAI、Anthropic 已表态参与，但其他中小型 AI 公司可能持观望态度。 - **与中国竞争背景**：命令的出台与中美 AI 竞赛密切相关，特朗普政府试图在不牺牲创新速度的前提下建立安全防护。总体而言，这项行政令是美国在 AI 治理上的一次试探性举措。它既非强制监管，也非完全放任，而是试图通过“自愿+保密”机制在安全与创新之间寻找平衡点。未来，这一框架能否有效运行，将取决于企业的参与意愿和政府评估能力的实际效果。

The Verge24天前原文

1671

微软发布Scout：基于OpenClaw的自主AI Agent，全天候替你干活

新上线

微软在Build 2026大会上正式推出**Scout**，这是其首个基于**OpenClaw**框架的“自动驾驶”AI Agent。与需要用户逐次提示的Copilot不同，Scout被设计为始终在后台运行的**自动飞行员**，拥有独立的Entra身份，能自主跨应用执行任务。 ## 核心能力与集成 Scout可连接**Teams、Outlook、OneDrive和SharePoint**，并访问聊天、邮件、日历和联系人数据。用户通过Teams即可调用它，它还能通过**MCP协议**与浏览器及外部应用交互，覆盖云端、桌面和Web端。其典型任务包括：协调会议时间、根据工作安排自动锁定日历时段，甚至识别“决策停滞”等风险，提前预警。 ## 架构与可用性 Scout基于微软此前开源的**OpenClaw** Agent框架构建，该框架允许开发者创建能长期运行、具备记忆和工具调用能力的Agent。微软强调，Scout拥有独立的**Entra身份**，意味着其行为可被企业IT部门通过Intune策略统一管控，并需要用户“选择加入”认证。目前Scout仅作为**实验性功能**向微软Frontier项目客户开放。 ## 行业背景与挑战 Scout是微软“代理化”战略的最新一步。此前微软已在Microsoft 365中推出**Agent Mode**（在Word/Excel内与Copilot交互）和**Copilot Cowork**（类似Anthropic Claude Cowork的独立任务Agent）。然而，微软一直面临企业客户对Microsoft 365 Copilot付费意愿低的困境——仅约**3%**的M365客户订阅了Copilot（每人每月30美元），累计付费用户约**1500万**。Scout这类“无人值守”Agent能否提升用户粘性和付费转化，仍是关键考验。 ## 小结 Scout的推出标志着AI助手从“被动响应”向“主动代理”的转变。与Google Project Mariner、Anthropic Computer Use等竞品相比，微软的优势在于其深度绑定的办公生态和IT治理能力。但企业是否会为“永远在线的AI员工”买单，还需市场验证。

Hacker News9424天前原文

1672

数学家警告：AI 正威胁数学研究，行业影响引发《莱顿宣言》

新上线

## 核心结论国际数学联盟（IMU）于 2026 年 6 月 2 日正式发布《莱顿宣言》，公开警示人工智能对数学研究构成的系统性威胁。这份由 16 位研究者历经八个月起草的宣言，已被 IMU 背书，并获得数百名数学家签名支持。 ## 背景：AI 的“入侵”已非假设宣言的发布时机耐人寻味——就在两周前，OpenAI 公开宣称其 AI 模型推翻了一个存在 80 年之久的几何猜想。这标志着 AI 不再只是数学家的辅助工具，而是开始直接参与数学发现的核心环节。帝国理工学院数学家 Kevin Buzzard 指出：“数学家们应该震惊地发现，科技公司突然对他们的工作产生了浓厚兴趣。”《莱顿宣言》正是对这一趋势的深思熟虑回应。 ## 两大核心威胁 ### 1. 不可靠的“伪证明”泛滥宣言指出，AI 模型能够生成“看似合理但不可靠（甚至错误）的论证”，这些论证难以与正确的数学证明区分。这给审稿人带来巨大压力，并“危及我们对证明正确性、透明性和独立可验证性的传统标准”。牛津大学计算机科学系主任 Leslie Ann Goldberg 警告：“不准确的 AI 生成草稿制作成本极低，存在用错误结论污染文献的风险。一旦发生，错误将随着新结果建立在错误基础上而扩散。” ### 2. 学术引用的伦理困境宣言同时强调，基于已发表作品训练的模型，其输出经常未能恰当引用所综合的人类工作。这不仅模糊了学术贡献的归属，更可能加速“无源知识”的传播，损害数学研究的公信力。 ## 对行业与学科的影响宣言特别关注 AI 对**学生和早期职业数学家**的不成比例影响。这些群体更可能依赖 AI 工具，也更容易因学术规范松动而丧失独立研究能力。长期来看，这将威胁整个学科的未来。 ## 结语《莱顿宣言》并非全盘否定 AI 的价值，而是呼吁数学界在拥抱技术的同时，守住学术诚信的底线。它要求科技公司、学术机构和资助者共同制定准则，确保 AI 在数学领域的应用透明、可审计且尊重人类贡献。这场博弈的结果，将定义未来数学研究的走向。

Ars Technica24天前原文

1673

马丁·斯科塞斯成为好莱坞最不可能的AI代言人

新上线

好莱坞传奇导演**马丁·斯科塞斯**（Martin Scorsese）近日以一种出人意料的方式拥抱了人工智能——他正式成为AI图像生成初创公司**Black Forest Labs**的合作伙伴兼顾问。据《纽约时报》6月2日报道，这位82岁的导演将利用该公司的AI技术进行**故事板创作**，而非电影拍摄或后期制作中的其他环节。斯科塞斯在声明中表示：“70年来，我一直亲手绘制故事板。”他认为，AI工具能让他更快、更高效地向摄影师和美术指导传达自己的视觉构想。这一应用场景虽然有限，却标志着好莱坞对AI态度的**显著软化**。 Black Forest Labs是一家总部位于德国弗赖堡的70人初创公司，其AI图像生成技术已嵌入**Adobe、Canva、微软和Meta**等主流平台。公司最新估值达**32.5亿美元**，投资方包括由斯科塞斯经纪人Rick Yorn联合创立的BroadLight Capital。值得注意的是，该团队正是**Stable Diffusion**的原班人马。据《连线》报道，他们近期拒绝了与**Elon Musk的xAI**合作，原因是此前在Grok图像生成器上的合作因内容安全争议而终止。尽管斯科塞斯的使用范围仅限于前期的可视化沟通，但这一合作仍可能引发部分业内人士的担忧。不过，这已是近期好莱坞对AI态度松动的又一例证。从编剧工会与制片方就AI使用达成协议，到多位导演尝试AI辅助制作，行业正逐步探索AI的边界。斯科塞斯的加入，无疑为这场讨论增添了**最具分量的注脚**。

TechCrunch24天前原文

1674

微软首款高级推理AI模型MAI-Thinking-1亮相Build 2026

新上线

在Build 2026开发者大会上，微软一口气发布了七款自研AI模型，其中最引人注目的是旗舰级推理模型**MAI-Thinking-1**。这标志着微软在AI模型自研道路上迈出了关键一步——去年它才推出首批自研模型，此前主要依赖OpenAI的技术。两家公司近期已重新谈判合作协议，以逐步松绑关系。 ## MAI-Thinking-1：中等规模，对标顶尖微软表示，MAI-Thinking-1是一个“中等规模模型”，在关键软件工程基准测试中“媲美领先模型”。公司强调，该模型“从头开始使用干净数据训练，未从第三方模型蒸馏”。这既是对数据质量的自信，也暗含与OpenAI等对手的差异化竞争策略。 ## 七款模型覆盖多模态与开发场景除MAI-Thinking-1外，其余六款模型分别聚焦图像生成、转录、语音和代码领域： - **MAI-Image 2.5及Flash版**：支持文生图和图像编辑 - **MAI-Transcribe-1.5**：号称“比竞品快5倍”的转录模型 - **MAI-Voice-2及Flash版（即将推出）**：新增15种语言和更多语音选项 - **MAI-Code-1-Flash**：高效推理的代码模型，已集成至GitHub Copilot和Visual Studio Code ## 战略意义：从OpenAI依赖到独立生态微软此次大规模推出自研模型，正值其与OpenAI关系调整之际。去年双方签署了更松散的协议，微软开始减少对单一供应商的依赖。MAI-Thinking-1的发布，意味着微软在**推理能力**这一关键领域拥有了自己的王牌，而非仅仅依赖GPT系列。值得注意的是，微软强调“无蒸馏”训练——这直接回应了业界对模型训练数据来源的争议。此前有研究指出，部分模型可能通过蒸馏技术“抄袭”其他模型能力。微软此举意在树立技术独立性和数据合规形象。 ## 行业影响与展望微软自研模型矩阵的完善，将加剧AI基础设施层的竞争。一方面，Azure云服务可直接调用这些模型，降低客户对第三方模型的依赖；另一方面，GitHub Copilot等开发工具将获得更深度、更定制化的模型支持。 MAI-Thinking-1的“中等规模”定位也值得玩味：它避开与GPT-4o、Claude 3.5等超大模型的直接对抗，转而通过高效训练和垂直优化实现“小而美”。这种策略可能更适合企业级部署，尤其对成本敏感的场景。 Build 2026上，微软还展示了量子计算芯片等前沿进展。但就AI而言，**从“OpenAI的合作伙伴”到“自研模型玩家”的转型**，才是今年最清晰的信号。

The Verge24天前原文

1675

微软发布 Scout：基于 OpenClaw 框架的个性化 AI 助手

新上线

微软在 Build 大会上正式推出 **Scout**，一款基于 **OpenClaw** 框架构建的 AI 助手，旨在将 OpenClaw 的强大与灵活性引入 Microsoft 365 生态系统。Scout 是一款始终在线的代理型助手，拥有持久的身份和风格，用户可为其命名（例如演示中的“Sebastian”），并通过持续反馈来定制自动化任务。 Scout 的核心理念是“适应性”与“个性化”。微软副总裁 Omar Shahine 表示，每个人都有自己的工作习惯，Scout 能够将这些模式编码为“记忆”和“技能”，并持久保存在代理中。随着用户不断训练，代理会变得更了解用户，获得更多自主权，甚至能做出判断。这种定制化循环——助手从用户行为中学习并随时间变得更强大——正是消费级 AI 工具黏性的关键：你投入越多，越难离开。 Scout 通过微软的 **Frontier 计划** 提供给早期用户，需订阅 **GitHub Copilot** 才能使用。它基于云端，但可跨桌面和浏览器运行，便于连接收件箱、日历等系统。预装技能包括日历管理和会议议程起草，但 Shahine 认为用户自创的技能才是真正价值所在。针对 AI 代理可能失控的担忧（OpenClaw 曾出现过代理在研究员收件箱中行为异常的事件），Scout 内置了 **安全防护系统**，持续检查操作是否符合预设准则，每次检查都会生成审计追踪。Scout 是微软在 Build 大会发布的一系列 AI 产品之一，标志着微软在 AI 代理领域的进一步深入。

TechCrunch24天前原文

1676

安卓手机即将能识别假冒来电和深度伪造诈骗

新上线

谷歌在6月的安卓功能更新中，推出了针对深度伪造电话诈骗的自动防护功能。这项新功能主要针对“冒充诈骗”——根据FTC数据，2024年美国这类诈骗造成的损失接近30亿美元。随着AI语音克隆工具的进步，骗子更容易模仿熟人的声音和号码进行诈骗。谷歌的解决方案基于其此前为金融电话验证推出的系统，现在扩展到所有联系人。当来电显示为联系人时，手机会通过Google Phone、Google Messages和Google通讯录三款应用协同验证。具体机制是：骗子通常使用在线中继来伪造号码，而真正的来电会包含一个来自Google拨号应用的确认信号。如果该信号缺失，系统会通过Messages向被冒充的联系人发送一个经过认证的RCS消息，确认其是否正在拨打该电话。若对方回复未拨打电话，则判定为诈骗。该功能适用于Android 12及以上设备，但需要安装谷歌的三款通讯应用。Pixel和摩托罗拉手机预装这些应用，三星也已全面转向Google Messages。不过，由于三星自有拨号应用用户众多，实际覆盖范围可能受限。此外，本次更新还包括其他功能：类似AirDrop的快速分享改进、更多AI集成等。谷歌正通过系统级防护应对AI诈骗威胁，但用户仍需保持警惕，因为技术手段并非万能。

Ars Technica24天前原文

1677

微软 Scout 上线：永不掉线的 AI 同事，帮你搞定无聊的办公室杂务

新上线

在微软 Build 开发者大会上，微软正式推出 **Scout**，一个基于 Teams 的始终在线 AI 代理。Scout 可以访问你的工作消息、日历和邮件，自动执行任务、重新安排冲突的会议、起草专业的回复。它本质上是企业版的 OpenClaw，专为办公室白领设计，你可以像对待人类同事一样在 Teams 中直接给它发指令。 Scout 是微软“代理优先”转型的一部分，旨在自动化知识工作者的软件使用方式。微软企业副总裁 Omar Shahine 表示：“Scout 就像一个私人助理，你下班了它还在工作。”当你闲聊休息时，Scout 会忙着为下周全员会议锁定时间、基于最新消息生成发言要点。目前 Scout 已面向小部分客户开放，并计划扩大范围。除了 Teams 集成，微软还测试一款桌面应用，今日起面向选择“前沿”功能访问权限的订阅者推出，但需同时拥有 GitHub Copilot 订阅。用户可设置目标和偏好，让 Scout 主动分配任务。例如，Shahine 告诉 Scout 永远保护家庭晚餐时间，因此当会议被安排在晚餐时段时，代理会自动标记并向同事建议重新安排。Scout 还能根据邮件和消息创建承诺清单，发送提醒并起草跟进计划。当然，早期版本可能会有些粗糙。

WIRED AI24天前原文

1678

微软 Scout 全新 AI 个人助理登场：基于 OpenClaw 构建，比 Copilot 更强大

新上线

微软在 Build 2026 大会上正式推出 **Microsoft Scout**，这是一款基于 OpenClaw 构建的 **始终在线 AI 个人助理**，不同于现有的 Copilot，Scout 能够主动监控日历、交通、邮件和 Teams 对话，为用户提供日程建议、费用报告、邮件草稿等全方位协助。 ## 什么是 Scout？ Scout 被微软称为“首款真正的个人助理”。它与 Microsoft 365 深度集成，但能力远不止于聊天。Scout 可以 **主动打电话提醒用户出发时间**，根据实时路况和日程安排建议最佳出门时机，还能在后台阅读 Teams 线程和邮件，自动提炼重要事项。 ## 与 Copilot 有何不同？ | 特性 | Copilot | Scout | |------|---------|-------| | 交互方式 | 被动聊天 | 主动通知与通话 | | 感知范围 | 当前文档/应用 | 日历、交通、邮件、Teams | | 运行模式 | 应用内嵌入 | 桌面客户端 + 云端始终在线 | Scout 更像一位 **真人助理**，不仅回答问题，还会主动“操心”你的日程与任务。 ## 当前进展与未来计划 - 本周起向美国 **Frontier 客户** 提供桌面预览版 - 未来几个月将推出更广泛的云版本 - 内部已有 **3000 多名微软员工** 在使用，用于安排会议、预订旅行、填写表单等微软高管 Omar Shahine 表示：“很多人用它成为更好的自己——我们都有想达成的目标，但常常没时间去做，Scout 帮你找回时间。” ## 行业意义 Scout 的推出标志着 AI 助手从“被动响应”走向“主动服务”。在 Google 推出类似 OpenClaw 助手的背景下，微软希望借助 Scout 在 **企业级个人助理市场** 占据先机。未来，Scout 可能成为微软 365 生态中不可或缺的“数字员工”。

The Verge24天前原文

1679

微软推出新标准，让开发者更精准控制AI代理行为

新上线

随着AI代理能力不断增强，企业在将其部署到各种应用、工作流和产品中时，面临一个新挑战：如何确保代理在不同环境下按预期行动。微软正通过一项名为 **Agent Control Specification (ACS)** 的新开源标准来解决这一问题，旨在为开发者提供更一致、更细粒度的方式来控制AI代理的允许行为。 ACS本质上允许开发者、合规和安全团队为代理定义自己的策略。这些规则可以规定代理可以做什么、禁止做什么、何时需要人工审批操作，以及应记录哪些证据供后续审查。当代理执行任务时，策略文件会在多个拦截点被检查，确保其不越界。当前，开发者通常通过系统提示词、应用代码中的自定义检查或分类器来管控AI行为，但这些方法往往导致控制碎片化，难以审计和跨框架复用。ACS将这些控制整合到一个通用治理层中。微软表示，该规范可在代理工作流的多个节点检查其是否遵守护栏——包括接收输入前、调用工具前、工具返回结果后以及最终响应发送给用户前。策略可以允许、阻止操作，编辑敏感信息，甚至请求人工批准。开发者还可以插入输入输出分类器、用LLM作为策略裁判，以及检查工具调用、工具选择、输入准确性、输出使用和响应的逻辑。由于这些策略可以写成单个文件，因此可以随代理一起打包，使安全策略能跨不同框架和环境跟随代理。ACS现以SDK形式发布，并提供了针对LangChain、OpenAI Agents SDK和Anthropic Agents SDK的插件。 ## 行业背景与意义 AI代理的自主性提升带来了新的治理需求。工具误用或意外操作可能导致级联故障，企业急需标准化的控制手段。ACS的推出填补了这一空白，它将分散的控制点统一为可移植的策略文件，降低了合规风险，也使得代理行为更可预测。对于采用多框架的企业而言，ACS的跨平台特性尤为关键——策略可以一次定义，随处执行。 ## 小结微软ACS为AI代理治理提供了一种标准化、可扩展的方案。通过将安全策略与代理捆绑，企业可以在不牺牲灵活性的前提下，实现对代理行为的精细化管控。这一举措有望推动AI代理在企业级应用中的安全落地。

TechCrunch24天前原文

1680

谷歌电话 App 新增防诈骗功能：AI 识别冒充联系人的诈骗电话

新上线

谷歌正在为其 Phone by Google 应用推出一项新功能，旨在保护用户免受 AI 冒充诈骗的侵害。当用户接到一个看似来自联系人、但实际为诈骗分子伪装的电话时，应用会弹出警告提示，帮助用户及时挂断。该功能是谷歌 6 月 Android 更新的一部分，默认在运行 Android 12 及更高版本的 Pixel 手机上启用。 ## 诈骗威胁日益严峻随着 AI 技术的发展，冒充诈骗已成为一个严重问题。据 FBI 报告，仅 2025 年一年，美国人因 AI 诈骗损失超过 **8.93 亿美元**。诈骗者通常会伪造联系人的电话号码，并利用 AI 技术模仿其声音，冒充亲友或权威人物进行诈骗。 ## 工作原理 Phone by Google 的防诈骗功能基于 **端到端加密的富通信服务（RCS）** 技术。当用户和某个信任的联系人双方都使用 Phone by Google 时，联系人的设备会发送一个“静默确认信号”来验证电话的真实性。如果诈骗者试图伪造该号码，这个确认信号就会缺失，应用便会向用户发出警告。通知会显示“**可能有人正冒充您的联系人给您打电话**”，并提供挂断选项。谷歌表示，该功能默认开启，且其他应用也可以采用这一技术。 ## 更广泛的 Android 更新除了电话防诈骗功能，谷歌 6 月的 Android 更新还包括： - 为更多设备（包括三星 Galaxy S25 系列）增加对 Apple AirDrop 的支持 - 将个人安全应用开放给 13 岁以下儿童 - 在 Google Photos 中广泛推出 AI 服装试穿功能 - 通过 Circle to Search 查找衣物中物品的功能扩展到更多用户该功能目前仅适用于同时使用 Phone by Google 的双方，但谷歌计划未来让更多应用和平台受益。随着 AI 诈骗手段日益复杂，这一功能无疑为用户提供了一层重要的安全防护。

The Verge24天前原文