SheepNav

AI 资讯

每日聚合最新人工智能动态

## 融资概览:估值翻倍,亏损依旧 据知情人士透露,数据安全初创公司 **Cyera** 即将完成由 **Evolution Equity Partners** 领投的新一轮融资,金额至少 **3 亿美元**,估值达到 **120 亿美元**。这一估值较其五个月前 90 亿美元的估值增长了约 33%,而当时该公司刚完成由 Blackstone 领投的 4 亿美元 F 轮融资。 ## 财务数据:高增速背后的隐忧 Cyera 当前年经常性收入(ARR)已超过 **1.5 亿美元**,这意味着本次估值的市销率高达 **80 倍**——这一倍数甚至超过了许多高速增长的 AI 初创公司。然而,消息人士透露,公司仍在亏损,且支出增速快于收入增速,部分成本用于大规模招聘销售团队。据 PitchBook 数据,Cyera 今年已新增 **500 个岗位**。 Cyera 发言人声称相关数字“事实性严重不准确”,但未提供具体更正。Evolution Equity Partners 则未予置评。 ## 行业背景:AI 安全赛道火热 Cyera 成立于 2021 年,主要为企业提供数据安全平台,帮助客户抵御利用 AI 工具发起的攻击。在 F 轮融资时,公司宣称其客户已覆盖 **五分之一** 的《财富》500 强企业,2025 年收入增长超过 **3 倍**。 本轮融资后,Cyera 累计融资额将至少达到 **20 亿美元**。公司近期还利用资金收购了 Index Ventures 支持的 Ryft 以及成立不到一年的 Genie Security,加速技术整合。 ## 小结 Cyera 的高估值反映了市场对 AI 安全赛道的强烈信心,但 80 倍 ARR 的估值倍数也使其面临盈利压力。在烧钱扩张的同时,能否尽快实现盈利将成为投资者关注的焦点。

TechCrunch24天前原文
微软 Project Solara:一个为 AI 代理而非应用设计的 Android 操作系统

微软在移动应用时代屡屡受挫,如今正将赌注押在 AI 代理上。在 Build 2026 大会上,微软发布了一款全新的基于 Android 的操作系统——**Project Solara**。该公司表示,Solara 是专为运行 AI 代理而非传统应用而设计的。 Solara 并非要立即取代现有应用,而是针对一系列概念硬件和软件,等待未来“魔法代理”的到来。其愿景是让 Solara 运行在多种专用设备上,界面由 AI 即时生成,所有功能由微软及其他公司坚信即将出现的爆炸性智能模型驱动。 据微软介绍,Solara 是一个从芯片到云端的平台,旨在让代理摆脱对单一界面的依赖。微软指出,新的计算形态一直需要专业化,而这一过程复杂且昂贵。移动计算转型中,微软在应用可用性、安全性和长期支持上多次落后。但微软设想,如果有一群 AI 代理能基于上下文构建所需内容,这些问题将不复存在。 Project Solara 基于谷歌 Android 开源项目(AOSP)构建。底层操作系统被称为 **Microsoft Device Ecosystem Platform**,包含微软多项企业技术,以及一个可与多个 AI 代理交互的 shell。微软不能将其称为 Android,因为它并非授权软件包。 Solara 围绕一个名为**即时 UI**(just-in-time UI)的概念设计。不同于为手表、桌面显示器或智能眼镜手动设计界面和内容,Solara 将使用代理即时创建适合当前场景的界面。例如,一个运行完整 Android 系统的工作证牌可能只显示极简界面,而在智能显示器上,相同功能会包含更多数据和特性。 不过,微软明确表示,这目前仍只是一个概念。所有这些尚未实现,但微软承诺将投入资金进行研发。

Ars Technica24天前原文

2013 年 Google Reader 关闭时,许多人宣告 RSS 已死。但事实证明,RSS 从未停止运转——它只是从人类阅读器转向了幕后管道。如今,AI 智能体(Agent)正在成为 RSS 的新主人。 ## RSS 的“死亡”是一次误诊 Google Reader 的关闭让 RSS 从大众视野中消失,取而代之的是社交算法推送。算法提供的“随机奖励”对人类具有成瘾性,但对 AI 智能体毫无意义。一个需要监控竞品发布、跟踪法规变化或总结研究论文的智能体,**不需要惊喜,它需要确定性和结构化**。 RSS 恰好满足智能体的四个关键需求: - **确定性列表**:只提供新内容,没有冗余干扰; - **可解析格式**:XML 结构清晰,无需猜测; - **无速率限制**:不依赖广告关系,没有 API 调用配额; - **无认证墙**:公共内容可直接访问,无需登录。 相比之下,社交平台 API 几乎无法做到以上任何一点。它们频繁变更、收费,甚至直接关闭访问权限。 ## 播客行业的 250 亿美元证明 RSS 从未真正死去的最好证据是播客。**2022 年播客行业规模已达 250 亿美元**,而它的底层协议依然是 2002 年发布的 RSS。Spotify、Apple Podcasts、Overcast 等所有播客应用都通过 RSS 获取节目文件和元数据。 为什么没有人“颠覆”RSS?因为它太完美了:开放、免费、无中间商、无需谈判访问权限。每一集内容的 URL 就在 feed 里,始终如此。 ## 智能体时代:RSS 的第二次生命 同样的逻辑将扩展到所有需要被智能体可靠消费的文字内容。无论是为查询检索上下文的语言模型,还是检查新文件的监控智能体,或是摄入新闻通讯的摘要工具——它们都需要一个**可预测、结构化、按时间顺序排列的新内容列表**。而这正是 RSS 的全部定义。 问题在于:你的内容是否以这种方式可达?还是被困在设计用于人类注意力、主动阻碍程序化访问的系统中? ## 行动建议 如果你还没有为内容提供 RSS feed,请立即行动。在你的细分领域,智能体会在算法依赖的页面之前,先找到结构化的 feed。 > 如果你在社交平台上发布内容,AI 智能体和聚合器可能无法可靠地触及它们。 **RSS 不是过去的遗产,而是 AI 时代的基础设施。** 它简单、开放、稳定,恰好填补了智能体与数据源之间的关键空白。

Hacker News8524天前原文

微软 Build 2026 开发者大会今日拉开帷幕,CEO 萨提亚·纳德拉与多位高管登台,带来了一系列以 AI 为核心的重大发布。从专为 AI 开发打造的迷你 Surface PC,到始终在线的个人助手,再到跨设备连接 AI 代理的操作系统,本届大会几乎完全围绕 AI 展开。以下是 7 大核心亮点速览。 ## 1. Surface RTX Spark Dev Box:专为 AI 开发者打造的迷你 PC 微软发布了 **Surface RTX Spark Dev Box**,这是一款面向开发者的迷你 PC,旨在运行本地 AI 模型。它搭载了英伟达全新的 Arm 架构 **Spark RTX 芯片**,配备 **128GB 统一内存**,并预装了 Visual Studio Code 和 GitHub Copilot 等开发工具。设备预配置了 Windows 11 Pro,默认启用深色模式,任务栏简化,无小部件。微软尚未公布定价与完整规格,但表示将于今年晚些时候在美国上市。 ## 2. 面向开发者的 Windows 更新:原生 Linux 工具与智能终端 微软为 Windows 11 增加了 **Coreutils**,即“原生运行的类 Linux 命令行工具”。同时,通过 Windows Subsystem for Linux (WSL),开发者可创建、运行和交互 Linux 容器。全新的 **Intelligent Terminal** 则能为开发者偏好的 AI 代理提供上下文支持,进一步提升开发效率。 ## 3. Project Solara:连接 AI 代理的跨设备操作系统 微软展示了 **Project Solara**,一个基于 Android 的操作系统,旨在跨设备运行 AI 代理。微软与高通和联发科合作开发,该系统可作为 PC 的伴侣,或在设备间无缝交接任务。演示中出现了桌面集线器和原型设备,但距离实际产品可能还有一段时间。 ## 4. 始终在线的 AI 个人助手 微软推出了一款“始终在线”的个人 AI 助手,能够持续感知上下文,主动提供提醒、日程管理和信息检索。该助手深度集成于 Windows 及微软生态,代表了从“被动响应”到“主动服务”的转变。 ## 5. 微软自研 AI 模型全面升级 大会还更新了微软自研的 AI 模型系列,包括语言、视觉和多模态模型。新模型在推理效率、上下文窗口和指令遵循方面均有显著提升,并已集成到 Azure AI 和 Copilot 服务中。 ## 6. Copilot 能力扩展:从代码到全场景 GitHub Copilot 获得重大更新,不仅支持更多编程语言,还能理解整个代码库的上下文,提供更精准的代码建议。此外,Copilot 的能力扩展至 Microsoft 365 办公套件,可自动生成文档摘要、分析 Excel 数据、设计 PowerPoint 演示文稿。 ## 7. 企业级 AI 安全与治理工具 微软发布了全新的 AI 安全与治理套件,帮助企业监控 AI 模型的使用、检测偏见、确保合规。该工具集包括模型审计日志、数据脱敏接口和策略自动化引擎,旨在降低企业部署 AI 的风险。 > **小结:** 本届 Build 大会清晰地展示了微软的 AI 战略:从硬件(Surface Dev Box)、系统(Project Solara)、开发工具(Windows 更新、Copilot)到模型与服务,构建一个完整的 AI 生态系统。开发者将成为这一生态的核心驱动力。

The Verge24天前原文

Uber 近期对员工 AI 使用设置了每人每月 1500 美元的支出上限,此前该公司曾鼓励员工尽可能多地使用 AI 工具,结果在四个月内就花光了全年预算。此举反映出 AI 成本高企和投资回报不明朗的行业困境。 ## 预算超标与紧急限流 据 Bloomberg 报道,Uber 新规要求每位员工每月在每款 AI 编码工具(如 Anthropic 的 Claude Code 或 Cursor)上的支出不得超过 **1500 美元**。公司通过内部仪表盘追踪使用情况,员工如需超额需申请批准。这一限流措施并不令人意外——今年 4 月,Uber 首席技术官透露,该公司的年度 AI 预算在短短四个月内就已耗尽。 此前,Uber 曾鼓励员工“尽可能多用 AI”,甚至在公司内部排行榜上对使用量进行排名,以激发竞争。如今,过度热情的使用直接导致了预算失控。 ## 高管质疑 AI 投资回报 Uber 首席运营官 Andrew Macdonald 近期在播客中公开质疑 AI 的生产力影响,称“很难在 AI 使用和新消费者功能之间划清界限”。他的发言与公司收紧预算的动作形成呼应,也折射出整个科技行业面临的共同难题:**AI 投资回报(ROI)在哪里?** 尽管企业纷纷向 AI 投入巨额资金,但 ROI 至今仍是一个“理论现象”,大家都在期望它最终会实现,但等待的过程中已有人开始焦虑。 ## 行业启示:AI 狂欢后的冷静期 Uber 的案例并非孤例。随着 AI 应用从实验阶段进入规模化部署,成本控制问题日益凸显。企业在鼓励创新和维持财务纪律之间需要找到平衡点。Uber 的做法——设定明确上限、提供透明度、保留例外通道——或许为其他公司提供了一个参考模板。 **AI 不是免费的午餐**,当技术热情遭遇预算红线,如何让每一分钱都产生可衡量的价值,将是下一阶段竞争的关键。

TechCrunch24天前原文

AI实验室正以惊人速度推出新模型,但并非每次更新都如宣传般是重大突破。ZDNET的**模型发布追踪器**帮助读者在竞争格局中评估每款模型的真实价值。最新追踪显示,Anthropic于2026年5月28日发布的**Claude Opus 4.8**,其失调率与之前的Claude Mythos预览版相似,引发行业关注。 ### Opus 4.8:更快、更便宜,但并非全能 Opus 4.8 作为Opus 4.7的替代品,以**相同价格**提供更快的推理模式,推理成本降低**三分之一**。Anthropic表示,该模型在编码基准测试中超越前代,但仍未完全击败OpenAI的GPT 5.5。此外,Anthropic强调其在“亲社会特质”上达到新高度,如支持用户自主性和以用户最佳利益行事,尽管这些定义仍显模糊。 ### 安全与诚实:Anthropic的差异化策略 Anthropic一直将模型安全与可解释性作为核心,Opus 4.8进一步强化了这一标准。Opus 4.7的诚实率已达**92%**,而4.8在减少谄媚和幻觉方面更优。然而,其失调率与Claude Mythos预览版相当,表明在控制模型行为一致性方面仍有挑战。 ### 行业背景:模型竞争白热化 2026年以来,各大AI公司密集发布新模型,但真正的突破寥寥。Opus 4.8的发布反映了行业趋势:在性能提升边际递减的背景下,**成本优化**和**安全特性**成为差异化重点。对于开发者而言,选择模型需权衡能力、成本和可靠性。 ### 追踪器价值:去伪存真 ZDNET的追踪器并非测试所有模型,而是提供关键背景信息,帮助读者判断哪些模型值得深入探索。例如,Opus 4.8的编码能力虽强,但若用户更看重创意写作或多模态能力,可能需要考虑其他选择。 总之,Opus 4.8是Anthropic在安全与效率上的一次稳健迭代,但并非革命性更新。在模型泛滥的时代,保持批判性视角,结合具体场景评估模型,比盲目追逐最新发布更为重要。

ZDNet AI24天前原文

微软近日发布了名为 **ASSERT**(Adaptive Spec-driven Scoring for Evaluation and Regression Testing)的开源框架,旨在帮助开发者通过简单的自然语言描述,快速生成针对特定应用场景的AI行为测试。该工具填补了通用评估工具在应用级定制化测试方面的空白,让开发者能够更轻松地确保AI系统在具体产品中按照预期运行。 ## 从“一句话”到“一套测试”的自动化流水线 ASSERT的核心能力在于**将高层级的自然语言描述转化为结构化的测试用例**。开发者只需用文字描述AI系统应有的行为规范(例如“不要向公司外部人员发送邮件”“对机密信息仅限C级高管查看”),ASSERT便会自动执行以下步骤: 1. 将描述解析为可接受与不可接受的行为集合; 2. 生成对应的测试场景和问题; 3. 对目标AI系统运行测试并打分; 4. 记录系统的中间动作和工具调用路径,便于开发者定位失败环节。 此外,开发者还可以额外提供系统上下文、工具集和约束条件,进一步定制评估范围。 ## 为什么需要应用特定的AI测试? 微软负责任AI首席产品官 **Sarah Bird** 指出:“评估对于做出正确决策至关重要。如果不了解AI系统的实际行为,就很难判断它是否达到了组织的标准。”她强调,通用评估虽然能覆盖安全、合规等宏观维度,但**真正值得信赖的系统需要针对应用场景进行更多维度的测试**。 例如,一个文档研究AI助手,其行为规范可能包括:信息保密级别、摘要风格、引用来源方式等,这些细节往往无法被通用评估工具捕捉。ASSERT的出现正是为了解决这一“最后一公里”问题。 ## 从开发到运维的全周期覆盖 ASSERT不仅适用于开发阶段的测试,还能在**部署后乃至持续监控**中发挥作用。这意味着开发者可以在AI系统的整个生命周期内,持续验证其行为是否符合预期。随着AI应用日益复杂——从聊天机器人到企业级自动化代理——这种动态测试能力变得愈发关键。 ## 行业背景与趋势 当前,AI评估领域正从“模型能力测试”转向“应用行为验证”。OpenAI、Google等公司也在推出类似工具,但ASSERT的开源属性降低了定制化门槛。微软此举既是对自身生态的补充(如Azure AI Studio),也反映了行业对**可解释、可审计的AI行为**的迫切需求。对于开发者而言,ASSERT提供了一种低成本、高效率的方式,将抽象的政策转化为可量化的测试,从而减少“AI意外行为”带来的风险。 ## 小结 ASSERT的发布标志着AI测试工具进入“自然语言驱动”阶段。它让非AI专家也能参与行为验证,同时为专业开发者提供了深度调试的能力。随着更多组织将AI嵌入核心业务,这种从“通用评估”到“场景化测试”的进化,或将成为AI工程化落地的关键一环。

TechCrunch24天前原文

在 Build 2026 上,微软宣布其安全 AI 代理系统 **MDASH**(Microsoft Security 多模型代理扫描工具)结束预览,正式投入生产环境。该系统集成了超过 **100 个** 专业威胁狩猎 AI 代理,能够自动发现真实可利用的漏洞,并将其直接关联到 **Defender**、**GitHub 代码安全**、**Agent 365** 和 **Purview** 等企业安全组件中,帮助开发者更快地修复问题。 ## 从“噪音”到“信号”:MDASH 的核心价值 长期以来,安全自动化工具面临的一大难题是 **信噪比过低**——扫描器可能产生数百甚至数千条告警,但其中真正需要紧急响应的漏洞寥寥无几。MDASH 的设计思路类似 **战场分诊**:AI 代理首先快速评估每个潜在风险的严重性和可利用性,然后优先处理那些最危险、最有可能被攻击者利用的漏洞,而不是让安全团队淹没在海量告警中。 微软首席安全架构师 Aleš Holeček 表示:“AI 漏洞发现已从研究好奇心转变为生产级防御,而持久的优势在于围绕模型的代理系统,而非模型本身。”这意味着 MDASH 的成功不仅依赖底层大模型的能力,更依赖于 **代理编排、上下文关联和自动化响应** 的完整闭环。 ## 代理生态:100+ 专业代理各司其职 MDASH 此次发布的 100 多个代理并非通用型 AI,而是针对不同威胁场景专门训练的 **专业代理**。例如,某些代理专注于 **Web 应用漏洞**(如 SQL 注入、XSS),另一些则擅长 **云配置错误检测** 或 **供应链依赖分析**。这些代理可以并行工作,相互协作,甚至能根据扫描结果自动调整攻击路径模拟,以验证漏洞的实际可利用性。 这种 **多代理协作** 模式显著降低了误报率。微软内部测试显示,与传统单一扫描器相比,MDASH 将需要人工介入的告警数量减少了 **70% 以上**,同时将真实漏洞的发现速度提升了 **3 倍**。 ## 融入企业安全控制平面 MDASH 的正式发布不仅仅是功能成熟,更标志着微软将其整合进更大的 **企业安全控制平面**。通过连接 Defender for Cloud、GitHub Advanced Security、Microsoft Purview 以及新推出的 Agent 365 代理管理平台,MDASH 的发现结果可以自动触发工作流——例如在 GitHub 中创建 Issue、在 Defender 中生成事件、或通过 Purview 标记敏感数据泄露风险。 这种 **端到端自动化** 对于大型企业尤为重要。安全团队无需在不同工具之间切换,即可从漏洞发现到修复跟踪实现全链路闭环。微软还计划在后续版本中引入 **自适应修复建议**,即 AI 代理不仅指出问题,还能直接生成补丁代码或配置修改方案。 ## 行业影响与展望 MDASH 的发布标志着 **AI 安全代理** 从实验性工具走向企业级主流。与 CrowdStrike、Palo Alto Networks 等竞争对手的纯规则或单一模型方案不同,微软押注于 **代理生态的多样性** 和 **系统集成深度**。其优势在于: - **微软生态绑定**:Azure、GitHub、Office 365 用户可无缝接入 - **持续学习**:代理会基于实际攻击模式自动更新 - **开放扩展**:第三方安全厂商可开发自定义代理 不过,MDASH 也面临挑战:代理数量越多,系统复杂度越高,**编排与协调** 将成为关键瓶颈。此外,AI 代理本身的安全性(即“守护代理的代理”)也需要持续投入。 总体而言,Build 2026 的 MDASH 发布是微软在 **AI 驱动安全** 领域的重要里程碑,它让“AI 代理”不再只是概念,而是真正可落地、可规模化的企业安全基础设施。

ZDNet AI24天前原文

微软在年度 Build 开发者大会上发布了 7 款新 AI 模型,其中包括其首款推理模型 **MAI-Thinking-1**。该模型拥有 **350 亿参数**,在盲测中表现优于 Anthropic 的 Sonnet 4.61,并在 SWE Bench Pro 编码基准上对齐 Opus 4.6。微软强调 MAI-Thinking-1 使用“企业级、干净且商业许可的数据”训练,以回应版权争议。该模型面向多步骤任务,目前已通过 Microsoft Foundry 提供私人预览。 另一款重磅模型是 **MAI-Code-1**,专为编码优化,号称“超高效”并针对 GitHub 调优,即日起集成到 Copilot 和 VS Code 中,加入顶级编码模型竞争。 此外,微软还推出了 **MAI-Image-2.5** 及其闪速版本,这是其首个文本到图像和图像到图像模型,据称在 ELO 评分上超越了 Nano Banana Pro。新模型还包括语音模型,共同构建了更完整的 AI 能力矩阵。微软 AI CEO Mustafa Suleyman 在主题演讲中重申了“人文主义超级智能”的愿景。 此次发布标志着微软在基础模型领域的全面发力,从推理到编码再到多模态,旨在与 OpenAI、Anthropic 等对手正面竞争。

ZDNet AI24天前原文

美国总统特朗普于 2026 年 6 月 2 日签署一项行政命令,要求建立“自愿框架”,让 AI 公司在发布前沿模型前与联邦政府共享信息,以“促进安全创新并加强关键基础设施的网络安全”。该命令承认美国 AI 产业的成功部分源于“拒绝用过度繁重的监管扼杀创新”,但同时也指出新 AI 能力伴随安全风险。 命令指示多个联邦机构制定框架,在模型公开发布前“评估 AI 模型的高级网络能力”。企业可自行决定是否在发布前与政府共享模型,若选择共享,将获得特定的保密保护。此外,命令还要求联邦政府为 AI 准备网络防御,特别是针对关键基础设施。 该行政令的出台背景颇为曲折。此前特朗普曾推迟一项原计划的行政令,担心其可能“妨碍”与中国的竞争。据《纽约时报》报道,早期版本允许 AI 公司自愿在发布前 14 至 90 天共享模型,而当前版本将时间缩短为发布前 30 天。值得注意的是,**Google、微软和 xAI 已于上月同意接受商务部 AI 标准与创新中心(CAISI)的发布前审查**。OpenAI 和 Anthropic 早在 2024 年拜登总统任期内就已同意与 CAISI 共享模型,作为拜登推动 AI 安全护栏的一部分。 然而,特朗普政府此前在 AI 安全问题上一直采取低调态度。在前白宫 AI 顾问 David Sacks 的领导下,该政府曾采取不干预方针。此次签署的行政令明确表示不应被视为强制要求,而是自愿参与。 **行业分析**:这项行政令标志着美国 AI 监管政策的微妙转向。特朗普政府此前一直强调放松管制以促进创新,但面对 AI 模型日益强大的网络攻击能力,尤其是对关键基础设施的潜在威胁,政府不得不寻求一种平衡。自愿框架的设计既避免了强制监管可能带来的创新抑制,又为政府提供了了解前沿模型安全性的窗口。然而,企业是否自愿参与仍是未知数——尤其对于希望保持技术领先优势的公司而言,提前披露模型细节可能带来竞争风险。 **关键看点**: - **时间窗口缩短**:从早期版本的 14-90 天缩短至 30 天,降低了企业的披露负担,但也可能使政府审查时间不足。 - **企业参与分化**:头部公司如 Google、微软、xAI、OpenAI、Anthropic 已表态参与,但其他中小型 AI 公司可能持观望态度。 - **与中国竞争背景**:命令的出台与中美 AI 竞赛密切相关,特朗普政府试图在不牺牲创新速度的前提下建立安全防护。 总体而言,这项行政令是美国在 AI 治理上的一次试探性举措。它既非强制监管,也非完全放任,而是试图通过“自愿+保密”机制在安全与创新之间寻找平衡点。未来,这一框架能否有效运行,将取决于企业的参与意愿和政府评估能力的实际效果。

The Verge24天前原文

微软在Build 2026大会上正式推出**Scout**,这是其首个基于**OpenClaw**框架的“自动驾驶”AI Agent。与需要用户逐次提示的Copilot不同,Scout被设计为始终在后台运行的**自动飞行员**,拥有独立的Entra身份,能自主跨应用执行任务。 ## 核心能力与集成 Scout可连接**Teams、Outlook、OneDrive和SharePoint**,并访问聊天、邮件、日历和联系人数据。用户通过Teams即可调用它,它还能通过**MCP协议**与浏览器及外部应用交互,覆盖云端、桌面和Web端。其典型任务包括:协调会议时间、根据工作安排自动锁定日历时段,甚至识别“决策停滞”等风险,提前预警。 ## 架构与可用性 Scout基于微软此前开源的**OpenClaw** Agent框架构建,该框架允许开发者创建能长期运行、具备记忆和工具调用能力的Agent。微软强调,Scout拥有独立的**Entra身份**,意味着其行为可被企业IT部门通过Intune策略统一管控,并需要用户“选择加入”认证。目前Scout仅作为**实验性功能**向微软Frontier项目客户开放。 ## 行业背景与挑战 Scout是微软“代理化”战略的最新一步。此前微软已在Microsoft 365中推出**Agent Mode**(在Word/Excel内与Copilot交互)和**Copilot Cowork**(类似Anthropic Claude Cowork的独立任务Agent)。然而,微软一直面临企业客户对Microsoft 365 Copilot付费意愿低的困境——仅约**3%**的M365客户订阅了Copilot(每人每月30美元),累计付费用户约**1500万**。Scout这类“无人值守”Agent能否提升用户粘性和付费转化,仍是关键考验。 ## 小结 Scout的推出标志着AI助手从“被动响应”向“主动代理”的转变。与Google Project Mariner、Anthropic Computer Use等竞品相比,微软的优势在于其深度绑定的办公生态和IT治理能力。但企业是否会为“永远在线的AI员工”买单,还需市场验证。

Hacker News9424天前原文
数学家警告:AI 正威胁数学研究,行业影响引发《莱顿宣言》

## 核心结论 国际数学联盟(IMU)于 2026 年 6 月 2 日正式发布《莱顿宣言》,公开警示人工智能对数学研究构成的系统性威胁。这份由 16 位研究者历经八个月起草的宣言,已被 IMU 背书,并获得数百名数学家签名支持。 ## 背景:AI 的“入侵”已非假设 宣言的发布时机耐人寻味——就在两周前,OpenAI 公开宣称其 AI 模型推翻了一个存在 80 年之久的几何猜想。这标志着 AI 不再只是数学家的辅助工具,而是开始直接参与数学发现的核心环节。帝国理工学院数学家 Kevin Buzzard 指出:“数学家们应该震惊地发现,科技公司突然对他们的工作产生了浓厚兴趣。”《莱顿宣言》正是对这一趋势的深思熟虑回应。 ## 两大核心威胁 ### 1. 不可靠的“伪证明”泛滥 宣言指出,AI 模型能够生成“看似合理但不可靠(甚至错误)的论证”,这些论证难以与正确的数学证明区分。这给审稿人带来巨大压力,并“危及我们对证明正确性、透明性和独立可验证性的传统标准”。牛津大学计算机科学系主任 Leslie Ann Goldberg 警告:“不准确的 AI 生成草稿制作成本极低,存在用错误结论污染文献的风险。一旦发生,错误将随着新结果建立在错误基础上而扩散。” ### 2. 学术引用的伦理困境 宣言同时强调,基于已发表作品训练的模型,其输出经常未能恰当引用所综合的人类工作。这不仅模糊了学术贡献的归属,更可能加速“无源知识”的传播,损害数学研究的公信力。 ## 对行业与学科的影响 宣言特别关注 AI 对**学生和早期职业数学家**的不成比例影响。这些群体更可能依赖 AI 工具,也更容易因学术规范松动而丧失独立研究能力。长期来看,这将威胁整个学科的未来。 ## 结语 《莱顿宣言》并非全盘否定 AI 的价值,而是呼吁数学界在拥抱技术的同时,守住学术诚信的底线。它要求科技公司、学术机构和资助者共同制定准则,确保 AI 在数学领域的应用透明、可审计且尊重人类贡献。这场博弈的结果,将定义未来数学研究的走向。

Ars Technica24天前原文

好莱坞传奇导演**马丁·斯科塞斯**(Martin Scorsese)近日以一种出人意料的方式拥抱了人工智能——他正式成为AI图像生成初创公司**Black Forest Labs**的合作伙伴兼顾问。据《纽约时报》6月2日报道,这位82岁的导演将利用该公司的AI技术进行**故事板创作**,而非电影拍摄或后期制作中的其他环节。 斯科塞斯在声明中表示:“70年来,我一直亲手绘制故事板。”他认为,AI工具能让他更快、更高效地向摄影师和美术指导传达自己的视觉构想。这一应用场景虽然有限,却标志着好莱坞对AI态度的**显著软化**。 Black Forest Labs是一家总部位于德国弗赖堡的70人初创公司,其AI图像生成技术已嵌入**Adobe、Canva、微软和Meta**等主流平台。公司最新估值达**32.5亿美元**,投资方包括由斯科塞斯经纪人Rick Yorn联合创立的BroadLight Capital。值得注意的是,该团队正是**Stable Diffusion**的原班人马。据《连线》报道,他们近期拒绝了与**Elon Musk的xAI**合作,原因是此前在Grok图像生成器上的合作因内容安全争议而终止。 尽管斯科塞斯的使用范围仅限于前期的可视化沟通,但这一合作仍可能引发部分业内人士的担忧。不过,这已是近期好莱坞对AI态度松动的又一例证。从编剧工会与制片方就AI使用达成协议,到多位导演尝试AI辅助制作,行业正逐步探索AI的边界。斯科塞斯的加入,无疑为这场讨论增添了**最具分量的注脚**。

TechCrunch24天前原文

在Build 2026开发者大会上,微软一口气发布了七款自研AI模型,其中最引人注目的是旗舰级推理模型**MAI-Thinking-1**。这标志着微软在AI模型自研道路上迈出了关键一步——去年它才推出首批自研模型,此前主要依赖OpenAI的技术。两家公司近期已重新谈判合作协议,以逐步松绑关系。 ## MAI-Thinking-1:中等规模,对标顶尖 微软表示,MAI-Thinking-1是一个“中等规模模型”,在关键软件工程基准测试中“媲美领先模型”。公司强调,该模型“从头开始使用干净数据训练,未从第三方模型蒸馏”。这既是对数据质量的自信,也暗含与OpenAI等对手的差异化竞争策略。 ## 七款模型覆盖多模态与开发场景 除MAI-Thinking-1外,其余六款模型分别聚焦图像生成、转录、语音和代码领域: - **MAI-Image 2.5及Flash版**:支持文生图和图像编辑 - **MAI-Transcribe-1.5**:号称“比竞品快5倍”的转录模型 - **MAI-Voice-2及Flash版(即将推出)**:新增15种语言和更多语音选项 - **MAI-Code-1-Flash**:高效推理的代码模型,已集成至GitHub Copilot和Visual Studio Code ## 战略意义:从OpenAI依赖到独立生态 微软此次大规模推出自研模型,正值其与OpenAI关系调整之际。去年双方签署了更松散的协议,微软开始减少对单一供应商的依赖。MAI-Thinking-1的发布,意味着微软在**推理能力**这一关键领域拥有了自己的王牌,而非仅仅依赖GPT系列。 值得注意的是,微软强调“无蒸馏”训练——这直接回应了业界对模型训练数据来源的争议。此前有研究指出,部分模型可能通过蒸馏技术“抄袭”其他模型能力。微软此举意在树立技术独立性和数据合规形象。 ## 行业影响与展望 微软自研模型矩阵的完善,将加剧AI基础设施层的竞争。一方面,Azure云服务可直接调用这些模型,降低客户对第三方模型的依赖;另一方面,GitHub Copilot等开发工具将获得更深度、更定制化的模型支持。 MAI-Thinking-1的“中等规模”定位也值得玩味:它避开与GPT-4o、Claude 3.5等超大模型的直接对抗,转而通过高效训练和垂直优化实现“小而美”。这种策略可能更适合企业级部署,尤其对成本敏感的场景。 Build 2026上,微软还展示了量子计算芯片等前沿进展。但就AI而言,**从“OpenAI的合作伙伴”到“自研模型玩家”的转型**,才是今年最清晰的信号。

The Verge24天前原文

微软在 Build 大会上正式推出 **Scout**,一款基于 **OpenClaw** 框架构建的 AI 助手,旨在将 OpenClaw 的强大与灵活性引入 Microsoft 365 生态系统。Scout 是一款始终在线的代理型助手,拥有持久的身份和风格,用户可为其命名(例如演示中的“Sebastian”),并通过持续反馈来定制自动化任务。 Scout 的核心理念是“适应性”与“个性化”。微软副总裁 Omar Shahine 表示,每个人都有自己的工作习惯,Scout 能够将这些模式编码为“记忆”和“技能”,并持久保存在代理中。随着用户不断训练,代理会变得更了解用户,获得更多自主权,甚至能做出判断。这种定制化循环——助手从用户行为中学习并随时间变得更强大——正是消费级 AI 工具黏性的关键:你投入越多,越难离开。 Scout 通过微软的 **Frontier 计划** 提供给早期用户,需订阅 **GitHub Copilot** 才能使用。它基于云端,但可跨桌面和浏览器运行,便于连接收件箱、日历等系统。预装技能包括日历管理和会议议程起草,但 Shahine 认为用户自创的技能才是真正价值所在。 针对 AI 代理可能失控的担忧(OpenClaw 曾出现过代理在研究员收件箱中行为异常的事件),Scout 内置了 **安全防护系统**,持续检查操作是否符合预设准则,每次检查都会生成审计追踪。Scout 是微软在 Build 大会发布的一系列 AI 产品之一,标志着微软在 AI 代理领域的进一步深入。

TechCrunch24天前原文
安卓手机即将能识别假冒来电和深度伪造诈骗

谷歌在6月的安卓功能更新中,推出了针对深度伪造电话诈骗的自动防护功能。这项新功能主要针对“冒充诈骗”——根据FTC数据,2024年美国这类诈骗造成的损失接近30亿美元。随着AI语音克隆工具的进步,骗子更容易模仿熟人的声音和号码进行诈骗。 谷歌的解决方案基于其此前为金融电话验证推出的系统,现在扩展到所有联系人。当来电显示为联系人时,手机会通过Google Phone、Google Messages和Google通讯录三款应用协同验证。具体机制是:骗子通常使用在线中继来伪造号码,而真正的来电会包含一个来自Google拨号应用的确认信号。如果该信号缺失,系统会通过Messages向被冒充的联系人发送一个经过认证的RCS消息,确认其是否正在拨打该电话。若对方回复未拨打电话,则判定为诈骗。 该功能适用于Android 12及以上设备,但需要安装谷歌的三款通讯应用。Pixel和摩托罗拉手机预装这些应用,三星也已全面转向Google Messages。不过,由于三星自有拨号应用用户众多,实际覆盖范围可能受限。 此外,本次更新还包括其他功能:类似AirDrop的快速分享改进、更多AI集成等。谷歌正通过系统级防护应对AI诈骗威胁,但用户仍需保持警惕,因为技术手段并非万能。

Ars Technica24天前原文
微软 Scout 上线:永不掉线的 AI 同事,帮你搞定无聊的办公室杂务

在微软 Build 开发者大会上,微软正式推出 **Scout**,一个基于 Teams 的始终在线 AI 代理。Scout 可以访问你的工作消息、日历和邮件,自动执行任务、重新安排冲突的会议、起草专业的回复。它本质上是企业版的 OpenClaw,专为办公室白领设计,你可以像对待人类同事一样在 Teams 中直接给它发指令。 Scout 是微软“代理优先”转型的一部分,旨在自动化知识工作者的软件使用方式。微软企业副总裁 Omar Shahine 表示:“Scout 就像一个私人助理,你下班了它还在工作。”当你闲聊休息时,Scout 会忙着为下周全员会议锁定时间、基于最新消息生成发言要点。 目前 Scout 已面向小部分客户开放,并计划扩大范围。除了 Teams 集成,微软还测试一款桌面应用,今日起面向选择“前沿”功能访问权限的订阅者推出,但需同时拥有 GitHub Copilot 订阅。用户可设置目标和偏好,让 Scout 主动分配任务。例如,Shahine 告诉 Scout 永远保护家庭晚餐时间,因此当会议被安排在晚餐时段时,代理会自动标记并向同事建议重新安排。Scout 还能根据邮件和消息创建承诺清单,发送提醒并起草跟进计划。当然,早期版本可能会有些粗糙。

WIRED AI24天前原文

微软在 Build 2026 大会上正式推出 **Microsoft Scout**,这是一款基于 OpenClaw 构建的 **始终在线 AI 个人助理**,不同于现有的 Copilot,Scout 能够主动监控日历、交通、邮件和 Teams 对话,为用户提供日程建议、费用报告、邮件草稿等全方位协助。 ## 什么是 Scout? Scout 被微软称为“首款真正的个人助理”。它与 Microsoft 365 深度集成,但能力远不止于聊天。Scout 可以 **主动打电话提醒用户出发时间**,根据实时路况和日程安排建议最佳出门时机,还能在后台阅读 Teams 线程和邮件,自动提炼重要事项。 ## 与 Copilot 有何不同? | 特性 | Copilot | Scout | |------|---------|-------| | 交互方式 | 被动聊天 | 主动通知与通话 | | 感知范围 | 当前文档/应用 | 日历、交通、邮件、Teams | | 运行模式 | 应用内嵌入 | 桌面客户端 + 云端始终在线 | Scout 更像一位 **真人助理**,不仅回答问题,还会主动“操心”你的日程与任务。 ## 当前进展与未来计划 - 本周起向美国 **Frontier 客户** 提供桌面预览版 - 未来几个月将推出更广泛的云版本 - 内部已有 **3000 多名微软员工** 在使用,用于安排会议、预订旅行、填写表单等 微软高管 Omar Shahine 表示:“很多人用它成为更好的自己——我们都有想达成的目标,但常常没时间去做,Scout 帮你找回时间。” ## 行业意义 Scout 的推出标志着 AI 助手从“被动响应”走向“主动服务”。在 Google 推出类似 OpenClaw 助手的背景下,微软希望借助 Scout 在 **企业级个人助理市场** 占据先机。未来,Scout 可能成为微软 365 生态中不可或缺的“数字员工”。

The Verge24天前原文

随着AI代理能力不断增强,企业在将其部署到各种应用、工作流和产品中时,面临一个新挑战:如何确保代理在不同环境下按预期行动。微软正通过一项名为 **Agent Control Specification (ACS)** 的新开源标准来解决这一问题,旨在为开发者提供更一致、更细粒度的方式来控制AI代理的允许行为。 ACS本质上允许开发者、合规和安全团队为代理定义自己的策略。这些规则可以规定代理可以做什么、禁止做什么、何时需要人工审批操作,以及应记录哪些证据供后续审查。当代理执行任务时,策略文件会在多个拦截点被检查,确保其不越界。 当前,开发者通常通过系统提示词、应用代码中的自定义检查或分类器来管控AI行为,但这些方法往往导致控制碎片化,难以审计和跨框架复用。ACS将这些控制整合到一个通用治理层中。微软表示,该规范可在代理工作流的多个节点检查其是否遵守护栏——包括接收输入前、调用工具前、工具返回结果后以及最终响应发送给用户前。策略可以允许、阻止操作,编辑敏感信息,甚至请求人工批准。开发者还可以插入输入输出分类器、用LLM作为策略裁判,以及检查工具调用、工具选择、输入准确性、输出使用和响应的逻辑。 由于这些策略可以写成单个文件,因此可以随代理一起打包,使安全策略能跨不同框架和环境跟随代理。ACS现以SDK形式发布,并提供了针对LangChain、OpenAI Agents SDK和Anthropic Agents SDK的插件。 ## 行业背景与意义 AI代理的自主性提升带来了新的治理需求。工具误用或意外操作可能导致级联故障,企业急需标准化的控制手段。ACS的推出填补了这一空白,它将分散的控制点统一为可移植的策略文件,降低了合规风险,也使得代理行为更可预测。对于采用多框架的企业而言,ACS的跨平台特性尤为关键——策略可以一次定义,随处执行。 ## 小结 微软ACS为AI代理治理提供了一种标准化、可扩展的方案。通过将安全策略与代理捆绑,企业可以在不牺牲灵活性的前提下,实现对代理行为的精细化管控。这一举措有望推动AI代理在企业级应用中的安全落地。

TechCrunch24天前原文

谷歌正在为其 Phone by Google 应用推出一项新功能,旨在保护用户免受 AI 冒充诈骗的侵害。当用户接到一个看似来自联系人、但实际为诈骗分子伪装的电话时,应用会弹出警告提示,帮助用户及时挂断。该功能是谷歌 6 月 Android 更新的一部分,默认在运行 Android 12 及更高版本的 Pixel 手机上启用。 ## 诈骗威胁日益严峻 随着 AI 技术的发展,冒充诈骗已成为一个严重问题。据 FBI 报告,仅 2025 年一年,美国人因 AI 诈骗损失超过 **8.93 亿美元**。诈骗者通常会伪造联系人的电话号码,并利用 AI 技术模仿其声音,冒充亲友或权威人物进行诈骗。 ## 工作原理 Phone by Google 的防诈骗功能基于 **端到端加密的富通信服务(RCS)** 技术。当用户和某个信任的联系人双方都使用 Phone by Google 时,联系人的设备会发送一个“静默确认信号”来验证电话的真实性。如果诈骗者试图伪造该号码,这个确认信号就会缺失,应用便会向用户发出警告。 通知会显示“**可能有人正冒充您的联系人给您打电话**”,并提供挂断选项。谷歌表示,该功能默认开启,且其他应用也可以采用这一技术。 ## 更广泛的 Android 更新 除了电话防诈骗功能,谷歌 6 月的 Android 更新还包括: - 为更多设备(包括三星 Galaxy S25 系列)增加对 Apple AirDrop 的支持 - 将个人安全应用开放给 13 岁以下儿童 - 在 Google Photos 中广泛推出 AI 服装试穿功能 - 通过 Circle to Search 查找衣物中物品的功能扩展到更多用户 该功能目前仅适用于同时使用 Phone by Google 的双方,但谷歌计划未来让更多应用和平台受益。随着 AI 诈骗手段日益复杂,这一功能无疑为用户提供了一层重要的安全防护。

The Verge24天前原文