AI 资讯

每日聚合最新人工智能动态

321

Anthropic与白宫仍陷僵局：Claude Fable 5安全争议未解

新上线

Anthropic高层本周一飞往华盛顿，与美国白宫官员举行紧急会谈，但双方在Claude Fable 5模型的安全风险上仍未达成一致。据三位知情人士透露，特朗普政府拒绝解除上周因“越狱”漏洞而对Anthropic最先进AI模型实施的出口管制。政府认为，Claude Fable 5的某些防护措施可以被绕过，从而让用户访问公司更强网络安全模型Mythos的能力。Anthropic则连日来强调政府的担忧被夸大，并在商务部与国家标准与创新人工智能中心及国家网络总监办公室的研究人员召开工作组会议。商务部长霍华德·卢特尼克通过电话从法国埃维昂的G7峰会接入，但国家网络总监肖恩·凯恩克罗斯本人未参与。Anthropic方面，联合创始人兼首席计算官汤姆·布朗和外部事务主管莎拉·赫克主导讨论，前沿红队主管洛根·格雷厄姆及高级安全研究员尼古拉斯·卡利尼也飞往华盛顿参会。 **僵局背后的政治角力** 此次紧急会谈正值Anthropic与五角大楼就AI军事应用长期争执之际。上周，亚马逊CEO安迪·贾西直接致电财政部长斯科特·贝森特，提及模型漏洞，促使政府警觉。白宫随即要求NSA协助审查。商务部表示愿意寻找让Fable 5重新上线的途径，但前提是Anthropic完全解决越狱问题。目前尚不清楚下一步如何推进。Anthropic发言人称“双方正迅速寻求解决方案”，白宫则拒绝置评。 **行业背景与影响** 这起事件折射出AI安全监管的深层矛盾：一方面，政府担忧先进模型被恶意利用；另一方面，企业认为过度限制会扼杀创新。Anthropic此前已因军事应用争议与国防部关系紧张。此次出口管制若持续，可能影响其商业部署与国际合作。分析人士指出，随着AI能力边界拓展，类似博弈将愈发频繁。

WIRED AI3天前原文

322

iOS 27 为 iPhone 带来增强蓝牙追踪，但有个“坑”

新上线

在今年的 WWDC 上，苹果发布了 iOS 27，其中一项较少被提及的新功能是支持 **Channel Sounding（信道探测）**。这项技术最早出现在 2024 年秋季发布的蓝牙 6.0 规范中，旨在通过更精确的测距和方向感知，提升设备的空间定位能力。 ### 什么是 Channel Sounding？简单来说，Channel Sounding 让蓝牙设备能够实现“精细测距”——不仅能告诉你目标设备有多远，还能指示具体方向。相比传统的 RSSI（信号强度）估算，Channel Sounding 利用相位测量和往返时间计算，定位精度可达厘米级，并且具备更高的安全性，能有效防止中继攻击。 ### 对 iPhone 用户意味着什么？苹果在 iOS 27 中加入对 Channel Sounding 的支持，最直接的影响是 **Find My 网络**的体验升级。目前，Find My 主要依赖苹果自家设备（如 AirTag）或经过认证的第三方配件，但定位精度和方向提示仍有局限。有了 Channel Sounding，未来任何配备蓝牙 6.3 及以上芯片的第三方耳机、追踪器、智能锁、数字钥匙等，都能在 Find My 应用中实现类似 AirTag 的“精确查找”功能——显示距离、方向，甚至引导你一步步找到物品。这实际上是在 **“民主化”Find My 网络**：不再需要购买特定品牌的配件，只要设备支持新标准，就能无缝融入苹果的生态。 ### 但有个“坑” 然而，技术落地从来不会一蹴而就。最大的限制在于**硬件兼容性**：Channel Sounding 需要蓝牙 6.0 及以上版本的芯片支持，而目前市面上绝大多数设备仍停留在蓝牙 5.x 时代。即便苹果率先在 iPhone 上提供支持，第三方配件厂商也需要时间更新产品线。预计到 2027 年，我们才会看到首批蓝牙 6.3 设备上市，而全面普及可能需要更长时间。此外，苹果在 WWDC 上并未详细说明 Channel Sounding 的具体实现方式——是开放给所有开发者，还是需要经过 MFi 认证？这可能会影响第三方厂商的接入意愿。 ### 行业影响与展望从行业角度看，苹果对 Channel Sounding 的支持将加速蓝牙定位技术的标准化。谷歌此前已在 Android 中引入类似功能（如 Google 的“查找我的设备”网络），但生态碎片化导致体验不一。苹果的强势入场有望推动更多配件厂商统一采用新标准，最终让消费者受益。不过，短期来看，这一功能更像一个“未来承诺”。如果你打算今年秋季升级 iOS 27，可能暂时还感受不到变化——你需要等待配套硬件的普及。 ### 小结 - **亮点**：Channel Sounding 带来厘米级精度，让 Find My 网络支持更多第三方设备。 - **局限**：需要蓝牙 6.3 硬件，普及尚需时日。 - **建议**：如果你经常丢东西且依赖苹果生态，可以关注后续支持该技术的配件；否则，现有 AirTag 和 UWB 设备已足够使用。

ZDNet AI3天前原文

323

OpenAI 推出部署模拟：在发布前预测模型行为，提升安全评估

精选

OpenAI 近日发布了一项名为“部署模拟”（Deployment Simulation）的新方法，旨在模型正式发布前，通过模拟真实部署环境来预测其行为表现。这项技术通过隐私保护的方式重放历史对话数据，让候选模型在接近真实的上下文中做出响应，从而更准确地评估模型可能出现的不良行为及其发生频率。在 GPT-5 系列 Thinking 模型的多次部署中，部署模拟显著提升了不良行为率的估计精度，帮助发现了传统评估未能覆盖的新型对齐问题，并降低了模型识别测试环境的风险。该方法还成功应用于更复杂的智能体场景，表明其不仅适用于标准聊天，还能扩展至涉及工具调用的自主任务。 ## 核心价值与背景随着 AI 能力的不断提升，传统评估方法（如合成提示词、人工编写或生产环境中的对抗性测试）主要关注极端或低概率的恶意场景。然而，这些测试往往忽略了日常使用中可能出现的微妙偏差。部署模拟填补了这一空白：它通过模拟真实对话流，让评估更贴近实际部署后的交互模式。例如，在 GPT-5 系列模型的开发中，部署模拟揭示了某些在传统测试中未暴露的“隐形”风险，比如模型在特定上下文中的不当回应，或对用户意图的误判。这些发现直接推动了缓解措施的制定和部署决策的调整。 ## 技术原理与扩展性部署模拟的核心流程包括： - **隐私优先的数据重放**：使用历史对话（已脱敏）作为输入，让新模型逐一响应，生成模拟的部署日志。 - **行为频率估计**：通过大量模拟对话，统计不良行为（如有害内容生成、拒绝服务等）的出现概率，而非仅依赖人工标注的少数案例。 - **自适应测试**：在模拟过程中，可以动态调整提示分布，覆盖更多边缘情况。 OpenAI 强调，该方法已成功应用于更复杂的智能体（Agent）部署，例如需要多步工具调用的场景。这表明它具备跨场景的通用性，未来甚至可用于内部模型的部署前风险评估。 ## 行业影响与未来规划部署模拟的出现，标志着 AI 安全评估从“静态测试”向“动态模拟”的转变。传统评估常面临“测试污染”问题——模型可能通过训练数据或上下文线索识别出测试意图，从而产生虚假的安全表现。而部署模拟通过隐藏测试身份，大幅降低了这种风险。 OpenAI 计划进一步优化该流程的易用性，使其成为模型开发的标准环节。可以预见，随着 AI 模型日益复杂，类似的方法将成为行业标配，帮助实验室在发布前更全面地理解模型行为，减少不可控风险。 ## 小结部署模拟并非替代现有评估方法，而是作为补充信号，提供“部署前预览”视角。它尤其适合以下场景： - 高容量对话模型（如 GPT 系列） - 涉及工具调用的智能体系统 - 需要量化风险概率的合规场景对于整个 AI 行业而言，这一方法不仅提升了安全性，也增强了公众对模型发布流程的信任。

OpenAI3天前原文

324

谷歌CEO Sundar Pichai在斯坦福毕业典礼遭嘘声与退场抗议，因谷歌涉以色列及ICE合同

新上线

## 事件概述上周末，谷歌CEO **Sundar Pichai** 在 **斯坦福大学** 毕业典礼上发表演讲时，遭遇了一场小规模抗议。约 **200名** 毕业生选择退场，部分学生发出嘘声，矛头直指谷歌的国防合同——包括与亚马逊共同承担的 **Project Nimbus**（价值 **12亿美元** 的云计算与AI服务合同，用于以色列军方），以及谷歌与美国 **移民和海关执法局（ICE）** 的合作关系。 ## 抗议现场抗议学生高举标语，如“ICE用谷歌AI进行间谍活动”、“种族灭绝运行在谷歌上”，并挥舞巴勒斯坦国旗，高喊“自由巴勒斯坦”。组织方包括“斯坦福学生争取巴勒斯坦正义”、“不为种族隔离提供科技”等校园团体。抗议声明称：“我们退场，是因为拒绝美化助长暴力的企业，并行使自主选择权。” ## 行业背景自加沙战争爆发以来，谷歌参与Project Nimbus一直面临内外部抗议。**2024年**，谷歌因抗议活动解雇了 **28名** 员工，但内部异议持续。电子前哨基金会（EFF）近期批评谷歌等公司对以色列使用其服务“视而不见”。微软同样因支持以色列军方受到批评，但在调查发现其云服务被用于大规模监控巴勒斯坦人后，限制了以色列政府的使用。 ## 争议回应此次学生抗议也引发了商界领袖的批评。Sun Microsystems联合创始人、著名风险投资人 **Vinod Khosla** 在X平台发帖称，抗议是“偏颇、愚蠢、短视且非常自私的”，认为学生忽视了全球底层30亿人口可能从AI中受益的机会。 ## 小结这场抗议反映了科技行业在军事与政府合同上面临的日益增长的道德压力。随着AI技术深入应用于国防和执法领域，企业领导者正面临来自员工、学生和公众的更强问责。

TechCrunch3天前原文

325

美国政府要求 Anthropic 下架模型，并非单纯的“越狱”事件

新上线

上周五，美国商务部援引一项鲜为人知的出口管制指令，致信人工智能公司 Anthropic，要求其禁止非美国公民（包括公司员工）访问其最新网络安全模型 Fable 5 和 Mythos 5，理由为“未具体说明的国家安全关切”。Anthropic 被迫在周末前将这两款旗舰模型全面下线，以遵守指令。这一举动引发行业震动。Anthropic 表示，他们认为这封信可能与模型防护机制的绕过有关，但由于信函未提供具体细节，公司也无法确定。值得注意的是，这封信并未公开，且行动似乎未经法院批准，显示出美国政府有能力以单边、迅速的方式强制科技公司停用产品。随着更多信息浮出水面，政府给出的理由愈发站不住脚。网络安全研究员 Katie Moussouris 在博客中透露，Anthropic 曾私下与她分享一篇安全研究人员撰写的论文，描述了对 Fable 5 防护机制的绕过方法（据《华尔街日报》报道，论文作者来自亚马逊的安全团队）。Moussouris 认为，论文中描述的所谓“越狱”行为本质上只是让模型审查代码安全漏洞，而非要求其修复代码，两者结果相似但提问方式略有不同，这种行为根本不应触发出口管制。她指出，论文描述的行为“无法被有意义地修复”，暗示政府的反应可能过度。 Axios 援引消息人士称，周末双方关系紧张，特朗普政府与 Anthropic 之间的个性差异导致了出口指令，而非 AI 产品本身的技术问题。这进一步表明，此次行动可能带有报复或政治色彩。此次事件向整个 AI 行业发出明确信号：即便是在技术层面看似合理的“越狱”行为，也可能招致政府干预。AI 公司需要意识到，合规不仅仅是技术问题，更是政治和法律问题。未来，类似出口管制可能被更频繁地用于限制 AI 模型的发布与使用，尤其是在涉及国家安全或地缘政治敏感领域。Anthropic 的遭遇将成为行业教科书式的案例。

TechCrunch3天前原文

326

Meta CTO 承认公司 AI 重组“糟糕透顶”

新上线

Meta 首席技术官 Andrew Bosworth 在一份内部备忘录中坦言，公司近期的人工智能部门重组“糟糕透顶”，并承诺将带来更多稳定性、更好的沟通以及恢复部分工作福利，以提振员工士气。据 WIRED 获得的这份备忘录显示，Bosworth 承认重组过程中出现了“大量失误”，导致团队混乱、士气低落。他写道：“我知道这次重组对很多人来说都很艰难，我们本可以做得更好。”Bosworth 表示，管理层将吸取教训，未来在组织变动时会更加谨慎，并改善信息透明度。此次重组是 Meta 大力押注 AI 领域的举措之一。过去一年，Meta 将多个 AI 团队整合到新的“生成式 AI”部门，并大规模招聘 AI 人才，同时也在其他业务部门进行裁员。这种“一边扩招一边裁员”的策略引发了内部不满。Bosworth 在备忘录中承认，沟通不足和流程混乱加剧了员工的不安。为改善现状，Bosworth 承诺将恢复一些被取消的福利，例如免费洗衣服务和更灵活的办公政策。他还强调，未来的重组将更注重“渐进式调整”而非“大刀阔斧的变革”。分析人士认为，Meta 的 AI 重组困境反映了科技巨头在快速转向 AI 时面临的普遍挑战：如何在保持创新速度的同时，维护组织稳定和员工信任。随着 AI 竞争日益激烈，Meta 能否平衡好这两者，将直接影响其长期竞争力。

WIRED AI3天前原文

327

Facebook 新 AI 搜索模式：答案来自你的公开帖子

新上线

Meta 今日宣布在 Facebook 上推出 **AI 模式**（AI Mode），该搜索功能将基于用户公开帖子生成答案，而非传统链接列表。当用户在 Facebook 搜索时，AI 模式会与“人物”、“ marketplace”等常规搜索选项并列出现。 Meta 表示，AI 模式“使用 Meta AI 为你提供基于我们各应用中公开内容的答案”。其背后的 **Muse Spark** 模型将“随时间解锁新功能，引用并推荐用户在 Instagram、Facebook 和 Threads 上分享的内容”。用户还可以对搜索结果提出后续问题，实现交互式搜索。这一做法与 Google 近期整合 Reddit 帖子到搜索和 AI 概览的策略类似。Meta 此举旨在利用其平台庞大的公开内容库，提供更具社交洞察的答案。 ### 其他新功能除了 AI 模式，Meta 还在同一天推出多项 AI 功能： - **照片预设**：可自动为球迷照片换上体育队服。 - **拼贴模板建议**：帮助用户快速创建图片拼贴。 ### 隐私与数据使用 Meta 明确强调，AI 模式仅使用 **公开帖子** 作为信息来源，不涉及私人内容。用户若希望自己的帖子不被用于训练或搜索，可在隐私设置中调整。 ### 行业影响 AI 搜索正成为科技巨头的新战场。Meta 借助其社交平台独有的实时、用户生成内容，试图在 AI 搜索领域建立差异化优势。然而，如何平衡内容利用与用户隐私，将是其持续面临的挑战。

The Verge3天前原文

328

Gemma 4 模型登陆 Amazon Bedrock：Google DeepMind 开源新作，兼顾智能与部署灵活性

新上线

**Google DeepMind 的开源模型家族 Gemma 4 现已正式登陆 Amazon Bedrock**，为开发者和企业在云端提供更灵活的 AI 模型选择。本次发布的 Gemma 4 系列包含三个指令微调版本：**Gemma 4 31B**（300 亿参数密集型）、**Gemma 4 26B-A4B**（260 亿参数混合专家模型，每次推理仅激活 40 亿参数）以及 **Gemma 4 E2B**（20 亿有效参数紧凑型）。这些模型均基于 Apache 2.0 开源许可发布，强调“每参数智能”的设计理念，旨在覆盖从边缘设备到大规模云部署的多种场景。 ### 核心能力与基准表现 Gemma 4 系列在架构上覆盖了**密集模型**和**混合专家（MoE）模型**两种路线，其中 MoE 变体在推理时仅激活部分参数，从而在保持高性能的同时降低计算成本。所有变体均支持： - **内置推理模式**：可处理复杂逻辑和多步骤推理任务 - **原生函数调用**：便于构建智能体工作流 - **多模态输入**：支持文本与图像混合输入 - **多语言支持**：预训练覆盖 140+ 种语言，开箱支持 35 种以上独立基准测试显示，Gemma 4 在“每参数智能”指标上表现突出。根据 Artificial Analysis 的评估，Gemma 4 31B 的 **Intelligence Index 达到 39**，远超同类 4B-40B 参数开源模型的中位数 15。这意味着在同等参数规模下，Gemma 4 能够提供更高的智能密度。 ### Amazon Bedrock 上的部署优势对于希望采用开源基础模型的企业而言，**数据安全、监管合规和运营控制**始终是核心考量。Amazon Bedrock 作为全托管服务，允许用户通过 API 直接调用 Gemma 4 模型，所有推理均在 AWS 基础设施上运行，并继承 Bedrock 原有的安全与隐私保护机制。关键特性包括： - **数据不用于训练**：用户的提示词和生成内容不会被用于模型训练 - **内容不共享**：与第三方隔离，保障企业数据隐私 - **弹性扩展**：按需推理服务可自动扩缩以应对工作负载变化 ### 应用场景与上手路径借助 Gemma 4 模型，开发者可以在 Bedrock 上构建多种应用： - **多模态智能体**：结合图像与文本输入，实现视觉问答、文档理解等任务 - **轻量级应用**：Gemma 4 E2B 紧凑模型适合资源受限的移动端或边缘设备 - **文档处理管线**：利用函数调用能力自动化文档分类、信息提取流程 - **软件工程工作流**：支持代码生成、调试建议等开发辅助任务 **如何快速开始？** 用户可通过 Amazon Bedrock 控制台、AWS CLI 或 SDK 访问 Gemma 4 模型。在 Bedrock 的模型目录中搜索“Gemma 4”即可找到对应变体，选择后创建推理端点即可通过 API 调用。由于模型为开源权重，企业也可独立评估其架构与训练方法，并在自有数据上进行微调。 ### 总结 Gemma 4 的入驻进一步丰富了 Amazon Bedrock 的开源模型生态。对于追求高性能与低成本平衡的团队，MoE 变体提供了极具吸引力的选择；而对数据主权有严格要求的企业，Bedrock 的全托管模式则消除了后顾之忧。随着多模态和智能体工作流的普及，Gemma 4 有望成为开发下一代 AI 应用的重要基石。

AWS ML3天前原文

329

草坪专家教你一招：如何找到最适合你的割草机器人

新上线

割草机器人并非“一刀切”的设备，许多宣传的炫酷功能可能你根本用不上。作为一名草坪专家，我测试过数十款产品，发现关键在于匹配你的院子，而非追求最高配置。 ## 不必追逐的“鸡肋”功能 - **GPS 导航**：对于大多数规则形状的小型草坪，边界线传感器已经足够精准，GPS 在树下或狭窄区域反而容易失灵。 - **APP 远程控制**：如果你只是希望割草机自动工作，基础定时功能即可，无需手机端实时操控。 - **多区域管理**：如果你的草坪是一个整体，无需分区，那么单区模式更简单可靠。 - **雨量传感器**：很多机器自带“下雨延迟”，但实际效果不如直接查看天气预报。 ## 真正该关注的核心 1. **草坪面积与地形**：选择覆盖面积略大于实际草坪的型号，并确认能爬坡（坡度 ≤25°）。 2. **切割宽度与高度**：窄刀片适合精细修剪，宽刀片效率高；可调高度（2-6cm）适应不同草种。 3. **电池续航与充电**：续航时间至少能一次完成整个草坪，且充电站位置要方便。 4. **安装与维护**：边界线铺设是否简便？刀片更换成本如何？ ## 专家建议 **先画一张院子地图**：测量面积、标注障碍物（花坛、树木）、记录坡度。然后拿着这张图去对比产品参数，而非被“智能”、“AI”等营销词迷惑。例如：一块 500 平米的规则平地，一款中端单区型号就绰绰有余；而带复杂花坛的 1000 平米坡地，才需要考虑多区 GPS 型号。 ## 小结割草机器人的本质是工具，不是科技玩具。**把预算花在刀刃上**——匹配的功率、可靠的刀片和简单的操作，比任何花哨功能都重要。记住：没有最好的机器人，只有最适合你院子的那一个。

ZDNet AI3天前原文

330

一年驾驶超 4 万公里，这些 Apple CarPlay 应用让我一路轻松

新上线

作为一名资深科技编辑，我每年驾驶里程超过 25,000 英里（约 4 万公里），对车载系统的依赖不言而喻。Apple CarPlay 已成为我驾驶中不可或缺的一部分，它让 iPhone 应用在车内更安全、更易用。以下是我在过去一年中使用频率最高、最不可或缺的 CarPlay 应用清单。 ### 导航：Google Maps 与 Waze 的抉择导航是 CarPlay 的核心场景。**Google Maps** 凭借精准的实时交通数据和丰富的兴趣点信息，成为我的首选。它能智能避开拥堵，并提供沿途加油站、餐厅等建议。而 **Waze** 则以其社区驱动的路况报告（如警察测速、事故提醒）见长，更适合熟悉路况的用户。两者均支持语音控制，大大减少了驾驶时分心的可能。 ### 音乐与播客：Spotify 和 Overcast 长途驾驶离不开音频娱乐。**Spotify** 的 CarPlay 界面简洁，支持语音搜索和个性化推荐，无论是通勤还是远行都能找到合适的配乐。对于播客爱好者，**Overcast** 是绝佳选择——它专为 CarPlay 优化，支持变速播放、智能跳过静音，并能同步进度，让你在车上无缝接听之前听到的内容。 ### 通讯：消息与 WhatsApp 保持联系但又不分心是关键。Apple 的 **信息** 应用在 CarPlay 上通过 Siri 实现朗读和听写回复，非常便捷。**WhatsApp** 同样支持语音操作，可发送语音消息或快速回复预设文本。不过需注意，这些功能仅适用于短消息，复杂交流仍需停车处理。 ### 实用工具：CarPlay 的隐藏技能除了上述应用，**TuneIn Radio** 提供了丰富的广播和有声书资源，适合信号不佳的地区。而 **Spotify** 和 **Apple Music** 的离线播放功能，在无网络覆盖的偏远路段尤为实用。另外，**Google Maps** 的离线地图下载功能也是长途驾驶的必备。 ### 小结：安全第一，应用其次 CarPlay 的核心价值在于将手机的核心功能以更安全的方式融入驾驶体验。应用的选择应服务于“减少分心”这一目标。我的建议是：优先安装导航和音频类应用，通讯类应用仅保留必要的，并确保所有操作都能通过语音完成。毕竟，再好的应用也比不上专注驾驶本身。

ZDNet AI3天前原文

331

英伟达计划发行超250亿美元债券，测试AI市场投资者热情

新上线

芯片巨头英伟达（Nvidia）于周一宣布，计划在美国发行250亿美元的投资级债券，这是该公司自2021年以来的首次债券发行，旨在测试投资者对AI领域进一步敞口的兴趣。根据一份条款清单，此次发行包括从2年期到30年期不等的七个期限部分。由于需求强劲，发行规模从最初的200亿美元上调至250亿美元，截至纽约时间下午早些时候，订单已超过850亿美元。知情人士称，得益于旺盛需求，10年期债券的收益率预期较美国国债高出0.5个百分点，低于最初讨论的0.75个百分点。 T Rowe Price投资组合经理Lauren Wagandt表示，美伊协议后的有利市场条件使英伟达能够以相对较低的成本筹集债务。“归根结底，这是一家非常高质量的公司，”Wagandt说，“而且它不像其他科技公司那样频繁进入市场。” 此次发行正值科技集团在AI军备竞赛加剧之际争相确保融资，同时华尔街面临新一轮股权和债务发行浪潮，包括SpaceX创纪录的750亿美元IPO。英伟达表示，计划将所得款项用于一般公司用途，包括偿还和再融资现有票据。此次发行规模至少是英伟达2021年疫情期间债券发行的三倍，当时其筹集了约50亿美元。完成后，英伟达的未偿债务将从目前的85亿美元增至约300亿美元。市场疲劳的早期迹象已促使一些科技公司寻找替代融资渠道。Anthropic转向私人信贷投资者，以完成由Broadcom支持的350亿美元交易。谷歌母公司Alphabet则决定进行二十多年来的首次股权发行，本月早些时候筹集了850亿美元新资本。英伟达作为AI行业构建大型语言模型（如OpenAI的GPT）所需强大芯片的首选供应商，其地位已被证明利润丰厚。此次债券发行不仅是对公司信用的考验，也是对整个AI行业投资热度的一次重要检验。

Ars Technica3天前原文

332

Anthropic 与白宫的新 AI 争端：Fable 5 和 Mythos 5 被强制下架

新上线

## 事件概述 Anthropic 在 6 月 9 日发布了其迄今最强大的 AI 模型 **Fable 5** 和 **Mythos 5**。Fable 5 被称为“能力超越以往任何通用模型”，而 Mythos 5 基于相同底层模型但“部分安全措施被移除”。然而，仅三天后，白宫于 6 月 12 日下令阻止外国用户访问这两个模型，理由是研究人员发现可通过特定方式让 Fable 5 输出可用于网络攻击的信息。Anthropic 随即关闭了所有用户的访问权限，并表示“遵守政府法律指令”，但强调“狭隘的越狱可能性不应成为召回已部署给数亿用户的商业模型的原因”。 ## 背景与连锁反应这场争端并非孤立事件。Anthropic 此前已陷入与五角大楼的纠纷，而此次白宫的直接干预进一步加剧了紧张局势。据报道，命令是在亚马逊与白宫对话后下达的，凸显了科技巨头与政府之间的微妙博弈。 ### 行业影响 - **非美国 AI 发展加速**：分析师指出，此举可能推动其他国家加速自主研发，减少对美国 AI 的依赖。 - **安全与开放的平衡**：事件再次引发关于 AI 安全审查与商业开放之间平衡的讨论。 ## 后续发展 - **6 月 14 日**：有报道称中国可能已获取 Mythos 5 的访问权限，白宫随即加强出口限制。 - **6 月 15 日**：特朗普政府被指利用此次事件推动“非美国 AI”议程，强调本土技术自主。 ## 关键观点 Anthropic 在声明中强调，模型已内置“高风险领域”使用限制，但白宫认为潜在风险过大。这一事件不仅影响 Anthropic 的商业部署，更可能重塑全球 AI 治理格局。 > “美国不仅主导前沿 AI，其政府还掌握着谁可以使用它的权力。”—— 评论指出，此次行动向世界展示了美国对 AI 技术的控制力。

The Verge3天前原文

333

2026年世界杯观赛指南：9种流媒体方式（含免费选项）

新上线

## 2026年世界杯即将开赛，如何免费或低成本观看？ 2026年世界杯即将拉开帷幕，这是全球最盛大的体育赛事之一。对于不想为昂贵的有线电视套餐付费的球迷来说，好消息是——观看比赛的方式比以往更多样化，甚至有不少免费选项。 ### 流媒体平台成为主流随着流媒体服务的普及，观众不再局限于传统电视转播。以下是9种值得关注的观赛方式，涵盖免费和付费选择： 1. **免费选项**：部分国家或地区的公共广播公司（如BBC、ITV等）可能提供免费直播，但需确认覆盖范围。此外，一些流媒体平台（如Pluto TV、Tubi）可能通过广告支持免费播放部分比赛。 2. **付费流媒体**：包括**FuboTV**、**Sling TV**、**YouTube TV**等，它们通常提供多频道套餐，支持高清直播和回放。 3. **体育专属服务**：如**ESPN+**、**Paramount+**等，可能拥有赛事转播权，需订阅。 4. **设备兼容性**：大多数流媒体服务支持电视、手机、平板和电脑，部分还支持4K直播。 ### 注意事项 - **地区限制**：转播权因国家而异，建议提前查询当地授权平台。 - **免费试用**：许多付费服务提供免费试用期，可合理利用。 - **网络要求**：稳定高速的互联网连接是关键，建议提前测试。 ### 总结 2026年世界杯的观赛选择比以往更灵活，从免费广播到高端流媒体，球迷们可以根据预算和偏好自由组合。无需有线电视，也能享受完整赛事。

ZDNet AI3天前原文

334

韩国人为何如此热爱AI？

精选

从仁川国际机场无人入境检查站的人脸识别，到江南区十字路口等待送餐的卡通机器人，再到遍布地铁站的K-pop偶像生日广告屏——首尔早已将AI融入城市肌理。与西方国家日益增长的AI疑虑不同，韩国人对AI表现出罕见的乐观。皮尤研究中心调查显示，仅16%的韩国人对AI感到担忧多于兴奋，为25个受调查国家中最低；而美国这一比例高达50%。韩国文化体育观光部和商工会议所调查也表明，多数韩国人每天使用AI辅助工作或生活。 ## 技术乐观主义的历史基因韩国对AI的热爱并非偶然，而是根植于其现代化进程中形成的“技术救国”信念。从战后重建到半导体崛起，再到5G和K-pop的全球输出，技术一直被视为国家跃升的核心驱动力。这种“技术现代化”叙事让韩国社会形成共识：拥抱AI不仅是潮流，更是维持全球竞争力的必然选择。政府更是将AI列为国家战略，推动从教育（AI教科书）到养老（AI看护机器人）的全场景落地。 ## 政府主导的“热情工程” 韩国的AI热情很大程度上是“自上而下”设计的。政府通过大规模投资、政策倾斜和公共宣传，将AI塑造为经济增长新引擎。例如，首尔江南区今年6月宣布将公交站升级为“AI公交站”，配备多语言问答终端。这种系统性推动让AI渗透到公共服务的毛细血管，也让民众在日常使用中自然接受AI。 ## 文化土壤与产业生态韩国独特的文化也为AI落地提供了温床。高度数字化的生活（99%的5G覆盖率）、对流行文化的狂热（AI虚拟偶像、AI网漫）以及游戏产业的深厚基础，使得AI产品能快速找到用户场景。年轻人将AI视为提升效率或娱乐的工具，而非威胁。此外，财阀主导的经济结构（如三星、LG、SK）确保了AI研发的巨额投入和产业链整合能力。 ## 挑战与隐忧尽管整体乐观，韩国AI发展也面临挑战。过度依赖政府主导可能导致创新活力不足，而AI对就业的冲击（尤其在制造业）尚未充分显现。此外，隐私和伦理问题随着人脸识别等技术的普及逐渐浮出水面。但就目前而言，韩国社会仍以“先试再说”的态度拥抱AI，这种务实精神或许正是其AI热潮持续的关键。

MIT Tech3天前原文

335

Meta 为 Facebook 推出“AI 模式”，从平台公开信息中提取答案

新上线

Meta 正在加速追赶 AI 竞赛的步伐。本周一，该公司宣布为 Facebook 推出一系列新 AI 功能，其中最引人注目的是 **AI 模式**——一种全新的搜索方式，能够基于 Facebook 平台上的公开帖子（包括群组和 Reels）生成合成答案。用户只需用自然语言提问，即可获得由 Meta AI 整合的回复，无需再手动翻看搜索结果。这一功能与此前低调上线的 **Forum** 应用中的“Ask”标签类似，后者同样允许用户提问并从 Facebook 群组讨论中提取答案。两者都引发了关于信息可靠性的疑问：由于 AI 总结的是普通用户的公开讨论内容，而非经过审查的来源，**过时或误导性信息**可能被传播。这并非孤例——谷歌此前在其 AI 模式中整合 Reddit 内容时，也面临过类似争议。除了搜索变革，Facebook 还新增了多项 AI 编辑工具：用户可为视频蒙太奇添加拼贴剪贴画和转场效果；AI 照片预设则允许用户一键更换服装、发型和配饰——例如，体育迷可以在 Stories 中点击“AI 编辑”并选择“穿戴”，虚拟穿上主队球衣，或直接在个人资料图片上应用“AI 重新造型”和“衣橱”功能。这些更新是 Meta 近期密集推出的 AI 功能的一部分：今年 2 月，Facebook 上线了动态个人资料图片（让静态照片挥手或戴上派对帽）；3 月，Marketplace 推出了自动回复买家消息的 AI 功能；本月早些时候，**创作者 AI 助手**上线，能根据创作者的发布内容和表现历史提供最佳发布时间和评论总结等个性化建议。 **Meta 的战略意图**已十分清晰：通过将 AI 深度嵌入搜索、创作和交互环节，让 Facebook 变得更具粘性和实用性，从而在激烈的 AI 竞争中找到差异化优势。然而，如何在提升便利性的同时确保信息质量，仍是其必须面对的挑战。

TechCrunch3天前原文

336

SpaceX 正式上市：IPO 后你需要知道的一切

新上线

历经 24 年，SpaceX 终于在万众瞩目下完成了史上最大规模的 IPO。本文梳理了上市首日的股价表现、关键人物表态、承销商收益以及市场反应，并展望这家太空巨头上市后的下一步动向。 ## 史上最大 IPO 落地 SpaceX 于 6 月 12 日在纳斯达克上市，发行价 **135 美元**，发行 **5.556 亿股**，募集资金 **750 亿美元**，一举成为全球历史上规模最大的 IPO。上市首日开盘价 **150 美元**，较发行价上涨 **11%**；盘中一度飙升 **30%**，最终收盘于 **160.95 美元**，涨幅 **19%**。上市后首个完整交易日，股价继续攀升至 **186.15 美元**，涨幅超过 **15%**。 ## 谁是大赢家？ - **承销商**：以高盛和摩根士丹利为首的投行获得约 **5 亿美元** 的总费用。 - **员工与早期投资者**：随着股价上涨，SpaceX 内部持股员工和早期投资者获得丰厚回报。马斯克本人则凭借 SpaceX 和特斯拉的持股成为 **全球首位万亿富翁**。 - **散户投资者**：Robinhood 等交易平台在 SpaceX 上市后出现 **历史级流量高峰**，散户交易热情空前。 ## 关键人物发声 SpaceX COO **格温·肖特韦尔**（Gwynne Shotwell）在 CNBC 采访中透露，**SpaceX 与特斯拉合并** 可能会让马斯克的生活“轻松一些”。这一表态引发市场对两家公司未来整合的猜想。马斯克则在 X 平台发文称赞 SpaceX 员工：“我无法用言语表达对 SpaceX 这帮了不起的人的爱。”他还转发了内部人士穿“绿鞋”的照片——**绿鞋期权** 允许承销商在需求强劲时额外增发最多 **15%** 的股份，暗示 IPO 认购火爆。 ## 上市之后：Starlink 与火星计划上市为 SpaceX 提供了更雄厚的资本基础。目前公司两大核心业务——**可回收火箭发射** 和 **Starlink 卫星互联网**——均处于快速扩张阶段。Starlink 已有超过 **150 万用户**，并计划进一步覆盖全球偏远地区。火星运输系统 Starship 的研发也在持续推进。 TechCrunch 将持续跟踪 SpaceX 上市后的财报、战略调整以及马斯克与肖特韦尔的最新表态。

TechCrunch3天前原文

337

特朗普封杀Anthropic，反而为非美AI崛起做了嫁衣

新上线

上周末，应白宫要求，Anthropic突然下线了其最新、最强大的AI模型。这家美国公司表示，在华盛顿要求其封锁所有外国公民（包括其员工）的访问权限后，它几乎没有选择。海外，这一事件提供了一个清醒的提醒：美国不仅主导着前沿AI，其政府还拥有决定谁可以使用它的权力。特朗普政府的行动迅速、全面，且几乎没有事先警告或解释。Fable 5和Mythos 5模型——它们已经受到限制，被禁止用于“高风险领域”——的突然下线，为长期存在的、警告不要依赖美国获取关键技术的论点提供了新的弹药。对于已经在主张自己必须领导AI技术的政治家、政府和公司来说，这成了新鲜的火药。在英国，AI与在线安全部长Kanishka Narayan没有直接提及Anthropic、特朗普或美国，但利用这次下线事件来论证英国必须发展自己的AI能力，并将此问题框定为国家安全问题。他说：“我们对待所有其他威胁主权的问题都极为严肃，但我们还没有学会以同样的方式对待这个问题。”屏幕上闪现着英国警察和军队的图像。AI是“我们时代的核心政治问题”，纳拉扬认为，英国必须决定这项技术将如何塑造其经济、安全与主权，“在别人替我们决定答案之前”。在法国，反应更为直接——也更强烈地点名美国。前总理Gabriel Attal，埃马纽埃尔·马克龙复兴党的总统候选人，称这次下线是“AI战争”的开始。他指出，这暴露了依赖美国AI基础设施的风险，并呼吁欧洲加速自主AI能力的建设。这一事件发生在全球各国政府日益关注AI主权的背景下。欧盟正在推进其“AI工厂”计划，旨在建立本土计算能力和模型训练基础设施。日本和印度也宣布了类似倡议。Anthropic的突然下线，可能成为推动这些努力的催化剂。对于Anthropic本身，公司表示正在与白宫谈判，希望恢复Fable和Mythos的访问权限。但损害已经造成：它强化了这样一种观念，即美国AI公司可能随时被政府用作地缘政治工具。这可能会加速全球AI供应链的去中心化，推动更多国家投资于自己的AI生态系统。从更广泛的角度看，这一事件凸显了AI技术日益增长的地缘政治重要性。正如互联网早期一样，控制关键基础设施的国家将拥有巨大的影响力。但与美国主导的互联网不同，AI领域可能出现多个区域中心。中国的DeepSeek、欧洲的Mistral和以色列的AI21等公司已经展示了非美AI的潜力。特朗普政府的行动，无论其初衷如何，可能最终加速了这一趋势。它向世界传达了一个明确的信息：如果你想要可靠的AI访问权限，就不要完全依赖美国。

The Verge3天前原文

338

AI Agent故障检测与根因分析：Strands Evals实战指南

新上线

## 从诊断到修复：Strands Evals如何赋能AI Agent可靠性工程随着AI Agent从实验室走向生产环境，故障检测与根因分析（RCA）成为保障系统稳定性的关键挑战。近期，AWS机器学习团队发布了一篇技术文章，详细介绍了**Strands Evals**——一套专为AI Agent设计的故障检测与诊断框架。本文将结合实际操作流程，解析其核心能力与行业价值。 ### 核心能力：结构化诊断输出 Strands Evals的核心是一组**detector函数**，它们能够对Agent的运行日志或行为数据进行实时分析。其输出并非简单的“正常/异常”二元判定，而是包含三个层次的结构化信息： 1. **分类故障与置信度**：系统会识别故障类型（如工具调用错误、逻辑循环、上下文丢失等），并给出置信度分数。例如，当Agent在连续三次工具调用后仍未完成任务，detector可能以95%的置信度标记为“无效循环”。 2. **因果链**：这是RCA的关键——框架会构建从根本原因（如系统提示词中缺失关键约束）到下游症状（如API调用参数错误）的完整链路。这种“症状→原因”的映射，让开发者能直接定位问题源头，而非被表面现象误导。 3. **修复建议**：基于诊断结果，系统会明确建议修改方向：是调整**系统提示词**（System Prompt），还是修复**工具定义**（Tool Definitions）。例如，若故障源于Agent对工具功能理解偏差，建议优先优化Prompt中的描述；若因工具参数类型不匹配，则需更新函数签名。 ### 集成到评估流水线：自动化诊断文章重点展示了如何将Strands Evals嵌入现有的CI/CD评估流程。通过在每个测试运行（test run）后自动调用detector函数，团队可以实现： - **持续监控**：每次模型更新或Prompt改动后，自动检测新引入的回归问题。 - **批量分析**：对历史运行日志进行离线扫描，发现隐藏的故障模式（如特定用户输入触发的罕见错误）。 - **量化改进**：通过对比故障率、修复建议命中率等指标，评估优化措施的实际效果。例如，一个电商客服Agent在测试中频繁出现“商品推荐不相关”的错误。Strands Evals的因果链可能显示：根本原因是系统提示词中“根据用户历史购买记录推荐”的指令不够明确，导致Agent过度依赖通用规则。修复建议直接指向Prompt修改，而非盲目调整底层模型。 ### 行业背景与价值当前，AI Agent的可靠性已成为企业落地的最大瓶颈之一。据Gartner预测，到2026年，30%的大型企业将采用Agent架构，但**故障定位的复杂性**是主要挑战——传统监控工具（如错误日志、性能指标）无法理解Agent的语义推理过程。Strands Evals的亮点在于： - **可解释性**：因果链让“黑盒”Agent的决策路径透明化，符合可解释AI（XAI）趋势。 - **低成本集成**：无需修改Agent代码，仅需在评估层添加detector调用。 - **领域通用性**：支持多种Agent框架（如LangChain、Semantic Kernel），且故障类型可自定义扩展。 ### 小结 Strands Evals为AI Agent的可靠性工程提供了一个实用的诊断工具。其结构化输出不仅缩短了从故障发现到修复的周期，还通过自动化集成提升了团队迭代效率。对于正在构建生产级Agent的团队而言，这无疑是一个值得关注的技术方向。未来，随着更多企业采用Agent驱动关键业务，类似的可观测性工具将成为基础设施的标配。

AWS ML3天前原文

339

如何立即下载 iOS 27 开发者测试版（以及哪些机型支持）

新上线

苹果在 WWDC 2026 上正式发布了 iOS 27，并随即向开发者开放了测试版。对于大多数 iPhone 用户而言，正式版将在今年秋季以免费软件更新的形式推送，但可用性可能因运营商、地区和当地法规而有所不同。iOS 27 是当前 iPhone 操作系统 iOS 26 的继任者，带来了多项针对日常用户体验的改进。 ## 如何获取 iOS 27 开发者测试版想要提前体验 iOS 27 的用户，可以通过以下步骤获取开发者测试版： 1. **注册 Apple Developer Program**：你需要一个开发者账号，年费为 99 美元。注册后，登录 [developer.apple.com](https://developer.apple.com)。 2. **在 iPhone 上启用 Beta 更新**：前往“设置” > “通用” > “软件更新” > “Beta 版更新”，选择“iOS 27 Developer Beta”。 3. **下载并安装**：点击“下载并安装”，等待设备重启即可。需要注意的是，开发者测试版可能存在不稳定或兼容性问题，建议在备用设备上安装，并提前备份数据。 ## 支持 iOS 27 的机型根据苹果官方信息，iOS 27 将支持以下 iPhone 型号： - iPhone 17 系列（包括 Pro 和 Pro Max） - iPhone 16 系列 - iPhone 15 系列 - iPhone 14 系列 - iPhone 13 系列 - iPhone 12 系列 - iPhone 11 系列 - iPhone XS 和 XS Max - iPhone XR - iPhone SE（第二代及后续机型）需要注意的是，iPhone X 及更早机型可能不再获得支持。 ## iOS 27 的主要新特性虽然 WWDC 主题演讲中详细介绍了多项更新，但根据已知信息，iOS 27 重点改进了以下方面： - **Siri 的深度集成**：得益于大语言模型，Siri 现在能够更自然地理解上下文，并执行跨应用操作。 - **全新的锁屏小组件**：用户可以在锁屏界面添加更多互动式小组件，如快捷操作和实时活动。 - **隐私增强**：新增应用跟踪透明度报告，以及更细粒度的位置权限控制。 - **Apple Intelligence 扩展**：AI 功能覆盖更多原生应用，包括邮件智能回复、照片编辑建议等。 ## 开发者与用户的注意事项对于开发者来说，测试版是适配应用和测试新 API 的关键阶段。苹果在 WWDC 上强调，开发者应利用 Xcode 16 中的新工具优化应用性能。对于普通用户，如果并非开发者或极度渴望尝鲜，建议等待公测版或正式版。测试版可能影响电池续航、导致应用崩溃，甚至造成数据丢失。 ## 结语 iOS 27 的开发者测试版现已开放，标志着苹果在 AI 驱动的用户体验上迈出新一步。随着秋季正式版的临近，更多细节将逐步揭晓。如果你决定尝试，请务必做好备份，并留意反馈渠道。

ZDNet AI3天前原文

340

6款Android Auto应用，早该发现，让每次驾驶更轻松

新上线

如果你使用Android Auto仅仅是为了导航和听音乐，那你可能错过了不少实用功能。事实上，通过一些精心挑选的应用，Android Auto可以大幅提升驾驶体验，让每一次出行都更加高效、安全、有趣。以下是6款值得立即尝试的应用，它们涵盖了导航、娱乐、信息获取等多个方面。 ### 1. **Waze**：社区驱动的实时导航 Waze不仅提供基础导航，更以其强大的社区功能著称。用户实时共享路况、事故、警察测速点等信息，帮助你避开拥堵，选择最佳路线。对于经常通勤或长途驾驶的用户来说，Waze的实时更新功能是无可替代的。 ### 2. **Pocket Casts**：播客爱好者的最佳伴侣如果你喜欢在驾驶时收听播客，Pocket Casts是Android Auto上最出色的播客应用之一。它支持自动下载、播放速度调整、跨设备同步进度，并且界面简洁，与Android Auto的整合非常流畅。你可以轻松浏览订阅的节目，快速切换单集，而不会分散驾驶注意力。 ### 3. **Spotify**：不仅是音乐，还有播客与有声书虽然很多人已经使用Spotify，但Android Auto版本的优化值得重新审视。除了海量音乐，Spotify还整合了播客和有声书，让你在一个应用中满足所有音频需求。其个性化推荐算法能根据你的驾驶习惯和心情推荐内容，让长途驾驶不再枯燥。 ### 4. **Google Maps**：超越基础导航的全面助手尽管Google Maps是默认导航应用，但许多用户并未充分利用其高级功能。例如，你可以保存常用地点、查看实时公交信息、搜索沿途的餐厅或加油站，甚至与朋友共享实时位置。在Android Auto上，这些功能都经过优化，语音控制响应迅速，让你无需动手即可获取信息。 ### 5. **Car Scanner ELM OBD2**：实时车辆诊断对于喜欢了解车辆状态的车主，Car Scanner ELM OBD2是一款强大的工具。通过蓝牙连接OBD2适配器，你可以在Android Auto屏幕上实时查看发动机转速、水温、油耗、故障码等数据。它甚至支持自定义仪表盘，让你根据需求监控关键指标，提前发现潜在问题。 ### 6. **Audible**：有声书让驾驶更有意义如果你喜欢在驾驶时“阅读”，Audible是有声书领域的标杆。Android Auto版本的Audible支持无缝播放，你可以通过语音命令查找书籍、跳转章节或调整播放速度。结合驾驶场景，选择一本引人入胜的小说或自我提升类书籍，让通勤时间变成学习时间。 ## 小结以上6款应用覆盖了导航、娱乐、车辆诊断等多个领域，能够显著提升Android Auto的使用体验。如果你尚未尝试，不妨从最感兴趣的一款开始，逐步发掘Android Auto的潜力。记住，安全驾驶永远是第一位，语音控制是这些应用的最佳操作方式。

ZDNet AI3天前原文