AI 资讯

每日聚合最新人工智能动态

301

《纽约时报》指控OpenAI在ChatGPT版权审判中隐藏证据

新上线

《纽约时报》与《每日新闻》指控OpenAI在长达两年的版权诉讼中隐藏关键证据，包括其能够搜索训练数据与聊天记录的能力。原告称，OpenAI数据隐私工程师Vinnie Monaco在法庭作证中披露，公司早已建立约7800万条去标识化ChatGPT对话的数据库，用于内部评估侵权情况，并开发了名为“Project Giraffe”的工具集，其中“Bloom”过滤器可检测并记录输出中的版权内容复现。这些内部工具与数据的存在，与OpenAI此前声称“无法搜索训练语料”、“技术负担过重”等抗辩理由直接矛盾。原告还指出，OpenAI在诉讼后删除了数十亿条ChatGPT输出，违反法院证据保全令，且提交的2000万条日志样本因大量涂黑被法院认定为“不可用”。该动议旨在寻求制裁，进一步激化这起标志性AI版权案。 ## 核心争议：OpenAI是否隐瞒了技术能力？诉讼焦点在于OpenAI是否故意隐瞒其检索训练数据与对话记录的能力。此前，OpenAI以技术困难与用户隐私为由，拒绝提供大规模日志数据。但Monaco的证词显示，公司早在诉讼前就已构建对话数据库，并用于内部侵权评估。此外，“Project Giraffe”工具的披露表明，OpenAI有能力检测版权内容复现，却未主动向法院说明。 ## 原告指控：证据破坏与拖延策略原告声称，OpenAI在诉讼后删除数十亿条ChatGPT输出，涉嫌违反证据保全令。同时，OpenAI将原本要求的1.2亿条日志样本压缩至2000万条，且提交版本中大量信息被涂黑，法院评价其“不可用”。这些行为被解读为刻意阻碍原告获取关键证据。 ## 行业影响：AI版权诉讼的标杆案例此案若认定OpenAI存在隐瞒行为，可能加剧监管对AI企业训练数据透明度的要求。目前，多家出版商与创作者正密切关注此案进展，其判决结果或为AI训练数据合理使用范围划出更清晰的边界。

TechCrunch7天前原文

302

OpenAI在与新闻机构的版权战中可能犯下致命错误

新上线

OpenAI 在与《纽约时报》等新闻机构的版权诉讼中，可能因隐藏或删除 ChatGPT 日志而面临制裁。这一行为被法院视为严重违规，可能影响案件走向，甚至导致不利判决。 ## 事件背景《纽约时报》于 2023 年底起诉 OpenAI，指控其未经授权使用大量受版权保护的新闻文章训练 ChatGPT，构成侵权。在诉讼过程中，法院要求 OpenAI 提供相关训练数据和使用日志。然而，OpenAI 被指未能完整保存这些记录，甚至可能故意删除或隐藏关键证据。 ## 潜在后果法律专家指出，若法院认定 OpenAI 存在故意销毁证据的行为，可能触发“不利推断”原则——即推定被销毁的证据对 OpenAI 不利。这可能导致 OpenAI 在版权侵权、合理使用等核心争议上处于劣势。此外，OpenAI 还可能因违反证据保全义务而面临罚款或其他制裁。 ## 行业影响此案被视为 AI 版权领域的标志性诉讼。如果 OpenAI 因证据问题败诉，将迫使所有 AI 公司重新审视训练数据的合规性，并强化数据溯源与日志管理。同时，这也凸显了 AI 研发中“黑箱”问题的法律风险——模型训练过程的不透明性可能成为诉讼中的致命弱点。 ## 小结 OpenAI 的“证据门”不仅关乎个案胜负，更可能为 AI 行业的版权合规树立重要先例。目前，法院尚未作出最终裁决，但这一动向已引发广泛关注。

Hacker News667天前原文

303

我测试了ChatGPT的Live语音升级，几乎感觉像真人对话——如何体验

新上线

OpenAI 为 ChatGPT 推出了全新的 Live 语音模型，采用全双工架构，让 AI 能够同时听和说，实现更自然的对话。笔者亲测后认为，这种体验几乎与真人交谈无异，但仍存在细微差距。 ## 从单工到全双工：语音交互的质变以往的 AI 语音助手大多采用“半双工”模式：你说话时它沉默，它说话时你只能听。这种轮流发言的机制让对话显得生硬，中断或插话常常导致混乱。而 ChatGPT 的 **GPT-Live** 模型引入了 **全双工架构**，意味着 AI 可以一边听你说话，一边回应，甚至同时进行网络搜索。实际体验中，当你说话时，AI 会适时插入“嗯”、“对”等反馈词，表明它在专注倾听。这种细微的交互变化极大地提升了对话的流畅度。你不再需要等待 AI 说完一整句话才能回应，而是可以像与真人交谈一样自然地打断或补充。 ## 多任务处理：边聊边查 Live 模型的另一大亮点是 **并行处理能力**。在对话过程中，你可以要求 ChatGPT 执行网络搜索或完成某个任务，这些操作会在后台由另一个模型处理，不会中断当前对话。例如，你在讨论某个技术问题时，AI 可以同时查找相关资料，并在合适时机给出引用。这种“边聊边查”的能力让语音助手从单纯的聊天工具变成了更高效的协作者。 ## 实际体验：接近真人，但仍有距离笔者在测试中发现，当对话节奏较快时，GPT-Live 能够很好地跟上，甚至能主动插话。但在长时间停顿或话题突然切换时，AI 有时会显得迟疑。此外，尽管反馈词增加了真实感，但偶尔的时机偏差仍会暴露其机器本质。总体而言，它已经非常接近真人对话，但尚未完全消除“AI 感”。 ## 如何体验新模型已部署在 **ChatGPT 网页版、Windows 应用和移动应用** 中。所有 ChatGPT 用户均可使用，免费版和付费版均可体验。只需在语音模式中选择 Live 模型即可。需要提醒的是，OpenAI 目前仍在不断优化该模型，未来可能根据用户反馈调整交互细节。 ## 行业意义全双工语音交互是 AI 助手迈向更自然人机交互的关键一步。谷歌、亚马逊等公司也在探索类似技术，但 OpenAI 率先将其落地到通用对话模型中。这一进步不仅适用于日常聊天，在客服、教育、远程协助等场景中也有巨大潜力。不过，隐私和伦理问题也随之而来——AI 能“同时听和说”意味着它可能在不经意间捕捉到更多背景信息，如何确保用户知情同意将是后续需要关注的重点。

ZDNet AI7天前原文

304

谷歌将标注AI生成的广告，消费者可一键查看广告制作方式

新上线

谷歌近日宣布，将在其广告系统中推出新的消费者可见功能，帮助用户识别哪些广告使用了人工智能技术。这项功能将集成在 **My Ad Center**（我的广告中心）面板中，用户通过点击广告上的三点菜单或信息图标即可进入。此前，该面板已支持用户屏蔽或举报广告、了解广告主信息及广告展示原因，现在新增的“How this ad was made”（此广告如何制作）选项将告知用户该广告是否由AI创建或编辑。这一举措的背景是，AI技术大幅降低了广告制作的门槛——品牌可以轻松生成产品在不同场景下的展示图，而无需进行真实的电商摄影。但与此同时，如果消费者无法区分真实照片与AI生成内容，就可能导致误导。虽然谷歌早已禁止误导性和欺骗性广告，但过去只要求选举类广告披露AI使用情况。现在，这一要求扩展至所有广告。对于使用谷歌生成式AI广告工具创建的广告，系统会自动启用披露标签。但如果广告由第三方工具制作，广告主则需要手动通过新的控制选项来声明是否使用了AI。谷歌表示，**不会主动核查广告主的声明是否属实**，这意味着该机制在很大程度上依赖广告主的诚信。此外，在某些法律法规有明确要求的市场，广告可能会被强制标注AI相关标签。从行业角度看，谷歌此举是对AI广告透明度呼声的回应。随着生成式AI在广告创意领域的快速普及，消费者对“所见是否所得”的疑虑日益增加。Meta、TikTok等平台此前也推出了类似的AI内容标签，但多集中在用户生成内容或政治广告领域。谷歌将披露机制扩展到所有商业广告，且将其纳入统一的广告信息面板，降低了用户的认知成本。不过，依赖广告主主动申报的策略也引发了争议。批评者认为，缺乏第三方验证可能让不诚信的广告主钻空子。谷歌对此尚未公布具体的抽查或惩罚措施。未来，随着各国AI监管法规的完善，强制标注或将成为行业标配，而谷歌的这一步或许只是开始。

TechCrunch7天前原文

305

巴黎AI语音创企Gradium获Nvidia参投，1亿美元种子轮刷新赛道纪录

新上线

**巴黎AI语音初创公司Gradium宣布完成1亿美元种子轮融资，英伟达（Nvidia）作为新投资者加入。** 本轮融资最初于去年12月启动，当时以7000万美元规模走出隐身模式，如今追加至1亿美元，显示出资本市场对实时语音AI赛道的强烈信心。 Gradium由前Google Brain、DeepMind和Facebook研究员Neil Zeghidour联合创立，从法国AI实验室Kyutai（由电信亿万富翁Xavier Niel支持）分拆而来。公司专注于开发超低延迟的语音AI模型，旨在消除AI对话中常见的“尴尬停顿”，实现近乎即时的语音响应。 ## 融资细节与战略意图此轮融资的投资者阵容豪华，包括**FirstMark Capital、Eurazeo、DST Global Partners、Eric Schmidt以及Xavier Niel**。新增的Nvidia参投尤为引人注目——作为AI算力基础设施的绝对龙头，Nvidia的投资往往带有生态布局意味。Gradium表示，资金将主要用于在**旧金山湾区开设办公室**，与Anthropic、Google、Meta和OpenAI等巨头争夺人才。 > “巴黎虽是欧洲AI重镇，但能接近全球最活跃的AI生态系统至关重要。”公司声明中如此解释跨洋扩张的决策。 ## 产品与竞争格局 Gradium的技术核心是**大规模、超低延迟的语音生成模型**。与市面上多数需要数百毫秒甚至更久才能响应的方案不同，其模型可将延迟压缩至人类自然对话的感知阈值以下。这在客服、虚拟助手、游戏NPC等场景中具有显著优势——用户不再需要等待“呃...让我想想”式的机械回应。竞争方面，该赛道已十分拥挤：**ElevenLabs**在2月估值达到110亿美元，**Google的Gemini**等大模型厂商也内置了强大的语音能力。但Gradium似乎已找到差异化路径：自去年12月上线以来，已拿下包括**法国汽车制造商雷诺（Renault）**在内的大客户。 ## 行业视角这笔交易折射出两个趋势：一是**语音AI正从“能听会说”向“即时交互”演进**，低延迟成为产品落地的关键门槛；二是**欧洲AI初创公司越来越多选择“双总部”模式**——保留欧洲研发根基的同时，在美国建立商业和人才据点。Gradium的案例表明，即使拥有欧洲顶级实验室背景，要参与全球AI竞赛，仍需直接切入硅谷的人才池与客户网络。 ## 小结 1亿美元种子轮、Nvidia背书、雷诺订单——Gradium用三个标签为自己贴上了“值得关注”的标记。但语音AI赛道已进入白热化阶段，资金只是入场券，真正的考验在于能否将技术优势转化为可持续的客户价值。对于这家巴黎起家的公司，硅谷的新办公室既是机遇，也是挑战。

TechCrunch7天前原文

306

Anthropic Wants You to Pay Up for Claude Fable 5

新上线

Claude subscribers must soon pay usage-based fees to access Anthropic’s best consumer AI model—a sign that the golden era of AI subscriptions is ending.

WIRED AI7天前原文

307

政府如何判定OpenAI前沿模型可以安全发布？透明度成谜

新上线

OpenAI 正逐步向公众开放其最新高级语言模型 **Sol**，该模型被认为至少与 Anthropic 的 **Fable** 相当——后者曾因其能力（或所有权）让白宫紧张，一度被禁止公开访问。那么，这些模型是如何获得发布许可的？简短回答：没人确切知道。乔治城大学安全与新兴技术中心高级研究分析师 Mina Narayanan 对 TechCrunch 表示：“坦白说，我无法了解这些具体流程，因此没有足够信息判断它们是否充分。”Anthropic 曾透露他们与政府进行了对话，开发了检测越狱尝试的分类器，并实施了防御性差距策略以防止未来越狱，但“政府与 Anthropic 和 OpenAI 之间的对话具体内容并不清晰”。前特朗普政策顾问、现任职于 OpenAI 的 Dean W. Ball 上个月在其通讯中写道：“没人知道获得许可的要求是什么。”Databricks、Perplexity 和 Laude Institute 的联合创始人、计算机科学家 Andy Konwinski 表示，他从未与任何了解该流程的人交谈过，甚至包括前沿实验室的员工。“这本质上是个问题，”他对 TechCrunch 说，“无论是否涉及安全，关键在于谁拥有决策权——谁把关并决定权限？” 特朗普政府执政 18 个月后，推进路径仍不明确，部分批评者认为这恰恰是因为行业人士在制定政策。上个月，经过数周内斗，一项行政令发布，为评估前沿模型制定了路线图，但具体细节尚未填充——除了明确不会有的内容。“不会出现‘AI 领域的 FDA’，”前 Andreessen Horowitz 合伙人、上月刚卸任白宫 AI 高级顾问的 Sriram Krishnan 告诉《金融时报》。值得注意的是，目前仍未就哪些模型需要政府审查、以及应由哪个或哪些机构进行评估达成一致。目前，商务部下属的 **AI 标准与创新中心** 似乎正在牵头，但行政令要求六个内阁机构在 8 月初之前确定最终流程。在此期间，过程充其量是临时性的。OpenAI CEO Sam Altman 在 CNBC 上表示，该流程涉及……（正文因字数限制截断，但核心信息已涵盖）

TechCrunch7天前原文

308

Instagram 用户看过来：如何阻止 Meta 的 AI 使用你的照片

新上线

Meta 于本周二推出了名为 **Muse Image** 的新 AI 图像生成功能，允许用户在旗下应用内创建原创图片、编辑现有照片，甚至生成定制广告。然而，其中一项能力迅速引发争议：Muse Image 允许用户利用公开 Instagram 账户中的照片生成 AI 图像。只要某人的个人资料是公开的，其他用户就可以标记该账户并将其照片用于 AI 生成内容。（仅私密账户和 18 岁以下用户的账户被自动排除在外。） **核心问题在于知情同意**。用户可能完全不知道自己的公开照片会被陌生人纳入 AI 图像，且当有人复用其公开内容时，用户甚至不会收到通知。此外，轻松操控他人图像的功能为滥用、骚扰、冒名顶替和非自愿图像编辑打开了大门。 ## 如何退出 Meta 的 Muse Image 生成器如果您希望阻止自己的照片被用于 AI 生成，可按照以下步骤操作： 1. 前往您的个人资料页面，点击右上角的三条横线。 2. 向下滚动找到“分享与复用”。 3. 寻找“允许他人在 Instagram 上使用您的内容参与 Meta AI 功能”的选项。 4. 将帖子和 Reels 的对应开关都关闭。 ## 行业背景与隐私担忧 Muse Image 的推出正值 AI 工具日益融入社交媒体平台之际。随着科技公司竞相推出新的生成式 AI 功能，许多专家认为需要更强的隐私保护和更高的透明度，以便用户充分了解自己的照片和个人数据如何被使用。公众对 AI 的怀疑情绪已然高涨。根据皮尤研究中心的调查，**35% 的受访者**表示对人工智能日益广泛的应用感到担忧多于兴奋。此外，Meta 在用户隐私方面的过往记录也加剧了人们对其最新 AI 功能的质疑。2019 年，美国联邦贸易委员会（FTC）因 Facebook 违反 2012 年的同意令，误导用户对其个人信息的控制权，对其处以 **50 亿美元** 罚款。此前，政治咨询公司剑桥分析通过一款性格测试应用获取了多达 **8700 万** Facebook 用户的数据。当时 Facebook 的平台政策允许开发者收集用户好友的信息，而许多用户对此并不知情。 ## 小结 Muse Image 的争议再次凸显了 AI 时代隐私保护的困境。对于普通用户而言，主动关闭相关设置是目前最直接的防护手段；而对于行业而言，如何在创新与隐私之间取得平衡，仍是一个待解的难题。

TechCrunch7天前原文

309

Meta新一代AI芯片将于9月投产，旨在降低GPU成本

新上线

据路透社援引内部备忘录报道，Meta计划于今年9月开始生产其最新版本的AI定制芯片，旨在缓解因组件短缺导致的GPU成本压力。该芯片是Meta训练与推理加速器（MTIA）项目的一部分，由Meta与博通合作设计，并由台积电负责制造。备忘录透露，至少有一款芯片在大约六周内通过了测试阶段。 Meta在3月详细介绍了四款新芯片，其中部分已部署或将在今年或明年部署。公司采取模块化设计方法，通过可组合的芯片组（chiplet）来适应AI技术的快速演进。每一代MTIA都基于前代改进，融入最新的AI工作负载洞察和硬件技术，并以更短的周期进行部署。这些芯片将主要用于训练排名和推荐算法模型、处理更广泛的AI工作负载以及面向应用的推理任务。尽管Meta仍会从英伟达和AMD等厂商采购GPU，但自研芯片有望帮助公司节省大量成本。自2023年以来，Meta一直在自研AI芯片，并已投入巨资确保计算能力。公司4月预计今年资本支出将在1250亿至1450亿美元之间，其中很大一部分用于AI项目。此外，Meta还在全球范围内达成数据中心和电力协议，投入数百亿美元获取计算能力，以训练和部署其新的Muse Spark系列AI模型。据备忘录，Meta计划今年部署7吉瓦的计算能力，明年翻倍。去年，Meta还与ARM签约以确保推荐系统的计算资源，并分别与AMD和亚马逊达成数十亿美元的协议，使用其Instinct GPU和自研CPU满足AI需求。 Meta并非唯一试图减少对英伟达依赖的公司。OpenAI上月也发布了自研AI芯片计划。随着AI芯片竞争加剧，Meta的模块化策略和快速迭代能力或将成为其关键优势。

TechCrunch7天前原文

310

iPhone截图裁剪后竟自动恢复原图？一个Bug让我暴露隐私，但我找到了解决办法

新上线

近日，有用户反映iPhone在iOS 26.5.2系统下出现了一个令人不安的Bug：**裁剪后的截图无法保存，反而自动恢复为完整原图**。这意味着用户本想隐藏的敏感信息，可能在不知情的情况下被分享出去。该问题的具体表现是：用户通过截图预览界面进行裁剪并点击“完成”后，系统并未保存裁剪后的版本，而是将原始完整截图存入相册。如果用户立即将“裁剪后”的截图分享给他人，实际发送的却是未经处理的完整图片，导致隐私泄露风险。 **临时解决方案**：目前唯一的变通方法是放弃预览裁剪流程，改为先将完整截图保存到相册，然后通过照片编辑功能进行裁剪并保存。虽然步骤繁琐，但能确保裁剪生效。苹果尚未正式确认此Bug，但考虑到iOS 27测试版已发布（该用户曾因Roku遥控器应用冻结问题从iOS 27降级至iOS 26.5.2），推测该问题可能与系统版本有关。建议用户： - **在分享截图前务必检查实际发送内容** - **优先使用相册编辑功能进行裁剪** - **关注苹果后续系统更新修复** 这一Bug再次提醒我们：在等待官方修复的同时，手动双重确认仍是保护隐私的最后防线。

ZDNet AI7天前原文

311

英伟达：自己创造的算力市场，却成了受害者

新上线

英伟达曾是 AI 硬件领域的绝对王者，但近两个月股价从 5 月高点下跌 15%，即便营收仍在增长。与此同时，内存巨头美光（Micron）市值近乎翻了三倍，成为新的市场宠儿。这背后反映出一个深刻的结构性转变：GPU 短缺缓解，而内存（DRAM）成为数据中心的新瓶颈。 ## 技术光环 vs. 市场现实英伟达的成功建立在真正的技术创新之上——CUDA 平台和 GPU 的快速迭代使之成为 AI 研究的默认引擎。然而，市场并不总是奖励最复杂的技术。内存芯片的制造相对成熟，但需求暴涨让美光这样的公司坐享其成：DRAM 现货价格自 2023 年以来大幅攀升，过去一年涨幅达 **10 倍**。 ## 算力市场的悖论英伟达证明了算力的巨大价值，但这一市场正变得“人人都想分一杯羹”。GPU 的供应紧张已在缓解，而数据中心对内存的需求却远超预期。投资者开始重新评估：是继续追捧技术壁垒最高的公司，还是转向那些虽然技术简单但供需缺口更大的环节？美光的崛起恰恰说明了后者的吸引力。 ## 谁的未来更稳？英伟达面临的不只是短期股价波动，更是市场逻辑的转变。当内存成为新瓶颈，英伟达的定价权可能被削弱。而美光等公司则受益于“量价齐升”的简单逻辑。这场算力市场的游戏，赢家可能不再是技术最亮眼的玩家。

TechCrunch7天前原文

312

微软全面押注AI驱动Windows安全新战略：对企业用户意味着什么

新上线

微软正在加速利用AI来自动化检测Windows漏洞，并已通过新流程向客户推送关键修复。这一举措旨在应对攻击者利用AI工具加速发现和利用漏洞的挑战。 ## 核心要点 - **AI驱动的漏洞发现**：微软建立了一套名为MDASH（多模型代理扫描框架）的自动化管道，利用AI在Windows代码库中大规模识别漏洞，减少误报并优先处理高风险问题。 - **更快的修复交付**：通过云端扫描和验证流水线，微软能够缩短从漏洞发现到客户保护的时间。企业管理员应预期每次更新中包含更多修复。 - **应对AI攻击加速**：攻击者已能利用AI快速找到新漏洞并发起攻击，微软此举旨在“在攻击者利用之前发现并修复问题”。 ## 战略背景与影响 Windows运行在超过15亿台PC和服务器上，是最显眼的攻击目标。微软Windows+设备部门执行副总裁Pavan Davuluri在博客中强调：“减少客户风险的最快方式是在攻击者利用之前发现漏洞。” 传统安全团队面临“好人必须防住每一次攻击”的不对称劣势，而AI的加入进一步放大了这种不平衡。微软的新策略通过AI自动化扫描、优先级排序和工程修复流水线，试图扭转局面。 ## 企业用户需注意 - **更新频率与内容**：企业IT管理员应准备接收更多修复补丁，因为AI发现漏洞的效率提升会带来更密集的更新。 - **验证与兼容性**：微软强调通过强化验证流程确保更新质量，但企业仍需在测试环境中验证关键业务应用的兼容性。 - **安全运营调整**：安全团队需关注微软安全公告中的新增修复项，并调整补丁管理策略以适应更快的更新节奏。 ## 行业意义这一战略反映了AI在网络安全领域的双重角色：既是攻击者的加速器，也是防御者的利器。微软将AI深度嵌入Windows安全开发生命周期，标志着从被动响应向主动预防的转变。未来，其他平台厂商可能跟进类似AI驱动漏洞管理方案。总结来说，微软的AI安全新战略旨在通过自动化提升漏洞发现和修复速度，为企业用户提供更强的前置防护，但同时也要求企业IT部门适应更快速的更新节奏和更密集的补丁管理。

ZDNet AI7天前原文

313

OpenAI 获政府批准公测 GPT-5.6，同步推出“ChatGPT Work”智能代理

新上线

OpenAI 在经历约两周的监管波折后，终于获得特朗普政府批准，正式向公众推出其最新旗舰模型 **GPT-5.6**。CEO Sam Altman 称其为“我们迄今最好的模型”。与此同时，OpenAI 还发布了一款名为 **ChatGPT Work** 的新 AI 智能代理，旨在让非技术用户也能轻松利用 Codex 的能力完成文档、表格、演示文稿乃至 Web 应用等任务。 ## 从“受限预览”到全面开放 GPT-5.6 最初在约两周前推出，但当时仅面向政府批准的组织进行“受限预览”，引发了监管层面的讨论。如今，随着政府绿灯亮起，该模型已向全球用户开放。OpenAI 在公告中强调，包括免费用户在内的 Mac 和 Windows 桌面端用户已可立即通过 ChatGPT 桌面应用访问 GPT-5.6 和 ChatGPT Work；而 Pro、Enterprise 和 Edu 用户在移动端和网页端将优先获得权限，Plus 和 Business 用户则将在“未来几天内”陆续收到更新，整体推送预计在 24 小时内完成全球覆盖。 ## ChatGPT Work：Codex 能力的大众化 ChatGPT Work 被描述为 ChatGPT 与 Codex 的结合体。它由 GPT-5.6 模型套件（包括 Sol、Terra 和 Luna）驱动，能够从用户指定的应用、文件和流程中收集上下文，并自动生成文档、电子表格、演示文稿和 Web 应用等成品。其统一的插件目录支持连接 Slack、Gmail、Google Drive、日历和 CRM 等常用工具，大幅降低了 AI 智能代理的使用门槛。这一发布正值 AI 代理竞争白热化之际。Anthropic 此前推出了 **Claude Cowork**（整合了 Claude 和 Claude Code），谷歌和苹果等科技巨头也在加速布局。尤其是在开源 AI 代理 **OpenClaw** 走红后，业界对“真正对普通人有用”的 AI 代理需求更加迫切。OpenAI 希望通过 ChatGPT Work 在这一赛道中占据领先地位，而 Sol（GPT-5.6 中最强大的子模型）将成为其核心优势。 ## 行业背景与展望 GPT-5.6 的公测标志着 OpenAI 在模型迭代与合规之间找到了新的平衡点。此前，监管审查曾一度阻碍其大规模部署，而此次政府快速放行也反映出 AI 政策环境的微妙变化。对于普通用户而言，ChatGPT Work 的推出意味着 AI 代理不再只是开发者的工具，而是可以融入日常办公与生活流程的“数字助手”。不过，AI 代理的实际效果仍存疑问。尽管 OpenAI 和 Anthropic 等公司不断加码，但真正能无缝执行复杂多步骤任务、并理解用户意图的 AI 代理尚未成熟。ChatGPT Work 能否在实用性上超越竞争对手，还需要用户的实际检验。

The Verge7天前原文

314

微软的补丁星期二将变得更“厚重”

新上线

微软宣布将更深度地利用 AI 来加速安全漏洞的发现与修复，这意味着未来的 Windows 11 更新中，每次安全发布所包含的补丁数量将显著增加。这一变化既是应对日益猖獗的 AI 驱动攻击，也是微软自身安全流程升级的必然结果。 ## 从被动防御到主动出击长期以来，微软的“补丁星期二”一直是 Windows 用户每月固定的安全节奏。但随着攻击者——包括业余黑客——越来越多地利用 AI 工具快速挖掘和利用漏洞，传统的补丁周期已显吃力。微软在官方博客中坦言，AI 的介入让“潜在问题能被更早识别”，因此客户将在每次安全更新中看到“更高密度的安全修复”。这并非空穴来风。今年 5 月，名为“Copy Fail”的高危漏洞几乎影响了所有 Linux 发行版，而安全研究员正是借助 AI 才得以快速定位该漏洞。同样，Anthropic 在发布 Claude Mythos 模型时声称，该模型已在“每个主流操作系统”中发现高危漏洞。AI 正在同时成为攻击者和防御者的利器。 ## 流程重塑：从开发到发布的 AI 渗透为了在提升速度的同时保证质量，微软表示正在更新其 **安全开发生命周期（SDL）**，明确要求流程必须“显式考虑潜在的 AI 赋能攻击技术和利用路径”。此外，微软还在投资“Windows 特定工具和代理框架”，用于辅助生成和验证安全补丁，但强调“人类仍将参与代码审查环节”。这意味着 AI 将负责初筛、生成修复建议，而最终决策权——尤其是涉及风险权衡的更新——依然掌握在开发者手中。微软希望借此在“速度”与“准确性”之间取得平衡。 ## 对用户意味着什么？对于普通 Windows 11 用户来说，最直观的变化是：**每个月的补丁星期二，系统更新包可能会更大，安装时间也可能更长**。但好处是，更多已知漏洞将在同一时间被修复，减少了因等待累积更新而暴露在风险中的窗口期。不过，微软也承认这并非没有挑战。更大规模的更新可能增加系统兼容性问题的概率，尤其是在企业环境中。为此，微软正在改进更新验证流程，并计划提供更灵活的暂停选项——正如早些时候宣布的“允许无限期暂停更新”功能所暗示的那样。 ## 行业趋势：AI 安全军备竞赛升级微软的举措并非孤例。整个安全行业都在经历一场由 AI 驱动的范式转变：传统基于签名的检测正让位于行为分析与异常检测，而漏洞发现也从人工代码审计转向大规模 AI 辅助扫描。微软此次将 AI 直接嵌入到补丁生产线的做法，标志着安全响应从“被动修复”向“主动预防”迈出了实质性一步。可以预见，未来会有更多厂商效仿微软，将 AI 深度整合进安全开发生命周期。对于用户而言，这意味着更频繁的更新和更高的系统安全性——但前提是，AI 的“幻觉”不会在补丁中引入新的问题。

The Verge7天前原文

315

MCP 工具设计：实用方法与权衡取舍

新上线

当基于模型上下文协议（MCP）的工具表现不佳时，问题往往不在协议本身，而在于工具设计。许多团队直接将现有 API 暴露给智能体，期望模型自行搞定一切。对于简单场景，这或许可行，但更多时候会失败。 ## 两大核心问题：臃肿与混淆 **臃肿**是指每次调用时，所有工具定义都会加载到 LLM 的上下文中，即使某些工具未被使用。多个连接的 MCP 服务器可能在用户提问前就消耗大量上下文。随着上下文被填满，模型的推理能力下降，会话效率降低。 **混淆**则表现为模型做出错误选择——调用不合适的工具、传入错误的参数。随后的重试进一步加剧臃肿，形成恶性循环。工具间语义相似、选项过多、命名模糊都会加剧混淆。 ## 常见误区与改进方向一个常见的“修复”是丰富工具描述，添加更清晰的定义、自然语言映射和使用示例。这确实有助于缓解混淆，但每增加一点内容都可能恶化臃肿，反而加剧了原本想解决的问题。解决臃肿和混淆本质上是一个**上下文工程（context engineering）**问题——即塑造 LLM 看到的内容以及何时看到，从而让模型产生更好的结果。 ## 实践方法与权衡为了具体说明，文章构建了一个模拟 K-12 内容搜索 API 的示例，并通过 MCP 协议暴露。你可以使用 Kiro CLI 在本地运行并对比不同设计的效果。关键方法包括： - **精简工具定义**：只暴露必要的参数，移除冗余描述。 - **分组与分层**：将相关工具分组，或按使用频率分层加载。 - **动态上下文注入**：仅在需要时才加载特定工具的定义。每种方法都有其取舍：精简可能降低灵活性，分组增加复杂度，动态注入则要求额外的调度逻辑。 ## 小结 MCP 工具设计的核心在于平衡上下文占用与模型理解能力。通过上下文工程优化工具定义，可以显著提升智能体的表现。AWS 建议开发者从“最小必要上下文”原则出发，逐步迭代优化。

AWS ML7天前原文

316

Amazon SageMaker HyperPod 推出企业级推理增强：数据捕获、Hugging Face 集成、NVMe 加速及 Route 53 域名管理

新上线

随着企业生成式 AI 工作负载的规模化，对更快、更可观测、更灵活的推理基础设施的需求持续增长。Amazon SageMaker HyperPod 推出了一系列新功能，旨在简化组织在生产环境中部署和运营大模型的方式。 ## 核心能力一览 ### 1. 多层次推理数据捕获团队现在可以在推理路径的多个节点记录输入和输出数据：从端点、负载均衡器，到模型 Pod 本身。通过声明式自定义资源定义（CRD）配置，提供深度可观测性和审计能力。这意味着你可以独立控制每一层的数据捕获开关，灵活选择适合业务场景的可见性深度。数据最终存储在 Amazon S3 中，用于模型监控、调试和模型改进。 ### 2. 直接从 Hugging Face Hub 部署模型无需提前将模型权重预置到对象或文件存储中，即可直接从热门社区 Hub 部署模型。新功能内置了对**门控访问（gated access）**、**版本锁定（revision pinning）** 和**令牌隔离（token isolation）** 的支持，覆盖 vLLM、TGI、SGLang 等主流推理运行时。这大幅简化了模型部署流程，让团队可以更快地将最新模型投入生产。 ### 3. NVMe 本地加载加速冷启动从节点本地 NVMe 存储加载模型权重，显著减少冷启动延迟。同时，当本地存储不可用时，系统会自动回退到云端存储，确保高可用性。对于需要频繁扩缩容或处理大模型的场景，这一改进能带来可观的性能提升。 ### 4. 自动 Route 53 DNS 管理 HyperPod 现在可以自动管理自定义域名的 DNS 记录。你只需指定域名，系统自动完成 DNS 配置，省去手动设置和运维的麻烦。 ### 5. Pod 级 IAM 权限控制通过自定义服务账户（Custom Service Accounts），基础设施团队可以为每个 Pod 分配细粒度的 AWS Identity and Access Management（IAM）权限。这强化了安全边界，使得多租户场景下的权限隔离更加精准。 ## 企业级推理的新标杆这些增强功能共同构成了一个更高效、更安全、更易于管理的推理平台。无论是需要审计日志的金融行业，还是追求快速迭代的 AI 初创公司，都能从中受益。团队可以在不牺牲治理和运营可见性的前提下，更快地交付 AI 应用。 SageMaker HyperPod 的此次更新，标志着 AWS 在推理基础设施上向企业级需求迈出了重要一步——从模型部署到运行监控，再到安全合规，形成了一个完整的闭环。

AWS ML7天前原文

317

1X Neo机器人拥有惊人的超快手指

新上线

挪威-美国机器人公司**1X**近日公布了其家用机器人**Neo**的仿生手部细节，这款机器人以其柔软、亲和的设计著称，如今配备了具备**25个自由度**的五指手。相比之下，人类手部通常拥有27个自由度。该手部采用**肌腱驱动执行器**，模拟人类手臂肌腱带动手指运动的机制，能实现快速、超伸等人类手指无法完成的动作。结合摄像头与AI视觉系统，Neo可以识别并抓取各种异形物体，实时检测并防止物体滑落。手部还达到**IP68防水等级**，意味着机器人能够自己洗手。1X执行器与手部总监Jonathan Terfurth表示，Neo的运动范围甚至可能超越人类，使其能够开门、搬运重物，甚至在电量低时自行插电。他指出，目标是让机器人在从未接触过机器人的普通人身边安全、顺从且柔软地工作。这标志着机器人从笨拙的机械爪向灵巧操作器的转变，类似于ChatGPT在语言领域的突破。目前，Neo的早期尝鲜定价分别为**20,000美元**和**50,000美元**，限量供应。 ## 从机械爪到仿生手长期以来，家用机器人往往配备简单的夹爪或吸盘，难以处理日常生活中的精细操作。1X Neo的仿生手通过**25个执行器**模拟肌腱运动，不仅提供了接近人类的灵活性，还具备超伸和高速运动能力，使其能够适应多样化的抓取场景。例如，它可以稳定地拿起易碎物品，或调整握持姿势防止滑落。 ## AI赋能的触觉智能手部的**摄像头和AI系统**负责分析环境与抓取对象的形状、材质和位置，实现上下文感知的抓取策略。这意味着Neo不仅能执行预设动作，还能根据实时反馈调整力度和姿态，类似于人类手部的触觉反馈机制。 ## 差异化竞争：柔软安全优先与市场上多数人形机器人追求力量与硬朗外观不同，1X Neo采用**3D晶格外壳**和柔软材质，设计灵感来自迪士尼角色**大白**，强调安全性与亲和力。其目标场景是家庭和办公室，而非工业或军事用途。早期定价在2万至5万美元之间，瞄准高端家用市场。 ## 小结 1X Neo的仿生手代表了机器人灵巧操作技术的重要进展，将肌腱驱动、AI视觉与防水设计结合，使机器人能够更自然地融入人类生活环境。随着这类技术的成熟，家用机器人从“工具”向“伙伴”的转变正在加速。

WIRED AI7天前原文

318

2026年最佳数字笔记本测评：专家亲测推荐

新上线

数字笔记本正在成为纸质笔记本的智能替代品，既保留了手写的自然手感，又消除了纸张杂乱的困扰。ZDNet资深编辑团队经过严格测试，从书写体验、便携性、功能丰富度等维度综合评估，选出了2026年最值得入手的数字笔记本。 ## 最佳选择：Boox Note Air5 C **Boox Note Air5 C** 凭借出色的纸感书写体验、强大的转录工具和便携设计，摘得本次测评的桂冠。它采用电子墨水屏技术，模拟真实纸张的摩擦感，让书写和绘画都流畅自然。内置的语音转文字功能可实时将会议录音转为笔记，大幅提升工作效率。机身轻薄，携带方便，适合学生和职场人士日常使用。 ## 值得关注：Kindle Scribe **Kindle Scribe** 同样表现亮眼，其最大优势是随机附赠触控笔，用户无需额外购买即可开始使用。与亚马逊生态无缝集成，支持在电子书上直接做笔记，对于Kindle重度用户来说是不错的选择。不过，在书写延迟和第三方应用支持上略逊于Boox Note Air5 C。 ## 选购建议 - **书写感受**：优先选择带有电子墨水屏和压感技术的设备，如Boox Note Air5 C。 - **便携性**：如果经常外出，建议选择10英寸以下、重量轻的型号。 - **功能需求**：需要语音转文字、云同步等高级功能的用户，应关注软件生态完善的产品。 - **预算**：数字笔记本价格从几百到几千元不等，建议根据实际使用场景选择。 ## 小结 2026年的数字笔记本市场已经相当成熟，Boox Note Air5 C 和 Kindle Scribe 分别代表了开放生态和封闭生态的顶尖水平。如果你追求极致的书写体验和多功能性，Boox Note Air5 C 是不二之选；如果你是Kindle用户且主要阅读和简单记录，Kindle Scribe 则更具性价比。

ZDNet AI7天前原文

319

你的Tenda路由器可能存在隐藏固件后门——立即关闭此设置

新上线

## 安全警报：Tenda路由器固件后门曝光，远程可被完全控制近日，CERT协调中心（CERT/CC）披露了一项严重安全漏洞：**Tenda旗下多款热门路由器固件中存在隐藏后门**，攻击者可远程绕过身份验证，获取设备完全控制权。该漏洞由匿名研究人员发现，细节已公开，且已被证实可轻松利用。 ### 后门如何运作？该后门本质上是一个**硬编码的管理员密码**，嵌入在固件中。任何知晓该密码的人，无需输入正确的用户名和密码，即可直接访问路由器的管理面板。一旦进入，攻击者能够执行多项危险操作： - 扫描内网，发现所有连接设备 - 窃取Wi-Fi密码 - 设置端口转发，将流量劫持至恶意服务器 - 禁用安全功能，为后续攻击铺路 ### 受影响固件版本根据CERT/CC公告，以下固件版本确认受影响： - US_FH1201V1.0BR_V1.2.0.14(408)_EN_TD - US_W15EV1.0br_V15.11.0.5(1068_1567_841)_EN_TDE - US_AC10V1.0re_V15.03.06.46_multi_TDE01 - US_AC5V1.0RTL_V15.03.06.48_multi_TDE01 - US_AC6V2.0RTL_V15.03.06.51_multi_T 值得注意的是，Tenda品牌产品通过亚马逊等主流渠道广泛销售，用户基数庞大。截至发稿，Tenda尚未发布官方补丁。 ### 用户应立即采取的行动在官方修复之前，**最有效的防御措施是禁用路由器的远程管理功能**。具体步骤： 1. 登录路由器管理界面（通常为192.168.0.1或192.168.1.1）。 2. 找到“远程管理”或“远程访问”设置。 3. 将其关闭，确保管理面板仅能从局域网内访问。此外，建议用户密切关注Tenda官方固件更新，并在补丁发布后第一时间升级。同时，修改默认管理员密码、启用WPA3加密、关闭不必要的服务（如UPnP、Telnet）也能提升整体安全性。 ### 行业影响与反思此次事件再次敲响警钟：物联网设备厂商在固件中埋藏后门并非孤例，此前Linksys、D-Link等品牌也曾曝出类似问题。对于消费者而言，购买路由器等网络设备时，**品牌的安全响应速度比功能丰富度更重要**。在厂商修复前，用户唯有主动加固自身网络，才能将风险降至最低。

ZDNet AI7天前原文

320

这款Android启动器太完美，让我彻底告别Nova

新上线

在Android第三方启动器（Launcher）领域，Nova Launcher曾长期占据王者地位，但自其创始人离职、被收购后，用户一直在寻找替代品。ZDNET编辑Jack Wallen近日发现了一款名为 **Octopi Launcher** 的应用，仅用5分钟就决定将其设为默认启动器，并直言“再也不想念Nova了”。 ### 为什么Octopi能打动资深用户？ Octopi Launcher并非简单的“Nova复刻”，它在设计理念和交互细节上做出了差异化。根据体验，其核心优势包括： - **极致的自定义能力**：与Nova类似，Octopi允许用户调整图标大小、网格布局、手势操作等，但它的设置界面更直观，**新手也能快速上手**。 - **流畅的动画与性能**：相比某些启动器因过度动画导致卡顿，Octopi在过渡效果上做到了**丝滑般流畅**，即使在低端设备上也能保持稳定。 - **独特的“智能堆叠”功能**：类似于iOS的App资源库，Octopi能自动将同类应用归类到文件夹中，但用户可手动调整规则，**兼顾了效率与个性**。 ### 免费版与Pro版的取舍 Octopi提供免费和Pro两个版本。免费版已包含大部分核心功能，足以满足日常使用；Pro版则解锁了**更高级的手势控制**、**动态壁纸集成**以及**无广告体验**。编辑认为，对于追求极致的用户，Pro版的性价比很高。 ### 行业背景：Nova没落后，谁在崛起？ Nova Launcher的衰落并非偶然。2025年其母公司被瑞典Instabridge收购后，**用户隐私问题**引发争议（新增第三方追踪），加上开发团队缩减，导致大量用户流失。与此同时，一批新兴启动器如**Octopi**、**Niagara**、**Lawnchair**等迅速填补空白。 - **Niagara**主打极简与单手持握操作，适合效率党； - **Lawnchair**则延续了Pixel Launcher的纯正血统； - **Octopi**的定位则更接近“全能替代”，既保留了Nova的深度自定义，又融入了现代设计语言。 ### 小结：值得一试吗？如果你仍在使用Nova，或者对当前启动器感到厌倦，Octopi Launcher绝对值得花5分钟体验。它的**免费版无功能阉割**，切换成本极低。正如编辑所言：“它完美到让我忘记了Nova。” 当然，每个人的需求不同。如果你追求极简，Niagara可能更适合；但若你想在自定义与流畅度之间找到平衡，Octopi无疑是当前市场上的**最佳选择之一**。

ZDNet AI7天前原文