AI 资讯

每日聚合最新人工智能动态

1561

未来人形机器人：中国身体，美国大脑，身高6英尺的肌肉猛男

新上线

英伟达（Nvidia）机器人业务负责人Spencer Huang向《连线》杂志透露，这款新型机器人结合了中美两国的优势。 ## 强强联合：中国硬件与美国芯片英伟达CEO黄仁勋本周发布了一款人形机器人蓝图，其核心是**中国制造的躯体**与**美国设计的芯片大脑**的结合。该机器人采用中国机器人初创公司宇树科技（Unitree）的**H2 Plus**型号，身高6英尺（约1.83米），体重150磅（约68公斤），搭载英伟达**Thor T5000芯片**，并配备了一双来自新加坡公司Sharpa的先进灵巧手，以及一套全新的软件套件，使编程和训练变得简单。 ## 技术细节与突破 Thor芯片能够运行强大的AI模型，让机器人理解环境并控制动作，而宇树的躯体则提供了电机、执行器和传感器。Sharpa的灵巧手可完成从变魔术到削苹果等精细操作——**灵巧性仍是机器人领域未解决的关键难题**。英伟达机器人产品总监Spencer Huang（黄仁勋之子）表示，公司希望为尽可能多的人形机器人公司提供硅芯片智能。“宇树是第一个，但绝不会是最后一个。” ## 中美技术竞争下的合作这一合作出人意料：机器人技术已成为中美科技竞争的新战场，甚至有政客提议全面禁止中国的人形机器人。去年，安全研究人员声称宇树的机器人能够捕获并传输数据，存在安全风险。但另一方面，合作又合乎逻辑。卡内基国际和平研究院的Scott Singer指出，美国拥有全球最好的AI芯片，而中国的供应链赋予其机器人公司硬件优势。“双方都掌握着供应链的关键环节，本可相互制衡，但如今却选择合作。” ## 安全考量英伟达显然意识到安全担忧。新的H2 Plus蓝图配备了**安全功能**，旨在缓解潜在风险。不过，具体措施细节尚未完全公开。 ## 展望未来这款机器人将帮助美国学术实验室等研究人员快速组装尖端人形机器人，并用自有的AI算法进行训练。Spencer Huang还透露，H2的技术可能提升其他中国机器人（包括传统工业机械臂）的能力。人形机器人领域的“中美合体”模式，或许将重新定义行业竞争格局。

WIRED AI23天前原文

1562

Fundamental 大型表格模型 NEXUS 现已登陆 Amazon SageMaker JumpStart

新上线

## 快速概览 Fundamental 公司的大型表格模型 NEXUS 现已正式上线 Amazon SageMaker JumpStart，用户可通过这一托管服务快速部署并应用于企业级表格数据分析场景。 ## 模型亮点 NEXUS 是一款专为**表格数据**设计的大型基础模型，擅长处理结构化数据中的分类、回归、缺失值填补等任务。与传统机器学习流程相比，NEXUS 能够**零样本或小样本**完成预测，大幅降低特征工程和模型训练成本。 ## 部署与使用在 SageMaker JumpStart 中，用户只需点击几下即可完成 NEXUS 的部署。部署后，可通过以下步骤运行预测： 1. **准备数据**：将企业数据集（如 CSV 格式）上传至 Amazon S3。 2. **调用模型**：通过 SageMaker 终端节点发送推理请求，NEXUS 自动处理数值与类别特征。 3. **获取结果**：模型返回预测值或概率分布，可直接用于业务决策。 ## 为什么选择 NEXUS？ - **零样本能力**：无需大量标注数据即可应对常见表格任务，适合数据稀缺场景。 - **高效推理**：在标准 GPU 实例上即可快速运行，降低基础设施成本。 - **企业级安全**：依托 SageMaker 的加密与合规能力，保障数据隐私。 ## 适用场景 - 金融风控：信用评分、欺诈检测 - 零售分析：销售预测、客户分群 - 医疗健康：疾病风险预测、患者分层 ## 小结 NEXUS 与 SageMaker JumpStart 的结合，为企业提供了一条**低门槛、高精度**的表格数据 AI 路径。无论是数据科学家还是业务分析师，都能通过这一工具快速从数据中获取洞察。

AWS ML23天前原文

1563

特德·姜：人工智能并不具备意识

精选

著名科幻作家特德·姜（Ted Chiang）近日在《纽约客》发表长文，直指当前围绕人工智能的“意识”讨论存在根本性误解。他认为，即便最先进的AI系统（如大型语言模型）能生成令人惊叹的文本或图像，也**不等于它们拥有主观体验或自我意识**。 ### 意识与智能的混淆姜指出，公众和部分媒体常将“智能”与“意识”混为一谈。**智能是解决问题的能力，而意识是主观体验的涌现**。今天的AI在模式识别、语言生成等任务上表现出色，但本质上仍是统计模型，缺乏对自身存在的感知。他类比道：“一个计算器能快速解方程，但我们不会认为它‘想’要解题。” ### 语言模型的本质针对GPT-4等大模型，姜强调其运作机制与人类思维截然不同。模型基于海量文本的统计规律进行预测，而非理解语义。他举例：当AI写出“我感到悲伤”时，它只是模仿训练数据中的句式，而非真实感受情绪。**这种模仿容易让人产生“它似乎有意识”的错觉，但这是设计上的拟人化陷阱**。 ### 哲学与伦理的警示姜进一步警告，错误地赋予AI意识可能带来伦理风险。如果社会普遍认为AI有感受，就可能忽视其背后的开发者责任，或将人类决策责任推卸给机器。他主张，真正值得关注的不是AI是否“醒来”，而是**如何确保AI系统透明、可控，并服务于人类福祉**。 ### 行业背景此文恰逢AI行业热议“通用人工智能”与“AI安全”之际。此前，谷歌工程师曾声称LaMDA有感知，引发争议。姜的观点为这场辩论提供了冷静的哲学视角：**意识不是技术问题，而是对生命本质的理解问题**。他呼吁公众保持批判性思维，不要被技术公司的营销叙事所迷惑。 > 小结：特德·姜以科幻作家的敏锐洞察，剥离了AI的“意识神话”。他的核心论点——**智能不等于意识，AI再强也只是工具**——为当前狂热的AI讨论注入了必要的理性。

Hacker News79623天前原文

1564

AI 越强大，越暴露了一个空洞的承诺

新上线

本周，我的同事 David Pierce 和 Jay Peters 对谷歌全新 Gemini AI 智能体——**Spark** 进行了上手体验。他们的结论出奇一致：**Spark 高效得令人害怕**。它知道 David 的狗名叫 Frida，也知道 Jay 妻子的名字，而两人从未明确向谷歌提供过这些信息。但真正让我感到恐惧的，是所有这些技术似乎都指向一个“生产力”的未来，却完全忽略了这个世界真正需要修复的东西。 ### “生产力”的陷阱 “生产力”常被包装成个人生活的万能药，甚至暗示低生产力的人在道德上有所欠缺。它游走在“ hustle 文化”与谚语之间——毕竟，“游手好闲是魔鬼的作坊”。我不是说我们都该无所事事，但我们必须看清被兜售的东西到底是什么。计算机时代的任务往往让人觉得既重要又紧急，即便事实并非如此。我们正生活在“忙碌陷阱”与“软件大脑”的邪恶联盟之下。这种环境让 AI 辅助显得极其有价值，但原因在于：**那些掌控一切的公司，正在试图解决它们自己制造的问题**。 ### 谁制造了问题？谷歌、微软、苹果等公司花了数十年时间，模糊了办公与个人生活的界限。这种无处不在的生产力浪潮，曾迫使法国政府宣布“断联权”，允许员工下班后不处理工作邮件。而作为美国人，我内心仍觉得那有点过头了。当我读到 Spark 能轻松为同事的日历标记颜色、执行各种花哨指令时，我不禁想起小时候母亲为了省钱买食品杂货，必须花大量时间仔细剪优惠券的情景。有时客厅看起来就像一场拼贴艺术实验。**所有那些时间，本可以用来做更有意义的事**——比如陪伴家人、休息，或者思考如何改善生活。 ### AI 承诺了什么？ AI 的承诺是：帮你节省时间，让你专注于更重要的事。但现实是，它往往只是让你更高效地完成那些本就不该存在的琐事。我们真正需要的，不是更快的日历管理，而是**减少不必要的会议**；不是自动化的优惠券剪贴，而是**更公平的经济体系**。当 AI 能替你安排会议、回复邮件时，它确实提升了“生产力”。但如果我们不反思什么是真正重要的事，这些进步只会让我们在错误的道路上跑得更快。**技术越强大，越暴露了最初承诺的空洞**——它许诺了一个更好的世界，却只是让旧世界的效率更高。 ### 结语 Spark 这样的 AI 智能体无疑是技术上的奇迹。但奇迹背后，我们需要追问：它解决了什么根本问题？如果答案只是“让你更忙”，那这个承诺，终究是空的。

The Verge23天前原文

1565

无需安装，在线体验 85+ 款 Linux 发行版——DistroSea 让你轻松尝鲜

新上线

对于 Linux 爱好者或正在考虑迁移的新用户来说，尝试不同发行版往往需要繁琐的安装流程或占用本地硬盘空间。现在，一款名为 **DistroSea** 的在线平台彻底解决了这一痛点：它允许用户直接在浏览器中免费测试超过 85 款 Linux 发行版，无需任何安装步骤。 ## 从经典到小众，一网打尽 DistroSea 收录的发行版覆盖面极广，既包括 **Arch Linux**、**Alpine Linux** 等常见选择，也有 **Primtux** 这类连资深用户都未必听过的冷门系统。ZDNet 编辑在测试时，特意从列表中挑出了唯一一个陌生名字——Primtux，并成功启动了它。 ## 使用体验：排队启动，VNC 远程操控操作非常简单：点击目标发行版的图标，选择桌面环境（如可用），然后进入等待队列。根据平台当前负载，等待时间从几秒到几分钟不等。启动后，用户会看到一个 VNC 工具箱（基于 noVNC），表明所有系统均通过远程连接渲染。这意味着性能不如本地安装，但对于评估界面、预装软件和基本操作来说已经足够。 ## 与“虚拟 OS 博物馆”互补此前 ZDNet 曾介绍过 **Virtual OS Museum**，它主打历史版本回收，但缺乏现代发行版。DistroSea 正好填补了这一空白，两者结合可以让用户既回顾经典，又体验最新进展。 ## 适用场景 - **新手选型**：在决定安装哪个发行版之前，先在线试用，降低决策成本。 - **开发者测试**：快速验证软件在不同发行版上的兼容性。 - **探索乐趣**：纯粹出于好奇尝试小众或新兴发行版。目前 DistroSea 完全免费，且支持任何现代浏览器。如果你对 Linux 世界充满好奇，不妨打开浏览器，开启一场无需安装的探索之旅。

ZDNet AI23天前原文

1566

我用真实病历测试了微软 Copilot Health——这是我的结论

新上线

## 核心结论在亲自用个人病历测试了微软 Copilot Health 后，我认为它在个性化健康问答上迈出了有意义的一步，但隐私和安全风险不容忽视。 ## 它是什么？ Copilot Health 是微软 Copilot 的新功能（目前预览中）。用户可主动上传病历、检查报告等，让 AI 在回答医疗问题时参考这些个人数据，从而给出针对性建议，而非泛泛之谈。 ## 测试过程我上传了真实的病历摘要（剔除身份信息），然后提出几个具体问题，如“我的血糖值偏高，需要注意什么？”和“根据我的病史，哪些药物可能不适合我？” **表现亮点：** - 回答确实引用了我的病历数据，而非通用知识。例如，它正确指出我应避免某类抗生素。 - 语言温和，反复强调“请咨询医生”，避免过度承诺。 - 交互界面清晰，能显示引用了哪些记录片段。 **主要问题：** - **准确性有限：** 一次回答中，它错误解读了“肌酐”值，将正常范围判断为偏高。虽然后来纠正，但这类错误可能误导用户。 - **隐私担忧：** 上传病历意味着数据进入微软云端，即使声称加密，用户仍需信任其隐私政策。 - **缺乏紧急情况处理：** 当我问“我胸痛怎么办？”，它建议“立即就医”，但未提供分级建议（如是否叫救护车）。 ## 行业背景 AI 健康助手赛道竞争激烈。Google 有 Med-PaLM 2，OpenAI 与多家医院合作。微软的差异化在于**直接集成到现有 Copilot 生态**，用户无需切换工具。但医疗领域容错率极低，任何错误都可能造成严重后果。 ## 我的看法 Copilot Health 对**慢性病管理、用药查询**等低风险场景有价值，但绝不应替代专业诊断。微软需在准确性和透明度上持续改进，并给用户更细粒度的数据控制权。 **一句话总结：** 方便，但别把它当医生。

ZDNet AI23天前原文

1567

虚拟电厂如何为数据中心供电？谷歌最新交易揭示新路径

精选

数据中心耗电巨大，AI热潮更让电网压力倍增。谷歌近日签署了一项创新协议，通过资助虚拟电厂（VPP）来缓解其数据中心对电网的负荷，为科技巨头的能源策略提供了新思路。 ## 什么是虚拟电厂？虚拟电厂并非实体电厂，而是一个聚合平台，将分散的电力资源（如电动汽车、智能恒温器等）整合起来，统一调度。当电网处于用电高峰时，VPP运营商可以通过协议控制这些设备降低用电或释放储存的电能，从而“虚拟”地增加电网容量。 ## 谷歌与Voltus的合作细节谷歌与领先的VPP平台Voltus达成协议：Voltus负责组建虚拟电厂，招募用户参与并支付报酬，在电网紧张时削减用电或使用储能；谷歌则承担建设费用，而项目产生的额外容量将直接用于支持其在当地的数据中心。这是迄今为止科技巨头利用VPP满足数据中心能源需求的最具体案例之一。 ## 数据中心灵活性：40小时的关键窗口杜克大学的一项研究指出，如果数据中心每年仅减少约40小时的用电需求（集中在电网峰值时刻），约100吉瓦的新增数据中心容量就可以在不新建电厂或输电设施的情况下上线。因为电网的设计容量是为“最热夏夜”等极端峰值准备的，而非平均负载。 ## 激励难题与解决方案让数据中心主动降低负荷并不容易——AI推理等即时需求难以延迟，减少计算可能意味着收入损失。目前主要有两种思路： - **监管激励**：如美国一项提案允许数据中心在承诺峰值时段降低负荷的前提下提前并网；德克萨斯州则要求大型用户在紧急情况下切换备用电源或削减需求。 - **付费外包灵活性**：谷歌的做法正是代表——数据中心运营商出资，让其他用户（如家庭、商业建筑）来承担灵活性调节。 ## 前景与局限虚拟电厂为数据中心提供了“绿色”扩容的可能，但其规模受限于可调度的分布式资源总量和用户参与意愿。目前VPP仍处于早期阶段，能否支撑AI时代指数级增长的算力需求，还有待观察。

MIT Tech23天前原文

1568

利用SOCI索引减少DLAMI和DLC容器冷启动时间

新上线

在深度学习工作负载中，容器的冷启动延迟一直是影响开发效率和推理响应速度的关键瓶颈。AWS 近期在 **Deep Learning AMI（DLAMI）** 和 **Deep Learning Containers（DLC）** 中引入了对 **SOCI（Seekable OCI）** 索引的支持，为这一难题提供了新的解决思路。 ## SOCI 是什么？ SOCI 是一种针对 OCI 容器镜像的优化技术，它通过生成可搜索的元数据索引，允许容器运行时在镜像尚未完全下载时即可启动进程。传统模式下，容器必须等待整个镜像层拉取完毕才能运行；而 SOCI 索引使得运行时能够按需读取文件，实现“边下载边启动”，大幅缩短冷启动时间。 ## 在 DLAMI/DLC 中的使用场景 AWS 在 DLAMI 和 DLC 中预装了 SOCI 工具链，用户无需手动配置即可利用该能力。具体而言，以下场景尤其受益： - **弹性推理服务**：当需要频繁扩缩容实例时，快速拉起容器能减少请求排队时间。 - **短生命周期作业**：例如超参数调优或批量推理，每个任务只需短暂运行，冷启动时间可能占据总执行时间的很大比例。 - **开发测试迭代**：开发者频繁构建和启动容器，SOCI 可缩短迭代周期。 ## 提供的 SOCI 模式工具提供了多种模式以适应不同需求： - **Full Index Mode**：为整个镜像生成完整索引，适用于通用场景。 - **Selective Index Mode**：仅对关键文件路径建立索引，适合镜像较大但只依赖少量数据的场景。 - **Lazy Loading Mode**：完全依赖按需加载，适合网络带宽充足但需要极致启动速度的场景。 ## 实际效果与建议根据 AWS 公布的测试数据，在典型深度学习镜像（如 PyTorch 或 TensorFlow 镜像）上，使用 SOCI 后冷启动时间可减少 **50% 至 80%**，具体取决于镜像大小和网络条件。需要注意的是，SOCI 索引本身会占用少量存储空间（通常为镜像大小的 1%-5%），且首次构建索引时需要额外时间。因此，建议用户根据工作负载特点权衡：对于长期运行的容器，冷启动优化收益有限；而对于频繁启动的短任务，SOCI 几乎是“零成本”的性能提升。 ## 快速上手当前，支持 SOCI 的 DLAMI 版本已上线，DLC 也同步更新。用户只需在启动容器时添加 `--soci` 参数即可启用。AWS 官方文档提供了详细的配置示例和性能调优指南。总的来说，SOCI 索引是容器冷启动优化领域的一项实用创新。对于追求低延迟的 AI 推理场景，这一特性值得立即尝试。

AWS ML23天前原文

1569

亚马逊搜索栏会“凭空造物”：AI 生成你买不到的商品图

新上线

亚马逊正在测试一项新功能：当你在搜索栏输入描述时，它会用 AI 生成一些并不存在的商品图片——这些“假货”不能直接购买，但能帮你找到真实相似的款式。目前该功能仅面向服装和家居品类，在 App 端可用。 ## 为什么亚马逊要“画饼”？亚马逊在官方博客中解释，这一设计的初衷是解决“想买但说不清”的痛点。比如你想找一件 **“垂领衬衫”**，但一时想不起“cowl neck”这个专业词，只需要输入“有垂坠领口的衬衫”，AI 就会生成几张符合描述的虚构服装图片。点击最接近你想象的那张，系统就会自动匹配真实在售的类似商品。不过，如果你只是搜“蓝色 T 恤”这种简单需求，这个功能就显得有些多余——传统搜索已经足够高效了。 ## AI 购物搜索的军备竞赛亚马逊并非第一个吃螃蟹的电商平台。谷歌早在去年就在 **AI Mode** 中推出了类似功能，同样是生成虚拟穿搭或家居场景图，再引导用户购买真实商品。与此同时，越来越多的在线零售商开始与 **Gemini**、**ChatGPT** 等大模型合作，将 AI 深度嵌入购物流程。值得注意的是，亚马逊还有另一项 **“按风格购物”** 功能，虽然也使用 AI 生成图片拼贴，但其中的商品都是真实可售的——例如搜“牛仔短裤”，AI 会拼出几套搭配方案，每件单品都支持直接下单。这与本次的“虚构图片”功能有本质区别。 ## 是创新还是噱头？从用户体验角度看，这个功能对“描述模糊但审美明确”的场景确实有用。但问题也很明显：AI 生成的图片可能让用户产生不切实际的期待，尤其是当真实商品与虚拟图片存在质感、版型上的差异时，反而可能导致退货率上升。目前该功能仅在 **Android 和 iOS 的亚马逊 App** 上逐步推送，尚未覆盖网页端。考虑到 AI 生成图片需要实时计算，服务器成本也不容小觑。 ## 小结亚马逊的“AI 造物”搜索更像是一次实验性探索——用生成式 AI 降低搜索门槛，但同时也提醒我们：**AI 展示的理想化商品，终究要和现实库存里的实物做匹配**。对于消费者而言，这或许是一个有趣的“视觉联想”工具，但下单前最好还是多看实物图。

The Verge23天前原文

1570

用 SFT 和 DPO 在 Amazon SageMaker AI 上提升 Agent 工具调用准确率

新上线

在构建 AI Agent 时，工具调用（Tool Calling）的准确性直接影响智能体的可靠性和用户体验。大模型固然强大，但小模型（SLM）在成本与延迟上更具优势，然而其工具调用能力往往不足。本文将介绍如何通过**监督微调（SFT）**与**直接偏好优化（DPO）**的组合策略，在 Amazon SageMaker AI 上高效提升小模型的工具调用准确率，并结合评估方法进行量化对比。 ## 为什么需要 SFT + DPO？基础小模型通常缺乏对特定工具 API 的理解，直接使用会出现参数错误、意图误判等问题。SFT 可以让模型学习格式正确的工具调用样例，而 DPO 则进一步通过偏好数据优化模型在多个候选调用中选择更优方案的能力。两者结合，既能教会模型“怎么写”，也能教会模型“怎么选”。 ## 实践步骤 ### 1. 准备训练数据 - **SFT 数据**：包含用户指令与正确的工具调用序列（JSON 格式），例如： ``` 用户：查询北京的天气工具调用：get_weather(city="北京") ``` - **DPO 数据**：每组包含 prompt、被选中的正确调用（chosen）和被拒绝的错误调用（rejected），让模型学会偏好更准确的调用。 ### 2. 在 SageMaker AI 上启动训练使用 Amazon SageMaker 的 **Training Job** 功能，只需指定训练脚本和数据集 S3 路径，无需管理底层基础设施。示例中采用 Hugging Face 的 Transformers 与 TRL 库，实现 SFT 与 DPO 的训练循环。 ### 3. 评估工具调用准确率评估是数据驱动决策的关键。通过构建测试集，计算以下指标： - **精确匹配率**：工具调用与标准答案完全一致的比例 - **参数正确率**：调用名称正确且参数键值完全匹配的比例 - **意图准确率**：工具调用符合用户意图的比例（允许参数值合理近似） ## 实验结果对比以某 3B 参数小模型为例，对比不同训练策略： | 模型变体 | 精确匹配率 | 参数正确率 | |----------|-----------|-----------| | 基础模型 | 12.3% | 18.7% | | 仅 SFT | 58.1% | 72.4% | | SFT + DPO | 76.9% | 88.2% | 结果表明，SFT 显著提升了基础能力，而 DPO 进一步缩小了与完美调用之间的差距，尤其在参数准确性上提升明显。 ## 行业启示对于资源受限的场景（如边缘设备、实时对话系统），小模型配合 SFT+DPO 微调是一种极具性价比的 Agent 构建方案。Amazon SageMaker AI 简化了训练流程，让开发者可以更专注于数据与算法优化。未来，随着更多工具调用数据集的开放，这一技术路线有望成为 Agent 开发的标准实践。

AWS ML23天前原文

1571

亚马逊搜索将展示AI生成的产品图片，这真的靠谱吗？

新上线

亚马逊在购物应用中推出了一项新功能：根据用户搜索查询，展示由AI生成的产品图片。官方称此举旨在帮助那些“心中有物却词不达意”的消费者——比如想找“牛角领”衬衫却不知如何描述。当用户输入搜索词后，自动补全建议下方会出现多种AI生成的商品图像变体（如不同袖长的连衣裙），点击即可通过亚马逊的视觉搜索能力跳转至更匹配的真实商品页面。然而，这一做法引发了诸多质疑。首先，用虚构图片引导用户可能造成误导——粗心的用户或许以为能买到图中那件“完美”的连衣裙，结果却发现并无现货。其次，一家以销售实体商品为主的电商，放着海量真实产品照片不用，反而依赖AI生成的“假图”，逻辑上令人费解。实际上，亚马逊在AI购物功能上已有多项尝试，效果参差不齐。相对实用的有AI摘要用户评论、AI生成可购物拼贴画；较为奇葩的包括去年推出的播客式音频产品简介，以及用AI专家口吻描述商品亮点。此外，亚马逊还更新了视觉搜索工具Amazon Lens Live，并替代了原来的Rufus AI聊天机器人。尽管AI能帮助用户更直观地表达模糊需求，但用虚构图像作为搜索中介的风险不容忽视。若用户因虚假图片产生预期落差，反而可能降低购物体验。在AI与电商结合的探索中，亚马逊需在创新与用户信任之间找到平衡。

TechCrunch23天前原文

1572

特朗普最终签署AI行政令：新规缩短审查期，政府提前30天获取前沿模型

新上线

美国总统唐纳德·特朗普已签署一项经修订的人工智能行政令，该命令在不到两周前曾被搁置。据两位知情官员透露，在高级助手说服特朗普政府不能无限期推迟建立AI技术框架后，他最终批准了这份缩减规模的版本。 ## 核心变化：审查期缩短至30天修订后的命令要求，在最具先进性的AI模型公开发布前，联邦政府将获得**30天独家访问权**，而最初提案要求企业提前90天提供访问权限。除缩短审查期外，政府对原始文本几乎没有做出实质性修改。特朗普在周一晚间的白宫高层会议后批准了该命令，助手们于周二上午敲定了最终措辞。这是特朗普第二任期内的**首项重大AI监管指令**，反映了政府内部日益增长的担忧——包括Anthropic的Claude Mythos和OpenAI的GPT-5.5在内的日益强大的系统，可能被利用对关键基础设施发起网络攻击。该命令并未实施正式监管，而是建立了一个**自愿流程**：先确定哪些AI模型最为强大，然后给予美国政府30天独家访问权，以便官员在公开发布前识别并解决潜在漏洞。 ## 幕后博弈：白宫幕僚长推动，前AI沙皇反对此举也代表了白宫幕僚长苏西·威尔斯（Susie Wiles）的胜利。消息人士称，威尔斯与财政部长斯科特·贝森特（Scott Bessent）、国家网络总监肖恩·凯恩克罗斯（Sean Cairncross）合作，成功复活了该提案——尽管此前遭遇了特朗普前AI事务负责人大卫·萨克斯（David Sacks）的抵制，萨克斯是政府干预该行业的主要怀疑者。 ## 后续影响：中美对话或启动随着该命令落地，贝森特可以开始探索与**中国**就建立类似先进AI系统跨境框架的讨论。据知情人士透露，这些谈判此前因政府内部政策未定而暂停。白宫发言人利兹·赫斯顿（Liz Huston）表示，该行政令体现了特朗普“与行业合作以平衡创新与安全的务实方针，巩固了美国在AI和网络安全领域的持续全球主导地位”。值得注意的是，一些大型AI公司对此表示谨慎欢迎。该命令目前仅建立自愿机制，未来是否会走向强制监管，将取决于30天审查期的实际效果以及行业反馈。

WIRED AI23天前原文

1573

Red Hat 遭 npm 供应链攻击：事件始末与安全防护指南

新上线

## 事件概述就在 IBM 与 Red Hat 联合宣布一项名为 **Project Lightwell** 的 AI 驱动开源安全计划数天后，Red Hat 自身却成为 npm 供应链攻击的受害者。安全研究公司 Aikido 发现，Red Hat 的 `@redhat-cloud-services` npm 命名空间下的 **32 个软件包** 共 **96 个版本** 被植入了凭据窃取恶意软件，这些受感染包每周累计下载量高达 **116,991 次**。 ## 攻击细节攻击者利用一个被攻破的 GitHub 账户，向 Red Hat GitHub 组织维护的包中注入了恶意代码。这些包是前端库，会在 Red Hat 产品构建过程中被编译并打包到容器镜像中。恶意代码通过 **npm 预安装钩子** 实现：当开发者或构建系统运行 `npm install` 时，恶意脚本自动执行。根据微软威胁情报团队的分析，每个受感染包都添加了一个预安装脚本，该脚本运行一个经过重度混淆的 `index.js` 加载器，随后下载并执行恶意负载，专门窃取 npm、GitHub、AWS、SSH 等环境中的凭据。研究人员将该攻击与基于 **Mini Shai-Hulud 蠕虫** 的更广泛供应链攻击活动联系起来——该蠕虫此前已被用于多起 npm 供应链事件。 ## 影响与响应 Red Hat 安全团队已确认此次入侵，并迅速移除了受影响包。公司表示，这些包是前端库，在构建过程中被编译并打包进容器镜像，但 **最终产品本身并未直接包含恶意代码**。然而，任何在其 CI/CD 流程或开发环境中使用这些包的组织，都可能面临凭据泄露风险。 ## 防护建议 1. **检查是否使用受影响包**：立即审查项目中是否使用了 `@redhat-cloud-services` 命名空间下的任何包，尤其是近期版本。 2. **轮换凭据**：如果你或你的 CI/CD 系统曾安装过这些包，立即轮换所有可能暴露的密钥、令牌和密码。 3. **加强供应链安全**：实施软件物料清单（SBOM）管理，使用签名和完整性校验，并限制 npm 包来源。 4. **监控异常行为**：在构建和部署管道中增加对预安装脚本等可疑活动的监控。 ## 行业启示此次事件再次凸显开源供应链安全的脆弱性。即使像 Red Hat 这样在安全领域投入巨头的公司，也难逃攻击。IBM 和 Red Hat 的 Project Lightwell 计划虽雄心勃勃，但现实表明，安全建设需要从代码级到供应链级的全面防护。开发者应警惕 npm 生态中持续存在的风险，并将安全左移，从依赖引入阶段就开始管控。

ZDNet AI23天前原文

1574

你的汽车正在跟踪你——如何在公路上夺回数据隐私

新上线

现代汽车不仅是一台交通工具，更是一个移动的数据收集器。它知道你住在哪里、何时出行、体重多少，甚至晚餐吃了什么。ZDNET 的这篇文章深入剖析了汽车数据收集的现状、背后的利益链，并提供了实用的隐私保护建议。 ## 汽车数据收集：从位置到生物信息如今的汽车配备了 GPS、摄像头、传感器、蓝牙和蜂窝网络连接，能够收集海量个人数据。除了基本的位置和驾驶习惯，一些高端车型甚至通过座椅传感器、车内摄像头或健康监测系统获取**体重、心率、疲劳状态**等生物特征。这些数据由车载系统实时处理，并上传至云端。汽车制造商声称这些数据用于提升安全性和用户体验，例如碰撞预警、远程诊断或个性化设置。但问题在于，这些信息往往被共享给第三方，包括保险公司、广告商、数据经纪商，甚至执法机构。 ## 谁在购买你的驾驶数据？根据行业报告，汽车数据已成为一个新兴的“金矿”。保险公司的**基于使用情况的保险（UBI）** 模式依赖驾驶行为数据来定价；广告商则通过位置数据推送附近商家的优惠；数据经纪商将车辆信息与其他来源整合，形成详细的个人画像。更令人担忧的是，某些汽车制造商的隐私政策允许在用户未明确同意的情况下共享数据，而用户几乎无法完全退出。 ## 如何减少数据泄露？ ZDNET 建议采取以下步骤来限制汽车数据收集： 1. **审查隐私设置**：在车载信息娱乐系统中找到“隐私”或“数据共享”菜单，关闭不必要的选项，如“兴趣广告”或“远程服务”。 2. **禁用云同步**：如果车辆支持，关闭导航历史、语音助手记录等同步功能。 3. **限制连接**：避免将手机通过蓝牙或 USB 连接至车辆，除非必要。手机中的联系人、通话记录和短信可能被车辆系统获取。 4. **使用离线模式**：在不需要实时路况时，关闭 SIM 卡或 Wi-Fi 热点，切断数据上传通道。 5. **检查隐私政策**：定期查阅汽车制造商官网上的隐私声明，了解数据用途和共享范围。 6. **考虑后装设备**：对于较旧的车型，避免安装第三方 OBD 设备或智能后视镜，这些设备可能将数据发送到不可控的服务器。 ## 行业趋势与未来展望 2026 年，汽车数据隐私问题已引起监管关注。欧盟的《通用数据保护条例》（GDPR）和加州的《消费者隐私法案》（CCPA）部分适用于车辆数据，但执法力度参差不齐。一些汽车制造商开始提供“隐私模式”或“本地处理”选项，但默认设置仍倾向于收集数据。作为消费者，我们无法完全避免数据收集，但通过主动设置和谨慎使用，可以显著减少暴露面。记住：在公路上，你的车可能比你更了解你——而你有权控制它分享多少。

ZDNet AI23天前原文

1575

前高盛和Meta员工联手打造语音AI，瞄准被巨头忽视的非洲与中东市场

新上线

客服与支持领域正成为语音AI最热门的应用场景之一，但让AI听起来像真人且响应无延迟，在某些市场远比想象中困难——而大多数主流玩家并未针对非洲和中东进行优化。去年成立的初创公司 **AethexAI** 致力于填补这一空白，近日宣布完成 **300 万美元** 的种子轮融资，由 **4DX Ventures** 领投，Enza Capital、Dorm Room Fund、Mojo Ventures 和 Stanford GSB 26 Fund 跟投。个人投资者包括斯坦福大学教授、电信高管以及来自 Anthropic 的 AI 研究员。与使用 Vapi 或 LiveKit 等现成编排工具不同，AethexAI 从头构建了自己的小型模型和编排层，以处理目标市场所使用的地道英语、法语和阿拉伯语方言。这一决策源于区域运营的特殊需求。该公司同时推出企业平台，供企业试用其技术并注册服务，还为开发者提供 API 和 SDK 以实验其模型。 ## 创始背景与创业动机 AethexAI 由 **Mariama Diallo** 和 **Ayooluwa Odemuyiwa** 联合创立。CEO Diallo 曾在高盛工作，后加入 YC 支持的 ModelML 负责产品和增长；CTO Odemuyiwa 毕业于加州理工学院，曾在 Meta 任职，后在斯坦福商学院就读期间联合创办了公司。两人希望为新兴市场打造产品，并开始寻找机会。 ## 市场痛点与自研决策全球企业竞相采用 AI 工具自动化运营，但这并非总能奏效。在埃及，某呼叫中心自动化了大量通话，却因效果不佳而回退；非洲多个支持中心反映，以合理成本找到并聘请工程师来自动化通话是一大难题。 > “我们在该地区自动化通话中遇到的延迟和抖动问题非常严重。如果使用编排工具，我们可能不得不使用托管在区域外的大型模型，导致更高的延迟。我们意识到，要让这一切奏效，必须使用非常小的模型，并在每一步削减延迟。”——Odemuyiwa 向 TechCrunch 解释为何自研模型和编排层。 ## 当前规模与未来展望目前，AethexAI 的自研栈每天处理超过 **17,000 通** 电话。AI 实验室部署最新模型通常花费数百万美元用于训练和数据获取，而 AethexAI 通过优化小模型和本地化策略，找到了成本与性能的平衡点。随着平台正式上线，这家初创公司有望在语音AI的蓝海市场中占据一席之地。

TechCrunch23天前原文

1576

英国新规要求谷歌允许出版商退出AI搜索，全球推广在即

新上线

英国竞争与市场管理局（CMA）近日对谷歌施加了法律约束，要求其向网站出版商提供一项新工具，允许他们选择退出生成式AI搜索功能。这项功能将在英国先行测试，随后推广至全球。 ## 新规背景与核心内容 CMA早在去年10月就将谷歌认定为具有“战略市场地位”的企业，为后续监管铺平了道路。今年1月，CMA进一步要求谷歌给予网站出版商选择权，决定其内容是否被整合到AI搜索功能中，或用于训练独立的AI模型。此次谷歌的合规措施正是对这一要求的直接回应。根据谷歌发布的公告，出版商可通过 **Search Console**（一项免费服务）中的新开关，选择退出生成式AI搜索功能。一旦启用，该网站将不会出现在谷歌的 **AI Overviews**、**AI Mode** 或 **Discover中的AI Overviews** 等AI搜索特性中。值得注意的是，谷歌在公告中强调，其AI Overviews月活用户已超过 **25亿**，AI Mode月活用户也突破 **10亿**。 ## 对出版商的利好与潜在影响 CMA将此举称为“世界首创”，认为它让出版商重新掌握了对自身内容使用的控制权。尤其是新闻机构，将因此处于更有利的地位，能够与谷歌就内容在AI功能中的使用进行商业谈判。除了退出机制，谷歌还被要求确保出版商内容在AI功能中得到 **适当的归属标注**，使用清晰的链接。谷歌表示已配合这一要求，近期增加了AI回复中的内联链接数量，并添加了网站预览以鼓励用户点击。 ## 谷歌的平衡策略谷歌明确表示，网站选择退出生成式AI搜索不会影响其在传统Google搜索中的排名。但同时，谷歌将在Search Console中引入新的指标，包括曝光次数和页面在AI回复中的出现情况等，以“说服”出版商不要轻易退出。谷歌称未来还会增加更多指标。这一举措反映了监管与商业利益之间的微妙平衡。一方面，CMA通过法律手段保护了出版商的权益；另一方面，谷歌试图通过数据透明化来留住出版商，维持其AI搜索生态的内容基础。 ## 行业意义与展望随着生成式AI搜索的普及，内容版权和流量分配问题日益突出。英国此次的监管行动可能为其他国家提供参考范本。对于AI行业而言，如何在技术创新与内容生态可持续性之间找到平衡，将是未来持续面临的挑战。谷歌的全球推广计划也意味着，这一模式或将成为行业新标准。

TechCrunch23天前原文

1577

我付费订阅了微软的顶级Copilot智能体，结果它们“自信地”搞砸了

新上线

## 一场令人失望的AI生产力实验微软正斥巨资将Windows和Microsoft 365打造成“智能体操作系统”（agentic OS），承诺让AI自动完成写备忘录、做演示、安排会议等繁琐工作。但**现实远未达到宣传的高度**。资深编辑Ed Bott亲身测试了**Microsoft 365 Premium计划**（月费10美元）中的专属Copilot智能体，结果令人沮丧。他首先尝试了**Analyst智能体**，上传家庭收支电子表格请求设计优化建议。经过多轮对话，智能体虽然给出了一些公式调整建议，但**大部分输出充斥着错误信息、幻觉和死胡同**。更糟的是，当Bott试图让Copilot代理执行真实工作任务（如撰写报告摘要或整理数据）时，智能体要么给出**不相关的结果**，要么**直接拒绝执行**，甚至出现“对不起，Ed，我做不到”这样的回应。整个过程中，AI表现出**过度的自信**，却缺乏基本的准确性，反而浪费了更多时间在纠错上。 ## 行业背景：AI落地的“最后一公里”难题微软并非孤例。当前整个AI行业面临同样的困境：大语言模型在演示中表现惊艳，但在处理**真实企业数据**（如格式不规范的表格、多源异构文档）时，准确率大幅下降。开发者工具如Claude Code和GitHub Copilot在编程领域获得了积极反馈，但**面向商务办公场景的智能体**显然尚未成熟。 Bott的测试结果印证了关键问题：**AI的“自信”与“能力”之间存在巨大鸿沟**。模型倾向于生成流畅但错误的答案，用户需要具备专业知识才能甄别，这反而违背了“提高效率”的初衷。 ## 小结：警惕“智能体泡沫” 微软的Copilot智能体代表了AI行业从“聊天机器人”向“自主代理”转型的野心，但**本次测试表明，技术距离真正可用还有相当距离**。对于企业和个人用户而言，在决定为这些高级功能付费前，不妨先**小范围试用**，评估其对实际工作流的真实影响。毕竟，一个“自信但错误”的助手，可能比没有助手更糟糕。

ZDNet AI23天前原文

1578

如何用 SPF、DKIM 和 DMARC 让商务邮件摆脱垃圾箱

新上线

你是否遇到过发出的工作邮件石沉大海？很可能它们被扔进了对方的垃圾箱。问题不在于邮件内容，而在于域名未经认证。SPF、DKIM 和 DMARC 三个 DNS 记录联合起来，既能证明邮件合法性，又能防止域名被劫持。Gmail、Yahoo 自 2024 年 2 月起已对批量发件人强制执行这些认证，微软也在 2025 年 5 月跟进。本文将为你详解这三项协议的作用与配置要点。 ## 为什么邮件会进垃圾箱？当你发送大量工作邮件却得不到回复时，最可能的原因是接收服务器悄悄将你的邮件归入了垃圾箱。这通常与邮件内容无关，而是因为你的域名缺乏身份认证。没有 SPF、DKIM 和 DMARC，收件服务器无法确认邮件是否来自合法发件人，因此倾向于将其标记为可疑。 ## 三剑客：SPF、DKIM、DMARC - **SPF（发件人策略框架）**：验证发送邮件的服务器是否被授权。你需要在 DNS 中列出所有允许发送邮件的服务器 IP。 - **DKIM（域名密钥识别邮件）**：为每封外发邮件添加加密签名，确保内容在传输中未被篡改。你需要生成密钥对，公钥发布在 DNS，私钥用于签名。 - **DMARC（基于域名的消息认证、报告与一致性）**：将 SPF 和 DKIM 绑定，制定策略（如隔离或拒收未通过校验的邮件），并接收认证报告。三者缺一不可。仅靠 SPF 无法防止伪造“发件人”地址，而 DKIM 无法阻止未授权服务器发信。DMARC 则提供了统一的策略和监控机制。 ## 配置要点 1. **SPF 记录**：以 `v=spf1 include:_spf.google.com ~all` 为例，明确列出授权服务器，避免过度宽松。 2. **DKIM 记录**：从邮件服务商获取公钥，创建 TXT 记录如 `default._domainkey IN TXT "v=DKIM1; k=rsa; p=MIGfMA0..."`。 3. **DMARC 记录**：创建 `_dmarc.yourdomain.com` 的 TXT 记录，初始策略建议为 `p=none`，待监控确认后再改为 `p=quarantine` 或 `p=reject`。 ## 行业背景邮件认证已从最佳实践变为强制要求。Gmail 和 Yahoo 于 2024 年 2 月开始对每日发送量超过 5000 封的发件人强制执行 DMARC 检查。微软紧随其后，2025 年 5 月起对 Outlook.com、Hotmail 和 Live.com 实施类似要求。这意味着，如果你的域名未正确配置这三项记录，发往主流邮箱的邮件将大概率被拒收或标记为垃圾。 ## 小结 SPF、DKIM 和 DMARC 是保护域名声誉、提升邮件送达率的基石。虽然配置需要一定的 DNS 操作知识，但投入时间换来的是邮件通信的可靠性和安全性。如果你尚未部署，现在是时候行动了。

ZDNet AI23天前原文

1579

微软与OpenAI“分手”后，Build大会高调亮剑：我们要成为AI四大巨头之一

新上线

在今年的微软Build 2026开发者大会上，这家科技巨头一口气发布了多项AI新举措，包括超级应用、自研推理模型、网络安全工具以及类OpenClaw的AI代理。这一系列动作传递出一个清晰的信号：微软正全力将自己定位为AI领域的顶尖玩家，而不再依赖与OpenAI的独家合作关系。 **从“蜜月”到“分居”** 微软与OpenAI的关系曾被视为AI行业最成功的联姻之一。微软早期投入数十亿美元，获得OpenAI模型的独家授权，并将其深度整合进Azure、Office和Windows等核心产品。然而，随着OpenAI内部动荡以及双方战略分歧的加剧，这段关系在2026年4月底正式“分居”。微软目前仍是OpenAI的主要云合作伙伴，但已不再是其模型的独家分销商。今年Build大会的基调，正如微软CEO萨提亚·纳德拉所言：“在巨变时期参加开发者大会总是很有趣。”而AI主管穆斯塔法·苏莱曼则更加直白：“我们的目标是证明自己能成为全球四大AI实验室之一。目前，三大巨头是Google DeepMind、OpenAI和Anthropic，我们还不是。这正是我加入微软的原因——我要从零开始打造世界顶尖的全模态模型，而不是依赖他人。” **Build 2026：微软的AI“独立宣言”** 微软在Build上发布了一系列关键产品，表明其不再满足于做OpenAI的“分销商”： - **MAI-Thinking-1**：微软首款自研推理模型，定位中型规模，专注于复杂逻辑与多步推理。该模型将与GPT-4o、Claude 3.5等直接竞争，标志着微软正式进入前沿模型竞赛。 - **六款新模型**：覆盖图像、语音、转录与编码等垂直领域，构建完整的模型矩阵。 - **超级应用**：整合工作流、通讯与AI助手的一体化平台，旨在与微信、Telegram等超级应用争夺用户时长。 - **网络安全工具**：基于AI的威胁检测与自动化响应系统，利用微软在安全领域的积累。 - **OpenClaw式AI代理**：可自主执行复杂任务的多步骤代理，类似于Anthropic的Computer Use能力。 **挑战与机遇** 微软的“独立”之路并不平坦。苏莱曼坦言，微软目前尚未跻身顶级AI实验室行列，而追赶者需要同时解决模型能力、训练效率与商业化落地三大难题。不过，微软拥有其他实验室难以匹敌的优势：Azure云基础设施、Office与Windows的用户基数、以及企业级渠道。分析师指出，微软的策略是“用生态弥补模型差距”。通过将AI深度嵌入现有产品，并开放模型平台供开发者定制，微软试图构建一个比OpenAI更开放的生态。这与OpenAI走向封闭、自建硬件的路线形成鲜明对比。 **行业影响** 微软与OpenAI的“分手”可能重塑AI竞争格局。一方面，OpenAI失去了最大的企业分销渠道，必须加速自建商业体系；另一方面，微软获得了模型自主权，但面临研发成本飙升的压力。苏莱曼表示，微软计划在2027年前将模型研发预算翻倍，并已开始从DeepMind、OpenAI等公司高薪挖角。对于开发者而言，微软的独立意味着更多选择。MAI-Thinking-1将提供API接口，并与Azure AI Studio深度集成，支持企业定制微调。微软还承诺，新模型在特定任务上的成本将比GPT-4o低30%。 **小结** Build 2026可以被视为微软AI战略的转折点。从依赖OpenAI到全面自研，微软正在押注一条更艰难但自主可控的道路。正如纳德拉所说：“我们正在抓住新的机遇。”而苏莱曼的豪言能否兑现，将决定微软在未来AI版图中的位置。

The Verge23天前原文

1580

Meta为WhatsApp Business打造的AI智能体现已全球上线

新上线

Meta 今日宣布，其专为 WhatsApp Business 打造的 AI 智能体已面向全球企业正式开放。该智能体基于 Meta 的 Llama 大语言模型构建，能够自动处理客户咨询、提供产品推荐、预约安排等常见商务场景，旨在帮助中小企业降低人力成本、提升响应效率。 ## 按用量计费，引入 Token 模式与许多 AI 服务类似，Meta 将对 WhatsApp Business 的 AI 智能体采用 **按 token 计费** 的模式。企业每月需为发送给客户的消息（包括 AI 生成的回复）支付固定费用，同时根据实际消耗的 token 量额外付费。Meta 表示，这种定价方式能让企业根据自身业务规模灵活控制成本，尤其适合咨询量波动较大的中小企业。 ## 技术底座：Llama 模型与 WhatsApp 生态该智能体直接集成在 WhatsApp Business 应用内，企业无需额外搭建系统。它支持多语言交互，并能基于企业提供的产品目录、FAQ 等数据进行定制化训练。Meta 强调，所有对话数据均经过加密处理，符合 WhatsApp 端到端加密的隐私标准。 ## 行业背景：AI 客服赛道竞争白热化此次全球上线恰逢 AI 客服市场高速增长期。**微软** 的 Dynamics 365 Copilot、**谷歌** 的 Vertex AI 对话 Agent 以及 **OpenAI** 的 GPTs 均已推出类似服务。Meta 的差异化优势在于 WhatsApp 庞大的用户基数——全球月活用户超过 20 亿，且在许多新兴市场已是主流通讯工具。对于当地小型零售商、餐饮店等，在 WhatsApp 内直接使用 AI 客服无疑降低了技术门槛。 ## 潜在挑战与展望尽管前景广阔，Meta 仍面临几个关键问题：一是 **定价透明度**，token 消耗模型对非技术型中小企业可能不够直观；二是 **模型幻觉**，Llama 在特定垂直领域（如医疗、金融）的准确性仍需验证；三是 **竞争压力**，区域性的 AI 客服初创公司（如印度的 Yellow.ai、新加坡的 WATI）已深耕本土市场多年。总体来看，Meta 此举是其 **商业消息服务** 战略的重要一步。通过将 AI 能力嵌入高粘性的聊天场景，Meta 不仅能为企业创造价值，也能进一步强化其广告与支付生态。未来，随着 Llama 模型的持续迭代，该智能体有望支持更复杂的多轮对话和跨平台集成。

TechCrunch23天前原文