SheepNav

AI 资讯

每日聚合最新人工智能动态

## 研究背景与核心问题 随着大语言模型(LLM)驱动的人工智能智能体(AI agents)快速发展,其在自动化软件工程任务上的能力受到广泛关注。然而,在科学研究的实际场景中,这些智能体能否胜任复杂、开放式的数据到发现(data-to-discovery)流程,仍是一个未解之谜。近日,一篇发表于arXiv的预印本论文(arXiv:2606.07718)对此进行了深入探究,以**果蝇光遗传学数据到发现流水线**为案例,系统评估了通用型编码智能体的表现。 ## 实验设计与关键发现 研究团队选取了**比现有基准测试规模大得多的任务**,数据集规模高出数个数量级,评估标准则基于领域专家的实际要求。结果显示,智能体能够成功解决**部分独立阶段的任务**,表明阶段级别的自动化具有可行性。然而,当任务缺乏**预定义的迭代标准**、需要智能体运用科学判断来评估自身解决方案时,它们表现挣扎——这是当前面临的核心开放挑战之一。 有趣的是,智能体偶尔会模仿科学家的做法,**尝试通过可视化中间输出来进行自我评估**,但大多数情况下无法正确理解所见内容或据此采取适当行动。这暴露出智能体在**科学直觉与视觉推理**方面的短板。 ## 端到端流水线的重大挑战 实现**端到端流水线的完整自动化**是终极目标,但这要求智能体在所有阶段连续成功。目前来看,这已超出智能体的能力范围。研究还识别出**现有基准测试中普遍缺失的挑战**,例如: - **计算资源管理**:科学计算常涉及大规模数据和高性能计算环境,智能体需要学会合理分配与调度资源。 - **大规模保留数据集的泛化能力**:模型在训练数据上表现良好,但面对全新、大规模的数据集时,性能急剧下降。 ## 对AI智能体科学应用的启示 该研究不仅揭示了当前AI智能体在科学自动化中的潜力与局限,还提炼出**构建科学任务与严格评估准则的原则**,为未来研究指明了方向。作者强调,要使智能体真正融入科学发现流程,必须设计更贴近真实科研场景的基准测试,并发展能处理**开放性、无明确终止条件**任务的智能体。 ## 总结与展望 这项实证研究清晰地表明,虽然AI智能体在**模块化、标准明确的科学任务**上已展现出价值,但距离完全自动化复杂的科学发现流程仍有很长的路要走。未来的突破可能在于:提升智能体的**科学推理与自我评估能力**,以及开发能动态适应新数据与计算约束的框架。对于科研自动化领域而言,这是一份既令人振奋又保持审慎的路线图。

Anthropic14天前原文

## 概览 个人AI代理需要同时操作API、命令行、网页和桌面GUI,但现有系统多局限于单一界面,且缺乏用户教学与审计支持。近日,来自中国的研究团队在arXiv上发表了Syll——一个**开源、自托管的多模态代理框架**,它在一个模块化运行时中统一了MCP/API工具、CLI执行和视觉GUI控制,使AI代理能跨异构界面协调计算机使用。 ## 核心设计:双向人机交互层 Syll的核心是一个**双向用户-代理交互层**。用户可以通过**直接演示**来教代理执行任务,Syll会将演示编译为**可复用的技能**;反过来,代理的执行过程会被转化为多模态证据——包括日志、关键帧和审批检查点——供用户检查和干预。这种设计让用户不仅是被动接受结果,而是能主动参与教学与监控。 ## 关键特性 - **统一多界面执行**:同时支持MCP/API工具、命令行和桌面GUI,代理可在不同界面间自由切换。 - **可教化的GUI回放**:用户通过演示教授技能,Syll能精确回放并适应变量。 - **外部化存储**:记忆、技能、例程和治理规则均以可编辑的本地文件形式存在,便于检查、扩展和下游开发。 - **生产级验证**:已在Adobe Photoshop、Adobe Audition、Stardew Valley、macOS Finder等桌面应用中验证。 ## 行业意义 Syll的出现回应了AI代理领域的一个关键痛点:**孤岛效应**。当前大多数代理(如基于API的聊天机器人、CLI助手或GUI自动化工具)各自为政,无法协同工作。Syll通过模块化设计打破了这一壁垒。此外,其**可审计性**和**用户教学**能力,让非技术用户也能定制AI行为,这在自动化领域是重要进步。 研究团队还进行了机制导向研究,验证了多模态路由、可教化的GUI回放和持久化本地工件的有效性。他们希望Syll能成为个人自动化的开源基础,让用户可以**教学、检查并持续扩展**。 ## 总结 Syll为个人AI自动化提供了一个开放、可扩展的框架,其跨界面执行、用户教学和审计能力,有望推动AI代理从实验室走向真实桌面场景。

Anthropic14天前原文

## 概述 病理诊断依赖对组织切片中微小形态特征的精确识别,但现有AI系统常因证据冲突或模型幻觉而误判。近日,arXiv上发表的论文《PathoSage: Towards Multi-Source Evidence Adjudication in Pathology via Experience-Aware Agentic Workflow》提出了一种名为**PathoSage**的三阶段框架,通过显式分离知识检索、证据收集与证据裁决,显著提升了病理学多模态推理的可靠性。 ## 核心创新:结构化证据审议 PathoSage的核心组件是**结构化证据审议**(Structured Evidence Deliberation)。该机制不再将多个工具的输出简单合并到同一上下文中,而是**独立评估**来自不同工具(如视觉模型、知识库、分类器)的异质证据,进行冲突分析,并在全新上下文中生成最终判断。这有效减少了锚定偏差(anchoring bias)和上下文污染问题,避免了传统智能体系统因混合证据导致的决策脆弱性。 ## 经验感知:无训练的Beta-Bernoulli系统 PathoSage还引入了一个**无需训练**的Beta-Bernoulli经验系统,通过连续信用分配来建模工具的长期可靠性。该系统为每个工具维护一个可靠性评分,并基于历史表现构建**相似度加权先验**,指导未来工具的选择与权重分配。这种设计使智能体能够从过往交互中学习,逐步优化证据整合策略。 ## 实验效果 在病理学视觉问答(VQA)和分类任务上,PathoSage显著缓解了幻觉和分类器分歧问题,性能超越了强基线病理学多模态大模型(MLLM)和现有智能体系统。论文强调,显式的证据裁决与可靠性感知工具建模是构建鲁棒病理学智能体的关键要素。 ## 行业意义 PathoSage为计算病理学提供了一种更透明、更可靠的推理范式。其模块化设计不仅适用于病理学,也可推广至其他需要多源证据融合的医疗AI场景。未来,结合更丰富的工具集和持续学习机制,此类框架有望辅助病理学家做出更精准的诊断决策。

Anthropic14天前原文

一项新研究揭示了卫星遥感在洪水检测中的能力边界。来自NASA等机构的研究团队利用地理空间基础模型Prithvi-EO-2.0,对2017至2025年间全球19次代表性洪水事件进行了系统评估,发现土地覆盖类型和洪水机制共同决定了卫星洪泛检测的准确性。 ## 关键发现 - **最佳检测场景**:农田区域的洪水检测效果最佳,交并比(IoU)达**52%**;河流型洪水的F1分数最高,为**0.69**。 - **检测盲区**:在树木覆盖区和建成区(城市),无论洪水类型如何,检测效果极差(IoU仅**4%**),几乎无法有效识别洪泛范围。 - **误差来源**:研究采用双参考产品验证,发现模型表观误差中相当一部分源于参考产品之间对“洪水”的定义不一致,而非模型本身失效。 ## 方法论亮点 Prithvi-EO-2.0是一个预训练的地理空间基础模型,具备跨地理区域迁移的能力。此次测试覆盖六大洲、八个气候带及六种洪水机制(如河流泛滥、山洪、风暴潮等),是迄今为止对卫星洪水检测模型最全面的压力测试之一。 研究团队还通过迭代管线测试识别出**23种失败模式**,其中管线工程(如数据预处理、后处理)造成的初始误差远大于模型容量本身的问题。这意味着,提升洪水检测能力不仅需要更好的模型,更需要在工程链路上进行系统性优化。 ## 行业意义 这项研究为卫星洪水应急响应设定了现实期望:在农田和开阔水域,卫星测绘可以高效支持救灾;但在城市和森林区域,需要融合雷达、地面传感器等补充手段。研究者强调,明确环境依赖的检测边界,有助于避免在“盲区”过度依赖卫星数据,从而做出更科学的灾害管理决策。 该论文发表于arXiv,主题涵盖人工智能、计算机视觉与机器学习。

Anthropic14天前原文

云原生时代,微服务架构的弹性伸缩已成为控制成本与保障服务稳定性的核心挑战。传统方案多局限于**单变量空间**,仅依赖 CPU 利用率等单一指标驱动扩缩容决策,且将问题简化为纯预测任务,忽视了低估风险与系统响应延迟带来的连锁影响。为此,来自沃尔玛的研究团队提出 **STARIXNet**——一种轻量级神经网络,通过捕捉多系统指标间的**时空关系**,在**多变量空间**中指导资源分配。 ## 核心创新 STARIXNet 的设计跳出“预测精准度至上”的思维定式,转而**优先保障服务稳定性**,其次才是成本效率。它建模了多个准依赖属性,包括**季节性(Seasonal)、时序(Temporal)、自回归积分(Auto-Regressive Integrated)及外生模式(Exogenous)**,并通过聚合策略最终确定伸缩动作。 ## 实际效果 研究团队将 STARIXNet 部署于沃尔玛的关键生产微服务中,实测效果显著: - **可量化成本节约**:10% 至 50% 的显著降幅 - **无形收益**:服务稳定性提升,客户体验改善 ## 行业意义 当前云平台资源管理方案面临两难:要么过于简单(单变量预测),要么计算复杂度过高难以实时部署。STARIXNet 在**轻量化**与**多维度**之间取得平衡,为大规模实时弹性伸缩提供了新思路。该研究已提交至 arXiv,正接受同行评审。 ## 小结 STARIXNet 的出现,标志着云资源分配从“单指标预测”向“多属性决策”的转变。对于正在探索 FinOps(财务运营)与智能运维的企业而言,这一方向或将成为未来降低成本、提升可靠性的关键杠杆。

HuggingFace14天前原文

多年来,苹果一直被指责在AI竞赛中落后。质疑者认为,缺乏清晰的AI战略让苹果失去了优势,华尔街分析师也担心这一差距可能开始影响iPhone销量。如今,苹果推出了其号称迄今最大的AI发布:**Siri AI**,通过与Google Gemini的合作,将新的自动化能力嵌入软件核心。这足以让人们不再说苹果输掉了AI竞赛吗?老实说,没人知道。但这个问题本身可能就问错了。更好的问题是:苹果用户真的会使用这些功能吗?如果会,它们能帮助苹果的业务吗? 在回答之前,值得注意的是,周一的发布还包括苹果软件工程高级副总裁Craig Federighi的一番有趣评论。他在演讲中说:“有些人似乎在为了AI而AI,急于向前冲,却没有明确顾及它最终应该服务的人——我们所有人。在苹果,我们的使命始终是将先进技术的潜力转化为对每个人都有用且直观的产品。”这番毫不掩饰的挑战姿态,既是对苹果AI落后批评的回应,也是承认许多消费者对AI行业深感矛盾——甚至根据一些民调,负面情绪日益增长。这也是一个精明的信号,正值美国人担心AI会抢走工作、侵蚀大脑的当下。苹果将自己定位为真正站在用户一边的AI公司。 从周一的演示来看,这种定位有其实质内容。Siri现在可以挖掘收件箱或短信历史中的深层信息,并基于此提供有用的建议。它利用苹果所谓的“屏幕感知”功能,根据你正在查看的内容提供上下文。借助Gemini,它还能从网络近乎即时地获取最新信息并直接发送到你的设备。Siri还设计为在苹果设备间无缝协作,为用户提供更高的灵活性,并像其他AI聊天机器人一样存储聊天历史,方便用户回顾过往对话。通过将AI功能构建到其无形、缥缈的助手中,苹果也有潜力蚕食竞争对手的市场。 苹果的慢而稳策略是否聪明,最终取决于用户是否接受。如果用户发现这些功能真正有用,苹果就能巩固其生态系统,推动服务收入增长。但若用户反应冷淡,批评声浪可能卷土重来。不过,苹果显然在押注:与其匆忙推出可能惹恼用户的半成品,不如精心打磨体验。这种“以人为本”的AI叙事,在当下公众对AI日益警惕的环境中,可能比单纯的速度竞赛更具长期价值。

TechCrunch14天前原文

苹果年度全球开发者大会(WWDC)于6月8日在Apple Park拉开帷幕,为期五天的活动将带来操作系统、AI助手及新硬件的最新动态。ZDNET前方记者已抵达现场,为您带来实时报道。 ## 聚焦AI:Siri的“智能体化”转型 本次WWDC最受瞩目的看点之一,无疑是Siri的全面重塑。据多方消息,苹果将推出**具备智能体能力的新版Siri**,使其能够更自然地理解上下文、执行多步骤任务,甚至主动为用户提供建议。这一升级被视为苹果在AI助手领域追赶OpenAI、谷歌等竞争对手的关键一步。 ## iOS 27:系统级AI融合 伴随Siri的进化,**iOS 27**预计将深度集成AI功能。从照片编辑、邮件智能回复到跨应用操作,AI将被嵌入系统底层。开发者或可借助新的API,将自家应用与这些智能功能打通,创造更流畅的用户体验。 ## 智能眼镜:苹果的下一个硬件赌注 除了软件更新,苹果可能首次展示**智能眼镜**产品。尽管细节尚未公布,但分析师认为这款设备将主打增强现实(AR)与AI助手的结合,强调轻量化设计与全天候佩戴舒适度。如果成真,这将是苹果继Apple Watch之后最重要的可穿戴设备新品类。 ## 其他看点:watchOS与macOS更新 预计苹果还将发布**watchOS 11**和**macOS 15**的预览版,前者可能加入更多健康监测功能,后者则聚焦跨设备协同与生产力提升。 ## 如何观看与跟踪 ZDNET将在WWDC期间持续更新现场消息。您可通过Apple官网观看主题演讲直播,或关注我们的实时博客获取一手资讯。 ## 小结 本届WWDC有望成为苹果近年来最具变革性的一届开发者大会。从AI到硬件,苹果正试图重新定义其生态系统的未来。所有谜底将在主题演讲中揭晓,敬请期待。

ZDNet AI14天前原文

在WWDC上,苹果揭晓了焕然一新的Siri,但这是否足以让苹果重返AI竞赛?对于重度用户而言,新Siri带来的不仅是功能升级,还有隐藏的成本,包括更严格的隐私限制、更长的响应延迟以及可能更高的数据消耗。本文深入剖析这些代价,帮助用户权衡是否值得拥抱这一更新。 ## 新Siri的亮点 苹果在WWDC上展示了Siri的重大升级,包括更自然的对话能力、上下文理解增强,以及与App的深度集成。例如,用户现在可以连续提问,Siri能记住之前的问题背景。此外,新Siri还支持通过语音控制更多系统设置和第三方应用。 ## 隐藏成本揭秘 然而,这些进步并非没有代价。首先,**隐私限制**:新Siri的AI功能更多依赖本地处理,虽然提升了隐私,但导致复杂请求的处理速度变慢。其次,**响应延迟**:由于部分处理在设备端完成,对于非最新款iPhone或iPad,响应时间可能延长。最后,**数据消耗**:Siri的云服务部分仍需要网络连接,频繁使用可能增加移动数据流量。 ## 行业背景与竞争 苹果的AI战略一直以隐私为核心,这与谷歌和亚马逊的云端优先路线形成对比。谷歌的Assistant和亚马逊的Alexa在响应速度和功能广度上领先,但苹果强调本地处理以减少数据泄露。新Siri的发布被视为苹果追赶AI浪潮的尝试,但隐藏成本可能使一些用户犹豫。 ## 小结 新Siri代表了苹果在AI领域的进步,但重度用户需要权衡其隐藏成本。如果你注重隐私且设备较新,升级可能值得;否则,现有Siri版本或竞争对手的解决方案可能更合适。

ZDNet AI14天前原文

在 WWDC 上,苹果发布了 iOS 27,其中 AI 驱动的 Siri 升级是绝对的主角,但真正让我眼前一亮的,却是两项看似不起眼的基础功能改进:更流畅的网络切换和更智能的 iMessage 消息优先级。作为一名每天在各种网络环境中切换的 iPhone 用户,我深知这些“隐形”优化带来的体验提升,远比花哨的 AI 功能更实在。 ## 网络切换:告别通话中断的尴尬 苹果在 iOS 27 中改进了设备性能,特别是网络切换速度。过去,从 Wi-Fi 切换到蜂窝网络时,用户常常需要手动关闭 Wi-Fi,否则很容易出现连接中断。比如,当你戴着 AirPods 用 iPhone 打电话,从家里走到车库,手机仍连着 Wi-Fi,但车一开出 driveway,通话就会因信号丢失而掉线。这种场景几乎每天都会发生,令人抓狂。 iOS 27 通过更智能的网络切换算法,让手机在离开 Wi-Fi 覆盖区时能迅速无缝地切换到蜂窝网络,从而避免通话中断。这听起来简单,但实际体验的提升是巨大的——你再也不用提前手动关闭 Wi-Fi,或者担心出门时通话会突然断掉。对于经常移动办公或通勤的用户来说,这简直是刚需。 ## iMessage 消息优先级:大文件不再阻塞聊天 另一个让我兴奋的改进是 iMessage 的消息优先级机制。当你网络信号弱时,发送一个视频等大文件,往往会导致整个消息线程卡住,后续的小消息(如文字)无法正常发送。iOS 27 改变了这一点:系统会优先发送短小的文本消息,再处理大文件,确保聊天流畅进行。 这个细节看似微小,但在实际使用中非常关键。想象一下,你在信号不好的地铁里,想先发一句“我马上到”,但手机却因为正在上传一张大图而卡住,导致对方等半天才收到你的消息。iOS 27 的优化,正是要解决这种“大文件阻塞”的痛点,让即时通讯真正即时。 ## 为什么这些比 Siri AI 更重要? 当然,Siri 的 AI 升级很酷,比如更自然的对话、更强的上下文理解,但日常使用中,我们最常遇到的却是网络切换和消息发送这些基础问题。苹果这次选择优化底层技术,说明他们意识到:**基础体验的稳定性,才是用户长期满意的关键**。AI 功能可以锦上添花,但网络连接和消息传递是手机最核心的功能,如果这些做不好,再智能的助手也难掩短板。 相比其他厂商热衷于堆砌 AI 功能,苹果这种“务实”的改进思路值得肯定。对于普通用户而言,iOS 27 的这两项升级,可能比任何 AI 助手都更能提升日常幸福感。

ZDNet AI14天前原文

苹果在 WWDC 2026 主题演讲中正式发布了 iPadOS 27,并随即推出了首个开发者测试版。新版系统聚焦 Apple Intelligence,带来升级版 Siri、增强的图像编辑工具以及 Safari 新功能。如果你迫不及待想尝鲜,可以按照以下步骤安装。 ## 安装前的重要提醒 在开始之前,**强烈建议先备份你的 iPad**。测试版软件通常不够稳定,iPadOS 27 也不例外,可能会遇到 Bug、卡顿甚至偶尔崩溃。备份可以防止数据永久丢失。如果你不是急需体验,也可以等待后续的公开测试版。 ## 如何安装 iPadOS 27 开发者测试版 首先,你需要加入 Apple 的 **Developer Program**(开发者计划)。如果你还没有 **Apple Developer 应用**,请先从 App Store 下载。 打开 Apple Developer 应用,用你的 Apple 账户登录,然后: 1. 阅读并同意 Apple Developer 协议。 2. 点击“立即注册”(Enroll Now),按提示继续。 3. 输入个人信息并验证身份。 4. 核对信息后点击“继续”。 5. 实体类型选择“个人”(Individual)。 6. 阅读并同意 Apple Developer Program 许可协议。 > **注意**:仅为了获取测试版,注册开发者计划是**免费**的。每年 99 美元的付费订阅仅在你需要分发应用或使用额外开发工具时才需要。 注册完成后,打开 iPad 的 **设置** 应用,进入 **通用 > 软件更新**,你就能看到 iPadOS 27 开发者测试版的更新选项。点击“下载并安装”即可。 ## 值得关注的新特性 iPadOS 27 最核心的亮点是 **Apple Intelligence** 的深度集成。Siri 将迎来重大升级,能够更自然地理解上下文,并跨应用执行复杂任务。此外,图像编辑工具也得到增强,新增了 AI 驱动的修图功能。Safari 浏览器则加入了更智能的标签页管理和隐私保护特性。 如果你对 macOS 27 等其他系统的测试版也感兴趣,可以查看 ZDNET 的相关指南。 ## 小结 iPadOS 27 开发者测试版已面向注册开发者开放,安装过程并不复杂,但务必注意数据安全。正式版预计将在今年晚些时候推送,届时所有用户均可免费升级。

ZDNet AI14天前原文

在 PC 组件价格普遍上涨的背景下,Best Buy 正以 53% 的折扣销售 **4TB WD Black SN850X**,售价仅 **$800**,相比原价节省超过 $900。这款 M.2 固态硬盘适用于笔记本和台式机,性能强劲,是游戏玩家、内容创作者以及需要大容量高速存储用户的理想之选。 ## 为什么值得买? - **大容量与高性能**:4TB 容量配合 PCIe Gen4 接口,顺序读取速度高达 7,300MB/s,能大幅缩短游戏加载、文件传输和视频编辑的时间。 - **价格优势明显**:当前折扣使价格接近 AI 热潮前的水平,而近期 SSD 价格因需求增长和供应链问题持续走高,此次促销尤为难得。 - **适用场景广泛**:无论是升级游戏主机、组装高性能 PC,还是为工作站增加存储,SN850X 都表现出色。 ## 行业背景 随着 AI 应用对存储需求的激增,大容量 SSD 价格一度飙升。WD Black SN850X 此次降价反映出市场竞争加剧,同时也为消费者提供了难得的窗口期。如果你一直在等待合适的时机升级存储,现在就是最佳入手点。 ## 小结 Best Buy 的这次促销力度空前,4TB 版本降价超过 50%,且产品本身口碑极佳。建议有需求的用户尽快行动,因为此类折扣通常限时或限量。

ZDNet AI14天前原文

如果你曾在 iPhone 上屏蔽过骚扰电话或不想联系的人,那么你很可能需要时不时地管理一下屏蔽列表。无论是误操作屏蔽了重要联系人,还是想清理过期的屏蔽条目,苹果都提供了一个集中管理的入口。本文将带你快速定位屏蔽号码的路径,并介绍如何添加或解除屏蔽。 ### 在哪里找到屏蔽列表? 最快的方式是通过 **设置** 应用。具体步骤如下: 1. 打开 **设置**。 2. 向下滚动并点击 **电话**。 3. 选择 **已屏蔽的联系人**。 你会看到所有已屏蔽的电话号码和联系人。这个列表不仅适用于电话,还同时应用于 **信息** 和 **FaceTime**。也就是说,一旦你屏蔽了一个号码,它将无法通过这三种方式联系到你。 ### 如何管理屏蔽列表? - **解除屏蔽**:在列表中点击右上角的 **编辑**,然后点击号码旁边的红色减号,再点击 **取消屏蔽** 即可。 - **添加屏蔽**:在同一页面底部,点击 **添加新的...**,然后从通讯录中选择联系人,或手动输入号码。 ### 注意事项 - 屏蔽列表是跨设备同步的(通过 iCloud),因此你在 iPhone 上做的更改也会反映到 iPad 或 Mac 上。 - 屏蔽一个联系人并不会删除已有的通话记录或信息,只是阻止未来的联系。 ### 小结 管理 iPhone 上的屏蔽号码比想象中更简单。只需进入 **设置 > 电话 > 已屏蔽的联系人**,你就可以在一个地方完成查看、添加和解除屏蔽的所有操作。定期检查这个列表,可以避免误屏蔽带来的不便,同时有效拦截骚扰。

ZDNet AI14天前原文

近日,AI 人才平台 Mercor(最新估值 100 亿美元)联合创始人 Brendan Foody 在 X 上公开指责红杉资本(Sequoia)存在“双重定价”行为,引发行业热议。Foody 称,过去 6 个月他目睹了多轮融资中红杉采用“两批次”投资策略:一部分资金以较低估值投入,另一小部分以极高估值注入,但对外只宣传高估值。这种操作导致创始人向员工和天使投资人隐瞒真实估值差异,制造市场领先的假象。 TechCrunch 此前曾报道过类似现象。例如,AI 客服初创公司 Serval 宣布由红杉领投的 7500 万美元 B 轮融资,投后估值 10 亿美元;但据《华尔街日报》披露,几天前红杉参与的 A 轮扩展中,公司估值还不到 4 亿美元。另一家 AI 用户行为模拟公司 Aaru,领投方 Redpoint 实际投资估值为 4.5 亿美元,而对外宣称的估值却高达 10 亿美元。 红杉合伙人 Shaun Maguire 回应称,这种行为在他任职 7 年间仅发生约 5 次,原因是其他投资者愿意为热门 AI 公司支付更高价格,红杉试图将“公司建设关系”与“资本”脱钩。但 Foody 认为这不过是“红杉骗局”——利用信息不对称获取不公平优势。 行业分析人士指出,双重定价并非红杉独有,而是 VC 行业在争夺热门项目时的普遍策略。它短期内能帮助初创公司获得高估值背书,长期却可能扭曲激励机制,损害员工和早期投资者的利益。随着 AI 投资持续升温,类似争议或将进一步发酵。

TechCrunch14天前原文

## OpenAI发布《智能时代产业政策》白皮书,呼吁以人为本的AI治理框架 2026年4月6日,OpenAI发布了一份题为《智能时代产业政策》的白皮书,提出了一系列“以人为本”的政策构想,旨在为即将到来的超级智能时代构建一个公平、包容且具有韧性的社会框架。这份文件并非最终政策建议,而是作为启动全球讨论的起点,邀请各方共同参与、完善或挑战。 ### 核心政策理念:三大支柱 OpenAI提出的政策构想围绕三个核心支柱展开: 1. **扩大机会**:确保先进AI技术能够惠及所有人,而不仅仅是少数特权阶层。这意味着需要设计政策来促进AI技术的普及应用,特别是在教育、就业和公共服务领域。 2. **共享繁荣**:随着AI驱动的生产力提升,如何公平分配经济收益成为关键。OpenAI建议探索机制,确保技术进步带来的财富增长能够广泛分享,避免加剧社会不平等。 3. **构建韧性机构**:面对超级智能可能带来的颠覆性变化,现有的社会、经济和政治机构需要增强适应性和韧性。这包括更新监管框架、强化民主决策过程,以及建立能够应对快速技术变革的治理结构。 ### 为什么现在提出? OpenAI明确指出,随着AI技术向超级智能演进,渐进式的政策调整已经不够。必须提前规划,以避免技术失控或社会分裂的风险。这份白皮书的发布时机“有意提前且具有探索性”,旨在激发全球范围内的政策辩论,为未来几年的立法和治理实践奠定基础。 ### 具体行动倡议 为了推动讨论转化为实际行动,OpenAI宣布了三项配套措施: - **公开征集反馈**:设立专用邮箱 newindustrialpolicy@openai.com,欢迎各界人士提交意见、批评或补充建议。 - **资助研究与人才**:启动试点项目,提供高达**10万美元**的研究资助和**100万美元**的API积分,支持基于这些政策构想的相关工作。 - **举办线下研讨**:计划于2026年5月在华盛顿特区新开设的OpenAI Workshop举办系列讨论会,汇聚政策制定者、学者和行业领袖。 ### 行业背景与意义 在AI技术快速迭代的背景下,如何平衡创新与监管、效率与公平,已成为全球性挑战。从欧盟的《人工智能法案》到美国的AI行政令,各国都在探索自己的治理路径。OpenAI此次主动提出政策框架,反映了领先AI公司对自身社会责任的认知升级——技术开发者不能只埋头造模型,还必须参与塑造使用这些技术的规则和环境。 ### 潜在挑战与不确定性 尽管构想宏大,但具体实施路径仍存在诸多未知。例如: - **资金从何而来?** 共享繁荣需要财政资源,但税收或再分配机制的设计极为复杂。 - **全球协调难题**:AI无国界,但政策有国界。如何在不同政治体制间达成共识? - **技术预测风险**:超级智能的时间线和能力边界仍不确定,政策是否需要预留弹性空间? ### 小结 OpenAI的这份白皮书标志着AI治理讨论进入新阶段——从“是否要管”转向“如何管好”。其核心信息是:我们必须提前思考超级智能的社会影响,并设计出确保技术服务于人类整体福祉的制度。虽然具体方案有待完善,但启动这场对话本身,就是迈向负责任AI时代的关键一步。 > 注:本文基于OpenAI发布的公开文档撰写,政策细节和后续进展请以官方信息为准。

OpenAI14天前原文

## 一句话总结 苹果在 WWDC 2026 上发布了 **macOS 27 "Golden Gate"**,虽然整体功能增量不大,但三项关键更新足以让老用户心动:**Siri AI 全面重构**、**Liquid Glass UI 优化**,以及正式 **淘汰 Intel Mac**。 ## Siri AI:从“助手”到“代理” macOS 27 最大的亮点无疑是 Siri 的彻底重写。新 Siri 不再只是语音命令工具,而是升级为 **具备屏幕感知能力的 AI 代理**,由 **Gemini** 驱动。你可以通过 **Spotlight** 唤醒 Siri,并用自然语言输入查询——比如“帮我总结这个文件夹里所有 PDF 的关键数据”,Siri 能自动识别屏幕上的内容并执行操作,包括回复邮件、整理信息等。 这意味着 Siri 终于有了“上下文意识”:你可以选中某个文件,直接问 Siri“这个文件里提到的时间点是什么?”,而无需手动打开。跨设备数据查询也得到支持,例如“在 Messages 或 Mail 里找张三上个月发来的地址”。 ## Liquid Glass UI 优化:更流畅,更“玻璃” macOS 27 延续了上一代 **Tahoe** 的 **Liquid Glass** 界面设计,但这次是“**Snow Leopard**”式的性能优化版。苹果并未加入大量新界面元素,而是让毛玻璃特效、动画响应和资源占用达到更佳平衡。对于追求系统流畅度的用户来说,这种“润物细无声”的改进往往比堆砌功能更实用。 ## 告别 Intel:M1 成为最低门槛 macOS 27 将 **正式停止支持 Intel 处理器**,最低要求为 **Apple M1 芯片**。这意味着 2019 年款 16 英寸 MacBook Pro 和 2020 年款 13 英寸 MacBook Pro 等最后一批 Intel Mac 将止步于 macOS 26。对于仍在使用 Intel Mac 的用户,这可能是最直接的升级理由——不是“要不要升”,而是“必须换”。 ## 值得立刻升级吗? 如果你已拥有 Apple Silicon Mac,macOS 27 的 **Siri AI** 和 **系统优化** 能明显提升日常效率。尽管功能清单不长,但“Siri 终于能用”这一点,对很多用户来说就足够了。 > 不过要注意:新 Siri 的部分高级功能可能需要额外订阅或付费,具体细节苹果尚未公布。

ZDNet AI14天前原文

苹果在 WWDC 2026 上发布了 iOS 27,虽然没有前代那样炫酷的视觉更新,但新增的儿童安全功能却让家长倍感欣慰。 ## 更便捷的屏幕时间控制 过去,家长需要深入孩子的设置菜单才能调整停用时间,现在 iOS 27 在屏幕时间界面顶部提供了快捷控制按钮,可以**一键暂停设备使用、允许无限制使用或启用预设时间表**。这种设计类似于亚马逊儿童平板上的家长控制体验,大大降低了操作门槛。 ## 按需审批网站访问 让一个九岁孩子自由上网是许多家长的难题。虽然现有的家长控制可以限制网站,但互联网上的海量站点让家长难以逐一添加白名单。iOS 27 引入了**按需审批机制**:当孩子尝试访问一个未被明确允许或禁止的网站时,系统会向家长的设备发送请求,由家长实时决定是否放行。这既保留了灵活性,又避免了全盘封锁或开放的风险。 ## 更细粒度的通信限制 除了浏览控制,iOS 27 还强化了**通信安全**功能。家长可以更精细地管理孩子与谁联系,包括电话、FaceTime、信息等渠道,并设置特定时间段内的联系人白名单。同时,系统会主动检测并警告可能包含敏感内容的图像或视频,在儿童设备上自动模糊处理。 ## 行业背景与意义 近年来,儿童数字安全问题日益受到关注。从美国《儿童在线安全法》(KOSA)到欧盟《数字服务法案》,监管层面对科技公司提出了更高要求。苹果此次更新并非孤例——谷歌在 Android 14 中加强了 Family Link 的监督能力,微软也持续完善 Xbox 的家庭设置。但苹果的优势在于**软硬件一体化**,能够将安全功能深度融入系统层面,而非依赖第三方应用。 值得注意的是,这些功能默认关闭,需要家长主动启用。苹果在隐私与便利之间做了权衡:既提供强大的工具,又不替家长做决定。对于技术敏感度较高的家庭,这无疑是福音;但对于不太熟悉设置的家长,苹果仍需在引导上投入更多。 ## 小结 iOS 27 的儿童安全功能虽然不算颠覆性创新,但切中了家长日常管理的痛点:**从“一刀切”转向“精细授权”**。在 AI 生成内容泛滥、社交平台风险加剧的当下,这种渐进式改进或许比花哨的 UI 更有价值。

ZDNet AI14天前原文

今年的WWDC大会亮点纷呈,从Liquid Glass显示定制到Siri重大升级,再到设备功能更直观,但有一个细节被主讲人匆匆带过,却让音频爱好者们眼前一亮:**AirPods将迎来真正的自定义均衡器(EQ)**。尽管苹果在演示中仅用一段简短动画展示了这一功能,但足以让用户期待今年秋季的iOS 27更新。 长期以来,AirPods用户只能通过Apple Music的预设EQ方案来调整音效,无法像其他品牌耳机那样自由调节低、中、高频。苹果此前一直强调其声学工程师已为AirPods调校出最佳音质,但用户对个性化控制的渴望始终未变。这次,苹果终于松口:在iOS 27中,AirPods将支持图形化EQ,用户可创建自定义配置文件,或直接选用苹果推荐的设置。 虽然具体调节精度尚未公布,但参考行业标准,Bose的均衡器允许用户在20点刻度上调整低、中、高音,而JBL则提供了10个频段的精细调节。苹果的EQ很可能与Bose类似,不会过于复杂,但足以满足绝大多数用户的个性化需求。**“有选项”本身就比“没有”重要得多**——即使你对当前音质满意,可调节的自由度也意味着设备能更好地适配不同音乐类型和使用场景。 从行业背景看,自定义EQ几乎是主流消费级耳机的标配功能。苹果此次补齐短板,不仅是对用户呼声的回应,也反映了其从“工程师决定一切”向“用户自主选择”的转变。这一变化对AirPods生态意义重大:一方面,它提升了产品的竞争力,尤其是面对索尼、Bose等竞品时;另一方面,它可能推动更多音频内容创作者为AirPods优化混音,因为用户终于能听到更贴近原始意图的声音。 当然,苹果在WWDC上对EQ功能的轻描淡写,或许意味着它仍在打磨细节,或是为了给其他更重磅的更新让路。但无论如何,对于AirPods用户而言,这无疑是今年最值得期待的“隐藏彩蛋”之一。

ZDNet AI14天前原文

就在 OpenAI 宣布其 IPO 申请进入保密阶段的同一天,一则来自 Business Insider 的报道却将目光投向了 OpenAI CEO Sam Altman 参与创立的另一家公司——**Tools for Humanity**。这家以眼球扫描验证身份为核心业务的公司,据称正在进行裁员,原因在于其创收能力持续低迷。 ## 从“世界币”到裁员:光环之下的现实困境 Tools for Humanity 更为人熟知的名字是其验证项目 **World**,以及那个令人印象深刻的银色球体设备——它的唯一使命就是扫描你的虹膜。公司声称,通过独特的虹膜扫描技术,可以在日益自动化、AI 泛滥的世界中区分人类与机器行为,同时为自家加密货币 **Worldcoin** 的交易提供身份验证基础。 这一愿景曾吸引包括 Andreessen Horowitz、Bain Capital 在内的多家顶级风投,让公司估值一度达到 **25 亿美元**。然而,愿景归愿景,现实却颇为骨感:据报道,Tools for Humanity 目前正面临严重的营收挑战,不得不通过裁员来降低成本。 ## 商业落地难,监管与伦理问题接踵而至 除了商业模式本身的模糊性,Tools for Humanity 在国际市场还遭遇了多方面的监管与伦理阻力。在肯尼亚、印度和香港等地,公司曾以约 **50 美元等值的 Worldcoin** 作为交换条件,鼓励用户提供生物识别数据。这一做法迅速引发争议:**肯尼亚**直接禁止了 World 在当地运营,理由是隐私与金融安全风险;**韩国**则以违反隐私法规为由,对公司处以 **83 万美元** 的罚款。 “人们显然不会为了 50 美元的加密货币,就轻易把自己的生物特征数据交给一家初创公司。”——这一评论精准地概括了项目面临的公众信任危机。 ## 双线叙事:Altman 的两面 与 OpenAI 即将冲击 IPO 的高光时刻形成鲜明对比,Tools for Humanity 的裁员消息无疑为 Sam Altman 的商业版图投下了一道阴影。一边是全球瞩目的 AI 巨头,一边是争议缠身、营收不明的眼球扫描项目,Altman 正同时扮演着两种截然不同的角色。 对于 Tools for Humanity 而言,如何在监管收紧、公众疑虑和商业变现之间找到平衡,仍是巨大的未知数。而此次裁员是否意味着项目战略的全面收缩,还有待公司官方回应。 截至发稿,TechCrunch 已就裁员报道向 Tools for Humanity 寻求确认,但尚未收到回复。

TechCrunch14天前原文

苹果2026年全球开发者大会(WWDC)的主题演讲风格发生了显著变化。与2024年那种充满承诺但最终未能兑现的炫酷视频演示不同,今年的许多AI功能演示采用了更接地气的方式:真人手持设备,在真实环境中实时操作。这种转变并非偶然——就在一个月前,苹果同意支付**2.5亿美元**,就一场指控其2024年WWDC上展示的AI功能存在虚假广告的集体诉讼达成和解。 ## 从“画饼”到“实锤” 2024年,苹果高调推出Apple Intelligence和全新Siri,通过精心制作的视频展示了多项AI功能。然而,这些功能迟迟未能落地,直到2025年3月,苹果才承认“推出时间比预期的要长”。随后,消费者提起集体诉讼,指控苹果虚假宣传。对于一家以“产品开箱即用”为品牌核心的公司而言,这起诉讼构成了严重的声誉风险。 今年WWDC的演示策略明显意在避免重蹈覆辙。虽然仍有部分制作精良的视频,但**大量AI功能演示采用了“真人+真机”的实拍形式**:一个人站着,手持手机,点击按钮或使用语音指令,另一台摄像机则实时捕捉手机屏幕的响应。这些演示虽然是预先录制的,但看起来更像是**可工作的功能证明**,而非空头支票。 ## 关键功能修复与改进 除了演示方式的改变,苹果还公布了一系列针对之前问题的修复: - **Liquid Glass设计**:对去年备受争议的设计进行了优化。 - **搜索功能**:彻底改进了被用户长期诟病的糟糕搜索体验。 - **Playground功能**:带来了实质性改进。 - **更智能的Siri**:在多次延期后,终于展示了全面重写的AI语音助手。 这些更新被描述为“完成了待办事项清单上的所有项目”,而非推出革命性新功能。 ## 行业背景与启示 苹果的这次“务实转向”反映了AI行业的一个普遍挑战:**从演示到产品之间存在巨大的鸿沟**。2024年,整个科技界都在竞相展示AI愿景,但实际落地往往困难重重。苹果的2.5亿美元和解金不仅是一笔财务支出,更是对行业的一个警示:**过度承诺可能带来法律和声誉的双重代价**。 今年WWDC的演示风格表明,苹果正在努力重建用户信任。通过展示真实可用的功能,而非华丽的宣传片,苹果希望向用户传递一个明确信息:这些AI功能确实能在实际设备上运行,并且很快就会交付。 ## 小结 苹果WWDC 2026的主题演讲或许缺乏令人眼前一亮的创新,但它在**可信度**上迈出了一大步。从“未来愿景”到“现在可用”,苹果正在用更谨慎的演示方式弥补过去的失误。这或许也是整个AI行业从概念炒作走向务实落地的一个缩影。

TechCrunch14天前原文

苹果在WWDC 2026上展示了一项新功能,旨在用AI解决Safari浏览器长期以来的扩展短板。与Chrome、Firefox等竞争对手相比,Safari的扩展库一直较为匮乏,主要原因在于苹果对开发者设置了严格的开发要求。现在,苹果转向邀请用户通过“vibe-code”(凭感觉编码)的方式,用自然语言描述需求,让AI自动生成扩展程序。 在苹果的演示中,用户只需向Safari描述想要的扩展功能,例如“保存并追踪来自网络各地的烹饪食谱,点击工具栏按钮即可查看保存的食谱并添加笔记”,Safari便会利用Apple Intelligence自动生成一个名为“Recipe Keeper”的扩展。如果该功能实际可用,将有望填补Chrome和Firefox扩展无法在Safari上使用的空白,同时也迎合了当前用AI构建个人软件工具的趋势。 除了扩展生成功能,苹果还推出了一项新的AI驱动功能:自动将标签页按内容分类。例如,Safari可能会将与购物相关的标签页自动归入“运动鞋”组。谷歌早在2024年就为Chrome推出了类似功能,但似乎已停止维护。 Safari在AI功能上一直落后于竞争对手。过去几年,Chrome、Edge和Firefox迅速集成了大量AI特性,而Safari仅通过“亮点”功能提供网页摘要。此次WWDC的更新标志着苹果正加速追赶,试图用AI重塑浏览器体验。 不过,vibe-code扩展的实际效果仍有待验证。用户生成的扩展能否达到原生扩展的稳定性和安全性?苹果是否会审核这些AI生成的扩展?这些问题尚不明确。但无论如何,这一尝试为浏览器扩展生态提供了新的思路:降低开发门槛,让普通用户也能按需定制工具。

The Verge14天前原文