SheepNav

AI 资讯

每日聚合最新人工智能动态

## 从手动重复到智能自动化:Amazon Quick Flows 实战指南 你是否曾为每周一的手动数据搬运和报告制作而苦恼?将数据从多个系统复制粘贴,再为不同利益相关者调整格式——这样的重复任务不仅耗时,还容易出错。**Amazon Quick Flows** 正是为此而生:它允许你用自然语言描述需求,无需编码或机器学习专业知识,即可构建 AI 工作流,实现任务自动化。 ### 什么是 Amazon Quick Flows? Quick Flows 是 **Amazon Quick** 产品线的一部分,后者是一组 AI 驱动的功能集合,旨在通过自然语言对话帮助用户分析数据、自动执行任务并获得洞察。Quick Flows 专注于任务自动化,让你把日常重复工作转化为可复用、可分享的 AI 工作流,提升个人和团队效率。 ### 上手前准备 确保你拥有一个活跃的 AWS 账户,并已启用 Amazon Quick 且具备 Quick Flows 的访问权限。具体设置步骤可参考 Amazon Quick 用户指南。 > 注意:Amazon Quick 使用生成式 AI,实际输出可能因模型迭代而有所差异,这属于正常现象。重点在于理解概念和收益,而非追求完全一致的输出。 ### 构建你的第一个工作流:财务绩效分析器 以下示例将引导你打造一个“**财务绩效分析器**”,它能自动从网络获取实时市场数据,分析关键指标,并生成专业摘要。 1. **进入 Quick Flows**:登录 Quick,导航至 Quick Flows。界面会显示一个文本区域,用于描述你的工作流,并附带示例提示。 2. **输入提示**:在文本框中输入类似这样的描述: > “创建一个工作流,能够收集全面的公司财务研究数据,设计一个工具,该工具可以……” (具体提示可根据实际需求调整,例如指定公司名称、分析维度等。) 3. **自定义与运行**:Quick Flows 会根据你的自然语言描述自动生成工作流步骤。你可以进一步调整参数(如数据源、输出格式),然后一键运行。 ### 进阶场景:员工入职自动化 除了财务分析,Quick Flows 还能处理更复杂的多步骤流程。例如,**员工入职自动化** 可以整合以下环节: - 从 HR 系统获取新员工信息 - 自动创建 IT 账号和邮箱 - 发送欢迎邮件并分配培训任务 - 生成入职进度报告 所有步骤均通过自然语言定义,无需编写代码。你还可以将工作流分享给团队,实现标准化协作。 ### 为什么选择 Quick Flows? - **零代码门槛**:业务人员也能直接上手。 - **自然语言驱动**:用“人话”描述流程,AI 理解并执行。 - **可复用与分享**:一次构建,多次使用,支持团队共享。 - **与 Amazon Quick 生态集成**:可直接调用平台内的数据、洞察和操作。 ### 小结 Amazon Quick Flows 代表了 AI 自动化工具的一个重要方向:**降低门槛,让非技术人员也能享受自动化红利**。从财务分析到员工入职,这些曾经需要数小时的手动工作,如今可以在几分钟内通过自然语言描述完成。对于希望提升团队效率的企业而言,这无疑是一个值得尝试的利器。

AWS ML1个月前原文

随着企业数据不断增长,如何确保 Amazon Bedrock 知识库与 Amazon S3 数据源之间的实时同步成为关键挑战。本文介绍一种基于事件驱动架构的无服务器解决方案,能够自动检测 S3 事件并触发数据摄入任务,同时严格遵守 Amazon Bedrock 的服务配额与速率限制,避免 API 过载,并提供全面的监控能力。 ## 背景与挑战 Amazon Bedrock 知识库允许用户将企业私有数据注入基础模型,以生成更相关、准确和个性化的回答。然而,当 S3 中的文档(包括元数据文件)发生添加、修改或删除时,知识库需要手动触发同步。对于频繁更新内容、多用户协作上传文档、以及需要实时响应的应用(如客服系统)而言,手动同步效率低下且容易出错。因此,实现自动化同步成为提升运营效率的必然需求。 ## 核心设计考量:服务配额与限流 要实现可靠的自动化,必须仔细处理 Amazon Bedrock 的保护性约束。当前服务配额规定: - **每个 AWS 账户最多同时运行 5 个摄入任务**(防止资源耗尽) - **每个知识库同时只能运行 1 个摄入任务**(确保聚焦处理) - **每个数据源同时只能运行 1 个摄入任务**(维护数据一致性) 此外,`StartIngestionJob` API 的速率限制为 **每 10 秒 1 次请求**(0.1 请求/秒)。这些配额因区域而异,需参考最新文档。 ## 解决方案架构 该方案采用无服务器、事件驱动架构,核心组件包括: - **Amazon S3 事件通知**:当 S3 存储桶中发生对象创建、更新或删除时,自动触发事件。 - **AWS Lambda 函数**:作为编排层,接收 S3 事件,检查当前摄入任务状态,并决定是否调用 StartIngestionJob API。Lambda 函数会**维护一个状态表**(例如使用 Amazon DynamoDB),记录每个知识库/数据源的最近摄入时间,以避免重复触发。 - **Amazon SQS 或 EventBridge**:用于缓冲事件并控制请求速率,确保不超过 API 限流。 - **Amazon CloudWatch**:监控所有操作,记录成功/失败事件,并发送告警。 ## 工作流程示例 假设内容团队在发布期间更新多个文件: 1. 用户上传文件到 S3,触发事件。 2. Lambda 函数收到事件后,查询 DynamoDB 检查该知识库是否已有正在运行的摄入任务。 3. 如果无任务且未超过配额,则调用 StartIngestionJob API;否则将事件暂存到 SQS 队列中延迟重试。 4. 任务完成后,通过 CloudWatch 记录日志并更新状态表。 ## 结论 此自动化方案不仅解放了运维人员的手动操作,还通过智能排队和配额感知机制,确保系统在 Amazon Bedrock 的约束下稳定运行。对于需要高频数据同步的企业(如内容管理、实时客服、文档协作平台),该架构提供了一种可扩展、可监控的实践路径。未来随着 Bedrock 服务配额的提升,该方案也能轻松适配更高吞吐场景。

AWS ML1个月前原文

OpenAI 与微软于本周一宣布再次修订双方合作协议,新条款不仅为 OpenAI 扫清了与亚马逊高达 500 亿美元交易可能引发的法律障碍,也为两家公司划定了更清晰、更长远的合作边界。 ## 核心变化:从“独家”到“非独家” 旧协议中,微软拥有 OpenAI 所有产品与知识产权的独家访问权,直至 OpenAI 实现通用人工智能(AGI)这一模糊时刻。新协议则彻底改变了这一安排:微软获得 OpenAI 模型与产品知识产权的 **非独家许可**,有效期至 **2032 年**。这意味着 OpenAI 可以自由地向任何云服务商提供其产品,而不再受限于单一合作伙伴。 ## 关键条款:Azure 仍是“首要”云伙伴,但不再“唯一” 尽管双方仍将微软称为 OpenAI 的 **首要云合作伙伴**,但措辞已明显软化。声明指出,OpenAI 产品将 **“首先”** 在 Azure 上提供——除非微软无法或选择不支持所需能力。这一“首先”的定义并未明确是时间优先还是平台独占,但明确的是,OpenAI 现在可以 **在任何云平台上向客户交付所有产品**。 ## 法律风险的解除 此前,OpenAI 与亚马逊达成的一项高达 **500 亿美元** 的云服务协议,与微软的独家条款存在潜在冲突。新协议通过明确非独家授权和 2032 年的截止期限,直接消除了微软据此起诉 OpenAI 的可能性。这对 OpenAI 而言是至关重要的战略胜利。 ## 微软的收获:现金流与股东信心 然而,微软并非输家。新协议确认 OpenAI 将继续作为 Azure 的 **巨大客户**——去年 10 月,OpenAI 已承诺额外购买 **2500 亿美元** 的微软云服务。这一承诺向微软股东传递了明确信号:即便合作模式调整,OpenAI 仍将是 Azure 收入的重要支柱。此外,微软在收入分成协议中获得了更多现金,进一步强化了财务回报。 ## 行业视角:AI 生态的“松绑”信号 这次协议修订反映了 AI 行业从“绑定合作”向“开放生态”的微妙转变。随着 OpenAI 自身数据中心建设加速,并与多家云服务商合作,它正逐步摆脱对单一基础设施的依赖。而微软则通过锁定长期收入与部分排他性优势,在保持核心利益的同时,避免了与重要客户的法律对抗。 总体来看,这份新协议为双方未来六年的合作奠定了更灵活、更可预测的基础,也为行业观察者提供了一个审视 AI 巨头间博弈与平衡的典型案例。

TechCrunch1个月前原文

近日,由前DeepMind研究员David Silver创立的英国AI实验室Ineffable Intelligence宣布完成11亿美元融资,估值达到51亿美元。该公司成立仅数月,旨在通过强化学习技术构建一种“超级学习器”,使其能够在不依赖人类数据的情况下自主发现知识和技能。 Silver是强化学习领域的权威专家,曾在DeepMind领导该团队超过十年,参与开发了AlphaZero等标志性项目——这些程序通过纯经验学习,在无需人类策略或棋谱的情况下击败了国际象棋和围棋的世界顶尖程序。如今,Ineffable Intelligence希望将这一理念推向更高层次:其超级学习器将从自身经验中探索所有知识,而非模仿人类行为。 公司官网宣称:“如果成功,这将代表与达尔文进化论相媲美的科学突破:他的法则解释了所有生命,而我们的法则将解释并构建所有智能。”Silver在个人博客中称Ineffable Intelligence为“毕生事业”,并表示将所有个人收益捐赠给高影响力慈善机构。 尽管该公司的技术路径和商业化前景尚不明朗,但巨额融资表明投资者对其愿景充满信心。在大型语言模型主导的AI浪潮中,Inffable Intelligence选择了一条截然不同的道路——通过强化学习实现通用智能,这可能为AI领域带来颠覆性变革。

TechCrunch1个月前原文

三星钱包近日推出了一项名为 **Trips** 的新功能,它能自动将用户钱包中的旅行相关卡片——如酒店预订、航班信息、租车订单、公共交通票以及博物馆、主题公园等体验门票——整合成一个统一的行程视图,并按时间和地点进行分组。这意味着用户无需再翻找各种票据,即可在一个页面上查看所有行程安排,并在需要时及时获取信息。该功能还支持为每项条目添加备忘,进一步提升了实用性。 对于经常旅行的 Galaxy 用户来说,这无疑是一个重大利好。目前,Android 系统内置的 Google Wallet 尚未提供类似功能,尽管它允许用户下载所有票据,但缺乏自动组织和行程视图的能力。三星此举不仅增强了自家钱包应用的竞争力,也为用户提供了更便捷的旅行管理体验。 这一功能的推出正值三星计划于 7 月关闭 Messages 应用之际,显示出三星正在加速整合其生态系统中的服务。随着三星钱包与 Google Wallet 的差异化越来越明显,Galaxy 用户或许有了更充分的理由选择三星的原生应用。

ZDNet AI1个月前原文

## 概述 企业构建 AI 智能体时,往往需要超越托管基础模型(FM)服务的能力。它们需要对性能调优、规模化成本优化、合规性与数据驻留、模型选择以及与现有安全架构集成的网络配置进行精细控制。Amazon SageMaker AI 端点正好满足这些需求,它让组织能够控制计算资源、扩展行为和基础设施部署,同时享受 AWS 托管运维层的好处。这些由 SageMaker AI 部署的模型可以驱动 AI 智能体,处理对话工作负载,并与 Amazon Bedrock 上可用的 FM 等编排框架集成。区别在于,组织保留了推理发生方式和位置的架构控制权。 本文演示了如何使用部署在 SageMaker AI 端点上的模型,通过 Strands Agents SDK 构建 AI 智能体。你将学习如何从 SageMaker JumpStart 部署基础模型,将其与 Strands Agents 集成,并使用 SageMaker Serverless MLflow 建立生产级可观测性以进行智能体追踪。此外,我们还将介绍如何在多个模型变体间实施 A/B 测试,并使用 MLflow 指标评估智能体性能,展示如何在你控制的 infrastructure 上构建、部署和持续改进 AI 智能体。 ## 核心技术组件 ### Strands Agents SDK **Strands Agents SDK** 是一个开源 SDK,采用模型驱动的方法,只需几行代码即可构建和运行 AI 智能体。它从简单到复杂的智能体用例都能胜任,支持从本地开发到生产部署的全流程。 ### Amazon SageMaker JumpStart **Amazon SageMaker JumpStart** 是一个机器学习(ML)中心,可以加速你的 ML 之旅。通过它,你可以基于预定义的质量和可责任指标快速评估、比较和选择基础模型,执行文章摘要、图像生成等任务。 ### SageMaker AI MLflow **SageMaker AI MLflow** 是一项托管能力,通过实验跟踪、模型版本管理和部署管理来简化机器学习生命周期。 ## 实践步骤 本文涵盖了以下关键步骤: 1. **在 SageMaker AI 上部署模型**:从 SageMaker JumpStart 部署基础模型。 2. **集成 Strands 与 SageMaker AI**:将部署的 SageMaker AI 模型与 Strands Agents 结合使用。 3. **设置智能体可观测性**:配置 SageMaker AI MLflow 应用以进行智能体追踪。 4. **实施 A/B 测试与评估**:在多个模型变体间进行 A/B 测试,并使用 MLflow 指标评估性能。 ## 对 AI 行业的意义 这一方案为企业提供了在自主控制的基础设施上构建 AI 智能体的完整路径。与完全托管的服务相比,它带来了更高的灵活性和合规性,尤其适合金融、医疗等对数据主权和网络控制有严格要求的行业。结合 MLflow 的可观测性,团队可以持续迭代优化智能体行为,实现从开发到生产的闭环改进。

AWS ML1个月前原文

Popsa 是一家帮助用户从照片库中挖掘珍贵记忆的技术公司,业务覆盖 50 多个国家和 12 种语言。其核心产品 Photo Book 通过设计自动化和 AI 技术,将日常照片转化为精美的印刷相册。近期,Popsa 利用 Amazon Bedrock 和 Amazon Nova 模型系列对其“标题建议”功能进行了全面升级,实现了更智能、更个性化的标题生成。 ## 从“法国2024”到创意标题 过去,许多用户面对 Photo Book 封面时只会输入“法国2024”、“西班牙照片”甚至“照片”这类平淡无奇的标题。Popsa 早在 2021 年就推出了标题建议功能,但原有方案依赖规则和简单模板,创意有限。借助生成式 AI,Popsa 希望让标题真正“活”起来——既能反映照片内容,又能传递情感和品牌调性。 ## 技术架构:元数据+视觉+检索增强生成 Popsa 的新方案整合了多种技术手段:首先,从用户选定的照片中提取元数据(如时间戳、地理坐标),并通过设备端卷积神经网络识别场景特征(如海滩、山脉、聚会等)。然后,利用 Amazon Bedrock 提供的统一 API,结合 **Anthropic Claude 3 Haiku** 和 **Amazon Nova Lite/Pro** 模型,对信息进行综合处理。 具体流程包括: - **检索增强生成**:从品牌语料库中检索与场景匹配的标题模板和关键词。 - **多模型协作**:Claude 3 Haiku 负责快速理解用户意图,Amazon Nova 系列则擅长生成多语言、风格一致的创意文本。 - **输出优化**:最终生成 12 种语言的标题和副标题,确保符合品牌调性。 ## 效果与价值 升级后的标题建议功能带来了显著提升: - **质量与效率**:标题创意性大幅提高,同时响应时间缩短,成本降低。 - **用户行为改善**:更多用户选择使用建议标题,而非手动输入。 - **商业指标增长**:用户满意度和购买率均有可量化提升。 - **规模化应用**:截至 2025 年,已自动生成超过 **550 万条个性化标题**。 ## 行业启示 Popsa 的实践展示了生成式 AI 在垂直场景中的落地路径:不是简单套用大模型,而是将模型能力与领域知识(元数据、视觉特征、品牌资产)深度融合。通过 Amazon Bedrock 的多模型编排,Popsa 在保证创意质量的同时控制了成本,这对许多希望引入 AI 但又担心预算超支的企业具有参考价值。 随着多模态模型和检索增强技术的成熟,类似的应用将越来越多——从相册标题到营销文案、从产品描述到个性化推荐,AI 正在从“生成内容”走向“生成有效内容”。对于用户而言,这意味着更少的选择困难,更多的惊喜体验。

AWS ML1个月前原文

微软与OpenAI的合作关系再次发生重大变化,双方已正式取消合同中的“AGI条款”。该条款曾规定,若任何一方实现“通用人工智能”(AGI),将触发一系列特殊条件,包括影响收入分成安排。如今,这一条款被移除,取而代之的是明确的收入分成截止日期和上限。 根据微软周一发布的公告,OpenAI将不再受限于仅使用微软Azure云服务,而是可以“向任何云提供商提供其所有产品”。微软仍将是OpenAI的“主要云合作伙伴”,且OpenAI产品将优先在Azure上发布,除非微软无法或选择不支持所需能力。这一变化为OpenAI打开了与亚马逊AWS、谷歌云等竞争对手合作的大门,有助于其缓解与微软因算力限制产生的摩擦,并为其潜在的上市铺路。 值得注意的是,双方取消了合同中的“AGI条款”。该条款原本规定,一旦实现AGI,微软将停止获得OpenAI的利润分成。现在,收入分成协议将持续到**2030年**,并设有**总额上限**,而非无限期延续。这意味着OpenAI的技术进展(包括AGI)不再影响微软的收益。 这是该条款的第二次重新谈判。2025年10月,OpenAI完成有争议的营利性重组时,曾获得微软同意并修改了协议。如今,随着AGI条款的消失,两家公司的关系从高度绑定转向更灵活的商业合作。 分析人士指出,这一调整反映了AI行业格局的变化:OpenAI需要更多算力和客户渠道,而微软则希望降低风险,避免被AGI的不确定性束缚。未来,OpenAI可能加速与更多云厂商合作,而微软将继续通过Azure和投资获取回报。

The Verge1个月前原文

一款名为 **Skye** 的 iPhone 应用尚未正式发布,却已获得投资者青睐和数万用户排队等待——这或许预示着消费者对更智能的 iPhone 体验充满渴望。 Skye 由初创公司 **Signull Labs** 开发,其核心思路是**将 iPhone 主屏幕改造为具备主动智能的“代理式”界面**,而非简单提供一个聊天机器人或独立应用。通过 iOS 小组件,Skye 能够感知用户上下文,提供个性化洞察:例如当地天气、健康状态、会议准备、邮件草稿、银行可疑交易提醒,甚至外出时的本地商家推荐。所有数据均需用户授权连接。 据创始人(化名 signüll,真实身份经 TechCrunch 确认为 Nirav Savjani)透露,Skye 在 X 平台上公布计划后,**已有数万人加入等待列表**。尽管产品尚未公开,但 SEC 文件显示,Signull Labs 已在 2025 年 9 月完成 **超过 358 万美元的种子轮融资**,投后估值达 **1950 万美元**。早期投资者包括 a16z 等知名机构。创始人此前曾在 Google 和 Meta 任职。 这一现象反映出市场对 **更深度集成 AI 的手机体验** 的强烈需求。与苹果自身相对克制的 AI 策略不同,Skye 试图以“环境智能”的方式让 AI 主动服务用户,而非被动响应。如果成功,它可能成为类似传闻中 **OpenAI 智能手机** 的雏形——一种以 AI 为核心、重新定义交互逻辑的设备。 不过,Skye 目前仍处于私人测试阶段,其真实能力、隐私保护机制以及能否在苹果生态中稳定运行,仍有待验证。但资本和用户的提前涌入,已经为这场“AI 主屏革命”投下了信任票。

TechCrunch1个月前原文
Claude Mythos 预览版催生代码安全新范式:多层验证与人工监督缺一不可

随着 Anthropic 发布 **Claude Mythos 预览版**,AI 辅助编程进入新阶段,但代码安全性面临更大挑战。传统安全措施难以应对 AI 生成代码的独特风险,例如逻辑漏洞、隐秘后门及合规问题。业界呼吁采用**多层验证机制**,包括自动化静态分析、动态测试与人工代码审查相结合。**人工监督**尤为关键,开发者需理解 AI 建议的上下文,避免盲目采纳。此外,企业需建立**持续监控与反馈循环**,将安全嵌入整个开发流程。Claude Mythos 的预览版本身也内置了安全限制,如限制生成敏感代码,但专家提醒这并非万能。未来,AI 辅助编码的安全保障将依赖工具、流程与人的协同进化。

IEEE AI1个月前原文

macOS 开箱体验已经很友好,但资深用户 Jack Wallen 分享了他每次拿到新 Mac 后第一时间调整的 6 个设置,让系统效率再上一个台阶。这些调整涵盖**触控板手势**、**热角**、**Dock 行为**、**Finder 偏好**、**键盘快捷键**以及**菜单栏定制**,其中大部分无需额外付费,仅一项推荐使用第三方 App。 ## 1. 定制触控板手势 默认手势虽够用,但 Wallen 建议进入**系统设置 > 触控板 > 更多手势**,将“在应用之间轻扫”“在全屏应用之间轻扫”“调度中心”和“Exposé”的手势改为自己习惯的。若想更进一步,推荐购买 **BetterTouchTool**(15 美元一次性授权),它能实现几乎任何自定义手势,比如他用单指画圆来打开应用切换器。 ## 2. 热角功能 热角让鼠标移到屏幕四个角落时触发指定操作。Wallen 的配置是:**左上角**→应用窗口,**左下角**→调度中心,**右下角**→通知中心,**右上角**→启动台。设置路径:系统设置 > 桌面与程序坞 > 触发角。 ## 3. 调整 Dock 行为 他建议关闭“**自动显示和隐藏程序坞**”,因为误触时频繁弹出反而干扰工作。同时将**最小化窗口效果**从“神奇效果”改为“缩放”,速度更快。 ## 4. Finder 显示路径栏与状态栏 在 Finder 中启用**显示 > 显示路径栏**和**显示 > 显示状态栏**,能随时看到文件位置和剩余空间。另外,将**新 Finder 窗口默认打开**设为“下载”或常用文件夹,减少点击次数。 ## 5. 键盘快捷键优化 Wallen 会修改几个常用快捷键:例如将“**截屏**”改为更方便的组合(如 Shift+Command+4 已很好,但他会调整全屏截图),并给**快速备忘录**分配一个顺手的热键。设置路径:系统设置 > 键盘 > 键盘快捷键。 ## 6. 菜单栏精简 他建议隐藏不常用的图标(如蓝牙、时间机器),只保留**Wi-Fi、电池、音量、输入法**等核心项。通过按住 Command 键拖动图标即可调整顺序或移除。若需更多控制,可借助 **Bartender** 这类 App 整理折叠区域。 > 小结:这些设置并非颠覆性改变,但累积下来能显著提升日常操作的流畅度。Wallen 强调,**个人习惯决定最佳设置**,建议读者根据自身工作流尝试调整,而非完全照搬。

ZDNet AI1个月前原文

Canva 最近推出的 AI 新功能“Magic Layers”曝出严重失误——该功能在拆分设计图层时,竟将用户作品中的“Palestine”(巴勒斯坦)一词自动替换为“Ukraine”(乌克兰)。这一事件由 X 用户 @ros_ie9 发现,其设计中的“cats for Palestine”被改成了“cats for Ukraine”,而“Gaza”等关联词则未受影响。Canva 已确认该问题并致歉,称已修复漏洞并加强审核。 ## 事件始末与影响 据用户反馈,Magic Layers 本用于将平面图像分解为独立可编辑的组件,不应改变设计中的文字内容。然而测试显示,该功能对“Palestine”一词存在系统性替换行为。虽然 Canva 声称已解决,但此事已引发广泛争议,相关帖子在 X 平台迅速传播。值得注意的是,其他用户也证实了该漏洞的存在。 ## 行业背景与竞争格局 这一失误对 Canva 来说尤为尴尬。作为设计工具领域的后起之秀,Canva 正大力押注 AI 功能,试图与 Adobe 的 AI 套件竞争。Magic Layers 是 Canva 近期 AI 大版本升级的核心功能,被其称为“开启创作新纪元”的关键一步。然而,此类政治敏感词的错误替换,不仅损害用户信任,也暴露了 AI 内容审核机制的潜在缺陷。 ## 后续与启示 Canva 发言人 Louisa Green 表示:“我们非常重视此类报告,正在采取额外检查措施以防再次发生。”目前,该功能已恢复正常。此事件提醒我们,AI 工具在敏感内容处理上仍需人工把关,尤其是涉及地缘政治议题时,自动化系统可能因训练数据偏差或规则设定不当而引发严重失误。对于依赖 AI 提升效率的设计师而言,保持对输出结果的人工审核依然不可或缺。

Hacker News791个月前原文

上周,OpenAI 同时发布了 ChatGPT Images 2.0 和 GPT-5.5 两大重磅更新。其中,ChatGPT Images 2.0 不仅支持文字渲染和基于真实数据的上下文理解,其基础图像生成能力也获得了显著提升。为了验证这一点,我们将 ChatGPT Images 2.0 与 Google Gemini 的 Nano Banana 模型进行了九项标准图像生成测试的横向对比。 ## 测试背景与方式 早在 2025 年 12 月,我们就曾用同样的测试集对这两个模型进行过评估。当时 Nano Banana 以 93% 的得分大幅领先 ChatGPT 的 74%——后者主要因为拒绝执行流行文化相关的测试项而丢分。但这一次,我们重新对两个模型进行了完全同步的测试,以确保对比数据能够反映当前的真实性能。 需要说明的是,本文中提到的“Gemini”、“Nano Banana”或“Google”均指 Google Gemini 的图像生成版本 Nano Banana;而“Images 2.0”则指上周发布的最新 ChatGPT 图像生成模式。 ## 九项测试结果:大逆转 在本次测试中,ChatGPT Images 2.0 取得了 **97%** 的惊人高分,而 Gemini Nano Banana 仅获得 **85%**。这意味着 ChatGPT 在基础图像生成能力上实现了显著反超,尤其是在**文本渲染**和**指令遵循**两个关键维度上,Nano Banana 出现了明显失误。 ### 具体亮点与不足 - **文本渲染**:ChatGPT Images 2.0 能够更准确地生成包含清晰文字的图像,例如海报、菜单等场景,而 Nano Banana 在文字清晰度和拼写正确性上仍有差距。 - **提示词遵循**:新版本的 ChatGPT 对复杂指令的理解和执行更加精准,减少了偏离用户意图的情况。 - **流行文化内容**:此前 ChatGPT 出于安全策略拒绝生成的部分内容,如今已能够正常处理。 ### 隐私隐忧:Gemini 的个性化“惊喜” 值得注意的是,Gemini Nano Banana 在测试中展现了一项“惊喜”功能——可以根据用户历史数据生成个性化图像。虽然这提升了相关性和趣味性,但也引发了关于**隐私安全**的讨论。相比之下,ChatGPT Images 2.0 在隐私保护方面更为保守,没有引入类似的个性化机制。 ## 行业启示 这一轮较量清晰地表明,**多模态生成模型的竞争已进入精细化阶段**。过去单纯追求图像质量或风格多样性的思路,正在向**文本与图像的深度融合**、**指令的精确理解**以及**安全与隐私的平衡**等更高维度转变。ChatGPT Images 2.0 的胜利不仅在于得分,更在于它证明了“基础能力+上下文智能”的路线可以同时提升实用性和创造力。 对于开发者而言,这意味着在选择图像生成 API 时,除了关注画质,还需要重点评估模型对**文字排版**、**长文本生成**以及**复杂场景描述**的还原能力。而对于普通用户,ChatGPT Images 2.0 的进步让“用 AI 做海报、设计页面”等日常需求变得更加可靠。 ## 小结 从 74% 到 97%,ChatGPT Images 2.0 用一场漂亮的翻身仗证明了自己的实力。而 Gemini Nano Banana 虽仍有 85% 的不俗表现,但在关键场景下的短板使其暂时落后。图像生成领域的竞争远未结束,下一次更新可能又会带来新的变数。

ZDNet AI1个月前原文
AlphaGo之父:当前AI走错了路,超级智能不应依赖人类数据

## 从AlphaGo到超级学习机:一条不同的路 2016年,**AlphaGo** 击败围棋世界冠军李世石,让世界第一次见识了“超级智能”的雏形。如今,AlphaGo 的核心开发者 **David Silver** 带着新公司 **Ineffable Intelligence** 重返聚光灯下,并直言不讳地批评当前AI的主流方向——大型语言模型(LLM)——是一条死胡同。 ### 强化学习:可再生能源 vs. 化石燃料 Silver 认为,LLM 本质上是在“模仿”人类智能,它们从海量的人类生成数据中学习模式和知识。他将这种数据比作“化石燃料”——虽然能提供快速的捷径,但终有枯竭且无法真正超越人类。 而他的公司选择押注 **强化学习**,让AI通过试错与环境互动,自主发现策略。Silver 形象地称之为“可再生能源”——可以无限学习、自我进化,不受人类认知边界的限制。这种思路正是 AlphaGo 成功的关键:AlphaGo 不仅学习了人类棋谱,更通过自我对弈(self-play)发现了人类从未想过的妙招。 ### “超级学习者”的野心 Ineffable Intelligence 的目标是构建 **“超级学习者”(Superlearners)**——能够在科学、技术、经济甚至政府治理等多个领域自主发现新知识的AI系统。Silver 将这一使命比作“与超级智能的第一次接触”。 这家成立不久的初创公司已获得 **11亿美元** 的种子轮融资,估值高达 **51亿美元**,成为欧洲AI领域的独角兽。Silver 还从 Google DeepMind 等前沿实验室招募了顶尖研究员,组建了一支实力强劲的团队。他承诺将个人股权收益全部捐出,用于推动这一愿景。 ### 分歧:硅谷的“捷径”与Silver的“长征” 当前,多数AI公司(如 OpenAI、Anthropic)正通过扩展 LLM 的规模、增强推理能力(如链式思维、工具使用)来逼近通用人工智能(AGI)。但 Silver 认为,这条路本质上受限于人类数据的质量和多样性,无法真正实现“超人类”的原创性突破。 他的观点并非孤例。部分研究者指出,LLM 的“幻觉”问题、对训练数据的依赖以及缺乏真正的因果推理能力,都可能是通向超级智能的障碍。而强化学习——尤其是与深度学习结合的深度强化学习——已被证明在围棋、游戏、机器人控制等领域能产生超越人类的表现。 ### 挑战与未来 不过,Silver 的路线也面临巨大挑战。强化学习在复杂、开放环境中的样本效率极低,往往需要数亿次试错才能学会简单任务。如何让“超级学习者”在真实世界的高维问题中高效学习,仍是未解难题。此外,安全性和对齐问题同样不容忽视:一个自我进化的智能体,若目标设定不当,可能产生不可控的行为。 Ineffable Intelligence 尚未公布具体的技术路线图或产品原型。但 Silver 的愿景无疑为AI行业注入了一股清流:与其让机器模仿人类,不如让它们创造属于自己的智慧。

WIRED AI1个月前原文

中国监管机构在经过长达数月的调查后,正式叫停了Meta收购AI智能体初创公司Manus的交易,这笔价值约20亿美元的收购案就此搁浅。这一决定不仅让Meta创始人马克·扎克伯格进军AI智能体领域的雄心受挫,也再次凸显了中美科技领域日益紧张的监管与地缘政治博弈。 ## 交易背景与叫停原因 Manus是一家专注于开发自主AI智能体(AI Agent)的中国初创公司,其技术能够使AI系统在无需人类持续干预的情况下执行复杂任务。Meta此前试图通过收购Manus来加强其在AI智能体领域的布局,以与谷歌、微软等对手竞争。然而,中国监管机构以国家安全和潜在技术泄露风险为由,启动了长期调查。最终,商务部依据相关法规,要求Meta必须解除已完成的交易,恢复原状。 ## 对Meta与行业的影响 这一决定对Meta而言无疑是重大打击。扎克伯格此前在多个场合强调AI智能体将是下一代计算平台的核心,而Manus的技术本可帮助Meta在AI代理(Agent)赛道快速建立优势。**Meta需重新评估其在中国市场的收购策略**,同时寻找替代技术来源。 对AI行业而言,此案可能进一步加剧全球技术分化。**中国加强对外资收购本土AI初创的审查**,而美国也正收紧对华技术出口限制。**国际AI合作面临更多不确定性**,企业需在合规与创新之间寻找平衡。 ## 未来展望 短期内,Meta的AI智能体计划或将延后,但公司仍可通过内部研发或投资其他地区初创来弥补缺口。长期来看,**监管壁垒可能促使科技巨头更重视本土化研发**,而非依赖跨境收购。中国则继续支持本土AI企业发展,此次叫停也向市场传递了保护核心技术的明确信号。

TechCrunch1个月前原文

据行业分析师透露,OpenAI 可能正在与多家硬件制造商洽谈,计划推出一款以 AI 智能体(AI agent)为核心交互方式的手机。这款设备将彻底颠覆传统智能手机的“应用商店模式”——用户不再需要安装和切换各类 App,而是通过自然语言与内置的 AI 智能体直接交互,完成订餐、导航、购物、社交等日常任务。 该消息最早由一位熟悉供应链的分析师在近期报告中提及,称 OpenAI 的目标是打造一款“无应用”手机,所有功能均由统一的 AI 系统调度。据称,这款设备可能最早于 **2028 年进入量产阶段**,但目前尚未有官方确认。 ## 从软件到硬件的野心 如果消息属实,这将是 OpenAI 从纯 AI 软件公司向硬件领域迈出的关键一步。此前,该公司已与苹果、微软等巨头合作,将 ChatGPT 集成到现有设备中。但自研手机意味着更大程度的控制权:从操作系统到芯片设计,都可能围绕 AI 智能体进行定制。 分析师指出,OpenAI 的 AI 手机可能会采用 **端侧大模型** 与云端协同的架构,确保任务响应的实时性。例如,用户说出“帮我订一份披萨”,AI 智能体便会自动调用外卖服务的 API,完成下单、支付和配送跟踪,全程无需打开任何 App。 ## 行业反应与挑战 这一消息引发了科技界的广泛讨论。支持者认为,AI 智能体确实有望简化用户交互,尤其对不熟悉复杂操作的年长用户或新兴市场用户有吸引力。但质疑者指出,当前 AI 智能体在意图理解、多任务协调和隐私保护方面仍存在瓶颈。 此外,硬件制造本身是重资产、低利润的领域,OpenAI 缺乏相关经验。即便与富士康等代工厂合作,从设计到量产也需要数年时间。竞争对手如谷歌、苹果和三星也在加速布局 AI 手机,后者更拥有成熟的供应链和生态优势。 ## 前景展望 尽管 2028 年量产的时间表看似遥远,但 AI 手机的概念已在行业内部酝酿多年。OpenAI 若能将强大的大模型能力与定制硬件结合,或许能催生一种全新的计算范式。不过,在官方正式公布前,这一切仍停留在推测阶段。我们可以期待更多细节在未来一两年内浮出水面。

TechCrunch1个月前原文
eVTOL电机与电动汽车电机有何不同?Joby动力总成主管详解设计差异

随着电动垂直起降飞行器(eVTOL)逐渐从概念走向商业化,其核心动力系统的设计引发了广泛关注。相比已经成熟的电动汽车(EV)电机,eVTOL电机面临着截然不同的工程挑战。Joby Aviation动力总成主管Jon Wagner近日在接受《航空杂志》采访时,揭示了两种电机在设计理念、可靠性要求和运行环境上的关键差异。 ## 可靠性要求的鸿沟 Wagner指出,汽车电机在设计时通常考虑的是“有限寿命”场景——即使一辆电动汽车行驶30万公里,其电机实际运行时间也远低于航空标准。而eVTOL电机必须满足**航空级的耐久性**,其设计寿命通常以**数万小时**计,且需要在极端温度、振动和海拔条件下保持稳定输出。 更关键的是**冗余与失效模式**。汽车电机失效通常意味着车辆抛锚,带来不便但风险可控;而eVTOL电机在空中失效则可能直接威胁生命安全。因此,Joby的电机从架构层面就内置了多重冗余,例如采用**双绕组设计**和**独立冷却回路**,确保单一故障点不会导致动力丧失。 ## 功率密度与热管理的博弈 eVTOL对功率密度的要求远超电动汽车。在起飞和着陆阶段,电机需要短时间内输出**峰值功率**以产生足够升力,而巡航阶段则只需较低功率。这种**高动态负载**特性要求电机具备极强的瞬态响应能力,同时必须高效管理热量——否则过高的温升会迅速降低永磁体的性能。 Wagner透露,Joby的电机采用了**先进的油冷系统**和**高耐温永磁材料**,使连续功率密度达到**每千克8千瓦以上**,远超典型汽车电机(约3-5千瓦/千克)。此外,电机还必须通过严格的**热循环测试**,模拟数百次起降带来的反复热冲击。 ## 噪声与电磁兼容的隐形挑战 与汽车不同,eVTOL在城市低空飞行,**噪声法规**极为严格。电机的高频电磁噪声和齿轮啮合噪声都需要针对性优化。Joby通过优化**定子槽形**和**转子磁路**,将电机本身的电磁噪声降低了**10分贝以上**,同时采用**直驱设计**减少传动噪声。 电磁兼容(EMC)也是一大难点。航空电子系统对电磁干扰极其敏感,电机控制器产生的开关噪声必须被抑制在极低水平。Wagner表示,Joby的电机通过了DO-160航空标准中的EMC测试,这比汽车标准严格一个数量级。 ## 从汽车到航空的工程跃迁 尽管Jon Wagner此前在特斯拉积累了丰富的汽车电机经验,但他坦言,将汽车技术直接移植到eVTOL上“行不通”。汽车追求的是**成本效益**和**规模化生产**,而航空更看重**安全裕度**和**极端工况验证**。例如,Joby的电机每一台都要进行**100%出厂测试**,包括高低温循环、振动扫频和过速试验,而汽车电机通常只做抽样测试。 ## 小结 eVTOL电机并非电动汽车电机的简单放大版,而是一种为**安全优先、高动态负载、严苛环境**而重新设计的航空级动力系统。随着Joby、Archer等公司推进适航认证,这些技术差异正成为行业竞争的核心壁垒。未来,当eVTOL真正融入城市交通时,其电机设计理念或将为地面电动交通带来新的启发——例如航空级可靠性标准是否会下放至高端电动汽车?这或许是两个行业相互借鉴的下一站。

IEEE AI1个月前原文

冷萃咖啡爱好者都知道,在家制作冷萃咖啡通常需要长时间浸泡,过程繁琐。但 **Cumulus 冷萃咖啡机** 打破了这一局限:它专为单杯冷萃、氮气冷萃和冷浓缩咖啡设计,操作简单如同使用 Keurig 胶囊机。目前该设备正在促销,**享受 20% 折扣(节省 139 美元)**。 ### 为何值得关注? 传统冷萃咖啡需要将咖啡粉在冷水中浸泡 12-24 小时,然后过滤,过程费时费力。而 Cumulus 机器通过专利技术,在几分钟内即可完成萃取,并且是**目前唯一能在家庭场景中制作氮气冷萃咖啡的设备**。氮气冷萃因其绵密的口感和丝滑的泡沫而备受追捧,以往只能在咖啡馆享用。 ### 功能与体验 - **冷萃模式**:快速萃取,保留咖啡的甜感和低酸度。 - **氮气冷萃**:通过内置氮气注入系统,产生细腻泡沫,口感如奶油般顺滑。 - **冷浓缩咖啡**:适合制作冰拿铁等饮品。 机器使用特制胶囊,用户只需放入胶囊、加水,按下按钮即可。清洁也相对简单,适合追求便捷的咖啡爱好者。 ### 价格与购买建议 原价约 695 美元,促销价约 556 美元。虽然价格不菲,但对于重度冷萃和氮气咖啡爱好者来说,它提供了前所未有的家庭自制能力。ZDNET 编辑评价为 **3/5 分**,指出其核心优势在于**独特性**——市场上没有其他同类产品能在家制作氮气冷萃。 ### 竞品对比 与 Keurig 或 Nespresso 等热咖啡胶囊机不同,Cumulus 专注于冷饮领域。如果你更喜欢热咖啡,它可能不适合;但若你是冷萃忠实粉丝,这台机器可能是你的理想选择。 ### 小结 Cumulus 冷萃咖啡机填补了家庭冷萃设备的空白,将咖啡馆级体验带入厨房。促销期间是入手的好时机,但建议先确认自己是否真的需要氮气冷萃功能——毕竟,这是一笔不小的投资。

ZDNet AI1个月前原文

如果你正在考虑更换家庭互联网服务提供商,T-Mobile 近期推出了一项颇具吸引力的促销活动:新用户只需订阅一个月的 5G 家庭互联网服务,即可获得 **300 美元现金返还**。 ### 活动详情 - **服务内容**:T-Mobile 5G 家庭互联网,提供高速无线宽带接入,无需光纤或电缆,适合家庭日常使用。 - **优惠条件**:用户需为新客户,并激活一个月的服务。返现通常以预付卡或账单抵扣形式发放。 - **适用地区**:活动覆盖 T-Mobile 5G 网络已部署的区域,具体可用性需通过官网查询。 ### 行业背景 在 AI 和云计算需求日益增长的当下,稳定高速的家庭网络已成为刚需。T-Mobile 作为美国主要运营商,正通过 5G 家庭互联网与传统宽带提供商(如 Comcast、AT&T)展开竞争。这类促销不仅降低用户试用门槛,也加速了 5G 固定无线接入的普及。 ### 价值分析 - **经济性**:相比传统宽带合约,T-Mobile 无年约限制,且 $300 返现相当于数月免费服务。 - **灵活性**:用户可随时取消,适合短期租户或希望测试 5G 宽带的用户。 - **技术优势**:5G 网络延迟低、部署快,尤其适合无法安装光纤的偏远地区。 ### 注意事项 - 需确认地址覆盖情况,5G 信号强度可能影响实际速度。 - 返现可能需要激活后数月内到账,具体条款以官方为准。 - 与 T-Mobile 手机套餐捆绑可能获得额外折扣。 总体而言,这是一次低成本体验 5G 家庭互联网的良机,尤其适合追求灵活性和高性价比的用户。

ZDNet AI1个月前原文

## 限时优惠:Adobe Creative Cloud Pro 半价订阅 如果你是创意工作者,正在寻找一款全能的创作套件,现在可能是入手 Adobe Creative Cloud Pro 的最佳时机。根据 ZDNET 的报道,Adobe 正在提供 **Creative Cloud Pro 年度订阅五折优惠**,原价每月 70 美元,现在仅需 **35 美元/月**,相当于年省 420 美元。 ### 包含哪些内容? 此次优惠覆盖超过 **20 款应用**,包括行业标杆的 **Photoshop**、**Premiere Pro**、**Illustrator**、**After Effects** 等,还包含 Adobe 的 **生成式 AI 功能**(如 Firefly 驱动的智能工具)、**数千款字体**以及 **Adobe Stock 素材库**。这意味着你不仅获得传统桌面工具,还能利用 AI 加速创作流程,例如通过文字生成图像、智能修图、自动视频剪辑等。 ### 优惠细节与注意事项 - **优惠期限**:截至 2026 年 4 月 27 日(或售完即止)。 - **适用对象**:新用户或符合条件的老用户(具体条款见 Adobe 官网)。 - **取消政策**:年度套餐通常需预付或分期,提前取消可能产生费用。 ### 与行业趋势的关联 Adobe 此次大幅折扣并非孤例。随着 AI 生成工具(如 Midjourney、Canva AI)的崛起,传统创意软件面临竞争压力。Adobe 通过将 Firefly 集成到旗舰产品中,并推出优惠订阅,旨在吸引更多用户进入其生态,同时巩固市场地位。对于创作者而言,这不仅是省钱的机会,更是以低成本体验前沿 AI 能力的窗口。 ### 如何购买? 直接访问 Adobe 官网,选择 Creative Cloud Pro 年度计划,优惠码会自动应用(或通过 ZDNET 等合作链接进入)。建议在购买前确认自己的需求:如果你只需要单个应用,Creative Cloud 单应用版可能更便宜;但如果你需要多款工具和 AI 功能,Pro 版无疑是高性价比之选。 ### 小结 Adobe Creative Cloud Pro 半价优惠是一次难得的让利,尤其适合预算有限但需要专业工具的个人创作者、自由职业者或小型团队。结合生成式 AI 的加持,这笔投资可能带来远超预期的生产力提升。

ZDNet AI1个月前原文