SheepNav

AI 资讯

每日聚合最新人工智能动态

OpenAI 正在将桌面 AI 工具 **Codex** 引入 ChatGPT 手机应用,允许用户通过手机远程指挥电脑上的 Codex 执行编程、操作应用等任务。这一举措紧随 Anthropic 的 **Claude Code** 走红之后,被视为 OpenAI 加速追赶、整合产品线的关键一步。 ### 手机端远程操控桌面 Codex 根据官方博文,用户现在可以通过 iOS 或 Android 上的 ChatGPT 应用,与电脑端的 Codex 进行实时交互。具体来说,你可以用手机“浏览所有线程、审查输出、批准命令、切换模型或启动新任务”。所有文件、凭证、权限和本地设置仍保留在 Codex 运行的电脑上,而手机端会实时接收更新的截图、终端输出、差异对比、测试结果和审批请求。 这一功能以预览形式向所有 ChatGPT 计划用户推出,包括免费版和更实惠的 Go 计划。这意味着 OpenAI 正在降低 Codex 的使用门槛,让更多用户能够体验桌面 AI 的便利。 ### 竞争压力下的战略调整 Codex 的移动端扩展并非孤立事件。近期 **Anthropic 的 Claude Code** 在开发者群体中迅速走红,给 OpenAI 带来了直接压力。据报道,OpenAI 为了加速追赶,正在采取一系列“聚焦”措施:削减“支线任务”、关闭 Sora 视频生成工具等项目,并集中资源发展企业业务。此前,OpenAI 已发布重大更新,使 Codex 能够在 macOS 上直接操作应用,这被视为其打造桌面“超级应用”野心的关键一步。 ### 行业影响与展望 将 Codex 能力延伸至手机,标志着 AI 开发工具的交互模式正在发生转变。过去,编程助手主要局限于桌面 IDE 或终端,而现在用户可以通过手机随时启动、监控或调整任务,实现了“随时随地的开发协作”。对于企业用户而言,这意味着更高的灵活性和响应速度;对于个人开发者,则可能意味着更便捷的工作流。 不过,这一功能目前仍处于预览阶段,实际体验和稳定性还有待观察。同时,远程控制桌面操作也可能引发新的安全和隐私考量——尽管 OpenAI 强调本地数据和凭证不会上传至手机,但跨设备通信的安全性仍是用户关注的焦点。 总体来看,OpenAI 正在通过 Codex 的移动化,将桌面 AI 工具从“单一设备”推向“多设备协同”,这不仅是功能上的补全,更是对 AI 开发工具生态的一次重塑。

The Verge19天前原文

Richard Socher,这位因创办聊天机器人初创公司You.com和参与ImageNet研究而闻名的AI领域重要人物,如今带着新项目“Recursive Superintelligence”重新回到聚光灯下。这家总部位于旧金山的初创公司于本周三正式浮出水面,并宣布获得**6.5亿美元**融资。Socher与Peter Norvig、Cresta联合创始人Tim Shi等一批顶尖AI研究者联手,试图攻克AI领域的一个“圣杯”——**递归自我改进**:打造一个能够自主识别自身弱点并重新设计以修复这些弱点的AI模型,整个过程无需人类介入。 在一次采访中,Socher阐述了他们的独特技术路径——**开放性(open-endedness)**。他强调,递归自我改进并非简单的“让AI改进某个东西”,而是一个完整的闭环:从研究想法的产生、实施到验证,全部自动化。这不仅限于AI研究本身,未来还可能扩展到物理领域。但最核心的场景是AI“对自己下手”,发展出一种对自身不足的自我意识。 值得注意的是,Socher并不认为Recursive Superintelligence是一个“新实验室”(neolab)——一个只重研究不重产品的AI创业新流派。他坚持表示,这个项目最终会交付实际产品。这或许暗示了其商业化路径:在追求通用超级智能的同时,也会寻找落地场景。 6.5亿美元的巨额融资也反映出资本对“自我进化AI”这一方向的狂热。当前,从OpenAI到DeepMind,几乎所有顶级实验室都在探索某种形式的递归或自动改进。但Socher团队认为,真正的递归自我改进尚未实现,而他们的“开放性”方法可能是突破口。 然而,挑战同样巨大。递归自我改进在理论上可能导致“智能爆炸”,引发安全与对齐问题。Socher团队如何确保AI在自我改进过程中保持可控,将是外界关注的焦点。此外,巨额融资也意味着巨大的交付压力——投资者不会无限期等待一个纯研究项目。 总体而言,Recursive Superintelligence的亮相标志着一个新阶段的开始:当AI研究开始将“让AI自己造自己”作为产品目标时,行业的技术路线、伦理讨论和商业逻辑都将面临重塑。

TechCrunch19天前原文

父亲节将近,Meta旗下智能眼镜迎来一波力度不小的折扣。**第二代Ray-Ban Meta智能眼镜**现享**15% off**,售价约**$390**(省$69);而**Oakley Meta HSTN**款式更是**直降20%**,优惠幅度达**$95**。此外,购买任意款式还可享受**定制镜片额外20% off**,对有视力需求的用户相当友好。 ### 优惠详情一览 | 型号 | 折扣幅度 | 参考优惠后价格 | |------|----------|----------------| | 第一代Ray-Ban Meta | 25% off | 约$300(估算) | | 第二代Ray-Ban Meta | 15% off | **$390**(省$69) | | Oakley Meta HSTN | 20% off | 省$95 | > 注:第一代价格基于25%折扣推算,实际价格请以电商页面为准。 ### 为什么值得关注? Meta的Ray-Ban智能眼镜自第二代起加入了**AI视觉助手**,支持实时物体识别、翻译、导航等功能,成为日常佩戴与科技尝鲜的平衡之作。Oakley款则更偏向运动与户外场景,设计更贴合活跃用户。 这次促销覆盖了**Meta与两大眼镜巨头Ray-Ban、Oakley**的全线合作产品,折扣力度在近期属于较高水平,尤其是Oakley款20%的降幅相当罕见。如果你正考虑入手一款**轻量级AI穿戴设备**,现在是不错的时机。 ### 购买建议 - **首次尝试智能眼镜**:推荐第二代Ray-Ban Meta,功能更完善,优惠后性价比突出。 - **运动爱好者**:Oakley Meta HSTN更贴合户外使用,且折扣更大。 - **有视力矫正需求**:别忘了叠加**镜片20% off**优惠,能省下不少。 ### 注意事项 - 促销由Amazon等渠道提供,库存可能有限。 - 第一代产品已停产,库存不多,但折扣最大。 - 建议下单前确认是否支持中国区功能(如AI助手需联网)。 总体来看,这次促销覆盖了Meta智能眼镜全产品线,折扣力度诚意十足。无论是自用还是作为父亲节礼物,都是一个值得考虑的选择。

ZDNet AI19天前原文
能源供应商为服务数据中心,抛弃太浩湖居民

位于加州与内华达州交界处的著名旅游和滑雪胜地太浩湖(Lake Tahoe)正面临一场能源危机。当地电力供应商 Liberty Utilities 宣布,其长期依赖的能源来源——内华达州公司 NV Energy——将在 2027 年 5 月前停止向其供电,理由之一正是内华达州快速扩张的数据中心需求。这一决定将影响居住在太浩湖地区的 49,000 名加州居民。 ## 数据中心需求成导火索 据 Liberty 向加州监管机构提交的文件,NV Energy 终止供电协议的主要原因之一是内华达州数据中心开发的快速增长。NV Energy 的规划文件显示,到 2033 年,北内华达州的十几个数据中心项目可能带来高达 5,900 兆瓦的新增电力需求。为了满足这一需求,NV Energy 已与多家科技公司签订合同,以获取额外的发电资源。例如,亚马逊近期同意支持该公用事业公司在里诺部署 700 兆瓦的“低碳能源”,其中包括 100 兆瓦的地热能。 尽管外界普遍将矛头指向数据中心,NV Energy 的代表却予以反驳,称这一决定是长期过渡的一部分,早在人工智能热潮之前就已开始。NV Energy 于 2009 年将其加州资产出售给 Liberty 后,曾通过一系列临时协议继续为太浩湖供电,直到 Liberty 找到其他供应商。如今,NV Energy 表示无法再延长这些协议。 ## 寻找替代方案 Liberty 目前正紧急寻找新的能源供应商,并计划为能够满足加州可再生能源要求的竞标者提供替代合同。然而,情况因监管复杂性而雪上加霜:据《财富》杂志报道,“没有一个单一的监管机构能够监督从发电到客户账单的整个链条”。加州居民的未来用电将面临不确定性。 ## 行业背景与启示 这一事件凸显了人工智能和数据中心扩张对能源基础设施的深远影响。随着 AI 训练和推理需求激增,科技巨头纷纷争夺清洁电力资源,导致部分地区出现能源挤占。太浩湖的案例并非孤例——全球多个地区都出现了数据中心与居民争夺电力的现象。对于政策制定者而言,如何在推动数字经济发展的同时保障民生用电,已成为亟待解决的课题。

Ars Technica19天前原文

据彭博社报道,OpenAI因与苹果的ChatGPT集成合作未达预期——订阅用户和曝光度均远低于预期——正考虑对苹果采取法律行动。OpenAI已聘请外部律所评估选项,可能包括发送正式违约通知,但全面诉讼预计将推迟至与Elon Musk的庭审结束后。 合作始于2024年6月苹果WWDC,ChatGPT被整合进Siri和视觉智能功能。OpenAI原预期该合作能带来数十亿美元订阅收入,但实际效果惨淡:集成功能被“深埋”,用户难以发现,收入远不及预期。一位OpenAI高管对彭博表示:“苹果基本意思是‘你得信任我们’,结果并不好。” 苹果方面也有不满,包括对OpenAI隐私标准的担忧,以及对其进军硬件领域(由前苹果设计总监Jony Ive领导)的恼怒。 OpenAI并非第一个后悔与苹果合作的伙伴。从Google Maps到Adobe,苹果有着“拥抱伙伴然后疏远”的漫长历史。当合作伙伴在苹果生态中显得“过于舒适”时,苹果往往会将其扫地出门。 目前OpenAI和苹果均未回应置评请求。此事件再次凸显了苹果作为平台方的强势地位——iPhone是极具吸引力的增长平台,但完全在苹果控制之下,第三方公司始终只是“客人”。

TechCrunch19天前原文

硅谷的“Token最大化”时代迎来了专属硬件。一个名为 **Clawdmeter** 的新开源项目,将 Anthropic 旗下 Claude Code 的使用数据搬到了小巧的桌面仪表盘上,让 AI 重度用户能实时掌握自己的 Token 消耗情况。 该项目由冰岛雷克雅未克的软件开发者 **Hermann Haraldsson** 打造。他并非嵌入式开发专家,但在 Claude 的帮助下,仅用几天时间就完成了原型。Haraldsson 表示,Claude 极大地降低了编程门槛,让非专业人士也能实现以往只有开发者才能完成的任务。 ## 从像素动画到数据可视化 Clawdmeter 的核心是一块 **Waveshare ESP32-S3-Touch-AMOLED-2.16** 显示屏,通过蓝牙与笔记本电脑连接。设备启动后,屏幕会显示像素风格的 **Clawd 精灵动画**——随着 Token 使用率升高,动画节奏会越来越快,形成一种“多巴胺循环”。用户可以通过中间按钮切换动画样式,或查看会话和每周的 Claude 使用数据图表。 ## Tokenmaxxing 文化的新符号 Clawdmeter 不仅是一个实用工具,更折射出开发者社区对 **Tokenmaxxing** 趋势的热衷。这一概念指工程师在工作中最大化 AI Token 消耗量,以此衡量自己对 AI 工具的吸收程度。有 Reddit 用户调侃道:“Anthropic 应该免费给我们寄一个。”还有人提议增加一键充值 Token 的按钮——当然,这可能带来意想不到的消费风险。 ## 开源与自建指南 项目已在 GitHub 开源,感兴趣的用户可自行购买硬件并按照指南搭建。Haraldsson 强调,设计阶段花费了最多时间,包括字体、颜色和动画细节的打磨。对于希望拥有个性化 AI 使用仪表盘的开发者来说,Clawdmeter 提供了一个兼具趣味性和功能性的选择。

TechCrunch19天前原文
特朗普访华科技随行团、马斯克与奥特曼诉讼谁占上风,以及汉坦病毒阴谋论

本期《Uncanny Valley》播客深入探讨了多个热点话题。首先,特朗普总统即将启程访华,随行团队中包括多位硅谷科技亿万富翁和《梅兰妮》导演布雷特·拉特纳。这一阵容引发了外界对其外交影响的广泛猜测——在中美经济与地缘政治博弈日益激烈的背景下,科技领袖的参与能否为对话增添变数? 其次,播客重点分析了埃隆·马斯克对萨姆·奥特曼的诉讼最新进展。马斯克指控OpenAI背离了其最初的**非营利使命**,转向逐利目标。节目探讨了双方在庭审中的攻防策略,以及谁更有可能占据上风。值得注意的是,庭审现场甚至出现了“豪华坐垫”等趣闻,而奥特曼则爆料马斯克曾有过将OpenAI传给子女的“惊人想法”。 此外,节目还揭露了围绕**汉坦病毒**爆发的各种离奇阴谋论。科学记者Leah分享了这些谣言如何在网上迅速传播,并介绍了开发该病毒检测方法的竞赛。 本集内容涵盖政治、科技与公共卫生的交叉领域,为听众提供了多元视角。

WIRED AI19天前原文

微软计划在 6 月底前取消大部分 Claude Code 许可证,引导数千名开发者转向其内部的 GitHub Copilot CLI。这一决策既有技术收敛的考量,也涉及财务优化——在财年结束前削减运营开支。Claude Code 在微软内部广受欢迎,甚至一度“过于成功”,但为了统一命令行 AI 编码工具,微软决心押注自家产品。

The Verge19天前原文

When Oregon resident Isabelle Reksopuro heard Google was gobbling up public land to fuel its data centers in her home state, she didn't initially know what to believe. "There's a lot of misinformation about data centers," she said. "Google has denied taking that land." Technically, she explains, The Dalles, a city near the Washington state […]

The Verge19天前原文

仅仅发布一个月后,Anthropic 备受争议的 Claude Mythos 模型已在测试中展现出显著的新能力,引发业界对其快速进化的关注。 英国 AI 安全研究所(AISI)在最新博客中披露,他们测试了 Mythos 的一个较新版本(Mythos Preview),结果令人震惊:该模型在两项网络安全测试中均取得突破,成为首个完成“冷却塔”挑战的 AI 模型。具体而言,Mythos Preview 在 10 次尝试中成功解决“最后的防线”6 次,并首次攻克此前无模型能解的“冷却塔”挑战(3/10 成功率)。这一成绩不仅超越了其自身早期版本,也优于 OpenAI 的 GPT-5.5。 Anthropic 上个月发布 Mythos Preview 时曾强调该模型“过于强大”而无法公开发布,并联合苹果、谷歌、微软等公司成立了“Project Glasswing”网络安全测试联盟,仅限合作伙伴使用。AISI 的独立测试验证了 Mythos 能力的真实跃升,既非单纯营销炒作,也未如部分担忧那般预示灾难性转变。 更值得关注的是,能力改进并非仅随模型代际更迭发生,而是在同一模型版本内部快速演进。AISI 指出,Mythos 在一个月内的进步表明 AI 能力的提升速度可能远超预期。这一现象对 AI 安全治理提出了新挑战:如何在模型内部快速迭代时有效评估风险并制定相应管控措施? 随着 Mythos 持续进化,关于“能力边界”与“安全护栏”的讨论将更加激烈。AISI 表示将继续监测其发展,为政策制定提供依据。

ZDNet AI19天前原文

Amazon Lex 新推出的 **Assisted NLU(自然语言理解)** 功能,正在改变对话式 AI 机器人的构建方式。传统 NLU 系统依赖开发者手动配置每一个可能的用户表述变体,不仅耗时巨大,而且难以覆盖真实场景下的语言多样性。Assisted NLU 则利用大语言模型(LLM)自动处理拼写错误、复杂句式和多意图表达,无需额外编码即可提升意图识别和槽位填充的准确率。 ### 传统 NLU 的三大痛点 1. **表述变体覆盖不全**:用户说“我想订酒店”和“我需要预订住宿”可能指向同一个意图,但传统系统需要分别枚举。 2. **复杂请求解析失败**:类似“帮我订一间 Seattle 市中心的双人房,12月15到18号”这样的句子,常丢失房间类型、位置、日期等关键信息。 3. **歧义处理能力弱**:用户说“我需要处理我的预订”,机器人无法判断是查询、修改还是取消。 ### Assisted NLU 如何工作 Assisted NLU 通过结合传统机器学习和 LLM,利用**意图和槽位的名称与描述**来理解用户输入。它支持三种工作模式: - **Primary 模式**:全程使用 LLM 增强理解,适合高精度场景。 - **Fallback 模式**:仅当传统 NLU 置信度不足时启用 LLM,作为安全兜底。 - **意图消歧**:当多个意图概率接近时,主动引导用户确认。 该功能已包含在标准 Amazon Lex 定价中,无需额外付费。 ### 实施最佳实践 #### 1. 优化意图与槽位描述 Assisted NLU 依赖语义理解,因此**描述的质量直接决定准确率**。建议: - 为每个意图提供清晰、具体的描述,例如“BookHotel”的描述可写为“用户预订酒店房间,包括选择地点、日期和房型”。 - 为槽位添加上下文提示,如“room_type”的描述为“房间类型,如标准间、套房、豪华房”。 #### 2. 利用 Test Workbench 验证 Amazon Lex 提供的 **Test Workbench** 可批量测试对话样本,对比传统 NLU 和 Assisted NLU 的表现。建议: - 准备涵盖常见表述、复杂句式和边缘情况的测试集。 - 关注意图分类准确率、槽位填充完整率和对话完成率三个指标。 - 根据测试结果迭代调整描述和示例语句。 #### 3. 渐进式迁移策略 - **新建机器人**:直接启用 Assisted NLU,从设计阶段就采用 LLM 增强。 - **现有机器人**:建议先启用 Fallback 模式,逐步观察效果,再切换到 Primary 模式。 - 保留传统 NLU 配置作为基线,便于对比回归。 ### 行业影响与展望 Assisted NLU 的推出,标志着对话式 AI 从“规则驱动”向“语义理解”的重要转变。对于企业而言,这意味着: - **降低维护成本**:减少手动枚举 utterance 的工作量,迭代周期从周级缩短到天级。 - **提升用户体验**:机器人能更自然地理解用户的真实表达,减少重复和放弃率。 - **加速上线速度**:新业务场景的对话模型搭建时间可缩短 50% 以上。 不过,LLM 的引入也带来新的考量:模型推理延迟、对描述质量的敏感度,以及在特定领域(如医疗、金融)的合规性。建议开发者在正式上线前进行充分的压力测试和合规审查。 总的来说,Amazon Lex Assisted NLU 为构建高精度对话机器人提供了一条更智能、更高效的路径。无论是初创公司还是大型企业,都可以通过合理的设计和测试,快速提升机器人的自然语言理解能力。

AWS ML19天前原文
安大略省审计发现:医生的AI笔记助手可能虚构信息

近年来,许多不堪重负的医生开始使用所谓的AI医疗抄写员,来自动总结患者对话、诊断和护理决策,形成结构化笔记用于健康记录。但安大略省审计长最近的一项审计发现,省政府推荐的AI抄写员经常生成错误、不完整甚至虚构的信息,这“可能导致不充分或有害的治疗方案,进而影响患者健康结果”。 审计长在《安大略省政府人工智能使用情况报告》中,审查了20家经省政府批准预合格的AI抄写员供应商在两个模拟医患对话中的转录测试结果。所有20家供应商在至少一项简单测试中均出现准确性问题,其中9家虚构了患者信息,12家错误记录信息,17家遗漏了讨论的心理健康问题的关键细节。 报告指出多个令人担忧的示例,例如AI抄写员虚构了不存在的血液检测或治疗转诊、错误转录处方药名称,以及遗漏心理健康问题的“关键细节”。在所有获批供应商中,AI抄写员在安大略省供应局评估标准中的“医疗笔记生成准确性”部分平均得分仅为12分(满分20分)。但这一关键指标仅占供应商总评分的约4%,即使AI抄写员在该指标得分为零,也容易达到批准的最低门槛(而衡量“安大略省本地存在”的指标占总评分的30%)。 审计长最终认为,这些AI抄写员“未得到充分评估”。报告谨慎而克制地指出,“必须对AI抄写员系统进行测试,以确保其可靠性”。

Ars Technica19天前原文

实时语音交互正成为 AI 应用的下一个前沿,但构建低延迟、可生产的语音智能体往往需要复杂的工程堆栈。Stream Vision Agents 这一开源框架与 **Amazon Bedrock** 及 **Amazon Nova 2 Sonic** 的结合,正在大幅降低这一门槛。开发者现在可以在几分钟内搭建起能够理解语音、调用工具并支持多语言的实时语音智能体,且具备生产级可靠性。 ## 架构解密:Stream Vision Agents + Amazon Nova 2 Sonic 如何协同工作 Stream Vision Agents 是一个专为实时多模态交互设计的开源框架,它抽象了音频流处理、事件管理和连接维护等底层细节。而 **Amazon Nova 2 Sonic** 是 Amazon Bedrock 上最新推出的语音模型,专为低延迟语音交互优化。两者结合后,开发者只需专注于智能体的业务逻辑,无需关心音频编解码、WebSocket 重连等基础设施。 核心工作流如下: 1. 用户语音通过 Stream Vision Agents 的客户端 SDK 捕获并实时流式传输。 2. 框架将音频流送入 Amazon Bedrock 上的 Nova 2 Sonic 模型进行语音识别与理解。 3. 模型返回文本或结构化响应,框架支持通过 **函数调用**(Function Calling)触发外部 API 或数据库查询。 4. 响应文本由 Nova 2 Sonic 的文本转语音(TTS)能力合成为语音,流式回传给用户。 5. 连接意外中断时,框架内置的 **自动重连** 机制确保会话无缝恢复。 ## 从代码到生产:关键能力一览 以下是该集成方案中值得关注的几项生产级特性: - **函数调用**:智能体可以调用预定义的函数来获取实时数据(如天气、库存、订单状态),而不仅仅是静态回复。例如,用户询问“我的订单什么时候到?”,智能体自动调用订单查询 API 并返回结果。 - **多语言语音支持**:Nova 2 Sonic 原生支持多种语言,包括中文、英文、日文、西班牙语等,且切换语言无需额外配置。这对于构建跨国客服或本地化应用至关重要。 - **自动重连**:网络波动时,Stream Vision Agents 会自动检测断连并重新建立 WebSocket 连接,同时保留会话上下文,避免用户重复表述。 - **低延迟优化**:端到端延迟控制在 **300ms 以内**,达到实时对话所需的“无感知”体验标准。 ## 实战:一个简单的语音助手示例 假设我们要构建一个支持中英文的“会议助手”,能够查询日程和添加提醒。以下伪代码展示核心逻辑: ```python from stream_vision_agents import Agent, BedrockNovaSonic agent = Agent( model=BedrockNovaSonic(model_id="amazon.nova-sonic-v1"), functions=[get_schedule, add_reminder], languages=["zh-CN", "en-US"] ) agent.run() # 启动实时语音交互 ``` 开发者只需定义好函数和模型参数,Stream Vision Agents 会处理音频流的输入输出、自动重连和函数调用路由。相比传统方案,代码量减少约 70%。 ## 行业意义与未来展望 这一集成方案的出现,意味着 **实时语音智能体** 不再是大厂专属。中小团队甚至个人开发者,都可以基于开源框架和云上 API 快速构建生产级应用。场景覆盖客服、语音助手、在线教育、医疗问诊等。 值得注意的是,Stream Vision Agents 本身是开源项目,这意味着社区可以持续贡献新的功能模块(如情感识别、说话人分离),而 Amazon Bedrock 则提供了稳定且可扩展的算力底座。这种“开源+云”的组合模式,正在成为 AI 应用开发的主流范式。 未来,随着多模态模型进一步成熟,这类智能体有望融合视觉信息(如摄像头画面)与语音交互,实现更丰富的场景理解。

AWS ML19天前原文

Amazon QuickSight 宣布推出跨账户 Athena 访问功能,用户现在可以通过 AWS Identity and Access Management (IAM) 角色链,查询其他 AWS 账户中的 Athena 数据,查询费用将计入数据所在账户。 ## 背景:数据孤岛与统一分析的挑战 在企业多云或大型组织中,数据往往分散在不同 AWS 账户中——例如生产环境、测试环境、分析团队各自拥有独立账户。传统上,跨账户查询 Athena 数据需要复杂的数据复制或管道集成,不仅增加延迟和成本,还容易导致数据不一致。 ## 新功能:跨账户 Athena 访问 借助 **跨账户 Athena 访问**,QuickSight 用户无需移动数据即可实现跨账户分析。其核心机制是 **IAM 角色链**:用户通过 QuickSight 的 SPICE 引擎或直接查询模式,利用 IAM 角色跨账户委托权限,从而查询目标账户中的 Athena 表。查询费用直接归属于数据所在账户,简化了成本分摊。 ## 使用场景与价值 - **统一报表**:将多个业务线的数据整合到一个 QuickSight 仪表板,无需数据仓库。 - **合规与治理**:数据保留在原账户,满足数据主权和访问控制要求。 - **成本透明**:查询费用直接计入数据账户,便于按业务部门核算。 ## 技术要点 - 需要配置跨账户 IAM 信任策略,确保 QuickSight 账户可代入目标账户的角色。 - 支持 Athena 工作组的跨账户引用,需确保目标账户的 Athena 工作组已授权。 - 当前功能适用于 **Amazon Athena** 数据源,后续可能扩展至其他服务。 ## 行业意义 这一更新标志着 **无服务器分析** 向更松耦合、更细粒度协作迈进。在 AI 和机器学习工作流中,数据通常分布在训练、推理、日志等多个账户,跨账户查询能力可显著加速数据准备和特征工程环节。 ## 小结 跨账户 Athena 访问是 QuickSight 在“统一洞察”方向上的重要一步,尤其适合多账户架构的组织。它降低了数据移动成本,同时保留了数据治理的灵活性。对于已经在使用 Athena 和 QuickSight 的企业,这是一个值得立即评估的功能。

AWS ML19天前原文

Amazon Bedrock AgentCore浏览器现已支持Chrome企业策略和自定义根CA证书,让组织能够对AI Agent的浏览器行为实施精细化管控。这项更新直击AI Agent无限制网页访问带来的安全痛点——通过配置URL白名单/黑名单、禁用密码管理器、阻止文件下载等450余项策略,企业可以确保Agent仅在授权域内活动,同时借助自定义CA证书打通与内部服务及SSL拦截代理的安全连接。本文深入解读该功能的技术原理、配置方法与行业价值。 ## 为什么需要为AI Agent施加浏览器策略? AI Agent若拥有不受限的网页访问权限,可能带来三类核心风险: 1. **导航越界**:Agent可能自行跳转到社交网站、搜索引擎等非授权域名,偏离任务目标。 2. **功能滥用**:浏览器自带的密码管理器、自动填充、文件下载等功能,可能被Agent无意间用于存储或泄露敏感数据。 3. **证书断层**:企业内部服务常使用私有CA签发证书,Agent浏览器默认不信任此类证书,导致HTTPS连接失败。 Chrome企业策略从浏览器层面直接锁定这些风险,**独立于Agent的提示词或推理逻辑**,形成一道不可绕过的安全屏障。 ## 核心能力:450+策略 + 自定义CA Amazon Bedrock AgentCore此次更新主要带来两大能力: ### 1. Chrome企业策略集成 通过标准的Chrome企业JSON配置,用户可以设定超过450项浏览器设置,包括: - **URL过滤**:通过白名单和黑名单精确控制Agent可访问的域名列表。 - **下载限制**:禁止Agent在浏览器中下载任何文件。 - **密码管理**:禁用密码管理器、自动填充等功能,防止凭据被意外存储。 - **其他控制**:如禁用开发者工具、限制插件加载等。 这些策略以JSON格式统一管理,与现有Chrome企业部署流程一致,降低了学习成本。 ### 2. 自定义根CA证书支持 针对内部服务场景,AgentCore允许上传组织自己的根CA证书。这样Agent浏览器就能信任由私有CA签发的HTTPS证书,顺利连接内部系统或经过SSL拦截代理的加密流量。对于金融、医疗、政务等高度依赖内部网络的企业而言,这一能力直接打通了AI Agent落地的“最后一公里”。 ## 实用示例:从限制到验证 文章通过一个完整的实践案例展示了功能流程: - **配置策略**:限制Agent只能访问Amazon Bedrock AgentCore官方文档网站。 - **执行与记录**:Agent在会话中尝试导航到其他网站时,浏览器被策略拦截,行为被完整录制。 - **CA验证**:使用公共测试站点演示自定义根CA证书的信任过程。 最终,Agent在浏览器策略的约束下,成功完成对AgentCore文档的研究任务,验证了策略生效与安全边界的一致性。 ## 行业视角:AI Agent安全从“劝诫”走向“强制” 此前,AI Agent的安全浏览主要依赖开发者编写提示词约束,例如“不要访问非授权网站”。但提示词可以被绕过、遗忘或误解,安全可靠性有限。Chrome企业策略的引入,将安全控制从**软性指导**升级为**硬性执行**——无论Agent如何决策,浏览器行为始终受策略框架约束。 这种“策略即代码”的思路,与零信任架构(Zero Trust)高度契合。企业无需信任Agent的内部逻辑,只需信任底层浏览器的策略执行引擎,从而大幅降低攻击面。 ## 总结 Amazon Bedrock AgentCore的Chrome企业策略与自定义CA支持,为AI Agent的浏览器行为提供了企业级的安全底座。它不仅解决了导航越界、功能滥用、证书断层三个核心痛点,更将安全控制与Agent开发解耦,让安全团队可以独立定义规则。随着AI Agent在企业工作流中的渗透率提升,这种“浏览器级安全”的能力将成为标配。

AWS ML19天前原文

据 Hacker News 热门讨论,苹果与 OpenAI 的合作关系出现裂痕,可能演变为法律争端。这一消息在技术社区引发广泛关注,目前已有 58 个点赞和 29 条评论。 ## 合作背景与潜在冲突 苹果与 OpenAI 的合作始于 2024 年,当时苹果宣布将 OpenAI 的 ChatGPT 集成到 Siri 等产品中,以提升 AI 能力。然而,随着合作的深入,双方在技术路线、数据隐私和商业利益分配上逐渐产生分歧。 ## 争议焦点 - **数据隐私**:苹果一贯强调用户隐私保护,而 OpenAI 的模型训练需要大量数据,双方在数据使用权限上存在分歧。 - **技术控制**:苹果倾向于将 AI 功能深度集成到自家生态系统中,而 OpenAI 希望保持其技术的独立性与品牌曝光。 - **商业利益**:合作中的收入分成、API 调用费用等商业条款未能达成一致。 ## 行业影响 这一争端可能对 AI 行业产生连锁反应: - **苹果**:若失去 OpenAI 支持,苹果可能加速自研大模型(如 Ajax 框架),或寻求与 Google、Anthropic 等合作。 - **OpenAI**:失去苹果这一重要渠道,OpenAI 的用户增长和营收可能受挫,迫使其更依赖企业客户。 - **用户**:Siri 的 AI 功能升级可能延迟,影响用户体验。 ## 未来走向 目前双方尚未公开表态,但法律争端并非不可能。若进入诉讼,将涉及合同解释、技术归属等复杂问题。此外,监管机构可能关注此事对 AI 市场竞争的影响。 **小结**:苹果与 OpenAI 的关系紧张反映了科技巨头在 AI 领域合作与竞争的双重博弈。最终结果可能重塑移动端 AI 生态格局。

Hacker News6419天前原文

一直以来,我的主力移动浏览器在 iPhone 上是 Safari,在安卓上是 Chrome。但最近,**Microsoft Edge** 凭借一系列新集成的 AI 功能,开始动摇我的使用习惯。尽管我对微软强推 Copilot 的做法颇有微词,但不得不承认,当 AI 用对地方时,它确实能成为得力助手。 根据 Edge 产品副总裁 Sean Lyndersay 的博客文章,移动版 Edge 现在引入了多项此前仅桌面版才有的 AI 技能,并新增了一些跨平台功能。以下是让我改观的核心更新: ### 1. 多标签页一键总结 过去,要了解多个标签页的内容,你得逐个翻阅。现在,在移动版 Edge 中,你可以直接让 Copilot 总结或回答关于所有打开标签页的问题。只需在标签页首页点击搜索栏旁的 Copilot 图标,输入或说出指令(如“总结打开标签页中的信息”),Copilot 便会分析内容并给出整合摘要。这极大提升了研究效率,省去了来回切换的麻烦。 ### 2. 网页转播客 Edge 现在能将任何网页内容转换为播客形式。当你阅读一篇长文或新闻时,可以点击地址栏旁的音频图标,选择“收听此页”,Edge 会生成语音版本。更妙的是,你还可以要求 Copilot 根据页面内容创建播客节目,实现“边听边学”。 ### 3. 基于浏览历史与过往对话的问答 Copilot 现在能调用你的浏览历史和之前的聊天记录来回答问题。例如,你可以问“我上周看的那篇关于量子计算的文章里提到的关键技术是什么?”Copilot 会直接从历史记录中提取相关信息,无需手动翻找。这一功能让 AI 助手真正具备了“记忆”,使后续查询更加连贯。 ### 4. 页面内容生成测验 学习或备考时,你可以让 Copilot 基于当前网页内容生成测验题。点击 Copilot 图标,选择“创建测验”,它会根据文本自动生成选择题或问答题。这对于学生或需要快速检验理解程度的用户来说非常实用。 ### 5. 跨标签页信息对比 除了总结,你还可以要求 Copilot 对比多个标签页中的信息。比如,同时打开几款产品的评测页面,然后问“对比这些手机的续航和摄像头参数”,Copilot 会提取关键数据并生成对比表格或要点列表。 ### 6. 更自然的语音交互 移动版 Edge 的语音输入功能得到增强,支持更自然的连续对话。你可以用语音发出复杂指令,如“帮我找一下昨天关于 AI 伦理的文章,然后总结它的主要观点”,Copilot 会依次执行。 ## 小结 这些更新并非颠覆性创新,但它们的组合效应显著提升了移动浏览的效率和体验。**Edge 不再只是一个浏览器,更像一个 AI 驱动的信息助理。** 尤其是多标签页总结和历史问答功能,解决了移动端多任务处理的痛点。当然,Copilot 的准确性仍有待验证,但至少它让我愿意在特定场景下放下 Safari 和 Chrome。如果你还没升级,建议更新到 **版本 148 或更高**,亲自体验这些变化。

ZDNet AI19天前原文

Cerebras Systems 的 IPO 可谓一波三折。一年前,这家AI芯片公司还深陷监管泥潭,如今却以一场震撼市场的首秀宣告归来。 ## 定价与首日表现 美东时间周四,Cerebras 正式登陆纳斯达克。**IPO 定价为每股185美元**,远高于此前上调后的发行价区间(150-160美元),初始发行规模也扩大至3000万股。**开盘价即飙升至385美元,较发行价上涨108%**,随后略有回落,截至午盘仍在330美元以上高位交易。按185美元的发行价计算,Cerebras 完全稀释后的估值已达 **564亿美元**。 CEO Andrew Feldman 所持股份价值约19亿美元,CTO Sean Lie 的持股价值约10亿美元——而按照当前300美元以上的股价,这一数字更为惊人。 ## 从绝境到逆袭 一年前,Cerebras 的上市前景还一片黯淡。这家从头设计巨型AI芯片、立志挑战英伟达的公司,早在2024年就提交了IPO申请。但**阿布扎比集团 G42 的大额投资引发了美国外国投资委员会(CFIUS)的无限期审查**——G42 当时贡献了 Cerebras 几乎全部收入,这种过度依赖让投资者望而却步。IPO计划被迫搁置。 转机出现在2025年4月。Cerebras 公布了亮眼财报:**2025年营收达5.1亿美元,同比增长76%**,且客户已扩展至多家。更关键的是,**净利润从上一年的亏损近5亿美元扭转为盈利2.378亿美元**。投资者态度迅速转变。 ## 市场地位与客户 Cerebras 凭借其专为AI推理设计的巨型芯片,已成为英伟达的有力竞争者。其客户包括 OpenAI(存在复杂循环交易关系)、G42、沙特穆罕默德·本·扎耶德人工智能大学以及亚马逊云服务(AWS)。 ## 行业意义 Cerebras 的成功上市标志着 **2026年首个大型科技IPO** 诞生,也为AI硬件赛道注入强心剂。在英伟达几乎垄断训练市场的格局下,Cerebras 在推理领域的差异化定位正获得市场认可。 (注:本文信息基于公开报道,不构成投资建议。)

TechCrunch19天前原文
石墨烯“纹身”为植物打造神经网络,实时监测干旱胁迫

科学家开发出一种基于石墨烯的超薄柔性传感器,可像“纹身”一样贴附在植物叶片表面,实时监测植物水分状态。这项技术有望在干旱易发地区构建植物传感网络,为精准农业和气候变化适应提供新工具。 ## 植物“纹身”如何工作? 来自德克萨斯大学奥斯汀分校的研究团队,利用**石墨烯**——一种由单层碳原子构成的二维材料,制造出厚度仅数微米的传感器。这种传感器能够紧密贴合植物叶片,通过测量叶片电导率的变化来推断其水分含量。当植物缺水时,叶片细胞膨压降低,电导率随之改变,传感器可捕捉到这一信号。 研究团队在龟背竹(Monstera)叶片上进行了测试,结果显示传感器能**准确追踪叶片失水过程**,响应时间仅为数秒。相比传统土壤湿度传感器或热成像仪,这种植物“纹身”更直接地反映植物自身的生理状态,且对叶片损伤极小。 ## 从单叶片到植物神经网络 这项技术的突破性在于其**可扩展性**。单个传感器仅覆盖一小片区域,但研究者设想将多个传感器部署在不同植株或同一植株的不同部位,通过无线通信形成类似神经网络的监测系统。例如,在干旱易发地区的农田中,每株作物上的传感器可以实时上传水分数据,帮助农民**精准灌溉**,避免水资源浪费。 此外,该传感器还可用于研究植物对气候变化的响应。通过长期监测不同环境条件下的植物水分动态,科学家能更深入地理解干旱胁迫的生理机制,并筛选更耐旱的作物品种。 ## 挑战与前景 尽管前景诱人,该技术仍面临一些挑战。目前,石墨烯传感器的制造过程相对复杂,成本较高,距离大规模应用还有距离。此外,传感器的长期稳定性和在户外环境中的耐久性仍需验证。但研究团队表示,随着制造工艺的改进,未来有望实现**低成本、可降解**的植物传感器。 这项研究发表于《ACS Applied Materials & Interfaces》,是**植物可穿戴电子设备**领域的重要进展。结合物联网与人工智能,这种植物“纹身”或将成为智能农业的关键组件,帮助人类更高效地应对全球水资源危机。

IEEE AI19天前原文

## 两款顶尖黑白E Ink平板,谁更适合你? ReMarkable 最新发布的 **Paper Pure** 数字纸平板,以 **399美元** 的起售价直接对标亚马逊 **Kindle Scribe**。两者外观相似,但核心定位截然不同。 ### 核心差异:写作优先 vs. 阅读优先 **Paper Pure** 专为笔记和素描设计,拥有极低延迟的手写体验和类似真实纸张的触感。其操作系统专注于无干扰书写,支持笔记整理、文档批注,并可通过云服务同步。而 **Kindle Scribe** 更偏向阅读,在提供手写功能的同时,深度整合亚马逊 Kindle 书城,适合阅读电子书并做笔记。 ### 硬件与体验对比 两者都采用 **E Ink 屏幕**,但 Paper Pure 的屏幕表面经过特殊处理,摩擦力更接近纸。Kindle Scribe 的屏幕则更光滑,手写时略有延迟。在笔的精准度上,ReMarkable 的 Marker 系列笔尖更细,压感更灵敏,适合绘画和精细书写。Kindle Scribe 的笔支持橡皮擦功能,但整体书写感略逊一筹。 ### 软件生态与内容 ReMarkable 提供 **ReMarkable Connect** 云服务,支持跨设备同步笔记,但文件导入格式有限。Kindle Scribe 则无缝接入亚马逊生态,可直接从 Kindle 商店购买书籍,并支持 PDF 批注。如果你已有大量 Kindle 图书,Scribe 更便捷;若专注笔记和文档处理,Paper Pure 更专业。 ### 结论 **ReMarkable Paper Pure** 在书写体验上胜出,适合学生、设计师和重度笔记用户。**Amazon Kindle Scribe** 则更适合阅读爱好者,兼顾笔记功能。选择取决于你的核心需求:是更看重“写”还是“读”。

ZDNet AI19天前原文