在 Miro,每年因缺陷误路由和重复分配导致的累计生产力损失高达 42 年。通过与 AWS PACE 团队合作,Miro 开发了基于 Amazon Bedrock 的 BugManager 解决方案,将团队重新分配次数减少六倍,缺陷解决时间从数天缩短至数小时。 ## 挑战:从近 100 个团队中准确路由缺陷 Miro 作为拥有超过 9500 万用户的 AI 创新工作空间,其工程组织包含近 100 个团队,每个团队负责特定产品领域。缺陷报告往往杂乱无章,包含文本、堆栈跟踪、截图甚至视频,且缺乏上下文。此外,团队结构动态变化——合并、新设、产品演进——使得传统基于规则或简单机器学习的方法难以维持高准确率。 ## 解决方案:基于 Amazon Bedrock 的 BugManager Miro 与 AWS PACE 团队合作,利用 **Amazon Bedrock** 构建了 BugManager。该方案通过以下关键步骤实现高精度路由: 1. **增强上下文**:自动从 GitHub PR、Confluence 文档、README 文件和历史工单中提取相关信息,丰富缺陷报告。 2. **多模态理解**:利用 Bedrock 基础模型的能力处理文本、堆栈跟踪、截图等异构数据。 3. **动态适应**:模型能够适应团队重组和职责变化,无需频繁重新训练。 ## 成果:六倍更少的重新分配,五倍更快的解决时间 BugManager 上线后,Miro 团队观察到显著改进: - **团队重新分配次数减少 6 倍**:缺陷首次分配即命中正确团队的比例大幅提升。 - **解决时间缩短 5 倍**:从数天降至数小时,减少了不必要的上下文切换。 - **累计生产力损失**:原本每年 42 年的浪费被大幅削减。 ## 技术架构亮点 BugManager 的架构充分利用了 Amazon Bedrock 的托管基础模型服务,无需管理底层基础设施。核心流程包括: - 缺陷报告进入后,通过 Bedrock API 调用预训练模型进行语义分析。 - 模型输出候选团队及置信度分数,并结合实时组织数据(如团队职责映射)进行最终决策。 - 系统持续从人工纠正中学习,通过反馈循环提升准确率。 Miro 的案例表明,生成式 AI 在 DevOps 领域的应用正从“辅助”走向“核心”。通过将 AI 嵌入缺陷路由这一关键环节,不仅提升了开发效率,更直接改善了产品交付质量和客户满意度。
## 从 Reddit 模仿者到 AI 新闻雷达:Digg 的第三次生命 曾经与 Reddit 齐名的链接分享网站 **Digg** 再次宣布回归。这距离其上一次“复活”仅过去数月——今年早些时候,Digg 以 Reddit 竞争者的身份重新上线,却因无法有效管理机器人流量、缺乏差异化而于 3 月关闭。创始人 Kevin Rose 随后在 4 月全职回归,重新设计产品。如今,新的 Digg 彻底抛弃了社区论坛模式,转型为 **AI 新闻聚合器**,并首次面向测试者公开预览。 ### 新玩法:从 X 平台实时抓取信号 新版 Digg 的首页结构与传统新闻聚合器类似:顶部展示四篇精选故事(包括最高浏览量、讨论热度上升最快、攀升速度最快和“你可能错过”的文章),下方是每日热门故事排名列表,并附有浏览量、评论、点赞、收藏等互动指标。但关键区别在于:**这些数据并非来自 Digg 自身,而是实时从 X 平台(原 Twitter)抓取的内容**。 Digg 通过实时分析 X 上的讨论,结合情感分析、聚类和信号检测算法,判断哪些新闻真正重要。创始人 Rose 在 X 上举例:当 OpenAI CEO Sam Altman 对一篇 AI 文章做出互动时,几乎总会引发连锁反应,使该话题在 X 上被深度讨论和传播。Digg 能够追踪这种互动激增,并以图表形式呈现,帮助用户从 X 的信息噪声中提取有效信号。 ### 从“数据迷”到普通用户:价值何在? 对数据爱好者而言,Digg 提供了一个观察 X 平台影响力传播链的窗口——例如,一张图表就能显示某条推文如何带动话题热度飙升。但对普通用户来说,这种“元数据”的价值可能有限。毕竟,仅仅知道“Altman 的推文确实有影响力”并不能直接帮助用户筛选出更优质的新闻。 目前 Digg 聚焦于 AI 领域,如果模式跑通,未来将扩展到其他话题。公司通过邮件向测试者表示:“网站还很粗糙,存在不少 Bug,这次预览更多是让用户先睹为快,而非正式发布。” ### 行业背景:AI 聚合赛道的拥挤与机遇 在信息过载时代,利用 AI 进行新闻筛选并非新鲜事。已有 **Artifact**(由 Instagram 联合创始人创办)、**SmartNews** 等同类工具,它们同样试图通过算法从海量信息中找出高价值内容。Digg 的独特之处在于其数据源完全依赖 X 平台,而非全网爬取。这种“寄生”策略的优势是数据获取相对简单,且能直接利用 X 上的社交信号(如大 V 互动);但风险同样明显——过度依赖单一平台,一旦 X 调整 API 策略或内容生态变化,Digg 将受到直接影响。 此外,Digg 需要回答一个根本问题:用户是否愿意为了“追踪 X 上的 AI 讨论热度”而专门访问一个独立网站?如果答案是否定的,那么 Digg 可能只是成为又一个数据可视化玩具,而非真正的信息工具。 ### 小结:旧瓶装新酒,仍需时间验证 Digg 的回归充满了试验色彩:它不再试图复制 Reddit 的社区模式,而是将自己定位为一个 **“X 平台信号放大器”**。这种定位能否在激烈的 AI 新闻聚合赛道中杀出重围,取决于两个关键因素:一是算法能否真正帮助用户节省时间,二是能否积累足够的用户规模以形成网络效应。目前来看,Digg 还处于非常早期的阶段——正如团队自己承认的,它“还很原始”。但至少,这一次它找到了一个比“Reddit 克隆”更清晰的差异化方向。
## 核心要点 AI 的爆发式增长正在重塑网络基础设施,而 Wi-Fi 作为企业无线网络的核心,其架构必须跟上步伐。芯片制造商正将 AI 推理引擎直接嵌入 Wi-Fi 芯片,以应对数据量激增与低延迟需求。 ## 正文 随着 AI 应用从云端走向边缘,企业无线网络正面临前所未有的压力。传统的 Wi-Fi 网络设计于 AI 时代之前,如今已难以胜任大量 AI 推理任务所需的实时数据传输与处理。 **关键变革:AI 推理引擎进入 Wi-Fi 芯片** 芯片制造商正在将 AI 推理引擎集成到 Wi-Fi 芯片中,这一举措旨在实现本地化智能处理。通过直接在芯片层面执行推理任务,网络可以降低对云端依赖,减少延迟,同时提升数据隐私与安全性。例如,AI 引擎可用于优化信道选择、预测流量模式,甚至实时识别网络威胁。 **从 Wi-Fi 6 到 Wi-Fi 7:逐步补齐短板** 每一代 Wi-Fi 标准都在试图缩小性能差距: - **Wi-Fi 6** 引入了 OFDMA 和 MU-MIMO,提升了多设备并发效率,但缺乏对 AI 的原生支持。 - **Wi-Fi 6E** 增加了 6GHz 频段,缓解了频谱拥堵,但 AI 集成仍停留在实验阶段。 - **Wi-Fi 7** 预计将带来更高的吞吐量和确定性低延迟,但其真正价值可能在于为 AI 推理预留的专用计算单元。 **行业背景与影响** 这一趋势与 AI 从训练转向推理的宏观方向一致。据行业预测,到 2025 年,超过 70% 的 AI 推理将在边缘设备上完成。Wi-Fi 芯片内置 AI 能力,将帮助企业无缝部署智能摄像头、工业机器人、自动驾驶辅助系统等应用,而无需改造现有网络架构。 **挑战与展望** 尽管前景乐观,但芯片级 AI 集成仍面临功耗、成本与标准化问题。此外,企业需要升级设备以支持新特性,这需要时间。不过,随着 AI 工作负载的持续增长,Wi-Fi 网络的“AI 就绪”将成为刚需。 ## 小结 AI 热潮正在倒逼 Wi-Fi 技术从“连接管道”升级为“智能节点”。芯片厂商的这一步棋,或许将重新定义无线网络的性能边界。
谷歌威胁情报组(GTIG)近日发布报告,称成功拦截了一起由“知名网络犯罪威胁行为体”策划的零日漏洞攻击。该漏洞针对一款未公开的“开源、基于 Web 的系统管理工具”,可绕过双因素认证(2FA),计划用于“大规模利用事件”。更引人注目的是,谷歌研究人员在漏洞利用的 Python 脚本中发现了 AI 参与的痕迹:包括一个“幻觉 CVSS 评分”以及“结构化、教科书式”的格式,与 LLM 训练数据特征高度吻合。这是谷歌首次发现 AI 被用于开发此类攻击。 ## AI 痕迹:幻觉评分与格式化代码 研究人员在分析脚本时注意到,其中包含一个 CVSS 评分,但该评分与实际漏洞严重性不符,属于 AI 常见的“幻觉”现象。此外,代码注释和结构过于规整,类似 LLM 生成的典型输出。谷歌强调,目前没有证据表明 Gemini 被用于此攻击,但承认这是 AI 辅助攻击的一个显著案例。 ## 攻击目标:2FA 逻辑缺陷 该漏洞利用的是“高级语义逻辑缺陷”——开发者在 2FA 系统中硬编码了信任假设,导致可被绕过。谷歌已成功“阻断”该漏洞利用,但警告称黑客正越来越多地使用 AI 寻找和利用安全漏洞。 ## 行业背景:AI 安全攻防升级 此次事件正值业界对 AI 安全能力高度关注之际。此前,Anthropic 的 Mythos 模型和一项 AI 辅助发现的 Linux 漏洞已引发讨论。谷歌报告还指出,攻击者正使用“角色驱动越狱”技术,诱导 AI 为其发现漏洞,例如指示 AI“假装自己是”安全研究员。同时,AI 系统本身也成为攻击目标,尤其是其自主技能和第三方数据连接器等组件。 ## 小结 谷歌的发现标志着 AI 在网络攻击中应用的一个转折点:从辅助分析到直接参与漏洞开发。虽然此次攻击被成功拦截,但 AI 降低黑客技术门槛的趋势已不可逆。安全社区需要加速研发 AI 防御工具,并警惕类似“幻觉评分”等 AI 特有痕迹成为未来攻击识别的新指标。
随着亚马逊宣布将于 **5 月 20 日** 停止对部分旧款 Kindle 的技术支持(包括 2013 年前发布的机型),许多用户面临设备“变砖”或功能受限的困境。对此,资深用户尝试了两种方案:**越狱安装 KOReader** 与 **换用替代固件**。 ### 越狱之路:KOReader 带来新生 越狱 Kindle 后安装第三方阅读应用 **KOReader**,可突破亚马逊的生态限制。KOReader 支持更多电子书格式(如 EPUB、PDF 重排)、自定义字体与排版,甚至能优化背光与翻页速度。对于已失去官方商店、云同步等功能的旧设备,KOReader 让阅读体验焕然一新。 但越狱存在门槛:需特定固件版本、操作步骤复杂,且可能失去保修。亚马逊虽未明确禁止,但后续系统更新可能封堵漏洞。 ### 更稳妥的选择:换用替代固件 相比越狱,**刷入开源固件** 是更“优雅”的解法。例如 **Duokan(多看)** 或 **Nickel**(Kobo 设备固件移植版)可完全替换系统,提供更稳定的阅读环境。这类固件通常针对电子墨水屏优化,电池续航更优,且支持多平台同步。用户只需通过 USB 连接电脑,按教程刷入即可。 ### 行业背景与建议 亚马逊此举意在推动用户升级至新款 Kindle,但旧硬件本身仍有价值。对于动手能力强的用户,越狱或刷机是低成本升级方案;普通用户可考虑 **关闭 Wi-Fi、手动传输图书**,继续使用基本功能。 **小结**:越狱 KOReader 适合追求功能自定义的极客,而刷入替代固件则更稳定易用。无论哪种方式,都让旧 Kindle 摆脱了“电子垃圾”的命运。
Amazon Quick 推出五项新能力,帮助数据专业人士大规模交付可信、可复现的AI驱动洞察。其中,**数据集问答(Dataset Q&A)** 允许用户通过自然语言直接查询数百万行数据,系统自动生成SQL并执行,同时遵循行级和列级安全策略,确保结果既快速又合规。这填补了从提问到获得可信答案之间的时间鸿沟,让企业数据真正服务于决策。
智能家居有时会让人不知所措,但 Sonos 的这几条语音指令既简单又是我日常生活不可或缺的部分。 ## 闹钟与天气:开启无手机干扰的早晨 我习惯把 **Sonos Play** 放在床头当作闹钟。用默认的 Sonos Chime 唤醒,能避免一早醒来就刷手机。你还可以选择自己喜欢的播放列表作为闹铃。醒来后,只需问一句“今天天气如何”,Giancarlo Esposito 的声音就会告诉我是否需要带伞或穿外套。 ## 电视开关:客厅里的“魔法” 我的 **Sonos Arc Ultra** 连接着电视,最让朋友惊讶的是,我只需说一句就能开关电视。这个指令在匆忙出门时尤其方便。 ## 房间切换与计时器:让音乐随你移动 在客厅听歌时,如果想回厨房继续听,一句“Move to Kitchen”就能无缝转移音乐。做饭时,用语音设置计时器也很顺手,无需触碰屏幕。 Sonos Voice Control 虽然不如其他语音助手“聪明”,但专注音频场景的这几个功能,确实让生活更高效。
传统的“发现-修复”安全模型曾一度合理,但在AI辅助开发、持续部署和漏洞积压爆炸式增长的今天,规则正在改写。旧的应用安全手册正在迅速失效。 ## 从“发现-修复”到“安全左移” 过去,应用安全的核心是“发现-修复”:安全团队或扫描工具找到漏洞,开发者修复,然后发布补丁。这就像一个**补丁跑步机**——你不停地跑,却原地踏步。每次新代码、新依赖或新漏洞出现,循环就重新开始。这种模式本质上是**被动响应**,而非主动防御。 如今,AI辅助开发让代码产出速度大幅提升,持续部署(CD)让发布频率从月级降到天级甚至小时级。漏洞积压已经让开发团队不堪重负。据ZDNET报道,**77%的IT经理表示他们的AI代理已经失控**,这进一步加剧了安全风险。 ## 漏洞积压:开发者的噩梦 当漏洞报告堆积如山时,开发者不得不频繁从新功能开发中抽身,去修复旧代码。更糟糕的是,有些漏洞深埋在层层叠叠的遗留代码中,修复成本极高,甚至不切实际。这种**“补丁疲劳”**不仅拖慢开发进度,还可能导致关键漏洞被忽视。 ## 解决方案:安全融入代码创建 行业正在转向**“安全左移”**(Shift Left),即在编码阶段就嵌入安全实践。具体包括: - **AI驱动的代码审查**:在代码提交时自动扫描漏洞。 - **安全设计**:将安全需求纳入架构设计。 - **持续安全验证**:在CI/CD管道中集成安全测试。 目标是让安全成为开发流程的一部分,而不是事后的补救。这不仅能减少漏洞数量,还能减轻开发者的负担。 ## 未来展望 随着AI和自动化工具的成熟,应用安全将从“发现-修复”进化为**“预防-自动化”**。开发者需要拥抱新的工具和流程,否则将永远陷在补丁跑步机上。 **关键要点**: - 持续部署使旧安全模型过时。 - 漏洞积压压垮开发团队。 - 应用安全必须向代码创建阶段迁移。
应用安全不再是开发者的专属领域。企业领导者必须将应用安全提升至董事会级别的责任,内置问责机制、激励机制和客户风险削减策略。 ## 从“事后修复”到“源头设计” 传统的应用安全通常是在软件发布后修补漏洞,而“源头安全”(Secure-at-the-source)是一种战略性的预防方法,旨在从根源上杜绝问题的产生。但对企业而言,这不仅仅是技术转变,更是一种文化使命。要实现全组织的预防性安全,需要将其打造成一个有资金支持、可管理、可重复的**运营模式**。 ## 软件安全:领导层的责任 当代码管理着客户体验、运营、身份认证、支付、分析以及AI工作流时,安全设计就成为了**高级领导层**的“赌公司”级别的风险缓解优先事项。开发者擅长开发,但即便是AI增强的工具也无法确定全局优先级、分配企业级工程资源、改变激励机制或解决部门所有权冲突。这些决策必须由**董事会层面**来推动。 ## 文化与激励机制是关键 安全优先的文化需要从激励入手。如果开发团队仅因功能交付速度而获得奖励,安全就容易被忽视。企业需要重新设计激励体系,将安全指标纳入绩效考核。同时,**问责机制**必须清晰:谁对安全漏洞负责?是开发者、产品经理还是业务线负责人?明确的归属才能驱动行动。 ## 运营模型:将预防转化为实践 一个有效的安全运营模型包括: - **自动化安全扫描**与AI辅助检测 - **安全设计评审**作为开发流程的必经环节 - **跨部门协作**机制,打破开发、运维与安全团队之间的壁垒 - **持续监控与反馈循环**,确保安全策略随威胁演进 ## 结语 在AI和云原生时代,应用安全已从技术问题演变为**企业治理问题**。将安全内嵌于开发源头,并赋予董事会层面的监督与资源支持,是现代企业保护客户数据、维持信任和避免重大损失的必经之路。
## 从被动修复到主动预防:安全左移的核心理念 传统的软件安全往往在开发后期甚至上线后才介入,导致漏洞修复成本高昂、效率低下。如今,行业正加速向“安全左移”(Shift Left)转变——将安全实践嵌入到软件开发的最早阶段,**在编码开始前就进行威胁建模、设定安全默认值、管理依赖项,并在开发者工作流中设置防护栏**。 ## 威胁建模:在代码诞生前预见风险 安全左移的第一步是**威胁建模**,即在设计阶段系统性地识别潜在攻击面。通过分析系统架构、数据流和信任边界,团队可以提前发现如注入攻击、权限提升等问题。例如,使用 STRIDE 或 PASTA 方法论,开发者能与安全工程师协作,在写第一行代码前就制定缓解措施。 ## 安全默认值:让“安全”成为默认选项 框架和库的默认配置往往追求易用性,却可能牺牲安全性。安全左移要求平台和工具提供**更安全的默认值**,例如自动启用 HTTPS、强制最小权限原则、禁用不必要的功能。这样,即使开发者没有显式配置安全选项,也能获得基础防护。 ## 依赖项卫生:管理开源组件的风险 现代软件高度依赖开源组件,而第三方依赖中的漏洞是常见攻击入口。安全左移强调**依赖项卫生**:使用 SBOM(软件物料清单)持续追踪组件版本,通过自动化工具扫描已知漏洞,并及时更新或替换有风险的依赖。同时,企业应建立策略,限制使用未经安全审核的库。 ## 开发者工作流中的防护栏 安全左移最直接落地的方式是在开发流程中嵌入自动化安全检查。例如: - **预提交钩子**:在代码提交前运行静态分析(SAST),阻止包含高危漏洞的代码入库。 - **CI/CD 管道集成**:每次构建时自动执行动态分析(DAST)、依赖扫描和容器镜像扫描。 - **即时反馈**:通过 IDE 插件在编码时实时提示安全问题,而非事后报告。 这些防护栏让安全成为开发过程的一部分,而非额外负担。 ## 行业背景:为什么现在加速左移? 过去几年,Log4j 等供应链攻击事件暴露了传统安全模式的局限性。同时,DevOps 和云原生架构的普及要求安全响应速度匹配持续交付节奏。**Gartner 预测,到 2025 年,70% 的企业将采用安全左移策略**,以减少漏洞数量和修复成本。 ## 小结:安全是设计出来的,不是检查出来的 安全左移的核心思想是:**漏洞最好在引入之前就被阻止**。通过威胁建模、安全默认值、依赖管理和开发者防护栏,组织可以大幅降低软件风险。但这需要文化转变——安全团队从“守门员”变为“教练”,赋能开发者编写更安全的代码。未来,随着 AI 辅助代码生成和自动化安全工具的成熟,安全左移将更加高效,成为现代软件工程的标配。
继 Copy Fail 之后,Linux 内核再次迎来一场安全风暴。名为 **Dirty Frag** 的新漏洞于 5 月 7 日被公开披露,它被描述为与 2022 年的 Dirty Pipe 同属一类内核缺陷,但攻击面指向了网络缓冲区中的 sk_buff 片段字段。该漏洞允许拥有低权限账户的攻击者将权限提升至 root,从而完全控制系统。 Dirty Frag 由安全研究员 Hyunwoo Kim 发现,他于 4 月底向 Linux 内核维护者报告了问题。然而,协调披露和补丁发布的过程很快失控。5 月 7 日,当各大发行版还在忙于修复前一个漏洞 Copy Fail 时,详细的 Dirty Frag 技术信息和可用的概念验证利用代码(针对 xfrm-ESP 组件)被第三方提前泄露到网上。 该漏洞链利用 Linux 网络和认证栈中的逻辑错误,破坏内核页缓存中的数据,实现本地提权。它主要影响两个子系统:IPsec 封装安全载荷(xfrm-ESP)路径(追踪为 CVE-2026-43284)以及其他尚待公开的组件。 目前,尚无完整的补丁能够防御所有可能的攻击。安全专家建议,在官方补丁发布之前,用户需要主动关闭一系列服务,包括 VPN 等网络功能,以降低风险。对于依赖 Linux 服务器的企业和个人用户而言,这意味着需要在安全性与可用性之间做出艰难的权衡。 ZDNET 的 Steven Vaughan-Nichols 指出,Linux 近期接连遭遇安全事件,从 Copy Fail 到 Dirty Frag,且两者都与 AI 辅助发现有关。虽然 Copy Fail 的补丁快速到位,但 Dirty Frag 的修复却因信息泄露而陷入被动。这提醒我们,即使是最成熟的开源操作系统,在面对复杂的内核漏洞时,响应速度和补丁质量仍然是严峻挑战。
最近,Linux 系统接连曝出 **Copy Fail** 和 **Dirty Frag** 两个高危漏洞,引发广泛关注。作为长期被公认为最安全的操作系统,Linux 的“金身”似乎出现了裂痕。但本文作者认为,这一趋势其实早有预兆,并且 Linux 内核社区正在积极应对,用户无需过度恐慌。 ## 为什么漏洞增多是必然? Linux 长期以来之所以安全,很大程度上得益于 **“隐匿性”**——早期使用人数少,黑客缺乏攻击动机。然而,随着 Linux 在服务器、云计算、AI、嵌入式设备甚至游戏领域的普及,其攻击面急剧扩大。如今,**全球企业几乎都依赖 Linux**,它支撑着互联网基础设施、智能设备乃至你的智能冰箱。当系统变得无处不在,自然成为攻击者的“香饽饽”。 ## 社区反应:行动迅速,修复可期 面对 Copy Fail 和 Dirty Frag 这样的严重漏洞,Linux 内核开发团队并未坐视不管。社区迅速发布补丁,并加强了代码审查和测试流程。作者强调,Linux 的 **开源协作模式** 是其最大优势——全球开发者共同参与,漏洞发现和修复的速度往往快于闭源系统。 ## 我的看法:不必过度担忧 尽管漏洞增多,但 Linux 的安全性依然领先。关键在于:**Linux 的漏洞通常会被快速发现并修复**,而闭源系统的漏洞可能长期潜伏。用户只需保持系统更新,合理配置安全策略,就能有效降低风险。正如作者所言:“这更像是一次安全闹钟,而不是末日警钟。” ## 小结 - **趋势**:Linux 漏洞增多是用户增长的自然结果。 - **应对**:内核社区反应积极,补丁及时。 - **建议**:保持更新,无需恐慌。
## 从《华尔街日报》到独立创业:一位科技记者的AI生活实验 资深科技记者乔安娜·斯特恩(Joanna Stern)刚刚完成了职业生涯的一次重大转变:她离开了《华尔街日报》高级个人科技专栏作家的职位,创办了自己的媒体公司 **New Things**。而伴随这家新公司诞生的,还有她关于人工智能的新书 **《I Am Not a Robot》**(我不是机器人),已于5月12日出版。 在本书的创作过程中,斯特恩进行了一项大胆的实验:**整整一年时间,她让AI渗透进自己生活的每一个角落**。从智能家居到写作辅助,从日程管理到社交互动,她几乎全面“外包”给了AI系统。这个沉浸式实验让她对AI的真实能力有了远超普通人的理解。 ### 人形机器人:远未成熟的“未来” 斯特恩在书中直言,当前市场上最受热捧的AI产品——尤其是人形机器人——**距离实用还有相当长的路要走**。尽管科技巨头和初创公司不断展示机器人跳舞、跑步甚至做家务的演示视频,但斯特恩发现,这些机器人在真实家庭环境中几乎无法稳定完成最基本的任务。她认为,人形机器人的成熟可能需要“非常长的时间”,当前阶段更像是技术Demo而非消费品。 ### 可穿戴AI:潜藏的“杀手级应用” 不过,斯特恩并非全盘悲观。在完成一年的AI生活实验后,她对某些特定类型的AI反而更加乐观。她特别提到**可穿戴AI设备**,认为这类产品可能真正找到那个让用户愿意接受所有技术权衡的“杀手级应用”。与手机上的AI助手不同,可穿戴设备能够更自然地融入日常行为——比如智能眼镜提供实时信息叠加、AI耳机进行环境语音分析——这些场景可能让AI从“工具”变成“身体的一部分”,从而改变人机交互的范式。 ### 用AI打造媒体新物种 斯特恩的新公司New Things本身也是AI应用的试验场。她透露,自己正在**利用AI工具来加速媒体公司的启动**,包括内容生成、数据分析、甚至部分编辑流程。与此同时,她选择与NBC合作,以确保内容能触达主流大众,同时将更多精力投入到**YouTube算法**的运营上——这代表了她对传统媒体分发模式的告别。 ### 行业启示:AI的“落地鸿沟” 斯特恩的经历折射出当前AI行业的一个核心矛盾:**技术炒作与实际落地之间存在巨大鸿沟**。一方面,大模型在文本、图像生成等领域展现出惊人能力;另一方面,在物理世界交互、长期自主决策等场景中,AI仍然笨拙得令人失望。她的实验提醒我们,AI的进步并非线性均匀的——某些领域可能很快迎来突破,而另一些则需要更长的耐心。 对于普通用户和投资者而言,斯特恩的结论或许值得深思:**不要被炫酷的机器人演示迷惑,但也不要忽视那些看似不起眼的可穿戴设备**。真正的AI革命,可能不会以人形机器人的形态走进家门,而是悄然嵌入我们每天佩戴的眼镜、耳机和手表之中。
智能家居的吸引力在于它能带来便利,但有些设备可能不会立刻让人想到去自动化。我亲身体验了5个不那么“显眼”却极其实用的家居设备自动化方案,包括自动开关的窗帘、根据湿度调节的浴室风扇、感应式垃圾桶、自动喂食器以及智能插座控制的灯具。这些改造不仅省去了日常琐碎操作,还让家居运行更流畅。例如,通过传感器和定时器,窗帘能根据日出日落自动开合;浴室风扇在湿度超标时自动启动,防止霉菌滋生。文章还分享了设置技巧和注意事项,比如选择兼容的智能平台、确保网络覆盖稳定,以及从低成本设备(如智能插座)入手逐步扩展。整体来看,自动化这些“非主流”设备能显著提升生活品质,而投入并不高。
AI 计算需求的爆发让数据中心运营商将目光投向了太空,但一个关键瓶颈是:没有足够的火箭将数据中心送入轨道。Cowboy Space Corporation 选择了一条更激进的路——自己造火箭。 该公司今日宣布完成 **2.75 亿美元** 的 B 轮融资,投后估值达 **20 亿美元**,由 Index Ventures 领投,Breakthrough Energy Ventures、Construct Capital、IVP 和 SAIC 跟投。CEO Baiju Bhatt(Robinhood 联合创始人)透露,**首枚火箭预计在 2028 年底前试飞**。 ## 从“太空发电”到“太空算力”的转身 Cowboy Space 最初名为 Aetherflux,成立于 2024 年,原计划在太空收集太阳能并传回地球。但随着 AI 算力需求飙升,团队发现将电力就地用于太空数据中心更具商业前景。然而,当 Bhatt 与多家火箭供应商洽谈后,结论令人沮丧:**现有运力根本无法支撑规模化部署**,即便 SpaceX 的 Starship 或 Blue Origin 的 New Glenn 未来可用,其商业排期也排到了 2030 年代之后。 > “我们不得不自己建立火箭计划。”——Baiju Bhatt ## 行业困境:火箭缺口与成本鸿沟 当前太空数据中心赛道玩家面临共同难题: - **运力不足**:SpaceX 的 Starship 预计本周末进行第 12 次试飞,但距离商业化运营仍需数年,且需优先服务星链业务;Blue Origin 的 New Glenn 在第三次发射中未能部署卫星。 - **成本高昂**:即便有可重复使用火箭,发射成本仍远高于地面数据中心建设。 - **时间错配**:大多数方案(如 Google Suncatcher)将目标定在 **2035 年左右**,而 Starcloud 则先行切入空间传感器边缘处理任务。 Cowboy Space 的“第三条路”——垂直整合火箭制造——旨在打破这一僵局。Bhatt 认为,只有自建运力才能控制单位经济性,使太空数据中心在成本上与地面方案竞争。 ## 资本押注:2.75 亿美元只是“首付” 本轮融资被 Bhatt 称为“首付”,意味着后续仍需大量资金。投资方包括 Bill Gates 旗下的 Breakthrough Energy Ventures,表明太空基础设施的长期价值已获顶级资本认可。Cowboy Space 计划用这笔资金组建团队、建设测试设施并推进火箭设计。 ## 前景展望 如果 Cowboy Space 能在 2028 年前实现火箭首飞,它将率先打通“太空算力”的物流通道。但挑战同样巨大:火箭研发是资金密集、技术门槛极高的领域,新玩家失败率不低。同时,监管、在轨运维、散热等问题也待解决。 一个有趣的反问:当 AI 对算力的渴求最终推动人类在太空建立数据中心时,**火箭公司本身是否会成为比数据中心更稀缺、更核心的资产?** Cowboy Space 的赌注正在于此。
## 护城河:不是芯片,而是 CUDA 当谷歌内部流出“我们没有护城河”的备忘录时,整个硅谷都在焦虑。但有一家公司稳坐钓鱼台——英伟达。CEO 黄仁勋曾将其称为最珍贵的“宝藏”,而这个宝藏并非硬件,而是 **CUDA**。 ### CUDA 是什么? CUDA 是 Compute Unified Device Architecture 的缩写,但如今没人会去拼写全称。它的核心能力是 **并行计算**。以一个简单的乘法表为例:9×9 共 81 个运算,单核 CPU 只能逐一执行;而拥有 9 个核心的 GPU 可以同时计算不同列,速度提升 9 倍。更聪明的优化还能识别交换律(7×9 = 9×7),减少重复计算,将 81 次操作降至 45 次。当一次训练成本高达一亿美元时,每一次优化都意义重大。 ### 从游戏到 AI 的跨界 英伟达的 GPU 最初为游戏图形渲染而生。2000 年代初,斯坦福博士生 Ian Buck(也是游戏玩家)意识到这种架构可用于通用高性能计算。他创建了编程语言 Brook,随后被英伟达招入麾下,与 John Nickolls 共同主导了 CUDA 的开发。可以说,没有 CUDA,就没有今天的大模型训练。 ### 真正的壁垒 硬件可以被追赶甚至超越,但 CUDA 生态是英伟达最深的护城河。开发者、框架、工具链都已围绕 CUDA 构建,迁移成本极高。即便 DeepSeek 等开源模型一度引发恐慌,但最终证明,**开源模型并未超越闭源模型**,而英伟达的统治地位依然稳固。 ## 小结 英伟达表面上是芯片公司,但 CUDA 揭示其本质是软件公司。硬件是城墙,软件才是护城河里的水。当其他公司在硬件上追赶时,CUDA 生态让英伟达始终领先一步。
对于像我这样的编剧——以及所有求职者——AI零工已经成为新的“端盘子”。八个月内,我在五个不同平台上完成了20个这样的“灵魂压榨”合同。情况很糟。 我的平台名字是 ri611,或者 h924092b12ee797f,取决于谁在付我钱。我是一名AI训练师。我评估聊天机器人的语气是否自然、平淡、做作或烦人;识别家具图片中的模式;搜索陌生人的合影,然后逐一将他们从肖像中移除;浏览怪异视频,标注和记录狗叫的时刻、陌生人经过窗边的瞬间、气球爆裂的精确毫秒。我还生成动漫性爱场景、斩首年轻女性,诱导大语言模型给出用家用物品制造炸弹的配方,并生成重演1月6日国会山骚乱的邀请——这些都是红队测试的一部分,旨在检验安全措施并探查漏洞。 我为Mercor、Outlier、Task-ify、Turing、Handshake、Micro1等公司工作。在我的“另一份”职业中,我是一名好莱坞编剧和剧集主管。我制作黄金时段电视剧,通常讲述一个中产阶级白人女性遭遇人生最糟糕一天的故事,再配以接地气的警察干预来增加悬念。我的剧集在Paramount、Hulu和BBC播出——我建议你还是别看为好。 2023年,好莱坞罢工,部分是为了阻止制片厂用AI取代编剧和演员。罢工持续近五个月后,娱乐业的旋转木马再也没能回到原来的速度。2025年初——当又一位制片人拖欠我为创作电视剧应得的六位数支票时——我开始寻找办法维持生计。AI训练并不在我的雷达上,直到一个非官方的美国编剧工会Facebook群里的一条评论引起了我的注意。群里满是失业编剧的帖子,他们为债务所困、为收入恐慌,乞求建议和生存策略:“我压力山大、焦虑不安……只是想喘口气”……“寻找食物银行/食品储藏室信息”……“嘿,你们都在做什么兼职?” “我一直在为一家叫Mercor的AI训练公司工作,”一个女人在评论中写道。“他们给编剧开每小时150美元。钱来得容易。”我当时正需要些容易钱。我也需要现金付房租、买食物、付给Maggie——那个仍然收我150美元固定费用帮我打扫公寓的人类,这项技能AI还没学会。能有多难呢?
大型语言模型在生成过程中会缓存所有先前计算的键值对,即KV缓存。随着序列长度线性增长,KV缓存成为服务部署的主要内存瓶颈。将KV缓存量化到更少的比特位可以降低这一成本,但现有的量化器对所有注意力头分配相同的位宽,忽略了不同头的重要性差异。一个自然的想法是给重要头分配更多比特,其余头分配较少比特。然而,研究表明这种混合精度分配存在一个隐藏陷阱:每个量化器遵循不同的失真曲线 D(b)=alpha*beta^{-b},而衰减率 beta 在不同量化器设计间从 3.6 到 5.3 不等。将一个量化器的失真模型应用于另一个,会颠倒分配顺序,导致性能甚至不如均匀量化。 为解决这一问题,研究者提出了 **RateQuant** 方法。RateQuant 首先从一个小型校准集上为每个量化器拟合失真模型,然后通过率失真理论中的反向注水法,以闭式解形式解决位分配问题。实验表明,在 Qwen3-8B 模型上,平均位宽 2.5 时,校准后的 RateQuant 将 KIVI 的困惑度从 49.3 降低到 14.9(降低 70%),并将 QuaRot 的困惑度提升了 6.6。整个校准过程在单个 GPU 上仅需 1.6 秒,推理时零额外开销。 ## 核心贡献 - **识别失真模型不匹配问题**:首次指出混合精度量化中,不同量化器的失真曲线差异会导致位分配策略失效。 - **提出 RateQuant 框架**:基于率失真理论,通过反向注水法实现最优位分配,无需额外推理开销。 - **显著性能提升**:在多种模型和量化器上验证,PPL 大幅降低,且校准过程高效。 ## 技术细节 RateQuant 的核心在于两步:首先,对每个量化器,从少量校准数据(约 128 个序列)中拟合出其失真模型参数 alpha 和 beta。然后,在给定平均位宽约束下,利用率失真理论中的反向注水法求解每个头的位宽分配,使得总失真最小。该方法避免了传统混合精度量化中位宽搜索的昂贵成本,且分配方案具有闭式解。 ## 实验验证 在 LLaMA-2/3、Qwen2.5/3 等系列模型上,RateQuant 在多种位宽设置下均优于均匀量化及现有混合精度方法。例如,在 Qwen3-8B 上,2.5 位平均位宽时,KIVI 的 PPL 从 49.3 降至 14.9,降幅达 70%。同时,RateQuant 与 QuaRot 结合,进一步提升了后者的性能。 ## 行业意义 KV 缓存量化的目标是减少大模型推理的内存占用,从而支持更长的上下文和更大的批量。RateQuant 通过理论指导的混合精度分配,在保持模型质量的同时更高效地压缩缓存。这一方法有望应用于实际推理系统,降低部署成本。此外,其零额外推理开销和极短的校准时间,使得它易于集成到现有量化流程中。
### 背景:长上下文推理的“内存墙”困境 大型语言模型(LLM)在处理长文本时,Key-Value(KV)缓存的内存占用随序列长度线性增长,成为性能瓶颈。现有压缩方法依赖启发式规则:**启发式预算分配**基于统计先验而非任务目标,导致资源错配;**启发式Token选择**则依赖查询-键交互或静态归纳偏置(如注意力下沉)。这些方法缺乏对任务目标的端到端优化,限制了压缩效率。 ### LKV:将KV压缩转化为可微分优化问题 来自中国科学院等机构的研究者提出 **LKV(Learned KV Eviction)**,将KV缓存淘汰建模为端到端可微优化问题。LKV包含两个核心组件: - **LKV-H**:学习任务优化的全局预算,为每个注意力头动态分配保留的KV槽位数,而非使用统一的压缩率。 - **LKV-T**:在不实例化注意力矩阵的前提下,推导出每个Token的内在重要性分数,实现独立的Token筛选。 这一设计绕过了所有启发式代理,严格将压缩行为与任务目标对齐。 ### 关键结果:15%缓存保留即可实现近无损性能 在 **LongBench** 和 **RULER** 两个长上下文基准测试中,LKV在高压缩率下均达到当前最优水平。特别地,在LongBench上,**仅保留15%的KV缓存**即可实现近无损性能。分析表明,**学习到的预算分配**是保真度的主导因素,数据驱动的分配策略是克服手工启发式局限性的关键。 ### 行业意义:从“手工调参”到“数据驱动”的范式转变 LKV的工作展示了将压缩策略本身作为可学习模块的潜力。传统方法中,工程师需要针对不同模型和任务手工调整压缩率或选择策略,而LKV通过端到端学习自动适应任务需求。这不仅提升了压缩效率,也为未来LLM推理优化提供了新思路:**让模型学会如何“遗忘”**,而非依赖固定的规则。 随着长上下文应用(如文档分析、多轮对话、代码库理解)的普及,KV缓存管理已成为LLM部署的关键挑战。LKV的端到端学习框架为突破内存瓶颈提供了可扩展的解决方案,值得关注其后续在实际推理引擎中的集成与落地。
## 气候风险加剧:保险业亟待长期战略 根据联合国减灾办公室(UNDRR)2025年报告,自然灾害的年均损失已从1970-2000年间的700-800亿美元飙升至2001-2020年间的1800-2000亿美元。面对这一趋势,保险行业亟需突破传统的一年期监管框架(如Solvency II),制定更具前瞻性的中长期策略。在此背景下,一项发表于arXiv的新研究提出了一种基于**条件生成对抗网络(Conditional GAN)** 的AI框架,专门用于生成未来气候指数的时空轨迹,为风险管理与保险精算提供支持。 ## SwiGAN模型:聚焦土壤湿度与干旱风险 该研究以法国为重点区域,选取**土壤湿度指数(SWI)** 作为干旱严重程度的关键指标。在法国自然灾害保险体系中,干旱导致的赔偿约占全部赔偿额的30%。研究人员开发的**SwiGAN模型**能够模拟至2050年的干旱传播模式,生成逼真的SWI地图序列,从而揭示气候变化情景下的干旱动态。 SwiGAN的核心技术是**Wasserstein GAN**,它通过条件化生成器和判别器,学习历史气候数据与未来情景之间的映射关系。与传统的物理模型相比,GAN方法能以较低的计算成本生成大量高分辨率情景,且能够捕捉极端事件的非线性特征。 ## 应用价值与可扩展性 SwiGAN的产出可直接用于保险公司的**风险定价、资本规划**以及**再保险策略设计**。例如,保险公司可根据生成的干旱情景调整保费费率,或评估不同区域在2050年前的累积赔付风险。此外,研究团队强调,该框架具有通用性,可推广至其他气候灾害(如洪水、风暴)以及更广泛的**经济情景生成(Economic Scenario Generation)** 领域。 ## 行业意义与未来方向 这项研究标志着AI在气候风险管理领域的又一次重要突破。随着气候变化加剧,传统的历史数据推演方法已难以捕捉未来风险的非平稳性。GAN等生成式模型的出现,为保险业提供了“以数据驱动模拟未来”的新工具。不过,研究也指出模型的局限性:当前仅针对法国特定区域,且依赖高质量的气象观测数据。未来工作将探索多灾害耦合情景以及全球尺度的应用。 总体而言,SwiGAN展示了生成式AI在**气候金融交叉领域**的巨大潜力,为保险业应对“黑天鹅”事件提供了可量化的决策支持。