AI 资讯

每日聚合最新人工智能动态

1761

FoLoRA：用广义瑞利商优化实现基础模型微调与能力保持的平衡

新上线

## 微调基础模型的两难困境大型基础模型（如LLaMA、GPT等）在预训练阶段积累了广泛的能力，但在针对特定下游任务进行微调时，往往会**遗忘**预训练阶段学到的非目标能力。例如，一个擅长数学推理的模型，经过指令微调后可能数学能力下降。现有方法通过特殊初始化或固定约束来缓解遗忘，但无法在训练过程中动态调节**适配与保持**的权衡。 ## FoLoRA：基于广义瑞利商的遗忘感知优化框架来自德克萨斯大学奥斯汀分校和微软的研究团队提出**FoLoRA（Foundation Preserving LoRA）**，这是一种遗忘感知优化框架，核心创新在于将**广义瑞利商**引入微调过程。FoLoRA通过以下步骤实现适配与保持的平衡： 1. **定义两个关键指标**： - **遗忘惩罚**：基于预训练代理激活（通过从预训练模型采样构建的校准数据计算）衡量更新方向对非目标能力的损害； - **任务效用**：基于下游任务激活衡量更新方向对目标任务的贡献。 2. **广义瑞利商评分**：将每个更新方向的得分定义为“任务效用/遗忘惩罚”，即每单位遗忘惩罚带来的任务效用。得分高的方向表示在遗忘较少的情况下提升目标任务。 3. **谱坐标系统与门控Adam更新**：利用广义瑞利商构建谱坐标系统，对低效用-高惩罚的方向进行衰减（即门控），从而在Adam优化器中动态调整更新强度。 ## 创新校准数据构建 FoLoRA另一个亮点是**预训练代理校准数据的生成**：不依赖单一代理数据集，而是从预训练模型本身采样。这种方法更具通用性，避免了代理数据集偏差，同时降低了对外部数据的依赖。 ## 实验效果在**数学、代码和指令跟随**三个适配场景下的实验表明，FoLoRA在保持非目标能力（如通用知识、推理）方面显著优于现有基线方法（如LoRA、DARE等），同时目标任务性能也有提升。例如，在数学适配中，FoLoRA在GSM8K上保持高准确率的同时，代码生成能力下降幅度最小。 ## 行业意义 FoLoRA为**基础模型持续学习**和**多能力平衡**提供了新思路。随着模型在垂直领域（如医疗、法律）的广泛应用，如何在不破坏通用能力的前提下进行高效适配，成为关键挑战。FoLoRA的**动态门控机制**和**代理数据采样策略**具有实用价值，可集成到现有LoRA微调流程中，为开发者提供更安全的微调方案。 ## 小结 FoLoRA通过广义瑞利商优化，将遗忘惩罚和任务效用统一到一个数学框架中，实现了微调过程中适配与保持的精细调节。该方法在多个任务上展示了优越性，有望成为基础模型适配的标准工具之一。未来工作可能包括扩展到更大模型和更多模态，以及探索更高效的代理数据构建方式。

HuggingFace25天前原文

1762

世界模型全面综述：架构、方法论、推理范式与应用全景

新上线

世界模型（World Models）作为学习环境结构与动态的内部模拟器，正成为实现通用人工智能的核心范式。近期一篇由26位学者联合撰写的综述论文（arXiv:2606.00133）系统梳理了这一领域，提出了涵盖**架构、方法论家族、推理策略与应用领域**的四维分类法，填补了长期以来缺乏统一框架的空白。 ## 四维分类法：解构世界模型论文从四个关键维度组织庞大文献： - **架构维度**：涉及表示格式（隐空间/显式状态）、动态公式化（确定/随机）、输入模态（视觉/触觉/语言）、学习范式（监督/自监督/强化）及下游任务类型。 - **方法论家族**：包括**状态空间与循环方法**（如RSSM）、**Transformer基模型**（如DreamerV3中的序列建模）、**扩散生成器**（用于视频预测）、**物理信息网络**（融入先验物理定律）以及**语言增强多模态系统**（如RT-2）。 - **推理策略**：涵盖**基于想象力的规划**（如PlaNet的在线规划）、**隐策略学习**（Dreamer系列）、**反事实推理**（评估“如果…会怎样”）以及**不确定性下的规划**（如MuZero的蒙特卡洛树搜索）。 - **应用领域**：从机器人、自动驾驶、视频预测到科学建模（气候/分子动力学）、医学影像、教育测量和商业金融，横跨十余个场景。 ## 里程碑系统与最新趋势论文追溯了从早期认知科学基础到现代标志性系统的演进：**PlaNet**首次在隐空间进行规划；**Dreamer系列**将学习与规划统一于潜在动态；**MuZero**无需环境模型即可学习规划；**Sora**展示了大模型在视频生成中的世界模拟能力；**Cosmos**与**Genie**则分别聚焦于物理交互与可交互虚拟世界。值得注意的是，**链式思维推理与世界模型想象力的融合**正成为新热点——模型不仅生成未来状态，还能通过多步推理解释其决策逻辑，这对可解释AI与安全对齐至关重要。 ## 挑战与开放问题尽管进展迅猛，领域仍面临三大核心挑战： 1. **累积预测误差**：长时域推演中误差指数级增长，影响规划可靠性。 2. **仿真到现实迁移**：模型在仿真中学习后难以直接部署到真实环境，需解决域适应与鲁棒性问题。 3. **评价碎片化**：缺少统一基准，不同论文使用不同任务与指标，难以横向对比。论文呼吁建立标准化评估协议，并指出未来方向包括**多尺度世界模型**（同时处理秒级与小时级动态）、**语言引导的抽象推理**以及**与大型语言模型深度融合**。 ## 小结世界模型正从单一学术概念演变为AI系统的核心组件。这篇综述不仅为研究者提供了清晰的分类地图，更揭示了**“预测-规划-推理”闭环**如何驱动下一代智能体。随着Sora等生成式模型与MuZero等规划算法的结合，世界模型有望在机器人、自动驾驶和科学发现中释放更大潜力。

HuggingFace25天前原文

1763

BitsMoE：利用谱能量引导MoE大模型量化中的位宽分配

新上线

混合专家（MoE）大语言模型通过稀疏专家激活降低了每token的计算量，但部署时所有专家权重需常驻内存，导致内存压力巨大。现有压缩方法在超低位宽下表现不佳：剪枝不可逆地移除模型容量，而粗粒度量化无法根据专家和权重方向的重要性分配位宽。为此，研究者提出 **BitsMoE**——一种基于谱能量引导的位宽分配框架，专为MoE大模型量化设计。 ## 核心思路：SVD分解与谱感知量化 BitsMoE的核心创新在于利用奇异值分解（SVD）将每个MoE层分解为**共享基**和**专家特定谱因子**。共享基不进行量化，以保留跨专家的通用结构；而专家特定因子则作为细粒度量化单元。这种分解将量化误差限制在专家差异部分，避免了共享信息的损失。 ## 混合精度位宽分配：激活感知整数线性规划为了确定每个量化单元的位宽，BitsMoE将谱级混合精度量化建模为**激活感知重建替代问题**，并通过整数线性规划在固定位预算下最小化估计重建损失。具体而言，该方法利用谱能量（即奇异值）作为重要性指标，能量更高的成分分配更多位宽，从而在压缩比和模型质量间取得最优平衡。 ## 实验结果：2-bit量化下精度提升27.83个百分点在 **Qwen3-30B-A3B-Base** 模型上的测试显示，2-bit量化下BitsMoE相比GPTQ实现了 **12.3倍量化加速**，平均准确率提升 **27.83个百分点**，解码速度提升 **1.76倍**。在多个MoE大模型（如Mixtral 8x7B、DeepSeek-MoE等）的实验中，BitsMoE在超低位宽（2-3 bit）下均显著优于现有方法，同时保持了高吞吐量。 ## 行业意义与展望 MoE模型因其高效推理而成为大模型部署的主流选择，但内存瓶颈制约了其在边缘设备上的应用。BitsMoE通过**谱能量引导的位宽分配**，首次在超低位宽下实现了可接受的精度损失，为MoE大模型的极致压缩提供了新思路。未来，该方法可进一步结合量化感知训练和硬件协同设计，推动大模型在资源受限场景的落地。论文代码和模型已开源，详见项目地址。

HuggingFace25天前原文

1764

DAStatFormer：融合统计特征的混合多分支Transformer，革新分布式声学传感模式识别

新上线

## 快讯：DAS事件分类迎来高效新方案分布式声学传感（DAS）技术利用光纤实现大规模监测，但高维度与复杂的时空模式让事件分类成为难题。现有深度学习方法（如CNN、循环模型及Transformer变体）要么难以捕捉长程依赖，要么处理原始DAS矩阵成本过高。近日，来自IMT Nord Europe的研究团队提出**DAStatFormer**——一种混合多分支Transformer架构，通过紧凑的多域统计特征与门控Transformer网络相结合，在显著降低计算开销的同时实现高达**99.4%** 的分类准确率。 ## 核心创新：从原始信号到统计特征 DAStatFormer的突破在于**避开原始高维信号**，转而从每个通道提取24个经ANOVA筛选的统计属性，覆盖时域、波形和频谱三个域。这一策略将数据规模压缩数个数量级，同时保留关键判别信息。每个域由专用的**逐步注意力分支**和**逐通道注意力分支**处理，最后通过自适应门控机制融合。 ## 性能对比：轻量级下的卓越表现实验基于公开的Φ-OTDR基准数据集和真实场景DAS数据集。结果显示，DAStatFormer不仅准确率接近完美（真实场景近乎100%），且参数量和推理成本远低于DASFormer、DeepViT等模型。这意味着它更适用于**实时、大规模**的DAS监测部署。 ## 行业意义：边缘智能的潜力 DAS在油气管道监控、地震预警、安防等领域应用广泛，但传统方案依赖昂贵计算设备。DAStatFormer的轻量设计为**边缘端部署**打开了可能——只需提取少量统计特征即可完成精准分类，有望推动DAS从实验室走向工程现场。研究团队已开源代码（见论文链接），为后续工作提供了坚实基础。

HuggingFace25天前原文

1765

自动可微非线性张量网络：实现深度神经网络指数级压缩的新路径

新上线

## 研究背景与核心思路深度神经网络（DNN）的规模持续膨胀，给部署在资源受限设备上带来了巨大挑战。传统的模型压缩方法，如低秩分解和剪枝，往往在压缩比和精度之间难以兼顾。近期，来自arXiv的一篇论文（arXiv:2606.00130）提出了一种名为**自动可微非线性张量网络（ADNTNs）** 的框架，旨在通过结构化权重生成实现指数级压缩，同时保持甚至提升模型精度。 ADNTNs 的核心思想是：不直接存储庞大的权重矩阵，而是通过一组**小型核心张量**，利用非线性激活函数和层次化连接（类似张量网络中的树结构）来“生成”大权重。这些核心张量通过**反向模式自动微分（AD）** 进行端到端训练，使其能够适应特定任务。 ## 三大架构与关键特性论文重点研究了三种张量网络架构： - **Tree Tensor Networks (TTNs)**：基础树形结构，通过层级组合构建权重。 - **augmented TTNs (aTTNs)**：在TTN基础上引入**边界纠缠消除单元**，提升表达能力。 - **Multi-scale Entanglement Renormalisation Ansatze (MERA)**：多尺度纠缠重整化，更擅长捕捉长程依赖。这些架构支持非线性激活、任务感知目标、批处理以及硬件感知的执行调度。作者特别指出，ADNTNs 并非简单地“免费”计算，自动微分并不能消除大中间张量的存储成本或优化收缩顺序的难题。 ## 实验结果与性能亮点研究在 **AlexNet** 和 **VGG-16** 的多个层上进行了广泛模拟。结果显示，每层压缩比从约 **2000倍到77000倍** 不等，而模型精度通常与稠密基线持平，甚至在VGG-16的若干层中**有所提升**。例如，在VGG-16的某些卷积层上，ADNTN在压缩超过万倍的情况下，分类准确率反而比原始模型高出0.5-1个百分点。这些结果令人鼓舞，但作者也保持审慎，认为这是“鼓励性而非最终结论”。ADNTNs 的真正潜力需要结合**优化算法、收缩调度和部署内核**的协同设计才能充分发挥。 ## 行业影响与未来展望 ADNTNs 为模型压缩提供了一种**数学结构严谨且硬件友好**的新范式。与低秩适应（LoRA）等仅单步更新的方法相比，ADNTN通过多层非线性层次结构实现了更强的表达能力。未来，该技术有望在移动端AI、边缘计算和大型语言模型（LLM）的部署中发挥重要作用，尤其是在需要极高压缩比且对精度敏感的场景。不过，目前的工作主要局限于卷积层，将其扩展到Transformer架构（如注意力权重）仍是开放问题。此外，自动微分带来的额外计算开销也需要进一步优化。

HuggingFace25天前原文

1766

Grokers：在类型化知识图谱上实现自下而上的归纳理解与写入时智能

精选

## 颠覆RAG范式：Grokers如何将AI理解成本从查询时转移到写入时传统检索增强生成（RAG）系统在每次查询时都需要调用大语言模型（LLM）来理解上下文，成本高昂且难以复用。而一篇新论文提出的 **Grokers** 架构，通过将智能从查询时转移到写入时，有望彻底改变这一局面。 ### 核心思想：写入时智能 Grokers 的核心是一种自下而上的归纳遍历架构，专门用于构建类型化知识图谱的持久、结构化理解。与 RAG 在每次查询时支付完整的理解成本不同，Grokers 在数据**写入**时（即数据进入图谱时）就完成分析。具体来说，自主的 **Groker 代理** 会分析类型化流图中的节点，通过受控的 LLM 调用提取结构化属性，然后沿依赖关系自下而上地归纳组合这些理解，最终将丰富的类型化属性写回图谱。此后所有查询都能零额外 LLM 成本地使用这些预计算的理解。 ### 三个形式化定理支撑论文提出了三个关键定理来保证 Grokers 的有效性： 1. **字节同一性定理**：通过事务性维护的反规范化索引，在语义未发生变化时，LLM 上下文块在不同轮次间是字节相同的，这使得 KV 缓存命中率接近 100%，大幅降低推理延迟。 2. **累积单调性定理**：在受控知识库增长协议下，无需 LLM 调用即可解决交互的比例随着交互次数的增加而单调不减，意味着系统越用越“聪明”，LLM 调用越来越少。 3. **双遍历序定理**：明确指出了在依赖有向无环图上，自上而下生成和自下而上理解是各自任务唯一正确的遍历顺序，且两者组合可形成一个完整的生成-理解循环。 ### 确定性搜索替代嵌入 Grokers 还提出了一种基于同义词缓存协议的确定性替代方案，替代传统的嵌入向量语义搜索。对于有限词汇域，其 LLM 回退率可收敛到零，这意味着在特定领域应用中，系统可以完全摆脱对 LLM 实时推理的依赖。 ### 实用价值与开源实现论文作者 Gregory Magarshak 已在开源项目 **Qbix / Safebox / Safebots** 中提供了参考实现。该架构特别适合需要频繁查询但数据变更不频繁的知识密集型场景，如企业知识库、法律文档分析、医疗记录推理等。通过将理解成本前置，Grokers 有望将大规模知识图谱的推理成本降低几个数量级。 ### 行业意义 Grokers 的出现挑战了当前 RAG 系统“每次查询都重新理解”的固有思路。如果其理论在实践中得到验证，可能会推动 AI 系统从“每次从头思考”转向“一次理解，多次复用”的新范式，尤其对实时性要求高、推理成本敏感的应用具有重大价值。

Anthropic25天前原文

1767

使用 AgentCore Gateway 与 MCP 客户端构建安全的授权码流程设置

新上线

## 概述在 AI 助手与 MCP（Model Context Protocol）服务器交互的场景中，安全认证是生产环境部署的关键环节。本文介绍如何利用 **Amazon Bedrock AgentCore Gateway** 实现 **OAuth 授权码流程（Authorization Code Flow）**，为 MCP 服务器提供入站身份验证机制。通过本方案，每个 AI 助手请求都将携带来自组织身份提供者（IdP）的有效用户身份令牌，确保请求来源的合法性与可追溯性。 ## 核心架构与实现 ### 1. 为什么选择授权码流程？授权码流程是 OAuth 2.0 中最安全的授权模式之一，特别适合服务端通信场景。与隐式流程相比，它避免了令牌直接暴露在浏览器端，而是通过后端交换授权码获取访问令牌，从而降低令牌泄露风险。在 AI 助手调用 MCP 服务器的上下文中，这一机制能有效防止未授权访问，确保只有经过身份验证的用户才能触发特定操作。 ### 2. 组件与工作流 - **AgentCore Gateway**：作为反向代理和认证网关，拦截所有传入的 MCP 请求，执行令牌验证与转发。 - **MCP 客户端**：AI 助手或应用程序，发起对 MCP 服务器的请求。 - **身份提供者**：组织内部的 OAuth 2.0 服务器（如 Okta、Auth0 或自建服务），负责签发 ID Token 和 Access Token。 - **MCP 服务器**：提供具体功能的后端服务，例如数据库查询、文件处理等。 **典型流程如下：** 1. MCP 客户端向 AgentCore Gateway 发起请求，携带身份提供者签发的 ID Token。 2. Gateway 验证令牌的签名、颁发者（issuer）和受众（audience），确保令牌有效且未过期。 3. 验证通过后，Gateway 将令牌中的用户身份信息（如用户 ID、角色）传递给下游 MCP 服务器。 4. MCP 服务器根据用户身份执行授权逻辑，返回响应。 ### 3. 配置要点 - **令牌验证规则**：在 AgentCore Gateway 中配置 JWT 验证参数，包括 JWKS URI（用于获取公钥）、期望的 `iss` 和 `aud` 值。 - **令牌缓存与刷新**：为避免每次请求都重复验证，Gateway 可缓存已验证的令牌（基于 JWT ID `jti`），并支持令牌刷新机制。 - **错误处理**：当令牌无效或过期时，Gateway 应返回标准 HTTP 401 状态码，并附带错误描述，方便客户端调试。 ## 场景价值该方案适用于企业级 AI 应用，例如： - **内部知识库助手**：仅允许特定部门的员工通过认证后查询敏感数据。 - **自动化工作流**：不同用户角色触发不同的 MCP 服务器操作，实现细粒度访问控制。 - **审计与合规**：所有请求都关联到具体用户身份，便于日志审计和问题追踪。 ## 小结通过 AgentCore Gateway 集成 OAuth 授权码流程，开发者可以为 MCP 服务器快速添加身份验证层，无需修改现有后端代码。这一模式不仅提升了安全性，还保持了与标准 OAuth 生态的兼容性，为 AI 助手的生产级部署提供了可靠的基础设施。

AWS ML25天前原文

1768

花190美元组了个Mesh Wi-Fi系统，轻松跑通12路4K视频流

新上线

如果你还在为家中Wi-Fi死角烦恼，或者觉得高端Mesh路由器价格高不可攀，那么**Tenda BE5100三件套Mesh Wi-Fi系统**可能会让你眼前一亮。这款仅售**190美元**（约合人民币1300元）的套装，不仅支持最新的**Wi-Fi 7**标准，还能同时处理**12路4K视频流**而毫无卡顿。 ## 性能实测：12路4K视频流无压力在ZDNET的实测中，这套系统被部署在一个约200平方米的复式住宅内。通过同时播放12路4K超高清视频（包括YouTube、Netflix和本地NAS流媒体），所有节点均未出现缓冲或掉线。测试工具显示，即使在距离主节点最远的角落，信号强度仍保持在-65dBm以上，延迟稳定在10ms以内。 ## Wi-Fi 7加持，性价比突出 BE5100支持Wi-Fi 7（802.11be）的320MHz频宽和4K QAM调制，理论速率可达5.1Gbps。虽然目前Wi-Fi 7终端尚不普及，但向下兼容Wi-Fi 6/6E，且为未来升级预留了空间。相比同类Wi-Fi 7 Mesh系统（如TP-Link Deco BE95售价约600美元），Tenda这套方案价格仅为三分之一，堪称“平民版”入门之选。 ## 设置与功能：App专业，硬件质感一般配套的**Tenda App**提供了从网络诊断、信号覆盖图到家长控制等专业级功能。用户只需扫描二维码即可完成初始配置，整个过程不到5分钟。不过，路由器外壳采用全塑料材质，手感略显廉价。另外，单独购买扩展节点的价格是100美元，整套购买显然更划算。 ## 行业背景：Mesh Wi-Fi普及加速随着远程办公、4K/8K流媒体和智能家居设备的爆发，传统单路由器已难以满足全屋覆盖需求。Mesh Wi-Fi系统通过多节点协作实现无缝漫游，成为中大型住宅的刚需。而**Wi-Fi 7**的商用化进一步推动了性能升级——更高的带宽、更低的延迟，使得多设备并发场景（如云游戏、VR）成为可能。Tenda BE5100的出现，意味着Wi-Fi 7 Mesh系统正在从高端市场向主流价位渗透。 ## 小结如果你预算有限，但又想体验Wi-Fi 7的潜力，Tenda BE5100是一个值得考虑的选择。它用不到200美元的价格，提供了足以覆盖大户型、支撑重度流媒体使用的性能。当然，对质感有要求的用户可能需要权衡其塑料外壳，但在这个价位上，稳定性和速度才是真正的王牌。

ZDNet AI26天前原文

1769

我亲手打造了一台80年代科幻片风格的DIY赛博终端，它还能做这些酷事

新上线

## 从《神经漫游者》到桌面：我的赛博终端构建之旅赛博终端（Cyberdeck）这个名词，最早源自威廉·吉布森1984年的科幻小说《神经漫游者》。如今，它已成为DIY社区中最热门的复古未来主义项目之一。我决定亲自动手，用树莓派打造一台属于自己的便携计算机，体验一把赛博朋克的感觉。 ### 为什么选择赛博终端？赛博终端的魅力在于它的自由度和个性化。不同于市面上千篇一律的笔记本或平板，赛博终端完全由你定义：外壳、键盘、屏幕、电池，甚至是操作系统和软件。它不追求性能极致，而是强调独特的视觉风格和功能定制。对于喜欢动手、热爱复古科技的人来说，建造一台赛博终端本身就是一种乐趣。 ### 我的构建过程我选择了一台**树莓派4B**作为核心，搭配5英寸HDMI触摸屏和机械键盘模块。外壳则用3D打印制作，参考了经典的“砖头”造型，并加入了LED灯带和复古按钮。电源方面，我集成了18650电池组，确保户外使用时的续航。关键步骤包括： - **硬件组装**：将树莓派、屏幕、键盘和电池通过定制线缆连接，固定在外壳内。 - **系统配置**：安装Raspberry Pi OS，并优化触控和键盘映射。 - **软件定制**：添加终端模拟器、文本编辑器、以及一些复古游戏模拟器。整个过程耗时约两周，其中调试驱动和电源管理最费时间。但完成后的成就感无可比拟。 ### 它能做什么？我的赛博终端并非只是摆设。它实际具备以下能力： - **便携编程**：在户外或咖啡厅里，它是一台全功能的Linux开发机。 - **复古游戏**：通过模拟器运行FC、GB等经典游戏。 - **网络工具**：可作为便携式渗透测试设备（配合Kali Linux）。 - **电子阅读**：用终端阅读纯文本或Markdown文档。 - **展示与社交**：带到黑客马拉松或科技聚会中，绝对是话题中心。当然，它的性能无法与主流笔记本相比，但**低功耗、可定制性**和**独特外观**是它的核心价值。 ### 赛博终端热潮背后的思考这股DIY风潮反映了人们对标准化消费电子产品的厌倦。在笔记本、手机几乎同质化的今天，赛博终端提供了一种“反叛”的可能：你可以掌控每一个细节，赋予设备个性。同时，它也是学习硬件和编程的绝佳实践项目。如果你不想从零开始，市面上已有一些套件或成品可供选择，但真正的乐趣在于亲手打造。正如我在构建过程中感受到的：**过程比结果更重要**。未来，我计划升级到树莓派5，并加入4G模块，让它成为真正随时在线的“口袋电脑”。赛博终端的可能性，只受限于你的想象力。

ZDNet AI26天前原文

1770

Codex 正成为每个人的生产力工具：OpenAI 发布《知识工作新时代》报告

精选

OpenAI 于 2026 年 6 月 2 日发布最新报告《知识工作新时代》，揭示其 AI 平台 **Codex** 正从编程工具演变为覆盖全职业的生产力助手。报告显示，Codex 目前周活跃用户已突破 **500 万**，自 2 月桌面应用上线以来增长超过 **6 倍**。虽然开发者仍是最大用户群体，但知识工作者占比已达 **20%**，且增速是开发者的 **3 倍以上**，标志着更广泛的应用转型正在发生。 ## 知识工作者的典型使用场景知识工作者主要利用 Codex 创建报告、电子表格、演示文稿、合同等工作成果。此外，**研究、数据分析、工作流自动化** 以及构建原本需要工程支持的轻量级工具，成为增长最快的任务类别。用户越来越多地同时运行多项 Codex 任务，例如并行处理数据调查、材料起草和流程自动化，这种 **多任务并行能力** 显著提升了工作节奏。 ## 对职业发展的潜在影响 OpenAI 在报告中指出，Codex 可帮助人们承担更具雄心的项目，从而 **扩大个人职责范围**，并可能加速职业晋升。通过减少信息查找、跨工具协调、审批流程等现代工作中的摩擦，Codex 让知识工作者能够专注于更高价值的工作。 ## 行业趋势与展望报告强调，Codex 的普及正在重塑 AI 对工作的长期影响。从金融到医疗，各行业用户均利用 Codex 降低工作阻力，提升产出质量。OpenAI 表示，这一趋势预示着 AI 将从辅助工具转变为 **核心生产力基础设施**，推动知识工作进入新纪元。更多细节可查阅完整报告。

OpenAI26天前原文

1771

家得宝促销：买Ryobi电池套装，免费送一把电动工具——编辑强烈推荐

新上线

**家得宝（Home Depot）** 正在推出一项极具吸引力的夏季促销活动：购买 **Ryobi One+ 18V锂电启动套装**（包含一块2.0Ah电池、一块4.0Ah电池和一个充电器，售价99美元），即可 **免费获赠一把指定Ryobi电动工具**，整体节省高达 **129美元**（折扣率57%）。 ## 活动核心信息 - **促销商品**：Ryobi One+ 18V锂电启动套装（型号可能因库存而异） - **售价**：99美元 - **赠品**：从指定列表中任选一把Ryobi电动工具，免费赠送 - **优惠力度**：相比原价节省约129美元 - **活动期限**：截至2026年6月1日（或售完即止） ## 为什么值得入手对于DIY爱好者和家庭用户来说，Ryobi One+生态系统提供了丰富的工具选择，且电池通用。这套组合包含一大一小两块电池，适合不同工作强度的需求：2.0Ah电池轻便，适合钻孔、拧螺丝等轻量任务；4.0Ah电池续航更长，适合电锯、吹风机等高耗电设备。免费赠送的工具则可以根据实际需要选择，如电钻、圆锯、打磨机等，相当于将总成本摊薄至不到100美元，性价比极高。 ## 编辑点评 ZDNET编辑评价该促销为“编辑之选”，并给出了5/5的评分。主要优势在于：1）电池套装本身是刚需；2）免费工具相当于白送；3）Ryobi品牌在性价比和工具种类方面口碑良好。需要注意的是，免费工具的选择范围可能有限，建议购买前确认可选项。 ## 购买建议如果你正在筹划夏季庭院维护或家居改造项目，这套组合可以一次性解决动力源和工具需求。建议优先选择平时售价较高的工具作为赠品，以最大化节省金额。

ZDNet AI26天前原文

1772

体验最新MX Linux版本：老旧PC焕然一新，性能飙升

新上线

MX Linux 近日发布了其最新版本，其中包含针对现代硬件的优化，让老旧 PC 也能焕发新生。作为一名长期关注 Linux 发行版的用户，我第一时间在主力机上安装了 **MX-25.2_Xfce_ahs_x64** 版本，体验令人印象深刻。 ## 版本选择：AHS 专为现代硬件打造 MX Linux 提供了多种版本，包括标准版、KDE 版、Fluxbox 版以及树莓派版。其中，**AHS（Advanced Hardware Support）版本** 集成了 **7.07 内核**、最新显卡驱动和固件，特别适合 1-3 年内的新硬件。它使用 **Liquorix 内核**（针对高性能音视频优化），并预装 **DKMS 包** 确保现代 GPU 和 Wi-Fi 芯片开箱即用。此外，**MX Nvidia 安装程序** 让驱动安装变得异常简单。 ## 实际体验：流畅与稳定兼得在我的中端 PC 上，MX Linux AHS 的 Xfce 桌面环境响应迅速，**HiDPI 缩放**（125% 和 150%）显示清晰锐利。无论是日常办公、网页浏览还是轻度游戏，系统都表现出色。得益于 Debian Stable 的根基，MX Linux 保持了极高的稳定性，几乎没有遇到崩溃或驱动问题。 ## 与竞品对比：速度与稳定的平衡相比追求极致速度的 CachyOS，MX Linux 更注重稳定性和易用性。它的 **Xfce 桌面** 轻量高效，资源占用低，非常适合老旧设备升级。如果你正在寻找一个既能利用新硬件特性，又不牺牲稳定性的系统，MX Linux AHS 无疑是明智之选。 ## 小结 MX Linux AHS 版本是 Linux 社区针对现代硬件的一次成功优化。它免费、开源，且安装简便，能让任何 PC 焕然一新。无论你是 Linux 新手还是老手，都值得一试。

ZDNet AI26天前原文

1773

索尼 Bravia 9 II vs. Bravia 9：我对比了两款电视，True RGB 是重大升级

新上线

索尼近日发布了新一代旗舰电视 **Bravia 9 II True RGB**，同时推出的还有 **Bravia 7 II** 及多款更新机型。对于正在考虑升级主电视或添置第二屏幕的用户来说，现在或许是入手的良机——无论你是索尼的忠实粉丝，还是只想淘个好价。 ## Bravia 9 II 的核心升级：True RGB 技术 Bravia 9 II 的最大亮点是采用了 **True RGB** 屏幕技术。与上一代 Bravia 9 的 Mini LED 面板不同，True RGB 通过独立控制红、绿、蓝三原色发光，实现了更广的色域、更精确的色彩还原和更高的亮度。这意味着在观看 HDR 内容时，色彩过渡更加自然，高光细节更加丰富，暗部表现也更纯净。 ## 与 Bravia 9 的对比：值得升级吗？从参数上看，Bravia 9 II 在色彩覆盖率和峰值亮度上明显领先。上一代 Bravia 9 的 Mini LED 虽然已经表现出色，但在处理复杂光线场景时仍会出现轻微的光晕现象。而 True RGB 技术从根本上解决了这个问题，每个像素都能独立发光，控光精度达到像素级。对于追求极致画质的影音爱好者，尤其是经常观看 4K HDR 电影或玩高帧率游戏的用户，Bravia 9 II 的升级是显而易见的。不过，如果你的 Bravia 9 仍在良好服役且对当前画质满意，那么升级的必要性可能不大——毕竟新一代机型的价格预计会更高。 ## 其他更新：Bravia 7 II 与系统优化除了旗舰型号，索尼还更新了 **Bravia 7 II**，同样搭载了改进的面板技术和更智能的画质算法。全系机型预计将搭载更新的 **Google TV** 系统，提供更流畅的界面和更丰富的流媒体集成。 ## 总结 Bravia 9 II 凭借 True RGB 技术，在画质上实现了质的飞跃，堪称目前索尼电视产品线的巅峰。如果你预算充足且对画质有最高要求，它无疑是值得考虑的选择。但对于现有 Bravia 9 用户，除非你对色彩精准度有专业级需求，否则可以再等一代。

ZDNet AI26天前原文

1774

股市能吞下Anthropic、SpaceX和OpenAI吗？

精选

随着人工智能和太空探索领域的私营公司估值飙升，一个关键问题浮出水面：公共市场是否准备好接纳这些巨头？Anthropic、SpaceX和OpenAI等公司正考虑或传闻将进行首次公开募股（IPO），但它们的独特结构——如OpenAI的非营利上限利润模式、SpaceX的高资本密集度以及Anthropic的安全优先理念——可能与传统投资者的期望相冲突。 ## 估值与市场匹配这些公司的估值已跻身全球最高之列：OpenAI最新估值达860亿美元，SpaceX约1800亿美元，Anthropic也超过180亿美元。然而，它们的商业模式高度依赖长期研发和不确定性极高的突破，这与股市对季度盈利的短期关注形成张力。例如，OpenAI的盈利上限条款可能限制股东回报，而SpaceX的星舰项目尚未商业化。 ## 投资者顾虑潜在挑战包括： - **治理结构**：OpenAI的非常规结构可能让机构投资者犹豫。 - **盈利路径**：AI公司烧钱速度惊人，盈利时间表不明。 - **监管风险**：AI和航天领域面临全球监管收紧。 ## 行业影响如果这些公司成功上市，可能为科技股注入新活力，但也会加剧市场波动。反之，若它们推迟或放弃IPO，可能促使更多私营融资，如软银愿景基金或主权财富基金。 ## 结论股市能否“吞下”这些公司，取决于它们能否调整自身结构以适应公共市场规则。短期内，它们更可能选择部分上市或特殊目的收购公司（SPAC）等替代路径。长期看，它们的上市将考验市场对高风险高回报科技公司的容忍度。

Hacker News72326天前原文

1775

Alphabet 计划筹集 800 亿美元用于 AI 基础设施建设

新上线

Alphabet（谷歌母公司）周一宣布，计划通过发行股票筹集 **800 亿美元**，以支持其庞大的 AI 基础设施扩张计划。其中，**100 亿美元** 的股票将出售给沃伦·巴菲特曾领导的伯克希尔·哈撒韦公司。 Alphabet 在声明中表示，企业和消费者对其 AI 解决方案和服务的需求强劲，已超出公司现有供应能力。通过扩大投资，公司旨在扩展基础计算设施，以抓住巨大的增长机遇。此举也被视为在保持健康资产负债表的同时，以平衡方式为投资提供资金。今年科技巨头在 AI 领域的资本支出竞赛持续升温。在 5 月的 Google I/O 大会上，CEO 桑达尔·皮查伊预计 Alphabet 今年的资本支出将在 **1800 亿至 1900 亿美元** 之间。而整个行业今年的 AI 资本支出总额预计将高达 **7000 亿美元**。此次融资表明，Alphabet 正积极应对 AI 算力需求激增的挑战，并试图在竞争中保持领先地位。通过引入伯克希尔·哈撒韦这样的长期投资巨头，Alphabet 也为其大规模资本开支增添了财务稳定性。

TechCrunch26天前原文

1776

GitHub Copilot 新计费模式上线：用户惊呼“一天就用光整月额度”

新上线

GitHub 于 4 月宣布将其 AI 编程助手 Copilot 的计费方式从按请求量改为按使用量，新政策今日正式生效。然而，大量用户在社交媒体和论坛上反映，新系统下的“AI 积分”消耗速度远超预期，部分用户甚至一天之内就用完了整月的配额。根据新方案，不同订阅等级每月获得固定数量的 AI 积分（1 积分 = 0.01 美元）。其中，**Pro 计划（10 美元/月）** 包含 1500 积分（价值 15 美元），**Pro+ 计划（39 美元/月）** 包含 7000 积分（价值 70 美元），**Copilot Max 计划（100 美元/月）** 包含 20000 积分（价值 200 美元）。每次请求消耗的积分由输入/输出 token 数量及所选底层模型决定。 **用户反馈的“账单冲击”** 令人咋舌。有用户分享称，自己过去一个月的正常使用量，若按新定价折算将高达数千美元。例如，使用 OpenAI GPT-5.5 模型输出 100 万 token 需花费 30 美元，而使用更便宜的 GPT-5.4 nano 则仅需 1.25 美元。但许多用户依赖“自动”模式选择模型，该模式可能默认调用成本更高的模型，导致积分迅速耗尽。 GitHub 解释称，旧系统下“一个简短聊天和一个长达数小时的自主编码会话成本相同”，导致 Copilot 自身承担了高昂的推理成本。新定价旨在让费用与算力消耗更匹配。然而，对于习惯了无限次请求的用户而言，这种转变无疑带来了强烈的“价格冲击”。 **行业观察**：此举反映了 AI 服务商普遍面临的盈利压力——随着大模型推理成本居高不下，按量计费正成为趋势。但如何平衡开发者体验与商业可持续性，仍是 GitHub 等平台需要持续探索的课题。目前，已有用户开始寻求替代工具或调整使用习惯，以控制成本。

Ars Technica26天前原文

1777

Amazon Bedrock AgentCore Identity 支持引用自有 AWS Secrets Manager 密钥

新上线

## 背景：智能体安全访问 API 的关键挑战 AI 智能体的能力取决于其能调用的工具。无论是从 CRM 检索客户数据、向 Slack 发布更新，还是查询 GitHub 仓库，智能体都需要调用外部 API，这意味着要在运行时安全地传递凭证。在代码中硬编码密钥或在提示词中暴露凭证，是构建生产级智能体系统面临的典型难题。 ## Amazon Bedrock AgentCore Identity 的原有方案与局限 Amazon Bedrock AgentCore Identity 通过凭证提供者和令牌保管库来解决这一问题——它会自动在您的 AWS 账户中为每个出站凭证提供者资源创建并管理一个 Secrets Manager 密钥。该密钥包含 API 密钥或客户端密钥，以及其他外部身份提供者的元数据。然而，此前用户无法在创建时自定义标签、轮换策略或使用客户管理的 AWS KMS 密钥进行加密，这限制了企业对密钥治理的灵活控制。 ## 新功能：引用自有密钥，保留完全控制权今天，我们宣布 AgentCore Identity 支持引用 AWS Secrets Manager 中的已有密钥。您可以引用自己预先配置的 Secrets Manager 密钥，保留对其管理的完全控制权。这意味着您可以将组织现有的密钥治理流程无缝扩展到 AgentCore。 ### 核心能力包括： - **加密配置**：您可以选择使用客户管理的 KMS 密钥进行加密，而非仅依赖默认加密。 - **自动轮换**：您可以为密钥设置自动轮换策略，确保凭证定期更新。 - **跨账户共享**：支持引用同一 AWS 区域内其他账户中的密钥（跨区域共享暂不支持）。 - **第三方集成**：通过 Secrets Manager 外部连接器引入的密钥同样受支持，可实现与第三方密钥管理器的集成。 - **标签与资源策略**：您可以添加自定义标签，并设置精细的资源策略，以控制访问权限。 ## 典型使用场景 **场景一：复用已有密钥** 您的智能体需要访问一个外部 API，而您的团队已经为该 API 创建了一个 Secrets Manager 密钥。现在，您只需将该密钥的 ARN 提供给凭证提供者资源，AgentCore Identity 就会直接引用它，而无需创建新的密钥。 **场景二：跨账户密钥引用** 假设您的开发团队在账户 A 中管理密钥，而智能体部署在账户 B 中。只要两个账户位于同一区域，您就可以在账户 B 中引用账户 A 的密钥，实现集中管理。 **场景三：集成第三方密钥管理器** 如果您使用 HashiCorp Vault 或 CyberArk 等第三方工具，可以通过 Secrets Manager 外部连接器将其密钥同步至 AWS，然后由 AgentCore Identity 直接引用。 ## 如何开始使用 1. 在 AWS Secrets Manager 中创建或确认您要引用的密钥。 2. 确保该密钥包含正确的凭证信息（API 密钥或客户端密钥）。 3. 在创建或更新 AgentCore Identity 凭证提供者资源时，指定该密钥的 ARN。 4. 根据需要配置标签、轮换策略和资源策略。 ## 总结这项新功能让企业能够将现有的密钥治理策略无缝应用到 AI 智能体场景中。通过保留对加密、轮换、标签和访问策略的完全控制，安全团队可以确保凭证管理符合组织合规要求，同时开发者无需在安全性和便利性之间妥协。随着 AI 智能体在企业中的广泛应用，安全凭证管理将成为基础设施的核心组成部分。Amazon Bedrock AgentCore Identity 的这一更新，正是朝着这个方向迈出的重要一步。

AWS ML26天前原文

1778

用Amazon Quick变革罕见癌症研究：整合生物医学数据库实现突破性发现

新上线

## 背景：罕见癌症研究的挑战与机遇罕见癌症研究长期受困于数据分散、样本稀少的问题。以**儿童肉瘤**为例，这类疾病发病率低，单一机构的病例数往往不足以支撑有统计学意义的研究，而不同数据库之间的异构性和访问壁垒进一步增加了整合难度。传统方法需要研究人员手动从PubMed、TCGA、GEO等多个来源提取数据，耗时且容易出错。 ## Amazon Quick的解决方案：端到端工作流最新发布的 **Amazon Quick Research** 为这一困境提供了自动化解决方案。该服务允许研究人员通过自然语言定义研究目标，系统会自动配置数据源、生成研究计划、执行分析并支持迭代修订。 ### 工作流核心步骤 1. **定义研究目标**：例如“分析儿童肉瘤中特定基因突变与预后的关联”。 2. **配置数据源**：Quick Research 支持连接 **PubMed**、**ClinGen**、**cBioPortal** 等公开生物医学数据库，用户只需指定访问凭证和查询范围。 3. **AI生成研究计划**：系统利用大语言模型自动生成分析步骤，包括数据清洗、统计方法、可视化方案等。 4. **运行与分析**：在云端执行计算，生成结果报告。 5. **迭代优化**：支持版本控制，研究人员可基于初步结果调整参数或补充数据，重新运行。 ## 实际应用：儿童肉瘤研究案例在官方演示中，研究者使用 Amazon Quick 整合了 PubMed 文献摘要和 cBioPortal 的基因组数据。系统自动识别出 **EWSR1-FLI1 融合基因** 在尤文肉瘤中的高频出现，并生成生存分析曲线。整个过程从数据整合到首次结果输出仅需数小时，而传统方法可能耗费数周。 ## 行业影响与前景 Amazon Quick 的推出标志着 **AI 辅助科研** 进入新阶段。通过降低数据整合门槛，它有望加速罕见病领域的知识发现。不过，当前版本仍依赖公开数据库的质量，且对于非结构化数据（如病理报告）的处理能力有限。未来若接入医院电子病历等私有数据，其潜力将进一步释放。对于研究机构而言，这不仅是效率工具，更是一种“研究操作系统”——将分散的数据、计算和分析能力统一管理。随着多模态AI的发展，类似平台或将成为生物医学研究的标配基础设施。

AWS ML26天前原文

1779

OpenAI 前沿模型与 Codex 正式登陆 AWS，企业 AI 部署门槛再降低

精选

OpenAI 宣布其前沿模型及编程智能体 Codex 已正式在 AWS 上可用，企业客户可通过熟悉的 AWS 环境、安全管控和工作流程直接使用 OpenAI 能力。此举旨在消除企业在安全审查、采购、合规等方面的部署障碍，加速从评估到生产的转化。 ## 两大入口：模型 + 编程智能体本次发布提供两种接入方式： - **OpenAI 模型通过 Amazon Bedrock 提供**：团队可利用 AWS 原生的安全与治理控件构建 AI 应用。 - **Codex 登陆 Amazon Bedrock**：Codex 是 OpenAI 旗下领先的软件工程智能体，每周已有超过 **500 万用户** 使用。现在 AWS 用户可直接在熟悉的开发环境中调用 Codex 进行代码编写、审查、调试和现代化改造。 ## 降低企业 AI 采用的核心壁垒对于大型企业而言，将前沿 AI 投入生产往往面临安全合规、采购流程、账单集成等多重挑战。OpenAI on AWS 的推出，让企业可以在**已通过内部认证的 AWS 环境**中直接使用 OpenAI 能力，无需额外搭建基础设施或重新审批供应商。这显著缩短了从概念验证到实际部署的周期。 AWS 和 OpenAI 表示，该服务同时支持 **Commercial 和 GovCloud 区域**，满足不同行业的数据驻留与合规要求。 ## 行业反响与下一步计划包括 **Amgen（安进）** 和 **Autodesk（欧特克）** 在内的企业技术高管已公开表示欢迎，认为此举能帮助企业将更多精力从运营障碍转移到实际业务创新上。 OpenAI 还透露，这仅是双方合作的起点，未来将继续扩展可用能力，包括在网络安全等领域的深度集成。

Hacker News37026天前原文

1780

英伟达追赶2000亿美元CPU市场：与微软、戴尔、惠普共推AI智能体PC

新上线

英伟达在台北国际电脑展上发布了名为 **RTX Spark** 的新款PC CPU，号称“超级芯片”，算力高达 **1 petaflop**，专为运行AI智能体（如 OpenClaw 或 Hermes Agent）而设计。首批搭载该芯片的 Windows PC 将于今年秋季上市，合作厂商包括 **华硕、戴尔、惠普、联想、微软Surface 和微星**，宏碁和技嘉后续跟进。这些PC配备了与微软联合开发的 **安全沙箱**，可保障智能体运行的安全性，同时具备足够的 CPU、GPU、RAM 及英伟达 CUDA 软件，能本地运行大型语言模型。英伟达表示，其 RTX 技术将为 AI 带来更快性能、更佳画质，并支持超过 **1000 款游戏和应用程序** 的 AI 功能。目前已有 **超过 100 家 Windows 软件开发者** 签约支持新芯片，包括 Adobe、Blender、ComfyUI、Riot Games 和 Xbox。英伟达CEO黄仁勋的愿景远不止于此——他希望通过这些PC终结“点击和打字”的时代，让用户只需“提问”，PC便能自动完成工作。此前，他在财报电话会上曾提及一个 **2000亿美元** 的新市场：面向AI的CPU销售，而非仅仅GPU。他还预言未来将有“数十亿个智能体”，每个智能体都需要工具，而这些工具就是PC，因此“我们需要更多的CPU”。值得注意的是，英伟达此前基于ARM架构的Windows设备尝试（如2013年的Surface RT）以失败告终，微软曾为此减记 **9亿美元**。但如今，凭借连续创纪录的季度营收，英伟达的底气已大不相同。

TechCrunch26天前原文