SheepNav

AI 资讯

每日聚合最新人工智能动态

## 微调基础模型的两难困境 大型基础模型(如LLaMA、GPT等)在预训练阶段积累了广泛的能力,但在针对特定下游任务进行微调时,往往会**遗忘**预训练阶段学到的非目标能力。例如,一个擅长数学推理的模型,经过指令微调后可能数学能力下降。现有方法通过特殊初始化或固定约束来缓解遗忘,但无法在训练过程中动态调节**适配与保持**的权衡。 ## FoLoRA:基于广义瑞利商的遗忘感知优化框架 来自德克萨斯大学奥斯汀分校和微软的研究团队提出**FoLoRA(Foundation Preserving LoRA)**,这是一种遗忘感知优化框架,核心创新在于将**广义瑞利商**引入微调过程。FoLoRA通过以下步骤实现适配与保持的平衡: 1. **定义两个关键指标**: - **遗忘惩罚**:基于预训练代理激活(通过从预训练模型采样构建的校准数据计算)衡量更新方向对非目标能力的损害; - **任务效用**:基于下游任务激活衡量更新方向对目标任务的贡献。 2. **广义瑞利商评分**:将每个更新方向的得分定义为“任务效用/遗忘惩罚”,即每单位遗忘惩罚带来的任务效用。得分高的方向表示在遗忘较少的情况下提升目标任务。 3. **谱坐标系统与门控Adam更新**:利用广义瑞利商构建谱坐标系统,对低效用-高惩罚的方向进行衰减(即门控),从而在Adam优化器中动态调整更新强度。 ## 创新校准数据构建 FoLoRA另一个亮点是**预训练代理校准数据的生成**:不依赖单一代理数据集,而是从预训练模型本身采样。这种方法更具通用性,避免了代理数据集偏差,同时降低了对外部数据的依赖。 ## 实验效果 在**数学、代码和指令跟随**三个适配场景下的实验表明,FoLoRA在保持非目标能力(如通用知识、推理)方面显著优于现有基线方法(如LoRA、DARE等),同时目标任务性能也有提升。例如,在数学适配中,FoLoRA在GSM8K上保持高准确率的同时,代码生成能力下降幅度最小。 ## 行业意义 FoLoRA为**基础模型持续学习**和**多能力平衡**提供了新思路。随着模型在垂直领域(如医疗、法律)的广泛应用,如何在不破坏通用能力的前提下进行高效适配,成为关键挑战。FoLoRA的**动态门控机制**和**代理数据采样策略**具有实用价值,可集成到现有LoRA微调流程中,为开发者提供更安全的微调方案。 ## 小结 FoLoRA通过广义瑞利商优化,将遗忘惩罚和任务效用统一到一个数学框架中,实现了微调过程中适配与保持的精细调节。该方法在多个任务上展示了优越性,有望成为基础模型适配的标准工具之一。未来工作可能包括扩展到更大模型和更多模态,以及探索更高效的代理数据构建方式。

HuggingFace25天前原文

世界模型(World Models)作为学习环境结构与动态的内部模拟器,正成为实现通用人工智能的核心范式。近期一篇由26位学者联合撰写的综述论文(arXiv:2606.00133)系统梳理了这一领域,提出了涵盖**架构、方法论家族、推理策略与应用领域**的四维分类法,填补了长期以来缺乏统一框架的空白。 ## 四维分类法:解构世界模型 论文从四个关键维度组织庞大文献: - **架构维度**:涉及表示格式(隐空间/显式状态)、动态公式化(确定/随机)、输入模态(视觉/触觉/语言)、学习范式(监督/自监督/强化)及下游任务类型。 - **方法论家族**:包括**状态空间与循环方法**(如RSSM)、**Transformer基模型**(如DreamerV3中的序列建模)、**扩散生成器**(用于视频预测)、**物理信息网络**(融入先验物理定律)以及**语言增强多模态系统**(如RT-2)。 - **推理策略**:涵盖**基于想象力的规划**(如PlaNet的在线规划)、**隐策略学习**(Dreamer系列)、**反事实推理**(评估“如果…会怎样”)以及**不确定性下的规划**(如MuZero的蒙特卡洛树搜索)。 - **应用领域**:从机器人、自动驾驶、视频预测到科学建模(气候/分子动力学)、医学影像、教育测量和商业金融,横跨十余个场景。 ## 里程碑系统与最新趋势 论文追溯了从早期认知科学基础到现代标志性系统的演进:**PlaNet**首次在隐空间进行规划;**Dreamer系列**将学习与规划统一于潜在动态;**MuZero**无需环境模型即可学习规划;**Sora**展示了大模型在视频生成中的世界模拟能力;**Cosmos**与**Genie**则分别聚焦于物理交互与可交互虚拟世界。 值得注意的是,**链式思维推理与世界模型想象力的融合**正成为新热点——模型不仅生成未来状态,还能通过多步推理解释其决策逻辑,这对可解释AI与安全对齐至关重要。 ## 挑战与开放问题 尽管进展迅猛,领域仍面临三大核心挑战: 1. **累积预测误差**:长时域推演中误差指数级增长,影响规划可靠性。 2. **仿真到现实迁移**:模型在仿真中学习后难以直接部署到真实环境,需解决域适应与鲁棒性问题。 3. **评价碎片化**:缺少统一基准,不同论文使用不同任务与指标,难以横向对比。 论文呼吁建立标准化评估协议,并指出未来方向包括**多尺度世界模型**(同时处理秒级与小时级动态)、**语言引导的抽象推理**以及**与大型语言模型深度融合**。 ## 小结 世界模型正从单一学术概念演变为AI系统的核心组件。这篇综述不仅为研究者提供了清晰的分类地图,更揭示了**“预测-规划-推理”闭环**如何驱动下一代智能体。随着Sora等生成式模型与MuZero等规划算法的结合,世界模型有望在机器人、自动驾驶和科学发现中释放更大潜力。

HuggingFace25天前原文

混合专家(MoE)大语言模型通过稀疏专家激活降低了每token的计算量,但部署时所有专家权重需常驻内存,导致内存压力巨大。现有压缩方法在超低位宽下表现不佳:剪枝不可逆地移除模型容量,而粗粒度量化无法根据专家和权重方向的重要性分配位宽。为此,研究者提出 **BitsMoE**——一种基于谱能量引导的位宽分配框架,专为MoE大模型量化设计。 ## 核心思路:SVD分解与谱感知量化 BitsMoE的核心创新在于利用奇异值分解(SVD)将每个MoE层分解为**共享基**和**专家特定谱因子**。共享基不进行量化,以保留跨专家的通用结构;而专家特定因子则作为细粒度量化单元。这种分解将量化误差限制在专家差异部分,避免了共享信息的损失。 ## 混合精度位宽分配:激活感知整数线性规划 为了确定每个量化单元的位宽,BitsMoE将谱级混合精度量化建模为**激活感知重建替代问题**,并通过整数线性规划在固定位预算下最小化估计重建损失。具体而言,该方法利用谱能量(即奇异值)作为重要性指标,能量更高的成分分配更多位宽,从而在压缩比和模型质量间取得最优平衡。 ## 实验结果:2-bit量化下精度提升27.83个百分点 在 **Qwen3-30B-A3B-Base** 模型上的测试显示,2-bit量化下BitsMoE相比GPTQ实现了 **12.3倍量化加速**,平均准确率提升 **27.83个百分点**,解码速度提升 **1.76倍**。在多个MoE大模型(如Mixtral 8x7B、DeepSeek-MoE等)的实验中,BitsMoE在超低位宽(2-3 bit)下均显著优于现有方法,同时保持了高吞吐量。 ## 行业意义与展望 MoE模型因其高效推理而成为大模型部署的主流选择,但内存瓶颈制约了其在边缘设备上的应用。BitsMoE通过**谱能量引导的位宽分配**,首次在超低位宽下实现了可接受的精度损失,为MoE大模型的极致压缩提供了新思路。未来,该方法可进一步结合量化感知训练和硬件协同设计,推动大模型在资源受限场景的落地。 论文代码和模型已开源,详见项目地址。

HuggingFace25天前原文

## 快讯:DAS事件分类迎来高效新方案 分布式声学传感(DAS)技术利用光纤实现大规模监测,但高维度与复杂的时空模式让事件分类成为难题。现有深度学习方法(如CNN、循环模型及Transformer变体)要么难以捕捉长程依赖,要么处理原始DAS矩阵成本过高。近日,来自IMT Nord Europe的研究团队提出**DAStatFormer**——一种混合多分支Transformer架构,通过紧凑的多域统计特征与门控Transformer网络相结合,在显著降低计算开销的同时实现高达**99.4%** 的分类准确率。 ## 核心创新:从原始信号到统计特征 DAStatFormer的突破在于**避开原始高维信号**,转而从每个通道提取24个经ANOVA筛选的统计属性,覆盖时域、波形和频谱三个域。这一策略将数据规模压缩数个数量级,同时保留关键判别信息。每个域由专用的**逐步注意力分支**和**逐通道注意力分支**处理,最后通过自适应门控机制融合。 ## 性能对比:轻量级下的卓越表现 实验基于公开的Φ-OTDR基准数据集和真实场景DAS数据集。结果显示,DAStatFormer不仅准确率接近完美(真实场景近乎100%),且参数量和推理成本远低于DASFormer、DeepViT等模型。这意味着它更适用于**实时、大规模**的DAS监测部署。 ## 行业意义:边缘智能的潜力 DAS在油气管道监控、地震预警、安防等领域应用广泛,但传统方案依赖昂贵计算设备。DAStatFormer的轻量设计为**边缘端部署**打开了可能——只需提取少量统计特征即可完成精准分类,有望推动DAS从实验室走向工程现场。 研究团队已开源代码(见论文链接),为后续工作提供了坚实基础。

HuggingFace25天前原文

## 研究背景与核心思路 深度神经网络(DNN)的规模持续膨胀,给部署在资源受限设备上带来了巨大挑战。传统的模型压缩方法,如低秩分解和剪枝,往往在压缩比和精度之间难以兼顾。近期,来自arXiv的一篇论文(arXiv:2606.00130)提出了一种名为**自动可微非线性张量网络(ADNTNs)** 的框架,旨在通过结构化权重生成实现指数级压缩,同时保持甚至提升模型精度。 ADNTNs 的核心思想是:不直接存储庞大的权重矩阵,而是通过一组**小型核心张量**,利用非线性激活函数和层次化连接(类似张量网络中的树结构)来“生成”大权重。这些核心张量通过**反向模式自动微分(AD)** 进行端到端训练,使其能够适应特定任务。 ## 三大架构与关键特性 论文重点研究了三种张量网络架构: - **Tree Tensor Networks (TTNs)**:基础树形结构,通过层级组合构建权重。 - **augmented TTNs (aTTNs)**:在TTN基础上引入**边界纠缠消除单元**,提升表达能力。 - **Multi-scale Entanglement Renormalisation Ansatze (MERA)**:多尺度纠缠重整化,更擅长捕捉长程依赖。 这些架构支持非线性激活、任务感知目标、批处理以及硬件感知的执行调度。作者特别指出,ADNTNs 并非简单地“免费”计算,自动微分并不能消除大中间张量的存储成本或优化收缩顺序的难题。 ## 实验结果与性能亮点 研究在 **AlexNet** 和 **VGG-16** 的多个层上进行了广泛模拟。结果显示,每层压缩比从约 **2000倍到77000倍** 不等,而模型精度通常与稠密基线持平,甚至在VGG-16的若干层中**有所提升**。例如,在VGG-16的某些卷积层上,ADNTN在压缩超过万倍的情况下,分类准确率反而比原始模型高出0.5-1个百分点。 这些结果令人鼓舞,但作者也保持审慎,认为这是“鼓励性而非最终结论”。ADNTNs 的真正潜力需要结合**优化算法、收缩调度和部署内核**的协同设计才能充分发挥。 ## 行业影响与未来展望 ADNTNs 为模型压缩提供了一种**数学结构严谨且硬件友好**的新范式。与低秩适应(LoRA)等仅单步更新的方法相比,ADNTN通过多层非线性层次结构实现了更强的表达能力。未来,该技术有望在移动端AI、边缘计算和大型语言模型(LLM)的部署中发挥重要作用,尤其是在需要极高压缩比且对精度敏感的场景。 不过,目前的工作主要局限于卷积层,将其扩展到Transformer架构(如注意力权重)仍是开放问题。此外,自动微分带来的额外计算开销也需要进一步优化。

HuggingFace25天前原文

## 颠覆RAG范式:Grokers如何将AI理解成本从查询时转移到写入时 传统检索增强生成(RAG)系统在每次查询时都需要调用大语言模型(LLM)来理解上下文,成本高昂且难以复用。而一篇新论文提出的 **Grokers** 架构,通过将智能从查询时转移到写入时,有望彻底改变这一局面。 ### 核心思想:写入时智能 Grokers 的核心是一种自下而上的归纳遍历架构,专门用于构建类型化知识图谱的持久、结构化理解。与 RAG 在每次查询时支付完整的理解成本不同,Grokers 在数据**写入**时(即数据进入图谱时)就完成分析。具体来说,自主的 **Groker 代理** 会分析类型化流图中的节点,通过受控的 LLM 调用提取结构化属性,然后沿依赖关系自下而上地归纳组合这些理解,最终将丰富的类型化属性写回图谱。此后所有查询都能零额外 LLM 成本地使用这些预计算的理解。 ### 三个形式化定理支撑 论文提出了三个关键定理来保证 Grokers 的有效性: 1. **字节同一性定理**:通过事务性维护的反规范化索引,在语义未发生变化时,LLM 上下文块在不同轮次间是字节相同的,这使得 KV 缓存命中率接近 100%,大幅降低推理延迟。 2. **累积单调性定理**:在受控知识库增长协议下,无需 LLM 调用即可解决交互的比例随着交互次数的增加而单调不减,意味着系统越用越“聪明”,LLM 调用越来越少。 3. **双遍历序定理**:明确指出了在依赖有向无环图上,自上而下生成和自下而上理解是各自任务唯一正确的遍历顺序,且两者组合可形成一个完整的生成-理解循环。 ### 确定性搜索替代嵌入 Grokers 还提出了一种基于同义词缓存协议的确定性替代方案,替代传统的嵌入向量语义搜索。对于有限词汇域,其 LLM 回退率可收敛到零,这意味着在特定领域应用中,系统可以完全摆脱对 LLM 实时推理的依赖。 ### 实用价值与开源实现 论文作者 Gregory Magarshak 已在开源项目 **Qbix / Safebox / Safebots** 中提供了参考实现。该架构特别适合需要频繁查询但数据变更不频繁的知识密集型场景,如企业知识库、法律文档分析、医疗记录推理等。通过将理解成本前置,Grokers 有望将大规模知识图谱的推理成本降低几个数量级。 ### 行业意义 Grokers 的出现挑战了当前 RAG 系统“每次查询都重新理解”的固有思路。如果其理论在实践中得到验证,可能会推动 AI 系统从“每次从头思考”转向“一次理解,多次复用”的新范式,尤其对实时性要求高、推理成本敏感的应用具有重大价值。

Anthropic25天前原文

## 概述 在 AI 助手与 MCP(Model Context Protocol)服务器交互的场景中,安全认证是生产环境部署的关键环节。本文介绍如何利用 **Amazon Bedrock AgentCore Gateway** 实现 **OAuth 授权码流程(Authorization Code Flow)**,为 MCP 服务器提供入站身份验证机制。通过本方案,每个 AI 助手请求都将携带来自组织身份提供者(IdP)的有效用户身份令牌,确保请求来源的合法性与可追溯性。 ## 核心架构与实现 ### 1. 为什么选择授权码流程? 授权码流程是 OAuth 2.0 中最安全的授权模式之一,特别适合服务端通信场景。与隐式流程相比,它避免了令牌直接暴露在浏览器端,而是通过后端交换授权码获取访问令牌,从而降低令牌泄露风险。在 AI 助手调用 MCP 服务器的上下文中,这一机制能有效防止未授权访问,确保只有经过身份验证的用户才能触发特定操作。 ### 2. 组件与工作流 - **AgentCore Gateway**:作为反向代理和认证网关,拦截所有传入的 MCP 请求,执行令牌验证与转发。 - **MCP 客户端**:AI 助手或应用程序,发起对 MCP 服务器的请求。 - **身份提供者**:组织内部的 OAuth 2.0 服务器(如 Okta、Auth0 或自建服务),负责签发 ID Token 和 Access Token。 - **MCP 服务器**:提供具体功能的后端服务,例如数据库查询、文件处理等。 **典型流程如下:** 1. MCP 客户端向 AgentCore Gateway 发起请求,携带身份提供者签发的 ID Token。 2. Gateway 验证令牌的签名、颁发者(issuer)和受众(audience),确保令牌有效且未过期。 3. 验证通过后,Gateway 将令牌中的用户身份信息(如用户 ID、角色)传递给下游 MCP 服务器。 4. MCP 服务器根据用户身份执行授权逻辑,返回响应。 ### 3. 配置要点 - **令牌验证规则**:在 AgentCore Gateway 中配置 JWT 验证参数,包括 JWKS URI(用于获取公钥)、期望的 `iss` 和 `aud` 值。 - **令牌缓存与刷新**:为避免每次请求都重复验证,Gateway 可缓存已验证的令牌(基于 JWT ID `jti`),并支持令牌刷新机制。 - **错误处理**:当令牌无效或过期时,Gateway 应返回标准 HTTP 401 状态码,并附带错误描述,方便客户端调试。 ## 场景价值 该方案适用于企业级 AI 应用,例如: - **内部知识库助手**:仅允许特定部门的员工通过认证后查询敏感数据。 - **自动化工作流**:不同用户角色触发不同的 MCP 服务器操作,实现细粒度访问控制。 - **审计与合规**:所有请求都关联到具体用户身份,便于日志审计和问题追踪。 ## 小结 通过 AgentCore Gateway 集成 OAuth 授权码流程,开发者可以为 MCP 服务器快速添加身份验证层,无需修改现有后端代码。这一模式不仅提升了安全性,还保持了与标准 OAuth 生态的兼容性,为 AI 助手的生产级部署提供了可靠的基础设施。

AWS ML25天前原文

如果你还在为家中Wi-Fi死角烦恼,或者觉得高端Mesh路由器价格高不可攀,那么**Tenda BE5100三件套Mesh Wi-Fi系统**可能会让你眼前一亮。这款仅售**190美元**(约合人民币1300元)的套装,不仅支持最新的**Wi-Fi 7**标准,还能同时处理**12路4K视频流**而毫无卡顿。 ## 性能实测:12路4K视频流无压力 在ZDNET的实测中,这套系统被部署在一个约200平方米的复式住宅内。通过同时播放12路4K超高清视频(包括YouTube、Netflix和本地NAS流媒体),所有节点均未出现缓冲或掉线。测试工具显示,即使在距离主节点最远的角落,信号强度仍保持在-65dBm以上,延迟稳定在10ms以内。 ## Wi-Fi 7加持,性价比突出 BE5100支持Wi-Fi 7(802.11be)的320MHz频宽和4K QAM调制,理论速率可达5.1Gbps。虽然目前Wi-Fi 7终端尚不普及,但向下兼容Wi-Fi 6/6E,且为未来升级预留了空间。相比同类Wi-Fi 7 Mesh系统(如TP-Link Deco BE95售价约600美元),Tenda这套方案价格仅为三分之一,堪称“平民版”入门之选。 ## 设置与功能:App专业,硬件质感一般 配套的**Tenda App**提供了从网络诊断、信号覆盖图到家长控制等专业级功能。用户只需扫描二维码即可完成初始配置,整个过程不到5分钟。不过,路由器外壳采用全塑料材质,手感略显廉价。另外,单独购买扩展节点的价格是100美元,整套购买显然更划算。 ## 行业背景:Mesh Wi-Fi普及加速 随着远程办公、4K/8K流媒体和智能家居设备的爆发,传统单路由器已难以满足全屋覆盖需求。Mesh Wi-Fi系统通过多节点协作实现无缝漫游,成为中大型住宅的刚需。而**Wi-Fi 7**的商用化进一步推动了性能升级——更高的带宽、更低的延迟,使得多设备并发场景(如云游戏、VR)成为可能。Tenda BE5100的出现,意味着Wi-Fi 7 Mesh系统正在从高端市场向主流价位渗透。 ## 小结 如果你预算有限,但又想体验Wi-Fi 7的潜力,Tenda BE5100是一个值得考虑的选择。它用不到200美元的价格,提供了足以覆盖大户型、支撑重度流媒体使用的性能。当然,对质感有要求的用户可能需要权衡其塑料外壳,但在这个价位上,稳定性和速度才是真正的王牌。

ZDNet AI26天前原文

## 从《神经漫游者》到桌面:我的赛博终端构建之旅 赛博终端(Cyberdeck)这个名词,最早源自威廉·吉布森1984年的科幻小说《神经漫游者》。如今,它已成为DIY社区中最热门的复古未来主义项目之一。我决定亲自动手,用树莓派打造一台属于自己的便携计算机,体验一把赛博朋克的感觉。 ### 为什么选择赛博终端? 赛博终端的魅力在于它的自由度和个性化。不同于市面上千篇一律的笔记本或平板,赛博终端完全由你定义:外壳、键盘、屏幕、电池,甚至是操作系统和软件。它不追求性能极致,而是强调独特的视觉风格和功能定制。对于喜欢动手、热爱复古科技的人来说,建造一台赛博终端本身就是一种乐趣。 ### 我的构建过程 我选择了一台**树莓派4B**作为核心,搭配5英寸HDMI触摸屏和机械键盘模块。外壳则用3D打印制作,参考了经典的“砖头”造型,并加入了LED灯带和复古按钮。电源方面,我集成了18650电池组,确保户外使用时的续航。 关键步骤包括: - **硬件组装**:将树莓派、屏幕、键盘和电池通过定制线缆连接,固定在外壳内。 - **系统配置**:安装Raspberry Pi OS,并优化触控和键盘映射。 - **软件定制**:添加终端模拟器、文本编辑器、以及一些复古游戏模拟器。 整个过程耗时约两周,其中调试驱动和电源管理最费时间。但完成后的成就感无可比拟。 ### 它能做什么? 我的赛博终端并非只是摆设。它实际具备以下能力: - **便携编程**:在户外或咖啡厅里,它是一台全功能的Linux开发机。 - **复古游戏**:通过模拟器运行FC、GB等经典游戏。 - **网络工具**:可作为便携式渗透测试设备(配合Kali Linux)。 - **电子阅读**:用终端阅读纯文本或Markdown文档。 - **展示与社交**:带到黑客马拉松或科技聚会中,绝对是话题中心。 当然,它的性能无法与主流笔记本相比,但**低功耗、可定制性**和**独特外观**是它的核心价值。 ### 赛博终端热潮背后的思考 这股DIY风潮反映了人们对标准化消费电子产品的厌倦。在笔记本、手机几乎同质化的今天,赛博终端提供了一种“反叛”的可能:你可以掌控每一个细节,赋予设备个性。同时,它也是学习硬件和编程的绝佳实践项目。 如果你不想从零开始,市面上已有一些套件或成品可供选择,但真正的乐趣在于亲手打造。正如我在构建过程中感受到的:**过程比结果更重要**。 未来,我计划升级到树莓派5,并加入4G模块,让它成为真正随时在线的“口袋电脑”。赛博终端的可能性,只受限于你的想象力。

ZDNet AI26天前原文

OpenAI 于 2026 年 6 月 2 日发布最新报告《知识工作新时代》,揭示其 AI 平台 **Codex** 正从编程工具演变为覆盖全职业的生产力助手。报告显示,Codex 目前周活跃用户已突破 **500 万**,自 2 月桌面应用上线以来增长超过 **6 倍**。虽然开发者仍是最大用户群体,但知识工作者占比已达 **20%**,且增速是开发者的 **3 倍以上**,标志着更广泛的应用转型正在发生。 ## 知识工作者的典型使用场景 知识工作者主要利用 Codex 创建报告、电子表格、演示文稿、合同等工作成果。此外,**研究、数据分析、工作流自动化** 以及构建原本需要工程支持的轻量级工具,成为增长最快的任务类别。用户越来越多地同时运行多项 Codex 任务,例如并行处理数据调查、材料起草和流程自动化,这种 **多任务并行能力** 显著提升了工作节奏。 ## 对职业发展的潜在影响 OpenAI 在报告中指出,Codex 可帮助人们承担更具雄心的项目,从而 **扩大个人职责范围**,并可能加速职业晋升。通过减少信息查找、跨工具协调、审批流程等现代工作中的摩擦,Codex 让知识工作者能够专注于更高价值的工作。 ## 行业趋势与展望 报告强调,Codex 的普及正在重塑 AI 对工作的长期影响。从金融到医疗,各行业用户均利用 Codex 降低工作阻力,提升产出质量。OpenAI 表示,这一趋势预示着 AI 将从辅助工具转变为 **核心生产力基础设施**,推动知识工作进入新纪元。 更多细节可查阅完整报告。

OpenAI26天前原文

**家得宝(Home Depot)** 正在推出一项极具吸引力的夏季促销活动:购买 **Ryobi One+ 18V锂电启动套装**(包含一块2.0Ah电池、一块4.0Ah电池和一个充电器,售价99美元),即可 **免费获赠一把指定Ryobi电动工具**,整体节省高达 **129美元**(折扣率57%)。 ## 活动核心信息 - **促销商品**:Ryobi One+ 18V锂电启动套装(型号可能因库存而异) - **售价**:99美元 - **赠品**:从指定列表中任选一把Ryobi电动工具,免费赠送 - **优惠力度**:相比原价节省约129美元 - **活动期限**:截至2026年6月1日(或售完即止) ## 为什么值得入手 对于DIY爱好者和家庭用户来说,Ryobi One+生态系统提供了丰富的工具选择,且电池通用。这套组合包含一大一小两块电池,适合不同工作强度的需求:2.0Ah电池轻便,适合钻孔、拧螺丝等轻量任务;4.0Ah电池续航更长,适合电锯、吹风机等高耗电设备。免费赠送的工具则可以根据实际需要选择,如电钻、圆锯、打磨机等,相当于将总成本摊薄至不到100美元,性价比极高。 ## 编辑点评 ZDNET编辑评价该促销为“编辑之选”,并给出了5/5的评分。主要优势在于:1)电池套装本身是刚需;2)免费工具相当于白送;3)Ryobi品牌在性价比和工具种类方面口碑良好。需要注意的是,免费工具的选择范围可能有限,建议购买前确认可选项。 ## 购买建议 如果你正在筹划夏季庭院维护或家居改造项目,这套组合可以一次性解决动力源和工具需求。建议优先选择平时售价较高的工具作为赠品,以最大化节省金额。

ZDNet AI26天前原文

MX Linux 近日发布了其最新版本,其中包含针对现代硬件的优化,让老旧 PC 也能焕发新生。作为一名长期关注 Linux 发行版的用户,我第一时间在主力机上安装了 **MX-25.2_Xfce_ahs_x64** 版本,体验令人印象深刻。 ## 版本选择:AHS 专为现代硬件打造 MX Linux 提供了多种版本,包括标准版、KDE 版、Fluxbox 版以及树莓派版。其中,**AHS(Advanced Hardware Support)版本** 集成了 **7.07 内核**、最新显卡驱动和固件,特别适合 1-3 年内的新硬件。它使用 **Liquorix 内核**(针对高性能音视频优化),并预装 **DKMS 包** 确保现代 GPU 和 Wi-Fi 芯片开箱即用。此外,**MX Nvidia 安装程序** 让驱动安装变得异常简单。 ## 实际体验:流畅与稳定兼得 在我的中端 PC 上,MX Linux AHS 的 Xfce 桌面环境响应迅速,**HiDPI 缩放**(125% 和 150%)显示清晰锐利。无论是日常办公、网页浏览还是轻度游戏,系统都表现出色。得益于 Debian Stable 的根基,MX Linux 保持了极高的稳定性,几乎没有遇到崩溃或驱动问题。 ## 与竞品对比:速度与稳定的平衡 相比追求极致速度的 CachyOS,MX Linux 更注重稳定性和易用性。它的 **Xfce 桌面** 轻量高效,资源占用低,非常适合老旧设备升级。如果你正在寻找一个既能利用新硬件特性,又不牺牲稳定性的系统,MX Linux AHS 无疑是明智之选。 ## 小结 MX Linux AHS 版本是 Linux 社区针对现代硬件的一次成功优化。它免费、开源,且安装简便,能让任何 PC 焕然一新。无论你是 Linux 新手还是老手,都值得一试。

ZDNet AI26天前原文

索尼近日发布了新一代旗舰电视 **Bravia 9 II True RGB**,同时推出的还有 **Bravia 7 II** 及多款更新机型。对于正在考虑升级主电视或添置第二屏幕的用户来说,现在或许是入手的良机——无论你是索尼的忠实粉丝,还是只想淘个好价。 ## Bravia 9 II 的核心升级:True RGB 技术 Bravia 9 II 的最大亮点是采用了 **True RGB** 屏幕技术。与上一代 Bravia 9 的 Mini LED 面板不同,True RGB 通过独立控制红、绿、蓝三原色发光,实现了更广的色域、更精确的色彩还原和更高的亮度。这意味着在观看 HDR 内容时,色彩过渡更加自然,高光细节更加丰富,暗部表现也更纯净。 ## 与 Bravia 9 的对比:值得升级吗? 从参数上看,Bravia 9 II 在色彩覆盖率和峰值亮度上明显领先。上一代 Bravia 9 的 Mini LED 虽然已经表现出色,但在处理复杂光线场景时仍会出现轻微的光晕现象。而 True RGB 技术从根本上解决了这个问题,每个像素都能独立发光,控光精度达到像素级。 对于追求极致画质的影音爱好者,尤其是经常观看 4K HDR 电影或玩高帧率游戏的用户,Bravia 9 II 的升级是显而易见的。不过,如果你的 Bravia 9 仍在良好服役且对当前画质满意,那么升级的必要性可能不大——毕竟新一代机型的价格预计会更高。 ## 其他更新:Bravia 7 II 与系统优化 除了旗舰型号,索尼还更新了 **Bravia 7 II**,同样搭载了改进的面板技术和更智能的画质算法。全系机型预计将搭载更新的 **Google TV** 系统,提供更流畅的界面和更丰富的流媒体集成。 ## 总结 Bravia 9 II 凭借 True RGB 技术,在画质上实现了质的飞跃,堪称目前索尼电视产品线的巅峰。如果你预算充足且对画质有最高要求,它无疑是值得考虑的选择。但对于现有 Bravia 9 用户,除非你对色彩精准度有专业级需求,否则可以再等一代。

ZDNet AI26天前原文

随着人工智能和太空探索领域的私营公司估值飙升,一个关键问题浮出水面:公共市场是否准备好接纳这些巨头?Anthropic、SpaceX和OpenAI等公司正考虑或传闻将进行首次公开募股(IPO),但它们的独特结构——如OpenAI的非营利上限利润模式、SpaceX的高资本密集度以及Anthropic的安全优先理念——可能与传统投资者的期望相冲突。 ## 估值与市场匹配 这些公司的估值已跻身全球最高之列:OpenAI最新估值达860亿美元,SpaceX约1800亿美元,Anthropic也超过180亿美元。然而,它们的商业模式高度依赖长期研发和不确定性极高的突破,这与股市对季度盈利的短期关注形成张力。例如,OpenAI的盈利上限条款可能限制股东回报,而SpaceX的星舰项目尚未商业化。 ## 投资者顾虑 潜在挑战包括: - **治理结构**:OpenAI的非常规结构可能让机构投资者犹豫。 - **盈利路径**:AI公司烧钱速度惊人,盈利时间表不明。 - **监管风险**:AI和航天领域面临全球监管收紧。 ## 行业影响 如果这些公司成功上市,可能为科技股注入新活力,但也会加剧市场波动。反之,若它们推迟或放弃IPO,可能促使更多私营融资,如软银愿景基金或主权财富基金。 ## 结论 股市能否“吞下”这些公司,取决于它们能否调整自身结构以适应公共市场规则。短期内,它们更可能选择部分上市或特殊目的收购公司(SPAC)等替代路径。长期看,它们的上市将考验市场对高风险高回报科技公司的容忍度。

Hacker News72326天前原文

Alphabet(谷歌母公司)周一宣布,计划通过发行股票筹集 **800 亿美元**,以支持其庞大的 AI 基础设施扩张计划。其中,**100 亿美元** 的股票将出售给沃伦·巴菲特曾领导的伯克希尔·哈撒韦公司。 Alphabet 在声明中表示,企业和消费者对其 AI 解决方案和服务的需求强劲,已超出公司现有供应能力。通过扩大投资,公司旨在扩展基础计算设施,以抓住巨大的增长机遇。此举也被视为在保持健康资产负债表的同时,以平衡方式为投资提供资金。 今年科技巨头在 AI 领域的资本支出竞赛持续升温。在 5 月的 Google I/O 大会上,CEO 桑达尔·皮查伊预计 Alphabet 今年的资本支出将在 **1800 亿至 1900 亿美元** 之间。而整个行业今年的 AI 资本支出总额预计将高达 **7000 亿美元**。 此次融资表明,Alphabet 正积极应对 AI 算力需求激增的挑战,并试图在竞争中保持领先地位。通过引入伯克希尔·哈撒韦这样的长期投资巨头,Alphabet 也为其大规模资本开支增添了财务稳定性。

TechCrunch26天前原文
GitHub Copilot 新计费模式上线:用户惊呼“一天就用光整月额度”

GitHub 于 4 月宣布将其 AI 编程助手 Copilot 的计费方式从按请求量改为按使用量,新政策今日正式生效。然而,大量用户在社交媒体和论坛上反映,新系统下的“AI 积分”消耗速度远超预期,部分用户甚至一天之内就用完了整月的配额。 根据新方案,不同订阅等级每月获得固定数量的 AI 积分(1 积分 = 0.01 美元)。其中,**Pro 计划(10 美元/月)** 包含 1500 积分(价值 15 美元),**Pro+ 计划(39 美元/月)** 包含 7000 积分(价值 70 美元),**Copilot Max 计划(100 美元/月)** 包含 20000 积分(价值 200 美元)。每次请求消耗的积分由输入/输出 token 数量及所选底层模型决定。 **用户反馈的“账单冲击”** 令人咋舌。有用户分享称,自己过去一个月的正常使用量,若按新定价折算将高达数千美元。例如,使用 OpenAI GPT-5.5 模型输出 100 万 token 需花费 30 美元,而使用更便宜的 GPT-5.4 nano 则仅需 1.25 美元。但许多用户依赖“自动”模式选择模型,该模式可能默认调用成本更高的模型,导致积分迅速耗尽。 GitHub 解释称,旧系统下“一个简短聊天和一个长达数小时的自主编码会话成本相同”,导致 Copilot 自身承担了高昂的推理成本。新定价旨在让费用与算力消耗更匹配。然而,对于习惯了无限次请求的用户而言,这种转变无疑带来了强烈的“价格冲击”。 **行业观察**:此举反映了 AI 服务商普遍面临的盈利压力——随着大模型推理成本居高不下,按量计费正成为趋势。但如何平衡开发者体验与商业可持续性,仍是 GitHub 等平台需要持续探索的课题。目前,已有用户开始寻求替代工具或调整使用习惯,以控制成本。

Ars Technica26天前原文

## 背景:智能体安全访问 API 的关键挑战 AI 智能体的能力取决于其能调用的工具。无论是从 CRM 检索客户数据、向 Slack 发布更新,还是查询 GitHub 仓库,智能体都需要调用外部 API,这意味着要在运行时安全地传递凭证。在代码中硬编码密钥或在提示词中暴露凭证,是构建生产级智能体系统面临的典型难题。 ## Amazon Bedrock AgentCore Identity 的原有方案与局限 Amazon Bedrock AgentCore Identity 通过凭证提供者和令牌保管库来解决这一问题——它会自动在您的 AWS 账户中为每个出站凭证提供者资源创建并管理一个 Secrets Manager 密钥。该密钥包含 API 密钥或客户端密钥,以及其他外部身份提供者的元数据。然而,此前用户无法在创建时自定义标签、轮换策略或使用客户管理的 AWS KMS 密钥进行加密,这限制了企业对密钥治理的灵活控制。 ## 新功能:引用自有密钥,保留完全控制权 今天,我们宣布 AgentCore Identity 支持引用 AWS Secrets Manager 中的已有密钥。您可以引用自己预先配置的 Secrets Manager 密钥,保留对其管理的完全控制权。这意味着您可以将组织现有的密钥治理流程无缝扩展到 AgentCore。 ### 核心能力包括: - **加密配置**:您可以选择使用客户管理的 KMS 密钥进行加密,而非仅依赖默认加密。 - **自动轮换**:您可以为密钥设置自动轮换策略,确保凭证定期更新。 - **跨账户共享**:支持引用同一 AWS 区域内其他账户中的密钥(跨区域共享暂不支持)。 - **第三方集成**:通过 Secrets Manager 外部连接器引入的密钥同样受支持,可实现与第三方密钥管理器的集成。 - **标签与资源策略**:您可以添加自定义标签,并设置精细的资源策略,以控制访问权限。 ## 典型使用场景 **场景一:复用已有密钥** 您的智能体需要访问一个外部 API,而您的团队已经为该 API 创建了一个 Secrets Manager 密钥。现在,您只需将该密钥的 ARN 提供给凭证提供者资源,AgentCore Identity 就会直接引用它,而无需创建新的密钥。 **场景二:跨账户密钥引用** 假设您的开发团队在账户 A 中管理密钥,而智能体部署在账户 B 中。只要两个账户位于同一区域,您就可以在账户 B 中引用账户 A 的密钥,实现集中管理。 **场景三:集成第三方密钥管理器** 如果您使用 HashiCorp Vault 或 CyberArk 等第三方工具,可以通过 Secrets Manager 外部连接器将其密钥同步至 AWS,然后由 AgentCore Identity 直接引用。 ## 如何开始使用 1. 在 AWS Secrets Manager 中创建或确认您要引用的密钥。 2. 确保该密钥包含正确的凭证信息(API 密钥或客户端密钥)。 3. 在创建或更新 AgentCore Identity 凭证提供者资源时,指定该密钥的 ARN。 4. 根据需要配置标签、轮换策略和资源策略。 ## 总结 这项新功能让企业能够将现有的密钥治理策略无缝应用到 AI 智能体场景中。通过保留对加密、轮换、标签和访问策略的完全控制,安全团队可以确保凭证管理符合组织合规要求,同时开发者无需在安全性和便利性之间妥协。 随着 AI 智能体在企业中的广泛应用,安全凭证管理将成为基础设施的核心组成部分。Amazon Bedrock AgentCore Identity 的这一更新,正是朝着这个方向迈出的重要一步。

AWS ML26天前原文
用Amazon Quick变革罕见癌症研究:整合生物医学数据库实现突破性发现

## 背景:罕见癌症研究的挑战与机遇 罕见癌症研究长期受困于数据分散、样本稀少的问题。以**儿童肉瘤**为例,这类疾病发病率低,单一机构的病例数往往不足以支撑有统计学意义的研究,而不同数据库之间的异构性和访问壁垒进一步增加了整合难度。传统方法需要研究人员手动从PubMed、TCGA、GEO等多个来源提取数据,耗时且容易出错。 ## Amazon Quick的解决方案:端到端工作流 最新发布的 **Amazon Quick Research** 为这一困境提供了自动化解决方案。该服务允许研究人员通过自然语言定义研究目标,系统会自动配置数据源、生成研究计划、执行分析并支持迭代修订。 ### 工作流核心步骤 1. **定义研究目标**:例如“分析儿童肉瘤中特定基因突变与预后的关联”。 2. **配置数据源**:Quick Research 支持连接 **PubMed**、**ClinGen**、**cBioPortal** 等公开生物医学数据库,用户只需指定访问凭证和查询范围。 3. **AI生成研究计划**:系统利用大语言模型自动生成分析步骤,包括数据清洗、统计方法、可视化方案等。 4. **运行与分析**:在云端执行计算,生成结果报告。 5. **迭代优化**:支持版本控制,研究人员可基于初步结果调整参数或补充数据,重新运行。 ## 实际应用:儿童肉瘤研究案例 在官方演示中,研究者使用 Amazon Quick 整合了 PubMed 文献摘要和 cBioPortal 的基因组数据。系统自动识别出 **EWSR1-FLI1 融合基因** 在尤文肉瘤中的高频出现,并生成生存分析曲线。整个过程从数据整合到首次结果输出仅需数小时,而传统方法可能耗费数周。 ## 行业影响与前景 Amazon Quick 的推出标志着 **AI 辅助科研** 进入新阶段。通过降低数据整合门槛,它有望加速罕见病领域的知识发现。不过,当前版本仍依赖公开数据库的质量,且对于非结构化数据(如病理报告)的处理能力有限。未来若接入医院电子病历等私有数据,其潜力将进一步释放。 对于研究机构而言,这不仅是效率工具,更是一种“研究操作系统”——将分散的数据、计算和分析能力统一管理。随着多模态AI的发展,类似平台或将成为生物医学研究的标配基础设施。

AWS ML26天前原文

OpenAI 宣布其前沿模型及编程智能体 Codex 已正式在 AWS 上可用,企业客户可通过熟悉的 AWS 环境、安全管控和工作流程直接使用 OpenAI 能力。此举旨在消除企业在安全审查、采购、合规等方面的部署障碍,加速从评估到生产的转化。 ## 两大入口:模型 + 编程智能体 本次发布提供两种接入方式: - **OpenAI 模型通过 Amazon Bedrock 提供**:团队可利用 AWS 原生的安全与治理控件构建 AI 应用。 - **Codex 登陆 Amazon Bedrock**:Codex 是 OpenAI 旗下领先的软件工程智能体,每周已有超过 **500 万用户** 使用。现在 AWS 用户可直接在熟悉的开发环境中调用 Codex 进行代码编写、审查、调试和现代化改造。 ## 降低企业 AI 采用的核心壁垒 对于大型企业而言,将前沿 AI 投入生产往往面临安全合规、采购流程、账单集成等多重挑战。OpenAI on AWS 的推出,让企业可以在**已通过内部认证的 AWS 环境**中直接使用 OpenAI 能力,无需额外搭建基础设施或重新审批供应商。这显著缩短了从概念验证到实际部署的周期。 AWS 和 OpenAI 表示,该服务同时支持 **Commercial 和 GovCloud 区域**,满足不同行业的数据驻留与合规要求。 ## 行业反响与下一步计划 包括 **Amgen(安进)** 和 **Autodesk(欧特克)** 在内的企业技术高管已公开表示欢迎,认为此举能帮助企业将更多精力从运营障碍转移到实际业务创新上。 OpenAI 还透露,这仅是双方合作的起点,未来将继续扩展可用能力,包括在网络安全等领域的深度集成。

Hacker News37026天前原文

英伟达在台北国际电脑展上发布了名为 **RTX Spark** 的新款PC CPU,号称“超级芯片”,算力高达 **1 petaflop**,专为运行AI智能体(如 OpenClaw 或 Hermes Agent)而设计。首批搭载该芯片的 Windows PC 将于今年秋季上市,合作厂商包括 **华硕、戴尔、惠普、联想、微软Surface 和微星**,宏碁和技嘉后续跟进。 这些PC配备了与微软联合开发的 **安全沙箱**,可保障智能体运行的安全性,同时具备足够的 CPU、GPU、RAM 及英伟达 CUDA 软件,能本地运行大型语言模型。英伟达表示,其 RTX 技术将为 AI 带来更快性能、更佳画质,并支持超过 **1000 款游戏和应用程序** 的 AI 功能。目前已有 **超过 100 家 Windows 软件开发者** 签约支持新芯片,包括 Adobe、Blender、ComfyUI、Riot Games 和 Xbox。 英伟达CEO黄仁勋的愿景远不止于此——他希望通过这些PC终结“点击和打字”的时代,让用户只需“提问”,PC便能自动完成工作。此前,他在财报电话会上曾提及一个 **2000亿美元** 的新市场:面向AI的CPU销售,而非仅仅GPU。他还预言未来将有“数十亿个智能体”,每个智能体都需要工具,而这些工具就是PC,因此“我们需要更多的CPU”。 值得注意的是,英伟达此前基于ARM架构的Windows设备尝试(如2013年的Surface RT)以失败告终,微软曾为此减记 **9亿美元**。但如今,凭借连续创纪录的季度营收,英伟达的底气已大不相同。

TechCrunch26天前原文