AI 资讯

每日聚合最新人工智能动态

861

被特斯拉起诉后，这家机器人手部初创公司达成和解并获1100万美元融资

新上线

机器人初创公司 **Proception** 在经历了一场与特斯拉的法律纠纷后，不仅达成了和解，还宣布完成了 **1100万美元** 的种子轮融资。该公司专注于开发高灵活度的机器人手部，旨在解决机器人领域最棘手的问题之一：灵巧操作。 ### 从特斯拉诉讼到和解 Proception 的创始人 **Jay Li** 曾是特斯拉 Optimus 人形机器人项目的技术负责人。去年，他被前雇主指控窃取商业机密，用于创立自己的公司。经过数月的法律交锋，双方最终达成和解，特斯拉于本月早些时候撤诉。Li 坦言，被特斯拉起诉并非好事，但他认为这次经历让公司变得更强大，就像一次“压力测试”。 ### 融资与产品发布本周一，Proception 宣布完成 **1100万美元** 的种子轮融资，由 **First Round Capital** 领投，**Y Combinator** 和 **BoxGroup** 参投。同时，公司宣布向研究机构和机器人公司交付首批高灵活度机器人手部产品，并开放更大规模的订单。Li 表示，公司的目标是成为其他机器人公司的顶级手部供应商，帮助他们节省开发灵巧操作技术的时间和资源。 ### 攻克机器人手部难题尽管机器人领域吸引了大量资金和关注，但 Li 认为，真正用于让机器人手部模仿人手的投入还不够。他的前老板、特斯拉 CEO **埃隆·马斯克** 也曾多次强调，机器人手部是尚未解决的最大工程难题之一。马斯克曾表示，Optimus 机器人可能在几年内进入工厂工作，但业界普遍认为，让机器人手部达到人类水平仍需多年。西北大学机器人学教授 Kevin Lynch 预测，这一目标可能还需要 **十年** 时间。 ### 独特的数据收集方法 Li 认为，Proception 能够更快地实现突破，关键在于其独特的数据收集方法。目前，大多数公司使用远程操作员来训练人形机器人——操作员佩戴 VR 头盔，通过机器人视角进行操控。但 Proception 采用了不同的策略，具体细节尚未完全公开。这种创新方法可能成为其加速研发的关键。 ### 前景与挑战 Proception 的机器人手部产品已开始发货，标志着公司从研发阶段迈向商业化。然而，在灵巧操作这一领域，竞争激烈且技术难度极高。能否在短期内实现突破，将决定 Proception 能否在市场中占据一席之地。

TechCrunch22天前原文

862

热成像相机：多年测试后，我发现它是你看不见问题的“省钱超能力”

新上线

经过多年测试，我发现热成像相机不仅是一种酷炫的工具，更是一项能实实在在省钱的“超能力”。最近一次检查就为我省下了1000美元。这些设备能发现肉眼看不见的问题，比如电路过热、房屋漏热等，早期干预可避免大额维修。热成像相机价格从几百到数千美元不等，有独立版、手机内置版和配件式。无论是DIY爱好者还是专业人士，都能从中获益。本文分享了作者的实际经验和选购建议。

ZDNet AI22天前原文

863

索尼Bravia 8 II OLED电视直降600美元：上一代旗舰为何仍值得入手

新上线

索尼Bravia 8 II虽然是上一代机型，但凭借出色的画质和当前600美元的折扣，依然是一款极具竞争力的OLED电视。本文从画质表现、性价比、适用场景等角度分析其购买价值，并给出客观建议。 ## 折扣与价格当前，65英寸版索尼Bravia 8 II在索尼官方渠道售价为**2700美元**，比原价**节省600美元**，折扣幅度接近20%。虽然亚马逊Prime Day已过，但索尼延续了这一优惠，对于错过促销的消费者而言是不错的机会。 ## 画质与性能 Bravia 8 II搭载了索尼成熟的OLED面板和XR认知处理器，能够提供深邃的黑色、精准的色彩以及优秀的动态范围。尽管其峰值亮度可能不及最新旗舰，但在大多数观影场景下，画质表现依然属于顶级水准。对于不追求最新技术参数的用户来说，它完全能满足家庭影院需求。 ## 值得买吗？ - **适合人群**：预算有限但希望获得高端画质的用户；不急于尝鲜新技术、更看重性价比的消费者。 - **不适合人群**：追求最新HDMI 2.1特性（如4K 120Hz可变刷新率）的硬核游戏玩家；对峰值亮度有极致要求的HDR发烧友。 ## 总结 Bravia 8 II在降价后成为中高端市场的有力竞争者。虽然它不是最新款，但索尼的画质调校和OLED的天然优势使其在观看电影、流媒体等内容时体验出色。如果你正在寻找一台大屏OLED电视且不想花费最新旗舰的价格，这款电视值得认真考虑。

ZDNet AI22天前原文

864

一次实验失误，或能颠覆计算方式

新上线

当前 AI 系统依赖 GPU 等传统硬件，能耗惊人——单个 GPU 功耗可达 1000 瓦，而人脑在处理同类任务时能效高出约百万倍。为了突破这一瓶颈，类脑计算（neuromorphic engineering）应运而生，旨在构建模仿神经元与突触的电子器件。然而，无论是新型实验器件还是 CMOS 晶体管模拟方案，都面临可靠性或集成度不足的问题。近日，研究人员在一次意外的实验室失误中，发现了一种简单高效的神经形态器件，它能像脑细胞一样工作，且制造工艺与传统半导体兼容。这一发现可能为低功耗、高性能计算打开新的大门。 ## 意外发现：从失误到突破在尝试制造新型忆阻器时，研究团队因操作失误导致材料层结构异常。但测试结果令人震惊：这种“错误”的器件展现出了**类似生物神经元的积分-点火特性**，且能耗极低。与需要数十个晶体管才能模拟一个神经元不同，这个单器件就能实现关键功能，**功耗仅为微瓦级别**。 ## 类脑计算的核心挑战传统神经形态方案面临两难：新型材料（如相变存储器、铁电晶体管）虽能模仿突触可塑性，但稳定性差、难以大规模集成；而 CMOS 模拟方案虽工艺成熟，但模拟一个神经元需 20-100 个晶体管，导致芯片面积大、功耗高。 ## 新器件的优势该意外发现的器件采用**标准硅基工艺**，结构简单，可直接与现有 CMOS 电路集成。它不仅能模拟神经元的时空整合功能，还能实现**突触权重更新**，这意味着一个器件即可完成传统方案中多个元件的工作。初步测试显示，其能效比传统 GPU 提升 **三个数量级**。 ## 前景与局限尽管成果令人兴奋，但该器件目前仅在实验室环境中验证，距离实用化仍有距离。团队需要解决器件一致性、长期可靠性以及大规模互联等问题。不过，这一“美丽的错误”已经为类脑计算提供了极具潜力的新方向——用最简单的结构，逼近生物大脑的效能。

IEEE AI22天前原文

865

Omen AI 用“水”优化数据中心：监测冷却液，防止细菌暴发

新上线

AI 算力需求激增，数据中心运营商想尽办法压榨每一块 GPU 的潜力，却意外催生了一个新问题：**细菌暴发**。液冷芯片的冷却液是水和抑菌剂的混合物。为了让芯片运行得更热，管理员可以增加水的比例（水吸热更好），但这会引发严重的污染，堵塞管路。传统解决方案是冲洗系统，这意味着关停机架长达五六小时，潜在损失高达数百万美元。 **Omen AI 提供了一种新思路**：用微型光谱仪实时监测冷却液健康状态，在细菌大量繁殖前就发出警报。CEO 兼创始人 Zach Laberge 表示：“你不再因为对化学状态一无所知而冒巨大停机风险。” 今天，Omen AI 宣布完成 **3100 万美元 A 轮融资**，由 Nava Ventures 领投，CRV、范德比尔特大学、曼胡默尔、Starhill Holdings、Hard Launch Capital 以及来自普利司通、通用汽车、江森自控、TensorWave 的高管个人跟投。 Laberge 的创业经历颇为传奇：2020 年他 14 岁时创立第一家公司，为工程机械安装传感器，融资 300 万美元，甚至为此从高中辍学（父母均支持）。那家公司倒闭后，他于 2024 年创立 Omen，最初聚焦流体系统，让工程机械智能预知维修需求——用实时监测取代耗时取样送检。除了细菌，该设备还能通过检测铜、铬等元素发现泵磨损，通过硅元素发现密封件问题。卡特彼勒经销商是 Omen 重型机械业务的早期客户，而卡特彼勒也是数据中心现场发电用的燃气轮机的主要供应商。Omen 很快发现了新方向。Laberge 说：“大约半年前，很多经销商开始问，‘我们在涡轮机上装传感器了，你们能不能也看看建筑侧？’”Omen 发现，数据中心建筑里充满了流体——从 HVAC 系统到芯片冷却。这笔融资将帮助 Omen 从工程机械跨界到数据中心基础设施，用“水”的智慧优化这个 AI 时代最关键的资源。

TechCrunch22天前原文

866

想进大厂？初创公司或许才是你更好的选择——原因在此

新上线

AI 正在重塑科技行业的招聘格局，而小型公司可能正提供当下最好的机会。 ## 大厂光环褪色，初创公司崛起过去几年，大型科技公司一直是求职者的首选目标：高薪、稳定、品牌光环。然而，随着 AI 技术的快速渗透，这一局面正在发生根本性转变。**大型企业普遍进入“效率优化期”**——裁员、冻结招聘、缩减非核心项目成为常态。与此同时，**初创公司却在 AI 浪潮中展现出更强的灵活性和增长潜力**。 ## 为什么初创公司现在更具吸引力？ 1. **更快的决策与落地**：在 AI 领域，技术迭代以周甚至天为单位。初创公司没有冗长的审批流程，工程师可以快速将想法转化为产品。对于想要深度参与 AI 实践的人才来说，这种“高密度工作”反而更有价值。 2. **更大的责任与成长空间**：在初创公司，一名工程师可能同时负责模型训练、部署和产品化，这种**全栈式 AI 技能**的锻炼机会在大厂往往需要数年才能获得。 3. **股权与潜在回报**：虽然初创公司的现金薪资可能不及大厂，但**股权激励**在 AI 创业潮中可能带来指数级收益。多家 AI 独角兽的早期员工已通过期权实现财富自由。 4. **避开“AI 裁员潮”**：大厂正在用 AI 替代部分岗位，而初创公司则在创造新岗位——从数据标注到模型微调，从 AI 安全到行业应用，需求旺盛。 ## 行业数据与趋势根据多家招聘平台的数据，2024 年**AI 相关岗位在初创公司的增长率达到 40%**，而大厂仅增长 12%。同时，初创公司对 AI 人才的需求更偏向**应用层**——包括 AI 产品经理、提示工程师、行业解决方案专家等，而非纯研究岗位。 ## 挑战与风险当然，初创公司并非完美。**稳定性较差**、资源有限、品牌溢价不足是主要短板。对于追求工作生活平衡或需要 H1B 签证支持的求职者，大厂可能仍是更稳妥的选择。 ## 结论：个人选择需匹配阶段 AI 时代的招聘分化，本质是**技术红利从巨头向创新者转移**的缩影。如果你渴望参与前沿技术落地、愿意承担一定风险，并希望快速积累实战经验，初创公司无疑是当前最值得考虑的路径。反之，若更看重稳定和体系化培训，大厂依然有其不可替代的优势。 > 关键不在于“大厂还是初创”，而在于**你的职业目标与 AI 技术演进节奏是否合拍**。

ZDNet AI23天前原文

867

索尼 WH-1000XM6 对比森海塞尔 Momentum 5：我用了数月，这是最终推荐

新上线

索尼 WH-1000XM6 和森海塞尔 Momentum 5 都是旗舰级头戴式降噪耳机，在音质、续航和设计上各有千秋。经过数月深度使用，我发现选择哪款主要取决于你的使用场景。如果你追求最佳的主动降噪和智能功能，索尼是更稳妥的选择；而如果你对音质的纯粹性和声场表现有更高要求，森海塞尔会带来更沉浸的听觉体验。 ## 音质对比：细节与氛围的博弈森海塞尔 Momentum 5 在声音调校上延续了品牌一贯的均衡风格，中高频通透自然，人声还原度极高，尤其适合古典、爵士和原声乐器为主的曲目。低频量感适中，但下潜和弹性出色，不会掩盖其他频段。相比之下，索尼 WH-1000XM6 的低频更饱满有力，适合流行、电子和摇滚等节奏感强的音乐，但部分用户可能会觉得低频稍显过量。 ## 降噪与智能功能：索尼的杀手锏索尼在降噪领域的技术积累使其 WH-1000XM6 在主动降噪性能上依然领先。自适应声音控制功能可以根据环境自动调整降噪强度，而 Speak-to-Chat 功能在用户说话时自动暂停音乐并切换至环境音模式，非常实用。森海塞尔的降噪能力同样出色，但算法更保守，对高频噪音的抑制稍弱，不过其透明模式自然度更佳。 ## 佩戴舒适度与续航两款耳机在长时间佩戴舒适度上都表现优秀。索尼的耳罩更柔软，压力分布更均匀，适合长时间使用。森海塞尔则采用更轻量化设计，头梁包裹性更好。续航方面，索尼官方标称 40 小时（降噪开），森海塞尔为 60 小时，实际使用中两者差异不大。 ## 选购建议 - **优先降噪与智能体验**：选索尼 WH-1000XM6，它的降噪深度和自适应功能在通勤、办公等嘈杂环境中优势明显。 - **优先音质与声场**：选森海塞尔 Momentum 5，它的声音细节和分离度更胜一筹，适合安静环境下欣赏音乐。 - **预算与生态**：两者价格相近，但索尼与手机 App 的联动更丰富，森海塞尔则支持蓝牙 5.4 和更高规格的编解码器。最终选择没有绝对好坏，只有是否适合你的使用习惯。建议线下试听后再做决定。

ZDNet AI23天前原文

868

美国如何用工程思维塑造主权：自力更生是一场持久战

新上线

在全球化与技术竞争交织的当下，**主权**与**自力更生**再次成为美国政策与产业界的核心议题。近日，IEEE Spectrum发表了一篇来自系统工程师、**《棘手问题：如何工程化一个更美好的世界》**作者**Guru Madhavan**的观点文章，探讨了美国历史上如何通过工程手段构建主权，并指出这种自力更生并非一蹴而就，而是一项持续的任务。 ## 工程与主权的历史交织文章开篇即点明：**主权并非天然存在，而是被“工程化”出来的**。从19世纪的跨洲铁路到20世纪的州际公路系统，从曼哈顿计划到阿波罗登月，美国在关键基础设施与科技领域的自主能力，往往是通过大型工程项目的推动而逐步建立。这些项目不仅解决了物理连接与国防安全问题，更在制度、人才与产业链层面塑造了国家的独立韧性。Madhavan强调，工程思维——即系统性地定义问题、整合资源、迭代方案——是国家主权建设的重要工具。 ## 自力更生的现实挑战然而，历史上的成功并不意味着今日可以高枕无忧。文章指出，**当代的供应链脆弱性、技术依赖与人才短缺**正在考验美国的主权基础。半导体制造、稀土材料、人工智能算法等关键领域，美国对海外来源的依赖程度远超过去。Madhavan认为，真正的自力更生不是追求100%的自给自足，而是**在关键节点上具备替代能力与快速恢复能力**。这需要政府、产业与学术界的持续协作，以及长期的投资耐心。 ## 现状与应对当前，美国通过《芯片与科学法案》等政策试图重振本土制造业，但Madhavan提醒，**硬件之外，软件与系统层面的主权同样重要**。例如，在AI领域，训练大模型所需的算力与数据往往依赖跨国云服务，这构成了新的依赖关系。他建议，应当借鉴历史上**国防高级研究计划局（DARPA）** 的模式，设立跨领域的工程创新机构，聚焦“卡脖子”技术的突破，并建立从基础研究到产业化的快速转化通道。 ## 小结：主权是动态工程 Madhavan总结道，**主权不是一次性的成就，而是一个需要不断维护与更新的动态系统**。就像软件需要持续打补丁，国家的主权工程也需要根据技术环境的变化而调整。对于AI从业者而言，这意味着不仅要关注算法与模型的进步，更要思考如何在开源生态、数据主权与算力基础设施上构建自主可控的闭环。未来的竞争，将是“工程化主权”能力的竞争。

IEEE AI23天前原文

869

你家的插座严重被低估了：7款即插即用神器，轻松提升居家体验

新上线

家里的墙壁插座，除了给手机充电，还能做什么？其实，只需插入一个小小的设备，就能让普通插座变身智能家居的起点、安全防护的前哨，甚至收纳整理的好帮手。本文精选7款即插即用的小工具，它们价格亲民，却能显著提升日常生活的便利性与舒适度。 ## 1. 空间魔术师：Merkury Slim Wall Adapter **售价：$10** 传统插头又大又笨，经常挡住相邻插座。Merkury Slim Wall Adapter 采用超薄设计，插入后几乎与墙面齐平，不仅释放了空间，还能让插座面板更整洁。对于床头柜、书桌等插座紧张的区域，这个小配件堪称“空间救星”。 ## 2. 智能管家：Kasa Smart Plug Ultra Mini 15A 4-Pack **售价：$38（原价$45，节省$7）** 想体验智能家居，智能插座是最低门槛。Kasa 这款迷你智能插座支持15A大电流，可通过手机App远程控制开关、设置定时或倒计时。配合语音助手，还能实现“一句话关灯”的便捷体验。4件套覆盖客厅、卧室、厨房，轻松打造自动化场景。 ## 3. 快充专家：Anker 33W 2-Port Wall Charger **售价：$19** Anker 这款充电器提供33W总功率，双口（USB-C + USB-A）设计，可同时为手机和耳机快充。采用GaN技术，体积比传统充电器更小巧，旅行携带也方便。对于多设备用户，它让插座不再“打架”。 ## 4. 安全卫士：Ting Fire Sensor **售价：$99** 电气火灾隐患往往无声无息。Ting Fire Sensor 插入插座后，能持续监测电路中的电弧故障（可能由老化线路或破损电线引起），一旦检测到异常，立即通过手机App发出警报。它由UL认证，并附赠保险服务，为家庭安全增添一道智能防线。 ## 5. 桌面整理官：Anker Flat Surge Protector **售价：$28** 传统插线板线缆杂乱，Anker 这款扁平设计防浪涌插座可紧贴墙面或桌面，自带USB-C/A快充口，并配有可旋转插头，适应狭小空间。防浪涌功能保护贵重设备，同时保持桌面整洁。 ## 6. 宠物好帮手：Whisko LitterGuard Pro **售价：$40（原价$50，节省$10）** 养猫家庭常为猫砂盆异味烦恼。Whisko LitterGuard Pro 是一款插入式空气净化器，专为猫砂盆设计，采用活性炭过滤和离子技术，持续净化周围空气。它体积小巧，直接插在插座上，无需占用额外空间。 ## 小结从几美元的适配器到百元级别的安全传感器，这7款产品覆盖了空间优化、智能控制、快充、安全、整洁和宠物护理等多个生活场景。它们无需复杂安装，即插即用，却能让家中每个插座都发挥更大价值。如果你也想以低成本提升居家体验，不妨从其中一款开始。 *注：价格和优惠信息来自原文，实际购买时请以电商平台为准。*

ZDNet AI23天前原文

870

免费让你的 Linux 看起来像 macOS：Zorin OS 简单调整指南

新上线

如果你喜欢 macOS 的界面，但又想迁移到 Linux，Zorin OS 提供了一个免费的解决方案。本文介绍如何通过几个简单的调整，让 Zorin OS 看起来几乎和 macOS 一模一样，无需购买 Pro 版本。 ### 为什么选择 Zorin OS？ Zorin OS 是一款基于 Ubuntu 的 Linux 发行版，以其对 Windows 和 macOS 用户友好的设计而闻名。它的默认界面类似于 Windows，但内置了强大的自定义功能，可以让用户轻松切换到 macOS 风格。 ### 免费实现 macOS 外观的步骤 1. **安装 Zorin OS**：首先，你需要从官方网站下载并安装 Zorin OS 的免费版本（Core 或 Lite）。 2. **调整主题和图标**：Zorin OS 提供了“Appearance”设置，你可以在这里选择“MacOS”主题和图标包。如果默认选项不够，可以安装第三方主题。 3. **修改 Dock 和面板**：将底部的任务栏移动到屏幕底部或侧面，并调整其样式以模仿 macOS 的 Dock。Zorin OS 的“Extensions”工具可以帮助你实现这一点。 4. **添加全局菜单**：macOS 的全局菜单栏是一个标志性特征。通过安装“Global Menu”扩展，你可以让应用菜单显示在顶部面板中。 5. **调整窗口按钮**：将窗口控制按钮（关闭、最小化、最大化）从右侧移到左侧，并修改图标样式。 ### 注意事项 - 免费版本可能需要手动安装一些扩展和主题，而 Pro 版本（付费）提供了更简便的一键切换功能。 - 自定义过程中，建议备份系统设置，以免出错。 ### 总结通过以上调整，你可以在 Zorin OS 上获得接近 macOS 的体验，而且完全免费。这对于那些喜欢 macOS 美学但希望享受 Linux 自由和安全的用户来说，是一个绝佳的选择。

ZDNet AI23天前原文

871

这款人形机器人，成了办公室里的“恐怖实习生”

新上线

人形机器人能跑、能跳、偶尔还能踢人，但要真正像人一样工作，它们还得学会开门、爬楼梯、搬箱子这些琐事。由前英伟达（Nvidia）机器人研究员创立的瑞士初创公司 **Flexion Robotics** 声称找到了解决方案。 Flexion 的核心思路是：先在仿真环境中训练机器人掌握单个技能，再由一个主 AI 算法决定如何组合使用这些技能。大多数演示视频中，人形机器人经过专门训练（如叠衬衫、上货架），背后通常有远程操控（teleoperation）支持，但这种方法在陌生环境中并不可靠。Flexion 自称其系统不同且更高效，因为它依赖仿真训练和有限的人工指令。在一段展示视频中，一台改装的 Unitree 人形机器人接收指令后自主运行：“一份零食包裹已送达 Flexion。请使用楼梯取回，再乘电梯上来。然后拆包，将物品放入零食区空抽屉。” Flexion 的方法整合了多种 AI 系统：主 AI 模型通过消化人类执行不同任务的视频来规划工作；软件将仿真中学到的技能与视频中的动作匹配，并在现实世界中执行。例如，要到达办公室邮件室，模型可能需要学会开门和使用电梯。系统还控制机器人的电机，使其能够行走、移动四肢并保持平衡。据 Flexion 联合创始人兼 CEO、前英伟达机器人研究科学家 **Nikita Rudin** 介绍，软件的“秘密武器”是大量使用强化学习（reinforcement learning），通过试错让计算机掌握任务。从主 AI 模型到仿真再到电机控制，每一层都采用了这种技术。科技领袖如埃隆·马斯克和 Jensen Huang 认为，人形机器人将对经济产生巨大影响，因为它们可以替代人类从事重复性劳动。Flexion 的“实习生”虽仍显笨拙，但已展现出在真实办公环境中执行多步骤任务的潜力。

WIRED AI23天前原文

872

不可观测状态与受限决策时点下的马尔可夫赌博机学习

新上线

## 研究背景与问题定义在在线学习领域，**马尔可夫赌博机（Markovian bandits）** 是一类重要的模型，其特点是每个臂（arm）的状态按马尔可夫链演化。然而，现有工作通常假设状态可观测且决策时点无约束。本文《Learning in Markovian bandits with non-observable states and constrained decision epochs》首次系统研究了**状态不可观测**且**决策时点受限**的场景下的遗憾最小化问题。作者聚焦于**纯遗憾基准（pure regret benchmark）**，即比较学习算法的性能与最优**纯策略**（pure policy）——该策略类似经典随机赌博机的最优策略，从头到尾选择同一个最优臂，绝不切换。这一设定简化了分析，但已能揭示核心挑战。 ## 核心贡献：自退化马尔可夫赌博机与遗憾下界论文提出了**自退化马尔可夫赌博机（self-degrading Markovian bandits）** 这一新概念，它是经典休憩型（rested）马尔可夫赌博机的推广。在该模型中，纯策略总是渐近最优的，这为后续理论分析提供了基础。一个重要发现是：**若算法极少切换臂，则其遗憾必然超对数增长**，即 $\omega(\log(T))$（$T$ 为学习时域）。这意味着在状态不可观测且决策受限时，对数遗憾（如经典 UCB 算法）在无先验知识的情况下是不可达的。 ## 算法设计与遗憾上界面对这一下界，作者设计了 **UCB-NOM**（Upper Confidence Bound for Non-Observable Markovian bandits），一种基于乐观原则的算法。其遗憾接近对数形式，具体表现为： - **无先验知识时**：遗憾为 $O(\log(T) \cdot \text{某个因子})$，略高于对数但未达超对数下界。 - **给定先验知识时**：若已知臂的偏差函数（bias function）的界，则 UCB-NOM 可实现 **$O(\log(T))$ 的遗憾**，且最坏情况遗憾为 $O(\sqrt{T \log(T)})$。值得注意的是，**遗憾界不依赖于马尔可夫链的状态数**，这大大增强了算法的实用性。 ## 行业意义与展望该工作揭示了状态不可观测性在自退化马尔可夫赌博机中仅是“轻微不便”，而非根本性障碍。对于实际应用——如推荐系统、临床试验、通信网络中的资源分配——这意味着即使无法观测用户状态或系统内部状态，仍可通过精心设计的算法获得接近最优的性能。未来方向包括：扩展到更一般的纯策略不一定最优的模型，以及考虑有限切换次数下的遗憾分析。 > **一句话总结**：本文证明了在不可观测状态和受限决策时点的马尔可夫赌博机中，超对数遗憾下界不可避免，但 UCB-NOM 算法可达到近乎对数的遗憾，且不依赖状态数。

HuggingFace23天前原文

873

Prism Transformer：渐进式多头注意力机制，突破Transformer结构瓶颈

新上线

Transformer架构中的多头注意力机制通常在每个层均分隐藏维度，导致所有头共享相同的子空间维度（dh = dmodel/h）。这种均匀分配被视为一种结构性瓶颈：早期层的头因维度受限，难以捕捉复杂的高维上下文模式。为此，研究者提出了 **Prism Transformer**，一种新型架构，用渐进式头调度替代静态均匀配置。通过逐层单调增加头的数量，Prism Transformer 自然形成了从局部到全局的表征层次：早期层使用更少但更宽的“头”来捕捉复杂的局部组合模式，而深层则部署大量窄头，将这些模式分解为专门的语言特征。关键在于，这种结构变化是参数中性和计算中性的，不引入任何训练或推理开销，保持了与标准Transformer相同的权重矩阵和FLOP预算。在三种模型规模（124M、354M、757M参数）上，Prism Transformer 持续优于均匀基线，验证损失降低，并在多个零样本下游基准（包括PIQA、HellaSwag、ARC-Easy和WinoGrande）上取得增益。实验表明，非均匀子空间分配能够释放标准Transformer预算内的潜在容量，使模型能力得到更有效的利用。 ## 核心创新点 - **渐进式头调度**：头数随层数增加，早期层头少维度高，深层多头维度低，形成层次化表征。 - **零额外开销**：不增加参数或计算量，仅改变注意力头的分配方式。 - **一致性能提升**：在多种规模下验证，证明非均匀分配的有效性。 ## 行业意义这一工作挑战了Transformer中“均匀分配”的默认假设，为改进注意力机制提供了新思路。它不依赖额外数据或计算资源，即可提升模型性能，对资源受限场景尤为实用。未来，Prism Transformer 有望与稀疏注意力、混合专家模型等技术结合，进一步推动高效Transformer的发展。

HuggingFace23天前原文

874

几何感知傅里叶神经算子：破解周期域上三次非线性薛定谔方程的共振难题

新上线

近日，arXiv 上发布了一项新研究（arXiv:2606.27459），提出了一种**几何条件化的傅里叶神经算子**，用于求解二维平坦环面上的三次非线性薛定谔方程。该工作的核心创新在于：通过将环面的**纵横比参数**显式纳入算子学习框架，使得模型能够捕捉不同几何形状下截然不同的高频级联行为。 **问题背景** 在二维环面上，NLS 方程的动力学强烈依赖于环面的纵横比。当纵横比为有理数时，傅里叶共振结构丰富，能量可以高效地向高频模式传递，导致 Sobolev 范数快速增长；而当纵横比为无理数时，共振受限，能量传递受到抑制，解的行为更为温和。传统数值方法需要精细分辨这种几何效应，计算成本高昂。 **方法亮点** 研究者设计了一个**几何条件化 FNO**，其输入不仅包含解的实部和虚部，还额外拼接了纵横比参数 $\omega^2$。模型通过端到端训练学习一步时间推进算子，并在随机相位初始条件生成的未见轨迹上进行评估。训练数据采用傅里叶伪谱方法生成，保证了高频分辨率的准确性。 **实验结果** 数值实验表明，该学习算子成功复现了两种几何下的关键动力学特征： - **有理环面**：Sobolev $H^2$ 范数显著增长，反映强烈的能量级联； - **无理环面**：$H^2$ 范数增长受限，行为更接近平滑解。这一结果与理论分析（如 Hrabski 等人 2021 年的工作）高度一致。 **消融研究** 作者还进行了系统的消融实验，考察了保留傅里叶模态数、激活函数、傅里叶层深度以及显式几何条件的影响。关键发现包括： - **引入 $\omega^2$ 参数**显著提升了长期预测精度，尤其对有理几何效果更为明显； - 较深的傅里叶层有助于捕捉复杂的非线性相互作用，但存在过拟合风险； - 激活函数的选择对收敛速度和最终精度有一定影响，GELU 表现优于 ReLU。 **意义与展望** 这项工作展示了**几何感知的神经算子**在非线性色散偏微分方程中的潜力。它不仅为 NLS 方程的数值求解提供了新工具，也为更广泛的**谱传输现象**（如等离子体物理、光学中的湍流）的机器学习建模开辟了道路。未来可将该方法推广至三维情形或更复杂的非线性项，并探索与物理信息网络的结合。

HuggingFace23天前原文

875

多重中介者之咒：激活修补中隐藏的交互效应

新上线

## 激活修补的盲点：自然间接效应并非“纯粹” 在机械可解释性领域，**激活修补（Activation Patching）** 是归因模型行为至具体组件的核心工具。其通过估计**自然间接效应（NIE）** 来衡量单个组件对模型输出的因果贡献。然而，一篇来自 arXiv 的新论文指出：NIE 并非仅仅捕捉通过该组件的因果效应——它同时包含了**交互效应（INT）**，即该组件的因果效应本身如何依赖于模型中其他组件的状态。 ## 交互效应从何而来？论文重新从因果中介分析推导了激活修补的估计量，发现 NIE 实质上混合了“纯间接效应”和“交互效应”。INT 衡量的是：当其他组件处于“干净”或“修补”状态时，同一组件的因果影响可能截然不同。这种依赖关系意味着，单个组件的“重要性”并非固有属性，而是随上下文动态变化。 ## 为何无法简单消除？面对 INT，直觉上的补救措施——如调整估计器或改变分析单元——均存在可预见的失效模式。作者在 **GPT-2 的 IOI（间接对象识别）电路** 上进行了实证： - 某些组件的因果重要性在状态依赖下要么完全不可见（被低估），要么被人为放大（虚假归因）。 - **INT 的方差** 解释了此前文献中报告的**忠实度分数不稳定性**——当交互效应显著时，同一组件在不同 prompt 下的归因结果可能剧烈波动。 ## 理论根源与可预测性论文从数学上证明： - INT 的大小与**干净激活和修补激活之间的距离**成正比。即，当修补引入的扰动越大，交互效应越强。 - 当模型在局部满足**仿射（affine）性质**（如线性层）时，INT 可忽略；但在非线性激活函数（如 ReLU、LayerNorm）作用下，INT 必然存在。 - INT 可**组合分解**为两两交互、三阶交互乃至更高阶的组交互。这意味着，即使每个组件的单独效应看似稳定，组合后仍可能涌现出显著的非线性因果依赖。 ## 是噪声，还是信号？论文的核心观点是：INT 不应被视为需要消除的“噪声”，而应作为可解释性研究中的**诊断工具**。 - **个体及组级别的 INT 符号与大小** 可提示因果结论是否**依赖于特定 prompt**。如果 INT 显著，则说明该组件的作用仅在特定上下文中成立。 - 当研究采用**贪心的 NIE 排序**来寻找重要组件时，INT 的存在意味着**仅靠单次修补会遗漏那些只有通过组合搜索才能发现的机制**。例如，两个组件各自 NIE 很小，但它们的交互效应却共同驱动了模型行为。 ## 对可解释性研究的启示这项研究揭示了当前机械可解释性方法的一个根本性局限：**线性归因假设在非线性模型中可能失效**。未来的研究可能需要： 1. 将交互效应显式纳入因果归因框架，例如报告 NIE 与 INT 的分解结果。 2. 开发能够捕捉高阶交互的搜索算法，而非仅依赖逐组件修补。 3. 对 prompt 的选择更加谨慎——在单一 prompt 上得出的因果结论可能无法泛化。总之，论文提醒社区：**组件间的依赖关系不是需要规避的麻烦，而是理解模型内部协同机制的关键线索。**

HuggingFace23天前原文

876

OverFlowLight：实时预防城市交叉口拥堵并优化交通信号的新框架

新上线

## 引言城市交通拥堵中，**队列溢出**是一个严重问题——当车辆排队长度超过交叉口容量时，会阻塞上游交通，引发连锁式交通瘫痪。现有的交通信号控制（TSC）算法大多以优化通行效率为目标，在高峰时段往往无法有效应对溢出，反而加剧拥堵并带来安全隐患。 ## 方案：OverFlowLight 针对这一痛点，研究团队提出了 **OverFlowLight**，一个实时框架，旨在预防性地解决队列溢出并提升整体 TSC 性能。该框架首先利用摄像头和雷达的多模态感知，实时准确检测溢出状态。一旦检测到溢出，系统会动态生成并插入专用溢出相位到信号周期中，以清除阻塞队列。其核心是**混合控制设计**：快速基于规则的溢出干预与强化学习等控制器后端相结合，兼顾短期应急和长期效率。 ## 实际部署与效果研究团队在 **三个主要城市的 43 个交叉口** 进行了大规模真实部署。结果表明，与现有基线相比，OverFlowLight 将溢出事件减少了 **60.4%**，网络通行能力提升了 **18.2%**。同时，它大幅减少了专家调优信号方案所需的人工干预。 ## 行业意义这项工作首次提出了一个**实用、可扩展、数据驱动**的主动预防交通瘫痪框架，为构建韧性与高效的城市交通系统提供了关键组件。其模块化设计可无缝集成到现有基于强化学习的 TSC 系统中，具有良好的实际应用前景。

HuggingFace23天前原文

877

RANSAC评分新范式：无需预设内点尺度，精度与鲁棒性双双提升

新上线

计算机视觉领域广泛使用的RANSAC（随机采样一致性）算法，其核心步骤——模型评分——长期依赖一个关键参数：**内点尺度**（inlier scale）。该参数需要用户预先设定，或从被污染的数据中估计，而估计本身又容易受异常值干扰，形成“先有鸡还是先有蛋”的困境。近日，来自德国基尔大学等机构的研究者在arXiv上提交了一篇论文，提出了一种**真正摆脱内点尺度依赖**的新型RANSAC评分方法，为这一经典问题提供了优雅的数学解。 ## 核心创新：从“估计尺度”到“边缘化尺度” 传统RANSAC变体（如MSAC、MAGSAC）的评分函数，无论是简单的内点计数还是带饱和函数的逐点得分，都隐含或显式地依赖于一个阈值参数，该参数本质上是内点尺度的函数。新方法的关键思路是**反转推理顺序**：不再先估计尺度再用其评分，而是通过共轭先验（Inverse-Gamma分布）将内点尺度在闭合形式下解析地边缘化（marginalize），然后直接优化数据划分（即哪些点是内点）。这一数学处理带来了几个显著优势： - **单一公式覆盖多种先验**：从无信息的Jeffreys先验到有信息的经验贝叶斯先验，同一个评分函数可以自适应地切换，无需修改算法。 - **计算高效**：评分函数可通过排序扫描（sort-and-sweep）实现 **O(N log N)** 的复杂度，与经典方法相当。 - **参数真正“消失”**：这是第一个在评分公式中完全不出现内点尺度的RANSAC变体。 ## 实验验证：近7万图像对上的全面碾压研究团队在包含近7万对图像的基准测试上进行了评估，覆盖了多种双视图估计问题（如基础矩阵、本质矩阵、单应矩阵估计），并使用手工特征（SIFT）和深度学习特征（SuperPoint+SuperGlue）两种管线。结果令人印象深刻： 1. **阈值误标定下的鲁棒性**：当用户提供的阈值偏离真实值时，传统方法（RANSAC、MSAC、GaU、MAGSAC）的准确率急剧下降，而新方法的性能**几乎保持平坦**。 2. **极低数据量下的高效性**：在仅用**2对验证点**进行模型选择时，新方法即可达到接近最优的精度，而基线方法通常需要**约100倍**的验证数据。 3. **先验正则化的自适应收紧**：当验证数据稀缺时，评分函数会自动加强先验的正则化作用，防止过拟合。 ## 行业意义与未来展望 RANSAC自1981年提出以来，一直是计算机视觉中鲁棒估计的基石。其评分环节的尺度依赖问题虽被长期认知，但始终缺少一个既理论严谨又计算可行的解决方案。这项工作不仅从数学上填补了这一空白，更在实用层面展示了巨大的潜力： - **降低用户调参门槛**：对于非专业用户，无需再为不同场景手动调整内点阈值。 - **提升自动化管线稳定性**：在SLAM、三维重建、视觉定位等需要大量自动处理的系统中，一个对参数不敏感的评分函数能显著减少故障率。 - **适应数据稀缺场景**：在只有少量匹配对的极端条件下（如纹理匮乏或视角剧烈变化），新方法仍能可靠工作。当然，论文也指出该方法目前主要在双视图几何估计上验证，未来可以扩展到更复杂的多视图问题。此外，边缘化框架理论上也适用于其他需要阈值参数的任务，如点云配准中的RANSAC变体。总的来说，这项研究以简洁的数学形式解决了RANSAC领域一个存在四十余年的痛点，堪称“评分问题”的终极解法。对于计算机视觉从业者而言，这是一个值得密切关注并尝试集成到现有管线中的新工具。

HuggingFace23天前原文

878

统一零样本时间序列预测：Darts 基础模型

新上线

时间序列分析是机器学习的重要分支，广泛应用于金融、气象、物联网等领域。自 2020 年首次发布以来，**Darts** 已成为最受欢迎的开源 Python 时间序列库之一。然而，随着 Chronos-2、TimesFM 2.5、TiRex、PatchTST-FM 等基础模型相继涌现，零样本预测能力显著提升，却因接口碎片化、缺乏互操作性而难以集成。近日，Darts 团队在 arXiv 发布论文《Unified Zero-Shot Time Series Forecasting: A Darts Foundation》，提出统一 **FoundationModel** 类集合，将上述主流基础模型封装为标准化接口，实现“只需改个名字”即可在现有 Darts 流水线中调用。 ## 零样本预测的范式转移传统时间序列预测需要针对每个数据集训练定制模型，成本高、泛化差。基础模型通过海量数据预训练，可直接用于未见过的任务，无需微调即可取得竞争性结果。但问题在于：每个模型都有独立的 API、预处理逻辑和输出格式，用户被迫在多个代码库间切换。 ## Darts 的解决方案 Darts 的 FoundationModel 类提供了**全周期预测接口**，涵盖零样本推理、微调、不确定性估计和回测。用户只需将模型名称从 `ARIMA` 改为 `Chronos-2`，即可体验零样本能力。新流水线也能无缝集成数据处理与评估工具。论文以 Chronos-2、TimesFM 2.5、TiRex、PatchTST-FM 为例，展示了统一框架如何降低使用门槛。例如，在能源负荷预测任务中，零样本模型的表现已接近甚至超越领域专用模型，且无需重新训练。 ## 行业意义与未来这项工作的核心价值在于**生态整合**。Darts 作为已有庞大用户基础的库，其统一接口有望加速基础模型在工业界的落地。未来，更多模型（如 Lag-Llama、MOMENT）可能被纳入，推动时间序列预测向“预训练+零样本”范式全面转型。对于开发者而言，这意味着更少的代码、更高的复用性；对于业务方，则意味着更快地从数据中获取洞察。基础模型不再是孤立的“黑盒”，而是可组合、可评估的标准化组件。

HuggingFace23天前原文

879

PairSAE：破解蛋白质共折叠模型中成对表征的“黑箱”

新上线

蛋白质结构预测的基础模型（如AlphaFold、Boltz-2）在生物分子结构预测和设计方面展现了惊人能力，但模型内部特征如何驱动输出仍是一个难题。标准稀疏自编码器（SAE）在Transformer序列嵌入上表现良好，但无法直接应用于Pairformer架构——对成对表征进行朴素操作会导致特征数量二次爆炸，并掩盖跨序列和成对表征分布的概念。来自哈佛医学院、MIT等机构的研究人员提出了**PairSAE**，一种专门为Pairformer架构设计的机械可解释性方法。PairSAE通过**N模式奇异值分解（N-mode SVD）**将成对张量总结为“token级交互角色”，然后使用稀疏自编码器学习一组共享的token级特征，这些特征可以解码回序列和成对表征。在**Boltz-2**模型处理**PLINDER蛋白质-配体复合物数据集**的激活值上评估，PairSAE能够提取出与**UniProt注释**对齐的可解释特征，并预测Boltz-2的亲和力值。这表明PairSAE成功将结构生物学基础模型的潜在空间与可解释的结构概念联系起来，阐明了模型“知道什么”，同时避免了传统SAE在Pairformer架构中遇到的陷阱。该研究已被**机器学习结构生物学研讨会（MLSB 2025）**接收。 ## 核心挑战：为什么标准SAE在Pairformer上失效？蛋白质共折叠模型（如Boltz-2）使用**Pairformer架构**，其核心是处理成对表征——即描述每对残基（或原子）之间相互作用的张量。这种表征天然是二次的（N×N），并且与序列表征（1D）深度耦合。标准SAE假设特征可以独立地从单一模态嵌入中学习，但直接应用于成对表征时面临两个问题： 1. **二次爆炸**：如果对每个成对元素独立学习特征，特征数量会随序列长度平方增长，计算和存储开销巨大。 2. **概念割裂**：许多生物概念（如结合位点）同时涉及序列信息和成对交互信息，标准SAE无法联合建模这种分布式表征。 ## PairSAE：两步走，让成对表征“透明化” PairSAE的核心思想是将高维成对张量压缩为token级的低维“交互角色”，再通过SAE学习共享特征。具体分为两步： ### 1. N模式SVD降维将成对张量视为一个三维张量（token×token×特征通道），通过N模式SVD将其分解为三个因子矩阵。其中，token模式上的因子矩阵提供了每个token的“交互角色向量”，这些向量编码了该token与其他所有token的交互模式。通过保留前k个奇异值，实现了从O(N²)到O(Nk)的压缩（k远小于N）。 ### 2. 共享稀疏自编码器将token级角色向量与序列表征拼接，输入到一个稀疏自编码器中。该自编码器学习一组稀疏的、可解释的token级特征，这些特征同时解码回序列表征和成对表征。由于特征是在token级别学习的，它们自然地捕捉了跨模态的分布式概念（如“这是一个结合口袋残基”）。 ## 实验验证：特征对齐与亲和力预测研究者在**Boltz-2**模型（蛋白质-配体共折叠模型）上测试了PairSAE，使用**PLINDER数据集**（包含数千个蛋白质-配体复合物）。 - **特征可解释性**：PairSAE学习到的特征与**UniProt**数据库中的功能注释（如“活性位点”、“金属结合位点”）高度对齐。例如，某个特征在配体结合残基上激活强度显著高于其他残基。 - **亲和力预测**：将PairSAE的特征作为输入，训练一个线性模型预测Boltz-2输出的亲和力值，取得了较高的相关性（R²≈0.65），表明这些特征捕捉了与结合强度相关的关键信息。 ## 意义与展望 PairSAE为结构生物学基础模型的可解释性提供了新工具。它不仅帮助研究者理解模型预测的分子机制，还可能指导蛋白质设计：通过识别与特定功能相关的特征，可以更有针对性地优化序列。未来工作可以扩展到更复杂的多聚体系统，或与蛋白质设计方法结合。该研究也提示，针对特定架构设计可解释性方法至关重要——通用方法可能因架构差异而失效。 ## 小结 - PairSAE通过N-mode SVD和共享SAE，成功对Pairformer架构的成对表征进行可解释性分析。 - 在Boltz-2上提取的特征与生物注释对齐，并能预测亲和力。 - 方法避免了标准SAE在成对表征上的二次爆炸和概念割裂问题。

HuggingFace23天前原文

880

Prime Day虽已结束，但这5个优惠仍可捡漏（别错过）

新上线

亚马逊Prime Day刚刚落幕，但如果你以为所有好价都已消失，那可就错了。根据我的追踪，仍有几款热门产品维持着促销价格，涵盖厨房小家电、高端智能手表、会员服务等多个品类。如果你在Prime Day期间犹豫不决或错过了心仪商品，现在可能是最后的入手机会。 ### 🍦 厨房神器：Ninja Slushi 冰沙机这款**Ninja Slushi**是今年夏季的爆款单品，能将任何饮品在20分钟内转化为冰沙或雪泥。Prime Day期间它的价格一度降至**$199**（原价$299），目前部分渠道仍然维持这一价位。对于喜欢在家制作冷饮或举办派对的用户来说，这几乎是不可抗拒的优惠。 ### ⌚ 户外旗舰：Garmin Fenix 8 Pro 作为Garmin的旗舰级户外运动手表，**Fenix 8 Pro**在Prime Day期间直降**$200**，现价约**$899**。这款手表支持多频段GPS、太阳能充电和潜水级防水，专业跑者和户外探险者对其评价极高。如果你追求最精准的运动数据追踪和最耐用的设计，这可能是今年最值得入手的智能手表之一。 ### 🛒 会员福利：Walmart Plus 年度订阅 **Walmart Plus**在Prime Day期间推出了首次订阅享**50%折扣**的活动，年费仅需**$49**（原价$98）。该服务包含免费无限次配送、加油站折扣以及Scan & Go结账功能，非常适合经常在Walmart购物的家庭。目前这一折扣仍在部分推广渠道中有效。 ### 🎧 音频产品：Sony WH-1000XM5 耳机虽然Sony的头戴式降噪耳机**WH-1000XM5**在Prime Day期间最低曾达到**$298**，但现在仍有不少第三方卖家以**$328**左右的价格出售（原价$399）。考虑到这款耳机常年霸占降噪排行榜榜首，这个价格依然具备竞争力。 ### 💻 居家办公：Logitech MX Keys 键盘罗技的**MX Keys**键盘在Prime Day期间降至**$69**（原价$99），目前部分颜色版本仍可找到接近价位的库存。作为一款支持多设备无缝切换的办公键盘，它的手感和续航都备受好评，是提升工作效率的实用选择。 > 以上价格均来自美国亚马逊及主要零售商，部分优惠可能随时结束。建议在购买前确认最终价格和库存情况。如果你还在犹豫，不妨抓紧时间——毕竟这些折扣可能不会持续太久。

ZDNet AI23天前原文