SheepNav

AI 资讯

每日聚合最新人工智能动态

Z世代正在重新定义“真相”:从事实到情感的认知革命

社交媒体算法正在重塑Z世代对“真相”的理解,从传统的事实权威转向情感共鸣与身份认同。这一代在智能手机时代成长起来的年轻人,其认知模式正经历一场深刻的变革。 ### 从事实到情感:真相的双重维度 一段TikTok上走红的北极熊视频,在哀伤的钢琴配乐下,一只孤独的熊在逐渐变小的浮冰间游动。评论区充斥着青少年的悲伤、愤怒与无力感。而同一主题的另一端,是联合国政府间气候变化专门委员会(IPCC)用严谨语言写就的科学报告。两者都包含某种“真相”,却代表了人类理解真相的两种截然不同的频率。 Z世代,作为首个在智能手机时代度过童年期的群体,已经发展出一种与前辈截然不同的与真相的关系。研究数据显示,从2012年至2014年起,美国、英国、加拿大、澳大利亚和欧洲等多国青少年焦虑、抑郁、孤独、自残和社交退缩的比例急剧上升。这一时间点几乎与智能手机、前置摄像头和算法驱动的内容平台成为青少年社交生活核心枢纽的时刻完全吻合。 ### 数据背后的认知转型 来自美国疾病控制与预防中心长期开展的“青少年风险行为调查”、密歇根大学的“监测未来”研究以及国际心理健康数据集的分析显示,青春期女孩在抑郁症状、睡眠紊乱以及持续悲伤和无助感方面的比例大幅攀升。同时,研究人员还发现面对面社交互动减少,而线上社交时间显著增加。 但更深层的转变并非仅仅是心理层面的,而是**文化性和认知性的**。当社交生活迁移到以互动、可见性和情感反应为优化目标的平台上时,真相问题越来越多地通过身份、情感和社会认可来过滤,而非通过缓慢的机构系统——如证据、权威和辩论来确立。 ### 算法塑造的个性化真相 社交媒体不仅改变了年轻人消费的内容,还改变了他们处理现实的方式。这种从共享的公共真相向个性化、算法强化真相的转变,正是真相未来的核心所在。正如一位研究者所言:“我们的现实正在被塑造……” 这种塑造意味着,对于Z世代而言,一个信息是否“真实”,往往取决于它是否能引发情感共鸣、是否符合社群认同,而不仅仅是它是否符合客观事实。 ### 小结:理解新一代的认知地图 Z世代的这种认知方式并非简单的“反智”或“轻信”,而是一种在数字化生存中自然演化的适应策略。在信息过载的时代,情感和社群信任成为高效筛选信息的快捷方式。但这同时也带来了挑战:当情感认同凌驾于事实核查之上,公共讨论的基础可能被削弱。了解这一代人的认知逻辑,不仅是理解当下舆论环境的关键,也是构建未来有效沟通机制的前提。

WIRED AI19天前原文

固态硬盘(SSD)价格近期持续攀升,但 Best Buy 却逆势推出重磅优惠:**8TB 版 SanDisk Desk Drive 外置 SSD** 直降近 **62%**,售价仅 **740 美元**,比原价便宜约 **1,180 美元**。 ## 为什么值得关注? 随着 AI 模型训练、高分辨率视频编辑和大型游戏文件日益庞大,大容量存储的需求激增。传统机械硬盘速度慢,而 SSD 虽快但价格不菲。SanDisk Desk Drive 提供了 **8TB** 的超大空间,读写速度远超机械硬盘,特别适合需要频繁读写大文件的创作者和游戏玩家。 ### 性能与场景 - **游戏玩家**:可完整存放多个 100GB+ 的 3A 大作,加载速度大幅提升。 - **视频/摄影创作者**:直接外置编辑 4K/8K 素材,无需频繁迁移数据。 - **AI 从业者**:存储训练数据集或模型权重,便携且高速。 ## 市场背景 近两年,由于 NAND 闪存产能调整和需求上升,SSD 价格普遍上涨,大容量型号尤甚。此次 Best Buy 的折扣力度罕见,**740 美元** 的价格甚至低于部分 4TB 型号的常规售价,堪称“买大送小”。 ## 购买建议 如果你正在寻找可靠的大容量外置存储,且不想等待价格回落,这款 SanDisk Desk Drive 无疑是当前性价比之选。不过需注意,该优惠可能限时或限量,建议尽快行动。 > **编者注**:本文为资讯分享,不构成购买建议。价格和库存可能随时变动,请以 Best Buy 页面为准。

ZDNet AI19天前原文

## 你的浏览器正在“出卖”你吗? 每次打开浏览器,无论是刷社交媒体、查银行账户还是随便逛逛,你的行为数据都在被默默收集。Cookie通知、同意按钮、服务使用协议……这些看似无害的提示背后,是无数组织在追踪你的在线活动,甚至将你的浏览习惯打包出售。2026年,隐私保护已不再是可选项,而是数字生存的必需品。ZDNET专家经过数周实测,从隐私政策、反追踪能力、默认安全设置等维度,为你筛选出当前最值得信赖的**安全浏览器**。 ### 为什么需要换掉主流浏览器? 主流浏览器(如Chrome、Edge)虽然方便,但其商业模式高度依赖广告和数据收集。即使你关闭了“个性化广告”,浏览器仍可能通过**浏览器指纹识别**(canvas fingerprinting、WebGL指纹等)建立你的唯一身份档案。更隐蔽的是,许多浏览器内置的“安全功能”实际上会向第三方发送你的浏览数据。 ### 2026年专家推荐清单 #### 1. **Brave** —— 隐私与速度的平衡之选 - **核心优势**:默认屏蔽追踪器、广告和第三方Cookie,内置**Tor匿名模式**,可一键访问暗网或隐藏IP。 - **性能表现**:加载速度比Chrome快3倍(实测),因为去除了大量广告和脚本。 - **隐私亮点**:Brave Shields功能可显示被拦截的追踪器数量;支持**IPFS**(星际文件系统)协议,实现去中心化内容分发。 - **适用人群**:追求极速且不希望做任何配置的用户。 #### 2. **Firefox** —— 开源定制化之王 - **核心优势**:Mozilla是非营利组织,无广告业务压力;**Total Cookie Protection**(全站Cookie隔离)技术可防止跨站追踪。 - **性能表现**:2026年版本优化了内存占用,在低配设备上运行流畅。 - **隐私亮点**:支持**DNS-over-HTTPS**(DoH)加密查询;可通过about:config深度调整隐私设置。 - **适用人群**:技术爱好者或希望完全掌控隐私策略的用户。 #### 3. **Tor Browser** —— 匿名性天花板 - **核心优势**:基于Firefox深度定制,流量经过三层加密和中继节点转发,**几乎无法追踪到真实IP**。 - **性能表现**:速度较慢(延迟约1-3秒),但这是匿名性的代价。 - **隐私亮点**:默认禁用JavaScript(部分网站需手动开启);每次关闭会话自动清除所有痕迹。 - **适用人群**:记者、活动人士或对匿名性有极高要求的用户。 #### 4. **DuckDuckGo Browser** —— 极简隐私体验 - **核心优势**:**一键清除**所有浏览数据;内置**隐私评分**(A-F等级)显示网站追踪强度。 - **性能表现**:轻量级设计,启动速度快;但扩展生态较弱。 - **隐私亮点**:强制HTTPS连接;阻止隐藏的第三方追踪器。 - **适用人群**:新手用户或仅需基础隐私保护的普通网民。 #### 5. **Vivaldi** —— 隐私与功能并存 - **核心优势**:高度可定制界面;内置**追踪器拦截器**和**广告屏蔽器**(无需额外插件)。 - **性能表现**:基于Chromium内核,兼容Chrome扩展;但内存占用略高。 - **隐私亮点**:无用户账户强制登录;支持**端到端加密同步**。 - **适用人群**:需要丰富功能且不愿牺牲隐私的用户。 ### 如何选择最适合你的浏览器? - **日常轻度使用**:DuckDuckGo Browser 或 Brave,开箱即用。 - **需要高匿名性**:Tor Browser,但需接受速度损失。 - **技术控/深度定制**:Firefox 或 Vivaldi。 - **企业/办公场景**:Brave 或 Vivaldi,兼顾安全与效率。 ### 额外提醒:没有“绝对安全”的浏览器 即使使用最安全的浏览器,你的隐私仍可能被以下行为泄露: - 登录谷歌、Facebook等账户(会关联身份) - 安装恶意扩展 - 使用公共Wi-Fi(建议搭配VPN) ZDNET建议:**组合使用**——日常用Brave,敏感操作(如访问暗网、举报信息)用Tor,并定期清理Cookie和缓存。 ### 结语 2026年,隐私保护工具已足够成熟,无需再为安全牺牲体验。从今天起,换个浏览器,或许是你最简单的数字防护第一步。

ZDNet AI19天前原文

针对家庭网络隐私保护需求,ZDNET 专家团队对 2026 年主流 VPN 路由器进行了全面评测,从预装支持、性能表现到易用性逐一筛选。如果你希望一次设置就能保护家中所有设备,省去在每台手机、电脑上单独安装 VPN 的麻烦,那么选对路由器是关键。 ### 为什么需要 VPN 路由器? 传统 VPN 需要用户在每台设备上分别安装客户端,操作繁琐且容易遗漏。而 **VPN 路由器** 将 VPN 功能直接集成到网络入口——所有连接该路由器的设备(包括智能电视、游戏机、IoT 设备)都会自动通过 VPN 加密传输,实现“全屋保护”。尤其适合智能家居用户、远程工作者或对隐私要求较高的家庭。 ### 2026 年优选产品亮点 经过数小时的压力测试、吞吐量对比和配置便捷性评估,评测团队总结出以下核心考量维度: - **预装 VPN 协议支持**:是否原生支持 WireGuard、OpenVPN 等主流协议 - **性能衰减控制**:启用 VPN 后网速下降幅度是否在可接受范围内 - **固件更新与安全性**:厂商是否持续提供安全补丁 - **易用性**:初次安装是否需要专业知识 **推荐产品共同特征**:多数入选路由器已预装 VPN 客户端,用户只需输入服务商提供的凭据即可激活,无需刷第三方固件。部分高端型号甚至提供一键切换 VPN 服务器位置的功能。 ### 选购建议 1. **确认 VPN 服务兼容性**:先确认你使用的 VPN 服务商是否支持路由器安装,以及是否提供专用配置工具。 2. **关注处理器性能**:VPN 加密解密会消耗 CPU 资源,建议选择双核 1.5GHz 以上处理器的型号。 3. **Wi-Fi 6/6E 优先**:新标准能更好抵消 VPN 带来的速度损失。 4. **不要忽视散热**:持续运行 VPN 会使路由器发热,金属外壳或带散热孔的设计更可靠。 ### 小结 2026 年的 VPN 路由器市场已相当成熟,从入门级到发烧级都有覆盖。对于大多数家庭用户,选择一款 **预装 VPN 支持、Wi-Fi 6 以上、品牌信誉良好** 的路由器即可获得满意的体验。记住:最好的设备是那种“一次设置,长期无忧”的产品。

ZDNet AI19天前原文
Meta 新现实:利润创新高,士气跌谷底

Meta 即将在下周裁减约 10% 的员工,这家公司正经历着冰火两重天:一方面财报利润屡创新高,另一方面内部士气跌至冰点。WIRED 采访了十多位现任和前任员工,揭示了“人人都不开心”的职场现状。 ## 利润与裁员并行 在 AI 和元宇宙的巨额投入下,Meta 的广告业务强势复苏,2024 年第二季度净利润同比增长 73% 至 134.7 亿美元。然而,就在财报发布后不久,公司宣布将裁减约 10% 的员工,涉及数千人。这已是自 2022 年以来的第三轮大规模裁员,累计裁员比例超过 20%。 ## 员工士气为何低迷 受访员工形容公司内部氛围“压抑且焦虑”。一位现任工程师表示:“我们一边庆祝财报数字,一边担心下周会不会收到解雇邮件。” 管理层频繁的组织调整和“效率年”战略让员工感到疲惫不堪。多名员工提到,**扎克伯格强调的“扁平化”和“减少管理层级”** 实际上导致了更多的不确定性:项目被砍、团队重组、绩效压力陡增。 更令员工不满的是,裁员的同时,公司仍在大力投资 AI 基础设施和元宇宙项目。一位前产品经理说:“公司有钱建数据中心、买 GPU,却不愿意保留那些辛苦工作的员工。” 这种资源分配的失衡加深了员工的疏离感。 ## AI 转型下的职场文化 Meta 正在将资源向 AI 倾斜,包括推出开源大模型 Llama 系列和 AI 驱动的社交功能。然而,这种转型也意味着非 AI 团队的边缘化。一位员工透露:“如果你不在 AI 或广告部门,感觉就像二等公民。” 部分团队甚至被要求“重新申请”岗位,以匹配新的组织方向。 ## 小结 Meta 的现状折射出科技巨头在 AI 竞赛中的残酷一面:为了维持增长和竞争力,公司不惜牺牲员工稳定性。尽管财务数字亮眼,但人才流失和士气问题可能成为长期隐患。正如一位离职员工所言:“Meta 不再是那个让人兴奋的地方了,它变成了一台冷冰冰的利润机器。”

WIRED AI19天前原文

在AI内容生成的浪潮中,一个核心问题日益凸显:当AI向用户提供信息时,谁来决定哪些内容被呈现?Campbell Brown,这位曾担任Meta新闻合作主管的资深媒体人,近期就这一话题发表了自己的看法。她指出,硅谷内部围绕AI内容治理的讨论,与普通消费者的认知之间存在巨大鸿沟。 Brown观察到,技术社区正专注于模型能力、安全对齐和偏见消除等专业议题,而普通用户更关心的是AI给出的答案是否可信、是否公平、是否反映了多元视角。这种认知错位可能导致公众对AI系统的不信任,甚至引发更广泛的社会争议。 作为新闻行业的资深人士,Brown在Meta期间曾负责与全球新闻出版商合作,深度参与了内容审核、虚假信息治理和新闻生态平衡等棘手问题。她认为,AI内容治理可以借鉴新闻编辑室的经验:透明性、责任制和多元利益相关方参与是关键。 Brown强调,AI公司不能仅依赖内部工程师和伦理团队来定义“正确”的信息输出。她建议引入外部专家、民间组织甚至用户代表,共同参与制定内容准则。同时,AI系统应该向用户明确说明其信息来源、推荐逻辑和潜在局限性,让用户有能力做出判断。 这一观点与当前行业趋势不谋而合。随着生成式AI进入搜索、推荐和问答场景,从Google的AI Overviews到OpenAI的ChatGPT,内容准确性、偏见和来源引用问题屡屡引发争议。Brown的呼吁提醒我们:AI的内容治理不仅是技术问题,更是社会契约问题。 未来,AI公司可能需要像传统媒体一样建立“编辑室”机制,在算法效率与信息质量之间寻找平衡。而公众参与和外部监督,或许正是弥合硅谷与消费者认知鸿沟的关键一步。

TechCrunch19天前原文

法律科技初创公司 Clio 刚刚宣布其年度经常性收入(ARR)突破 **5 亿美元** 大关,这一里程碑式的成就恰逢 AI 公司 Anthropic 在 legal tech 领域持续加码,引发行业关注。 Clio 作为云法律实践管理软件的领军者,其增长反映了法律行业对数字化工具的强劲需求。公司通过提供案件管理、计费、文档自动化等一站式解决方案,成功吸引了从 solo practitioner 到大型律所的广泛客户群。5 亿美元 ARR 的达成,不仅验证了其产品市场匹配度,也表明法律科技赛道正进入高速成长期。 与此同时,Anthropic 正凭借其 Claude 模型系列积极切入法律垂直场景。Claude 在合同分析、法律研究、文件审查等任务上展现出强大能力,直接与 Clio 等平台形成竞争或互补关系。Anthropic 近期推出的 **Claude for Enterprise** 及针对法律行业的定制化方案,正在重塑传统法律服务的成本结构与效率边界。 两大玩家在同一时间节点的动态,揭示了 legal tech 领域的两个核心趋势:**一是 SaaS 化平台持续渗透传统法律 workflow**,Clio 的成功证明律所愿意为云端一体化工具付费;**二是生成式 AI 正从“辅助工具”升级为“核心生产力引擎”**,Anthropic 的入局意味着 AI 原生能力将成为下一代法律软件的标配。 对于 Clio 而言,5 亿美元 ARR 既是荣誉也是压力。如何在 Anthropic 等 AI 公司的攻势下保持差异化,将决定其能否守住市场份额。可能的路径包括:深化 AI 原生功能集成、构建开放生态以接入第三方 AI 模型,或通过并购快速补足技术短板。 行业观察人士指出,法律科技市场的天花板远未触及。全球法律服务市场规模超 8000 亿美元,数字化渗透率仍处于个位数。Clio 与 Anthropic 的竞合关系,或将加速整个行业的智能化转型,最终受益的是那些能够降低法律成本、提升服务可及性的终端用户。

TechCrunch19天前原文

## 当智能体学会“何时”而非“如何”行动:一种通信高效的强化学习新范式 传统的安全强化学习(Safe RL)通常聚焦于一个问题:**智能体应该做什么**?然而,一篇来自 arXiv 的新论文提出了一个颠覆性的视角:**智能体何时需要行动**?该研究通过将运行时保障(Run-Time Assurance, RTA)与 Lyapunov 安全屏障相结合,证明了单一策略可以同时学习控制输入和通信高效的时序决策。 ### 核心创新:从“什么”到“何时” 论文的核心洞察在于,在已知平衡点附近的稳定控制场景中,智能体无需在每个时间步都执行动作。通过一个基于 Lyapunov 预测的 RTA 层,系统可以在安全时“保持沉默”,仅在必要时才触发策略干预。这种机制不仅减少了控制频率,还通过一个预计算的 LQR 备份控制器提供了比传统约束马尔可夫决策过程(CMDP)更强的安全保证——后者仅能在期望意义上保证安全,而 RTA 提供了逐点(pointwise)的 Lyapunov 安全盾。 ### 实验数据:效率与安全的双赢 研究者在三个经典控制任务上验证了该方法:倒立摆、小车-杆系统和平面四旋翼。结果显示,学习到的策略在平均采样间隔(Mean Inter-sample Interval, MSI)上分别比 Lyapunov 触发的基线提升了 **1.91 倍、1.45 倍和 3.51 倍**。更关键的是,以相同平均速率运行的固定 LQR 控制器在所有三个环境中均不稳定,这证明**自适应时序决策**而非单纯降低平均速率才是实现安全稀疏控制的关键。 ### 跨环境迁移与扩展性 论文的一大亮点是,通过 CARE(Communication-Aware RL with Efficiency)推导出的 Lyapunov 奖励函数可以跨环境直接迁移,无需重新设计。一个单一权重参数 \( w_c \) 即可控制稳定性与通信开销之间的权衡。消融实验表明,RTA 盾不可或缺——移除后 MSI 下降了 **1.27 至 1.84 倍**,且状态范数显著恶化。 此外,研究者还提出了一个偏好条件扩展(preference-conditioned extension),只需 **2/11** 的训练计算量即可从单个模型恢复完整的权衡前沿。在 12 维状态的三维四旋翼案例研究中,该框架成功扩展至高维系统,而经典 STC(Self-Triggered Control)在此类场景下已不可行。对于 \(\pm30\%\) 的质量变化和外部扰动,系统表现出优雅的退化特性——RTA 层吸收了学习策略无法处理的部分。 ### 行业意义与未来方向 这项工作对边缘计算、机器人部署和物联网场景具有重要启示。在通信带宽受限或能量预算严格的环境中,智能体无需持续与控制器通信,而是“按需”行动,这将大幅降低能耗和延迟。论文同时指出,该结果在离散和连续域中均与算法无关(通过 SAC 实验验证),意味着其核心思想可以嵌入到各种主流 RL 框架中。 未来,研究者计划探索更复杂的非线性系统以及多智能体协同场景下的“何时行动”问题。

HuggingFace19天前原文

多模态图学习(MGL)近年来备受关注,它通过整合文本、图像、结构等多种模态信息,为社交网络、推荐系统等应用提供了强大的建模能力。然而,现实中的图数据往往分散在不同机构(如医院、银行)中,出于隐私和合规限制无法直接共享,且各参与方拥有的模态常常不完整——有的节点只有文本,有的只有图像。这种“数据孤岛”与“模态缺失”并存的问题,对联邦学习框架下的鲁棒性提出了严峻挑战。 现有方法存在明显短板:集中式MGL方法虽能处理缺失模态,但无法适应联邦场景中知识共享与泛化的需求;而联邦MGL方法虽已成熟,却主要针对非图数据,难以直接迁移到图结构上。一个直观的解决方案是采用“客户端补全+服务端聚合”的两阶段流水线:客户端先利用本地补全模型恢复缺失模态,服务端再聚合各客户端的生成器与骨干网络参数。但这一思路面临两大核心难题: 1. **拓扑隔离下的局部补全**:客户端仅能基于本地子图进行模态生成,缺乏全局语义信息,导致补全质量低下。 2. **可靠性失衡的全局聚合**:不同客户端拥有的模态种类和补全可靠性差异巨大,若平等对待所有更新,会引入大量噪声。 针对上述问题,来自北京理工大学等机构的研究者提出了 **FedMPO** 框架。该框架包含三项关键技术: - **拓扑感知的跨模态生成**:利用图结构上下文(如邻居节点的多模态特征)来恢复缺失信息,使补全过程感知全局拓扑关系。 - **缺失感知的专家路由**:在本地引入轻量级路由机制,自动过滤掉补全过程中产生的不可靠信号,保留高置信度的特征。 - **可靠性感知的聚合**:在服务端根据各客户端生成器的恢复质量动态降低不可靠更新的权重,避免低质量更新污染全局模型。 实验在 **6个数据集、3类任务**(节点分类、链接预测等)上展开。结果显示,FedMPO 在 **高缺失率**(缺失模态比例高)和 **非独立同分布**(各客户端数据分布差异大)的场景下,性能相比基线方法分别提升 **4.10%** 和 **5.65%**,且对缺失模态的鲁棒性显著优于现有方法。 这一工作为联邦图学习在多模态场景下的实际落地提供了新思路。未来,随着边缘设备算力的提升与隐私法规的趋严,类似 FedMPO 这种兼顾隐私、异构性与鲁棒性的方法,将有望在医疗影像分析、跨域推荐和智慧城市等真实场景中发挥关键作用。

HuggingFace19天前原文

## 研究背景:当KAN遇上差分隐私 Kolmogorov-Arnold网络(KAN)作为近年来兴起的新型神经网络架构,因其在可解释性和参数效率上的潜力受到广泛关注。然而,其理论分析大多停留在理想化的全批量梯度下降(GD)和独立噪声差分隐私场景,与实际训练中常用的**小批量随机梯度下降(SGD)**以及能更好平衡隐私与效用的**相关噪声机制**存在差距。 ## 核心贡献:首个基于小批量SGD的KAN泛化界 来自多家机构的研究人员联合发表论文,首次为**使用梯度裁剪的小批量SGD训练的KAN网络建立了群体风险界**。该工作覆盖了非私有SGD和差分隐私SGD(DP-SGD)两种场景,其中DP-SGD引入了高斯扰动,并考虑了从独立噪声到时间相关噪声的插值。 这标志着KAN理论向实践迈出了关键两步: - **训练方式**:采用现代网络的标准方案——小批量SGD,而非全批量梯度下降; - **噪声机制**:相关噪声机制在实验中已被证明能比独立噪声带来更优的隐私-效用权衡。 ## 技术难点与创新 该研究在技术上颇具挑战。**时间相关性破坏了标准一步SGD论证中的条件中心结构**,而投影步骤又阻碍了相关扰动的精确抵消。研究团队提出了三项关键技术创新: 1. **辅助无投影动力学**:通过引入一个不包含投影操作的辅助迭代过程,绕开投影带来的分析困难; 2. **移位迭代**:构造一个吸收了当前噪声扰动的移位变量,使得相关噪声的影响可以被有效追踪; 3. **高概率自举证明**:通过自举方法以高概率保证投影步骤在大部分时间内处于非激活状态,从而简化分析。 ## 理论价值与行业意义 将上述优化分析与基于稳定性的泛化论证相结合,最终得到了群体风险界。据作者称,这是**首个在凸学习之外(特别是针对神经网络)对DP训练的相关噪声机制进行优化和群体风险分析的工作**。 这一成果不仅深化了我们对KAN网络训练过程的理论理解,也为在实际部署中更高效地使用差分隐私技术提供了理论支撑。**当企业或研究机构需要在敏感数据上训练KAN模型时,可以更有信心地采用相关噪声DP-SGD,因为它现在有了严格的泛化保证。** ## 小结 这项研究填补了KAN网络在差分隐私训练理论上的空白,将分析从理想化的全批量独立噪声场景推进到更实际的小批量相关噪声场景。其技术路线——通过辅助动力学和移位迭代处理时间相关性——也为其他非凸模型的隐私分析提供了可借鉴的框架。

HuggingFace19天前原文

## 研究背景:稀疏奖励下的训练困境 当前,大型语言模型(LLM)在预训练后通常使用**稀疏验证器奖励**进行后训练。这种奖励机制仅能判断采样轨迹是否成功,却无法提供推理过程在何处成功或失败的细粒度指导。例如,在数学推理中,模型可能因中间步骤出错而最终失败,但稀疏奖励仅给出“失败”的二元信号,难以定位具体错误位置。 ## 现有方法局限:孤立轨迹的局限性 **同策略蒸馏(On-Policy Distillation, OPD)** 通过训练学生模型生成的轨迹来提供更密集的令牌级监督,从而缓解上述问题。然而,现有OPD方法通常独立处理每个采样轨迹,忽略了同一提示下其他尝试所蕴含的丰富信息。这种“孤立蒸馏”方式浪费了多轨迹间的对比信息,限制了训练效率。 ## MOPD框架:同侪条件蒸馏的创新 针对上述局限,研究团队提出**多轨迹同策略蒸馏(Multi-Rollout On-Policy Distillation, MOPD)**——一种基于同侪条件的蒸馏框架。其核心思想是:利用学生模型自身的局部采样组(即同一提示下的多次尝试)构建信息更丰富的教师信号。 MOPD将教师信号条件化于**同侪的成功与失败轨迹**: - **成功轨迹**提供有效推理模式的正向证据; - **失败轨迹**则提供结构化的负向证据,指出应避免的常见错误。 研究探索了两种同侪上下文构建方式: 1. **正向同侪模仿**:仅基于成功轨迹进行模仿学习; 2. **对比性成功-失败条件化**:同时利用成功与失败轨迹进行对比学习。 ## 实验验证:多领域性能提升 在**竞赛编程、数学推理、科学问答和工具使用**等基准测试上,MOPD一致优于标准同策略基线方法。进一步的教师信号分析表明,**混合成功-失败上下文**能使教师分数与验证器奖励更好地对齐,表明性能提升源于更忠实、实例自适应的监督信号。 ## 结论与启示 MOPD揭示了一个关键洞察:**有效的同策略蒸馏应利用学生模型的多轨迹试错行为,而非将轨迹视为孤立样本**。这一发现为LLM后训练提供了新思路——通过挖掘同组轨迹间的对比信息,可以在不增加额外外部数据的情况下显著提升训练效果。未来,该框架有望扩展到更多复杂推理任务,并与强化学习等范式结合。

HuggingFace19天前原文

## 当黑箱模型遇见物理法则:OceanCBM 如何打开海洋预报的“黑匣子”? 极端海洋现象(如海洋热浪)的预测一直是个难题。传统数值模型依赖物理方程,计算成本高且精度有限;而近年来表现优异的深度学习模型虽然预测能力强,却如同一个“黑箱”——它们能给出准确结果,却无法解释“为什么会这样”,更难以保证其内部推理过程符合真实物理规律。 近日,一篇发表在 arXiv 上的论文提出了名为 **OceanCBM** 的新模型,试图在预测性能与可解释性之间架起一座桥梁。这是首个将 **概念瓶颈模型(Concept Bottleneck Model, CBM)** 应用于海洋时空预测与机制性解释的工作。 ### 什么是概念瓶颈模型? 传统神经网络将输入直接映射到输出,中间层学习到的特征往往是隐式的、难以解读的。而概念瓶颈模型在中间加入一个“瓶颈层”,该层由**预设的、具有物理意义的概念**组成。模型必须先将输入压缩成这些概念的取值,再基于概念做出最终预测。这样一来,人们可以直接检查模型“认为”哪些概念重要,以及它们如何影响结果。 OceanCBM 的设计更为巧妙:它采用**混合监督**方式,将**来自地球物理流体动力学的指定概念**(如涡度、温度梯度等)与一个**自由概念**(free concept)相结合。自由概念用于捕捉未被预设概念覆盖的残余物理过程,同时起到正则化作用,避免模型被过度约束。 ### 关键发现:混合监督带来稳定的机制表征 研究团队使用 OceanCBM 预测**混合层热含量**——海洋热浪的关键前兆信号。实验结果表明: - **混合监督**(同时使用概念标签和最终预测标签进行训练)能够产生**一致且可解释的机制表征**。 - 相比之下,仅使用预测目标训练(预测-only)或仅使用概念标签训练(处方-only)的基线模型,虽然预测性能相近,但学习到的潜在结构在不同初始化下**高度不稳定**,说明它们没有真正学到一致的物理机制。 这一对比有力地证明:高性能的黑箱模型可能只是“表面拟合”,其内部表征并不稳健。而 OceanCBM 通过引入物理概念瓶颈,在不牺牲预测精度的前提下,获得了对物理过程更忠实、更可解释的内部表示。 ### 意义与展望 OceanCBM 的工作直接回应了机器学习在气候科学中的一个核心矛盾:**我们是否愿意为了可解释性而牺牲性能?** 该模型的答案是“不必”。通过精心设计的混合监督和概念瓶颈,可解释性与预测能力可以兼得。 未来,这一框架有望推广到其他地球系统预测任务(如厄尔尼诺预报、海冰变化分析)中,帮助科学家不仅知道“会发生什么”,更理解“为什么会发生”。 > **一句话总结**:OceanCBM 用物理概念作为中间桥梁,让海洋预报模型既能精准预测,又能讲清楚背后的物理故事。

HuggingFace19天前原文

一个核心共识是:当AI模型在高风险领域协助决策时,应当传达其预测的置信度。然而,实证表明,决策者往往难以仅凭置信度判断何时该信任AI。最新理论研究发现,**人机置信度对齐程度**与AI辅助决策的效用正相关,但对齐程度如何影响学习最优决策的复杂性,此前尚不明确。 来自马克斯·普朗克研究所的研究团队在发表于arXiv的论文中,首次从理论层面回答了这一问题。他们证明,在二元预测与二元决策的典型场景下,AI辅助决策问题可等价于一个具有完全反馈的**双臂在线上下文学习问题**,并推导出预期遗憾的下界为Ω(√(|H|·|B|·T)),其中H和B分别代表人类与AI的置信度集合。 关键发现是:当人机置信度完美对齐时,学习器可达到O(√(|H|·T·log T))的预期遗憾;进一步,若|H|足够小(√|H| = O(log T))且B可数,借助Dvoretzky-Kiefer-Wolfowitz不等式的非平凡推广,遗憾界可优化至O(√(T·log T))。这些结果表明,**对齐显著降低了学习复杂性**。 研究团队还通过两项真实人类受试者实验验证了理论的鲁棒性。实验中,参与者在AI辅助下完成简单决策任务,结果证实即使对齐不完全,理论结论仍然成立。 这项研究对AI辅助决策系统设计具有重要启示:**提升人机置信度对齐不仅有助于决策者更有效地利用AI建议,还能从算法层面降低学习最优策略的难度**。未来,开发者可通过校准AI置信度输出、设计交互界面帮助用户校准自身置信度,从而在医疗诊断、金融风控等高 stakes 场景中实现更高效的人机协作。

HuggingFace19天前原文

随机神经网络(RdNN)通过冻结随机初始化的输入到隐藏层权重,使得输出层可以闭式求解,从而避免了反向传播,训练效率极高。然而,传统的随机初始化方法完全忽略了特征之间的依赖关系——相关性、非对称性、尾部依赖统统被无视,导致模型条件数恶化,预测性能大打折扣。这一问题长期被 RdNN 领域忽视,直到最近一篇被 AISTATS 2026 接收的论文提出了 **CAWI(Copula-Aligned Weight Initialization)** 框架,才给出了系统性的解决方案。 ### 核心思路:让初始化“看见”数据 CAWI 的核心思想并不复杂:既然输入到隐藏层的权重在训练中不再更新,那么初始化阶段就应该更“聪明”地利用数据中的统计信息。传统方法从独立同分布(如高斯或均匀分布)中采样权重,相当于假设所有特征彼此无关——这在真实数据中几乎不可能成立。CAWI 则引入 **Copula** 这一统计工具,先通过经验 CDF 将每个特征映射到 [0,1] 区间,再拟合一个多元 Copula 来捕捉特征间的秩相关(即依赖结构),最后从该 Copula 中采样每个权重列,并施加固定的逆边际变换以设定尺度。 整个过程不改变 RdNN 的目标函数、求解器或“一次冻结”范式,唯一变化的是权重的采样分布——从“盲目独立”变为“依赖感知”。 ### 两种 Copula 家族,覆盖多种依赖模式 论文考虑了两种主流 Copula 家族: - **椭圆型 Copula**(高斯、t-Copula):擅长捕捉对称的线性相关和尾部相关。 - **阿基米德 Copula**(Clayton、Frank、Gumbel):能够处理非对称依赖和不同的尾部行为(如 Clayton 强调下尾依赖,Gumbel 强调上尾依赖)。 这种设计使 CAWI 能灵活适配不同类型的数据,无论是金融数据中常见的“同跌不同涨”现象,还是生物医学数据中的非线性关联,都能被有效建模。 ### 实验验证:83 个数据集上的全面胜出 研究者在 **83 个分类基准**(包括二分类和多分类)以及两个生物医学数据集(BreaKHis 和 Schizophrenia 数据集)上进行了测试,使用标准浅层和深层 RdNN 架构。结果表明,CAWI 在预测性能上 **一致且显著地优于传统随机初始化**,尤其是在特征间存在较强相关性的数据集上,提升幅度更为明显。 ### 为什么重要? RdNN 因其训练速度快、无需反向传播而受到关注,但“随机初始化”一直被当作一个简单的工程选择,很少有人质疑其统计合理性。CAWI 的工作看似只是改了一个采样步骤,实际上触及了 RdNN 的根基——它证明了:**即使权重被冻结,初始化时的统计敏感性也能对最终性能产生决定性影响**。这一发现不仅为 RdNN 提供了一种即插即用的改进方案,也为理解随机特征映射的表示能力提供了新视角。 ### 局限与展望 目前 CAWI 需要额外的 Copula 拟合步骤,在大规模特征维度下计算开销可能增加。此外,论文主要关注分类任务,其在回归、生成模型等场景的表现还有待探索。不过,作为首个系统解决 RdNN 初始化依赖感知问题的框架,CAWI 无疑为这一领域打开了一扇新的大门。 代码已开源,感兴趣的读者可以前往 GitHub 仓库复现实验。

HuggingFace19天前原文

## 突破传统监控瓶颈:从低维状态到高维感知空间 自动驾驶等感知驱动系统的安全运行,离不开对系统行为的实时监控。传统方法依赖将连续传感器数据映射为基于低维状态变量的离散逻辑命题。然而,这种抽象在复杂感知场景下频频失效:映射过程需要额外的学习模块,计算开销大、鲁棒性差,且容易产生语义偏差。 针对这一痛点,来自华盛顿大学、微软研究院等机构的研究人员提出了 **Embedding Temporal Logic (ETL)**——一种直接在**学习到的嵌入空间**中执行监控的新型时序逻辑。相关论文已提交至 arXiv。 ## ETL 的核心机制:基于距离的谓词与时序组合 ETL 的创新在于重新定义了逻辑谓词。它不再依赖人工定义的符号化条件,而是通过计算**观测嵌入与参考嵌入之间的距离**来判定谓词真值。参考嵌入可以来自示范轨迹、视觉目标或避让区域,因此 ETL 能够自然地表达“接近目标”、“远离障碍”等高层次感知概念。 这些感知谓词与传统的时序算子(如“始终”、“最终”、“直到”)结合,使得 ETL 可以描述复杂的**时序感知行为**,例如“在接近目标前,始终保持在安全区域内”。 ## 可靠性与实践:保形校准与实验验证 为了确保监控结果的可信度,研究团队引入**保形校准**机制,为谓词评估提供统计意义上的可靠性保证,尤其适用于安全关键场景。 在多个机器人操作环境中的实验表明,ETL 监控器与真实语义(ground truth)具有高度一致性,能够准确检测出违反时序规范的感知行为。与传统方法相比,ETL 避免了额外的学习模块,计算效率更高,且无需预先定义状态空间。 ## 行业意义与未来展望 ETL 的提出为自动驾驶、无人机、服务机器人等感知密集型系统的安全监控提供了新范式。它填补了**符号逻辑与连续感知世界**之间的鸿沟,使得形式化验证技术能够真正落地于实际系统。 未来,研究团队计划将 ETL 扩展到更复杂的多模态感知场景,并探索其在在线学习与自适应监控中的应用。随着嵌入模型的不断进步,基于嵌入的逻辑监控有望成为自主系统安全验证的标准工具。

HuggingFace19天前原文

亚马逊Prime会员年费139美元,月费15美元,但你可能不知道有两种合法途径可以享受50%折扣。本文详细解析政府援助计划(如SNAP、Medicaid)和30天免费试用后自动转为折扣订阅的资格条件与操作步骤。Prime Day即将来临,提前省下会员费,购物更划算。

ZDNet AI20天前原文

从 **2026 年 5 月 1 日** 起,美国航空(American Airlines)正式实施新的便携式电池(充电宝)规定,限制旅客随身携带的充电宝数量,并对使用方式提出更严格的要求。 ## 新规核心变化 - **数量限制**:每位旅客最多只能携带 **两块便携式充电宝**。 - **存放要求**:充电宝必须保持 **可见** 或 **易于取用**,不得放入头顶行李舱或行李箱深处。 - **使用规定**:飞行途中如需使用充电宝为设备充电,需确保其始终处于可监控状态。 ## 背景与行业趋势 美国航空并非首家出台此类限制的航司。此前,**达美航空**、**联合航空** 等已对充电宝的携带和使用做出类似规定。收紧限制的核心原因在于 **锂电池的安全隐患**——锂电池在过热或短路时可能引发火灾,而飞机客舱内一旦起火,后果极为严重。近年来,多起航班因充电宝冒烟或起火而被迫返航或紧急降落,促使监管机构和航空公司加强管控。 国际航空运输协会(IATA)和各国航空安全机构已多次警告,**充电宝必须随身携带**,严禁托运,且需采取防短路措施(如用绝缘胶带包裹电极、放入原包装或专用保护袋)。美国航空的新规正是对这一安全共识的进一步细化。 ## 旅客注意事项 - **提前清点**:出发前确认随身充电宝数量不超过两块。 - **容量限制**:虽然美国航空未在本次公告中更新容量限制,但多数航司仍遵循 **100Wh(约 27000mAh)** 的上限,超过需获批。 - **保持可见**:建议将充电宝放入座椅口袋或随身小包中,避免被行李挤压。 - **留意更新**:各航司政策可能随时调整,出行前务必查阅官网最新规定。 ## 小结 美国航空的新规是航空业对锂电池安全风险的又一次主动应对。对于经常飞行的旅客,建议养成 **精简充电宝数量、妥善保管、及时关注航司公告** 的习惯,避免因违规影响行程或造成安全隐患。

ZDNet AI20天前原文

三星确认将于今年7月关闭其自有的消息应用(Samsung Messages),要求运行Android 12及更高版本的三星手机用户迁移至Google Messages。这一决定标志着三星长达16年的自有通讯平台即将落幕。对于希望保留重要短信记录的用户,以下是两种免费且安全的备份方法: ### 本地备份至外部存储 最安全的备份方式是将短信直接导出并保存到外部硬盘或SSD。具体步骤如下: 1. 使用USB数据线将手机连接至电脑。 2. 在手机端选择“文件传输”模式。 3. 在电脑上找到手机存储中的“Samsung Messages”文件夹(通常位于内部存储/Android/data/com.samsung.android.messaging/)。 4. 复制该文件夹到外部存储设备中。 注意:不同Android版本路径可能略有差异,且部分加密消息可能无法直接读取。建议在备份前清理不必要的对话以节省空间。 ### 云端备份 三星也提供了官方云备份方案: - **Samsung Cloud**:进入设置 > 账户与备份 > 三星云 > 备份数据,选择“消息”进行备份。每个三星账户提供15GB免费空间。 - **Google Drive**:在设置中启用Google One备份,确保“短信”选项已勾选。备份后,当切换至Google Messages时可自动恢复部分数据。 两种方法均无需第三方工具,最大程度保障隐私安全。 ### 背景与建议 三星自2024年起已在Galaxy S系列新机中默认使用Google Messages,甚至禁止下载Samsung Messages。这一转变主要出于服务器维护成本和安全性考量——谷歌的RCS协议已覆盖数十亿用户,而三星不愿再承担独立运营消息服务的负担。 对于用户而言,及时备份不仅能避免7月停运后数据丢失,也是整理旧信息的好时机。建议在6月底前完成操作,并优先使用本地备份以获得完全控制权。

ZDNet AI20天前原文

微软 Edge 浏览器正在为 Copilot AI 助手带来一次重磅更新,使其能够跨所有打开的标签页提取信息,并新增 AI 播客、学习模式等多项功能。 ### 跨标签页对话:Copilot 成为你的“浏览器大脑” 新功能允许 Copilot 从你所有打开的标签页中收集信息。当你与 Copilot 对话时,可以询问标签页中的内容、比较正在查看的产品、总结打开的文章等。微软表示,你可以“选择想要体验的功能,或关闭不需要的”。这一更新意味着 Copilot 不再局限于单一页面,而是能理解整个浏览会话的上下文。 值得注意的是,微软将**退役 Copilot Mode**,该模式此前也能从标签页提取信息,并提供一些代理功能(如代你预订)。这些代理能力已被整合到 **“Browse with Copilot”** 工具中,用户仍可通过该工具获得类似体验。 ### 学习、播客与写作:AI 深度嵌入浏览流程 Edge 还引入了多项 AI 驱动的工具: - **“Study and Learn” 模式**:可将当前文章转变为学习课程或互动测验,适合学生或需要快速消化内容的用户。 - **AI 播客生成**:能将标签页内容转化为 AI 生成的播客,类似 NotebookLM 的音频概览功能。 - **AI 写作助手**:当你在网页上输入文本时自动弹出,提供写作辅助。 此外,Copilot 可被授权**访问你的浏览历史**,以提供更“相关、高质量的回答”。微软强调,用户将看到清晰的视觉提示,知晓 Copilot 何时处于活动状态、正在执行何种操作。 ### 记忆与导航:长期上下文与全新新标签页 桌面端和移动端的 Copilot 将具备 **“长期记忆”** 能力,可根据之前的对话调整回复。当你打开新标签页时,会看到经过重新设计的页面,融合了聊天、搜索和网页导航,并集成 **Journeys 功能**——该功能利用 AI 将浏览历史整理成可回溯的分类。 ### 移动端增强:屏幕共享与语音问答 Edge 移动应用更新后,允许用户**与 Copilot 共享屏幕**,并通过语音提问正在查看的内容。微软表示,Copilot 活动时会有“清晰的视觉提示”,让你知道它在采取行动、帮助、倾听或查看。 ### 行业视角:浏览器 AI 竞争白热化 此次更新正值各大浏览器厂商加速 AI 化。Edge 的跨标签页信息提取直接对标 Arc 浏览器的“Instant Search”等功能,而 AI 播客与学习模式则借鉴了 NotebookLM 的成功经验。通过将 Copilot 深度嵌入浏览流程,微软试图将 Edge 从“网页窗口”升级为“AI 工作台”。对于用户而言,这意味着更少的手动切换与搜索,更多由 AI 驱动的上下文理解。不过,隐私与数据控制仍是关键问题——微软明确提供了功能开关与权限管理,但用户需自行权衡便利性与信息暴露风险。

The Verge20天前原文
马斯克诉奥特曼庭审现场:大家都在用高级坐垫

在备受瞩目的 **马斯克诉奥特曼** 庭审中,除了法律交锋,一个有趣的细节引起了观察者的注意:法庭里几乎人手一个高级坐垫。 ## 坐垫成为“标配” 据在场记者观察,被告席上的 OpenAI 和微软团队成员,包括 CEO **萨姆·奥特曼** 和法务总监 **张昌**,都使用了厚厚的黑色坐垫,其中最豪华的来自 **Purple** 品牌,售价 120 美元。OpenAI 总裁 **格雷格·布罗克曼** 和妻子安娜则使用了白色枕头,似乎来自 **Coop** 品牌,售价 35 美元一对。甚至还有人在背后垫了一个枕头。 ## 为何如此? 法庭的硬木长椅对于持续数周的马拉松式庭审来说,显然不够舒适。一位资深科技律师表示,虽然使用坐垫并不常见,但考虑到本案的时长,也并非完全出格。主审法官 **伊冯·冈萨雷斯·罗杰斯** 的法庭里,核心律师们坐的是相对豪华的皮椅,但其他旁听席则条件有限。 ## 庭审之外 这一细节折射出 AI 行业巨头之间诉讼的“人性化”一面。尽管双方在法庭上激烈辩论——微软已披露在 OpenAI 上投入超过 **1000亿美元**——但舒适坐垫成了某种“平等”的象征。毕竟,再激烈的法律攻防,也敌不过屁股坐麻的生理需求。 ## 小结 这场庭审不仅关乎 AI 的未来,也关乎如何让屁股舒服地度过漫长的庭审。或许,下次科技巨头对簿公堂时,坐垫会成为标配装备。

WIRED AI20天前原文