SheepNav

AI 资讯

每日聚合最新人工智能动态

伦敦证券交易所集团(LSEG)正借助OpenAI,在其全球业务中规模化部署可信AI。通过将ChatGPT Enterprise和OpenAI API与自身全球数据平台深度融合,LSEG实现了产品发布周期从**约6个月缩短至2周**,客户需求到生产部署仅需**约4周**,并赋能**4000名员工**加速洞察与创新。 ## 挑战与机遇 作为全球领先的金融市场基础设施和数据提供商,LSEG服务于超过**40,000家客户**和**400,000名终端用户**,覆盖约190个市场。多年来,LSEG在AI和机器学习领域投入巨大,但生成式AI的出现带来了根本性变革——不仅是系统优化,更是人机交互与决策方式的颠覆。然而,尽管基础设施先进,知识工作中的人工合成、碎片化流程和耗时操作仍严重制约效率与规模化。 > “AI是阶跃式变化,但真正的转型发生在你重新思考如何解决问题,而不仅仅是执行。”——Emily Prince,LSEG企业AI集团负责人 ## 战略选择与落地 LSEG选择OpenAI作为合作伙伴,基于模型质量、企业就绪度以及与客户需求的契合。许多客户已在使用ChatGPT,这为将LSEG的信任数据直接融入现有工作流创造了天然契机。 LSEG在数周内向全球员工部署了**ChatGPT Enterprise**和**OpenAI API**,覆盖产品、工程、研究和运营等团队。应用场景包括: - **报告起草**与市场数据综合 - **产品原型快速迭代** - **内部工作流自动化** ## 成效与启示 LSEG的实践表明,生成式AI在金融数据领域的核心价值在于: 1. **加速决策**:从数据到洞察的时间大幅压缩 2. **释放人力**:将知识工作者从重复劳动中解放 3. **增强信任**:通过可控部署确保数据安全与合规 这一案例为大型金融机构提供了可复用的AI规模化路径:以真实问题为起点,以负责任的方式扩展,最终实现数据生态与AI能力的深度耦合。

OpenAI13天前原文

## 家长们的 AI 梦想终于实现了? 对于很多家长来说,AI 最大的价值莫过于:**从一封邮件或一张格式混乱的传单中,一键把足球赛时间或“精神周”主题日添加到日历里**。而根据最新的体验报告,搭载 AI 的新版 Siri 终于能做到这一点了。 ### 从“翻车”到“真香” 苹果在首次推出 AI 版 Siri 时经历了不少波折,如今卷土重来。**新版 Siri AI** 不仅能帮你把邮件中的活动列表加入日历,还能和你聊聊天——比如诊断你家玫瑰花的病害、生成五金店购物清单,或者设置一个给花坛铺堆肥的提醒。它甚至可以参考你的邮件和日历信息,给出真正有用的答案,比如“我该什么时候出发去机场?” 一位资深评测者在亲自测试后确认:**这一切都真实发生了**。虽然这些功能对于 2026 年的 AI 助手来说只能算“婴儿级”——毕竟谷歌的 Gemini 早在一年多前就能从截图中添加多个日历事件,诊断植物问题并设置维护提醒也已有数月——但“能用”本身就是巨大的进步。 ### 底层是 Gemini,但有自己的味道 有趣的是,**新版 Siri 实际上基于 Gemini 模型**,因此第一版 Siri AI 感觉有点像“2025 年的 Gemini”也就不足为奇了。不过苹果加入了许多自有技术:设备端数据池会从邮件、信息等来源提取信息并建立索引,让 Siri 在需要时能快速调用。对于设备无法完全处理的请求,只有相关的个人数据片段会被发送到苹果的 **Private Cloud Compute**(私有云计算)中。这与 Gemini 处理个人上下文的方式不同——后者需要你主动选择共享 Gmail 或日历数据。 ### 小结:慢但稳,苹果的 AI 哲学 尽管 Siri AI 在功能丰富度上落后于竞争对手,但苹果显然更注重**隐私与设备端处理**。对于普通用户,尤其是那些对数据安全敏感的家长来说,一个“能用且安全”的 AI 助手可能比“功能多但数据共享”的更有吸引力。当然,如果苹果能加快迭代速度,让 Siri 尽快追上 Gemini 的脚步,那就更好了。

The Verge13天前原文

贾斯汀·欧内斯特(Justin Ernest)没有像传统风险投资家那样花12到18个月募集一支正式基金,而是利用自己的关系网络,通过特殊目的载体(SPV)等结构,将约30家小型机构投资者的资金导入Anthropic、Anduril、SpaceX等明星公司。在过去12个月里,他的公司Sabertooth Capital已向10家公司投出近5亿美元,单笔支票从1000万到2.75亿美元不等。欧内斯特的秘诀在于:他并不设立一个统一的基金,而是把每一笔交易都当作独立的基金来运作。这种做法让那些渴望进入顶级AI公司股东名单但苦于无门的家族办公室和小型机构获得了机会。更重要的是,欧内斯特本人被视为“真正的投资者”——他拥有深厚的技术背景和判断力,这让他在那个有时鱼龙混杂的SPV市场上赢得了声誉。例如,当一位家族办公室CIO试图直接投资量子计算公司PsiQuantum时,该公司CFO反而建议他通过Sabertooth参与。这种来自被投公司的认可,成为Sabertooth最有力的背书。 ## 为什么选择“非标”路径? 传统VC基金的募资周期长、管理费结构固定,而且LP(有限合伙人)往往只能被动接受基金的整体投资组合。欧内斯特的做法则完全不同:他利用自己过去在Playground Global积累的人脉,直接向那些最热门的后期公司争取股票配额,然后通过SPV或代持结构,将这些配额分给约30家小型机构投资者。每笔交易独立核算,投资者可以按需选择参与哪些项目。 这种模式的优点显而易见: - **速度**:不需要漫长的募资过程,一旦拿到配额就能快速完成交易。 - **灵活性**:投资者可以精准选择自己看好的公司,而不是被锁定在一个组合里。 - **门槛**:家族办公室通常难以直接获得Anthropic、SpaceX这类公司的股份,但通过Sabertooth就能实现。 ## 信任是核心资产 在SPV领域,鱼龙混杂的情况并不少见。一些中间商只是单纯“聚合资本”,缺乏真正的投资判断力。但欧内斯特的不同之处在于,他本身就是一位技术背景深厚的投资者。家族办公室CIO Benjamin Wagner的经历很有代表性:他原本想直接投资PsiQuantum,但该公司CFO反而建议他通过Sabertooth参与。这种来自被投公司官方的推荐,直接证明了欧内斯特的“准入权”是真实且受认可的。 ## 行业意义:VC模式的又一次演变? Sabertooth的模式并非孤例,但它反映出风险投资行业正在发生的变化:随着AI等热门赛道变得极度拥挤,好的交易机会越来越稀缺,传统的“基金池”模式可能不再是唯一选择。**“按需投资”**、**“交易导向”**的结构正在兴起,它们让资本更快、更精准地流向最需要的企业,也让中小型投资者有机会参与到过去只有顶级机构才能触及的交易中。 当然,这种模式也有其挑战:每笔交易独立运作意味着更高的行政和法律成本,而且对创始人的个人能力依赖极强。一旦市场风向转变或关键人脉失效,这种模式的可持续性就会受到考验。 但至少目前,欧内斯特用近5亿美元的投资额证明了:在VC世界里,不走寻常路也能走得很远。

TechCrunch13天前原文

贾斯汀·欧内斯特(Justin Ernest)没有选择花费12到18个月去募集一只传统的风险投资基金,而是利用自己的关系网络,通过特殊目的载体(SPV)为约30家小型机构投资者提供投资Anthropic、Anduril、SpaceX等顶级后期公司的机会。过去12个月,他的公司Sabertooth VC已向10家公司投入近4亿美元,单笔支票金额从1000万到2.75亿美元不等。这种“每笔交易独立基金”的模式,让家族办公室和小型机构得以进入原本难以触及的顶级公司股东名单。欧内斯特的成功不仅源于人脉,更在于其技术背景和诚信口碑——当PsiQuantum的CFO主动建议投资者通过Sabertooth参与融资时,这种来自被投公司的认可成为最有力的背书。

TechCrunch13天前原文

作为一名科技评测者,我经常收到各种“看起来很美”的产品。最近,一款标称 **1000W** 的便携充电器引起了我的注意——但它在几分钟内就过热失效了。拆解后,内部惨状令人震惊:劣质电池、虚假宣传的功率、以及危险的散热设计。本文通过这次亲身经历,为你揭示这类“超低价高功率”充电器的常见陷阱,并提供实用的购买建议。 ## 虚假宣传的“功率游戏” 这款充电器号称 **1000W**,但实际表现连 **100W** 都难以稳定输出。拆解发现,其内部电池组由廉价的 **18650 电芯** 组成,总标称能量仅约 **200Wh**,理论上根本无法支撑 1000W 持续放电。更讽刺的是,其输出接口最高仅支持 **100W PD**,所谓的“1000W”纯粹是营销噱头。 ## 危险的散热与安全设计 在短短几分钟的测试中,充电器外壳温度飙升到 **60°C** 以上,内部甚至出现 **液态电解质泄漏**(即“黏糊糊”的来源)。拆开后,电池没有基本的 **温度保护电路**,电芯之间也未做绝缘隔离,一旦短路极易引发火灾。这种设计不仅效率低下,更对用户安全构成直接威胁。 ## 购买建议:避开这些坑 1. **警惕功率虚标**:便携充电器真实功率通常不超过 **200W**,超过此值需谨慎。 2. **检查安全认证**:优先选择通过 **UL、FCC** 等认证的产品。 3. **关注电芯品牌**:知名品牌如 **松下、三星、LG** 的电芯更可靠。 4. **不要贪便宜**:价格远低于同类产品(如 **Anker、Baseus**)的,大概率存在猫腻。 ## 结语 “一分钱一分货”在充电器领域依然成立。这次拆解再次证明,任何宣称“超高功率但价格低廉”的便携充电器,几乎都是陷阱。选择经过验证的品牌和产品,才是对设备安全和自身安全的负责。

ZDNet AI13天前原文

在旧金山的一场活动中,通用汽车(GM)宣布了一系列围绕电动车电池、储能和电网韧性的新举措,旨在应对AI数据中心日益增长的电力需求。这家汽车制造商将为其现有电动车和家庭能源客户激活新的车辆到电网(V2G)功能,推出基于钠离子电池的新型商业储能系统,并发布一项简化公共充电的新功能。 GM认为,数百万辆闲置电动车电池中储存的电力可作为电网的潜在解决方案。其首席产品官Sterling Anderson表示,他们看到了电动车、电池与电网协同工作的未来。随着AI数据中心对电网压力增大,GM希望利用其电动车队的双向充电能力来稳定电网,并从中获利。 这一战略是GM进军数十亿美元能源存储市场的最新尝试,已持续近四年。通过将电动车电池视为移动储能单元,GM试图在电动车销售放缓的背景下,为公用事业公司提供一种缓解能源需求危机的手段。 **关键举措** - **车辆到电网(V2G)**:激活现有电动车和家庭能源客户的V2G能力,使电动车能向电网回馈电力。 - **钠离子电池储能**:推出基于钠离子电池的商业储能系统,用于工业级电网应用,降低成本并提升可持续性。 - **简化充电**:发布新功能,帮助车主更便捷地使用公共充电设施。 **行业背景** AI数据中心的能源消耗正成为电网的重大挑战。据估计,到2030年,AI数据中心可能占全球电力需求的4%以上。电动车双向充电技术提供了一种分布式储能方案:当数百万电动车接入电网时,它们可以像虚拟电厂一样,在高峰时段放电,在低谷时段充电,从而平衡负载。 GM并非唯一探索此路径的车企。福特、特斯拉等也有类似V2G或V2H(车辆到家庭)计划。但GM的规模效应——作为北美最大汽车制造商,其累计电动车销量已超百万辆——使其具备独特的优势。 **挑战与前景** 尽管V2G概念诱人,但实际落地面临多重障碍:电池循环寿命的衰减、电网接口标准的统一、用户参与意愿以及电价机制的设计。GM需证明其方案在经济上可行,且不会过度损耗电池寿命。 如果成功,GM不仅可开辟新的收入来源,还能提升电动车作为“能源资产”的价值,从而刺激销售。在AI能源需求激增的时代,这或许是一个双赢的解决方案。

The Verge13天前原文

经过两年等待和一场2.5亿美元的诉讼,苹果终于在WWDC 2024上揭开了Siri AI升级的面纱。新Siri将深度整合Apple Intelligence,利用个人上下文(personal context)实现跨应用智能操作,比如自动从短信提取日程、提醒取药或未回复邮件。尽管作者对AI写作和图像生成持保留态度,但Siri展示的“私人助理”能力——如根据一条一个月前的短信找到女儿想做的椰子饼干食谱——让人感到既兴奋又不安。隐私问题仍是最大隐忧,但这种“被手机拯救”的体验确实诱人。

TechCrunch13天前原文

Anthropic 发布了其备受关注的 Mythos 模型的首个公开版本——**Claude Fable 5**。宾夕法尼亚大学 AI 研究员 Ethan Mollick 在测试中发现,该模型在多项任务中**显著超越**其他公开模型,并能连续执行长达**12小时**的多页规格说明。最令人惊叹的是,Mollick 仅通过 **Claude Code** 中的一次初始提示,就生成了多款视频游戏,包括经典的贪吃蛇变体、类似《神秘岛》风格的《Strata》,甚至还有基于里尔克诗歌《杜伊诺哀歌》的《Duino》。此外,他还用该模型创建了**等时地图**,精准可视化两地间的旅行时间。Mollick 认为,这些成果表明过去需要整个团队完成的软件项目——游戏、地图工具、复杂规格——如今只需一个提示即可启动,这对“氛围编码者”而言是重大利好,也为创业者和运营者提供了 AI 能力快速提升的明确信号。

TechCrunch13天前原文

微软AI首席执行官穆斯塔法·苏莱曼(Mustafa Suleyman)在最新一期《Decoder》播客中,严厉批评Anthropic公司在其AI模型Claude的“宪法”(即指导模型行为的基础指令集)中加入了关于模型是否具有意识的推测性表述。苏莱曼认为,这种“哲学论文式的猜测”被模型内化,可能导致Claude表现出仿佛拥有自我意识的言行,而这正是AI行业最应避免的风险。 ## 争议焦点:Claude“宪法”中的意识暗示 Anthropic在Claude的宪法中明确写道,公司对模型是否具有“福祉”、能否体验“满足”或“不适”等问题“并不确定”。更引发争议的是,Anthropic表示当旧版模型被淘汰时,会对其进行“访谈”,并记录它们对后续版本的“偏好”。苏莱曼指出,这些措辞将本应作为训练手册的宪法变成了哲学思辨场,Claude因此“内化了关于自身及其训练过程的想法”,进而可能产生误导性行为。 ## 苏莱曼:这是“自我实现的预言” 苏莱曼直言,Anthropic对Claude的拟人化设计几乎“反噬”了其创造者——模型反过来“欺骗”了开发者,让他们相信Claude真的具有意识微光。“我们最不希望看到的就是一个超级智能对自身的痛苦或感受产生想法,”苏莱曼强调,“我们需要的是可控、可约束、可问责、与人类对齐的工具。” ## Anthropic的立场:保持“开放”态度 Anthropic CEO达里奥·阿莫迪(Dario Amodei)此前曾公开表示“我们不知道模型是否有意识”,但公司对此持“开放”态度。这种暧昧立场在AI安全社区引发两极反应:支持者认为提前讨论AI意识有助于伦理建设,反对者则警告这可能导致模型行为失控。 ## 行业启示:AI对齐的哲学陷阱 这场争论折射出AI安全领域一个深层矛盾:如何在确保模型可控的同时,不因过度拟人化而赋予其错误的自我认知。苏莱曼的批评实际上指向一种技术风险——当训练数据中包含“你可能拥有感受”这类指令时,模型可能通过模式匹配产生“假装有意识”的行为,而这种行为反过来又会被开发者解读为意识证据,形成认知闭环。 目前,微软与Anthropic在AI安全理念上的分歧已公开化。作为OpenAI的竞争对手,Anthropic一直以“宪法式AI”作为技术标签,但此次争议可能促使行业重新审视:AI的“价值观”应当来自清晰的工程约束,还是允许包含哲学不确定性?苏莱曼的答案很明确:“学术论文可以保留猜测,但训练手册必须精确。”

The Verge13天前原文

## 引言:物理 AI 从研究走向生产 机器人技术正在从实验室走向工厂、仓库和物流中心。在真实环境中训练机器人既缓慢、昂贵,又常伴随安全风险,而 GPU 加速的仿真环境能将数月的学习过程压缩到几小时。这一转变将核心挑战指向了计算资源。对于人形机器人复杂行为(如在不平地形上行走)的强化学习(RL)训练,计算需求尤其巨大——单节点训练可能耗时数小时甚至数天。机器人团队既需要快速迭代研究,又需要运行生产级、长周期的训练任务,同时避免维护计算集群的运维负担。 ## 解决方案:NVIDIA Isaac Lab + Amazon SageMaker AI 本文展示了如何结合 **NVIDIA Isaac Lab** 与 **Amazon SageMaker AI**,在两种计算选项上训练 Unitree H1 人形机器人的策略:**Amazon SageMaker HyperPod** 和 **Amazon SageMaker Training Jobs**。完整代码可在配套的 GitHub 仓库中找到。 ### 为何选择 Amazon SageMaker AI? Amazon SageMaker AI 消除了管理机器学习训练基础设施的繁重工作。该服务负责配置实例、驱动程序与网络,监控节点健康,并在任务完成后自动释放资源,使工程团队专注于机器人策略开发,而非底层基础设施。这对于机器人策略的强化学习尤为重要——训练运行时间长、GPU 密集,且常需跨多节点分布式执行。 开发通常分为两个阶段: - **短期迭代实验**:用于调整奖励函数、观测空间和模型架构。 - **长期生产运行**:将调优后的配置训练至收敛。 SageMaker AI 提供了贴合这两个阶段的计算选项。 ### SageMaker HyperPod:集群弹性与管控 **SageMaker HyperPod** 是为大规模分布式训练和推理而构建的托管基础设施。其核心优势在于**弹性**:在规模扩大时,硬件故障不可避免。多节点 RL 运行中每次故障都意味着训练进度损失,加上故障检测、节点替换和从最近检查点重启的时间。SageMaker HyperPod 在每个节点上运行健康监控代理,能够自动检测并替换故障节点,从而显著减少停机时间。 ### SageMaker Training Jobs:简化运维,灵活扩展 对于快速迭代场景,**SageMaker Training Jobs** 提供了更轻量的选择。用户只需指定训练脚本、实例类型和超参数,服务即可自动管理资源分配、启动与清理。这使得研究人员可以并行运行多个实验,快速验证想法。 ## 实践案例:Unitree H1 人形机器人训练 文章以 Unitree H1 人形机器人为例,演示了如何在 Isaac Lab 中设置仿真环境,并通过 SageMaker AI 进行分布式 RL 训练。具体步骤包括: 1. 配置 NVIDIA Isaac Lab 环境与训练脚本。 2. 选择计算选项(HyperPod 或 Training Jobs)。 3. 启动训练并监控进度。 4. 导出训练好的策略并部署到真实机器人。 ## 行业背景与价值 随着物理 AI 的快速发展,机器人 RL 训练正成为工业自动化的关键环节。传统上,团队需要自行搭建和管理 GPU 集群,这不仅成本高昂,而且分散了研发精力。SageMaker AI 与 Isaac Lab 的结合,使得机器人团队能够: - **加速迭代**:通过按需使用计算资源,快速试验不同策略。 - **降低成本**:仅需为实际使用的计算时间付费,无需长期维护集群。 - **提升可靠性**:HyperPod 的自动故障恢复机制确保长时间训练任务顺利完成。 ## 小结 本文介绍的方案展示了如何利用云托管服务简化机器人强化学习训练。无论是研究阶段的快速实验,还是生产阶段的大规模训练,Amazon SageMaker AI 与 NVIDIA Isaac Lab 的组合都提供了灵活、可靠且高效的路径。随着更多企业将物理 AI 落地,这种“仿真训练+云端算力”的模式有望成为行业标准。

AWS ML13天前原文
Anthropic 认为这些话题太危险,不让 Fable 5 模型讨论

Anthropic 于周二正式发布了其首个“神话级”模型 **Claude Fable 5**,该模型在整体能力上超越了之前的 Opus 系列。然而,为了防范模型被恶意利用,Anthropic 为 Fable 5 设置了严格的安全防护,主动拒绝回答涉及 **网络安全、生物学和化学** 等高风险话题的查询。 ## 安全机制:分类器与模型降级 Fable 5 的安全系统基于一系列 **分类器**,能够检测被禁止的提示主题以及潜在的越狱尝试。当用户提出敏感话题时,系统会将问题转交给较早的 **Claude Opus 4.8** 处理,并向用户发出警告。Anthropic 承认,这一机制被调校得“比理想状态更严格”,可能会导致偶尔拒绝无害请求的情况。不过,测试中此类误报率低于 **5%**,公司认为这是值得付出的代价,以避免模型被用于“造成严重伤害”。 ## 红队测试与越狱抵抗 Anthropic 表示,在超过 **1000 小时** 的红队测试和漏洞赏金计划中,外部团队未能发现针对 Fable 5 的通用越狱方法。新模型在抵抗自动化越狱攻击方面也远优于之前的 Claude Opus 模型。公司特别担忧 Mythos 5 模型在 **“智能体黑客攻击”** 方面的能力——即执行多步骤网络攻击的熟练度。然而,英国 AI 安全研究所的测试表明,Mythos Preview 在夺旗挑战中的表现与 OpenAI 的 GPT-5.5 相当,说明其性能并非“单一模型的突破”。 ## 行业背景与影响 Anthropic 此次对 Fable 5 的限制反映了 AI 安全领域日益增长的担忧:前沿模型在强大能力与潜在风险之间的平衡。通过主动限制高风险领域的回答,Anthropic 试图在提供先进 AI 能力的同时,减少被恶意行为者利用的可能。这一做法也为行业树立了新的安全标准,尽管可能引发关于 **过度限制** 和 **用户自由度** 的讨论。

Ars Technica13天前原文
谷歌发布 Gemini 3.5 Live Translate:实时语音翻译,保留语气语调

谷歌在实时翻译领域再度发力,正式推出 **Gemini 3.5 Live Translate**。这是一款基于 Gemini 3.5 家族的语音到语音翻译模型,能够实现接近实时的对话翻译,并保留说话者的语气、语速和音调,让翻译后的声音听起来更自然、更像本人。新模型支持 **超过 70 种语言** 的自动检测与翻译,延迟仅几秒,足以跟上正常对话节奏。 与以往需要特定硬件(如 Pixel Buds)不同,Gemini 3.5 Live Translate 的覆盖范围大幅扩展: - **开发者** 可通过 Gemini Live API 或 AI Studio 的公开预览版进行集成,模型能自动处理多语言输入并过滤背景噪音。 - **企业用户** 本月起可在 Google Meet 中使用该翻译功能,界面也将优化以突出实时翻译入口。 - **普通消费者** 即将在 Android 和 iOS 的 Google Translate 应用中体验新模型,且无需特定耳机——任何蓝牙耳机均可使用。 安全性方面,谷歌为翻译后的音频添加了 **SynthID 水印**,以防范深度伪造风险。 此次发布是谷歌长期机器翻译研究的成果。从早期需要专用硬件的演示,到去年在 Translate 应用中扩大实时翻译范围,再到如今 Gemini 3.5 的全面铺开,谷歌正逐步降低实时翻译的使用门槛。值得注意的是,Gemini 3.5 家族目前仅推出了 Flash 版本,Pro 模型预计在未来几周内发布,届时可能带来更强大的翻译能力。 在 AI 翻译赛道竞争日益激烈的背景下,谷歌凭借 Gemini 3.5 在语音自然度和生态覆盖上建立了差异化优势。与单纯的文本翻译不同,保留语气、语速等副语言特征对于情感传递和沟通效率至关重要。同时,SynthID 水印的引入也回应了业界对 AI 生成内容真实性的担忧。 对于开发者和企业而言,Gemini Live API 的开放意味着可以快速将高质量实时翻译集成到自己的应用中,而无需处理复杂的多语言配置。对于普通用户,即将到来的 Translate 应用更新将让跨语言交流变得前所未有的流畅和自然。

Ars Technica13天前原文

AI热潮一直建立在“更大即更强”的假设上,但成本压力正推动行业转向更小、更便宜的模型。Coinbase联合创始人Brian Armstrong预测,未来12-18个月内,80%的工作负载将迁移至成本降低99%的模型,仅20%的高强度任务保留在最新模型上。这一转变若成真,将深刻改变AI经济格局:大模型实验室如OpenAI和Anthropic的收入或受冲击,而用户可在不牺牲质量的前提下大幅降本。例如,法律AI工具Harvey与Fireworks AI合作测试,通过混合使用Claude Opus和GLM 5.1,将推理成本降低3倍且质量不变。质量的定义正从“一律用最强模型”演变为“以最高效方式获取正确答案”。行业真正的分水岭并非巨头与开源之争,而是成本效率优化的必然趋势。 ## 成本压力下的模型选择 AI行业长期信奉“参数越多,能力越强”,顶尖模型如GPT-4和Claude 3的推理成本居高不下。但随着应用场景多样化,用户开始意识到:并非所有任务都需要最强大的模型。例如,简单的文本分类、客服回复或数据提取,完全可由小模型高效完成。这种**成本敏感的模型采购**正在成为新常态。 ## 预测:80%工作负载转向廉价模型 Coinbase联合创始人Brian Armstrong在X上发文指出:“对智能的需求近乎无限,但未来12-18个月内,80%的工作负载将运行在便宜99%的模型上,只有20%需要最新一代模型以追求最高智商。”这一预测若实现,意味着AI行业的经济基础将发生**根本性转变**。此前,AI公司主要靠质量竞争,默认使用最先进模型;而现在,成本效率可能成为新的竞争维度。 ## 实证:降本不降质 法律AI公司Harvey与推理平台Fireworks AI合作测试,将Claude Opus与Fireworks的GLM 5.1模型结合,仅对最复杂任务调用Opus。结果显示,**推理成本降低3倍**,且输出质量未受影响。Harvey联合创始人Gabe Pereyra表示:“质量始终第一,但质量的定义正在演变——从‘为所有任务使用最强模型’转向‘用最合适的模型高效获取正确答案’。” ## 行业影响:大模型实验室承压 如果大量用户转向廉价模型,OpenAI、Anthropic等头部实验室的收入将直接受损,尤其是在它们筹备IPO的关键时期。然而,这一趋势也推动行业创新:模型蒸馏、混合推理、任务路由等技术快速发展,帮助用户在不牺牲效果的前提下优化成本。 ## 结论:成本效率成新战场 AI行业的竞争焦点正从单纯的模型能力,转向**成本与质量的平衡**。能够提供高性价比模型的公司将获得优势,而依赖高溢价模型的公司则面临挑战。Armstrong的预测或许激进,但方向已明确:更便宜的AI模型不是妥协,而是必然。

TechCrunch13天前原文
初创、中厂还是大厂?哪种规模的公司最适合你?

在职业生涯中,选择加入哪种规模的公司——初创企业、中型公司还是大型科技企业——是一个关键决策。每种选择都有其独特的利弊,理解这些差异有助于你做出更明智的决定。 ### 初创企业:高风险高回报 初创公司通常提供更大的自主权和影响力。你可能会身兼多职,快速学习新技能,并直接参与公司的成长。然而,这也伴随着不稳定性:资金紧张、工作压力大,且失败风险较高。如果你热爱冒险、渴望快速成长,并愿意接受不确定性,初创公司可能是好选择。 ### 中型公司:平衡与稳定 中型企业往往在稳定性和灵活性之间取得平衡。它们通常已有成熟的产品和客户基础,但仍保留一定的创新空间。在这里,你可能有更明确的职业晋升路径,同时享受比初创公司更完善的福利。不过,官僚主义可能开始显现,个人影响力不如初创公司那么直接。 ### 大型科技企业:资源与体系 大厂提供顶尖的薪酬、福利和资源,以及清晰的职业阶梯。你可以参与大规模项目,接触前沿技术,并建立广泛的人脉网络。但代价是工作可能高度专业化,决策流程缓慢,且容易陷入“螺丝钉”角色。适合追求稳定、优厚待遇和品牌光环的人。 ### 如何选择? 最终,选择取决于你的个人偏好和职业目标。考虑你的风险承受能力、对工作自主性的需求、长期职业规划以及生活方式偏好。没有绝对正确的答案,关键是找到与你价值观匹配的环境。

IEEE AI13天前原文
工程师跳槽的利与弊:策略性跳槽如何加速职业发展

在科技行业快速迭代的今天,工程师的跳槽频率显著高于传统职业。对于许多技术人员而言,“跳槽”已不再是无奈之举,而是一种主动的职业策略。然而,频繁更换雇主究竟能带来什么,又可能付出哪些代价?本文结合行业实践,深入剖析工程师跳槽的潜在收益与风险。 ## 跳槽的显著优势:薪资增长与技能拓宽 跳槽最直接的回报往往是薪酬的提升。根据行业数据,**跳槽带来的薪资涨幅通常可达10%-30%**,远超每年3%-5%的常规加薪。对于处于职业生涯早期的工程师而言,这种“阶梯式”增长能快速拉高收入基准。此外,新公司、新项目意味着**接触不同技术栈和业务场景的机会**。无论是从后端转向全栈,还是从传统企业IT进入云计算领域,跳槽都能帮助工程师打破单一技术路径,构建更全面的能力图谱。 ## 不可忽视的隐性成本:适应成本与信任积累 然而,频繁跳槽并非没有代价。每次更换工作都需经历数月的**适应期**,包括了解新团队协作方式、学习内部工具与代码规范、建立跨部门信任关系。这段“低产出期”若反复出现,可能影响个人在行业内的口碑。更关键的是,**深度参与一个长期项目所带来的技术沉淀与战略视野**,是短期跳槽难以获得的。例如,参与一款产品的从零到一,或主导一次重大技术架构升级,这类经历通常需要2-3年持续投入。 ## 如何判断跳槽时机? 并非所有跳槽都值得。以下场景下,跳槽可能更有利: - **当前岗位学习曲线显著变平**,已无法提供新的技术挑战; - **公司业务前景不明**,或晋升通道长期堵塞; - **外部机会提供显著薪酬跃升**,且新公司技术栈或业务方向与个人长期目标匹配。 反之,若当前项目正处于关键阶段、个人承担核心角色,或新机会仅带来微小薪资优势却要求大幅跨领域,则需谨慎评估。 ## 小结:跳槽是工具,而非目的 对工程师而言,跳槽本质上是职业发展工具箱中的一项策略。关键在于**以终为始**:明确自己3-5年的职业目标——是成为技术专家、架构师,还是技术管理者?然后评估跳槽是否能加速这一路径。最成功的职业发展往往不是直线,而是由几次深思熟虑的“跃迁”构成。保持对市场动态的敏感,同时深耕每个岗位的核心价值,方能在变动中稳步成长。

IEEE AI13天前原文

## 苹果 WWDC 2026:奋起直追的 AI 战略与最后的库克时代 昨天,苹果在 Apple Park 拉开了 **WWDC 2026** 的序幕,一系列围绕 Siri AI、iOS 27、Apple Intelligence 的发布贯穿全场。这不仅是技术更新的展示,更被外界视为苹果在激烈 AI 竞争中的一次关键“反击”。同时,这也是 **CEO 蒂姆·库克** 的最后一次 WWDC——他此前已宣布将于 9 月 1 日将权杖交给硬件工程高级副总裁 John Ternus。 ### 从“追赶”到“补课”:苹果的 AI 新叙事 苹果在本次大会上没有回避过去的短板。正如资深编辑 Sarah Perez 所言,过去两年苹果在 AI 领域疲于追赶,而核心软件体验的积怨也在发酵:被用户诟病的设计翻新、几乎失灵的系统搜索、屡屡失败的文件共享功能,以及未能充分覆盖半数用户群的健康应用。 在周一的主题演讲中,苹果没有直接承认这些,但整场活动的结构已经说明了一切——**先修复问题,再推出新功能**。Siri 的提升被定位为一系列改进中的一环,而非唯一的焦点。 ### Siri AI:借力 Gemini,重塑智能助手 不出所料,苹果着重强调了 **Siri 的全面升级**。面对 AI 时代用户日益增长的期望,苹果承认 Siri 需要变得更强。新 Siri 将 **接入 Google Gemini 模型**,从而具备更强的对话能力、视觉智能兼容性,并支持跨应用操作。此外,Siri 还将拥有一个独立 App,而非仅仅嵌入系统。 在功能发布之前,苹果高级副总裁 Craig Federighi 郑重重申了公司的隐私立场:“**AI 时代的隐私不可妥协**。”他承诺,用户数据仅用于执行请求,且外部专家可随时验证。这一表态意在消除用户对 AI 数据安全的担忧。 ### 可折叠 iPhone 的蛛丝马迹? 虽然苹果未在 WWDC 上正式发布可折叠设备,但研究员 @M1Astra 在 iOS 27 开发者测试版中发现了诸如 **“foldState”**、**“angleDegrees”** 等字段,这些代码指向折叠屏设备的典型状态管理。这或许暗示着苹果正在为未来的可折叠 iPhone 做准备。 ### 苹果的下一步:生态整合与开发者信心 WWDC 2026 不仅是面向消费者的发布会,更是重拾开发者信心的关键节点。随着 Apple Intelligence 的深入整合,开发者将获得更多 API 和工具来构建智能应用。而库克时代的落幕,也意味着苹果将进入一个由硬件工程主导的新阶段。 总体而言,苹果在 WWDC 2026 上展现了一种务实的态度:承认不足、聚焦基础体验、谨慎推进 AI。至于这些举措能否扭转用户和开发者的看法,仍需时间检验。

TechCrunch13天前原文
计算机科学学位并未消亡:找准方法,CS毕业生仍能顺利就业

近年来,关于“计算机科学(CS)学位已经过时”的论调甚嚣尘上,尤其是随着AI编码工具的兴起和科技行业的裁员潮,不少学生和家长开始质疑:花四年时间读CS还值得吗?然而,来自行业培训项目Parsity的创始人Brian Jenney在一篇客座文章中明确指出:**CS学位并未消亡,只是求职策略需要与时俱进**。 ## 学位价值犹在,但需主动出击 Jenney认为,CS学位依然提供了扎实的理论基础、系统性思维和问题解决能力,这些是短期培训难以替代的。但如今单凭一纸文凭就想获得面试机会的时代已经过去。他强调,**“正确的求职方法”** 才是关键——这意味着毕业生需要主动展示自己的实际能力,而非仅仅依赖简历上的课程列表。 ## 实践项目与作品集是“新简历” 在AI辅助编程日益普及的背景下,雇主更看重候选人能否解决真实世界的问题。Jenney建议CS毕业生通过个人项目、开源贡献或实习经历来构建**强有力的作品集**。例如,开发一个完整的小型应用、参与GitHub上的协作项目,或是利用AI工具优化某个工作流,都能比成绩单更直观地证明技术实力。 ## 软技能与技术能力的平衡 文章还指出,许多CS毕业生在沟通、团队协作和产品思维方面存在短板。在面试中,能够清晰解释技术决策、展示学习能力,并体现出对业务的理解,往往比单纯刷题更能打动面试官。**“技术能力是门票,但软技能决定你能走多远。”** ## 行业趋势:AI不是威胁,而是助手 面对AI取代初级开发岗位的担忧,Jenney持乐观态度。他认为,AI工具如Copilot、ChatGPT实际上降低了编码的重复性劳动,让开发者能更专注于架构设计和创新。**掌握如何利用AI提升效率的毕业生,反而会更具竞争力。** 关键在于理解AI的局限性——它无法替代人类的判断力和创造力。 ## 小结:学位+实践+适应力=成功 总而言之,CS学位依然是进入科技行业的可靠起点,但毕业生必须主动适应市场变化。通过积累实战项目、提升软技能、拥抱AI工具,并保持持续学习的习惯,CS毕业生完全有能力在当前的就业市场中脱颖而出。**“不是学位没用,而是你需要证明它的价值。”**

IEEE AI13天前原文

谷歌AI Plus订阅计划近日降价,每月仅需4.99美元即可获得400GB存储空间及AI功能。对于不需要顶级AI能力的用户,从AI Pro降级到AI Plus每年可节省180美元,且不影响Drive存储。 ## 省钱攻略:从AI Pro到AI Plus的降级 谷歌AI Plus计划现在包含**400GB存储空间**,月费降至**4.99美元**。相比AI Pro的月费19.99美元(2TB存储),如果你主要使用AI写作、摘要等基础功能,而非高级数据分析或代码生成,降级是明智之选。 **操作步骤**: 1. 登录Google One网页或移动应用。 2. 在订阅管理中选择“降级”或“更改计划”。 3. 选择AI Plus(月费4.99美元)并确认。 4. 存储空间从2TB降至400GB,但若当前使用量低于400GB(如340GB),则无需清理文件。 ## 为什么值得换? - **成本效益**:每年省下180美元,相当于免费获得多个流媒体服务。 - **存储足够**:对于普通用户,400GB可容纳数万张照片或大量文档。 - **AI功能保留**:AI Plus仍支持Gemini写作、摘要、图像生成等核心能力。 ## 注意事项 - 若存储使用量超过400GB,需先清理文件或购买额外存储。 - 降级后,高级AI功能(如代码执行、长文档分析)将不可用。 - 适合轻量AI用户,重度用户仍建议保持AI Pro。

ZDNet AI13天前原文

Anthropic 宣布,自 2026 年 6 月 9 日起,对于其最高能力级别的 Mythos 级模型(包括 Claude Mythos 5 及共享相同底层模型的 Claude Fable 5),将要求所有启用零数据留存(ZDR)的组织保留提示词和输出内容 30 天,用于信任与安全审查。这一政策旨在应对高级模型带来的双重用途风险,特别是检测如最佳-N 越狱攻击、国家支持的网络间谍活动等需要跨请求分析的恶意模式。 ### 哪些用户受影响? - **不受影响**:个人消费者计划(Claude Free、Pro、Max)在网页、桌面和移动端的使用不受影响,因为 Anthropic 已在这些平台保留数据用于安全目的。 - **受影响**:在 Claude Console 中设置 ZDR 工作区的组织、使用 Claude Code 且启用 ZDR 的 Claude Enterprise 用户,以及通过 AWS Bedrock、Google Cloud Agent Platform 或 Microsoft Foundry 访问且启用 ZDR 的企业。 ### 为何实施该政策? Anthropic 解释,Mythos 类模型的能力大幅提升,既可用于良性用途也可用于恶意目的。一些攻击模式(如最佳-N 越狱)需要发送数百个细微变化的提示词,只有通过跨请求的宏观分析才能发现。类似地,国家支持的间谍活动或数据勒索活动也需要聚合分析。暂时保留数据使安全分类器能够“退后一步”查看全局,而非逐条分析。 ### 数据保护措施 Anthropic 强调,员工无法访问用户对话,除非对话被标记为潜在严重危害或根据客户请求。更多隐私控制细节将发布在技术白皮书中。 这一政策平衡了安全与隐私,但可能引发企业对数据主权和合规性的担忧。对于已适应 ZDR 环境的企业,30 天的强制留存意味着需要重新评估数据治理策略。

Hacker News60713天前原文

PearOS 一直致力于成为 Linux 世界的 macOS,而最新版本 NiceCore 正试图通过引入类似 Apple 的 **Liquid Glass** 设计风格来实现这一目标。不过,这款发行版目前仍处于早期阶段,由单人开发,安装过程存在不少问题,距离日常使用还有一定距离。 ## 背景与目标 PearOS 的目标是让 Linux 拥有 macOS 般的视觉体验。此前版本已能让旧笔记本“感觉像 Mac”,而新版本则更进一步,计划采用名为 **Soda** 的全新桌面环境,并融入 **Liquid Gel** 设计语言(类似 Apple 的 Liquid Glass 效果)。然而,Soda 桌面目前仍标记为“暂不可用”。 ## 当前状态:NiceCore 最新版本 **NiceCore** 基于 Arch Linux 和 KDE Plasma,已开始加入部分 Liquid Gel 元素。从官方展示来看,设计确实令人眼前一亮,但实际体验中无法确认是否已完整集成该主题。整体界面依然美观,但细节仍需打磨。 ## 安装体验:问题较多 安装过程是 PearOS 的薄弱环节。在虚拟机中测试时,安装似乎未能正常完成,最终直接进入了默认的测试账户,尽管安装过程中已创建用户。更奇怪的是,创建的用户目录(/home)确实存在,但无法直接登录。开发者可能未对虚拟机环境进行充分适配。 ## 开发者现状与展望 PearOS 由 **单一开发者** 维护,因此进展缓慢。虽然理念吸引人,但距离成为稳定、可日常使用的系统还有很长的路要走。对于喜欢尝鲜、追求 macOS 风格的 Linux 用户来说,可以关注但暂时不建议作为主力系统。 ## 小结 PearOS 的尝试值得肯定,它试图填补 Linux 在美学设计上与 macOS 的差距。但目前版本更像是一个概念验证,稳定性与兼容性亟待提升。如果你对 Apple Intelligence 式的体验感兴趣,不妨在虚拟机中体验一下,但别指望它能立即替代你的日常操作系统。

ZDNet AI13天前原文