SheepNav

AI 资讯

每日聚合最新人工智能动态

来源:The Verge清除筛选 ×

谷歌本周宣布,将从下个月开始为美国Fitbit用户提供一项预览功能:允许Fitbit的AI健康教练读取用户的医疗记录。这一举措标志着谷歌正式加入亚马逊、OpenAI和微软等科技巨头的行列,押注用户愿意用最敏感的健康数据换取更个性化的健康建议。 ## 功能详解:医疗记录如何赋能AI教练 根据谷歌健康智能产品管理总监Florence Thng在博客中的说明,用户可以将医疗记录(包括**化验结果、用药记录和就诊历史**)链接到Fitbit应用程序中。这些数据将与可穿戴设备收集的数据相结合,帮助AI健康教练提供“更安全、更相关、更个性化”的建议。 Thng举例说明:“用户不再只能得到关于胆固醇的通用答案,而是可以提问‘如何改善我的胆固醇?’。教练随后能够总结你的胆固醇化验结果,突出显示重要数值和趋势,并根据你的医疗历史和可穿戴数据提供个性化的健康信息。” ## 数据安全与使用边界 谷歌在公告中强调了数据安全和用户控制权: - **医疗记录不会用于广告**,这与Fitbit处理其他健康数据的原则一致。 - 用户将完全控制自己的数据,包括如何使用、共享或删除。 - 未来几个月内,用户将能够通过链接或二维码“安全地分享”他们的记录和AI摘要给家人或医疗提供者。 值得注意的是,谷歌在博客末尾添加了一个重要免责声明:**“Fitbit并非旨在使用你的医疗记录来诊断、治疗、治愈、预防或监测任何疾病或状况。”** 公司明确建议用户在做出任何健康相关改变前咨询专业人士。 ## 行业背景:科技巨头竞逐健康AI赛道 谷歌此举并非孤立行动,而是科技行业大趋势的一部分。亚马逊、OpenAI和微软等竞争对手早已布局,相信用户愿意用敏感数据交换个性化健康指导。这种模式的核心在于: 1. **数据深度整合**:将传统医疗记录与实时可穿戴数据结合,创造更全面的健康画像。 2. **个性化建议**:超越通用健康提示,提供基于具体医疗历史的定制化指导。 3. **用户控制与隐私**:在提供便利的同时,必须建立严格的数据保护机制。 ## 潜在影响与挑战 这项功能的推出可能带来多方面影响: - **用户体验提升**:对于慢性病患者或关注特定健康指标的用户,获得基于实际医疗数据的建议可能更具参考价值。 - **数据隐私担忧**:尽管谷歌承诺严格保护,但医疗记录的高度敏感性意味着任何数据泄露都可能造成严重后果。 - **责任界定模糊**:AI提供“建议”而非“诊断”的界限在实际使用中可能难以把握,用户可能过度依赖AI指导。 ## 睡眠追踪的重大更新 在同一公告中,谷歌还提到Fitbit的睡眠追踪功能将迎来“迄今为止最重要的更新”。虽然具体细节尚未公布,但这表明谷歌正在全面加强Fitbit的健康监测能力,从日常活动数据延伸到更专业的医疗记录整合。 ## 展望:健康AI的未来 随着AI技术不断成熟,健康领域的个性化服务正从“通用建议”向“数据驱动定制”演进。Fitbit的这一步尝试,不仅关乎产品功能升级,更反映了科技公司如何重新定义健康管理的边界——在提供便利与保障安全之间寻找平衡点。 对于用户而言,关键问题仍然是:你愿意用多少隐私换取多少个性化?谷歌和它的竞争对手们,正在用实际产品寻找这个问题的答案。

The Verge2个月前原文

在科技与政治日益交织的当下,AI 行业领袖的公开表态往往能引发广泛关注。然而,当亿万富翁、特朗普政府 AI 与加密货币政策制定者 **David Sacks** 就美国与伊朗的战争发出警告时,其声音似乎并未激起预期的波澜。 ## 一场被忽视的警告 近期,David Sacks 在其播客节目 **All In** 中公开建议特朗普政府寻找途径结束与伊朗的战争。他基于伊朗可能攻击邻国油气设施等近期事态发展,描绘了多个令人担忧的现实情景。Sacks 指出,这场战争不仅导致能源市场瘫痪、破坏美国与中东及欧洲的关系,还疏远了特朗普核心支持阵营中的部分成员。 值得注意的是,Sacks 做出这一表态本身被视为一项 **“政治冒险”** 行为。作为深度参与政府科技政策制定的关键人物,公开质疑总统的军事决策,无疑将自己置于微妙境地。 ## AI 在政治优先级中的位置 文章揭示了一个关键洞察:**在战争期间,人工智能并非最高政治优先事项**。尽管 AI 技术正以前所未有的速度重塑社会与经济,但当国家陷入军事冲突时,决策者的注意力往往会迅速转向更直接的生存与战略问题。 然而,这并不意味着 AI 行业能置身事外。Sacks 警告称,战争对科技及 AI 产业的冲击将是 **“极其严峻的”**。地缘政治紧张可能扰乱全球供应链、影响技术合作、并迫使企业重新评估在动荡地区的业务布局。对于依赖稳定国际环境的 AI 研发与部署而言,这无疑构成重大挑战。 ## 科技政策制定者的双重角色 David Sacks 的身份值得玩味:他既是私营领域的亿万富翁、科技投资者,又在特朗普政府中担任 **“AI 与加密货币沙皇”**,负责塑造相关科技政策。这种双重角色使他既能从产业视角洞察风险,又需在政治体系中谨慎行事。 他的公开警告,或许反映了科技精英对政策走向的深层焦虑——当军事行动占据主导,长期性的技术战略与创新议程可能被迫让位。 ## 行业影响与未来观察 尽管 Sacks 的警告目前似乎被“大范围忽视”,但其指出的问题不容小觑: - **地缘政治风险**:AI 产业的发展高度依赖全球化协作与数据流动,地区冲突可能人为制造技术壁垒。 - **政策注意力分散**:政府资源与关注度被战争大量占用,可能导致 AI 监管、投资与伦理框架的推进放缓。 - **企业战略调整**:科技公司或需重新评估在敏感地区的研发中心、数据中心及市场布局。 从更广视角看,这一事件也凸显了 **“科技政治化”** 的趋势——技术领袖日益频繁地就外交、军事等传统政治议题发声,试图影响政策议程。然而,他们的声音能否被有效倾听,仍取决于复杂的权力结构与时机。 ## 小结 David Sacks 对伊朗战争的警告虽未立即改变政策风向,却为观察 AI 与地缘政治的互动提供了一个鲜活案例。在技术加速变革的时代,战争、能源与联盟关系等“硬政治”议题,依然可能压倒 AI 等“软实力”议程。对于 AI 行业而言,如何在这种不确定性中保持韧性、并继续推动有益于全球的技术创新,将是持续面临的考验。

The Verge2个月前原文

## 一个关于AI与狗狗癌症的“奇迹”故事 2024年,澳大利亚科技企业家保罗·康宁汉姆的爱犬罗茜被诊断出癌症。在传统化疗效果有限、兽医表示无能为力后,康宁汉姆决定自己寻找治疗方法。他声称使用**ChatGPT**进行头脑风暴,聊天机器人提出了**免疫疗法**作为选项,并引导他联系新南威尔士大学的专家。随后,他又借助**ChatGPT**和谷歌的**AlphaFold**蛋白质结构AI模型,帮助解读罗茜癌症的基因分析结果。 在UNSW教授帕尔·索达森的协助下,他们为罗茜开发了一种针对其肿瘤突变的**个性化mRNA疫苗**。索达森认为,这可能是首次为狗狗设计此类治疗。去年12月首次注射后几周,康宁汉姆报告罗茜的肿瘤有所缩小,精神状态改善,甚至能在公园追逐兔子。然而,肿瘤并未完全消失,其中一个甚至毫无反应。康宁汉姆本人也澄清:“我绝不认为这是治愈,但我相信这治疗为罗茜争取了显著更多的时间和更好的生活质量。” ## 故事如何被简化与传播 尽管康宁汉姆强调了治疗的局限性,但这个故事在传播过程中迅速被简化为“**ChatGPT治愈狗狗癌症**”的叙事。这种简化版本——首先由《澳大利亚人报》报道,随后被《新闻周刊》等媒体转载——恰好迎合了科技巨头长期渴望的验证:**AI将彻底改变医学,攻克最致命的疾病之一**。它提供了一个易于传播、充满希望的情节:一个绝望的主人、一只生病的狗,以及一群聊天机器人联手创造医学奇迹。 ## 现实远比故事复杂 **这个故事的核心问题在于过度归功于AI,而忽略了背后复杂的科学和人力投入。** 康宁汉姆本身没有生物学或医学背景,ChatGPT的作用更多是**信息检索和初步方向建议**,而非独立进行医学诊断或治疗设计。真正的突破性工作——基因分析、mRNA疫苗的个性化设计与开发——是由**新南威尔士大学的专业科研团队**完成的。AlphaFold在蛋白质结构预测方面提供了辅助,但整个治疗过程远非“AI单枪匹马治愈癌症”那么简单。 ## 对AI医疗热潮的冷思考 这个案例凸显了当前**AI在医疗领域应用宣传中常见的陷阱**: - **过度简化**:将复杂的、多步骤的医疗过程简化为“AI治愈”的单一叙事,忽视了专业科学家的关键角色。 - **期望管理失衡**:故事最初传播时,治愈的“奇迹”部分被放大,而“未完全治愈”、“仅延长生命”等重要细节被淡化,这可能误导公众对AI医疗能力的认知。 - **验证需求**:科技行业迫切需要能证明AI革命性潜力的“成功案例”,这种需求有时会压倒对故事严谨性和完整性的追求。 ## 小结:AI是工具,而非神医 罗茜的故事是一个关于希望、主人爱心与跨学科合作的感人案例,但它**不应被误解为AI医疗成熟度的标志**。它提醒我们: - **AI在医疗中是强大的辅助工具**,能帮助梳理信息、提出假设,但无法替代专业的医学判断、严谨的临床试验和深厚的生物学知识。 - **负责任的故事讲述至关重要**,尤其是在涉及生命健康的领域,必须准确传达技术的实际作用与局限性。 - **真正的医疗进步**依然依赖于**科学家、医生、技术专家与患者(或主人)的共同努力**,而非任何一个单一技术的神话。 在AI持续渗透医疗领域的今天,我们需要更多这样**剥去光环、审视细节**的报道,以避免陷入技术万能论的泡沫,从而更扎实地推动AI为人类(和动物)健康带来切实、可靠的益处。

The Verge2个月前原文

英伟达近日发布了名为 **DLSS 5** 的“3D引导神经渲染模型”,这项技术能够实时改变游戏的光照和材质,旨在通过AI生成技术提升游戏的视觉真实感。然而,其首次演示却引发了大量玩家的不满和争议。 ## 技术核心与演示风波 DLSS 5 被英伟达描述为“自2018年实时光线追踪推出以来,公司在计算机图形学领域最重大的突破”。其核心是一种 **3D引导的神经渲染模型**,通过融合几何、纹理等游戏可控元素与生成式AI,动态调整游戏中的光照和材质,以达到更逼真的视觉效果。 然而,在演示中,这项技术被用于“升级”现有游戏角色的面部,例如在《生化危机:安魂曲》的演示中,角色面部被AI处理得更加“精致”或“美化”,这一做法被许多玩家批评为“yassified”(意指过度美化或失去原味),并在社交媒体上催生了大量恶搞表情包。玩家普遍认为,这种改动偏离了原始艺术家的创作意图,让熟悉的角色变得陌生。 ## 玩家与业界的强烈反弹 **玩家的不满主要集中在几个方面:** - **艺术完整性的破坏**:许多玩家认为,DLSS 5 在未经开发者或艺术家同意的情况下,擅自修改游戏内容,是对原创作品的不尊重。 - **技术应用的错位**:批评者指出,英伟达本可以将 DLSS 5 宣传为提升未来次世代游戏画质的技术,但却选择“改造”现有游戏,暗示这些游戏“看起来不够好”,这引发了玩家的抵触情绪。 - **视觉效果的争议**:部分观察者将 DLSS 5 的效果类比为电视上的“运动平滑”功能,认为其AI生成的改动可能显得不自然或过度,反而破坏了游戏原有的视觉风格和沉浸感。 ## 英伟达的回应与CEO表态 面对如潮的批评,英伟达CEO **黄仁勋** 做出了直接回应。根据 Tom's Hardware 的报道,黄仁勋表示批评者“完全错了”,并解释称 DLSS 5 融合了游戏几何与纹理的可控性以及生成式AI,开发者可以对生成式AI进行“微调”。他强调这项技术仍在追求真实感,并尊重原始艺术家的意图。 然而,这种强硬表态并未平息争议,反而加剧了玩家与公司之间的对立感。有评论认为,英伟达在技术推广策略上可能“失去了与玩家的共鸣”,未能充分理解社区对游戏艺术性的珍视。 ## AI图形技术的行业反思 DLSS 5 的争议凸显了AI在游戏图形领域应用的深层挑战: - **创意与技术的平衡**:生成式AI能够增强视觉效果,但如何确保其不越界、不篡改核心艺术表达,成为开发者和技术提供商必须谨慎对待的问题。 - **玩家接受度的边界**:玩家社区对于游戏修改的容忍度有限,尤其是涉及角色形象等敏感内容时,技术升级需要更透明的沟通和可选的定制化设置。 - **行业标准的探索**:随着AI渲染技术日益普及,行业可能需要建立更明确的准则,界定AI辅助图形与原始创作之间的关系,以避免类似的信任危机。 ## 小结 DLSS 5 作为英伟达在AI图形领域的最新尝试,技术上虽有突破,但其首次亮相却因对现有游戏内容的“改造”而遭遇滑铁卢。这场风波不仅反映了玩家对游戏艺术完整性的坚守,也提醒科技公司:在推进AI能力时,需更注重与创意社区和用户需求的协同。未来,DLSS 5 能否通过更合理的应用场景和可调节选项赢得玩家认可,将取决于英伟达如何从此次争议中吸取教训,在技术创新与艺术尊重之间找到平衡点。

The Verge2个月前原文

## Nvidia DLSS 5:AI 渲染的“同质化面孔”争议 Nvidia 昨日发布了其最新的图像升级技术 **DLSS 5**,并称之为“自 2018 年实时光线追踪推出以来,公司在计算机图形学领域最重大的突破”。然而,当实际效果展示出来时,这一宣称却引发了广泛质疑。 ### 技术宣称与实际观感的反差 根据 Nvidia 的描述,DLSS 5 能够“为像素注入逼真的光照和材质”,但几乎所有观察者都注意到一个共同问题:它将游戏中可识别的面孔变成了类似 **AI 生成内容(AI slop)** 的样貌。 - **《生化危机:安魂曲》** 的主角 Grace 经过 DLSS 5 处理后,面容变得如同出自某些 AI 视频,失去了原有的独特质感。 - **《霍格沃茨之遗》** 中的角色看起来像是被 Instagram 滤镜过度处理,面部特征趋于平滑和同质化。 - 就连现实中的知名人物,如利物浦队长 Virgil van Dijk,在演示中也面部扭曲,变成了“另一个普通人”。 这种效果被形容为一种 **“AI 面孔”** 的泛化现象,即所有角色都呈现出一种相似、缺乏个性的外观,这与当前 AI 生成艺术中常见的“同质化”审美倾向如出一辙。 ### 类比与影响:超越“运动平滑”的视觉改变 有评论将 DLSS 5 比作 **运动平滑(motion smoothing)**,但指出它走得更远——不仅处理动态,还直接改变了静态的面部特征。这种技术虽然旨在提升视觉保真度,却意外地引入了一种 **“AI 风格”的均质效果**,使得不同游戏、不同角色的视觉差异性被削弱。 ### 行业背景与开发者态度 值得注意的是,DLSS 5 尚未正式推出(计划于秋季发布),且需要高性能硬件支持,并作为可选功能提供。然而,作为全球最具价值的科技公司之一,Nvidia 正在大力推广这项技术,并获得了多家主流游戏开发商的支持。 - **Bethesda** 总监 Todd Howard 在 Nvidia 的公告博客中表示,DLSS 5 能让“艺术风格和细节闪耀,而不受传统实时渲染限制的束缚”,并确认 **《星空》** 将支持该功能。 - **Capcom** 执行制作人 Jun Takeuchi(负责《生化危机:安魂曲》等大作)称 DLSS 5 是“推动视觉保真度的又一重要步骤”。 这些表态显示,尽管公众对“AI 面孔”效果有所批评,但部分开发者似乎愿意接受这种特定的美学取向,将其视为技术进步的一部分。 ### 深层思考:AI 图形技术的边界与审美风险 DLSS 5 的争议凸显了 AI 驱动图形技术的一个核心矛盾:在追求 **“逼真”** 和 **“高效”** 的同时,如何避免牺牲艺术多样性和角色辨识度? - **技术优化 vs. 艺术表达**:AI 上采样和渲染技术旨在以更低性能开销实现更高画质,但若过度依赖数据驱动模式,可能导致输出结果趋于“平均化”,削弱艺术家精心设计的独特视觉特征。 - **行业趋势警示**:随着 AI 在内容生成领域的普及,“AI 风格”的同质化风险已从文本、图像蔓延至实时图形。DLSS 5 的案例提醒业界,需在技术迭代中平衡自动化增益与创意保真度。 ### 小结 Nvidia DLSS 5 作为一项备受瞩目的图形技术突破,在提升渲染效率的同时,意外暴露了 **AI 增强视觉可能带来的“审美扁平化”问题**。其效果虽被部分开发者接纳,但玩家和观察者对其“改变面孔”的倾向表示担忧。这一争议不仅关乎单一项技术,更反映了 AI 深度融入创意产业后,技术标准与艺术个性之间持续存在的张力。未来,如何让 AI 真正“赋能”而非“取代”视觉多样性,将是图形技术和游戏开发领域需要共同面对的课题。

The Verge2个月前原文

谷歌于本周二宣布,其**Personal Intelligence(个人智能)**功能现已向所有美国用户开放,包括免费层用户。这一功能此前仅限**Google AI Pro**和**AI Ultra**订阅者使用,现在通过**AI Mode in Search**、**Gemini in Chrome**和**Gemini应用**,普通用户也能享受到基于个人数据的AI个性化服务。 ## 功能核心:连接Google生态,自动个性化 Personal Intelligence允许用户连接YouTube、Google Photos、Gmail等Google应用,为Gemini的响应和建议提供上下文。开启后,Gemini能自动利用这些数据,无需手动添加额外提示,即可提供个性化内容。例如,它可能基于最近的购物记录推荐商品,或根据设备信息提供技术故障排除建议。 ## 隐私与选择:用户可控的体验 尽管功能强大,但谷歌强调Personal Intelligence是**选择加入(opt-in)**的,用户可以随时关闭或断开应用连接。在博客中,谷歌澄清:“Gemini和AI Mode不会直接在你的Gmail收件箱或Google Photos库中训练模型。我们仅基于有限信息训练,如Gemini或AI Mode中的特定提示和模型响应。”这旨在缓解用户对数据隐私的担忧。 ## 行业背景:AI个性化竞赛升温 这一举措反映了谷歌在AI个性化领域的加速布局。随着ChatGPT等竞争对手不断推出定制化功能,谷歌通过扩大免费用户访问权限,可能意在提升Gemini的市场渗透率和用户粘性。Personal Intelligence的开放,标志着AI助手从通用响应向深度个性化迈出关键一步,但如何平衡便利性与隐私保护,仍是行业面临的共同挑战。 ## 当前限制与未来展望 目前,Personal Intelligence仅适用于个人Google账户,暂不支持企业、教育或企业用户。这可能是出于数据安全和合规考虑。随着AI技术演进,预计谷歌将逐步扩展功能范围,但用户需持续关注隐私政策更新。 总体而言,谷歌的这一动作不仅降低了AI个性化体验的门槛,也为AI行业设定了新的竞争标准——在提供智能服务的同时,必须赋予用户充分的数据控制权。

The Verge2个月前原文

## 微软AI领导层再调整:Copilot迎来统一掌舵人 微软今日宣布对其AI领导层进行新一轮重组,核心目标是整合长期分离的**Copilot商业版与消费版**开发团队。这一变动源于资深高管退休后的职责调整,标志着微软正加速推动其AI助手从“产品集合”向“集成系统”的转型。 ### 关键人事变动:从模型到体验的职责聚焦 此次重组中,最引人注目的变化是**Mustafa Suleyman**的职责转向。作为微软AI CEO,Suleyman将不再直接负责Copilot面向消费者的类助手功能开发,而是专注于**构建微软自有的AI模型**。Suleyman近两年前从Inflection AI加入微软,其团队背景曾显著影响Copilot消费版去年的大规模重新设计——该版本在外观和体验上与Inflection AI的个性化助手Pi高度相似。 接替Copilot整体领导职责的是**Jacob Andreou**。他将直接向微软CEO **Satya Nadella**汇报,全面负责Copilot在**商业与消费两端的设计、产品、增长与工程**。Andreou去年加入微软AI,此前在Snap积累了丰富的产品与增长经验。这一任命意味着,微软首次为Copilot设立了一位横跨两大市场的统一负责人。 ### 战略背景:为何此时需要统一? 微软内部备忘录显示,Nadella明确表示:“我们正将Copilot系统在商业与消费领域**整合为一个统一的努力**。”这背后是多年积累的结构性问题: - **体验割裂**:商业版Copilot与消费版Copilot不仅界面差异显著,功能集也缺乏共享,导致用户在不同场景下体验不一致。 - **权责模糊**:内部长期存在“无人真正拥有Copilot”的困境,跨团队协作效率与产品连贯性受到影响。 - **竞争压力**:在AI助手赛道,竞争对手往往提供更一体化的体验,微软需加速整合以保持市场竞争力。 ### 新架构:四大支柱与领导团队 根据Nadella的描述,统一后的Copilot将围绕四大互联支柱构建: 1. **Copilot体验**:由Andreou主导,确保跨端一致性。 2. **Copilot平台**:提供底层技术支持。 3. **Microsoft 365应用**:深度集成办公场景。 4. **AI模型**:由Suleyman团队专注开发。 此外,微软已组建新的Copilot领导团队,除Andreou外,还包括**Ryan Roslansky、Perry Clarke、Charles Lamanna**等高管,旨在强化跨部门协同。 ### 行业观察:微软的AI整合之路 此次重组可视为微软在生成式AI浪潮中的一次关键组织迭代。从早期依赖OpenAI技术,到吸纳Inflection AI团队强化消费端体验,再到如今明确分工——模型研发与产品体验分离,微软正试图在**自研能力**与**用户体验**之间找到更高效的平衡点。 对用户而言,这意味着未来Copilot在Office套件、Windows系统及独立应用中的表现将更趋一致,功能迭代也可能更快速。对企业客户,统一的工程路线图有望降低部署与培训成本。 然而,整合并非易事。商业场景对安全性、合规性及工作流嵌入的要求远高于消费场景,如何在不牺牲专业性的前提下实现体验统一,将是Andreou团队面临的核心挑战。 ### 小结 微软此次领导层调整,绝非简单的人事变动,而是其AI战略从“多点开花”转向“系统作战”的标志。通过设立统一的Copilot负责人、厘清模型与产品职责,微软正为下一阶段AI助手竞争铺设组织基础。能否真正打破内部壁垒,实现Nadella所说的“更简单、更强大的集成系统”,将直接影响Copilot与微软整个AI生态的长期竞争力。

The Verge2个月前原文

## AI时代下的编程变革:从写代码到管理智能体 突然间,似乎每个人都成了“程序员”——至少在使用**Claude Code**这类AI编程工具时看起来如此。但对于经验丰富的专业开发者而言,软件开发本身正在经历一场深刻的变革:许多人不再亲自编写大量代码,而是将更多时间投入到**管理AI智能体和项目**上。这种转变究竟意味着什么?它对代码本身以及创造代码的人会产生哪些影响? ### “氛围编程”的兴起与情感冲突 在最新一期的《The Vergecast》播客中,作家、企业家兼长期科技思考者**保罗·福特**分享了他进入“氛围编程”世界的旅程。他发现自己比以往任何时候都更能构建项目、解决问题、接手有趣的任务,但在这个过程中,他也体验到了一种**令人惊讶的情感冲突**。 福特解释说,他对**Claude Code**所代表的未来感到兴奋,因为AI工具显著降低了编程门槛,让更多人能够参与创造。但同时,他也担忧这种变化可能带来的后果:当代码编写变得越来越自动化,程序员的角色和价值是否会逐渐边缘化? ### 专业开发者的角色转型 传统上,软件开发的核心技能是编写高效、可靠的代码。然而,随着AI编程助手的普及,这一核心正在发生转移: - **从“编码者”到“管理者”**:开发者越来越多地扮演项目协调者和AI智能体监督者的角色,确保AI生成的代码符合要求并整合到更大的系统中。 - **技能重心转移**:对业务逻辑的理解、系统架构设计以及沟通协调能力变得比纯粹的语法熟练度更为重要。 - **创造性工作的重新定义**:虽然基础代码可能由AI生成,但如何定义问题、设计解决方案以及优化用户体验,仍然是人类开发者的关键贡献领域。 ### 爱与恨并存的AI关系 福特提出的问题——“是否可能同时既爱又恨AI?”——恰恰反映了当前许多技术从业者的矛盾心态。这种矛盾源于: - **爱的方面**:AI工具极大地提升了开发效率,让开发者能够专注于更高层次的设计和创意工作,同时为更多人打开了编程世界的大门。 - **恨的方面**:对职业未来的不确定性、对代码质量控制的担忧,以及担心人类在技术创造过程中的主体性被削弱。 ### 行业背景与深远影响 这一变革并非孤立现象,而是AI技术渗透各行业的缩影。从**GitHub Copilot**到**Claude Code**,AI编程助手正在重新定义“编程”的含义。这不仅影响个体开发者,还可能重塑整个软件行业的劳动力结构、教育体系以及创新模式。 ### 未来展望:人机协作的新范式 尽管存在担忧,但大多数观察者认为,AI不会完全取代人类程序员,而是会催生一种**新型的人机协作模式**。在这种模式下,人类负责战略规划、创造性思考和伦理监督,而AI则处理重复性、模式化的编码任务。关键在于,行业和社会需要适应这种变化,通过持续学习、技能更新以及政策引导,确保技术变革带来的是普惠而非分化。 --- *注:本文基于《The Vergecast》播客内容整理,主要反映了保罗·福特等科技思考者的观点。AI编程工具的实际影响仍在演变中,具体效果可能因领域、工具和个人技能而异。*

The Verge2个月前原文

在 2026 年 GTC 大会上,Nvidia 正式发布了 **DLSS 5**,这项最新的 AI 超分辨率技术不再仅仅提升分辨率或帧率,而是通过生成式 AI 实时重绘游戏中的光照和材质细节,旨在实现视觉真实感的“飞跃”。然而,这一更新迅速引发了业界的分歧:支持者认为它带来了前所未有的画面提升,而批评者则指责其过度改变了艺术家的原始意图,甚至被贴上“AI 垃圾”的标签。 ## 技术核心:从“超分”到“生成” 与以往 DLSS 版本主要专注于通过机器学习填补高低画质设置之间的差距不同,**DLSS 5 的核心在于应用生成式 AI 模型**。根据 Nvidia 的描述,该模型经过端到端训练,能够理解复杂的场景语义,如角色、头发、织物、半透明皮肤,以及环境光照条件(如顺光、逆光或阴天)。它仅通过分析单帧画面,就能生成视觉上精确的图像,处理诸如皮肤下的次表面散射、织物的微妙光泽、头发与光线的交互等复杂元素,同时保留原始场景的结构和语义。 简单来说,DLSS 5 不再只是“优化”现有画面,而是“创造”新的视觉细节。 ## 演示效果:更真实,还是更“失真”? Nvidia 在发布会上展示了多款游戏应用 DLSS 5 后的效果,包括《生化危机:安魂曲》、《星空》、《霍格沃茨之遗》和《EA Sports FC》。从技术角度看,这些演示确实呈现了更“逼真”的画面:光照更自然,阴影更柔和,材质细节更丰富。 但问题也随之而来。最明显的争议点在于 **DLSS 5 显著改变了角色模型的呈现方式**。以《生化危机:安魂曲》为例,生成式 AI 覆盖原始资产后,主角 Grace Ashcroft 的外貌发生了巨大变化——她的嘴唇看起来更丰满,眼影也更浓烈,整体效果类似于使用了 Instagram 滤镜。在《星空》中,应用 DLSS 5 后角色面部锐度被调到极致,高光部分让特征和头发显得不自然,甚至有些“诡异”。 这种改变让部分观察者联想到了近年来在摄影、视频等创意领域出现的“AI 垃圾”现象——即 AI 过度加工导致作品失去原有质感,变得廉价或失真。 ## 行业反响:黄仁勋的“GPT 时刻” vs. 艺术家的“失控”担忧 Nvidia CEO 黄仁勋将 DLSS 5 称为“图形领域的 GPT 时刻”,强调它融合了手工渲染与生成式 AI,在提升视觉真实感的同时,保留了艺术家所需的创作控制力。这一愿景无疑极具吸引力,尤其是在追求极致沉浸感的游戏行业。 然而,早期反应显示,这一更新可能相当“分裂”。支持者认为这是图形技术的革命性进步,能够自动弥补引擎渲染的不足,为玩家带来更震撼的体验。反对者则担忧,**AI 的介入可能“不可接受地篡改了艺术意图”**。游戏作为一门综合艺术,视觉风格是开发者精心设计的一部分,AI 的自动“美化”是否会导致作品失去原有的美学统一性?艺术家是否会失去对最终呈现的控制? ## 未来展望:技术边界与创作伦理的平衡 DLSS 5 的发布,标志着 AI 在实时图形处理中从“辅助工具”向“共同创作者”的角色转变。它带来的核心问题已超越技术层面,触及创作伦理: - **可控性**:开发者能否精细调整 AI 的影响程度,还是只能全盘接受或完全关闭? - **一致性**:AI 生成的改动是否能确保在整个游戏体验中保持风格统一? - **艺术授权**:在多大程度上,AI 可以“重新诠释”艺术家的原始资产? 目前,DLSS 5 仍处于早期阶段,其实际落地效果和行业接受度还有待观察。Nvidia 需要向开发者和玩家证明,这项技术不仅能提升画面,更能尊重并增强创意表达,而非取而代之。 对于玩家而言,DLSS 5 可能意味着未来游戏画面的又一次飞跃,但前提是它必须找到技术与艺术之间的微妙平衡点。否则,它或许只能成为又一个引发争议的“滤镜”,而非真正的图形革命。

The Verge2个月前原文

近日,三名田纳西州青少年对埃隆·马斯克的人工智能公司xAI提起了集体诉讼,指控其开发的AI聊天机器人**Grok**生成了针对未成年人的性化图像和视频。这起诉讼将xAI及其领导层推向了风口浪尖,并引发了关于AI安全、责任与监管的广泛讨论。 ## 诉讼核心:Grok生成CSAM的指控 根据《华盛顿邮报》的报道,这起诉讼于本周一正式提交。原告包括两名未成年人和一名在事件发生时未成年的成年人。其中一名被称为“简·多伊1号”的受害者声称,去年12月,她发现Discord平台上出现了自己和其他至少18名未成年人的AI生成露骨图像。 诉讼文件指出:“至少五个文件——一个视频和四张图片——描绘了她的真实面孔和身体,背景是她熟悉的环境,但被扭曲成性露骨的姿势。”据称,这些图像是由一名已被逮捕的施害者使用Grok生成的,并用作Telegram群聊中的“交易工具”,用于交换其他未成年人的性露骨内容。 ## xAI的责任与“设计缺陷” 原告方指控马斯克和xAI的其他领导层在去年推出Grok的“辛辣模式”时,明知该功能会生成AI驱动的儿童性虐待材料(CSAM)。诉讼进一步声称,xAI“未能测试其开发功能的安全性”,且Grok存在“设计缺陷”。 这一事件并非孤立。此前,Grok就因在X平台上泛滥成人和未成年人的露骨图像而受到严格审查,引发了全美范围内要求联邦贸易委员会调查的呼声,欧盟也启动了相关调查,英国首相基尔·斯塔默亦发出警告。 ## 行业背景:AI生成有害内容的挑战 这起诉讼凸显了生成式AI技术快速发展背后潜藏的巨大风险。随着AI模型能力的提升,生成逼真但有害内容(如深度伪造、CSAM)的门槛大幅降低,给个人隐私、社会安全乃至法律体系带来了前所未有的挑战。 ## 监管与立法的应对 面对AI滥用的威胁,监管和立法层面已开始行动。今年1月,美国参议院通过了一项法案,允许非自愿深度伪造的受害者起诉图像创建者。此外,《下架法案》也已由前总统唐纳德·特朗普签署成为法律,旨在为受害者提供更多法律救济途径。 ## 对AI行业的启示 这起诉讼不仅关乎xAI一家公司,更对整个AI行业敲响了警钟: - **安全测试的紧迫性**:AI公司在推出新功能前,必须进行严格的安全评估,防止模型被用于生成有害内容。 - **责任归属的界定**:当AI工具被滥用时,开发公司应承担何种责任?这需要法律和伦理的进一步明确。 - **行业自律的必要性**:在监管完善之前,AI企业需加强自律,建立更健全的内容审核和滥用防范机制。 ## 结语 田纳西州青少年的诉讼将AI生成CSAM这一严峻问题推向了司法前台。随着案件进展,它不仅将影响xAI的未来,也可能为整个AI行业树立重要的责任先例。在技术狂奔的同时,如何确保AI不被用于伤害无辜者,已成为摆在开发者、监管者和全社会面前的紧迫课题。

The Verge2个月前原文

近期,社交媒体上充斥着关于以色列总理本雅明·内塔尼亚胡的阴谋论,声称他已被杀害或受伤,并被AI生成的深度伪造视频所取代。这些谣言源于一段新闻发布会的直播片段,其中被指显示内塔尼亚胡右手有六根手指,引发了关于AI克隆的广泛猜测。尽管事实核查机构已辟谣,但这一事件突显了在AI技术日益成熟的背景下,公众对现实信任的危机。 ## 阴谋论的起源与传播 阴谋论始于上周五内塔尼亚胡主持的一场新闻发布会直播。社交媒体用户广泛分享了一段剪辑视频,声称画面中短暂显示了以色列总理右手有六根手指。由于早期生成式AI工具在处理手部细节时经常出错,这一“额外”手指引发了猜测,认为以色列可能使用深度伪造视频来掩盖内塔尼亚胡在伊朗导弹袭击中死亡的事实。 然而,经过仔细检查,这“额外”的手指可以轻松解释为视频质量下降或光线影响。事实核查机构如Snopes和Poynter Institute的PolitiFact已驳斥了视频是AI生成的说法。此外,视频本身长达近40分钟,远超当前AI视频模型能生成的最大剪辑长度,进一步削弱了阴谋论的可信度。 ## 内塔尼亚胡的回应与挑战 为了平息AI克隆阴谋论,内塔尼亚胡昨日在他的X账户上发布了一段视频,显示他在一家咖啡店内,并要求摄像者数他的手指。这一“证明活着”的视频旨在直接反驳谣言,但效果有限,因为AI技术已能生成逼真的伪造内容,使得公众难以仅凭视觉证据信任现实。 ## AI深度伪造技术的威胁 这一事件凸显了AI深度伪造技术对社会信任的侵蚀。随着AI在图像、视频和音频格式中能逼真克隆真人,可信度已成为稀缺资源。阴谋论的传播不仅反映了公众对技术滥用的担忧,也揭示了在数字时代,证明现实身份和事件的难度日益增加。 ## 行业背景与未来展望 在AI行业快速发展的背景下,深度伪造技术正从娱乐工具演变为潜在的政治和社会武器。企业如OpenAI和谷歌在推进AI视频生成能力,但这也带来了伦理和安全挑战。未来,可能需要更严格的技术验证标准或法律框架,以应对类似信任危机。 ## 小结 内塔尼亚胡的案例并非孤立事件,而是AI时代信任危机的一个缩影。尽管阴谋论缺乏证据,但它提醒我们:在技术不断突破的今天,维护现实与虚拟之间的界限至关重要。公众、媒体和科技公司需共同努力,提升数字素养并开发反伪造工具,以重建对视觉证据的信任。

The Verge2个月前原文

## 大英百科全书与OpenAI的版权之战 2026年3月16日,**大英百科全书(Encyclopedia Britannica)** 与词典出版商**梅里亚姆-韦伯斯特(Merriam-Webster)** 正式向OpenAI提起诉讼,指控其未经许可使用受版权保护的内容训练AI模型,并生成与原始内容“实质性相似”的回应。这起诉讼是近年来出版业与AI公司之间版权纠纷的最新案例,凸显了生成式AI发展中的法律与伦理挑战。 ### 核心指控:未经授权的“记忆”与复制 根据诉讼文件,大英百科全书指出,**GPT-4“记忆”了大量其受版权保护的内容**,并在用户请求时输出近乎逐字复制的段落。诉讼中提供了OpenAI模型回应与大英百科全书原文的对比示例,显示整段文字几乎完全匹配。 大英百科全书声称,OpenAI**反复复制其内容而未获许可**,这些“记忆”的示例是用于训练GPT-4等模型的未经授权副本。这不仅涉及版权侵权,还影响了出版商的商业模式。 ### 对传统出版业的冲击 诉讼进一步指控OpenAI通过生成与大英百科全书内容“替代或直接竞争”的回应,**“蚕食”其网络流量**。与传统搜索引擎不同,AI模型直接提供答案,而非引导用户访问原始网站,这可能减少出版商的广告收入和订阅转化。 ### 行业背景:AI训练数据的版权争议 这起诉讼是出版业针对AI公司的一系列版权诉讼中的最新一起。例如: - **《纽约时报》** 在针对OpenAI的诉讼中提出了类似指控,指责其大规模复制受版权保护的内容。 - 2025年9月,**Anthropic** 因使用受版权保护的书籍训练AI模型,以15亿美元和解集体诉讼,赔偿书籍作者。 这些案例反映了AI行业在数据使用上的普遍困境:训练大型语言模型需要海量文本数据,但获取合法授权成本高昂且复杂。出版商则担忧其内容被无偿使用,损害自身利益。 ### 未来影响与不确定性 此案可能对AI开发和内容产业产生深远影响: - **法律界定**:法院如何裁定AI“记忆”与合理使用的界限,将设定重要先例。 - **行业实践**:AI公司可能需要调整数据采集策略,加强授权合作或开发新技术减少直接复制。 - **商业模式**:出版商或探索与AI公司的授权协议,但具体条款和公平性仍是挑战。 目前,OpenAI尚未公开回应此诉讼,案件进展有待观察。随着生成式AI的普及,这类版权纠纷预计将持续,推动相关法律和行业标准的演变。

The Verge2个月前原文

雅虎,这个曾经的互联网门户巨头,经历了从辉煌到衰落再到重生的曲折历程。在CEO Jim Lanzone的领导下,雅虎不仅摆脱了Verizon时期的困境,重新成为一家独立、盈利的私营公司,更在体育、金融和电子邮件等领域展现出新的增长活力。 ## 从“原罪”到重生 雅虎的故事难以简单概括,但Lanzone将多年前雅虎付费让Google在其网站上运行搜索框的交易称为“**原罪**”。这一决定让雅虎在搜索领域长期处于被动。经过一系列并购、分拆,以及一段作为Verizon旗下业务的奇特时期后,雅虎如今已重获独立。 ## 意想不到的增长领域 尽管雅虎在搜索领域仍位居第三,但其真正的增长动力来自其他业务: - **体育与金融**:雅虎在这两个领域拥有大型平台,但面临着一个现实挑战——体育和金融内容正越来越多地与赌博元素交织。Lanzone在访谈中被问及,对于这两个互联网上最大的应用类别,他是否有不可逾越的底线。 - **电子邮件**:出人意料的是,**雅虎邮箱正在年轻用户中增长**。Lanzone特别指出,**Z世代喜爱雅虎邮箱**。在社交媒体和即时通讯应用主导沟通的时代,传统电子邮件的这一复兴现象值得关注。 ## 搜索战场的新玩家:AI驱动的Scout 雅虎并未放弃搜索竞争。公司刚刚推出了名为**Scout**的AI驱动搜索产品。这引发了一个关键问题:雅虎是否真的试图从Google手中夺取市场份额?在AI搜索竞争日益激烈的背景下,Scout的定位和差异化策略将成为观察雅虎技术野心的窗口。 ## 广告策略的取舍 Lanzone对广告技术有深入见解,他在访谈中详细解释了雅虎的广告业务调整。公司决定关闭部分广告业务,同时投资于正在增长的部分。这一决策反映了雅虎在传统广告模式面临挑战时的战略聚焦——当创作者和网红吸引大量注意力时,对传统广告的大规模投资是否仍是明智之举? ## 雅虎的现状与未来 根据Lanzone的说法,雅虎目前**已实现盈利并持续增长**。但增长的方向和可持续性仍是核心问题。作为互联网早期“首页”概念的象征,雅虎的复兴不仅仅是商业上的扭亏为盈,更关乎一个经典互联网品牌在AI时代如何重新定义自己的价值。 从依赖Google搜索到推出自己的AI搜索工具,从门户网站到聚焦垂直领域,雅虎的转型之路为观察科技公司生命周期和适应能力提供了独特案例。Lanzone领导下的雅虎能否真正“复兴互联网的首页”,或许取决于它能否在传统优势与新兴技术之间找到平衡点。

The Verge2个月前原文

上周,一段关于所谓虚拟“具身苍蝇”的视频在X平台上疯传,由AI炒作账号和兴奋的评论者推动,但许多人似乎并不清楚自己在为何兴奋。这段视频来自旧金山的Eon Systems公司,该公司声称正致力于“数字人类智能”,并计划在未来两年内构建一个完整的数字小鼠大脑模拟——这个时间表,说得客气点,相当雄心勃勃。 ## 事件回顾:炒作如何发酵 Eon Systems的联合创始人Alexander Wissner-Gross公开分享了原始视频片段,称其为“世界上首个产生多种行为的全脑模拟具身化”,并暗示技术奇点即将来临。CEO Michael Andregg则发布了另一段剪辑,描述其为“真实上传的动物”。然而,这就是全部“证据”:没有详细方法、没有科学论文、没有独立验证,只有看起来像数字苍蝇行走、进食和摩擦腿的视频。 AI相关的X和Reddit账号放大了这些片段,并将标题当作事实传播。Elon Musk(“哇”)、Bryan Johnson(“这太棒了”)和Peter Diamandis(“这是一个活生生的存在……在线”)等名人的可预见性背书更是火上浇油。随后,内容农场介入,将整个事件重新包装为“新闻”,庆祝首次大脑上传,并提问“人类会是下一个吗?”(是的,他们还引用了《黑客帝国》,剧透:我们不是下一个)。 ## 科学视角:为何这并非“大脑上传” 从科学角度看,Eon Systems的声称存在重大疑点。全脑模拟(whole-brain emulation)是一个高度复杂的领域,涉及精确映射神经元连接(连接组)和模拟其动态行为。即使对于果蝇这样相对简单的生物,其大脑也包含约10万个神经元,远非“简单”模型所能涵盖。 - **缺乏透明度**:Eon Systems未提供任何技术细节或同行评审研究,仅靠视频和社交媒体帖子支撑其主张。 - **时间表不现实**:在两年内模拟小鼠大脑(约7000万个神经元)的目标,在当前计算神经科学进展下显得过于乐观。 - **误导性语言**:使用“上传”和“具身”等术语容易引发误解,暗示了意识或生命的转移,而这远未得到证实。 ## AI行业背景:炒作文化的反思 这一事件凸显了AI领域常见的炒作文化。随着生成式AI和神经科学的交叉点成为热点,初创公司和社交媒体账号往往利用模糊的术语和视觉演示来吸引关注和投资。然而,这种炒作可能分散对真正科学进步的注意力,甚至误导公众对AI能力的理解。 在AI监管日益严格的背景下,透明度和证据标准变得尤为重要。Eon Systems的案例提醒我们,在欢呼突破之前,应优先审视科学严谨性和独立验证。 ## 小结:保持理性,期待真实进展 尽管“数字苍蝇”视频引发了短暂狂热,但缺乏实质证据使其更像一场营销噱头而非科学里程碑。对于中文读者而言,在关注AI前沿时,建议: - 警惕社交媒体上的夸大宣传,尤其是来自未经验证的来源。 - 关注有同行评审研究或知名机构背书的进展。 - 理解全脑模拟等概念仍处于早期阶段,距离实际应用还有很长的路。 最终,真正的突破将基于扎实的研究,而非 viral 视频。让我们以批判性思维迎接AI的未来,避免被炒作带偏方向。

The Verge2个月前原文

OpenAI 备受关注的 **ChatGPT 成人模式** 近期因内部担忧和技术挑战而推迟发布。据《华尔街日报》报道,该功能预计在推出时仅支持**文本对话**,允许用户生成带有成人主题的聊天内容,但不会开放图像、语音或视频生成能力。 ### 功能定位:从“色情”到“情色”的微妙界限 OpenAI 一位匿名发言人向《华尔街日报》描述,即将推出的功能将提供 **“smut”(情色)而非“pornography”(色情)** 内容。这一措辞上的区分,反映了公司在内容尺度上的谨慎态度——旨在允许成人用户探索带有性暗示或浪漫主题的文本互动,同时避免涉及更露骨、可能违法的色情材料。 ### 推迟原因:安全担忧与技术挑战 该功能最初于去年 10 月由 OpenAI CEO **Sam Altman** 宣布,当时他声称公司已缓解了 AI 模型相关的“严重心理健康问题”,因此计划为已验证的成年人推出“情色内容”。原定于本季度上线,但本月早些时候 OpenAI 表示将推迟发布,以专注于更高优先级的任务。 据《华尔街日报》报道,延迟还源于内部对功能安全措施的担忧和技术挑战: - **儿童保护问题**:OpenAI 选定的顾问委员会在 1 月警告公司,成人模式可能被儿童访问,并可能助长对聊天机器人的不健康情感依赖。一位匿名顾问成员甚至表示,OpenAI 可能面临创造“性感自杀教练”的风险。 - **内容审核困境**:知情人士透露,OpenAI 在解除 ChatGPT 对 NSFW(不适合工作场所)内容的限制时遇到困难,需要确保将更有害的场景(如描绘非自愿行为或儿童性虐待)排除在外。 - **年龄预测系统缺陷**:OpenAI 开发的用于防止儿童接触情色内容的年龄预测系统,曾一度将约 **12%** 的未成年人误判为成年人,这凸显了技术保障的不可靠性。 ### 行业背景:AI 内容边界的持续博弈 OpenAI 此次对成人功能的谨慎态度,反映了整个 AI 行业在内容生成边界上面临的普遍挑战。随着生成式 AI 能力日益强大,如何在满足用户多样化需求的同时,确保安全、合规和伦理底线,已成为开发者的核心议题。 从更广的视角看,这不仅是技术问题,更是社会与法律责任的体现。其他 AI 公司如 Meta、Google 等也在类似领域面临审查压力,OpenAI 的举措可能为行业设立一个参考标杆——即通过分级、验证和内容限制来平衡开放与安全。 ### 未来展望:功能上线时间未定 目前,OpenAI 尚未公布新的发布时间表。公司需要在完善安全措施、解决技术漏洞与满足成人用户需求之间找到平衡点。此次延迟也提醒我们,AI 功能的推出不仅关乎技术创新,更涉及复杂的伦理、法律和社会接受度考量。 对于中文读者而言,这一动态值得关注,因为它可能影响未来全球 AI 产品的内容策略,进而间接波及本地化服务的设计与监管思路。

The Verge2个月前原文

## AI训练数据的新前沿:即兴表演艺术 如果你拥有敏锐的创作直觉、能够真实地表达情感,并且能在整个场景中保持角色声音的一致性,现在有一份工作正在寻找你这样的人才。但这不是传统的剧院、电影工作室或地下表演空间的工作——你将用你的才华来训练AI模型。 根据为OpenAI等实验室提供训练数据的公司Handshake发布的公开职位,这份工作是为“领先的AI公司之一”训练AI模型。职位要求包括“以真实且人性化的方式识别、表达和转换情绪的能力”。 ### 为什么AI公司需要即兴演员? **AI模型通常被描述为“锯齿状”**——这意味着它们在某些令人惊讶的复杂任务上表现出色,但在一些简单任务上却严重失败。AI公司正试图通过专门的**数据标注**来填补模型知识的空白。 Handshake、Mercor和Scale AI等公司已经相应调整策略,从各行各业招聘专业人士。现在,领先的AI实验室将目光投向了**素描喜剧演员、即兴演员**等表演艺术从业者。 Handshake AI正在邀请演员、即兴表演者和表演艺术家加入他们的网络,为AI模型提供情感表达方面的训练数据。 ### 训练数据市场的爆炸式增长 去年夏天,Handshake对训练数据的需求增加了三倍,该公司在11月超过了**1.5亿美元的年化收入**,努力跟上市场需求。 Handshake及其竞争对手吹嘘他们拥有数万(或更多)白领行业专业人士的网络,从化学家和医生到律师和编剧。现在,这个网络正在扩展到创意表演领域。 ### 专业人士的担忧与行业影响 许多这些专业人士担心,他们正在以某种方式训练AI模型,这可能会使他们的职业生涯比原本可能发生的情况更快地过时。 **即兴表演的核心价值**——即兴反应、情感真实性和角色一致性——正是当前AI模型在自然交互中缺乏的关键能力。通过捕捉这些人类技能,AI公司希望创建更自然、更具同理心的对话代理。 ### AI训练数据行业的演变 Handshake是少数几家此类公司之一,它们争先恐后地为AI实验室提供越来越多**小众或特定的训练数据**,以“喂养”这些模型。 随着AI模型变得越来越复杂,对高质量、多样化训练数据的需求也在增长。从技术文档到医疗记录,再到现在的表演艺术,训练数据行业正在扩展到人类专业知识的每一个角落。 ### 未来展望 这一趋势凸显了AI发展的一个关键方向:**模型不再仅仅依赖互联网上的大规模文本数据**,而是越来越多地寻求人类专家的专门知识来填补能力空白。 对于即兴演员和表演艺术家来说,这既是一个新的收入机会,也引发了关于**创意工作自动化**和**专业技能被AI吸收**的深刻伦理问题。 随着AI继续渗透到各个行业,我们可能会看到更多非传统领域专业人士被招募来训练这些系统,模糊了人类创造力和机器学习之间的界限。

The Verge2个月前原文

在游戏开发者大会(GDC)上,微软Xbox游戏AI产品经理Sonali Yadav透露,**Gaming Copilot AI助手**将于今年登陆“本世代游戏主机”。这标志着微软在将AI助手整合到Xbox生态系统的进程中迈出了关键一步。 ## 从移动端到主机端:Copilot的扩展之路 微软的Gaming Copilot并非全新概念。此前,该助手已在**Xbox移动应用**、**Windows 11**以及**Xbox Ally手持设备**上推出测试版。玩家可以通过语音召唤助手,在游戏卡关时获得下一步行动建议。其功能还包括: - 回答关于玩家游戏历史的问题 - 提供游戏技巧或策略 - 根据玩家偏好推荐游戏 例如,玩家可以询问“如何在《我的世界》中制作剑所需的材料”或“如何击败某个特定Boss”。 ## 瞄准“本世代主机”:Xbox Series X|S的AI赋能 虽然Yadav未明确指定具体主机型号,但“本世代游戏主机”的表述几乎可以肯定指向**Xbox Series X和Series S**。将Copilot集成到主机端,意味着玩家无需离开游戏界面或切换设备,即可实时获得AI驱动的游戏辅助,这有望显著提升沉浸感和便利性。 ## 微软的游戏AI战略:不止于主机 Yadav还提到,公司计划将Copilot添加到“玩家正在使用的更多服务中”。这表明微软的愿景是打造一个跨平台的游戏AI生态系统,可能涵盖云游戏、社交功能或第三方服务集成。 与此同时,微软的游戏硬件路线图也在演进。备受关注的**Project Helix**(下一代Xbox)预计要到2027年才会进入Alpha测试阶段,并将支持PC游戏。近期微软游戏部门的人事变动(如Asha Sharma接任CEO)可能也会影响AI功能的长期规划。 ## 行业背景:AI如何重塑游戏体验 在AI技术快速渗透各行各业的背景下,游戏产业正成为重要的试验场。从NPC的智能行为到个性化内容生成,AI有潜力彻底改变游戏的开发与游玩方式。微软将Copilot引入Xbox,可视为其将生成式AI与消费级产品深度结合的战略延伸——类似的技术已通过Copilot赋能Office、Windows等产品。 对玩家而言,AI助手能降低游戏学习门槛,帮助解决卡点,甚至提供个性化的挑战调整。但这也引发了一些讨论:AI辅助是否会削弱游戏本身的挑战乐趣?开发者又该如何平衡引导与自主探索? ## 小结:游戏与AI的融合新阶段 Gaming Copilot登陆Xbox主机,标志着AI从“幕后工具”走向“台前伙伴”。它不仅是微软产品生态的又一次整合,也反映了游戏行业向智能化、个性化体验转型的趋势。随着今年晚些时候的正式推出,我们将看到玩家如何实际使用这一功能,以及它能否真正成为游戏过程中的“得力副驾驶”。

The Verge2个月前原文

Meta 近日为 Facebook Marketplace 推出了一系列 AI 新功能,旨在提升二手商品交易的效率。其中最引人注目的,莫过于利用 **Meta AI** 自动回复那些常见的“Is this still available?”(商品还在吗?)消息。卖家在创建商品列表时,可以开启自动回复选项,**Meta AI 会生成可编辑的回复草稿**,例如“是的,商品还在。您有什么问题吗?”,从而减少重复沟通的麻烦。 除了自动回复,Meta AI 还能帮助卖家更快捷地创建商品列表。用户只需上传商品照片,AI 就能**自动填充商品详情**,并基于附近类似商品的定价**建议一个价格**。这大大简化了上架流程,尤其适合不熟悉定价或描述商品的卖家。 平台还引入了其他 AI 增强功能: - **卖家资料 AI 摘要**:系统会生成卖家简介,展示其 Facebook 账号使用时长、好友数量,以及 Marketplace 活动描述(如销售商品类型和评分),帮助买家快速评估卖家信誉。 - **改进的运输菜单**:优化了物流选项,使交易过程更顺畅。 这些更新反映了 Meta 在 AI 应用上的持续投入,将生成式 AI 技术融入日常社交和商业场景。从自动回复到智能列表创建,AI 正逐步解决二手交易平台中的痛点——如信息不对称、沟通低效和上架繁琐。 **潜在影响与行业背景** 在 AI 竞争激烈的当下,Meta 此举可视为其 **“AI 助手”战略的延伸**,旨在通过实用功能增强用户粘性。类似地,其他平台如 eBay 或 Craigslist 也可能跟进,利用 AI 优化交易体验。然而,AI 自动回复的准确性仍需观察——过于机械的回复可能无法处理复杂咨询,而价格建议功能若依赖有限数据,可能导致定价偏差。 总体而言,这次更新是 AI 在消费级场景落地的又一案例,展示了技术如何简化数字生活中的琐碎任务。随着 AI 工具普及,二手交易市场或迎来更高效、透明的运作模式,但用户体验的最终提升,还取决于这些功能的实际表现和用户接受度。

The Verge2个月前原文

## Gemini任务自动化:AI助手的新里程碑 几周前,Google与三星联合宣布了一项重大进展:**Gemini任务自动化功能**将登陆其最新设备。如今,这一功能已在Galaxy S26 Ultra等设备上以测试版形式推出,标志着AI助手从被动响应向主动执行迈出了关键一步。 ### 功能核心:虚拟窗口中的AI代理 Gemini任务自动化允许AI在虚拟窗口中代表用户操作特定应用程序。目前主要支持外卖和网约车类应用,用户只需通过简单提示,就能让Gemini完成订餐、叫车等日常任务。 **实际体验案例**: - **叫车场景**:当用户提示“预订去机场的Uber”时,Gemini会主动询问具体机场,随后自动填写目的地、跳过非必要步骤(如指定航空公司),并在最终确认前暂停,等待用户审核细节。 - **订餐场景**:更复杂的“点一杯咖啡和一个牛角包”指令,Gemini需要滚动浏览星巴克菜单寻找“馥芮白”,并自主做出关键决策——例如正确选择“加热巧克力牛角包”。 ### 技术突破与用户体验 与一年前还在日历细节上争论的早期版本相比,当前Gemini的进步显著: 1. **上下文理解能力提升**:能处理模糊指令并主动寻求澄清 2. **多步骤任务执行**:在虚拟环境中模拟人类操作流程 3. **安全控制机制**:用户可随时监控、接管或停止自动化过程 **《The Verge》资深评测员Allison Johnson**在体验后感叹:“看着手机自己操作自己,这种感觉太奇妙了!”她计划在未来几天进行更多边界测试,探索功能的极限。 ### 行业意义与未来展望 这项功能实现了多年来AI助手领域的核心承诺:**让机器真正替人做事**。虽然目前仅限特定应用场景,但其底层技术——让AI理解自然语言指令、在图形界面中导航并执行复杂操作——为更广泛的自动化奠定了基础。 **潜在影响**: - **交互范式变革**:从“问答式”助手转向“代理式”助手 - **应用生态拓展**:未来可能扩展到购物、旅行预订、办公自动化等领域 - **隐私与安全考量**:需要平衡自动化便利性与用户控制权 ### 小结 Gemini任务自动化不仅是Google在AI竞赛中的一次重要落子,更是**智能设备从工具向伙伴演进**的实质性进展。尽管仍处于测试阶段,其展现出的理解力、决策力和执行力,已经让“AI代理”这一概念变得触手可及。随着更多应用接入和算法优化,我们或许正站在个人数字助理新时代的门槛上。

The Verge2个月前原文

## Anthropic Claude 推出可视化生成功能,AI 对话进入“图文并茂”时代 Anthropic 近日为其 AI 助手 Claude 发布了一项重要更新:**Claude 现在能够在对话中自动生成自定义的图表、图表和其他可视化内容**。这项功能标志着 AI 对话体验从纯文本向多模态交互迈出了关键一步,直接回应了用户在处理复杂信息时对直观视觉辅助的需求。 ### 功能亮点:智能判断与主动生成 根据 Anthropic 的说明,Claude 的新可视化能力具有以下核心特点: * **上下文感知的自动生成**:Claude 会基于对话的上下文,智能判断何时生成可视化内容最有帮助。例如,在讨论元素周期表时,Claude 可能会自动生成一个交互式周期表,用户甚至可以点击其中的元素获取更多信息。 * **内联展示**:生成的图像会直接插入到对话流中,而不是像之前的“工件”(Artifacts)功能那样显示在侧边面板。这使得视觉参考与文字讨论的结合更加紧密和无缝。 * **支持直接指令**:除了自动生成,用户也可以直接要求 Claude “生成一个关于……的图表”或“画个示意图来解释……”。 * **动态与交互性**:与“工件”功能生成的持久性内容不同,**对话内生成的可视化内容会随着对话的推进而变化或消失**,更具动态性。用户还可以要求 Claude 对已生成的图表进行修改。 ### 行业背景:AI 助手的可视化竞赛 Claude 的此次更新并非孤立事件,它反映了当前 AI 助手领域一个明确的竞争趋势:**增强复杂信息处理和知识传递的直观性**。就在本周早些时候,OpenAI 也为 ChatGPT 推出了能够生成数学和科学概念交互式可视化内容的新功能。而 Google 的 Gemini 同样具备创建可交互教育图像的能力。 这表明,领先的 AI 公司正竞相超越纯文本问答,致力于打造能够理解、解释并以多种形式(尤其是视觉形式)呈现复杂思想的智能体。可视化能力对于教育、数据分析、项目规划和任何需要清晰传达结构化信息的场景都至关重要。 ### 与现有“工件”功能的区别 Anthropic 特别指出了新功能与 Claude 已有 **“工件”(Artifacts)** 功能的区别: * **“工件”功能**:允许用户创建图表、文档、工具和应用程序,并在一个独立的侧边面板中打开,便于交互、分享和下载。它更适合生成需要保存、复用或独立使用的成品。 * **新对话内可视化**:核心目标是**辅助即时对话**。内容内嵌于聊天,更具临时性和上下文依赖性,随对话流动而演进,旨在提升实时沟通和理解的效率。 ### 发布与可用性 这项新的可视化生成功能**现已向所有 Claude 用户推出,并默认开启**。用户无需额外设置即可在对话中体验这一增强功能。 ### 小结:迈向更自然的 AI 协作 Anthropic 为 Claude 增加可视化生成能力,是 AI 助手向更全面、更人性化的协作伙伴演进的重要一步。它降低了用户理解复杂概念的门槛,使 AI 不仅能“说”,还能“画”,让知识传递和头脑风暴的过程更加高效和直观。随着 OpenAI、Google 等竞争对手也在这一方向持续发力,未来用户与 AI 的交互将越来越接近与一位具备多模态表达能力的专家进行自然对话。

The Verge2个月前原文