AI 资讯

每日聚合最新人工智能动态

1901

开发者拒绝在没有AI的情况下工作——这可能会反噬他们

新上线

2026年，AI编程工具已成为开发者的“标配”，但最新研究揭示了一个令人担忧的趋势：开发者越来越不愿在没有AI辅助的情况下工作，这可能导致代码质量下降和长期隐患。 ## 开发者“上瘾”：没有AI就不干活 2026年2月，知名AI研究机构METR发布了一项令人惊讶的发现：大多数开发者不再愿意在没有AI的情况下工作，即使是参与研究任务也不例外。METR原本计划重复2025年的一项经典实验——测量开发者手动编码与使用AI编码的生产力差异——却遭遇了意想不到的困难：开发者拒绝参与，因为他们“不希望在没有AI的情况下工作，哪怕只是为了研究”。这一现象揭示了AI工具在开发者群体中的深度渗透。2025年的原始实验曾发现，虽然AI能快速生成代码，但开发者随后需要花费更多时间排查错误、调整AI输出以及等待任务完成，整体效率反而下降。然而，到了2026年，开发者对AI的依赖已经超越了效率考量，成为一种工作习惯甚至“心理依赖”。 ## 自评生产力翻倍，但事实可能相反 METR随后在5月发布了一项调查，让技术员工自我评估AI带来的生产力提升。不出所料，受访者普遍认为AI使他们**对组织的价值翻了一番**。但这种主观感受与客观数据之间存在明显矛盾。 2026年的一个热门趋势是“**Tokenmaxxing**”——即将AI使用量（token消耗数）作为生产力指标。这一做法正在遭遇质疑。据《金融时报》报道，亚马逊已关闭内部token追踪排行榜“Kirorank”，原因是员工通过过度使用AI代理来“刷榜”，导致成本飙升。Uber同样在2026年前四个月就耗尽了全年AI预算，但COO Andrew Macdonald在播客中承认，巨额投入并未带来项目数量或生产力的可衡量提升。 ## AI代码的维护陷阱程序员兼作家James Shore在Hacker News上引发热议的一篇博客中指出，AI生成的代码并不一定能减少代码维护需求，反而可能增加负担。“你写两次代码，”他写道，暗示AI生成的代码往往需要人工反复修正。 ## 长期风险：技能退化与隐性债务开发者拒绝脱离AI工作，意味着他们可能在失去独立解决复杂问题的能力。当AI工具无法处理边缘情况或产生难以调试的“幻觉代码”时，过度依赖的开发者将面临更大的挑战。此外，AI生成的代码可能引入**技术债务**——虽然短期内加速了开发，但长期维护成本可能远超预期。 ## 结论：工具虽好，依赖需有度 AI编程工具无疑是强大的生产力放大器，但2026年的研究提醒我们：**效率不等于效果，速度不等于质量**。开发者需要警惕对AI的过度依赖，在享受便利的同时，保持核心编程能力和代码审查的严谨性。否则，今天的“捷径”可能成为明天的“陷阱”。

TechCrunch29天前原文

1902

亚马逊要用AI动画改编《好建议杯子蛋糕》，原作者震怒

新上线

Loryn Brantz 多年前为 BuzzFeed 创作的卡通角色“好建议杯子蛋糕”（Cuppy），如今被 BuzzFeed 授权给亚马逊 Prime Video，计划通过 AI 工具制作成动画剧集《Cupcake & Friends》。Brantz 对此毫不知情，并在 Instagram 上公开谴责这是“对全球艺术家的攻击”。该剧集是亚马逊 AWS 与 MGM 工作室联合发起的 GenAI 创作者基金首批项目之一。Brantz 指出，BuzzFeed 在未与她协商的情况下，将她的原创角色用于 AI 动画，违背了此前高管的口头承诺。她呼吁抵制 BuzzFeed 及所有 AI 生成或辅助的动画作品。这一事件凸显了数字媒体公司在 AI 时代对创作者权益的漠视，也引发了关于 AI 生成内容版权与伦理的广泛讨论。

WIRED AI29天前原文

1903

免费帮你打扫房间？这家AI初创公司用你的家训练未来机器人

新上线

一家名为 **Shift** 的 AI 训练初创公司近日推出了一项看似“天上掉馅饼”的服务：免费为你打扫房间，但条件是——清洁工工作时会佩戴一顶装有摄像头的“魔法帽子”，全程记录清洁过程，用于训练未来的家务机器人。 ## 用隐私换整洁？ Shift 在社交媒体上宣布了这一不寻常的 offer，并解释称，清洁过程中产生的训练数据价值远超清洁服务成本。用他们官网的话说：“你得到一尘不染的公寓，我们得到训练数据。双赢。” 宣传视频中，清洁工身着白色制服，头戴一顶略显笨拙的帽子，擦窗、拖地、吸尘、刷碗、擦拭台面——这顶“魔法帽子”里的摄像头从清洁工的第一人称视角记录一切。 ## 隐私与数据的交易当然，允许陌生人进入家中并全程录像，隐私问题是绕不开的坎。Shift 承诺客户隐私“得到充分保护”，所有姓名、面孔、以及屏幕和证件上的个人信息都会在用于 AI 训练前进行模糊和匿名化处理。清洁工也经过合作方审查，但他们并非 Shift 员工。公司强调：“今天打扫的每一间房屋，都在为明天能自我打扫的房屋铺路。” 有趣的是，越脏乱的环境反而越有价值。FAQ 页面指出“更具挑战性的清洁环境尤其有用”，但清洁工也有权拒绝任何他们觉得不舒服的任务。 ## 落地与未来目前该服务仅限纽约地区，但 Shift 联合 CEO Bercan Kilic 表示，很快会扩展到 **旧金山、伦敦、苏黎世和慕尼黑**。免费清洁仅限“限时”体验，但这一模式切中了 AI 行业对真实世界操作数据日益增长的需求——用人类演示来训练机器人，正成为具身智能赛道的关键环节。 Shift 的做法并非孤例。近年来，多家公司通过众包或雇佣方式收集人类操作数据，用于训练机械臂、扫地机器人甚至人形机器人。不过，直接以上门清洁换取数据的方式，在成本和隐私平衡上仍属大胆尝试。对于用户而言，这或许是一次“用隐私换整洁”的赌博：你的家会成为机器人学习的“考场”，而代价只是忍受一次免费打扫和那顶奇怪的帽子。

Hacker News19029天前原文

1904

上手体验 Gemini Spark：我把生活全权交给它，它却把我男友当成了“好朋友”

新上线

Google 在今年的 I/O 开发者大会上推出了 **Gemini Spark**，一个始终在线的 AI 智能体，能够连接你的个人数据、完成在线任务并自动化日常交互。这是 Google 对 2026 年初席卷硅谷的 OpenClaw 智能体的回应。作为首批体验者，我让 Gemini Spark 完全访问我的 Gmail、文档和日历，然后输入了一句简单的提示：“帮我计划一场生日派对”。结果令人惊叹：它不仅从我真实预订的卡拉 OK 酒吧信息中提取了细节，还生成了五页的完整计划，包括宾客名单、场地规则、附近餐饮、余兴派对地点、邮件邀请和主题创意。整个过程仅需几分钟，无需我时刻监督。然而，真正让我哭笑不得的是 AI 生成的宾客名单。它扫描了我的邮件和文档，推荐了 15 位潜在朋友——恰好是包间最大容量。名单第一位是我的长期同居男友，却被标注为“亲密朋友和频繁旅伴”。更离谱的是，作为寿星的我本人竟然不在名单上。这种“数据洞察”与真实关系的错位，暴露了当前 AI 智能体在理解人类情感和社交细微之处时的局限性。 Gemini Spark 本周开始向 AI Ultra 订阅用户（每月 100 美元）开放 Beta 版，位于 Gemini 聊天机器人的新标签页中，支持移动端和桌面端控制。尽管它在任务自动化上表现出色，但这次“翻车”提醒我们：AI 可以处理日程，却无法理解人心。

WIRED AI29天前原文

1905

这些AI术语你肯定听过但未必懂，我们来一次性说清楚

新上线

人工智能的崛起带来了大量新术语和行话。本文整理了一份常用词汇表，帮助你理解LLM、RAG、RLHF等关键概念。 ## 从AGI到AI Agent：核心概念解析 **AGI（通用人工智能）** 是一个模糊但重要的概念。OpenAI CEO Sam Altman将其描述为“可以雇来当同事的普通人类水平的AI”，而OpenAI的章程则定义为“在大多数经济价值工作上超越人类的高度自主系统”。Google DeepMind的理解略有不同，认为AGI是“在大多数认知任务上至少与人类能力相当的AI”。值得注意的是，即使是AI研究前沿的专家们对此也未达成共识。 **AI Agent（智能体）** 指的是能够自主执行一系列任务的工具——比如报销费用、预订机票或编写代码——远超基础聊天机器人的能力。不过，正如我们之前解释过的，这个新兴领域仍有许多不确定性，不同人对AI Agent的理解可能不同，其底层基础设施也仍在建设中。 ## 技术细节：API端点与思维链 **API端点（API endpoints）** 可以理解为软件后端暴露的“按钮”，其他程序可以“按下”这些按钮来触发功能。开发者利用这些接口构建集成，例如让一个应用从另一个应用拉取数据，或让AI Agent直接控制第三方服务。大多数智能家居设备和联网平台都有这些隐藏按钮，普通用户通常看不到。随着AI Agent能力增强，它们越来越能自主发现并调用这些端点，带来强大的自动化可能。 **思维链（Chain of thought）** 是一种推理方法，让AI像人类一样逐步思考问题。面对简单问题时，人类大脑可以不经思考直接回答；而复杂问题则需要分解步骤。思维链提示技术正是模拟这种过程，要求模型输出中间推理步骤，从而提升复杂任务的准确性。 ## 行业背景与术语价值这些术语的涌现反映了AI行业的快速迭代。理解它们不仅是技术爱好者的需求，更是商业决策者和普通用户跟上时代的基础。例如，区分AGI的不同定义有助于评估AI公司的技术路线和商业承诺；了解API端点的概念则能理解为什么AI Agent正在成为自动化领域的热点。本文作为一份活文档，将持续更新。建议读者重点关注**RLHF（基于人类反馈的强化学习）**、**RAG（检索增强生成）** 等后续会深入解析的术语，它们分别对应AI对齐和知识检索两大关键方向。

TechCrunch29天前原文

1906

当公司“误入AI歧途”：Box创始人警告“AI精神病”现象

新上线

近年来，AI取代人类工作的论调甚嚣尘上，但Box创始人Aaron Levie却提出了一个令人警醒的观点：那些决定AI可以取代你工作的人，恰恰是最不了解你工作真正内涵的人。他将这种现象称为“AI精神病”（AI psychosis）。 Levie的这番评论并非空穴来风。项目管理平台ClickUp近期裁掉了22%的员工，理由是为了给AI代理腾出空间。更令人担忧的是，2026年的科技行业裁员人数已经几乎与2025年全年持平。这些数据表明，企业正在以前所未有的速度用AI替代人类岗位，但其中可能隐藏着巨大的认知偏差。 ### 什么是“AI精神病”？ Levie所描述的“AI精神病”，指的是企业高管和技术决策者过度沉迷于AI的潜力，以至于盲目相信AI能够解决所有问题，甚至在不完全理解业务复杂性的情况下，就贸然用AI替代人类员工。这种思维模式忽略了AI的局限性，也低估了人类在特定场景下的不可替代性。例如，ClickUp的裁员决策引发了广泛争议。虽然AI代理在处理重复性任务上确实高效，但项目管理涉及大量的人际沟通、创意协调和战略决策，这些都是当前AI难以胜任的。Levie认为，这种“先开枪后瞄准”的做法，最终可能导致企业效率下降，甚至失去核心竞争力。 ### AI替代的隐形成本事实上，AI替代人类工作并非简单的成本效益计算。当企业盲目追求AI化时，往往会忽略以下隐形成本： - **知识流失**：经验丰富的员工离开后，其积累的行业知识和隐性技能难以被AI复制。 - **创新停滞**：过度依赖AI可能导致团队失去主动思考和创新的能力。 - **客户体验下降**：AI在处理复杂、个性化需求时，往往不如人类灵活和富有同理心。 Levie的警告并非反对AI技术本身，而是呼吁企业保持理性。AI应当被视为增强人类能力的工具，而非完全替代人类的解决方案。 ### 行业趋势与反思 2026年的裁员数据令人震惊：科技行业的裁员人数已接近2025年全年水平。这背后既有经济下行的压力，也有AI技术普及的冲击。然而，Levie的观点提醒我们，裁员并非总是最优解。企业在推动AI转型时，需要更深入地评估岗位价值，避免陷入“为了AI而AI”的误区。一些公司已经开始反思这一趋势。例如，部分企业选择通过再培训让员工与AI协作，而非直接裁员。这种“人机协同”的模式或许更可持续。 ### 小结 “AI精神病”是一个值得所有科技从业者警惕的现象。在AI浪潮席卷各行各业的今天，企业决策者需要保持清醒：AI是工具，不是万能药。真正的竞争力，来自于对技术与人类价值的深刻理解与平衡。

TechCrunch29天前原文

1907

Robinhood 推出 AI 代理炒股功能：让智能体帮你下单交易

新上线

随着科技行业围绕 AI 智能体（AI Agent）加速布局，股票交易应用 **Robinhood** 也正式加入这一浪潮。本周三，Robinhood 宣布推出 **AI 代理交易** 功能，并同步上线一款面向 AI 代理的虚拟信用卡，标志着个人投资与 AI 自主操作之间的边界正在被打破。 ## 功能设计：AI 代理如何为你交易？ Robinhood 用户现在可以为自己的 AI 代理创建一个独立账户，并连接专属钱包。AI 代理能够读取和分析用户的投资组合，提出交易策略和投资建议，但**只能动用预充入专属钱包的资金**来下单。所有交易行为都会通过 Robinhood 应用向用户发送通知，用户可随时监控代理的活动。对于部分交易，代理会生成预览，**需要用户手动批准**后才能执行。 Robinhood 还内置了欺诈检测保护机制：一旦出现可疑交易，Robinhood 团队会进行审查并协助用户解决争议。目前该功能处于 **Beta 阶段**，仅支持股票交易；公司计划后续扩展至期权、加密货币、事件合约、期货和预测市场。 ## 连接方式：通过 MCP 协议实现智能体对接 Robinhood 允许用户将 AI 代理连接到其 **Model Context Protocol (MCP) 服务**，从而执行多种操作，例如： - 分析集中度风险和行业敞口 - 执行交易 - 浏览分析师笔记以发现跨行业投资机会这种开放接口的设计，使得用户可以使用自己的工具、大型语言模型（LLM）和代理来与 Robinhood 平台交互。 ## 虚拟信用卡：让 AI 代理也能付款除了交易功能，Robinhood 还推出了一款专为 AI 代理设计的 **虚拟信用卡**。用户可将 AI 代理连接到 Robinhood 的银行 MCP 服务器，使其能够代表用户进行支付。该虚拟卡目前仅面向 Robinhood Gold Card 持有者开放，用户可以设置**每月消费限额**，并选择每次支付是否需要代理请求批准。Robinhood 表示，即将推出的 **Platinum Card** 也将支持类似的虚拟代理卡功能。 ## 行业背景与战略意义 Robinhood 在 AI 领域的布局已有时日：2024 年收购了 AI 驱动的研究平台 **Pluto**，去年又推出了提供投资建议的 AI 助手。此次 AI 代理交易功能的推出，进一步将 AI 从“建议者”升级为“执行者”，标志着个人投资领域进入 **AI 自主操作** 的新阶段。对于用户而言，AI 代理可以 24/7 监控市场并快速执行策略，但也带来了风险控制、隐私保护等新挑战。Robinhood 通过独立钱包、交易通知和人工审查机制，试图在“自主”与“可控”之间取得平衡。 ## 小结 Robinhood 的 AI 代理交易功能目前处于早期测试阶段，但它预示了一个趋势：AI 智能体正在从聊天工具演变为具备实际金融操作能力的“数字管家”。未来，随着更多资产类别和支付场景的接入，AI 代理在个人金融领域的应用空间值得密切关注。

Hacker News11229天前原文

1908

AI公司免费帮你打扫，但全程录像：为训练机器人，它们盯上了你的家务活

新上线

本周，一家名为 **Shift** 的 AI 训练初创公司宣布，将为纽约居民提供**免费的家政清洁服务**，并计划将业务扩展到伦敦等城市。表面上是福利，但背后有一个明确的交换条件：Shift 要求拍摄清洁工工作的全过程——从洗碗、擦台面到拖地，所有家务细节都会被记录下来。这些视频并非用于宣传，而是作为训练机器人的**真实世界数据**。为什么需要这么多家务视频？与可以从互联网大规模抓取的文本、图像数据不同，机器人要学习物理世界中的操作，需要理解空间、运动、力、摩擦、不规则形状和光线变化等复杂因素。对人类来说轻而易举的叠衣服、捡苹果、倒水，对机器人而言却是巨大的工程挑战。要教会它们这些技能，必须依赖海量的、高质量的**物理世界数据**。 Shift 并非孤例。在印度，家居服务平台 **Pronto** 也被曝出利用客户的家作为 AI 训练素材的来源，拍摄烹饪、清洁、洗衣等家务活动。Pronto 声称只在客户明确同意的情况下录制，但客户获得什么回报尚不明确。这种做法引发了关于隐私和知情同意的讨论。 ### 数据瓶颈催生“创意”采集随着具身智能（Embodied AI）和机器人技术的升温，真实世界数据成为稀缺资源。与数字内容不同，家务数据无法轻易从网上抓取，且往往涉及隐私和伦理问题。Shift 的模式本质上是“以服务换数据”——用免费清洁换取拍摄许可，既获取了高质量训练数据，又绕过了传统数据采集的高昂成本。 ### 隐私与便利的博弈对于消费者而言，免费清洁听起来很有吸引力，但代价是让陌生人记录下自己私密的生活空间。这些视频如何存储、使用、分享，是否会被用于其他目的，都是未知数。Shift 和 Pronto 的做法也提醒我们：在 AI 时代，**数据采集的边界正在模糊**，而日常生活中的隐私可能成为技术发展的“燃料”。 ### 小结机器人想要真正走进家庭，必须先学会做家务。而学会做家务，又需要大量家庭场景的数据。Shift 的免费清洁计划是这一循环中的一环，它揭示了 AI 训练数据获取的新趋势——从公开网络转向现实世界，从免费抓取转向“等价交换”。但如何平衡技术发展与个人隐私，将是整个行业需要持续面对的课题。

The Verge1个月前原文

1909

继英伟达 200 亿美元“非收购式人才获取”后，AI 芯片初创公司 Groq 据称再融 6.5 亿美元

新上线

据 Axios 报道，AI 芯片初创公司 Groq 正寻求从现有投资者处筹集 **6.5 亿美元** 新资金，以加大对推理（inference）云业务的投入。该业务依托 Groq 自研芯片和系统，为开发者与企业提供托管推理密集型应用的平台。此前，Groq 在去年 12 月与英伟达达成了一项价值约 **200 亿美元** 的“非收购协议”（not-a-quisition），部分 Groq 高管转投英伟达，同时 Groq 将其硬件技术授权给英伟达。这笔交易让 Groq 的早期投资者获得了现金回报——如果该交易是完整收购，它本会成为英伟达历史上最大的一笔收购。如今，这些投资者被要求继续注资，支持 Groq 的推理云业务扩张。推理是 AI 模型在收到提示后进行的处理过程，当前在 AI 领域的需求远大于模型训练。Groq 的新方向目前由临时 CEO **Adam Winter** 和临时 CFO **Matt Eng** 领导。报道称，这轮融资几乎已成定局：Groq 的投资方 **Disruptive** 和 **Infinitium** 已同意，如果其他现有投资者不愿按比例认购，它们将补足剩余份额。 ## 行业背景 Groq 的转型折射出 AI 芯片赛道的显著变化。随着大模型从训练转向大规模部署，**推理效率** 成为关键瓶颈。Groq 凭借其低延迟、高吞吐的 LPU（语言处理单元）架构，在推理市场占据一席之地，但面临英伟达、AMD 以及 Cerebras 等定制芯片厂商的激烈竞争。此次融资也凸显了 **“非收购式人才获取”** 模式的兴起。英伟达通过类似协议，既获得了关键人才，又避免了反垄断审查，而 Groq 则获得了资金和生态支持。不过，Groq 的核心团队流失后，能否独立推进推理云战略仍存变数。 ## 小结 Groq 的 6.5 亿美元融资计划，既是对其推理云业务前景的押注，也是对英伟达主导地位的一次挑战。在 AI 推理需求爆发的当下，这家初创公司能否借力此轮融资实现突围，值得持续关注。

TechCrunch1个月前原文

1910

继英伟达200亿美元“非收购式挖角”后，AI芯片初创公司Groq据悉再融资6.5亿美元

新上线

AI芯片初创公司Groq正计划从现有投资者处筹集6.5亿美元新资金，以加大对其推理云业务的投入。据Axios报道，这家公司正从硬件转向聚焦AI推理（inference）——即优化AI模型对用户提示做出响应的过程。去年12月，Groq与英伟达达成了一项价值约200亿美元的“非收购协议”，涉及部分Groq高管跳槽至英伟达，以及Groq硬件技术的授权。这笔交易让Groq的投资者获得了现金回报，但如果当时是全面收购，它本将成为英伟达历史上最大的一笔收购。如今，这些投资者被要求再次出资，支持公司发展推理云业务，该业务允许开发者和企业托管其推理密集型应用。目前，Groq由临时CEO Adam Winter和临时CFO Matt Eng领导。报道称，这6.5亿美元融资几乎已成定局——现有投资者Disruptive和Infinitium已同意，如果其他投资者不愿按比例认购，他们将补足剩余份额。推理是AI提示之后发生的处理过程，目前在AI世界中，推理的需求远大于模型训练。Groq的转型反映了这一趋势：随着AI应用大规模落地，推理环节对算力的消耗正成为瓶颈，而Groq自研芯片在推理速度和能效上具有优势。这轮融资距离英伟达的“非收购”协议仅半年，显示出Groq在获得资金和人才后，正加速向推理服务商转型。对于英伟达而言，这既是巩固其AI生态的举措，也间接扶持了一个潜在竞争对手。

TechCrunch1个月前原文

1911

视频星期五：极致全向移动机器人

新上线

本周的机器人视频精选又来了！从仿生多足设计到全向移动突破，这些机器人正在重新定义“运动能力”的边界。 ## 亮点一：多足机器人的“冗余美学” 在最新一期“视频星期五”中，**通用机器人实验室（General Robotics Lab）** 展示了一款拥有**超常数量腿**的机器人。设计师似乎信奉“腿越多越好”的理念——这款机器人不仅能在复杂地形中保持稳定，还能通过冗余腿实现**容错运动**：即使部分关节失效，仍能继续完成任务。这让人联想到自然界中的蜈蚣或千足虫，它们通过多足协调实现高效且稳健的移动。 ## 亮点二：极致全向移动能力该机器人的**全向移动**能力尤为突出。不同于传统轮式或双足机器人的转向限制，它可以在不改变朝向的情况下向任意方向平移，甚至原地旋转。这种能力在狭小空间作业（如管道检测、废墟搜救）中极具价值。研究者通过优化腿部运动轨迹和地面接触力，实现了近乎瞬时的方向切换。 ## 行业背景：为什么“腿越多”反而更受关注？近年来，足式机器人领域呈现两极分化：一方面，**双足人形机器人**因拟人形态备受资本追捧；另一方面，**多足机器人**在**工业巡检、灾害响应**等场景中展现出独特优势。例如，波士顿动力的Spot（四足）已在石油平台和建筑工地部署，而六足或八足机器人则能进一步降低单腿负载，适应更松软或崎岖的地形。 ## 未来展望虽然该机器人目前仍处于实验室阶段，但其设计理念为下一代救援或探索机器人提供了新思路。随着驱动器和控制算法的进步，多足机器人有望在**农业、行星探测**等领域大显身手。不过，能耗和运动效率仍是需要攻克的关键难题。更多机器人酷炫视频，可关注IEEE Spectrum的“视频星期五”系列。

IEEE AI1个月前原文

1912

《真相的未来》作者因使用AI生成内容陷入争议

新上线

一本探讨AI如何扭曲现实的书籍，却因作者本人使用AI而陷入信任危机。史蒂夫·罗森鲍姆的新书《真相的未来》被曝包含多处伪造或错误归因的引文，而AI检测工具更指出书中部分内容疑似由AI生成。尽管作者辩称AI仅用于辅助研究，但这一事件揭示了AI时代下信息真实性的深层困境。

WIRED AI1个月前原文

1913

开源安全乱象丛生，IBM与Red Hat押注50亿美元和2万名工程师能否力挽狂澜？

新上线

开源软件的安全问题正日益严峻，维护者不堪重负。IBM与Red Hat联合推出 **Project Lightwell**，这是一项由AI驱动的、旨在以工业级规模发现并修复开源软件漏洞的计划。两家公司计划投入 **50亿美元**，动员 **2万名工程师**，打造一个集中式安全漏洞处理中心。 ### 背景：开源维护者的困境随着AI的普及，开源项目面临双重挑战：一方面，AI帮助开发者更快编程和发现缺陷；另一方面，大量AI生成的漏洞报告让维护者应接不暇。知名开源项目 **cURL** 的创始人兼维护者 **Daniel Steinberg** 坦言：“2026年安全报告涌入速度是2024年的4到5倍，是2025年的两倍。”他首次承认“工作强度前所未有，但漏洞洪流仍在持续”，已濒临过劳。他呼吁更多公司提供资金支持，以雇佣更多开发者分担压力。 ### Project Lightwell：AI驱动的安全中心 IBM与Red Hat的回应是Project Lightwell——一项“前所未有的力量”，旨在以工业规模识别并修复开源软件漏洞。它计划成为事实上的开源组件安全中心，覆盖支撑现代企业IT的核心组件。不过，该项目并非直接向上游开发者支付报酬，而是为IBM和Red Hat的工程师提供先进的AI工具，让他们专注于修复关键开源项目的安全问题。 Anthropic的 **Mythos Preview模型** 已在短短几周内识别出近 **3900个严重安全漏洞**，凸显了快速修复的紧迫性。为此，两家公司将投入 **50亿美元** 并动员 **2万名工程师**，在未来数年内推进该项目。 ### 订阅模式与未来展望 Lightwell将采用订阅制服务，但具体定价和运作细节尚未公布。这一模式能否有效缓解开源维护者的压力，并真正提升软件供应链的安全性，仍有待观察。但无疑，这是迄今为止企业界对开源安全最重大的投入之一。

ZDNet AI1个月前原文

1914

免费上门打扫？代价是全程录像，用于训练机器人

新上线

一家德国初创公司 MicroAGI 近日在纽约推出了一项“免费家庭清洁”服务，但要求清洁工佩戴摄像头记录全过程，用于训练未来家用机器人。这听起来像科幻情节，却已在现实中悄然落地。 ## 服务模式：以数据换清洁 MicroAGI 通过其新上线的 **Shift 应用** 提供预约服务。用户只需在 App 上填写电话、邮箱、住址等信息，即可预约一次约两小时的免费深度清洁。清洁工均为“专业清洁人员”，但会佩戴智能眼镜或头戴摄像头，全程记录第一人称视角的清洁动作。公司官网直言，此举是为了收集 **“第一人称清洁视频”**，用于训练下一代家用机器人。这种“以数据换服务”的模式，在 AI 训练数据采集领域并非首创，但直接进入家庭环境仍属罕见。 ## 隐私承诺：自动模糊处理针对隐私担忧，Shift 应用在 FAQ 中承诺：所有视频在上传至云端前，会通过运行在设备上的 **“先进机器学习模型”** 自动模糊人脸、身份证件、屏幕、手机等个人可识别信息。公司声称这些模糊处理是“不可逆的”。但评论区指出几个潜在问题： - 用户无法要求删除已用于训练的数据； - 匿名化技术能否彻底防止家庭场景被识别，尚无第三方验证； - 预约需绑定支付信息，若取消不及时可能被扣款。 ## 行业背景：机器人训练数据的“饥渴” 当前具身智能（Embodied AI）领域面临一个核心瓶颈：**高质量的真实操作数据极度匮乏**。模拟环境生成的数据与真实场景存在“仿真-现实差距”，而人工标注又成本高昂。此前，已有公司通过付费让用户穿戴摄像头记录日常活动（如做饭、整理）来收集数据。MicroAGI 的“免费清洁”策略，本质上是将数据采集成本转嫁为服务成本——用清洁服务换取用户对数据采集的许可。 ## 争议与展望这种模式在 Reddit 等社区引发两极讨论。支持者认为，这为机器人训练提供了低成本、高真实度的数据，有望加速家用机器人落地。反对者则担忧，家庭环境的隐私边界模糊，即便模糊处理，仍可能通过物品布局、宠物特征等间接信息识别出用户。 MicroAGI 尚未公布具体的数据安全审计报告或第三方监督机制。对于是否接受“用隐私换清洁”，最终仍需用户自行权衡。 ## 小结免费清洁的诱惑背后，是 AI 公司对真实世界数据的迫切需求。当服务与数据采集深度绑定，用户需要更透明的隐私条款和更强的数据控制权。这场实验的结果，或将影响未来家用机器人数据采集的伦理标准。

Ars Technica1个月前原文

1915

Cognition CEO 吴浩：AI 编程助手不是为了取代人类，而是成为你的“编程伙伴”

新上线

近日，AI 编程助手初创公司 Cognition 宣布完成 10 亿美元融资，估值高达 260 亿美元。其核心产品 Devin 被公认为最成功的 AI 编程代理之一，但 CEO 吴浩（Scott Wu）明确表示，Devin 的设计初衷并非取代人类程序员。 ## 从“替代”到“伙伴” 在 Cognition 的官方博客中，他们描绘了一个“自动驾驶式软件开发”的未来。当被问及 Devin 是否会取代中级程序员（L4）时，吴浩给出了“是，也不是”的回答。他强调：“我们从未将其视为替代人类。我知道外界有这样的讨论，但这从来不是我们的观点。” 吴浩本人是一位资深程序员，9 岁开始编程，曾被誉为“有史以来最有成就的少年竞技程序员”之一。二年级时，他就在面向七年级学生的全国数学竞赛中获胜，并结识了 Scale AI 创始人 Alexandr Wang 等天才少年。正是这种背景，让吴浩对编程有着深厚的感情。 “我们开始构建 Devin 时，想法很简单：它就是你的伙伴，帮你构建更多东西。”吴浩甚至在自己的办公桌上放了一个 Devin 泰迪熊，作为这种理念的象征。 ## 保持编程的乐趣吴浩不希望 AI 代理剥夺人们编程的乐趣。“大多数软件工程师热爱构建软件。如果你问他们为什么，他们会说：我可以从无到有创造东西，把想法变成产品，变成体验。”他认为，就像可视化开发环境将软件创建从机器指令中抽象出来一样，AI 代理是另一层抽象——介于构思软件产品和实际产出之间。然而，值得注意的是，Cognition 内部确实使用 Devin 来完成几乎所有软件的交付。这种“自己用自己产品”的做法，一方面证明了 Devin 的能力，另一方面也引发了对程序员就业的担忧。 ## 产业视角在 2026 年这个 AI 裁员新闻频发的年份，吴浩的表态显得尤为谨慎。他坦言：“我们不想让程序员失业。我们本身就是程序员。”这种立场与许多鼓吹“AI 取代人类”的科技公司形成鲜明对比。但现实是，AI 编程代理的能力正在快速提升。Devin 能够端到端地处理任务，从需求理解到代码生成、测试、部署，几乎覆盖了整个开发流程。对于企业而言，这意味着更高的效率和更低的成本。吴浩试图在效率与人文之间找到平衡。他相信，AI 代理可以解放程序员，让他们专注于更有创造性的工作，而不是被重复性劳动所困。但最终，这种平衡能否实现，取决于技术发展和社会选择。 ## 小结 Cognition 的案例表明，AI 编程代理的未来不是非此即彼的替代，而是人机协作的新范式。吴浩的“伙伴”理念为行业提供了一个值得思考的方向：AI 应当增强人类能力，而非取而代之。

TechCrunch1个月前原文

1916

验证码仍能精准识别AI代理，人机对抗远未结束

新上线

近日，Hacker News 上关于“CAPTCHAs can still detect AI agents”的讨论引发广泛关注。尽管近年来大语言模型和多模态AI在图像识别、自然语言理解等领域取得突破性进展，但验证码（CAPTCHA）这一经典的图灵测试机制依然能够有效区分人类与AI代理。本文将从技术原理、行业挑战和未来趋势三个维度，解析验证码为何至今仍是AI难以逾越的屏障。 ## 验证码为何仍能奏效？验证码的核心设计理念是利用人类与机器在感知、推理和交互上的差异。当前主流验证码包括扭曲文字、图像选择（如“选出所有包含自行车”）、以及行为分析（如鼠标轨迹、点击模式）。尽管AI在静态图像分类上已超越人类，但验证码通过动态生成、噪声叠加、语义歧义和时序约束，大幅提升了破解难度。例如，Google 的 reCAPTCHA v3 会综合用户浏览历史、页面停留时间和操作连贯性进行风险评分，而非仅依赖单一任务，这使得AI代理难以模拟真实人类的随机性和不完美操作。 ## AI代理的攻防博弈近年来，研究者尝试用强化学习、生成对抗网络（GAN）和视觉Transformer破解验证码。例如，2023年的一项研究显示，AI在解决扭曲文字验证码上的准确率已超过90%。然而，验证码系统也在快速进化：引入动态交互（如拖拽滑块）、上下文感知（如要求用户按顺序点击特定物体），甚至结合生物特征（如分析按键力度）。这种“猫鼠游戏”使得AI代理的通用破解方案始终滞后于验证码的更新。 ## 行业影响与未来展望对于依赖AI代理进行数据采集、自动化测试和服务的公司而言，验证码的持续有效性意味着更高的运营成本。许多企业转向付费API或自建代理池，但面临IP封锁和账号风控风险。另一方面，验证码提供商如Cloudflare、Arkose Labs开始推出更隐形的验证方案（如Turnstile），旨在减少对用户的干扰同时提升安全性。长远来看，随着AI在常识推理和情境理解上的进步，验证码可能需要融合更多模态（如听觉、触觉）或转向基于用户身份的持续验证。但至少在当下，验证码作为人机边界的守门人，依然稳固。

Hacker News841个月前原文

1917

是的，你应该把个人数据从网上移除——我们最爱的服务正打55折

新上线

## 你的数据正在被“免费”利用每一次网购、注册账号、甚至浏览网页，你的个人信息——姓名、地址、电话、邮箱——都可能被数据经纪商悄悄收集、打包出售。这些数据最终流向营销电话、垃圾邮件，甚至诈骗团伙。**Incogni** 正是为此而生的一款数据移除服务，它能自动帮你向各大数据经纪商发送删除请求，持续监控并清理你的数字足迹。 ## 限时优惠：55% 折扣 ZDNET 编辑团队推荐 Incogni 作为首选隐私工具，目前该服务正提供 **55% 的折扣**：年费仅 **86 美元**（原价 191 美元），省下 105 美元。这一价格在同类服务中极具竞争力，尤其适合希望一劳永逸减少骚扰的用户。 ## 为什么选择 Incogni？ - **自动化流程**：无需手动联系数十家数据经纪商，Incogni 代理完成所有删除请求。 - **持续监控**：定期扫描数据泄露和新增记录，确保你的信息不会再次被收集。 - **覆盖广泛**：支持超过 200 家数据经纪商和人员搜索网站。 - **用户友好**：设置简单，提供进度追踪和删除报告。 ## 谁需要它？如果你曾收到过精准的营销电话、垃圾邮件，或者担心身份信息被滥用，那么 Incogni 值得考虑。尤其对于经常在线上留下信息的人——比如网购达人、社交媒体活跃用户——它能显著减少数据暴露面。 ## 小结在数据泄露频发的今天，主动管理个人隐私已成为刚需。Incogni 以合理的价格和自动化能力，为用户提供了一个高效方案。趁 55% 折扣入手，相当于每天花费不到 0.24 美元，即可为你的数字生活加上一道“防护锁”。

ZDNet AI1个月前原文

1918

梵蒂冈在Anthropic的“内线”：教皇如何影响AI行业

新上线

教皇利奥十四世（Pope Leo XIV）发布历史性AI通谕《Magnifica Humanitas》，呼吁“解除”人工智能的武装。在随后的仪式上，一位意想不到的演讲者登上讲台：Anthropic联合创始人、无神论者Chris Olah。Olah坦言，包括Anthropic在内的前沿AI实验室都身处一套“有时会与做正确之事相冲突的激励机制和约束”之中。这为教皇的观点提供了第一手验证：AI行业需要外部压力和内部约束，以避免人类灾难。通谕虽不会立即让AI公司放弃AGI追求，或让CEO停止以AI效率为由裁员，但其目的在于开启对话，缓和行业的鲁莽野心，并在那些明知后果可能糟糕却仍在构建AI的人心中唤起羞耻感。梵蒂冈对AI的思考已持续数十年，从2016年的密涅瓦对话系列会议开始，就不断邀请科技界人士参与。Olah的出现是多年布局的结果。

WIRED AI1个月前原文

1919

ExpressVPN 以27次安全审计遥遥领先——但审计到底意味着什么？

新上线

## ExpressVPN 审计数量碾压对手，但用户该关注什么？ VPN 行业的安全审计常常被厂商当作营销亮点，但普通用户往往对这些术语感到困惑。最近，**ExpressVPN** 宣布已通过 **27 次独立安全审计**，包括其新推出的 **ExpressMailGuard** 和 **Identity Defender** 两项产品。这一数字远超主要竞争对手，例如 NordVPN 和 Surfshark 通常仅公布数项审计结果。 ### 审计的本质：第三方背书还是营销工具？安全审计是由独立第三方机构对 VPN 服务的代码、基础设施和隐私政策进行审查，旨在验证其“无日志”声明和加密实现是否可靠。ExpressVPN 的审计由 **Cure53** 等知名安全公司执行，覆盖了从 VPN 协议到邮件保护功能的多个层面。然而，审计并非一劳永逸——它仅代表特定时间点的快照，且审计范围可能有限。用户仍需关注审计报告的完整性和时效性。 ### 行业对比：数量不等于质量 ExpressVPN 的 27 次审计在数量上确实领先，但竞争对手也在提升透明度。NordVPN 曾通过德勤的审计，并公开其基础设施架构；Surfshark 则引入了漏洞赏金计划。关键在于，审计是否覆盖了用户最关心的隐私核心——例如日志保留策略和 DNS 泄漏防护。ExpressVPN 的审计历史较长，但用户应查看具体报告，而非仅依赖数字。 ### 实用建议：如何解读 VPN 审计 - **查看审计机构信誉**：Cure53、德勤等知名机构更具公信力。 - **关注审计范围**：是否包括服务器、应用程序和隐私政策？ - **注意时效性**：审计日期越新越好，旧审计可能无法反映当前状态。 - **结合独立评测**：审计并非唯一标准，实际速度、连接稳定性同样重要。总之，ExpressVPN 的审计记录值得肯定，但用户在选择 VPN 时仍需综合考量。审计是信任的基石，而非全部。

ZDNet AI1个月前原文

1920

申请截止今日！TechCrunch Disrupt 2026 演讲机会最后冲刺

新上线

**TechCrunch Disrupt 2026** 将于 **10月13日至15日** 在旧金山 Moscone West 举行，演讲申请窗口将于 **今晚（太平洋时间 11:59 p.m.）** 关闭。这场年度科技盛会预计汇聚 **超过 10,000 名** 初创企业及风险投资领袖，议题覆盖 **AI、金融科技、基础设施、机器人、气候科技** 等前沿领域。 ### 申请流程与演讲形式申请者需提交议题，经编辑团队筛选后进入 **“观众选择”投票环节**，由 TechCrunch 读者决定最终登台阵容。演讲形式分为两种： - **分组会议（Breakout Sessions）**：30分钟演讲（最多4位演讲者，含主持人）+ 20分钟问答，容量100人。 - **圆桌讨论（Roundtables）**：30分钟引导式讨论（最多40人），无需幻灯片或音视频设备，侧重深度交流。 ### 为何不容错过 Disrupt 是科技界最具影响力的活动之一，过往参与者包括 **初创公司创始人、投资人、技术专家**。成功入选不仅能获得曝光，更能与行业决策者直接对话。 ### 行动提醒申请截止时间紧迫，有意者需立即提交。更多细节可查阅 TechCrunch **Call for Content** 页面。 > 早鸟票优惠（最高省 $410）将于 **5月29日** 截止，注册请访问官网。

TechCrunch1个月前原文