SheepNav

AI 资讯

每日聚合最新人工智能动态

2026年,AI编程工具已成为开发者的“标配”,但最新研究揭示了一个令人担忧的趋势:开发者越来越不愿在没有AI辅助的情况下工作,这可能导致代码质量下降和长期隐患。 ## 开发者“上瘾”:没有AI就不干活 2026年2月,知名AI研究机构METR发布了一项令人惊讶的发现:大多数开发者不再愿意在没有AI的情况下工作,即使是参与研究任务也不例外。METR原本计划重复2025年的一项经典实验——测量开发者手动编码与使用AI编码的生产力差异——却遭遇了意想不到的困难:开发者拒绝参与,因为他们“不希望在没有AI的情况下工作,哪怕只是为了研究”。 这一现象揭示了AI工具在开发者群体中的深度渗透。2025年的原始实验曾发现,虽然AI能快速生成代码,但开发者随后需要花费更多时间排查错误、调整AI输出以及等待任务完成,整体效率反而下降。然而,到了2026年,开发者对AI的依赖已经超越了效率考量,成为一种工作习惯甚至“心理依赖”。 ## 自评生产力翻倍,但事实可能相反 METR随后在5月发布了一项调查,让技术员工自我评估AI带来的生产力提升。不出所料,受访者普遍认为AI使他们**对组织的价值翻了一番**。但这种主观感受与客观数据之间存在明显矛盾。 2026年的一个热门趋势是“**Tokenmaxxing**”——即将AI使用量(token消耗数)作为生产力指标。这一做法正在遭遇质疑。据《金融时报》报道,亚马逊已关闭内部token追踪排行榜“Kirorank”,原因是员工通过过度使用AI代理来“刷榜”,导致成本飙升。Uber同样在2026年前四个月就耗尽了全年AI预算,但COO Andrew Macdonald在播客中承认,巨额投入并未带来项目数量或生产力的可衡量提升。 ## AI代码的维护陷阱 程序员兼作家James Shore在Hacker News上引发热议的一篇博客中指出,AI生成的代码并不一定能减少代码维护需求,反而可能增加负担。“你写两次代码,”他写道,暗示AI生成的代码往往需要人工反复修正。 ## 长期风险:技能退化与隐性债务 开发者拒绝脱离AI工作,意味着他们可能在失去独立解决复杂问题的能力。当AI工具无法处理边缘情况或产生难以调试的“幻觉代码”时,过度依赖的开发者将面临更大的挑战。此外,AI生成的代码可能引入**技术债务**——虽然短期内加速了开发,但长期维护成本可能远超预期。 ## 结论:工具虽好,依赖需有度 AI编程工具无疑是强大的生产力放大器,但2026年的研究提醒我们:**效率不等于效果,速度不等于质量**。开发者需要警惕对AI的过度依赖,在享受便利的同时,保持核心编程能力和代码审查的严谨性。否则,今天的“捷径”可能成为明天的“陷阱”。

TechCrunch29天前原文
亚马逊要用AI动画改编《好建议杯子蛋糕》,原作者震怒

Loryn Brantz 多年前为 BuzzFeed 创作的卡通角色“好建议杯子蛋糕”(Cuppy),如今被 BuzzFeed 授权给亚马逊 Prime Video,计划通过 AI 工具制作成动画剧集《Cupcake & Friends》。Brantz 对此毫不知情,并在 Instagram 上公开谴责这是“对全球艺术家的攻击”。该剧集是亚马逊 AWS 与 MGM 工作室联合发起的 GenAI 创作者基金首批项目之一。Brantz 指出,BuzzFeed 在未与她协商的情况下,将她的原创角色用于 AI 动画,违背了此前高管的口头承诺。她呼吁抵制 BuzzFeed 及所有 AI 生成或辅助的动画作品。这一事件凸显了数字媒体公司在 AI 时代对创作者权益的漠视,也引发了关于 AI 生成内容版权与伦理的广泛讨论。

WIRED AI29天前原文

一家名为 **Shift** 的 AI 训练初创公司近日推出了一项看似“天上掉馅饼”的服务:免费为你打扫房间,但条件是——清洁工工作时会佩戴一顶装有摄像头的“魔法帽子”,全程记录清洁过程,用于训练未来的家务机器人。 ## 用隐私换整洁? Shift 在社交媒体上宣布了这一不寻常的 offer,并解释称,清洁过程中产生的训练数据价值远超清洁服务成本。用他们官网的话说:“你得到一尘不染的公寓,我们得到训练数据。双赢。” 宣传视频中,清洁工身着白色制服,头戴一顶略显笨拙的帽子,擦窗、拖地、吸尘、刷碗、擦拭台面——这顶“魔法帽子”里的摄像头从清洁工的第一人称视角记录一切。 ## 隐私与数据的交易 当然,允许陌生人进入家中并全程录像,隐私问题是绕不开的坎。Shift 承诺客户隐私“得到充分保护”,所有姓名、面孔、以及屏幕和证件上的个人信息都会在用于 AI 训练前进行模糊和匿名化处理。清洁工也经过合作方审查,但他们并非 Shift 员工。公司强调:“今天打扫的每一间房屋,都在为明天能自我打扫的房屋铺路。” 有趣的是,越脏乱的环境反而越有价值。FAQ 页面指出“更具挑战性的清洁环境尤其有用”,但清洁工也有权拒绝任何他们觉得不舒服的任务。 ## 落地与未来 目前该服务仅限纽约地区,但 Shift 联合 CEO Bercan Kilic 表示,很快会扩展到 **旧金山、伦敦、苏黎世和慕尼黑**。免费清洁仅限“限时”体验,但这一模式切中了 AI 行业对真实世界操作数据日益增长的需求——用人类演示来训练机器人,正成为具身智能赛道的关键环节。 Shift 的做法并非孤例。近年来,多家公司通过众包或雇佣方式收集人类操作数据,用于训练机械臂、扫地机器人甚至人形机器人。不过,直接以上门清洁换取数据的方式,在成本和隐私平衡上仍属大胆尝试。 对于用户而言,这或许是一次“用隐私换整洁”的赌博:你的家会成为机器人学习的“考场”,而代价只是忍受一次免费打扫和那顶奇怪的帽子。

Hacker News19029天前原文
上手体验 Gemini Spark:我把生活全权交给它,它却把我男友当成了“好朋友”

Google 在今年的 I/O 开发者大会上推出了 **Gemini Spark**,一个始终在线的 AI 智能体,能够连接你的个人数据、完成在线任务并自动化日常交互。这是 Google 对 2026 年初席卷硅谷的 OpenClaw 智能体的回应。 作为首批体验者,我让 Gemini Spark 完全访问我的 Gmail、文档和日历,然后输入了一句简单的提示:“帮我计划一场生日派对”。结果令人惊叹:它不仅从我真实预订的卡拉 OK 酒吧信息中提取了细节,还生成了五页的完整计划,包括宾客名单、场地规则、附近餐饮、余兴派对地点、邮件邀请和主题创意。整个过程仅需几分钟,无需我时刻监督。 然而,真正让我哭笑不得的是 AI 生成的宾客名单。它扫描了我的邮件和文档,推荐了 15 位潜在朋友——恰好是包间最大容量。名单第一位是我的长期同居男友,却被标注为“亲密朋友和频繁旅伴”。更离谱的是,作为寿星的我本人竟然不在名单上。这种“数据洞察”与真实关系的错位,暴露了当前 AI 智能体在理解人类情感和社交细微之处时的局限性。 Gemini Spark 本周开始向 AI Ultra 订阅用户(每月 100 美元)开放 Beta 版,位于 Gemini 聊天机器人的新标签页中,支持移动端和桌面端控制。尽管它在任务自动化上表现出色,但这次“翻车”提醒我们:AI 可以处理日程,却无法理解人心。

WIRED AI29天前原文

人工智能的崛起带来了大量新术语和行话。本文整理了一份常用词汇表,帮助你理解LLM、RAG、RLHF等关键概念。 ## 从AGI到AI Agent:核心概念解析 **AGI(通用人工智能)** 是一个模糊但重要的概念。OpenAI CEO Sam Altman将其描述为“可以雇来当同事的普通人类水平的AI”,而OpenAI的章程则定义为“在大多数经济价值工作上超越人类的高度自主系统”。Google DeepMind的理解略有不同,认为AGI是“在大多数认知任务上至少与人类能力相当的AI”。值得注意的是,即使是AI研究前沿的专家们对此也未达成共识。 **AI Agent(智能体)** 指的是能够自主执行一系列任务的工具——比如报销费用、预订机票或编写代码——远超基础聊天机器人的能力。不过,正如我们之前解释过的,这个新兴领域仍有许多不确定性,不同人对AI Agent的理解可能不同,其底层基础设施也仍在建设中。 ## 技术细节:API端点与思维链 **API端点(API endpoints)** 可以理解为软件后端暴露的“按钮”,其他程序可以“按下”这些按钮来触发功能。开发者利用这些接口构建集成,例如让一个应用从另一个应用拉取数据,或让AI Agent直接控制第三方服务。大多数智能家居设备和联网平台都有这些隐藏按钮,普通用户通常看不到。随着AI Agent能力增强,它们越来越能自主发现并调用这些端点,带来强大的自动化可能。 **思维链(Chain of thought)** 是一种推理方法,让AI像人类一样逐步思考问题。面对简单问题时,人类大脑可以不经思考直接回答;而复杂问题则需要分解步骤。思维链提示技术正是模拟这种过程,要求模型输出中间推理步骤,从而提升复杂任务的准确性。 ## 行业背景与术语价值 这些术语的涌现反映了AI行业的快速迭代。理解它们不仅是技术爱好者的需求,更是商业决策者和普通用户跟上时代的基础。例如,区分AGI的不同定义有助于评估AI公司的技术路线和商业承诺;了解API端点的概念则能理解为什么AI Agent正在成为自动化领域的热点。 本文作为一份活文档,将持续更新。建议读者重点关注**RLHF(基于人类反馈的强化学习)**、**RAG(检索增强生成)** 等后续会深入解析的术语,它们分别对应AI对齐和知识检索两大关键方向。

TechCrunch29天前原文

近年来,AI取代人类工作的论调甚嚣尘上,但Box创始人Aaron Levie却提出了一个令人警醒的观点:那些决定AI可以取代你工作的人,恰恰是最不了解你工作真正内涵的人。他将这种现象称为“AI精神病”(AI psychosis)。 Levie的这番评论并非空穴来风。项目管理平台ClickUp近期裁掉了22%的员工,理由是为了给AI代理腾出空间。更令人担忧的是,2026年的科技行业裁员人数已经几乎与2025年全年持平。这些数据表明,企业正在以前所未有的速度用AI替代人类岗位,但其中可能隐藏着巨大的认知偏差。 ### 什么是“AI精神病”? Levie所描述的“AI精神病”,指的是企业高管和技术决策者过度沉迷于AI的潜力,以至于盲目相信AI能够解决所有问题,甚至在不完全理解业务复杂性的情况下,就贸然用AI替代人类员工。这种思维模式忽略了AI的局限性,也低估了人类在特定场景下的不可替代性。 例如,ClickUp的裁员决策引发了广泛争议。虽然AI代理在处理重复性任务上确实高效,但项目管理涉及大量的人际沟通、创意协调和战略决策,这些都是当前AI难以胜任的。Levie认为,这种“先开枪后瞄准”的做法,最终可能导致企业效率下降,甚至失去核心竞争力。 ### AI替代的隐形成本 事实上,AI替代人类工作并非简单的成本效益计算。当企业盲目追求AI化时,往往会忽略以下隐形成本: - **知识流失**:经验丰富的员工离开后,其积累的行业知识和隐性技能难以被AI复制。 - **创新停滞**:过度依赖AI可能导致团队失去主动思考和创新的能力。 - **客户体验下降**:AI在处理复杂、个性化需求时,往往不如人类灵活和富有同理心。 Levie的警告并非反对AI技术本身,而是呼吁企业保持理性。AI应当被视为增强人类能力的工具,而非完全替代人类的解决方案。 ### 行业趋势与反思 2026年的裁员数据令人震惊:科技行业的裁员人数已接近2025年全年水平。这背后既有经济下行的压力,也有AI技术普及的冲击。然而,Levie的观点提醒我们,裁员并非总是最优解。企业在推动AI转型时,需要更深入地评估岗位价值,避免陷入“为了AI而AI”的误区。 一些公司已经开始反思这一趋势。例如,部分企业选择通过再培训让员工与AI协作,而非直接裁员。这种“人机协同”的模式或许更可持续。 ### 小结 “AI精神病”是一个值得所有科技从业者警惕的现象。在AI浪潮席卷各行各业的今天,企业决策者需要保持清醒:AI是工具,不是万能药。真正的竞争力,来自于对技术与人类价值的深刻理解与平衡。

TechCrunch29天前原文

随着科技行业围绕 AI 智能体(AI Agent)加速布局,股票交易应用 **Robinhood** 也正式加入这一浪潮。本周三,Robinhood 宣布推出 **AI 代理交易** 功能,并同步上线一款面向 AI 代理的虚拟信用卡,标志着个人投资与 AI 自主操作之间的边界正在被打破。 ## 功能设计:AI 代理如何为你交易? Robinhood 用户现在可以为自己的 AI 代理创建一个独立账户,并连接专属钱包。AI 代理能够读取和分析用户的投资组合,提出交易策略和投资建议,但**只能动用预充入专属钱包的资金**来下单。所有交易行为都会通过 Robinhood 应用向用户发送通知,用户可随时监控代理的活动。对于部分交易,代理会生成预览,**需要用户手动批准**后才能执行。 Robinhood 还内置了欺诈检测保护机制:一旦出现可疑交易,Robinhood 团队会进行审查并协助用户解决争议。目前该功能处于 **Beta 阶段**,仅支持股票交易;公司计划后续扩展至期权、加密货币、事件合约、期货和预测市场。 ## 连接方式:通过 MCP 协议实现智能体对接 Robinhood 允许用户将 AI 代理连接到其 **Model Context Protocol (MCP) 服务**,从而执行多种操作,例如: - 分析集中度风险和行业敞口 - 执行交易 - 浏览分析师笔记以发现跨行业投资机会 这种开放接口的设计,使得用户可以使用自己的工具、大型语言模型(LLM)和代理来与 Robinhood 平台交互。 ## 虚拟信用卡:让 AI 代理也能付款 除了交易功能,Robinhood 还推出了一款专为 AI 代理设计的 **虚拟信用卡**。用户可将 AI 代理连接到 Robinhood 的银行 MCP 服务器,使其能够代表用户进行支付。该虚拟卡目前仅面向 Robinhood Gold Card 持有者开放,用户可以设置**每月消费限额**,并选择每次支付是否需要代理请求批准。Robinhood 表示,即将推出的 **Platinum Card** 也将支持类似的虚拟代理卡功能。 ## 行业背景与战略意义 Robinhood 在 AI 领域的布局已有时日:2024 年收购了 AI 驱动的研究平台 **Pluto**,去年又推出了提供投资建议的 AI 助手。此次 AI 代理交易功能的推出,进一步将 AI 从“建议者”升级为“执行者”,标志着个人投资领域进入 **AI 自主操作** 的新阶段。 对于用户而言,AI 代理可以 24/7 监控市场并快速执行策略,但也带来了风险控制、隐私保护等新挑战。Robinhood 通过独立钱包、交易通知和人工审查机制,试图在“自主”与“可控”之间取得平衡。 ## 小结 Robinhood 的 AI 代理交易功能目前处于早期测试阶段,但它预示了一个趋势:AI 智能体正在从聊天工具演变为具备实际金融操作能力的“数字管家”。未来,随着更多资产类别和支付场景的接入,AI 代理在个人金融领域的应用空间值得密切关注。

Hacker News11229天前原文

本周,一家名为 **Shift** 的 AI 训练初创公司宣布,将为纽约居民提供**免费的家政清洁服务**,并计划将业务扩展到伦敦等城市。表面上是福利,但背后有一个明确的交换条件:Shift 要求拍摄清洁工工作的全过程——从洗碗、擦台面到拖地,所有家务细节都会被记录下来。这些视频并非用于宣传,而是作为训练机器人的**真实世界数据**。 为什么需要这么多家务视频?与可以从互联网大规模抓取的文本、图像数据不同,机器人要学习物理世界中的操作,需要理解空间、运动、力、摩擦、不规则形状和光线变化等复杂因素。对人类来说轻而易举的叠衣服、捡苹果、倒水,对机器人而言却是巨大的工程挑战。要教会它们这些技能,必须依赖海量的、高质量的**物理世界数据**。 Shift 并非孤例。在印度,家居服务平台 **Pronto** 也被曝出利用客户的家作为 AI 训练素材的来源,拍摄烹饪、清洁、洗衣等家务活动。Pronto 声称只在客户明确同意的情况下录制,但客户获得什么回报尚不明确。这种做法引发了关于隐私和知情同意的讨论。 ### 数据瓶颈催生“创意”采集 随着具身智能(Embodied AI)和机器人技术的升温,真实世界数据成为稀缺资源。与数字内容不同,家务数据无法轻易从网上抓取,且往往涉及隐私和伦理问题。Shift 的模式本质上是“以服务换数据”——用免费清洁换取拍摄许可,既获取了高质量训练数据,又绕过了传统数据采集的高昂成本。 ### 隐私与便利的博弈 对于消费者而言,免费清洁听起来很有吸引力,但代价是让陌生人记录下自己私密的生活空间。这些视频如何存储、使用、分享,是否会被用于其他目的,都是未知数。Shift 和 Pronto 的做法也提醒我们:在 AI 时代,**数据采集的边界正在模糊**,而日常生活中的隐私可能成为技术发展的“燃料”。 ### 小结 机器人想要真正走进家庭,必须先学会做家务。而学会做家务,又需要大量家庭场景的数据。Shift 的免费清洁计划是这一循环中的一环,它揭示了 AI 训练数据获取的新趋势——从公开网络转向现实世界,从免费抓取转向“等价交换”。但如何平衡技术发展与个人隐私,将是整个行业需要持续面对的课题。

The Verge1个月前原文

据 Axios 报道,AI 芯片初创公司 Groq 正寻求从现有投资者处筹集 **6.5 亿美元** 新资金,以加大对推理(inference)云业务的投入。该业务依托 Groq 自研芯片和系统,为开发者与企业提供托管推理密集型应用的平台。 此前,Groq 在去年 12 月与英伟达达成了一项价值约 **200 亿美元** 的“非收购协议”(not-a-quisition),部分 Groq 高管转投英伟达,同时 Groq 将其硬件技术授权给英伟达。这笔交易让 Groq 的早期投资者获得了现金回报——如果该交易是完整收购,它本会成为英伟达历史上最大的一笔收购。 如今,这些投资者被要求继续注资,支持 Groq 的推理云业务扩张。推理是 AI 模型在收到提示后进行的处理过程,当前在 AI 领域的需求远大于模型训练。Groq 的新方向目前由临时 CEO **Adam Winter** 和临时 CFO **Matt Eng** 领导。 报道称,这轮融资几乎已成定局:Groq 的投资方 **Disruptive** 和 **Infinitium** 已同意,如果其他现有投资者不愿按比例认购,它们将补足剩余份额。 ## 行业背景 Groq 的转型折射出 AI 芯片赛道的显著变化。随着大模型从训练转向大规模部署,**推理效率** 成为关键瓶颈。Groq 凭借其低延迟、高吞吐的 LPU(语言处理单元)架构,在推理市场占据一席之地,但面临英伟达、AMD 以及 Cerebras 等定制芯片厂商的激烈竞争。 此次融资也凸显了 **“非收购式人才获取”** 模式的兴起。英伟达通过类似协议,既获得了关键人才,又避免了反垄断审查,而 Groq 则获得了资金和生态支持。不过,Groq 的核心团队流失后,能否独立推进推理云战略仍存变数。 ## 小结 Groq 的 6.5 亿美元融资计划,既是对其推理云业务前景的押注,也是对英伟达主导地位的一次挑战。在 AI 推理需求爆发的当下,这家初创公司能否借力此轮融资实现突围,值得持续关注。

TechCrunch1个月前原文

AI芯片初创公司Groq正计划从现有投资者处筹集6.5亿美元新资金,以加大对其推理云业务的投入。据Axios报道,这家公司正从硬件转向聚焦AI推理(inference)——即优化AI模型对用户提示做出响应的过程。 去年12月,Groq与英伟达达成了一项价值约200亿美元的“非收购协议”,涉及部分Groq高管跳槽至英伟达,以及Groq硬件技术的授权。这笔交易让Groq的投资者获得了现金回报,但如果当时是全面收购,它本将成为英伟达历史上最大的一笔收购。如今,这些投资者被要求再次出资,支持公司发展推理云业务,该业务允许开发者和企业托管其推理密集型应用。 目前,Groq由临时CEO Adam Winter和临时CFO Matt Eng领导。报道称,这6.5亿美元融资几乎已成定局——现有投资者Disruptive和Infinitium已同意,如果其他投资者不愿按比例认购,他们将补足剩余份额。 推理是AI提示之后发生的处理过程,目前在AI世界中,推理的需求远大于模型训练。Groq的转型反映了这一趋势:随着AI应用大规模落地,推理环节对算力的消耗正成为瓶颈,而Groq自研芯片在推理速度和能效上具有优势。 这轮融资距离英伟达的“非收购”协议仅半年,显示出Groq在获得资金和人才后,正加速向推理服务商转型。对于英伟达而言,这既是巩固其AI生态的举措,也间接扶持了一个潜在竞争对手。

TechCrunch1个月前原文
视频星期五:极致全向移动机器人

本周的机器人视频精选又来了!从仿生多足设计到全向移动突破,这些机器人正在重新定义“运动能力”的边界。 ## 亮点一:多足机器人的“冗余美学” 在最新一期“视频星期五”中,**通用机器人实验室(General Robotics Lab)** 展示了一款拥有**超常数量腿**的机器人。设计师似乎信奉“腿越多越好”的理念——这款机器人不仅能在复杂地形中保持稳定,还能通过冗余腿实现**容错运动**:即使部分关节失效,仍能继续完成任务。这让人联想到自然界中的蜈蚣或千足虫,它们通过多足协调实现高效且稳健的移动。 ## 亮点二:极致全向移动能力 该机器人的**全向移动**能力尤为突出。不同于传统轮式或双足机器人的转向限制,它可以在不改变朝向的情况下向任意方向平移,甚至原地旋转。这种能力在狭小空间作业(如管道检测、废墟搜救)中极具价值。研究者通过优化腿部运动轨迹和地面接触力,实现了近乎瞬时的方向切换。 ## 行业背景:为什么“腿越多”反而更受关注? 近年来,足式机器人领域呈现两极分化:一方面,**双足人形机器人**因拟人形态备受资本追捧;另一方面,**多足机器人**在**工业巡检、灾害响应**等场景中展现出独特优势。例如,波士顿动力的Spot(四足)已在石油平台和建筑工地部署,而六足或八足机器人则能进一步降低单腿负载,适应更松软或崎岖的地形。 ## 未来展望 虽然该机器人目前仍处于实验室阶段,但其设计理念为下一代救援或探索机器人提供了新思路。随着驱动器和控制算法的进步,多足机器人有望在**农业、行星探测**等领域大显身手。不过,能耗和运动效率仍是需要攻克的关键难题。 更多机器人酷炫视频,可关注IEEE Spectrum的“视频星期五”系列。

IEEE AI1个月前原文
《真相的未来》作者因使用AI生成内容陷入争议

一本探讨AI如何扭曲现实的书籍,却因作者本人使用AI而陷入信任危机。史蒂夫·罗森鲍姆的新书《真相的未来》被曝包含多处伪造或错误归因的引文,而AI检测工具更指出书中部分内容疑似由AI生成。尽管作者辩称AI仅用于辅助研究,但这一事件揭示了AI时代下信息真实性的深层困境。

WIRED AI1个月前原文

开源软件的安全问题正日益严峻,维护者不堪重负。IBM与Red Hat联合推出 **Project Lightwell**,这是一项由AI驱动的、旨在以工业级规模发现并修复开源软件漏洞的计划。两家公司计划投入 **50亿美元**,动员 **2万名工程师**,打造一个集中式安全漏洞处理中心。 ### 背景:开源维护者的困境 随着AI的普及,开源项目面临双重挑战:一方面,AI帮助开发者更快编程和发现缺陷;另一方面,大量AI生成的漏洞报告让维护者应接不暇。知名开源项目 **cURL** 的创始人兼维护者 **Daniel Steinberg** 坦言:“2026年安全报告涌入速度是2024年的4到5倍,是2025年的两倍。”他首次承认“工作强度前所未有,但漏洞洪流仍在持续”,已濒临过劳。他呼吁更多公司提供资金支持,以雇佣更多开发者分担压力。 ### Project Lightwell:AI驱动的安全中心 IBM与Red Hat的回应是Project Lightwell——一项“前所未有的力量”,旨在以工业规模识别并修复开源软件漏洞。它计划成为事实上的开源组件安全中心,覆盖支撑现代企业IT的核心组件。不过,该项目并非直接向上游开发者支付报酬,而是为IBM和Red Hat的工程师提供先进的AI工具,让他们专注于修复关键开源项目的安全问题。 Anthropic的 **Mythos Preview模型** 已在短短几周内识别出近 **3900个严重安全漏洞**,凸显了快速修复的紧迫性。为此,两家公司将投入 **50亿美元** 并动员 **2万名工程师**,在未来数年内推进该项目。 ### 订阅模式与未来展望 Lightwell将采用订阅制服务,但具体定价和运作细节尚未公布。这一模式能否有效缓解开源维护者的压力,并真正提升软件供应链的安全性,仍有待观察。但无疑,这是迄今为止企业界对开源安全最重大的投入之一。

ZDNet AI1个月前原文
免费上门打扫?代价是全程录像,用于训练机器人

一家德国初创公司 MicroAGI 近日在纽约推出了一项“免费家庭清洁”服务,但要求清洁工佩戴摄像头记录全过程,用于训练未来家用机器人。这听起来像科幻情节,却已在现实中悄然落地。 ## 服务模式:以数据换清洁 MicroAGI 通过其新上线的 **Shift 应用** 提供预约服务。用户只需在 App 上填写电话、邮箱、住址等信息,即可预约一次约两小时的免费深度清洁。清洁工均为“专业清洁人员”,但会佩戴智能眼镜或头戴摄像头,全程记录第一人称视角的清洁动作。 公司官网直言,此举是为了收集 **“第一人称清洁视频”**,用于训练下一代家用机器人。这种“以数据换服务”的模式,在 AI 训练数据采集领域并非首创,但直接进入家庭环境仍属罕见。 ## 隐私承诺:自动模糊处理 针对隐私担忧,Shift 应用在 FAQ 中承诺:所有视频在上传至云端前,会通过运行在设备上的 **“先进机器学习模型”** 自动模糊人脸、身份证件、屏幕、手机等个人可识别信息。公司声称这些模糊处理是“不可逆的”。 但评论区指出几个潜在问题: - 用户无法要求删除已用于训练的数据; - 匿名化技术能否彻底防止家庭场景被识别,尚无第三方验证; - 预约需绑定支付信息,若取消不及时可能被扣款。 ## 行业背景:机器人训练数据的“饥渴” 当前具身智能(Embodied AI)领域面临一个核心瓶颈:**高质量的真实操作数据极度匮乏**。模拟环境生成的数据与真实场景存在“仿真-现实差距”,而人工标注又成本高昂。 此前,已有公司通过付费让用户穿戴摄像头记录日常活动(如做饭、整理)来收集数据。MicroAGI 的“免费清洁”策略,本质上是将数据采集成本转嫁为服务成本——用清洁服务换取用户对数据采集的许可。 ## 争议与展望 这种模式在 Reddit 等社区引发两极讨论。支持者认为,这为机器人训练提供了低成本、高真实度的数据,有望加速家用机器人落地。反对者则担忧,家庭环境的隐私边界模糊,即便模糊处理,仍可能通过物品布局、宠物特征等间接信息识别出用户。 MicroAGI 尚未公布具体的数据安全审计报告或第三方监督机制。对于是否接受“用隐私换清洁”,最终仍需用户自行权衡。 ## 小结 免费清洁的诱惑背后,是 AI 公司对真实世界数据的迫切需求。当服务与数据采集深度绑定,用户需要更透明的隐私条款和更强的数据控制权。这场实验的结果,或将影响未来家用机器人数据采集的伦理标准。

Ars Technica1个月前原文

近日,AI 编程助手初创公司 Cognition 宣布完成 10 亿美元融资,估值高达 260 亿美元。其核心产品 Devin 被公认为最成功的 AI 编程代理之一,但 CEO 吴浩(Scott Wu)明确表示,Devin 的设计初衷并非取代人类程序员。 ## 从“替代”到“伙伴” 在 Cognition 的官方博客中,他们描绘了一个“自动驾驶式软件开发”的未来。当被问及 Devin 是否会取代中级程序员(L4)时,吴浩给出了“是,也不是”的回答。他强调:“我们从未将其视为替代人类。我知道外界有这样的讨论,但这从来不是我们的观点。” 吴浩本人是一位资深程序员,9 岁开始编程,曾被誉为“有史以来最有成就的少年竞技程序员”之一。二年级时,他就在面向七年级学生的全国数学竞赛中获胜,并结识了 Scale AI 创始人 Alexandr Wang 等天才少年。正是这种背景,让吴浩对编程有着深厚的感情。 “我们开始构建 Devin 时,想法很简单:它就是你的伙伴,帮你构建更多东西。”吴浩甚至在自己的办公桌上放了一个 Devin 泰迪熊,作为这种理念的象征。 ## 保持编程的乐趣 吴浩不希望 AI 代理剥夺人们编程的乐趣。“大多数软件工程师热爱构建软件。如果你问他们为什么,他们会说:我可以从无到有创造东西,把想法变成产品,变成体验。”他认为,就像可视化开发环境将软件创建从机器指令中抽象出来一样,AI 代理是另一层抽象——介于构思软件产品和实际产出之间。 然而,值得注意的是,Cognition 内部确实使用 Devin 来完成几乎所有软件的交付。这种“自己用自己产品”的做法,一方面证明了 Devin 的能力,另一方面也引发了对程序员就业的担忧。 ## 产业视角 在 2026 年这个 AI 裁员新闻频发的年份,吴浩的表态显得尤为谨慎。他坦言:“我们不想让程序员失业。我们本身就是程序员。”这种立场与许多鼓吹“AI 取代人类”的科技公司形成鲜明对比。 但现实是,AI 编程代理的能力正在快速提升。Devin 能够端到端地处理任务,从需求理解到代码生成、测试、部署,几乎覆盖了整个开发流程。对于企业而言,这意味着更高的效率和更低的成本。 吴浩试图在效率与人文之间找到平衡。他相信,AI 代理可以解放程序员,让他们专注于更有创造性的工作,而不是被重复性劳动所困。但最终,这种平衡能否实现,取决于技术发展和社会选择。 ## 小结 Cognition 的案例表明,AI 编程代理的未来不是非此即彼的替代,而是人机协作的新范式。吴浩的“伙伴”理念为行业提供了一个值得思考的方向:AI 应当增强人类能力,而非取而代之。

TechCrunch1个月前原文

近日,Hacker News 上关于“CAPTCHAs can still detect AI agents”的讨论引发广泛关注。尽管近年来大语言模型和多模态AI在图像识别、自然语言理解等领域取得突破性进展,但验证码(CAPTCHA)这一经典的图灵测试机制依然能够有效区分人类与AI代理。本文将从技术原理、行业挑战和未来趋势三个维度,解析验证码为何至今仍是AI难以逾越的屏障。 ## 验证码为何仍能奏效? 验证码的核心设计理念是利用人类与机器在感知、推理和交互上的差异。当前主流验证码包括扭曲文字、图像选择(如“选出所有包含自行车”)、以及行为分析(如鼠标轨迹、点击模式)。尽管AI在静态图像分类上已超越人类,但验证码通过动态生成、噪声叠加、语义歧义和时序约束,大幅提升了破解难度。例如,Google 的 reCAPTCHA v3 会综合用户浏览历史、页面停留时间和操作连贯性进行风险评分,而非仅依赖单一任务,这使得AI代理难以模拟真实人类的随机性和不完美操作。 ## AI代理的攻防博弈 近年来,研究者尝试用强化学习、生成对抗网络(GAN)和视觉Transformer破解验证码。例如,2023年的一项研究显示,AI在解决扭曲文字验证码上的准确率已超过90%。然而,验证码系统也在快速进化:引入动态交互(如拖拽滑块)、上下文感知(如要求用户按顺序点击特定物体),甚至结合生物特征(如分析按键力度)。这种“猫鼠游戏”使得AI代理的通用破解方案始终滞后于验证码的更新。 ## 行业影响与未来展望 对于依赖AI代理进行数据采集、自动化测试和服务的公司而言,验证码的持续有效性意味着更高的运营成本。许多企业转向付费API或自建代理池,但面临IP封锁和账号风控风险。另一方面,验证码提供商如Cloudflare、Arkose Labs开始推出更隐形的验证方案(如Turnstile),旨在减少对用户的干扰同时提升安全性。 长远来看,随着AI在常识推理和情境理解上的进步,验证码可能需要融合更多模态(如听觉、触觉)或转向基于用户身份的持续验证。但至少在当下,验证码作为人机边界的守门人,依然稳固。

Hacker News841个月前原文

## 你的数据正在被“免费”利用 每一次网购、注册账号、甚至浏览网页,你的个人信息——姓名、地址、电话、邮箱——都可能被数据经纪商悄悄收集、打包出售。这些数据最终流向营销电话、垃圾邮件,甚至诈骗团伙。**Incogni** 正是为此而生的一款数据移除服务,它能自动帮你向各大数据经纪商发送删除请求,持续监控并清理你的数字足迹。 ## 限时优惠:55% 折扣 ZDNET 编辑团队推荐 Incogni 作为首选隐私工具,目前该服务正提供 **55% 的折扣**:年费仅 **86 美元**(原价 191 美元),省下 105 美元。这一价格在同类服务中极具竞争力,尤其适合希望一劳永逸减少骚扰的用户。 ## 为什么选择 Incogni? - **自动化流程**:无需手动联系数十家数据经纪商,Incogni 代理完成所有删除请求。 - **持续监控**:定期扫描数据泄露和新增记录,确保你的信息不会再次被收集。 - **覆盖广泛**:支持超过 200 家数据经纪商和人员搜索网站。 - **用户友好**:设置简单,提供进度追踪和删除报告。 ## 谁需要它? 如果你曾收到过精准的营销电话、垃圾邮件,或者担心身份信息被滥用,那么 Incogni 值得考虑。尤其对于经常在线上留下信息的人——比如网购达人、社交媒体活跃用户——它能显著减少数据暴露面。 ## 小结 在数据泄露频发的今天,主动管理个人隐私已成为刚需。Incogni 以合理的价格和自动化能力,为用户提供了一个高效方案。趁 55% 折扣入手,相当于每天花费不到 0.24 美元,即可为你的数字生活加上一道“防护锁”。

ZDNet AI1个月前原文
梵蒂冈在Anthropic的“内线”:教皇如何影响AI行业

教皇利奥十四世(Pope Leo XIV)发布历史性AI通谕《Magnifica Humanitas》,呼吁“解除”人工智能的武装。在随后的仪式上,一位意想不到的演讲者登上讲台:Anthropic联合创始人、无神论者Chris Olah。Olah坦言,包括Anthropic在内的前沿AI实验室都身处一套“有时会与做正确之事相冲突的激励机制和约束”之中。这为教皇的观点提供了第一手验证:AI行业需要外部压力和内部约束,以避免人类灾难。通谕虽不会立即让AI公司放弃AGI追求,或让CEO停止以AI效率为由裁员,但其目的在于开启对话,缓和行业的鲁莽野心,并在那些明知后果可能糟糕却仍在构建AI的人心中唤起羞耻感。梵蒂冈对AI的思考已持续数十年,从2016年的密涅瓦对话系列会议开始,就不断邀请科技界人士参与。Olah的出现是多年布局的结果。

WIRED AI1个月前原文

## ExpressVPN 审计数量碾压对手,但用户该关注什么? VPN 行业的安全审计常常被厂商当作营销亮点,但普通用户往往对这些术语感到困惑。最近,**ExpressVPN** 宣布已通过 **27 次独立安全审计**,包括其新推出的 **ExpressMailGuard** 和 **Identity Defender** 两项产品。这一数字远超主要竞争对手,例如 NordVPN 和 Surfshark 通常仅公布数项审计结果。 ### 审计的本质:第三方背书还是营销工具? 安全审计是由独立第三方机构对 VPN 服务的代码、基础设施和隐私政策进行审查,旨在验证其“无日志”声明和加密实现是否可靠。ExpressVPN 的审计由 **Cure53** 等知名安全公司执行,覆盖了从 VPN 协议到邮件保护功能的多个层面。然而,审计并非一劳永逸——它仅代表特定时间点的快照,且审计范围可能有限。用户仍需关注审计报告的完整性和时效性。 ### 行业对比:数量不等于质量 ExpressVPN 的 27 次审计在数量上确实领先,但竞争对手也在提升透明度。NordVPN 曾通过德勤的审计,并公开其基础设施架构;Surfshark 则引入了漏洞赏金计划。关键在于,审计是否覆盖了用户最关心的隐私核心——例如日志保留策略和 DNS 泄漏防护。ExpressVPN 的审计历史较长,但用户应查看具体报告,而非仅依赖数字。 ### 实用建议:如何解读 VPN 审计 - **查看审计机构信誉**:Cure53、德勤等知名机构更具公信力。 - **关注审计范围**:是否包括服务器、应用程序和隐私政策? - **注意时效性**:审计日期越新越好,旧审计可能无法反映当前状态。 - **结合独立评测**:审计并非唯一标准,实际速度、连接稳定性同样重要。 总之,ExpressVPN 的审计记录值得肯定,但用户在选择 VPN 时仍需综合考量。审计是信任的基石,而非全部。

ZDNet AI1个月前原文

**TechCrunch Disrupt 2026** 将于 **10月13日至15日** 在旧金山 Moscone West 举行,演讲申请窗口将于 **今晚(太平洋时间 11:59 p.m.)** 关闭。这场年度科技盛会预计汇聚 **超过 10,000 名** 初创企业及风险投资领袖,议题覆盖 **AI、金融科技、基础设施、机器人、气候科技** 等前沿领域。 ### 申请流程与演讲形式 申请者需提交议题,经编辑团队筛选后进入 **“观众选择”投票环节**,由 TechCrunch 读者决定最终登台阵容。演讲形式分为两种: - **分组会议(Breakout Sessions)**:30分钟演讲(最多4位演讲者,含主持人)+ 20分钟问答,容量100人。 - **圆桌讨论(Roundtables)**:30分钟引导式讨论(最多40人),无需幻灯片或音视频设备,侧重深度交流。 ### 为何不容错过 Disrupt 是科技界最具影响力的活动之一,过往参与者包括 **初创公司创始人、投资人、技术专家**。成功入选不仅能获得曝光,更能与行业决策者直接对话。 ### 行动提醒 申请截止时间紧迫,有意者需立即提交。更多细节可查阅 TechCrunch **Call for Content** 页面。 > 早鸟票优惠(最高省 $410)将于 **5月29日** 截止,注册请访问官网。

TechCrunch1个月前原文