SheepNav

AI 资讯

每日聚合最新人工智能动态

在 TikTok 上,一位名叫 Aliyah 的浅肤色黑人女性穿着西部风服装,含泪推销她“手工制作”的金属皮带扣,声称需要观众停留 13 秒来拯救她的小生意。但 Aliyah 并非真人,而是 AI 生成的虚拟形象——她的产品同样来自快时尚网站 Shein,价格仅是视频中售价的四分之一。 《The Verge》调查发现,TikTok、Facebook 和 Instagram 上存在大量类似账号,使用 AI 生成的人物、背景和文案,通过代发货模式销售皮带扣、牛仔靴形马克杯、钩编包等商品。这些视频中,AI 人物的声音机械呆板,与哭泣表情不匹配;拭泪动作后泪痕消失;多个账号共享相同背景和道具。部分视频虽标注为 AI 生成,但评论区自动回复仍试图模仿非裔美国人口语,以博取同情和购买。 专家指出,这种利用种族身份和情感操纵的 AI 诈骗正在快速增长。AI 工具降低了创建虚假网红和产品的门槛,使消费者难以辨别真伪。平台审核机制滞后,往往在欺诈内容传播后才采取行动。 这起事件揭示了 AI 技术被滥用于欺诈的新趋势:通过制造虚假的少数族裔形象,利用同理心和愧疚感诱导消费,同时掩盖产品真实来源和价格。消费者应警惕过度煽情的小商家视频,核实产品信息,避免为溢价买单。监管与平台需加强 AI 内容标识和源头追溯,防止此类欺诈蔓延。

The Verge昨天原文

在AI投资热潮席卷硅谷的2022年,前Meta工程师、连续创业者Craig Campbell却做出了一个反直觉的决定:拒绝投资人的“空白支票”,创办一个名为 **Past Maps** 的网站。这个看似“老派”的押注,如今正通过有机搜索实现可持续增长,成为AI时代下的一个另类成功故事。 ## 从AI热潮中抽身 Campbell并非没有机会搭上AI快车。他曾是Meta的工程师,并在2022年成功出售了自己的上一家创业公司——一个面向Shopify商家的电商工具。彼时,AI领域正涌入大量资金,投资人们急切地希望他“再干一票”。然而,Campbell选择了另一条路:做一个让人们浏览历史地图的网站。 “我之前的VC投资者一直催我,‘再搞点新东西,我们给你开空白支票。’”Campbell回忆道。但他有自己的想法。在许多人认为“谷歌零点击”时代即将到来、网站流量日益萎缩的背景下,进入网站业务显得尤为不合时宜。但Campbell不为所动。 ## Past Maps:用技术连接过去与现在 Past Maps的核心功能很简单:将某个地区的历史地图与现代地图叠加,用户可以通过调节透明度来对比古今地貌变化。这些历史地图来自美国地质调查局等公开来源,而Campbell开发了让用户以交互方式探索它们的工具。 这个项目的灵感其实源于Campbell的个人爱好——金属探测。通过定位旧建筑和小径的现代位置,他能找到新的寻宝地点。当他将工具分享到Reddit后,其他金属探测爱好者也表现出了浓厚兴趣。于是,他的新事业就此起步。 当然,Past Maps的吸引力远不止于寻宝。对于任何对身边环境充满好奇的人来说,它都是一座宝藏。例如,作者用它来了解杜瓦米什河在被截弯取直之前的原始形态。 ## 老派网站的新生机 更令人意外的是,Past Maps的增长主要依靠 **有机搜索** ——这在当下几乎被视为一种“奢侈”。在内容分发日益被社交媒体和AI推荐主导的时代,一个依赖搜索引擎自然流量的网站能够生存并发展,实属罕见。Campbell的案例表明,即使是“老派”的网站模式,只要提供独特且有价值的体验,依然能吸引用户。 ## 启示:反主流策略的价值 Campbell的故事为科技创业者提供了一个值得深思的样本。当所有人都在追逐AI时,他选择了一个看似过时的赛道,并用技术手段赋予了它新的生命力。这不仅体现了对用户真实需求的洞察,也证明了**差异化竞争**的力量。在AI浪潮中,或许并非只有做大模型或AI应用才能成功,那些解决具体问题、提供独特体验的“小”产品,同样能找到自己的生态位。

The Verge昨天原文

## 什么是Windows 365云PC? Windows 365是微软推出的一项云服务,它将完整的Windows桌面环境(包括操作系统、应用和数据)托管在微软的云端,用户可以通过任何设备远程访问。简单来说,它让一台“云电脑”随时随地为用户服务,无需依赖本地硬件性能。 ## 跨平台体验:MacOS、安卓和iOS 我在MacBook、安卓手机和iPhone上分别测试了Windows 365。最直观的感受是:**无论设备如何,核心体验一致**。打开微软远程桌面应用,登录账户后,一个完整的Windows 11桌面便呈现在屏幕上。 - **MacOS**:配合外接键盘和鼠标,体验接近原生PC,但触控板手势需要适应。 - **安卓**:在手机屏幕上操作Windows桌面略显局促,但微软的触控优化做得不错,双指缩放、长按右键等功能可用。 - **iOS**:iPad的大屏幕体验优于iPhone,配合Apple Pencil甚至可以进行精细操作。 ## 性能与延迟:够用吗? 云PC的性能取决于微软的后端配置。我测试的是基础版(2核CPU、4GB RAM、128GB存储),日常办公、浏览网页、使用Office套件完全流畅。**延迟方面**,在Wi-Fi环境下,操作响应几乎无感;但使用移动网络时,偶尔会有轻微卡顿,尤其在高分辨率视频场景下。 ## 价格与适用场景 Windows 365按订阅收费,个人版起价约每月$20(含Windows 11许可证)。对于需要**临时使用Windows环境**的Mac用户、需要在移动设备上处理复杂办公任务的商务人士,或者希望统一管理企业设备IT部门,它都是一个值得考虑的方案。但如果你只是轻度办公,本地设备已足够,这笔开销可能不划算。 ## 小结 Windows 365云PC并非颠覆性产品,但它精准解决了跨平台一致性和灵活性的痛点。就像一位同事所说:“当你在iPad上能完整运行Excel宏时,你就知道它值了。”

ZDNet AI昨天原文

SpaceX 终于提交了 IPO 申请,这可能是史上规模最大的公开上市,估值传闻超过 1 万亿美元。但深入阅读其 S-1 文件后,你会发现这更像是金融虚无主义的终极形态——对马斯克及其银行家是盛宴,对普通投资者则可能是灾难。 ## 荒谬的数字游戏 文件中最惊人的数字是所谓总可寻址市场(TAM)高达 **28.5 万亿美元**,而美国 2025 年 GDP 也不过约 24 万亿美元。一个公司宣称的市场潜力竟然超过整个美国的经济总量,这本身就是一种讽刺。更令人担忧的是,SpaceX 去年亏损近 **50 亿美元**,却寻求万亿估值。 ## 从 WeWork 到 SpaceX:愚蠢的升级 如果说 WeWork 的 IPO 文件是一个笑话,那么 SpaceX 的则是一种威胁。WeWork 只是概念包装下的房地产公司,而 SpaceX 确实拥有星链、星舰等真实资产。但问题在于,其估值逻辑完全脱离了基本面。特斯拉目前市盈率超过 300 倍,而传统车企仅 11 倍,连印钞机般的英伟达也只有 33 倍。SpaceX 显然想复制特斯拉的“ meme 股”神话。 ## 七次“意识之光”与 AI 社交网络 S-1 文件中七次提到“将意识之光延伸到星辰”,这与其说是商业愿景,不如说是宗教布道。更值得警惕的是,SpaceX 现在自称是“太空公司 + AI 公司 + 社交网络”——一个包罗万象的概念,却缺乏清晰的盈利路径。星链虽然已有数十万用户,但前期投入巨大,且面临地面 5G 和低轨卫星竞争;星舰的星际旅行更是遥遥无期。 ## 散户的宿命:接盘侠 马斯克是原初的金融网红,他的特斯拉早已证明,故事可以比业绩更重要。但历史也告诉我们,当一家公司用宏大叙事掩盖财务亏损时,最终买单的往往是散户。WeWork 的 IPO 失败殷鉴不远,但 SpaceX 的不同之处在于它拥有真正的技术和政府合同,这反而让骗局更有迷惑性。 ## 结论 SpaceX 的 IPO 对马斯克是套现的良机,对早期投资者是退出的通道,但对普通散户而言,这可能是一个精心设计的陷阱。在金融虚无主义的狂欢中,唯一确定的是:**number go up** 不会永远持续。

The Verge昨天原文

在数字墨水屏平板领域,ReMarkable Paper Pure 和 Boox Go 10.3 Lumi(第二代)是近期最受关注的两款产品。两者均配备 **10.3 英寸** 显示屏,起售价同为 **399 美元**,但实际体验却截然不同。作为一名长期使用这两款设备进行工作的编辑,我将从书写手感、软件生态、文件管理和便携性等维度,为你剖析它们各自的优劣势。 ## 书写手感:ReMarkable 更接近真实纸张 ReMarkable Paper Pure 的核心优势在于其极致的**书写体验**。它的屏幕表面经过特殊处理,配合专属笔尖,摩擦感非常接近真实纸张,延迟极低,几乎感觉不到电子墨水屏的刷新。如果你是一位重度笔记用户或需要频繁进行文档批注,ReMarkable 会给你带来沉浸感。 相比之下,Boox Go 10.3 的书写手感稍显“滑”,虽然延迟控制同样出色,但缺少那种阻尼感。不过,Boox 支持多种笔触和颜色(通过灰度模拟),在功能性上更丰富。 ## 软件生态:Boox 开放,ReMarkable 专注 这是两者最根本的差异。Boox Go 10.3 运行基于 Android 的定制系统,**开放性极强**。你可以安装第三方应用,如 Kindle、微信读书、印象笔记等,甚至能通过浏览器直接访问网页。这意味着它不仅仅是一个记事本,更是一台多功能的阅读和轻办公设备。 而 ReMarkable Paper Pure 采用**封闭式系统**,专注于手写和文档管理。它不支持第三方应用,但提供极其流畅的笔记整理、PDF 批注和云同步功能。如果你是追求“减少干扰、专注写作”的用户,ReMarkable 的设计哲学会更合你意。 ## 文件管理与同步:各有千秋 Boox 的文件管理功能更强大,支持多格式文档(包括 EPUB、PDF、MOBI 等),并可通过 Wi-Fi、蓝牙或 USB 传输。其云同步方案也灵活,可对接多个第三方云盘。 ReMarkable 的文件管理则更简洁,主要通过其官方云服务进行同步,支持 PC、手机和网页端访问。虽然功能不如 Boox 丰富,但胜在稳定和一致。 ## 便携性与续航 两款设备都极其轻薄,重量均在 **400 克左右**,适合随身携带。续航方面,ReMarkable 得益于其精简的系统,续航时间更长,通常可达数周。Boox 由于后台运行 Android 服务,续航稍短,但也能满足一周左右的中度使用。 ## 最终选择:取决于你的核心需求 如果你追求**最纯粹的手写体验**,并且希望减少数字干扰,ReMarkable Paper Pure 是更好的选择。它就像一本永远用不完的笔记本。 如果你需要**功能更全面的设备**,希望在笔记之外还能阅读电子书、浏览网页或使用特定应用,那么 Boox Go 10.3 的开放性将带来更多可能性。 两者均无背光,这是电子墨水屏平板在特定场景下的共同短板。但总体而言,它们都是各自定位下的优秀产品。

ZDNet AI昨天原文

Amazfit 在 2026 年的新品发布节奏快得惊人,而最新旗舰 Cheetah 2 Pro 更是将目标瞄准了高端运动与日常健康的融合场景。过去几周,我深度体验了这款手表,甚至专门带着它下场打高尔夫——结果它真的帮我改进了挥杆数据,值回了票价。 ## 外观与佩戴:旗舰质感,但偏大 Cheetah 2 Pro 采用圆形钛合金表圈与蓝宝石玻璃镜面,整体做工精致,在户外光线下的可视度极佳。不过,**49mm 的表盘尺寸**对细手腕用户来说略显笨重,尤其搭配原装硅胶表带时,长时间佩戴会有明显的存在感。如果你习惯轻巧手环,可能需要适应几天。 ## 高尔夫模式:专业到令人意外 作为高尔夫爱好者,我重点测试了内置的 **高尔夫球场地图与挥杆分析功能**。手表通过 GPS 自动定位球场,并显示果岭前中后距离、障碍区提示。最惊艳的是 **挥杆检测**:它能记录挥杆节奏、杆头速度以及击球效率,并在 App 内生成可视化报告。实测三场 18 洞,GPS 轨迹精确到 1-2 米误差,挥杆数据与专业雷达设备对比,一致性达到 90% 以上。对于业余球友来说,这相当于请了一位随身教练。 ## 运动与健康:全面但非极致 除了高尔夫,Cheetah 2 Pro 覆盖 **150 多种运动模式**,包括游泳、骑行、徒步等。心率与血氧监测在静态下相当准确,但高强度间歇训练时,心率响应稍有延迟。睡眠分析新增了 **午睡自动识别**,这对碎片化休息场景很实用。续航方面,**日常使用约 12 天**,开启 GPS 连续运动约 35 小时,在高阶智能手表中属于优秀水平。 ## 智能功能与生态 手表运行 Amazfit 自研系统,支持离线地图、音乐存储、NFC 支付。通知推送流畅,但第三方应用生态远不如 Wear OS 丰富。**Zepp App** 的数据整合能力是亮点,能将运动、睡眠、压力等指标汇总为健康趋势报告,并给出个性化建议。不过,缺少血压监测和 ECG 心电图,对于追求极致健康数据的用户可能不够。 ## 小结:值得买吗? **Cheetah 2 Pro 适合两类人**:一是深度运动爱好者,特别是高尔夫、越野跑等需要专业数据的人群;二是追求长续航与全面健康监测的日常用户。它的硬伤在于尺寸偏大、生态封闭,且 2999 元左右的定价接近 Apple Watch Ultra,但如果你更看重运动专项能力而非应用生态,它会是更具性价比的选择。 总体而言,Amazfit 用 Cheetah 2 Pro 证明了:**智能手表不必在专业运动和日常体验之间妥协**——至少在高尔夫这件事上,它确实让我打出了更好的成绩。

ZDNet AI昨天原文
你真的需要付费购买转录软件吗?

## 免费转录工具实测:付费软件真的值得吗? Wispr Flow 是一款 AI 驱动的转录工具,声称能让你“以思维速度写作,比键盘快 4 倍”。它的核心卖点不仅是语音转文字,更在于后处理:先用 AI 将语音转为文本,再用大语言模型(LLM)去除填充词,并自动格式化为完整的句子和段落。实测效果确实不错,但每年 **144 美元** 的订阅费让人犹豫。 ### 免费方案同样能打 实际上,底层技术——AI 转录和 LLM——已经广泛可用。Nvidia 的 Canary 和 OpenAI 的 Whisper 都是开源的,可在本地免费运行。而大多数 AI 爱好者已经订阅了 OpenAI、Claude 或 Google Gemini,这些模型都能胜任后处理工作。此外,Ollama、Google Recorder 和 Apple Intelligence 等本地工具也是免费选择。 ### 最佳免费替代:Spokenly 经过测试,**Spokenly** 是目前最好的免费跨平台替代品。它支持 macOS 和 Windows,无需注册账号,免费下载即可使用。虽然并非开源,但功能上能覆盖 Wispr Flow 的核心体验:语音转文字 + 智能格式化,且不牺牲准确性。 ### 结论:按需选择 - 如果你追求即开即用、设计精致,且预算充足,Wispr Flow 值得一试。 - 如果更看重性价比,Spokenly 或本地开源工具(如 Whisper + Ollama 组合)完全够用。 - 手机用户可优先考虑设备自带的语音输入功能(如苹果的 Dictation、谷歌的 Assistant Voice Typing),它们也在不断升级。 **一句话总结**:转录软件的核心价值在于后处理,但这项能力如今已不稀缺。付费前不妨先试试免费方案。

WIRED AI昨天原文

## 告别AI摘要:9个Google搜索替代品实测 随着Google AI Overviews(AI摘要)成为默认功能,越来越多用户开始怀念传统搜索那种“只显示链接”的纯粹体验。如果你也厌倦了AI替你总结网页内容,不妨试试以下9个替代方案,其中**Startpage**和**DuckDuckGo**凭借隐私保护和极简AI介入脱颖而出。 ### 为什么需要替代品? Google的AI Overviews会在搜索结果顶部自动生成摘要,虽然对快速获取信息有帮助,但经常打断用户直接访问原始链接的意图。对于希望自主判断信息源、避免AI偏见或单纯偏好传统列表式结果的用户,寻找替代品变得迫切。 ### 精选替代方案 #### 1. **Startpage**:隐私优先的“隐形Google” - 使用Google搜索结果,但去除追踪和AI摘要。 - 提供“匿名视图”功能,保护用户IP。 - 界面简洁,完全无AI干扰。 #### 2. **DuckDuckGo**:隐私与实用平衡 - 不追踪用户,且内置!bang命令(如!g直接跳转Google)。 - 默认无AI摘要,但可选“AI Chat”功能(需手动开启)。 - 近年新增AI助手,但搜索结果页依然保持传统。 #### 3. **Mojeek**:独立索引的“反AI斗士” - 拥有自建搜索引擎索引,不依赖Google或Bing。 - 搜索结果完全由爬虫决定,无AI重排或摘要。 - 适合追求绝对独立性的用户。 #### 4. **SearXNG**:元搜索引擎的自托管选项 - 可自建实例,聚合多个引擎结果(Google、Bing、Wikipedia等)。 - 过滤AI摘要,但需一定技术门槛。 - 提供高度定制化体验。 #### 5. **Qwant**:法国隐私引擎 - 不追踪,搜索结果以卡片形式呈现,无AI摘要。 - 专注重于欧洲市场,英文结果稍弱。 #### 6. **Brave Search**:基于自身索引的隐私引擎 - 使用独立索引,且默认无AI摘要(可选“AI回答”功能)。 - 集成Brave浏览器生态。 #### 7. **Kagi**:付费无广告搜索 - 无广告、无追踪,且提供“快速回答”但非AI摘要。 - 定价约$10/月,适合重度用户。 - 搜索结果干净,可自定义权重。 #### 8. **Swisscows**:家庭友好型搜索 - 使用语义搜索,但无AI摘要,过滤成人内容。 - 数据存储于瑞士,隐私法律严格。 #### 9. **Ecosia**:环保搜索引擎 - 用广告收入植树,搜索结果来自Bing,但无AI摘要。 - 适合环保主义者。 ### 如何选择? - **追求隐私+Google结果**:选Startpage。 - **日常替代**:DuckDuckGo最均衡。 - **独立索引**:Mojeek或Brave Search。 - **无广告体验**:考虑付费Kagi。 ### 小结 AI搜索虽是大势,但传统搜索依然有忠实用户群。上述9个工具均提供“无AI摘要”选项,让你重新掌控浏览体验。值得注意的是,部分引擎(如DuckDuckGo)也在试探性加入AI功能,但用户可选择关闭。未来,完全“无AI”的搜索可能越来越稀缺,但至少目前,你仍有选择权。

ZDNet AI昨天原文

Android Auto 在提供便捷的驾驶体验的同时,也会因为高强度资源占用导致手机发热甚至过热关机。本文总结了 8 个经过验证的降温技巧,帮助你在使用导航、音乐和通话等功能时保持手机冷静。 ### 为什么 Android Auto 会让手机变热? 当手机同时运行导航、流媒体音乐、充电、数据传输等多个任务时,处理器和屏幕持续高负载工作,热量自然积聚。尤其是在夏天车内高温环境下,散热更加困难。 ### 8 个实用降温方法 1. **关闭后台不必要的应用**:在连接 Android Auto 前,手动关闭不需要的后台 App,减少资源竞争。 2. **降低屏幕亮度**:屏幕是主要发热源之一,将亮度调至自动或手动降低 50%,能显著减少发热。 3. **使用车载空调出风口支架**:将手机放在空调出风口前,利用冷风直接散热;避免阳光直射的中控台或仪表盘位置。 4. **更换高质量 USB 数据线**:劣质或老化的线缆会导致充电不稳定,增加手机负担。建议使用原装或认证的 USB-C 线。 5. **关闭不必要的连接功能**:如果不需要蓝牙、Wi-Fi 或热点,可暂时关闭,减少射频模块工作产生的热量。 6. **限制充电电流**:部分手机支持“慢充”模式,在 Android Auto 连接时开启可降低充电发热。 7. **更新系统和应用**:Google 常通过更新优化 Android Auto 的资源占用,保持最新版本可减少异常发热。 8. **暂时关闭无线 Android Auto**:无线连接比有线更耗电且发热更明显,若条件允许,优先使用有线连接。 ### 小结 手机过热不仅影响使用体验,还可能缩短电池寿命。通过以上方法,大多数用户能有效控制温度。若问题持续,建议检查手机散热设计或联系厂商支持。

ZDNet AI昨天原文

随着极端天气日益频繁,停电不再是小概率事件。资深科技编辑 Adrian Kingsley-Hughes 分享了他多年应急准备中积累的太阳能发电机快速就绪方案,从日常维护到风暴前检查清单,助你在断电前抢占先机。 ## 为什么太阳能发电机是应急刚需? 近年来,**太阳能发电站(Solar Generator)** 已成为美国家庭的热门选择——既能日常削峰填谷节省电费,又能在灾害来临时充当**弹性电源**。但许多人忽略了一个关键问题:**设备在仓库里“吃灰”半年后,真到用的时候能立刻工作吗?** ## 我的风暴前快速就绪流程 ### 1. 日常维护是基础 - 每季度对电池进行**一次完整充放电循环**,保持电芯活性。 - 太阳能板定期清洁,避免灰尘堆积影响效率。 - 检查所有线缆接头是否氧化或松动。 ### 2. 风暴预警发出后的“黄金4小时” 当天气预报显示未来72小时内有强风暴时,立刻启动以下流程: - **充满电池**:将发电机连接市电充至100%,并确保**备用扩展电池**同样满电。 - **部署太阳能板**:提前架设好便携面板,**不一定要朝正南**——多云天气下,朝东南或西南也能获得可观发电量。 - **负载测试**:接入关键设备(如冰箱、CPAP呼吸机、路由器),运行30分钟确认逆变器输出稳定。 - **准备转接方案**:备好延长线、多口USB充电器,以及**车充转家用插座适配器**(应急时可从电动车取电)。 ### 3. 风暴中的动态管理 - 若天气允许,每4小时调整一次太阳能板角度。 - 优先为**医疗设备、通讯设备、冷藏药品**供电。 - 使用**功率计插座**监控实时功耗,避免过载。 ## 我的装备清单(仅供参考) - 主力:**Jackery Explorer 2000 Pro**(2042Wh,2200W输出) - 备用:**Goal Zero Yeti 1500X**(1516Wh) - 面板:4块**200W可折叠单晶硅板**,总峰值800W ## 小结:别等停电再翻说明书 太阳能发电机不是“买了就完事”的设备。**定期维护+提前部署**才是应急能力的核心。正如 Kingsley-Hughes 所说: > “风暴不会等你准备好。但如果你提前演练过,就能在别人摸黑找蜡烛时,依然享有灯光和Wi-Fi。” 最后提醒:**所有应急电源方案都应配合烟雾报警器和一氧化碳探测器使用**,切勿在室内运行燃油发电机。

ZDNet AI昨天原文

随着大语言模型(LLM)在生产环境中大规模部署,如何同时监控模型质量和基础设施性能成为运维团队的核心挑战。近日,AWS 发布了一套基于 **Amazon Managed Grafana** 的综合性可观测性方案,专为在 **Amazon SageMaker AI** 终端节点上使用推理组件(Inference Components)托管的 LLM 服务设计。该方案打破了传统监控中“质量”与“数量”分离的局限,将 GPU 利用率、延迟、吞吐量等基础设施指标与模型输出质量、响应准确度等业务指标统一呈现在一个仪表盘中。 ## 从碎片化到统一视图 过去,运维人员通常需要切换多个工具:用 CloudWatch 查看 GPU 和内存使用率,用日志分析工具跟踪推理响应,再用第三方平台评估模型生成质量。这种碎片化方式不仅效率低下,还容易遗漏关键关联信息。例如,当 GPU 利用率突然下降时,是模型本身出现退化(如输出重复或语义错误),还是负载调度问题?新方案通过 Grafana 将不同数据源汇聚,让运维者能在一张仪表盘上快速定位根因。 ## 核心监控维度 该方案覆盖了四大关键维度: 1. **基础设施指标**:GPU 利用率、显存占用、实例级 CPU 和网络 I/O,帮助识别资源瓶颈。 2. **推理性能指标**:请求延迟(P50/P99)、吞吐量(TPS)、并发请求数,以及推理组件的队列深度。 3. **模型质量指标**:基于采样推理结果计算的质量评分,例如 BLEU、ROUGE 或自定义评估指标,用于检测模型退化。 4. **成本与效率**:每个请求的推理成本、GPU 单位时间的 token 产出,为优化部署提供数据支撑。 ## 技术实现亮点 方案利用 **SageMaker Model Monitor** 采集推理质量数据,通过 **Amazon CloudWatch** 接收基础设施指标,再由 **Amazon Managed Grafana** 的 **Prometheus** 兼容数据源进行聚合和可视化。值得一提的是,它支持对 **推理组件** 级别的监控——这是 SageMaker AI 为 LLM 部署引入的新抽象,允许在同一终端节点上动态分配不同模型的内存和 GPU 资源。 ## 实际应用场景 在真实测试中,该仪表盘帮助团队发现了一个典型问题:某 LLM 在低并发时 P99 延迟正常(<500ms),但 GPU 利用率仅为 30%。通过关联质量指标,发现模型在低负载下产生了更多重复 token,导致推理效率下降。运维团队随即调整了推理组件的 `MinVCPU` 和 `MaxVCPU` 参数,优化了资源分配,使 GPU 利用率提升至 70% 的同时,模型质量保持稳定。 ## 总结 这套方案不仅为 LLM 推理运维提供了“上帝视角”,更将可观测性从资源层延伸到了业务价值层。对于正在使用 SageMaker AI 部署 LLM 的团队,它显著降低了排查问题的平均时间(MTTR),并为成本优化和模型迭代提供了数据驱动的决策基础。未来,随着推理组件支持更多的自动缩放策略,这类综合监控将成为 LLM 服务可靠性的标配。

AWS ML昨天原文

2026年,AI编程工具已成为开发者的“标配”,但最新研究揭示了一个令人担忧的趋势:开发者越来越不愿在没有AI辅助的情况下工作,这可能导致代码质量下降和长期隐患。 ## 开发者“上瘾”:没有AI就不干活 2026年2月,知名AI研究机构METR发布了一项令人惊讶的发现:大多数开发者不再愿意在没有AI的情况下工作,即使是参与研究任务也不例外。METR原本计划重复2025年的一项经典实验——测量开发者手动编码与使用AI编码的生产力差异——却遭遇了意想不到的困难:开发者拒绝参与,因为他们“不希望在没有AI的情况下工作,哪怕只是为了研究”。 这一现象揭示了AI工具在开发者群体中的深度渗透。2025年的原始实验曾发现,虽然AI能快速生成代码,但开发者随后需要花费更多时间排查错误、调整AI输出以及等待任务完成,整体效率反而下降。然而,到了2026年,开发者对AI的依赖已经超越了效率考量,成为一种工作习惯甚至“心理依赖”。 ## 自评生产力翻倍,但事实可能相反 METR随后在5月发布了一项调查,让技术员工自我评估AI带来的生产力提升。不出所料,受访者普遍认为AI使他们**对组织的价值翻了一番**。但这种主观感受与客观数据之间存在明显矛盾。 2026年的一个热门趋势是“**Tokenmaxxing**”——即将AI使用量(token消耗数)作为生产力指标。这一做法正在遭遇质疑。据《金融时报》报道,亚马逊已关闭内部token追踪排行榜“Kirorank”,原因是员工通过过度使用AI代理来“刷榜”,导致成本飙升。Uber同样在2026年前四个月就耗尽了全年AI预算,但COO Andrew Macdonald在播客中承认,巨额投入并未带来项目数量或生产力的可衡量提升。 ## AI代码的维护陷阱 程序员兼作家James Shore在Hacker News上引发热议的一篇博客中指出,AI生成的代码并不一定能减少代码维护需求,反而可能增加负担。“你写两次代码,”他写道,暗示AI生成的代码往往需要人工反复修正。 ## 长期风险:技能退化与隐性债务 开发者拒绝脱离AI工作,意味着他们可能在失去独立解决复杂问题的能力。当AI工具无法处理边缘情况或产生难以调试的“幻觉代码”时,过度依赖的开发者将面临更大的挑战。此外,AI生成的代码可能引入**技术债务**——虽然短期内加速了开发,但长期维护成本可能远超预期。 ## 结论:工具虽好,依赖需有度 AI编程工具无疑是强大的生产力放大器,但2026年的研究提醒我们:**效率不等于效果,速度不等于质量**。开发者需要警惕对AI的过度依赖,在享受便利的同时,保持核心编程能力和代码审查的严谨性。否则,今天的“捷径”可能成为明天的“陷阱”。

TechCrunch2天前原文
亚马逊要用AI动画改编《好建议杯子蛋糕》,原作者震怒

Loryn Brantz 多年前为 BuzzFeed 创作的卡通角色“好建议杯子蛋糕”(Cuppy),如今被 BuzzFeed 授权给亚马逊 Prime Video,计划通过 AI 工具制作成动画剧集《Cupcake & Friends》。Brantz 对此毫不知情,并在 Instagram 上公开谴责这是“对全球艺术家的攻击”。该剧集是亚马逊 AWS 与 MGM 工作室联合发起的 GenAI 创作者基金首批项目之一。Brantz 指出,BuzzFeed 在未与她协商的情况下,将她的原创角色用于 AI 动画,违背了此前高管的口头承诺。她呼吁抵制 BuzzFeed 及所有 AI 生成或辅助的动画作品。这一事件凸显了数字媒体公司在 AI 时代对创作者权益的漠视,也引发了关于 AI 生成内容版权与伦理的广泛讨论。

WIRED AI2天前原文

海信 U6 Pro 是一款扎实的中端 Mini LED 电视,而在这个价位上更是不二之选。 ## 核心亮点 - **75英寸大屏**:适合客厅或家庭影院,沉浸感十足。 - **Mini LED 技术**:相比传统 LED,Mini LED 能提供更高的对比度和亮度,黑色更深邃,亮部更生动。 - **价格优势**:原价通常接近千元,如今降至 **$850 以下**,性价比突出。 ## 适合谁买? 如果你是预算有限但追求画质的用户,U6 Pro 是绝佳选择。它不支持顶级游戏特性如 120Hz 高刷或 HDMI 2.1,但日常观影、流媒体和轻度游戏完全够用。对于非发烧友而言,这个价格买一台 75 英寸 Mini LED 电视,几乎找不到对手。 ## 行业视角 电视市场正加速向 Mini LED 和 OLED 分化。海信凭借 U6 Pro 在中端市场精准卡位,以实惠价格普及先进显示技术。亚马逊此次降价进一步拉低了入手门槛,可能带动新一轮换机潮。相比之下,同价位竞品多为传统 LED 或小尺寸 OLED,U6 Pro 在尺寸和画质之间取得了很好的平衡。 ## 小结 如果你正在寻找一台大尺寸、画质好且价格合理的电视,海信 U6 Pro 的这次促销值得关注。建议尽快下单,因为这类优惠通常限时。

ZDNet AI2天前原文
上手体验 Gemini Spark:我把生活全权交给它,它却把我男友当成了“好朋友”

Google 在今年的 I/O 开发者大会上推出了 **Gemini Spark**,一个始终在线的 AI 智能体,能够连接你的个人数据、完成在线任务并自动化日常交互。这是 Google 对 2026 年初席卷硅谷的 OpenClaw 智能体的回应。 作为首批体验者,我让 Gemini Spark 完全访问我的 Gmail、文档和日历,然后输入了一句简单的提示:“帮我计划一场生日派对”。结果令人惊叹:它不仅从我真实预订的卡拉 OK 酒吧信息中提取了细节,还生成了五页的完整计划,包括宾客名单、场地规则、附近餐饮、余兴派对地点、邮件邀请和主题创意。整个过程仅需几分钟,无需我时刻监督。 然而,真正让我哭笑不得的是 AI 生成的宾客名单。它扫描了我的邮件和文档,推荐了 15 位潜在朋友——恰好是包间最大容量。名单第一位是我的长期同居男友,却被标注为“亲密朋友和频繁旅伴”。更离谱的是,作为寿星的我本人竟然不在名单上。这种“数据洞察”与真实关系的错位,暴露了当前 AI 智能体在理解人类情感和社交细微之处时的局限性。 Gemini Spark 本周开始向 AI Ultra 订阅用户(每月 100 美元)开放 Beta 版,位于 Gemini 聊天机器人的新标签页中,支持移动端和桌面端控制。尽管它在任务自动化上表现出色,但这次“翻车”提醒我们:AI 可以处理日程,却无法理解人心。

WIRED AI2天前原文

人工智能的崛起带来了大量新术语和行话。本文整理了一份常用词汇表,帮助你理解LLM、RAG、RLHF等关键概念。 ## 从AGI到AI Agent:核心概念解析 **AGI(通用人工智能)** 是一个模糊但重要的概念。OpenAI CEO Sam Altman将其描述为“可以雇来当同事的普通人类水平的AI”,而OpenAI的章程则定义为“在大多数经济价值工作上超越人类的高度自主系统”。Google DeepMind的理解略有不同,认为AGI是“在大多数认知任务上至少与人类能力相当的AI”。值得注意的是,即使是AI研究前沿的专家们对此也未达成共识。 **AI Agent(智能体)** 指的是能够自主执行一系列任务的工具——比如报销费用、预订机票或编写代码——远超基础聊天机器人的能力。不过,正如我们之前解释过的,这个新兴领域仍有许多不确定性,不同人对AI Agent的理解可能不同,其底层基础设施也仍在建设中。 ## 技术细节:API端点与思维链 **API端点(API endpoints)** 可以理解为软件后端暴露的“按钮”,其他程序可以“按下”这些按钮来触发功能。开发者利用这些接口构建集成,例如让一个应用从另一个应用拉取数据,或让AI Agent直接控制第三方服务。大多数智能家居设备和联网平台都有这些隐藏按钮,普通用户通常看不到。随着AI Agent能力增强,它们越来越能自主发现并调用这些端点,带来强大的自动化可能。 **思维链(Chain of thought)** 是一种推理方法,让AI像人类一样逐步思考问题。面对简单问题时,人类大脑可以不经思考直接回答;而复杂问题则需要分解步骤。思维链提示技术正是模拟这种过程,要求模型输出中间推理步骤,从而提升复杂任务的准确性。 ## 行业背景与术语价值 这些术语的涌现反映了AI行业的快速迭代。理解它们不仅是技术爱好者的需求,更是商业决策者和普通用户跟上时代的基础。例如,区分AGI的不同定义有助于评估AI公司的技术路线和商业承诺;了解API端点的概念则能理解为什么AI Agent正在成为自动化领域的热点。 本文作为一份活文档,将持续更新。建议读者重点关注**RLHF(基于人类反馈的强化学习)**、**RAG(检索增强生成)** 等后续会深入解析的术语,它们分别对应AI对齐和知识检索两大关键方向。

TechCrunch2天前原文

近年来,AI取代人类工作的论调甚嚣尘上,但Box创始人Aaron Levie却提出了一个令人警醒的观点:那些决定AI可以取代你工作的人,恰恰是最不了解你工作真正内涵的人。他将这种现象称为“AI精神病”(AI psychosis)。 Levie的这番评论并非空穴来风。项目管理平台ClickUp近期裁掉了22%的员工,理由是为了给AI代理腾出空间。更令人担忧的是,2026年的科技行业裁员人数已经几乎与2025年全年持平。这些数据表明,企业正在以前所未有的速度用AI替代人类岗位,但其中可能隐藏着巨大的认知偏差。 ### 什么是“AI精神病”? Levie所描述的“AI精神病”,指的是企业高管和技术决策者过度沉迷于AI的潜力,以至于盲目相信AI能够解决所有问题,甚至在不完全理解业务复杂性的情况下,就贸然用AI替代人类员工。这种思维模式忽略了AI的局限性,也低估了人类在特定场景下的不可替代性。 例如,ClickUp的裁员决策引发了广泛争议。虽然AI代理在处理重复性任务上确实高效,但项目管理涉及大量的人际沟通、创意协调和战略决策,这些都是当前AI难以胜任的。Levie认为,这种“先开枪后瞄准”的做法,最终可能导致企业效率下降,甚至失去核心竞争力。 ### AI替代的隐形成本 事实上,AI替代人类工作并非简单的成本效益计算。当企业盲目追求AI化时,往往会忽略以下隐形成本: - **知识流失**:经验丰富的员工离开后,其积累的行业知识和隐性技能难以被AI复制。 - **创新停滞**:过度依赖AI可能导致团队失去主动思考和创新的能力。 - **客户体验下降**:AI在处理复杂、个性化需求时,往往不如人类灵活和富有同理心。 Levie的警告并非反对AI技术本身,而是呼吁企业保持理性。AI应当被视为增强人类能力的工具,而非完全替代人类的解决方案。 ### 行业趋势与反思 2026年的裁员数据令人震惊:科技行业的裁员人数已接近2025年全年水平。这背后既有经济下行的压力,也有AI技术普及的冲击。然而,Levie的观点提醒我们,裁员并非总是最优解。企业在推动AI转型时,需要更深入地评估岗位价值,避免陷入“为了AI而AI”的误区。 一些公司已经开始反思这一趋势。例如,部分企业选择通过再培训让员工与AI协作,而非直接裁员。这种“人机协同”的模式或许更可持续。 ### 小结 “AI精神病”是一个值得所有科技从业者警惕的现象。在AI浪潮席卷各行各业的今天,企业决策者需要保持清醒:AI是工具,不是万能药。真正的竞争力,来自于对技术与人类价值的深刻理解与平衡。

TechCrunch2天前原文

随着科技行业围绕 AI 智能体(AI Agent)加速布局,股票交易应用 **Robinhood** 也正式加入这一浪潮。本周三,Robinhood 宣布推出 **AI 代理交易** 功能,并同步上线一款面向 AI 代理的虚拟信用卡,标志着个人投资与 AI 自主操作之间的边界正在被打破。 ## 功能设计:AI 代理如何为你交易? Robinhood 用户现在可以为自己的 AI 代理创建一个独立账户,并连接专属钱包。AI 代理能够读取和分析用户的投资组合,提出交易策略和投资建议,但**只能动用预充入专属钱包的资金**来下单。所有交易行为都会通过 Robinhood 应用向用户发送通知,用户可随时监控代理的活动。对于部分交易,代理会生成预览,**需要用户手动批准**后才能执行。 Robinhood 还内置了欺诈检测保护机制:一旦出现可疑交易,Robinhood 团队会进行审查并协助用户解决争议。目前该功能处于 **Beta 阶段**,仅支持股票交易;公司计划后续扩展至期权、加密货币、事件合约、期货和预测市场。 ## 连接方式:通过 MCP 协议实现智能体对接 Robinhood 允许用户将 AI 代理连接到其 **Model Context Protocol (MCP) 服务**,从而执行多种操作,例如: - 分析集中度风险和行业敞口 - 执行交易 - 浏览分析师笔记以发现跨行业投资机会 这种开放接口的设计,使得用户可以使用自己的工具、大型语言模型(LLM)和代理来与 Robinhood 平台交互。 ## 虚拟信用卡:让 AI 代理也能付款 除了交易功能,Robinhood 还推出了一款专为 AI 代理设计的 **虚拟信用卡**。用户可将 AI 代理连接到 Robinhood 的银行 MCP 服务器,使其能够代表用户进行支付。该虚拟卡目前仅面向 Robinhood Gold Card 持有者开放,用户可以设置**每月消费限额**,并选择每次支付是否需要代理请求批准。Robinhood 表示,即将推出的 **Platinum Card** 也将支持类似的虚拟代理卡功能。 ## 行业背景与战略意义 Robinhood 在 AI 领域的布局已有时日:2024 年收购了 AI 驱动的研究平台 **Pluto**,去年又推出了提供投资建议的 AI 助手。此次 AI 代理交易功能的推出,进一步将 AI 从“建议者”升级为“执行者”,标志着个人投资领域进入 **AI 自主操作** 的新阶段。 对于用户而言,AI 代理可以 24/7 监控市场并快速执行策略,但也带来了风险控制、隐私保护等新挑战。Robinhood 通过独立钱包、交易通知和人工审查机制,试图在“自主”与“可控”之间取得平衡。 ## 小结 Robinhood 的 AI 代理交易功能目前处于早期测试阶段,但它预示了一个趋势:AI 智能体正在从聊天工具演变为具备实际金融操作能力的“数字管家”。未来,随着更多资产类别和支付场景的接入,AI 代理在个人金融领域的应用空间值得密切关注。

Hacker News1092天前原文

本周,一家名为 **Shift** 的 AI 训练初创公司宣布,将为纽约居民提供**免费的家政清洁服务**,并计划将业务扩展到伦敦等城市。表面上是福利,但背后有一个明确的交换条件:Shift 要求拍摄清洁工工作的全过程——从洗碗、擦台面到拖地,所有家务细节都会被记录下来。这些视频并非用于宣传,而是作为训练机器人的**真实世界数据**。 为什么需要这么多家务视频?与可以从互联网大规模抓取的文本、图像数据不同,机器人要学习物理世界中的操作,需要理解空间、运动、力、摩擦、不规则形状和光线变化等复杂因素。对人类来说轻而易举的叠衣服、捡苹果、倒水,对机器人而言却是巨大的工程挑战。要教会它们这些技能,必须依赖海量的、高质量的**物理世界数据**。 Shift 并非孤例。在印度,家居服务平台 **Pronto** 也被曝出利用客户的家作为 AI 训练素材的来源,拍摄烹饪、清洁、洗衣等家务活动。Pronto 声称只在客户明确同意的情况下录制,但客户获得什么回报尚不明确。这种做法引发了关于隐私和知情同意的讨论。 ### 数据瓶颈催生“创意”采集 随着具身智能(Embodied AI)和机器人技术的升温,真实世界数据成为稀缺资源。与数字内容不同,家务数据无法轻易从网上抓取,且往往涉及隐私和伦理问题。Shift 的模式本质上是“以服务换数据”——用免费清洁换取拍摄许可,既获取了高质量训练数据,又绕过了传统数据采集的高昂成本。 ### 隐私与便利的博弈 对于消费者而言,免费清洁听起来很有吸引力,但代价是让陌生人记录下自己私密的生活空间。这些视频如何存储、使用、分享,是否会被用于其他目的,都是未知数。Shift 和 Pronto 的做法也提醒我们:在 AI 时代,**数据采集的边界正在模糊**,而日常生活中的隐私可能成为技术发展的“燃料”。 ### 小结 机器人想要真正走进家庭,必须先学会做家务。而学会做家务,又需要大量家庭场景的数据。Shift 的免费清洁计划是这一循环中的一环,它揭示了 AI 训练数据获取的新趋势——从公开网络转向现实世界,从免费抓取转向“等价交换”。但如何平衡技术发展与个人隐私,将是整个行业需要持续面对的课题。

The Verge2天前原文

AI芯片初创公司Groq正计划从现有投资者处筹集6.5亿美元新资金,以加大对其推理云业务的投入。据Axios报道,这家公司正从硬件转向聚焦AI推理(inference)——即优化AI模型对用户提示做出响应的过程。 去年12月,Groq与英伟达达成了一项价值约200亿美元的“非收购协议”,涉及部分Groq高管跳槽至英伟达,以及Groq硬件技术的授权。这笔交易让Groq的投资者获得了现金回报,但如果当时是全面收购,它本将成为英伟达历史上最大的一笔收购。如今,这些投资者被要求再次出资,支持公司发展推理云业务,该业务允许开发者和企业托管其推理密集型应用。 目前,Groq由临时CEO Adam Winter和临时CFO Matt Eng领导。报道称,这6.5亿美元融资几乎已成定局——现有投资者Disruptive和Infinitium已同意,如果其他投资者不愿按比例认购,他们将补足剩余份额。 推理是AI提示之后发生的处理过程,目前在AI世界中,推理的需求远大于模型训练。Groq的转型反映了这一趋势:随着AI应用大规模落地,推理环节对算力的消耗正成为瓶颈,而Groq自研芯片在推理速度和能效上具有优势。 这轮融资距离英伟达的“非收购”协议仅半年,显示出Groq在获得资金和人才后,正加速向推理服务商转型。对于英伟达而言,这既是巩固其AI生态的举措,也间接扶持了一个潜在竞争对手。

TechCrunch2天前原文