SheepNav

AI 资讯

每日聚合最新人工智能动态

我用Gemini的AI化身克隆了自己,结果令人不安地像我

我使用Gemini应用生成了一段逼真的视频,其中包含一个数字克隆的我。Google将此视为创作的未来,而我仍然感到毛骨悚然。 ## 初次体验:从设置到生成 一个温暖的午后,我在旧金山多洛雷斯公园为一只史前恐龙唱生日歌。当我完成小夜曲时,一个插着粉色蜡烛的纸杯蛋糕凭空出现在我空着的手中。吹灭蜡烛后,那个CGI风格的恐龙露出满足的表情。视频中的男人看起来和听起来都像我,但实际上这是使用Google Gemini应用的新功能——**化身(Avatars)** 生成的。这些数字再现类似于OpenAI已停用的Sora应用的核心功能。化身由Google新的Omni视频模型驱动,仅对付费订阅用户开放。我每月支付20美元订阅Google AI Pro计划,但很快就用完了使用限额(每5小时重置)。我只问了几个问题并生成了两个10秒的片段,就被提示等待。 ## 技术细节与限制 与OpenAI允许用户决定是否允许他人使用自己肖像生成视频不同,Google只允许成年用户用自己的化身制作视频。设置过程大约需要5分钟:在光线充足的房间里,用手机摄像头对准脸部,朗读一串两位数数字,然后缓慢向右转头再向左转。完成后,我的数字克隆诞生了。需要注意设置时的着装,因为衣服很可能出现在AI生成的画面中。 ## 质量与感受 前两个片段分别是我在旧金山为恐龙唱歌和在金门大桥下冲浪。我既印象深刻又感到不安。内容有些尴尬,存在混乱的时刻和不合逻辑的服装,但视频中的人确实是我。我放大画面观察嘴巴的动作——牙齿有点不协调,但那就是我,连双下巴都还原了。 ## 行业背景与前景 Google将化身视为创作的未来,但这类技术也引发伦理担忧。相比OpenAI的开放态度,Google采取了更谨慎的策略,限制用户只能生成自己的化身,这在一定程度上降低了滥用风险。然而,随着AI视频生成技术日益成熟,如何在创新与隐私保护之间取得平衡仍是行业面临的重大挑战。

WIRED AI1个月前原文

Spotify 近日发布了一款名为 **Studio by Spotify Labs** 的全新独立 AI 应用,能够根据用户的个人数据生成每日简报、播客和播放列表。该应用目前以研究预览形式推出,面向 18 岁以上用户,未来几周内将正式上线。Studio 的独特之处在于,它不仅能调用用户的 Spotify 收听历史,还能连接邮箱、日历、笔记等第三方应用,从而生成高度个性化的音频内容。 ## 功能亮点:从“被动听”到“主动生成” Studio 的核心能力是 **通过聊天机器人提示词生成音频**。用户输入需求后,AI 会综合分析其 Spotify 数据与已授权的个人应用信息,制作出专属的每日简报播客。更值得关注的是,Spotify 宣称该 AI 能“代表用户采取行动”,例如研究主题、使用浏览器、整理信息或协助完成任务。所有生成的内容均可保存至用户的 Spotify 资料库。 这一功能将 Spotify 从传统的音频流媒体平台推向 **个性化内容创作平台**。此前,Spotify 已允许用户将来自 OpenClaw 和 Claude 等第三方 AI 生成的播客保存到资料库,并计划于下月推出“个人播客”(Personal Podcasts)——用户可直接在 Spotify 应用内通过提示词生成 AI 播客。 ## 行业背景:AI 播客赛道竞争加剧 Spotify 并非首家涉足 AI 生成播客的公司。自 2024 年起,Google 的 NotebookLM 已提供类似功能;亚马逊的 Alexa Plus 和微软的 Edge 浏览器也在近期推出了各自的 AI 播客特性。部分用户将其视为快速获取新闻或学习新知识的工具,但整体使用规模尚不明确。 然而,Spotify 的优势在于其 **音频内容生态的天然契合性**。用户本就习惯通过 Spotify 收听播客和音乐,而 Studio 的推出进一步降低了内容创作门槛——用户无需专业设备或编辑技能,即可生成定制化音频。不过,Spotify 明确表示 Studio 仅用于生成简报、播客和播放列表,**不涉及音乐创作**。 ## 用户价值与潜在争议 对于普通用户而言,Studio 的最大吸引力在于 **效率与个性化**。例如,通勤前生成一份融合了日程安排、新闻要点和音乐推荐的播客,比手动切换多个应用更便捷。但这也引发了隐私担忧:用户是否愿意将邮箱、日历等敏感数据授权给 AI?此外,AI 生成播客能否替代真人主播的独特观点和情感表达,仍是未知数。 Spotify 同时宣布,Premium 用户即日起可使用 **播客问答聊天机器人**,它能针对正在收听的节目提供时间戳或主题解析。这些举措表明,Spotify 正试图通过 AI 技术巩固其音频领域的领先地位,但如何在创新与隐私、效率与人文价值之间取得平衡,将是其面临的关键挑战。

The Verge1个月前原文

曾被誉为“最美 Linux”的 Deepin 桌面环境,如今正面临被主流发行版抛弃的窘境。继 SUSE 之后,Fedora 也正式从官方仓库中移除了所有 Deepin 软件包。这一决定并非一时冲动,而是基于长期积累的安全隐忧。 ## 从惊艳到隐忧 Deepin 桌面环境(DDE)以其精美的界面和用户体验一度被视为 Linux 桌面的“破圈”之作。然而,早在 2018 年,Deepin 就被曝出商店向中国第三方分析服务 CNZZ 发送未加密请求,涉及用户浏览器代理等信息。尽管 Deepin 官方随后停止了数据收集,且后续取证未发现核心层存在间谍软件,但信任裂痕已然产生。 ## SUSE 的“临门一脚” 2025 年,SUSE 率先宣布切断与 Deepin 的关系。其调查指出,Deepin 社区打包者为绕过安全审查,在 openSUSE 中采用了一种规避标准 RPM 打包机制的变通方案来安装受限资源。SUSE 直言:“鉴于这一违规行为以及 Deepin 代码审查的艰难历史,我们将暂时从 openSUSE 发行版中移除 Deepin 桌面包。” ## Fedora 紧随其后 在 SUSE 声明之后,Fedora 团队也以类似的安全理由移除了 Deepin 软件包。这意味着 Fedora 和 Red Hat Enterprise Linux 用户将无法再从官方仓库直接安装 DDE。Red Hat 作为企业级 Linux 的标杆,其决策往往具有行业风向标意义。 ## 不是终点,而是转折 对于 Deepin 而言,被两大主流发行版“拉黑”无疑是沉重打击。但换个角度看,这也为 Deepin 提供了自我革新的契机。目前,Deepin 的发展路径已十分明确:**必须进行严格的代码审查**,重建社区信任。如果 Deepin 能够借此机会彻底解决安全合规问题,未来或许仍有机会重返主流仓库。 ## 对用户的影响 对于普通用户来说,最直接的影响是无法再通过 Fedora 或 openSUSE 的官方源一键安装 DDE。不过,用户仍可通过第三方源或自行编译的方式使用 Deepin 桌面,但这增加了安全风险和操作门槛。对于追求稳定与安全的用户,建议暂时转向其他桌面环境如 GNOME、KDE Plasma 或 Budgie。 ## 结语 Deepin 的遭遇再次提醒我们:在开源世界,**安全与信任是发行版的生命线**。任何绕过审查的“捷径”都可能带来长期代价。Deepin 能否走出低谷,取决于其能否以透明、合规的方式重新赢得社区的信任。

ZDNet AI1个月前原文

摩托罗拉为 Razr Fold 打造的 Smart Connect 桌面模式,让我几乎可以告别笔记本电脑。以下是我的实际体验。 ## 从手机到桌面:一次无缝切换 当我第一次将 Razr Fold 连接到便携显示器时,Smart Connect 界面自动弹出,手机屏幕瞬间变成触摸板——无需额外配件,操作直观。连接方式灵活:有线、无线或通过智能眼镜投射,都能获得接近完整的桌面体验。 ## 性能与兼容性:够用且流畅 在 Razr Fold 上运行 Smart Connect 时,多任务处理流畅。我同时打开了浏览器、文档编辑器和 Slack,切换迅速,没有明显卡顿。值得注意的是,它支持窗口自由缩放和排列,与 Windows 11 的体验高度相似。外接键盘和鼠标后,打字和导航效率大幅提升。 ## 关键场景:移动办公的新选择 对于经常出差或需要临时办公的人来说,Smart Connect 提供了一个轻量级方案。我尝试用它撰写文章、回复邮件、甚至进行简单的图片编辑。虽然重度任务(如视频渲染)仍需笔记本,但日常办公已足够。 ## 与竞品对比:差异化优势 与三星 DeX 相比,摩托罗拉的 Smart Connect 在连接便捷性和触控交互上更胜一筹。DeX 需要专用底座或有线连接,而 Smart Connect 支持无线投屏,且手机作为触控板的体验更自然。不过,应用生态上仍落后于 DeX,部分专业软件尚未适配。 ## 小结:值得尝试的移动工作站 Smart Connect 让 Razr Fold 从一个折叠手机升级为便携工作站。如果你已经有便携显示器或智能眼镜,这套组合几乎可以替代笔记本电脑完成大部分工作。当然,它并非完美——重度任务仍需传统 PC,但对于移动办公者来说,这是一个令人兴奋的补充。

ZDNet AI1个月前原文

社交平台上充斥着 AI 生成的劣质片段,如丹尼尔·克雷格骑 Vespa 或哥斯拉大战金刚,这些内容让许多人认为好莱坞将被 AI 取代。然而,AI 视频的真正潜力并不在于制造这些“片段污染”,而是通过智能体技术重塑整个影视制作流程。 Luma AI 的 CEO Amit Jain 指出,早期 AI 视频公司试图说服好莱坞用提示词替代摄像机,但这远远不够。生成的 10 到 16 秒片段无法构成镜头、序列或场景。如今,Luma 等公司转向开发 AI 智能体,覆盖从前期策划到后期制作的端到端工作流,类似于 Anthropic 从“氛围编码”转向智能体工作流的演进。 这种变革意味着 AI 不再只是生成视频的工具,而是融入剧本分析、分镜设计、拍摄调度和视觉特效等环节。例如,Luma 与 Wonder Project 合作成立的新制作公司 Innovative Dreams,正探索如何用 AI 智能体辅助电影创作。虽然高质量影视作品仍需人类创意主导,但 AI 能显著提升效率,降低试错成本。 好莱坞并未“被煮”,而是站在技术升级的关口。AI 视频的下一阶段,不是制造更多廉价片段,而是成为制片人的智能助手,让创意更快落地。这或许才是 AI 对娱乐产业最深远的影响。

The Verge1个月前原文

Spotify 正在从单纯的播客消费平台,向“人人皆可创作”的个性化音频平台进化。近日,该公司宣布推出一系列基于 AI 的新功能,涵盖个人播客生成、AI 问答以及创作者工具,标志着其在音频内容领域的又一次重要布局。 ### 一、个人播客:你的专属音频简报 核心亮点是 **AI 驱动的个人播客生成功能**。用户只需输入一个想法或自定义提示词,Spotify 就能自动生成一档播客。该功能不仅支持一次性主题创作,还能**按日或按周生成定期简报**,例如“分享我所在城市的每日更新,并告诉我喜欢的艺人有哪些本地演出”,或者“用五分钟帮我理解经济学”。 更强大的是,用户可以**附加链接、PDF 和文本**作为素材来源,并**选择自定义语音**来播报。这让人联想到 Google 的 NotebookLM、ElevenLabs 的阅读器以及前 NotebookLM 开发者推出的 Huxe 应用——Spotify 显然借鉴了这些产品的思路,但将其无缝集成到自己的生态中。 目前该功能可通过 GitHub 上的命令行工具(支持 Claude Code 和 Codex)体验,未来将直接整合进 Spotify 应用内。此外,Spotify 还发布了**桌面版应用 Studio by Spotify Labs**,它可以连接用户的邮箱和日历,生成个性化的日常简报。 ### 二、AI 问答:边听边问,深度互动 针对 Premium 移动端用户,Spotify 在美国、瑞典和爱尔兰率先上线了 **AI 问答功能**。用户在收听播客时,可以针对当前剧集或其中提到的概念提问,AI 会即时给出答案。同时,用户还能请求针对特定主题的播客推荐。 这一功能与 Google 本周早些时候推出的“Ask YouTube”高度相似,本质上是将大语言模型的理解能力嵌入到音频消费场景中,让被动收听变为主动探索。Spotify 透露,**视频播客的观看量同比增长了 50%**,而问答功能有望进一步提升用户参与度和留存率。 ### 三、创作者生态:变现工具与订阅制 对于播客创作者,Spotify 开放了 **创作者赞助工具**,帮助其管理品牌合作。同时新增了**订阅制功能**,允许创作者对独家内容和体验收费。Instagram、Facebook 和 Snap 等社交平台早已提供类似产品,Spotify 正在追赶这一趋势,试图构建更完整的创作者经济闭环。 ### 行业视角 从“听播客”到“做播客”,再到“问播客”,Spotify 正在用 AI 重新定义音频体验。这不仅是技术能力的展示,更是对用户粘性和内容差异化战略的深度考量。随着生成式 AI 在音频领域的渗透加速,Spotify 有望在个性化内容推荐之外,开辟出“用户即创作者”的新增长路径。

TechCrunch1个月前原文

Spotify 于周四在投资者日活动中宣布,将在其 **Spotify for Authors** 平台中集成 **ElevenLabs** 的 AI 语音技术,推出一款面向自助出版有声书的工具。该功能计划于 **今年 6 月** 以邀请制开启 Beta 测试,初期仅支持英语。值得注意的是,使用该工具生成的有声书 **不附带独家合同**,作者可自由将作品发布至其他平台。 这一举措建立在 Spotify 与 ElevenLabs 已有合作的基础上——此前作者已可通过 ElevenLabs 平台制作有声书并提交至 Spotify。Spotify 还与 Google Play Books 合作支持数字旁白内容,但 ElevenLabs 更富表现力和人性化的语音模型可能是此次升级的关键原因。有趣的是,ElevenLabs 本身已在 2025 年推出了自己的自助出版平台。 与此同时,Spotify 将 **Spotify for Authors** 平台的语言支持扩展至 **10 种新语言**,包括法语、加拿大法语、德语、荷兰语、拉丁西班牙语、瑞典语、芬兰语、冰岛语、丹麦语和挪威语。此外,公司计划今年升级 **Audiobook+** 套餐,提供更高的收听限额,并未来为学生和家庭增加新选项(具体定价和用量细节尚未公布)。 截至目前,Spotify 已拥有 **超过 100 万 Audiobook+ 订阅用户**,有声书业务年化经常性收入有望达到 **1 亿美元**。公司还推出了一项自然语言提问功能,帮助用户发现有声书。今年夏季,Spotify 将把基于提示生成播放列表的功能(当前适用于播客和音乐)扩展至有声书。 过去几年,Spotify 大幅加码有声书领域,已积累 **70 万本有声书** 目录。公司通过拓展国际市场、投资非英语作品、支持应用内购买、发布有声书排行榜,以及在美国和英国启动作者实体书销售计划等举措,使收听时长同比提升了 **60%**。超过一半的 Audiobook+ 用户来自 Spotify 的免费层级,这表明有声书正成为吸引和留存用户的有效手段。

TechCrunch1个月前原文

Spotify 近日发布了一款名为 **Studio by Spotify Labs** 的独立桌面应用,以研究预览形式在 20 多个市场上线,旨在让用户通过 AI 生成个性化播客。该应用的核心功能是允许用户基于个人数据——如日历、邮件、日程等——创建每日简报或主题播客,甚至支持多步骤指令,例如“为我规划意大利自驾游的每日音频简报,推荐沿途晚餐地点,并以播客推荐结束”。所有生成的播客均保存在用户的 Spotify 库中,可跨设备同步,但不会公开分享。 这一举措直接对标 Google 的 **NotebookLM**,后者因率先推出基于源材料的播客生成功能而走红,并随后增加了基于 Google Discover 信息流的每日播客功能。与此同时,Adobe、ElevenLabs 以及 Hero、Huxe 等应用也纷纷跟进这一格式。Spotify 的差异化在于深度整合个人上下文——应用内置的 AI 智能体可联网抓取用户邮件和日程信息,从而生成真正“私人订制”的音频内容。 值得注意的是,Spotify 此前已为开发者推出命令行工具,供 Claude Code 或 Codex 等编码工具的用户生成播客并保存到库中;而新应用则面向非技术用户,降低了使用门槛。公司强调,目前仍处于早期预览阶段,AI 可能犯错或输出不可靠内容,用户需谨慎使用。 从行业视角看,Spotify 此举是其“全音频”战略的延伸——通过将 AI 播客嵌入个人数据流,它希望在知识消费场景中占据一席之地。与 NotebookLM 偏重学术或文档驱动的模式不同,Spotify 更强调生活场景的实用性与个性化,这或许能吸引更广泛的普通用户。然而,隐私与数据安全将是关键挑战:用户是否愿意将日历、邮件等敏感信息授权给一个娱乐平台?此外,AI 生成内容的准确性与时效性也需要持续优化。 简言之,Spotify 正在将“听”的边界从音乐、播客扩展到个人知识管理,与 Google 的竞争也从流媒体延伸至 AI 生产力工具。这场争夺“耳朵经济”的新战役,才刚刚开始。

TechCrunch1个月前原文

微软宣布将逐步淘汰 SMS 短信验证方式,推动用户改用通行密钥(passkey)等更安全的认证方法。短信验证码因缺乏加密、易被拦截和 SIM 卡交换攻击而成为安全隐患。微软建议用户设置通行密钥,通过生物识别或设备 PIN 实现无密码登录,同时保留备用邮箱验证。这一举措顺应了行业向无密码认证转型的趋势,有助于提升账户安全性并简化登录流程。

ZDNet AI1个月前原文
毛利语文本转语音模型:拒绝大科技价值观,守护土著语言主权

在全球人工智能浪潮中,大型科技公司主导着语音助手、翻译工具和文本转语音(TTS)模型的发展,但它们的价值观往往与土著社区的需求相冲突。最近,新西兰怀卡托大学AI研究所联合主任、计算机科学家Te Taka Keegan领导的项目,开发了一款面向毛利语的文本转语音模型。该模型并非简单套用大科技公司的技术框架,而是从数据收集到模型训练全程由毛利社区主导,确保符合毛利文化价值观和语言特性。 ## 为什么需要土著拥有的AI模型? 主流TTS模型通常依赖海量标注数据,这些数据多来自英语等主流语言,且训练过程往往忽视少数语言的语音、语法和文化背景。对于毛利语这类濒危语言,大科技公司的模型可能产生不自然的发音、误用敬语,甚至因训练数据不足而表现糟糕。更关键的是,数据主权问题——谁拥有语音数据?谁决定模型的使用方式? Keegan团队的做法是:**从社区收集高质量的毛利语语音数据**,由母语者参与标注和验证,确保模型能准确反映毛利语的韵律、重音和方言差异。模型本身也采用开源架构,避免被单一商业公司控制,社区可以自由部署、修改和扩展。 ## 技术路径与挑战 该模型基于**端到端TTS架构**,使用Transformer和WaveNet等技术,但针对毛利语音节结构(如长元音、双元音和声门塞音)进行了优化。训练数据来自数百位毛利语母语者,涵盖不同年龄段和地区方言,以提升模型的泛化能力。与传统模型不同,团队刻意避免使用自动语音识别(ASR)生成的伪标签,因为这类数据可能引入错误,损害语言质量。 挑战在于:毛利语是低资源语言,可用的公开数据远少于英语。团队通过社区合作、口述历史录音和语言振兴计划获取数据,并设计了**数据增强策略**(如音高调整、速度变化)来扩充训练集。此外,模型需要处理毛利语中特有的**语法结构**,例如动词前缀和名词所有格标记,这些在英语TTS中并不常见。 ## 土著AI模型的全球趋势 毛利语TTS项目并非孤例。全球范围内,多个土著社区正在开发自己的AI模型: - **加拿大**:因纽特语和克里语的语音助手,由土著非营利组织主导,重点保护方言多样性。 - **澳大利亚**:原住民语言TTS项目,结合传统故事叙述和现代语音合成,用于教育场景。 - **北欧**:萨米语自然语言处理工具,强调数据主权和社区许可协议。 这些项目的共同点是:**拒绝大科技公司的“一刀切”解决方案**,转而建立社区拥有的数据基础设施和模型。它们通常采用开源许可,确保技术利益回流社区,而不是被商业公司垄断。 ## 对AI行业的意义 毛利语TTS模型挑战了AI发展的主流叙事:技术必须由硅谷巨头定义。它证明,**低资源语言模型可以做到高质量,只要社区深度参与**。这为其他濒危语言提供了可复制的路径: 1. **数据主权优先**:社区控制数据收集、存储和使用。 2. **文化适配**:模型设计必须尊重语言的文化内涵(如敬语、禁忌词汇)。 3. **开源与可持续**:避免供应商锁定,允许社区长期维护。 当然,这类项目也面临资金和人才短缺问题。Keegan团队呼吁更多政府和基金会支持土著AI研究,并建议大科技公司提供技术基础设施,但将控制权交给社区。 ## 小结 毛利语TTS模型不仅是技术成果,更是文化自决的象征。它提醒我们:AI的价值观并非中性,而是由创造者决定。当社区掌握技术主权时,AI才能真正服务于多元文化,而不是强化主流语言的霸权。

IEEE AI1个月前原文

5月19日,Anthropic在伦敦举办了为期两天的开发者活动“Code with Claude”,恰逢Google I/O大会同期举行。Anthropic员工强调这只是巧合,并非刻意竞争。活动现场,工程师Jeremy Hadfield询问在场开发者:“过去一周内,谁提交了完全由Claude编写的拉取请求?”近半数人举手。当被问及“谁提交了完全由Claude编写且自己未阅读代码的拉取请求?”时,多数手仍举着,伴随紧张的笑声。 这并非新闻——LLM驱动的工具如Anthropic的Claude Code和OpenAI的Codex已彻底改变软件开发方式。顶级科技公司如今乐于宣称开发者手写代码的比例极低。Hadfield表示:“Anthropic的大部分软件现在由Claude编写,Claude Code中的大部分代码也是Claude自己写的。”OpenAI、Google和Microsoft也有类似说法。 令人瞩目的是,这种新范式已变得如此平常,且普及速度惊人。这是Anthropic第二次举办开发者活动,同时也在旧金山和东京举行。去年此时,公司刚发布Claude 4,其编码能力有限。但随着Claude 4.6和4.7(分别于2月和4月发布)的推出,Claude Code已成为越来越多开发者愿意托付工作的工具。 Anthropic的目标是将自动化推向极致——不是让AI生成代码再由人类修正,而是让Claude自行检查和修正。Claude Code负责人Boris Cherny在主题演讲中表示:“默认不再是‘我要提示Claude’,而是‘我要让Claude自我提示’。”理想情况下,开发者甚至不应看到错误信息,一切将由Claude处理、测试和调整,直到代码正常运行。 这一转变对开发者角色影响深远。Anthropic强调,AI并非取代开发者,而是让他们专注于更高层次的设计与决策。然而,现场多数开发者承认未阅读AI生成的代码,引发对代码质量与安全性的担忧。活动展示了编程的未来——人机协作的新模式,但伴随责任与信任的挑战。

MIT Tech1个月前原文

随着阵亡将士纪念日临近,各大品牌纷纷推出笔记本电脑优惠活动。本文整理了当前最值得关注的笔记本折扣,涵盖苹果、戴尔、联想等主流品牌,包括 MacBook Air M5、MacBook Pro M5、华硕 Vivobook 14、戴尔 Plus 16 和 HP EliteBook 6 G1a 等型号,最高可节省 600 美元。这些优惠来自亚马逊、百思买等可靠零售商,适合有升级或购机需求的消费者。

ZDNet AI1个月前原文

阵亡将士纪念日即将到来,沃尔玛已经提前对热门科技产品进行了大幅降价。以下是目前最值得关注的几款优惠: - **沃尔玛+会员**:首月仅需1美元(节省12美元) - **三星Odyssey Neo G7 43英寸Mini LED 4K游戏显示器**:售价499美元(节省400美元) - **Ninja Professional Plus搅拌机**:售价79美元(节省16美元) - **TCL 55英寸QM7K Mini LED QLED 4K电视**:售价648美元(节省302美元) 这些优惠涵盖了从家庭娱乐到厨房电器的多种品类,折扣力度相当可观。例如,三星Odyssey Neo G7显示器降价幅度高达44%,而TCL电视也直降302美元。沃尔玛+会员的折扣则让用户能以极低成本体验会员服务。 需要注意的是,这些价格可能随时变动,建议有需求的消费者尽早下单。ZDNET将持续关注更多促销动态,为读者提供最新信息。

ZDNet AI1个月前原文
开源软件开始帮助机器人“思考”

在人工智能领域,开源运动正从语言模型向机器人领域蔓延。一个关键信号是,Hugging Face 社区平台 LeRobot 如今已托管超过 **58,000 个数据集**,这些数据集专门用于训练机器人 AI 模型。 ## 从语言到动作:开源社区的跨界 长期以来,机器人 AI 的开发高度依赖闭源系统和企业级资源。但 LeRobot 的快速增长表明,开源社区正在填补这一空白。该平台不仅提供数据集,还包含预训练模型和仿真工具,让研究人员和爱好者能够更轻松地构建机器人智能。 ## 为什么是现在? 三个因素推动了这一趋势: - **数据民主化**:高质量机器人数据集曾经稀缺且昂贵,现在通过社区贡献大量积累。 - **模型复用**:像 Hugging Face 这样的平台允许开发者微调现有模型,而不是从零开始。 - **协作加速**:开源社区通过共享代码和最佳实践,降低了入门门槛。 ## 这意味着什么? 对于行业而言,开源机器人 AI 可能带来类似大语言模型领域的变革——更快的创新周期、更低的成本以及更广泛的应用场景。例如,小型团队现在可以基于 LeRobot 数据集训练机械臂完成精细操作,而无需昂贵的实验室环境。 ## 挑战与展望 尽管前景乐观,机器人 AI 开源仍面临挑战:物理世界的复杂性导致仿真与现实差距(sim-to-real gap),且安全性验证比纯软件更困难。但 LeRobot 的数据规模仍在增长,社区活跃度持续上升,这预示着开源机器人 AI 正在从实验走向实用。

IEEE AI1个月前原文

经过一个月的庭审,马斯克诉奥特曼案终于尘埃落定。结果出乎意料却又在情理之中:陪审团认定马斯克提起诉讼时已超过诉讼时效,案件被直接驳回。The Verge 资深记者 Liz Lopatto 全程旁听了这场被形容为“动物园”般的审判,她描述了法庭外每日不断的抗议活动,以及两位AI界巨头之间充满个人恩怨的激烈交锋。 ## 诉讼时效成为关键 案件的转折点出现在诉讼时效问题上。Liz 解释道,马斯克声称 OpenAI 从非营利组织向营利实体转型损害了他的利益,但陪审团认为这一主张提出得太晚。根据相关法律,诉讼必须在发现损害后的特定时间内提起,而马斯克的起诉时间已经超出了这一期限。 这一裁决意味着法庭并未深入审理OpenAI转型是否合规、马斯克是否真的遭受损失等实质性问题。从法律角度看,案件在程序层面就被终结了。 ## 一场个人恩怨的公开对决 尽管案件名义上涉及 OpenAI 的治理结构转型和马斯克的经济损失,但 Liz 指出,整个诉讼更像是一场个人恩怨的宣泄。马斯克显然对奥特曼和 OpenAI 的成功感到不满——尤其是这家他当初参与创立的公司如今在他离开后价值飙升。 庭审期间,双方证人的证词充满了相互指责和矛盾。马斯克指责奥特曼背叛了OpenAI最初的非营利使命,而奥特曼则反击称马斯克只是因未能掌控公司而心生嫉妒。整个法庭充斥着不可靠的证人和混乱的叙述,以至于 Liz 问道:“在一群不可信、不可靠的人互相争斗的房间里,还有人剩下什么声誉可以失去吗?” ## 对AI行业的影响 此案的草草收场对AI行业而言,或许是一种解脱。如果法庭深入审理,可能会对OpenAI的转型产生重大影响,甚至为其他AI公司的治理结构树立先例。然而,诉讼时效的裁决避免了这一结果。 尽管如此,这场审判仍然暴露了AI行业核心人物之间深刻的分歧和紧张关系。马斯克和奥特曼作为AI领域的两个标志性人物,他们的公开冲突反映了关于AI发展方向的根本性争论:是追求开放和非营利性,还是拥抱商业化和营利性? Liz 的报道还提到,法庭外的抗议活动多种多样,从支持AI安全到反对技术垄断,各种声音交织在一起。这反映出AI技术已经不再仅仅是技术问题,而是深刻影响社会的公共议题。 ## 结语 马斯克诉奥特曼案以一场“雷声大雨点小”的方式结束。它没有产生具有约束力的法律先例,也没有彻底解决OpenAI的治理争议。但它提醒我们,在AI这个高速发展的领域,个人恩怨和商业竞争往往与重大技术决策纠缠在一起。正如 Liz 所说,这场审判最终可能只是“小题大做”。

The Verge1个月前原文

AI 初创公司 Hark 宣布完成 7 亿美元 A 轮融资,投后估值达 60 亿美元。这家由机器人领域连续创业者 Brett Adcock 创立的公司,正致力于打造一个“通用”AI 个人助理系统,涵盖模型与硬件。本轮融资由 Parkway Venture Capital 领投,AMD Ventures、ARK Invest、Intel Capital 等多家机构跟投。Hark 计划于今年夏天发布首批多模态模型,随后推出专用硬件设备。 ## 巨额融资背后的神秘野心 Hark 的创始人 Brett Adcock 此前曾创立机器人公司 Figure.AI 和电动飞行器公司 Archer。他于 2025 年底自掏腰包 1 亿美元启动 Hark,目标是开发一个能作为“数字世界通用界面”的代理型 AI 系统。尽管公司对具体产品细节守口如瓶,但巨额融资和豪华投资者阵容已引发行业高度关注。 Hark 目前拥有 70 名员工,并运营着一个配备 Nvidia B200 GPU 的数据中心。新资金将用于招募硬件、产品设计和 AI 研究领域的顶尖人才,以及获取算力和组件。值得注意的是,前苹果产品高管 Abidur Chowdhury 担任设计总监,他透露投资者对其团队的演示印象深刻,但拒绝透露更多细节。 ## 差异化定位:面向普通用户的 AI 界面 Chowdhury 指出,当前 AI 产品多聚焦于帮助开发者编写代码,例如 Anthropic 和 OpenAI 的优先方向,但真正为普通用户设计的 AI 界面和原生硬件却很少。Hark 的目标正是填补这一空白。他称:“我还没看到真正能帮助普通人的产品……人们都在构建帮助程序员的东西,这确实有效且影响深远,但我们还没看到针对普通人的类似突破。” ## 挑战与未知 尽管愿景宏大,Hark 仍面临诸多挑战。首先是提供用户上下文以构建个性化体验的难题,其次是硬件开发的复杂性和高成本。此外,在 OpenAI、Google 等巨头环伺的 AI 消费市场,Hark 能否凭借“通用界面”概念突围仍是未知数。不过,Chowdhury 表示:“凭借这个专注点、优秀的团队和本轮融资,我们相信能在这个领域做出真正特别的东西。” ## 小结 Hark 的 7 亿美元 A 轮融资再次印证了 AI 领域的资本狂热,但其神秘的产品路线和尚未公开的 demo 也让市场充满疑问。如果 Hark 能成功打造出面向普通用户的通用 AI 界面,它可能成为 AI 消费级应用的转折点;否则,巨额融资也可能只是昙花一现。行业将密切关注其今年夏季的多模态模型发布。

TechCrunch1个月前原文

一款名为 **The Path** 的新AI心理治疗应用近日获得1430万美元种子轮融资,由Prime Movers Lab领投,知名励志作家托尼·罗宾斯(Tony Robbins)作为联合创始人加入。该应用声称其AI模型在心理健康安全基准测试Vera-MH中获得了95分,远超消费者聊天机器人最高65分的成绩。 The Path的诞生源于其前身——男性心理健康应用Mental中的一个功能:AI互动音频。用户对这一功能的强烈反响让创始人意识到,AI在心理治疗领域具有巨大潜力。联合创始人兼CEO安森·惠特默(Anson Whitmer)曾任职于冥想应用Calm,他的个人经历也驱动着这一事业:19岁时,一位挚爱的叔叔自杀身亡;大学期间,一位表兄在遗言中留下求助电话,却为时已晚。这些悲剧促使他攻读心理学博士学位,并最终投身于将科学成果普及大众的工作。 惠特默认为,传统心理治疗和辅导无法覆盖所有人——世界上没有足够的治疗师。而大语言模型(LLM)和AI技术有望弥合这一鸿沟,为每个人提供个性化的心理支持。托尼·罗宾斯的加入进一步强化了The Path的定位:一款结合治疗与教练功能的App,并融入罗宾斯广受欢迎的自我提升方法。 在安全方面,The Path强调其模型在Vera-MH基准测试中表现优异。Vera-MH是专门评估AI心理健康应用安全性的测试,涵盖危机响应、有害内容过滤等指标。相比之下,通用型消费者聊天机器人在该测试中得分较低,凸显了专业领域AI安全的重要性。 The Path的投资者阵容还包括速滑选手阿波罗·奥诺(Apolo Anton Ohno)、拳击手德昂泰·维尔德(Deontay Wilder)等。目前,该应用尚未正式上线,但已引发行业关注。在AI心理治疗领域,安全性与有效性始终是核心挑战,The Path试图通过专业数据训练和专家参与来建立信任。 随着AI在心理健康领域的渗透加速,如何在提供便利的同时确保用户安全,将成为所有从业者必须回答的问题。The Path的尝试或许会为行业树立新的标杆。

TechCrunch1个月前原文

在最近的Google I/O开发者大会上,谷歌展示了多项AI代理产品,意图构建一个围绕AI代理的生态系统。然而,这些产品数量繁多、定位模糊,可能让普通消费者感到困惑。本文梳理了谷歌推出的主要AI代理功能,包括信息代理、Spark、Android Halo和Daily Brief等,并分析了其背后的战略意图与潜在挑战。

TechCrunch1个月前原文

随着全球铝价因中东局势上涨约20%,美国回收初创公司正借助人工智能技术提升关键矿物(尤其是铝)的回收率,试图从废料中挖掘巨大价值。 ## 铝价上涨背后的机遇 自2月底特朗普政府针对伊朗的冲突升级以来,铝价已飙升至数十年高位。全球约10%的铝产自海湾地区,地缘政治动荡直接推高了金属价格。美国早已将铝列为关键矿物,但国内需求大量依赖进口,而本土生产的铝大部分来自回收。对于回收行业初创公司而言,这无疑是黄金时代。 ## AI如何改变废品分拣 **Amp Robotics** 是一家专注于垃圾分拣的初创公司,其CTO Matanya Horowitz向TechCrunch透露:“铝可能只占垃圾流量的1%,但每吨售价常超过1000美元,实际上是最有价值的单品之一。”Amp利用AI驱动的分拣系统,通过可见光和红外摄像头识别包装纸、铝箔等各类材料,并借助机械臂和气嘴将铝从塑料中精确分离。该公司声称其系统对特定材料(包括铝)的回收准确率超过90%。 **Sortera** 则更专注于金属回收。这家总部位于印第安纳州的初创公司最近在田纳西州开设了第二家工厂,处理能力翻倍至2.4亿磅,其中90%至100%为铝。该产量相当于美国去年消耗的430万公吨中相当可观的一部分。Sortera采用激光、摄像头和X射线荧光等多种传感器,将数据输入AI算法,对薯片大小的铝废料进行分类,识别具体牌号。通过高精度分离,每磅铝能获得更高利润。 ## 未被充分利用的“城市矿山” 美国环保署数据显示,尽管铝是回收率最高的材料之一,但全国仅约20%的铝被回收。Horowitz指出:“在大都市区,即使有成功的回收项目,一半的铝仍直接进入垃圾填埋场,根本未进入回收系统。”这意味着巨大的资源浪费——同时也是初创公司的商业机会。 ## 行业影响与展望 随着AI技术不断成熟,回收初创公司有望大幅提升回收率,减少对进口原铝的依赖。Amp和Sortera等企业的成功实践表明,AI不仅能提高分拣精度,还能通过优化材料等级实现更高经济收益。对于金属行业而言,这类“城市矿山”正成为越来越重要的供应来源。

TechCrunch1个月前原文

本月早些时候,SpaceX 与 Anthropic 宣布了一项新的计算合作伙伴关系,允许 Anthropic 使用 SpaceX 位于田纳西州孟菲斯的 Colossus 数据中心。随着 SpaceX 首次公开募股文件的披露,这笔交易的更多细节浮出水面,包括 Anthropic 向马斯克公司支付的惊人费用。 ### 巨额合同细节曝光 根据 SpaceX 提交的 S-1 文件,Anthropic 同意 **每月支付 12.5 亿美元**,直至 2029 年 5 月,以获得 SpaceX 的 Colossus I 和 Colossus II AI 训练中心的使用权。这意味着 **每年 150 亿美元** 的支出,几乎相当于 SpaceX 2025 年全年 187 亿美元收入的两倍。合同包含一项条款,允许任何一方在 **90 天内** 终止协议,且 Anthropic 的费用在 5 月和 6 月的容量提升期间会有所减免。 ### 行业背景与竞争格局 这一退出条款反映了 AI 行业快速变化的特性。值得注意的是,Anthropic 的 Claude 模型与马斯克旗下 xAI 的 Grok 存在直接竞争关系。这笔交易凸显了 AI 公司对算力的极度渴求——尤其是在全美数据中心建设遭遇地方反对的背景下。马斯克在 X 上表示,SpaceX 愿意为其他 AI 公司提供类似服务,称其“正在大规模提供 AI 计算即服务”。 ### SpaceX 的 AI 转型 自今年早些时候 SpaceX 与马斯克的 xAI 合并后,该公司在 AI 领域投入巨大。文件显示,SpaceX 2025 年 AI 资本支出达 **127 亿美元**,占总资本支出的 61%;2026 年第一季度 AI 支出为 77 亿美元,而太空部门仅 10 亿美元。然而,其 AI 部门在 2025 年亏损了 63 亿美元。 ### 算力军备竞赛的缩影 这笔交易是 AI 行业算力军备竞赛的最新例证。随着大模型训练需求激增,头部公司不惜重金锁定计算资源。对于 Anthropic 而言,每年 150 亿美元的投入虽然高昂,但可能是维持竞争力的必要代价。而对 SpaceX,这不仅是收入来源,更是其从航天公司向 AI 基础设施提供商转型的关键一步。

The Verge1个月前原文