SheepNav

AI 资讯

每日聚合最新人工智能动态

2017年8月底,OpenAI(当时还是一个小型非营利研究实验室)的关键人物聚在一起,讨论如何创建一家营利性实体来商业化其技术,并为实现AGI筹集所需资金。据OpenAI总裁Greg Brockman在证词中透露,**Elon Musk**当时要求对公司拥有完全控制权,而就在此前不久,他刚刚给每位联合创始人送了一辆**特斯拉Model 3**。Brockman认为,这是马斯克在争取支持时的一种“糖衣炮弹”策略。 会议开始时,OpenAI研究主管**Ilya Sutskever**还特意委托制作了一幅特斯拉画作作为友好礼物赠予马斯克。但气氛很快急转直下:当马斯克得知其他人不会同意他控制公司的要求时,他变得愤怒和沮丧。据Brockman描述,马斯克静坐沉思了几分钟后,突然说:“我拒绝。”随后他站起来,在桌旁暴怒踱步——Brockman甚至担心他会动手打人。马斯克抓起画作,冲出门外,又转身质问:“你们什么时候离开OpenAI?” Brockman和Sutskever最终没有离开,也没有屈从于马斯克的愿景。马斯克随即停止了对OpenAI运营预算的定期捐赠,并在六个月内离开了董事会,不过他仍然为OpenAI与Neuralink共享的办公室支付租金直至2020年。 随着如今围绕OpenAI未来的法律斗争展开,2017年的这段关键分歧时期成为焦点。当时,联合创始人们就谁将掌控公司未来产生严重分歧,最终导致了马斯克对联合创始人的诉讼。虽然Sam Altman尚未发声,但Brockman提供了为期两天的证词,并多次引用个人日记,罕见地揭示了一位30岁科技高管与Elon Musk进行激烈博弈的幕后细节。

TechCrunch28天前原文
研究警告:用AI仅10分钟,可能让你变懒变笨

一项最新研究发现,即使只使用AI聊天机器人10分钟,也可能对人们的思考和解决问题的能力产生令人震惊的负面影响。来自卡内基梅隆大学、麻省理工学院、牛津大学和加州大学洛杉矶分校的研究人员设计了三项实验,每项涉及数百人。参与者通过在线平台完成包括简单分数计算和阅读理解在内的任务,并获得报酬。部分参与者被允许使用能自主解决问题的AI助手。当AI助手被突然移除后,这些参与者放弃解决问题或答错的可能性显著更高。研究指出,AI的广泛使用可能以牺牲基础问题解决技能的培养为代价来提升短期生产力。 麻省理工学院助理教授、研究参与者米希尔·巴克表示:“结论不是我们应该在教育或工作中禁止AI。AI显然能帮助人们当下表现得更好,这很有价值。但我们应该更谨慎地考虑AI提供何种帮助以及何时提供。”巴克此前在谷歌DeepMind工作,他提到一篇关于AI可能长期削弱人类能力的著名文章启发了他。该文章认为这种削弱是不可避免的,但也许让AI帮助人们发展自身心智能力应成为模型与人类价值观对齐的一部分。 “这本质上是一个认知问题——关于坚持、学习以及人们如何应对困难,”巴克说,“我们希望将关于长期人机交互的更广泛担忧带入受控实验环境。”研究结果尤其令人担忧,因为一个人坚持解决问题的意愿对获取新技能至关重要,也预测了他们长期学习的能力。巴克表示,可能需要重新思考AI工具的工作方式,让模型像优秀的人类教师一样,有时优先考虑人的学习而非直接替他们解决问题。那些直接给出答案的系统,可能正在悄悄损害我们的思维能力。

WIRED AI28天前原文

在持续进行的 **Musk v. Altman** 庭审中,OpenAI 前首席技术官 **Mira Murati** 通过视频作证,指控 CEO **Sam Altman** 在 AI 模型安全标准问题上对她撒谎。 Murati 在证词中表示,Altman 曾声称 OpenAI 法务部门认定某个新 AI 模型无需经过公司部署安全委员会的审查,但她随后与总法律顾问 **Jason Kwon** 核实后发现事实并非如此。“Altman 先生当时说的是实话吗?”面对这一问题,Murati 明确回答:“不是。” 这并非 Altman 首次被控不诚实。联合创始人 **Ilya Sutskever** 曾在提交给董事会的备忘录中写道,Altman “习惯性撒谎、削弱高管权威、挑拨高管关系”。前董事会成员 **Helen Toner** 在 2024 年的播客中也提到,董事会曾收到 Altman “在不同场合撒谎和操纵” 的证据。 Murati 进一步描述了 Altman 的“管理问题”:她表示自己“在一个极其复杂的组织中承担着艰巨的工作”,而 Altman 未能提供清晰的领导,反而“削弱了我的工作能力”。为了确保安全,Murati 最终绕开 Altman,直接让该模型通过了安全委员会审查。 此案由 **Elon Musk** 于 2024 年提起,指控 OpenAI 背离其非营利使命,转向以营利为目标。庭审中曝光的内部矛盾,尤其是高层之间的信任危机,可能对 OpenAI 的治理结构和公众形象产生深远影响。

The Verge28天前原文

Chrome 用户最近可能发现电脑被悄悄下载了一个 4GB 的文件,名为 `weights.bin`。该文件是谷歌用于其 **Gemini Nano** 本地大语言模型(LLM)的一部分,旨在提升 AI 响应速度并保护隐私。虽然文件无害,但因其体积庞大且下载过程不透明,引发了用户对存储空间和知情权的担忧。本文解析文件来源、作用,并教你如何管理它。

ZDNet AI28天前原文

据最新提案披露,SpaceX 正考虑在得克萨斯州格莱姆斯县投资建设一座名为“Terafab”的半导体制造与先进计算设施,初期投入可能高达 **550 亿美元**,项目总预算预计达到 **1190 亿美元**。这一“多阶段、下一代、垂直整合”的晶圆厂,将同时整合特斯拉与芯片巨头英特尔的力量,为 AI 服务器、卫星、太空数据中心、自动驾驶汽车及机器人等场景生产芯片。 ## 为何要建 Terafab? 埃隆·马斯克在内部解释中直言:“要么我们建 Terafab,要么我们就没有芯片。我们需要芯片,所以我们必须建。” 这一表态折射出他对当前芯片供应瓶颈的焦虑。马斯克认为,现有半导体厂商的产能远不能满足其旗下公司(xAI、SpaceX、特斯拉)在 AI 与机器人领域的需求。Terafab 的目标是未来每年生产足够支撑 **1 兆瓦(terawatt)** 功率的芯片,这个数字远超任何现有晶圆厂的规划。 ## 多方协同与战略意图 提案显示,Terafab 并非 SpaceX 的独角戏。特斯拉将贡献资源,英特尔则作为芯片制造合作伙伴加入,共同开发针对 AI 服务器、卫星通信、太空数据中心以及特斯拉自动驾驶和机器人平台的专用芯片。这种跨界合作背后,是马斯克对“计算即基础设施”的深度布局。 值得注意的是,xAI 与 SpaceX 已在今年完成合并,合并后实体估值高达 **1.25 万亿美元**,并计划于 6 月上市。Terafab 项目正是这一超级实体在硬件层面的关键落子——确保 xAI 的 Grok 系列模型拥有足够的算力进行训练和推理,同时支撑马斯克提出的“太空数据中心”构想,后者被其视为 AI 计算需求爆发的下一个增长点。 ## 选址尚存变数 尽管格莱姆斯县的提案已公开,但马斯克在周二的一条推文中表示,该地点只是“几个候选地之一”。德州在税收优惠、土地成本和能源供应方面具有传统优势,但项目规模庞大,涉及环境评估、水电配套及地方政府审批,最终选址仍需数月才能确定。 ## 行业影响 若 Terafab 按计划推进,它将成为全球投资规模最大的半导体制造项目之一,甚至超过台积电和三星在美建厂的总和。这不仅会重塑 AI 芯片供应链格局,也可能加剧全球对先进制程产能的争夺。对于英特尔而言,参与 Terafab 意味着其代工业务获得了一个极具分量的客户,有助于提升其在 AI 时代的竞争力。 不过,1190 亿美元的投资额在半导体史上尚无先例,项目能否获得足够融资、技术路线是否可行、以及市场对 AI 芯片的需求是否真如马斯克预期的那么旺盛,都将是决定 Terafab 成败的关键变量。

TechCrunch28天前原文

中国AI实验室DeepSeek正洽谈首轮风险投资,据英国《金融时报》和彭博社报道,短短几周内其潜在估值已从200亿美元飙升至450亿美元。这家实验室于2025年初因推出大语言模型而声名鹊起,该模型仅用美国OpenAI和Anthropic等模型训练所需算力的一小部分和成本的一小部分便完成训练。此后,它在推理和编程等领域与全球顶级模型保持了合理竞争水平,并坚持开源权重(版本可在Hugging Face上免费获取)。 DeepSeek由对冲基金亿万富翁梁文峰创立,他控制着公司近90%的股份。据《金融时报》报道,该公司此前从未寻求外部投资者。然而,面对竞争对手挖角DeepSeek研究人员的局面,梁文峰决定融资,以便向员工发放公司股份。消息人士称,本轮融资据彭博社报道,由国家投资工具**中国集成电路产业投资基金**(俗称“大基金”)领投。中国正大力资助本土AI技术发展,以规避获取美国技术(尤其是芯片)的难题。DeepSeek已针对中国硬件巨头华为的芯片进行了优化,这一组合被认为是中国发展可与美国匹敌的AI的强大双翼。此外,中国云巨头腾讯和阿里巴巴据称也在洽谈参与本轮投资。 ### 行业背景与意义 DeepSeek的崛起标志着中国AI产业在算力受限条件下的另类突破。其高效训练方法挑战了“大力出奇迹”的行业共识,证明通过算法创新同样能实现顶尖性能。此轮融资若落地,不仅将巩固DeepSeek的人才队伍,更将加速中国自主AI生态的构建,尤其是与华为芯片的深度绑定,有望形成软硬一体的国产替代方案。对全球AI竞争格局而言,这意味着一股不可忽视的新势力正在崛起,可能重塑中美科技博弈的版图。

TechCrunch28天前原文
Google DeepMind 入股《EVE Online》开发商,联手打造 AI 测试沙盒

Google DeepMind 宣布入股《EVE Online》开发商 CCP Games(现已独立并更名为 Fenris Creations),双方将合作利用这款大型多人在线游戏作为 AI 模型的测试环境。此次合作标志着科技巨头与游戏开发商在人工智能研究领域的又一次深度跨界联动。 ## 合作细节与目的 根据协议,Google DeepMind 将获得 Fenris Creations 的少数股权,并利用《EVE Online》独特的玩家驱动生态系统来研究“复杂、动态系统中的智能行为”。具体而言,DeepMind 会在一个本地运行的离线版本游戏中进行受控实验,测试 AI 模型的**长时程规划、记忆能力与持续学习**能力,而不会影响在线玩家的正常体验。双方还表示将“探索由这些技术驱动的新游戏体验”。 ## 为什么选择《EVE Online》? 《EVE Online》以其庞大的沙盒宇宙、复杂的玩家经济体系和长期战略博弈而闻名。Fenris 首席执行官 Hilmar Veigar Pétursson 在一封致玩家的公开信中强调:“EVE 是少数几个已经像活生生的世界一样运行的环境之一,可以在此探索关于智能的问题。” Google DeepMind 总监 Alexandre Moufarek 则称其为“测试通用人工智能的安全沙盒”,并表示该游戏在模拟真实世界的复杂性方面“无与伦比”。 ## 游戏作为 AI 试验场的传统 Google DeepMind 在利用游戏训练 AI 方面有着悠久历史:从围棋(AlphaGo)到雅达利游戏,再到《星际争霸》,游戏一直被视为检验模型能力的理想环境。近年来,DeepMind 更进一步,开始使用“虚拟世界”模型帮助 AI 学习在物理现实中运作。此次与《EVE Online》的合作,延续了将复杂游戏作为 AI 研究前沿阵地的思路。 ## Fenris Creations 的独立之路 与此同时,CCP Games 的管理层花费 **1.2 亿美元** 从韩国发行商 Pearl Abyss 手中买回公司所有权,实现独立运营,并更名为 Fenris Creations。公司表示不会进行重组或裁员,业务照常进行。这一财务动作与 DeepMind 的投资几乎同步宣布,显示双方对未来合作的信心。 ## 行业意义与展望 此次合作不仅为 AI 研究提供了更贴近真实复杂性的测试场,也为游戏行业带来了新想象:AI 模型可能在游戏中扮演更智能的 NPC、更精准的经济调控者,甚至成为玩家的“对手”或“队友”。而对于 DeepMind 而言,《EVE Online》的长期博弈特性将考验 AI 在不确定环境下的决策能力,这可能为自动驾驶、金融交易等现实场景提供借鉴。

Ars Technica28天前原文
求求AI公司,别再用人脑过程给功能命名了

Anthropic 在其开发者大会上宣布了一项名为“做梦”(Dreaming)的新功能,作为其 AI 代理基础设施的一部分。该功能旨在让 AI 代理在任务间隙“梳理”其活动日志,从中提取模式并优化性能。这一命名立刻让人联想到菲利普·K·迪克的经典科幻小说《仿生人会梦见电子羊吗?》,但现实中的 AI 远未达到书中的水平。自 2022 年聊天机器人革命以来,AI 公司热衷于用“推理”“思考”“记忆”等人脑认知过程来命名功能,这种营销策略模糊了人与机器的界限。本文呼吁业界停止这种命名方式,认为它误导公众对 AI 能力的认知,并可能引发不必要的伦理担忧。

WIRED AI28天前原文
Anthropic 的 Claude 托管代理现在可以“做梦”了

在 Code with Claude 开发者大会上,Anthropic 为 Claude Managed Agents 引入了一项名为“做梦”(dreaming)的新功能。该功能通过定期回顾过往会话和记忆存储,识别值得保留的重要模式并存入长期记忆,从而帮助多个代理在长时间项目中保持信息连贯。目前“做梦”处于研究预览阶段,仅限 Claude 平台上的托管代理使用。此外,Anthropic 还宣布将 Pro 和 Max 用户的 Claude Code 使用时长限制从 5 小时翻倍,并开放了 outcomes 和 multi-agent orchestration 两项预览功能。

Ars Technica28天前原文

Anthropic 为其 Claude 智能体推出了一项名为“做梦”(dreaming)的新功能,允许智能体通过回顾过去的交互来自我改进和优化记忆。该功能基于现有记忆能力,让智能体在空闲时自动分析会话模式,识别常见错误、工作流偏好,并重组记忆以保持高信息密度,特别适用于长期运行和多智能体协作场景。用户可选择自动更新或手动审批记忆更改。此外,Anthropic 还扩展了 outcomes 和 multi-agent orchestration 功能,以提升任务执行准确性和智能体间协作效率。这一更新再次体现了 Anthropic 将产品拟人化的策略,从功能命名到产品理念,持续赋予 AI 人性化特质。

ZDNet AI28天前原文

面试前总是紧张?AI 可以成为你的得力助手。从公司调研到模拟练习,AI 能帮你准备得更充分。但别忘了,面试仍是“人的过程”,AI 只是工具,最终还需结合人类反馈。以下是三个实用的 AI 面试准备方法。 ## 1. 用 AI 深度调研公司与面试官 面试前,你需要了解公司背景、市场地位、企业文化、近期动态,甚至面试官的个人信息。过去这可能需要数小时,但现在 AI 可以快速整理。职业教练 Cord Harper 指出:“通过合适的提示词,AI 能提供很好的背景知识。”不过,务必核实 AI 输出的准确性,避免被“幻觉”误导。你可以要求 AI 提供信息来源,并点击链接验证。 ## 2. 模拟面试与答案演练 AI 聊天机器人可以扮演面试官,根据岗位要求提问。你还可以要求 AI 针对你的回答给出改进建议,比如调整语气、补充细节或突出成果。这有助于你发现盲点,但不要完全依赖 AI,最终需结合真人反馈来打磨表现。 ## 3. 优化自我介绍与行为问题 很多面试会问“请介绍一下你自己”或“谈谈你的一次失败经历”。AI 可以帮助你梳理逻辑,用 STAR 法则(情境、任务、行动、结果)组织答案。你可以先写草稿,让 AI 优化语言,但务必保留个人真实经历和情感,避免模板化。 > **小结**:AI 是强大的面试准备工具,但它无法替代人与人之间的化学反应。保持真诚,将 AI 的客观分析与自身故事结合,才能在面试中脱颖而出。

ZDNet AI28天前原文

谷歌正在对其AI搜索体验进行重大更新,核心变化包括在AI摘要中引入来自Reddit等网络论坛的讨论内容,并为链接添加更多上下文信息。这一设计旨在帮助用户获取更小众、更主观问题的答案,但同时也带来了信息混乱的风险。 自两年前谷歌将AI概览(AI Overview)引入搜索以来,该功能一直备受争议。用户曾发现AI概览会引用讽刺性内容(如建议每天吃一小块石头)或不可靠来源(如建议在披萨上涂胶水)。尽管谷歌不断改进,但AI概览仍存在幻觉问题。《纽约时报》分析显示,其准确率约为90%,但考虑到谷歌每年处理数万亿次搜索,这意味着每分钟仍有数十万次搜索返回不准确结果。 此次更新中,谷歌明确表示将优先展示来自公开在线讨论、社交媒体及其他一手来源的“观点预览”。例如,对于“如何修理漏水水龙头”这类问题,AI摘要可能会直接呈现Reddit论坛中高赞用户的经验分享,并附上用户名、社区名称等背景信息,帮助用户判断可信度。 然而,这一做法也引发了新的疑问:AI概览的核心功能究竟是直接回答问题,还是充当信息导航?如果只是汇总多方观点,它和传统搜索的差别何在?有分析指出,谷歌正在模糊答案与信息来源的界限,这可能导致用户对AI搜索的信任度进一步下降。 行业观察人士认为,谷歌此举反映出AI搜索面临的深层困境:既要提供即时答案,又要避免因过度依赖大语言模型而导致的错误。引入论坛内容虽能丰富信息维度,但也可能放大社区中的错误或偏见。未来,谷歌需要在答案准确性与信息多样性之间找到更精准的平衡点。

TechCrunch28天前原文
网络罪犯也开始抱怨AI垃圾内容泛滥论坛

## 黑客也烦AI“垃圾内容” 爱丁堡大学安全研究员Ben Collier指出,网络罪犯也在抱怨AI生成的“垃圾内容”(AI slop)污染他们的论坛。一项由剑桥大学、斯特拉斯克莱德大学等机构进行的研究分析了2022年ChatGPT发布至2023年底的97,895条AI相关对话,发现地下网络犯罪论坛上对AI的负面情绪正在上升。 ### 论坛生态受冲击 研究显示,论坛用户抱怨有人用AI生成“要点式解释”基础安全概念,导致低质量帖子泛滥。此外,用户还担心谷歌AI搜索概览减少论坛访问量。这些论坛(多源于俄罗斯)曾是诈骗者交易数据、发布黑客任务、互相吐槽的社区,用户通过可靠行为积累声誉,甚至举办写作比赛。AI的介入破坏了这种社交动态:新手试图用AI生成内容快速提升声誉,引发老用户反感。 ### 从乐观到怀疑 在生成式AI热潮初期,黑客对AI辅助攻击持乐观态度,但如今转向怀疑。研究人员发现,论坛上出现大量抱怨“AI垃圾”的帖子,例如“没人要求你加入AI功能——我们只希望你改进网站、停止对新功能收费”。这与普通用户对AI入侵应用的抱怨如出一辙。 ### 讽刺与启示 网络罪犯对AI“垃圾内容”的抵制,恰恰反映了AI对在线社区质量的影响不分正邪。尽管这些论坛从事非法活动,但内部仍存在对内容质量和社区规范的坚持。这一现象也提醒平台管理者:AI生成内容若不加管控,会破坏任何社区的信任基础。

WIRED AI28天前原文

近日,由知名风投Khosla Ventures支持的机器人初创公司**Genesis AI**展示了其从基础模型到实体硬件的全栈能力。该公司此前以 **1.05亿美元** 的种子轮融资引发行业关注,如今首次公开了其核心模型 **GENE-26.5** 以及一套机械手的复杂操作演示。 ## 从模型到硬件:全栈布局 Genesis AI 的定位是构建机器人领域的“基础模型”,类似于大语言模型在AI领域的角色。GENE-26.5 被设计为能够理解物理世界并生成机器人动作指令的通用模型。而本次演示中,一组机械手完成了包括抓取、旋转、精细操作等复杂任务,展示了模型与硬件的协同能力。 这一策略与当前多数机器人公司不同——许多企业专注于单一环节(如软件或硬件),但 Genesis AI 选择从模型到执行器全面自研。分析认为,这种全栈方式有助于减少系统集成中的延迟与误差,但也对研发资源提出了极高要求。 ## 行业背景:机器人基础模型竞赛升温 Genesis AI 的进展出现在机器人AI领域竞争加剧的背景下。特斯拉、Figure AI、1X 等公司均推出了各自的人形机器人,而英伟达、谷歌等科技巨头也在研发通用机器人模型。**基础模型**被视为解锁机器人通用性的关键——它能将自然语言指令直接转化为物理动作,而无需为每个任务单独编程。 值得注意的是,Genesis AI 的种子轮融资规模在机器人初创公司中相当罕见,反映出投资者对该赛道的高度期待。然而,从模型到可靠硬件的落地仍有漫长道路,包括成本、安全性、泛化能力等挑战。 ## 演示亮点与潜在影响 虽然公司未公布演示的完整技术细节,但视频显示机械手能够执行**多指协同**的精细操作,例如翻转物体、使用工具等。这暗示 GENE-26.5 可能具备一定的**灵巧操作**能力,而不仅是简单的抓取。 如果 Genesis AI 能持续迭代,其全栈方案有望在物流、制造、家庭服务等场景中实现应用。不过,目前行业仍处于早期阶段,大规模商业化可能需要数年时间。 ## 小结 Genesis AI 的演示标志着机器人基础模型从理论走向实践的重要一步。全栈策略虽然风险较高,但若成功,可能重塑机器人行业的软件-硬件格局。后续关注点包括:模型是否开源、硬件成本控制以及实际部署案例。

TechCrunch28天前原文
Google 开源 Gemma 4 模型,采用“推测解码”技术实现最高 3 倍加速

Google 近期发布了 Gemma 4 开源模型,并随之推出了实验性的多令牌预测(MTP)草稿器,通过推测解码技术大幅提升本地 AI 推理速度。官方称,在保持输出质量不变的前提下,推理速度最高可提升 3 倍。 ## 技术原理:用“轻量草稿”加速“重型模型” 传统大语言模型(LLM)采用自回归方式逐个生成 token——每个 token 都需要完整的模型计算,即便只是填充词也不例外。在本地硬件上,内存带宽(相较于企业级高带宽内存 HBM)成为瓶颈:处理器频繁从显存搬运参数,大量计算周期被浪费。 MTP 的思路正是利用这段空闲时间:用一个极小的草稿模型(Gemma 4 E2B 的草稿器仅 7400 万参数)快速推测后续多个 token,再由主模型一次性验证。由于草稿器共享主模型的键值缓存,无需重复计算上下文,推测效率极高。 ## Gemma 4:从云端到本地的能力下放 Gemma 4 基于 Google 前沿模型 Gemini 的底层技术构建,但专门针对本地运行优化。**单个高性能 AI 加速器即可运行最大规模的 Gemma 4 模型(全精度)**,量化后甚至可在消费级 GPU 上部署。相比 Gemini 依赖 Google 定制 TPU 芯片和超算集群,Gemma 让用户能在自有硬件上调试 AI,避免数据全部上传至云端。 此外,Google 将 Gemma 4 的许可协议改为 **Apache 2.0**,比前代的自定义许可更为开放,降低了商业使用门槛。 ## 实际意义:本地 AI 推理的“降本增效” 推测解码并非全新概念,但 Google 将其系统性地集成到 Gemma 4 生态中,意义重大。对于开发者而言,这意味着: - 在同样硬件上获得更快的响应速度,或为同等速度选择更小/更便宜的硬件; - 保持模型输出质量(草稿器的错误会被主模型拒绝); - 开源实现便于社区优化和定制。 ## 局限性:不是万能加速 需要指出,加速效果取决于任务类型:草稿器推测准确率高时(如模板化回复)提速明显;在高度创造性或逻辑复杂的任务中,推测命中率下降,加速比可能缩小。此外,草稿器本身也占用一定内存,对极端资源受限的场景并不友好。 总体而言,MTP 是 Google 在“边缘 AI”方向上的重要补丁——让强大的模型在普通硬件上跑得更快,离“人人都能运行本地 AI”的目标又近了一步。

Ars Technica28天前原文

Tomofun,这家总部位于台湾的宠物科技初创公司,旗下产品 **Furbo 宠物摄像机** 正在重新定义宠物主人与宠物远程互动的方式。Furbo 将智能摄像头与 AI 结合,能够检测狗狗吠叫、奔跑或异常活动等行为,并实时向主人发出警报。这一能力的核心是计算机视觉和视觉语言模型,它们从视频流中解读宠物的动作。 最初,Furbo 的推理工作负载运行在基于 GPU 的 Amazon EC2 实例上。虽然 GPU 提供了高吞吐量,但由于需要支持大规模实时宠物活动警报的持续推理,成本高昂。为了降低成本并保持准确性,Tomofun 转向了由 **AWS Inferentia2** 驱动的 EC2 Inf2 实例,这是亚马逊自研的 AI 芯片。 ## 挑战:降低大规模实时视觉语言模型的 GPU 推理成本 运行先进的视觉语言模型(如 BLIP)原本托管在 GPU 实例上,但对于需要始终在线、实时推理的大规模工作负载来说,成本效益不佳。挑战有两方面:Tomofun 需要在数十万台设备上持续进行宠物行为监控,同时保持模型保真度和吞吐量,且不能大幅重写已针对 PyTorch 优化的 BLIP 代码库。 ## 解决方案概览 系统通过 AWS 服务实现了大规模宠物行为检测。其架构核心是 **Elastic Load Balancing (ELB)** 和 **Amazon EC2 Auto Scaling 组**,使用 EC2 Inf2 实例,能够随着推理负载的实时增长进行弹性伸缩。当摄像头捕捉到一帧画面时,数据通过 Amazon CloudFront 和 ELB 路由到第一层 Auto Scaling 组(托管宠物行为检测 API 服务器)。API 层处理请求后,将图像转发给第二层 Auto Scaling 组(专用于推理)。 ## 技术实现与优势 Tomofun 利用 AWS Inferentia2 的 **Neuron Core** 架构和 PyTorch Neuron 编译器,将 BLIP 模型转换为高效推理格式。通过 **模型并行** 和 **流水线并行** 技术,将模型分布在多个 Neuron Core 上,显著提升了吞吐量。与 GPU 方案相比,Inf2 实例在保持同等精度的同时,推理成本降低了约 **40-50%**,且延迟满足实时检测需求。 ## 总结 Tomofun 的成功实践表明,对于大规模、始终在线的视觉语言模型推理,AWS Inferentia2 提供了 **高性价比** 的替代方案。通过优化模型部署和利用弹性伸缩,企业可以在不牺牲性能的前提下显著降低运营成本。

AWS ML28天前原文

在线约会巨头 Match Group(旗下拥有 Tinder、Hinge 等知名应用)近日在财报电话会上透露,**公司正放缓今年剩余时间的招聘计划**,原因直指 AI 工具的部署“成本高昂”。这一表态揭示了 AI 浪潮下科技公司资源再分配的真实图景:当 AI 从“锦上添花”变为“核心基建”,人力成本与算力投入之间正在展开一场零和博弈。 ## 钱花在了哪里? Match Group 并非 AI 的新手。早在 2023 年,Tinder 就推出了 AI 驱动的照片验证功能,以遏制“猫图片”诈骗;Hinge 则利用大语言模型辅助用户优化个人简介。但 CFO Gary Swidler 在电话会中坦言,**生成式 AI 的推理成本远超预期**——每一次用户与 AI 推荐引擎的交互、每一次内容审核的模型调用,都意味着真金白银的 GPU 算力消耗。 公司预计,今年下半年 AI 相关支出将比上半年“显著增加”,而**冻结部分招聘岗位**成为平衡预算的直接手段。据估算,Match Group 的 AI 投入年化增长率可能超过 50%,这在其整体营收增速(2023 年约 5%)的背景下显得格外突出。 ## 行业缩影:AI 的“甜蜜负担” Match Group 的困境并非孤例。从微软到 Salesforce,科技巨头们正在经历一场类似的“AI 成本阵痛”: - **算力军备竞赛**:训练和推理需要大量 GPU,而英伟达的 H100 芯片价格仍居高不下(单卡约 3 万美元)。 - **模型维护成本**:即使是使用第三方 API(如 OpenAI),每次查询的费用也会随用户规模线性增长。 - **人才争夺战**:AI 工程师薪资溢价严重,但 Match Group 选择“少招人、多买算力”,本质上是用资本支出替代人力支出。 > 一个值得注意的细节是:Match Group 的员工总数在 2023 年已减少约 8%(从 2800 人降至 2570 人),而 AI 工具的使用范围却在扩大。这暗示着“AI 替代人力”的叙事正在从研发部门向运营、客服等后台岗位渗透。 ## 短期阵痛 vs 长期回报? 投资者对此反应复杂。一方面,Match Group 股价在财报后下跌约 3%,市场担心成本失控侵蚀利润;另一方面,公司强调 AI 正在提升核心指标:**Tinder 的付费转化率在引入 AI 推荐后提升了 2 个百分点**,而 Hinge 的匹配效率也有两位数增长。 CEO Bernard Kim 在电话会中描绘了一个“AI 驱动型约会平台”的未来:从智能筛选照片、反骚扰实时监控,到个性化约会路线规划,**AI 被定位为提升用户体验和留存率的“倍增器”**。但这一切的前提是——用户愿意为这些功能支付更高的订阅费吗? ## 结语:AI 的“成本墙”与行业启示 Match Group 的案例为所有依赖 AI 的消费级应用敲响了警钟:**AI 不是免费的午餐**。当技术红利从“模型能力突破”转向“规模化落地”时,成本结构将成为决定商业模式成败的关键变量。对于约会应用这类高频、低客单价(Tinder 月费约 10-30 美元)的产品而言,AI 成本占比一旦超过 15%,就可能侵蚀掉全部利润。 未来,我们可能会看到更多企业做出类似选择:**放缓人力扩张,将资源倾斜给 AI 基础设施**。这背后不仅是效率的考量,更是一场关于“谁能在 AI 时代活下来”的残酷筛选。

TechCrunch28天前原文

苹果公司近日同意支付 **2.5亿美元**,以和解一桩指控其过度宣传Siri AI功能上线时间的集体诉讼。该诉讼由消费者发起,称苹果在2019年至2023年间多次发布广告和声明,暗示Siri即将获得重大AI升级,但实际功能迟迟未能落地,导致用户基于虚假承诺购买了设备或服务。 **事件背景** 这起诉讼的核心在于苹果对Siri“下一代AI能力”的营销承诺。原告指出,苹果在2019年全球开发者大会(WWDC)上展示了Siri的“主动式”智能功能,例如更自然的对话、跨应用操作等,并表示这些功能将在当年晚些时候推送。然而,相关更新多次跳票,直到2023年iOS 17发布后,部分承诺功能才以有限形式上线。 **和解细节** 根据法庭文件,苹果虽未承认过错,但同意支付2.5亿美元以终结长达四年的法律纠纷。这笔款项将用于赔偿符合条件的美国消费者,每名用户预计可获得约20至50美元,具体取决于设备型号和购买时间。此外,苹果需在和解生效后一年内,在其官网和广告中明确标注Siri功能的实际可用性,避免再次引发误解。 **行业影响** 此案为科技巨头敲响警钟——在AI竞赛中,过度承诺可能带来法律与声誉双重风险。近年来,随着生成式AI爆发,苹果、谷歌、三星等公司纷纷加速布局智能助手升级,但技术成熟度与用户预期之间的鸿沟日益明显。本次和解表明,监管与消费者权益保护正对AI营销形成更严格的审视。 **对苹果的意义** 2.5亿美元对苹果而言并非巨额,但案件暴露了其AI战略的短板。相比ChatGPT等外部模型,Siri的智能化进程一直较为缓慢。苹果近年来通过收购AI初创公司、加大研发投入试图追赶,但生态整合与隐私保护之间的平衡仍是挑战。此次和解或促使苹果调整Siri功能的发布策略——从“先吹嘘再延期”转向“实际可用后再宣传”。

TechCrunch28天前原文

当企业需要为项目寻求专业意见时,通常会转向 LinkedIn 或 GLG、Third Bridge、AlphaSights 等专家网络平台。但这些平台往往只能根据职位头衔匹配专家,导致质量参差不齐。总部位于伦敦的初创公司 **Ethos** 认为,AI 可以彻底改变这一体验。 **Ethos 的核心创新在于语音驱动的专家入职流程。** 传统平台要求专家填写基于职位头衔的表格,而 Ethos 通过语音提问,能获取专家在多个领域更深层的知识数据——这些信息远非职位头衔所能涵盖。例如,企业可以提出“寻找在 A 级投资机构资助的金融自动化初创公司工作过的人”这样的复杂问题,或者让制药公司搜索“既专攻某领域、又发表过相关论文、还了解药物开发的医生”。 **融资与团队背景** 近日,Ethos 宣布完成 **2275 万美元的 A 轮融资**,由 **a16z** 领投,General Catalyst、XTX Markets、Evantic Capital 和 Common Magic 跟投。a16z 合伙人 Anish Acharya 指出,LinkedIn 和 GLG 等传统平台只能提供职位头衔这类浅层信号,而 Ethos 通过语音面试和精心设计的问题,捕捉专家的不同子专业领域。他认为:“语音是人类交流的原始形式,大多数人不知道如何简洁、有说服力且准确地写下自己的故事。语音是 Ethos 的一大优势。” 公司由 **James Lo** 和 **Daniel Mankowitz** 于 2024 年创立。Lo 曾任职麦肯锡和软银,参与过 WeWork、Arm 等公司的转型;Mankowitz 是 DeepMind 的前 AI 研究员,参与过 YouTube 视频压缩算法、Gemini 和 AlphaDev 排序算法。两位创始人从不同角度切入专家网络问题:Lo 希望为人们提供合适的经济和就业机会,Mankowitz 则认为经济本质上是人与人之间的知识图谱。 **规模化进展** Ethos 声称目前每周签约 **35,000 名专家**,并计划利用新资金加速平台开发、扩大团队并拓展市场。在 AI 行业,专家网络正变得越来越重要,尤其是当企业需要针对特定细分领域(如金融科技、生物医药)获取高质量见解时。Ethos 的语音入职和 AI 匹配方法,有望打破传统专家网络的信息瓶颈,为知识经济带来更高效的连接方式。

TechCrunch28天前原文

Zorin OS 是市场上最受欢迎的 Linux 发行版之一。如果你想充分利用它,可以考虑我常用的这些优化方法。 ## 从加速开始:启用 Zram 谁不想要更快的电脑呢?加速 Zorin OS 的最佳方法之一是启用 **Zram**,这是一个 Linux 内核模块,用于在 RAM 中创建压缩块设备,实现更快的数据访问和更高效的内存使用。Zram 就像快得多的交换空间,其改进效果显著。 启用 Zram 的步骤: 1. 安装必要工具:`sudo apt-get install zram-config` 2. 启用 Zram:`sudo systemctl enable --now zram-config` 3. 禁用交换文件:编辑 `/etc/fstab` 文件,注释掉 `/swap` 行,然后运行 `sudo swapoff /swapfile`。 4. 重启系统。 启用后,当多个应用同时运行时,性能提升尤为明显。 ## 精简开机启动项 登录系统时,某些应用会自动启动。有些是必需的,有些则可能多余。要管理启动项,可以通过桌面菜单中的“启动应用程序”工具进行启用或禁用。 ## 其他优化 除了上述两点,你还可以考虑: - **使用轻量级桌面环境**:如果硬件配置较低,可以切换到 Xfce 等轻量级桌面。 - **清理系统垃圾**:定期使用 `sudo apt autoremove` 和 `sudo apt autoclean` 清理无用包和缓存。 - **调整视觉效果**:关闭不必要的动画和透明效果,减轻 GPU 负担。 这些调整免费且任何人都可以操作。如果你也是 Zorin OS 用户,不妨一试。

ZDNet AI28天前原文