SheepNav

AI 资讯

每日聚合最新人工智能动态

OpenAI 近日发表官方声明,详细阐述了其在 AI 政策与政治倡导方面的立场,强调公司致力于透明、支持审慎监管和 AI 安全,并明确表示没有任何外部政治团体有权代表公司发言。 ## 核心立场:AI 治理应由多方参与 OpenAI 认为,AI 是人类有史以来最强大的技术之一,当前关于其治理和部署的决策将产生长远影响。公司主张,AI 的未来应由政府、研究人员、劳动者、公民社会、独立专家和公众共同塑造,而非由任何单一公司或组织主导。与此同时,像 OpenAI 这样的技术公司有责任明确自身的价值观、政策立场以及倡导方式。 ## 政治参与:坚持零捐款,不设 PAC 在过去一年中,AI 政策已成为政治辩论的焦点,越来越多的外部团体试图影响相关决策。许多科技公司已设立由员工资助的政治行动委员会(PAC),或向现有 PAC 捐款以塑造 AI 的公众叙事。OpenAI 则采取了截然不同的做法:**公司没有向任何超级 PAC 捐款,也没有设立员工资助的 PAC,更没有向政治候选人或竞选活动提供任何捐款**。OpenAI 承诺,如果未来改变这一做法,将保持透明。 ## 明确边界:个人行为不代表公司 OpenAI 允许员工以个人身份参与政治活动,包括捐款或为候选人、竞选活动和政治组织提供建议。但公司强调,**这些行为属于个人行为,不代表 OpenAI 的立场**。针对外界关于其联合创始人格雷格·布罗克曼(Greg Brockman)及其妻子安娜支持的组织“引领未来”(Leading the Future,LTF)的疑问,OpenAI 明确回应:布罗克曼夫妇与 LTF 的接触纯属个人行为,公司不指导 LTF 的活动,也不了解其运作。**没有任何外部政治团体能代表 OpenAI 或公司的观点**。 ## 呼吁透明与诚信 OpenAI 认为,AI 政策过于重要,不应沦为党派政治的又一个战场。公司呼吁所有倡导 AI 的团体都应明确其政策观点,诚实地说明其代表对象,避免使用“草根伪装”(astroturfing)等掩盖真实选择的手段。OpenAI 表示,其政策立场应以其公开言行作为评判标准,并承诺接受高标准审视。 ## 支持审慎监管与 AI 安全 作为声明的一部分,OpenAI 重申了对审慎监管和 AI 安全的支持,但未在本次声明中展开具体细节。这一立场与其一贯倡导的“安全、负责任地开发通用人工智能”的使命相符。 总体而言,OpenAI 此次表态旨在划清公司与个人政治活动的界限,回应外界对其政治影响力的质疑,并倡导 AI 政策讨论的透明与诚信。在 AI 监管日益成为全球焦点的当下,OpenAI 的立场或将为行业树立一种新的透明度标杆。

OpenAI26天前原文

斯坦福大学计算机科学课程 **CS336** 近期发布了一份关于 **AI 代理(AI Agent)** 使用的官方指南,引发 Hacker News 社区热议。该课程名为“大型语言模型”,主要教授 LLM 的原理、训练与部署。指南旨在规范学生在课程项目与作业中如何合理利用 AI 代理工具,平衡技术辅助与学术诚信。 ## 核心要点 指南明确允许学生在特定场景下使用 AI 代理,例如代码调试、概念解释或生成代码模板,但严格禁止直接使用 AI 生成完整作业答案或论文。学生需在提交时声明使用了哪些 AI 工具及其具体贡献,类似于引用外部资料。此外,指南强调学生必须对 AI 生成的内容负责,确保其准确性与原创性。 ## 行业背景与意义 此次发布恰逢学术界对 AI 辅助学习的争议升温。此前,多所高校曾因学生滥用 ChatGPT 完成作业而调整学术诚信政策。斯坦福 CS336 的指南试图在“拥抱技术”与“维护学术标准”之间找到平衡点。作为顶尖计算机科学课程,其做法可能成为其他院校的参照。 ## 社区讨论 在 Hacker News 上,该话题获得 167 分和 82 条评论。部分开发者认为指南过于宽松,仍可能被钻空子;另一些则赞赏其透明原则,认为声明机制能有效防止滥用。也有评论指出,AI 代理的定义尚不明确,未来需随技术迭代持续更新规则。 ## 小结 斯坦福 CS336 的 AI 代理指南是高等教育应对 AI 工具的一次务实尝试。它既承认了 AI 辅助学习的价值,又通过声明与责任归属维护了学术诚信。对于 AI 行业从业者而言,这一案例也提示:**透明度和用户责任** 是技术落地的关键原则。

Hacker News50226天前原文

经过数月的猜测,AI 领域的两大巨头——OpenAI 与 Anthropic——究竟谁将率先上市,答案终于有了眉目。2026 年 6 月 1 日,Anthropic 宣布已向美国证券交易委员会(SEC)秘密提交了注册声明草案,正式启动首次公开募股流程。这一里程碑事件标志着 Anthropic 在资本市场的征途上迈出了关键一步。 ## 估值惊人,超越 OpenAI Anthropic 在上一轮融资后估值高达 **9650 亿美元**,成为全球估值最高的初创公司,超过了其最大竞争对手 OpenAI 的 **8520 亿美元**。这一数字本身就说明了市场对 Anthropic 技术路线和商业前景的高度认可。Anthropic 由前 OpenAI 员工创立,一直以“安全 AI”为核心理念,其 Claude 系列模型在推理、编码和安全对齐方面表现突出,赢得了大量企业客户。 ## 秘密递表,细节暂不公开 与许多大型科技公司类似,Anthropic 选择了 **秘密提交** 的方式,这意味着关键的运营细节——如风险因素、高管薪酬、财务数据等——要等到后续流程才会公开。这种做法可以让公司在正式路演前有更多调整空间,也避免了过早暴露商业机密。 ## 竞争与盟友:SpaceX 的阴影 值得注意的是,Anthropic 的 IPO 时间点恰好落在 SpaceX 计划于 **6 月 12 日上市** 之前。SpaceX 的公开募股预计将筹集 **800 亿美元**,有望成为史上最大规模的 IPO。而 SpaceX 旗下拥有 xAI,并与 Anthropic 签订了每年 **150 亿美元** 的数据中心使用协议。这意味着 Anthropic 既是 SpaceX 的客户,又与其存在微妙的竞争关系。此外,OpenAI 刚刚在与马斯克的法律纠纷中胜诉,法官因诉讼时效驳回了所有指控,这让 OpenAI 得以专注于自身业务。 ## 行业意义:AI 上市潮的开启 Anthropic 的 IPO 可能开启 AI 公司的上市潮。随着大模型训练成本飙升,上市融资成为头部公司获取长期资金的关键渠道。对于投资者而言,Anthropic 的上市提供了一个押注“安全 AI”路线的机会;对于行业而言,这场 IPO 将检验市场对 AI 公司盈利模式的真实信心。 ## 小结 Anthropic 的上市进程已经启动,虽然距离正式挂牌交易还有数月,但这一消息无疑加剧了 AI 领域的竞争态势。接下来,市场的目光将集中在 SEC 的审查进度、公开的财务数据以及最终定价上。无论结果如何,这都将是 AI 产业资本化的一个标志性事件。

The Verge26天前原文

AI 实验室 Anthropic(Claude 开发者)于周一宣布,已向美国证券交易委员会(SEC)秘密提交首次公开募股(IPO)申请。该公司估值接近 1 万亿美元,但尚未披露发行股份数量或价格。Anthropic 表示,此次 IPO 将取决于市场条件及其他因素。 这一消息发布于 Anthropic 完成 650 亿美元 H 轮融资不到一周之后。该轮融资由 Altimeter Capital、Dragoneer、Greenoaks、Sequoia Capital、Capital Group、Coatue 和 D1 Capital Partners 共同领投,将公司估值推高至 9650 亿美元。大量机构与战略投资者早已为 IPO 做好准备。 Anthropic 的 IPO 恰逢市场火热期:SpaceX 也正以 2 万亿美元估值筹备上市,计划融资超 750 亿美元。秘密递交 IPO 文件允许公司在不公开详细财务信息、风险或内部业务细节的情况下启动上市准备,从而避开公众的审视目光。一旦推进,Anthropic 将提交 S-1 注册文件,披露财务状况、法律事务、风险以及投票权分布等关键信息。 与此同时,竞争对手 OpenAI 也在持续融资——今年 3 月完成 1220 亿美元融资,投后估值达 8520 亿美元——并筹备其 IPO。两大 AI 实验室的上市进程将正面交锋,考验市场对人工智能行业的信心与兴趣。 Anthropic 由前 OpenAI 员工于 2021 年创立,曾被视为大语言模型领域的挑战者。如今,凭借不断增长的能力与企业级服务,公司已吸引顶级客户,收入增长惊人。据近期披露,其年化收入已突破……

TechCrunch26天前原文

### 当智能体失控,运维如何跟上? 构建智能体 AI 解决方案时,团队会面临一系列独特的运维挑战。智能体做出不可预测的决策、成本意外飙升、调试非确定性故障似乎无从下手。与传统软件不同,智能体 AI 应用不只是执行预设的工作流——它们会**推理、适应并自主决策**,这意味着传统的 DevOps 实践需要彻底调整。 这就是 **AgentOps** 的用武之地。AgentOps 是一套运维规范,专为在生产环境中部署、管理和持续改进 AI 智能体而设计。它弥补了传统运维与智能体自主行为之间的鸿沟。 ### AgentOps 核心能力 Amazon Bedrock AgentCore 为 AgentOps 提供了底层支撑,帮助团队实现: - **可观测性**:追踪智能体的每一步推理与行动,记录决策路径与调用链。 - **成本控制**:实时监控每次推理与 API 调用的开销,设置预算告警。 - **调试与回放**:复现非确定性故障,回放智能体的决策过程以定位根因。 - **安全与治理**:定义智能体的行为边界,防止越权操作或数据泄露。 ### 行业背景与价值 随着 GPT-4、Claude 等大模型驱动的智能体从概念验证走向生产,运维问题日益突出。Gartner 预测,到 2026 年,**超过 30% 的大型企业将采用智能体 AI**,但其中 40% 的项目会因运维复杂性而失败。AgentOps 正是应对这一挑战的关键。 Amazon Bedrock AgentCore 通过提供统一的智能体运行时环境,让开发者无需从零搭建基础设施。它内置了**监控、日志、追踪和成本管理**功能,并与 AWS 生态(如 CloudWatch、X-Ray)无缝集成。 ### 适用场景 - **客服智能体**:确保每次对话的上下文一致,并审计敏感操作。 - **代码生成智能体**:追踪代码生成过程中的依赖与安全风险。 - **自动化工作流**:当智能体自主调用外部工具时,记录调用链以符合合规要求。 ### 小结 AgentOps 不是锦上添花,而是智能体 AI 规模化落地的必选项。Amazon Bedrock AgentCore 为团队提供了开箱即用的运维能力,让开发者能专注于智能体的行为设计,而非底层运维。随着智能体自主性增强,AgentOps 将成为 AI 工程实践的核心支柱。

AWS ML26天前原文

部署大语言模型(LLM)时,模型加载到 GPU 高带宽内存(HBM)的时间常成为瓶颈,尤其当模型参数规模达数千亿甚至万亿时,冷启动的“首 token 时间”(TTFT)会严重影响用户体验。本文介绍如何通过 **Amazon FSx for Lustre** 与 **NVIDIA GPUDirect Storage (GDS)** 的组合,结合 **TurboQuant KV Cache** 技术,大幅缩短模型加载延迟并扩展上下文窗口。 ## 背景:AWS 上的 NVIDIA Blackwell 架构 AWS 近期推出了基于 NVIDIA Blackwell 架构的 **Amazon EC2 P6e 和 P6 实例**。旗舰级 P6e UltraServer 集成了 72 块 Blackwell GPU,通过单个 NVLink 域提供 130 TB/s 的双向带宽、13.4 TB HBM3e 内存以及 360 PFLOPS(FP8)算力。此类超大规模实例通常用于训练万亿参数级的前沿模型。本文聚焦于单台 P6 或 P5en 实例的冷启动 TTFT 优化,多节点场景下各节点可并行从共享的 FSx for Lustre 文件系统中独立加载模型,充分利用 GDS 带来的高吞吐。 ## 模型加载瓶颈 传统 CPU 加载方式(左图)需将检查点流经 CPU 内存,再通过 PCIe 依次拷贝权重到各 GPU,效率低下。而 **GPUDirect Storage** 加载方式(右图)则预先将检查点按张量并行度切分,存放于 FSx for Lustre 上,所有 GPU 通过 EFA 直接并行读取各自分片至 HBM,完全绕过 CPU。 ## 实测效果 以 405B 参数的 Llama 3.1 模型为例,在 8×H200 GPU 的 P5en 实例上测试: - **传统 CPU 加载**:需约 10 分钟 - **GPUDirect Storage + FSx for Lustre**:缩短至 **约 35 秒**,加速比超 **17 倍** 此外,**TurboQuant** 技术通过量化 KV Cache 为 FP8/INT8,在相同 HBM 容量下可将上下文窗口扩展 **2-4 倍**,例如从 128K tokens 增至 512K tokens,且精度损失极小。 ## 关键结论 对于需要频繁冷启动或动态扩缩容的 LLM 推理场景,结合 **FSx for Lustre** 与 **GPUDirect Storage** 可显著降低基础设施等待开销;而 **TurboQuant** 则让有限显存支持更长上下文,直接提升模型的应用价值。两者互补,为 AI 推理带来了实际可落地的性能突破。

AWS ML26天前原文

佛罗里达州总检察长近日对OpenAI及其首席执行官萨姆·奥尔特曼提起法律诉讼,指控该公司在人工智能技术的开发和部署中存在欺骗性行为,并构成对公众的潜在风险。这起诉讼是美国各州针对AI行业采取法律行动的最新案例,反映出监管机构对AI安全与伦理问题的持续关注。 根据诉讼文件,佛罗里达州声称OpenAI的AI模型(如ChatGPT)在数据收集、隐私保护及输出内容的准确性方面存在误导性陈述,未能充分告知用户其技术的局限性和风险。诉讼还指出,奥尔特曼本人曾公开承认AI可能带来的社会危害,但公司却未能采取足够措施加以防范。 这是继加州、纽约等地类似诉讼后,又一州级政府对AI领军企业发起的法律挑战。分析人士认为,此类诉讼可能加速联邦层面的AI监管立法进程,同时也对科技公司如何平衡创新与风险防控提出更高要求。 OpenAI尚未对诉讼作出正式回应,但公司此前曾表示致力于负责任的AI开发,并支持合理的监管框架。此次诉讼的进展将对整个AI行业产生深远影响,尤其是在数据隐私、算法透明度和企业责任等关键议题上。 ## 关键问题与行业影响 - **隐私与数据安全**:诉讼焦点之一是OpenAI是否充分保护用户数据,尤其是在训练模型时如何获取和使用信息。 - **透明度与责任**:AI系统输出结果的可解释性成为法律争议点,企业需更清晰地说明模型工作原理及潜在偏差。 - **监管趋势**:多州诉讼可能推动美国国会制定统一的AI法规,避免各州各自为政带来的合规混乱。 ## 小结 佛罗里达州的诉讼标志着AI监管进入新阶段——从行业自律、白宫行政令转向司法系统的实质性介入。无论结果如何,这都将迫使AI公司重新审视其商业模式与合规策略,而公众对于AI安全性的讨论也将进一步深化。随着更多法律行动的出现,2025年或将成为AI治理的转折年。

Hacker News26826天前原文

## 从自然语言到数据洞察:Amazon Quick 与 KDB-X 的 MCP 集成实践 在金融交易、物联网监控和 DevOps 性能分析等领域,时间序列数据是决策的核心。然而,传统查询方式需要掌握复杂的数据库语法,限制了分析师和业务人员直接获取洞察的效率。近期,AWS 发布了一项新实践:通过 **MCP(Model Context Protocol)** 将 **Amazon Quick** 与 **KDB-X** 时间序列数据库集成,允许用户使用自然语言提问,并即时获得可视化答案。 ### 技术亮点:MCP 如何桥接 AI 与数据库 MCP 是一种开放协议,旨在让 AI 模型安全地访问外部工具和数据源。在此次集成中,Amazon Quick 作为 AI 驱动的商业智能服务,通过 MCP 服务器连接 KDB-X——一款专为金融高频交易设计的时间序列数据库。 具体工作流程如下: 1. 用户在 Amazon Quick 中以自然语言提出问题,例如“过去24小时内交易量最大的股票有哪些?” 2. Amazon Quick 将问题发送至 MCP 服务器,后者将其转换为 KDB-X 可执行的查询(如 q-sql)。 3. KDB-X 返回结果,Amazon Quick 自动生成图表或表格。 整个过程无需编写 SQL 或学习 KDB-X 特有语法,大幅降低了数据访问门槛。 ### 场景价值:从金融市场到物联网 虽然该示例聚焦金融领域,但 AWS 强调这一模式具有通用性。**任何需要从海量时间序列数据中快速提取洞察的场景**——例如 IoT 传感器异常检测、DevOps 基础设施监控——都可以复用相同的 MCP 集成架构。 - **金融场景**:交易员可询问“某只股票过去5分钟的波动率趋势”,系统实时调取毫秒级 tick 数据并生成图表。 - **物联网场景**:运维人员问“哪些传感器在过去1小时内温度超过阈值”,系统自动关联设备 ID 和时间戳。 - **DevOps 场景**:工程师查询“API 响应时间 p99 在过去24小时内的变化”,无需手动编写 PromQL 或自定义脚本。 ### 行业背景:AI 驱动的“对话式数据分析”趋势 这一实践反映了当前 AI 行业的两个重要趋势: 1. **协议层标准化**:MCP 的出现类似于数据库领域的 ODBC/JDBC,旨在统一 AI 模型与外部工具的交互方式。Anthropic 等公司也在推动类似协议,但 AWS 的 MCP 实现更强调与云服务的深度集成。 2. **自然语言 BI 进化**:传统 BI 工具(如 Tableau、Power BI)需要用户具备数据建模能力,而 AI 原生分析(如 Amazon Quick、ThoughtSpot)正试图让“问问题”成为核心交互方式。 不过,这种集成也面临挑战:**自然语言查询的歧义性**可能导致错误解读,例如“过去一周的销量”可能被理解为“最近7天”或“上周一至周日”。AWS 建议在 MCP 服务器中嵌入上下文规则,例如预设时间窗口、强制验证字段名称。 ### 小结:降低时间序列分析的门槛 Amazon Quick 与 KDB-X 的 MCP 集成,为时间序列数据分析提供了一条“零代码”路径。对于金融分析师,这意味着从数据请求到决策的周期从小时级缩短到秒级;对于 IoT 团队,则意味着无需专门招聘数据库专家即可实现实时监控。 未来,随着 MCP 生态的扩展,我们可能看到更多数据库(如 InfluxDB、TimescaleDB)接入类似协议,使自然语言成为数据交互的“通用语言”。

AWS ML26天前原文

在天气预报这个长期由国家级气象机构主导的领域,一家名为 **WindBorne** 的 AI 初创公司正以独特的技术路线打破格局——其预报准确性已超越传统政府机构。 ## 数据与模型双轮驱动 WindBorne 的核心竞争力在于将**模型构建**与**数据收集**紧密结合。与多数依赖公开气象数据的 AI 公司不同,WindBorne 自主运营着庞大的气象气球网络。公司目前在全球 15 个发射站点部署了约 **400 个气球**,这些气球持续飞行并实时采集大气温度、湿度、气压和风速等传感器读数。 这种“自采自用”的模式解决了天气预报领域的经典难题:高质量、高时空分辨率观测数据的稀缺。传统气象站多集中于陆地,海洋、极地及高空区域数据稀疏,而 WindBorne 的气球可以深入这些空白地带,将观测范围大幅扩展。 ## 最新进展:模型能力的跃升 WindBorne 近期对其预报模型进行了重大升级,准确性进一步提升。关键在于**优化了气球数据输入模型的方式**——如何将海量、非均匀分布的传感器观测数据有效地融入 AI 模型,使其既不过度拟合也不丢失关键信息,一直是气象 AI 的技术难点。公司通过改进数据同化算法,让模型能更充分地利用气球网络提供的精细化数据。 ## 行业背景与意义 天气预报正经历从“数值模式”到“AI 驱动”的范式转变。传统数值天气预报依赖超级计算机求解物理方程,计算成本极高,且对初始场精度敏感。而 AI 模型(尤其是基于 Transformer 架构的预报模型)能以更低的计算成本实现相当甚至更高的精度。 WindBorne 的成功验证了“专有数据 + 自研模型”路径的可行性。相比依赖公开数据的 AI 模型(如谷歌 GraphCast、华为盘古气象大模型),WindBorne 的数据壁垒更高,且能针对特定区域或天气现象进行定制优化。 ## 未来展望 随着气球网络的持续扩张(目标覆盖全球更多站点),以及模型迭代加速,WindBorne 有望在短期预报、极端天气预警等场景中提供比政府机构更及时、更精准的服务。对于农业、航空、能源等气象敏感行业而言,这种商业化的高精度预报服务可能带来显著的经济价值。 当然,政府气象机构在长期气候预测、全球数据共享等方面仍不可替代。但 WindBorne 的故事表明,AI 初创公司完全有可能在垂直领域实现“超车”,推动整个气象服务行业进入更高效、更精准的新阶段。

TechCrunch26天前原文

## FaceTime 视频留言:一个被低估的实用功能 如果你曾因对方未接听 FaceTime 通话而错过重要时刻,那么视频留言功能或许能帮上忙。这项功能类似于传统语音信箱,但允许你录制一段视频消息,让收件人在方便时查看。 ### 如何操作? 当 FaceTime 呼叫无人应答时,你会看到一个“录制视频留言”的选项。点击后,即可开始录制一段简短的视频消息。录制完成后,系统会自动发送给收件人。对方会在通话记录中看到你的留言,并可以随时播放。 对于 FaceTime 音频通话,苹果还提供了“实时语音留言”(Live Voicemail)功能,让你能留下纯音频消息。 ### 为什么很多人不知道? 尽管视频留言功能已存在一段时间,但许多用户并未意识到它的存在。这可能是因为该功能在界面中不够显眼,或者用户习惯了传统的语音留言模式。ZDNET 的编辑就曾在一个周末内教会了两人如何使用该功能,可见其普及度仍有提升空间。 ### 实用场景 - **错过重要通话**:当你无法接听时,对方可以留下视频消息,传达情感或重要信息。 - **快速分享**:无需等待对方接通,直接录制一段视频说明,提高沟通效率。 - **家庭互动**:父母或孩子可以留下有趣的视频消息,增加亲密感。 ### 小结 FaceTime 视频留言是一个简单但强大的功能,特别适合在对方忙碌或不便接听时使用。如果你还没试过,不妨在下次 FaceTime 呼叫无人应答时,点一下录制按钮,体验这种更丰富的沟通方式。 参考来源:ZDNET

ZDNet AI26天前原文
新服务器有望突破AI的“内存墙”

AI模型规模的指数级增长正将传统计算架构推向极限。当GPU算力持续攀升时,内存带宽与容量却成为制约性能的瓶颈——这一现象被业界称为“内存墙”。近日,硬件初创公司 **Majestic Labs** 宣布推出其AI服务器 **Prometheus**,旨在通过颠覆性的内存设计突破这一壁垒。 ## 128TB内存:从“搬运数据”到“就地计算” Prometheus 最引人注目的参数是每台服务器最高可配备 **128 TB 的 LPDDR6 内存**。这一数字远超当前主流AI服务器(通常搭载数百GB至数TB的HBM或DDR5内存)。Majestic Labs 的核心理念是:将海量数据直接存储在靠近计算单元的内存中,而非频繁地从存储系统搬运。 传统AI训练中,数据需从硬盘或SSD加载至GPU显存,再通过PCIe总线传输。这一过程不仅延迟高,且功耗巨大。Prometheus 通过将 **128TB 的 LPDDR6 内存** 直接与CPU/GPU互联,实现了近乎“零拷贝”的数据通路。LPDDR6 本身具备高带宽、低功耗特性,而大规模内存池化让模型参数与数据集可以常驻内存,极大减少了I/O等待时间。 ## 为何是“内存墙”而非“算力墙”? 当前AI领域的军备竞赛多聚焦于GPU算力(如NVIDIA H100/B200的TFLOPS提升)。然而,实际训练效率往往受限于内存带宽与容量。以GPT-4级别的万亿参数模型为例,其参数存储需数TB空间,而传统服务器内存仅能容纳部分参数,导致必须采用复杂的模型并行与数据流水线技术,这些技术本身会引入大量通信开销。 Majestic Labs 的创始人指出:“算力增长与内存性能增长之间的剪刀差正在扩大。过去十年,GPU算力提升了约1000倍,但内存带宽仅提升约20倍。”这种失衡使得大量计算单元处于“等待数据”的空闲状态,实际利用率远低于理论峰值。**Prometheus 的128TB内存** 直接瞄准这一痛点,让大模型可以完整驻留于内存,甚至允许同时加载多个模型版本进行对比测试。 ## 架构细节与潜在影响 虽然完整的技术白皮书尚未公布,但从已披露信息看,Prometheus 采用了 **内存池化与CXL(Compute Express Link)互连** 技术。CXL 允许CPU、GPU、内存等设备通过PCIe 5.0/6.0总线共享一致的内存地址空间。这意味着Prometheus 并非简单堆叠DRAM,而是构建了一个统一的内存层级:LPDDR6 作为主内存池,配合少量HBM作为GPU的本地高速缓存。 这种设计对AI推理场景尤为有利。推理任务通常对延迟敏感,且需要频繁访问大模型权重。传统方案中,权重从内存加载至缓存的过程可能占据推理时延的70%以上。Prometheus 的大内存池可让权重常驻,实现接近“即时响应”的推理效果。 ## 市场定位与挑战 Majestic Labs 并非唯一瞄准内存墙的玩家。三星、SK海力士等内存巨头正在开发 **CXL 内存模块**,而AMD与Intel也在推进统一内存架构。但Prometheus 的差异化在于其 **128TB 的极端容量**,这主要面向超大规模AI模型训练场景,如自动驾驶、药物研发、气候模拟等。 然而,该方案也面临成本与功耗挑战:128TB LPDDR6 的采购成本可能高达数百万美元,且服务器功耗将远超常规机型。此外,软件生态的适配同样关键——需要操作系统与AI框架(如PyTorch、TensorFlow)支持透明的大内存管理。 ## 小结 **Prometheus 服务器的发布** 标志着AI基础设施从“算力优先”向“内存优先”的思维转变。当模型规模突破万亿参数,单纯堆砌GPU已非最优解。Majestic Labs 的尝试是否成功,将取决于其能否在成本、性能与生态之间找到平衡。但无论如何,它已经为行业提供了一个值得关注的方向:**突破内存墙,或许才是解锁下一代AI能力的关键**。

IEEE AI26天前原文

在 AI 搜索工具风靡的当下,以隐私保护为特色的搜索引擎 DuckDuckGo 却反其道而行之,正式为 Chrome 和 Firefox 用户推出了“无 AI”浏览器扩展。这一举措正值其流量持续攀升之际,显示出用户对传统、无 AI 干扰的搜索体验依然存在强劲需求。 ## 背景:AI 搜索热潮下的“逆行者” 近年来,以 ChatGPT、Bing Chat 为代表的 AI 搜索引擎迅速崛起,它们通过生成式 AI 提供对话式答案,改变了传统搜索的交互模式。然而,AI 搜索也引发了隐私、准确性和内容来源等担忧。DuckDuckGo 一直主打“不追踪用户”的隐私搜索,此次推出的“无 AI”扩展进一步强化了其定位——用户无需担心搜索行为被用于 AI 模型训练,也无需面对 AI 生成的冗长摘要。 ## 产品细节:轻量级扩展,一键切换 新扩展名为 **DuckDuckGo Search**,目前支持 Chrome 和 Firefox 浏览器。安装后,用户可将 DuckDuckGo 设为默认搜索引擎,并直接通过浏览器地址栏进行搜索,无需手动访问网站。扩展还内置了隐私保护功能,如阻止第三方追踪器和强制 HTTPS 连接。值得注意的是,该扩展明确标注为“无 AI”,意味着搜索结果完全基于传统算法,不包含任何 AI 生成的摘要或对话式交互。 ## 流量增长背后的用户诉求 DuckDuckGo 近期流量显著增长,部分原因可能是用户对主流搜索引擎中 AI 功能的不满。例如,Google 的 AI 概览和 Microsoft Bing 的 AI 聊天功能虽然提供了便捷,但也带来了信息过载和隐私疑虑。DuckDuckGo 的“无 AI”标签恰好满足了那些追求简洁、快速且隐私友好的用户需求。根据公司数据,其日均搜索量已突破 1 亿次,而新扩展有望进一步吸引 Chrome 和 Firefox 用户群体。 ## 行业影响:AI 并非唯一答案 DuckDuckGo 的逆势操作提醒我们,AI 搜索并非适合所有人。对于注重隐私、偏好传统结果列表的用户来说,无 AI 的搜索体验反而更具吸引力。这一策略也反映了搜索市场的分化:一边是科技巨头押注 AI 以提升用户黏性,另一边则是隐私导向的搜索引擎抓住细分市场。DuckDuckGo 的扩展或许不会撼动 Google 的地位,但它为“反 AI”用户提供了一个明确的选择。 ## 小结 DuckDuckGo 的“无 AI”扩展是搜索领域一次有趣的尝试,它证明了在 AI 浪潮中,传统搜索仍有生存空间。对于开发者而言,这也是一种启示:并非所有产品都需要 AI 加持,回归核心需求有时能带来意想不到的增长。

TechCrunch26天前原文

微软即将在旧金山举办年度 Build 开发者大会,这不仅是该公司全面转向 AI 后的又一次关键亮相,也被视为重新赢回开发者信任的重要契机。据知情人士透露,本次大会将发布一系列重磅更新,涵盖新 AI 模型、Copilot 超级应用以及针对开发者的 Windows 优化体验。 ## AI 模型:本地推理与下一代小模型齐头并进 微软将在 Build 上展示新一代 AI 模型,包括一个全新的**推理模型**,旨在提升复杂任务的处理能力。更重要的是,微软将重点推动**本地模型**在 Windows 上的运行,让开发者能够利用本地计算资源,减少对昂贵云服务的依赖。Windows 负责人 Pavan Davuluri 此前已暗示“为开发者带来新东西”,预计将推出更小、更高效的下一代 AI 模型,适配不同硬件场景。 ## Copilot 超级应用:从助手到平台 Copilot 将升级为“**超级应用**”,整合更多功能模块,成为用户与 AI 交互的核心入口。这一举措延续了微软将 AI 嵌入所有产品的战略,但超级应用形态意味着 Copilot 将不再只是辅助工具,而是具备独立生态的平台级产品。 ## Windows 11 开发者优化:专注与性能 针对开发者长期反馈的痛点,微软将推出**Windows 11 开发者优化体验**,包括: - **无干扰环境**:预装必要的开发工具、脚本和应用,减少配置时间。 - **性能重写**:继续推进 Windows 11 部分组件的重写计划,提升系统响应速度和稳定性。 - **定制化改进**:Windows Insider 团队将在大会前夕展示更多自定义选项。 此外,微软还会公布 Windows 如何适配**Nvidia RTX Spark** 等新型芯片,为 AI 工作负载提供更好的硬件支持。 ## 大会背景:信任重建与行业转折 本届 Build 大会选址更小、更亲密的场地,反映出微软希望与开发者进行更深度的交流。近年来,Windows 和 GitHub 的信任度跌至低谷,而 AI 浪潮给了微软重新定义开发者关系的窗口。从本地 AI 模型到系统性能优化,微软正试图证明自己不仅是 AI 技术的推动者,更是开发者生态的坚实后盾。 ## 小结 微软 Build 2026 的关键词是“回归”:回归开发者需求,回归本地计算,回归系统基础体验。在 AI 军备竞赛中,微软不再只谈云端大模型,而是通过小模型、本地推理和平台优化,构建更务实的开发者工具链。这一策略能否赢得开发者芳心,将成为大会后行业关注的焦点。

The Verge26天前原文

生成式 AI 在音乐领域的渗透速度远超预期。据流媒体平台 Deezer 报告,**每天有超过 5 万首 AI 生成的歌曲被上传**,而工具如 Suno 已成为各类音乐人创作流程中的主流部分。面对这一浪潮,格莱美奖主办方——录音学院 CEO Harvey Mason Jr. 在接受《The Verge》专访时坦言,**AI 在音乐制作中已“无处不在”**,他参与的每个录音环节几乎都有 AI 的身影。 然而,录音学院目前的规则明确:**纯 AI 生成的音乐没有资格角逐格莱美奖**。这一规定在行业内外引发激烈讨论。Mason 本人既是学院掌门人,也是曾与 Janet Jackson、Beyoncé 等巨星合作的传奇制作人。他试图在保护“人类创造力”与接纳技术革新之间寻找平衡。 ### 从“会否颠覆”到“如何共存” 2024 年,AI 对音乐的影响尚不明朗;18 个月后,Mason 用“指数级增长”来形容 AI 音乐创作的速度。他观察到,AI 工具已从实验性玩具演变为高效的生产力助手——帮助制作人快速生成和弦进行、编曲灵感,甚至完成人声合成。但问题随之而来:当 AI 参与度达到何种比例时,作品仍应被视为“人类创作”? ### 格莱美的边界与挑战 录音学院面临的核心难题是:**如何定义“可获奖”的 AI 辅助作品**。目前规则禁止完全由 AI 生成的内容参评,但允许人类使用 AI 工具进行辅助创作。Mason 指出,学院正在研究更细致的分类标准,例如明确标注 AI 贡献占比、设立专门的 AI 音乐赛道等。但他强调,**格莱美的最高荣誉必须保留给“人类艺术表达”**——这是不可动摇的底线。 ### 行业生态的连锁反应 AI 音乐不仅冲击奖项评选,还影响平台内容审核与版权分配。Deezer 等平台已开始部署 AI 检测系统,以过滤低质或侵权内容。同时,传统唱片公司与新兴 AI 音乐公司之间的授权博弈愈演愈烈。Mason 认为,整个行业需要建立新的**透明度和归属机制**,确保人类创作者获得合理回报。 ### 展望:格莱美走向 Disney,拥抱年轻观众 除了 AI 议题,Mason 还透露格莱美奖将从 CBS 转至 Disney 平台播出,旨在触达 TikTok 时代更年轻的受众。这一战略调整暗示着传统颁奖礼正在主动适应流媒体与短视频主导的娱乐生态。 **结语**:AI 不会让音乐消失,但它正在改写“创作”的定义。格莱美作为行业风向标,其应对策略将深刻影响未来数年的音乐产业规则。Mason 的立场清晰:技术可以拥抱,但人类灵魂不可替代。

The Verge26天前原文

知名健身追踪平台 Strava 宣布将收紧其 API 访问权限,以应对 AI 爬虫和零代码工具带来的滥用问题。从即日起,开发者若想基于 Strava 数据构建应用,需支付每月 **11.99 美元** 的订阅费用。 Strava 在开发者中心更新中解释,这一变化源于“零代码 AI 工具”的兴起——这类工具让用户能快速创建应用,却对 API 造成“猛烈冲击”。公司数据显示,今年至今开发者申请数量同比暴增 **448%**,API 中介违规行为频发,爬虫尝试更导致平台性能整体下降。 ### 背景:从免费到收费 此前,开发者可免费申请使用 Strava API,并根据用户量逐步扩展权限。但如今,免费时代正式终结。这一举措并非孤立事件:2023 年,Reddit 已率先对 API 访问收费;Strava 自身也在 2024 年限制了第三方应用可展示的数据范围,并曾因专利问题起诉长期合作伙伴 Garmin(后撤诉)。 值得注意的是,Strava 于今年 2 月提交了 IPO 申请,收紧 API 或许也是为上市前优化商业模式、减少资源滥用。 ### 影响与例外 新政策不影响可穿戴设备和设备集成,用户仍可免费下载个人数据。此外,Strava 用户现可使用新工具将健身数据(包括配速、每秒心率、GPS 轨迹等)同步至 Claude 等 AI 平台。 ### 行业视角 零代码 AI 工具正成为 API 生态的“双刃剑”。一方面,它们降低了开发门槛,催生了大量创新应用;另一方面,过度调用和爬虫行为给平台带来沉重负担。Strava 的举措折射出平台方在开放与管控间的艰难平衡——既要保护数据价值,又要维持生态健康。 对于开发者而言,11.99 美元/月的订阅费可能筛选掉部分业余项目,但专业应用仍可接受。长远看,API 收费或将成为主流趋势,类似 Reddit、Twitter 的转型已证明:数据不再是免费的午餐。

The Verge26天前原文
英特尔:我们的新款AI芯片将比英伟达和AMD更便宜、更凉爽

英特尔计划于今年底推出一款名为“Crescent Island”的AI芯片,专注于推理任务,采用空气冷却和LPDDR5内存,旨在降低成本并挑战英伟达和AMD。该芯片是英特尔在新CEO陈立武领导下重振AI产品线的关键举措,此前其Gaudi系列训练芯片表现不佳。英特尔正评估该芯片是否可合规出口中国。

Ars Technica26天前原文

中国已批准全球首个侵入式脑机接口芯片——下一步是什么? 去年10月,在中国河南省自家院子里,董辉决定试着握笔。六年前的一场车祸让他颈部以下瘫痪,他缓慢地写下自己的名字、“谢谢”和日期。这一突破得益于名为 **NEO** 的脑植入芯片。今年3月,它成为全球首个获准在临床试验之外使用的侵入式脑机接口。该批准预计将加速中国成为脑植入全球领导者的进程。 ## 里程碑的意义 脑机接口(BCI)技术长期以来处于临床试验阶段,而中国的这一批准标志着从实验室走向商业化的关键一步。侵入式BCI通过直接植入大脑皮层读取神经信号,相比非侵入式方法,其信号精度更高,但手术风险和伦理争议也更大。NEO芯片的成功获批,意味着中国在神经技术领域已具备与国际巨头(如Neuralink)竞争的实力。 ## 中国加速布局 近年来,中国通过“十四五”规划等政策大力支持脑科学与类脑研究,投入数十亿美元。NEO的获批不仅是对技术安全性的认可,更可能推动国内BCI产业链的成熟。从芯片设计、手术机器人到康复训练,相关企业将迎来快速发展期。同时,中国也在探索非侵入式BCI在医疗、教育、娱乐等领域的应用,形成多层次技术路线。 ## 挑战与前景 尽管前景广阔,侵入式BCI仍面临诸多挑战:长期植入的生物相容性、信号衰减、数据隐私与伦理问题等。此外,全球监管标准尚未统一,中国率先批准可能引发国际争议。但无论如何,这一事件已为脑机接口的临床应用打开大门,未来5-10年,瘫痪患者恢复运动功能、失语者重新交流等场景或将逐渐成为现实。

MIT Tech26天前原文

2026年6月1日,OpenAI在密歇根州萨林市正式启动了名为“The Barn”的1GW数据中心园区项目。该项目是“星际之门”计划的一部分,旨在为人工智能时代构建关键基础设施。开工仪式上,密歇根州州长格雷琴·惠特默、当地社区与劳工领袖以及合作伙伴甲骨文、Related Digital和Walbridge共同出席。 **项目核心承诺** - **不增加居民负担**:项目所需基础设施和能源成本由项目方承担,不会转嫁给本地纳税人,确保居民电费不因此上涨。 - **保护水资源**:采用闭环冷却系统,用水量仅相当于普通办公楼,最大限度减少对当地水资源的压力。 - **创造就业机会**:预计将创造超过 **2,500个工会建筑岗位**、450个永久现场岗位、1,500个县级岗位以及1,000个间接岗位,重点雇佣密歇根本地熟练工人。 - **社区投资**:OpenAI联合Related Digital、甲骨文、Walbridge和黑石集团,向萨林市娱乐中心捐赠 **1,000万美元**,用于社区优先设施改造。此外,项目在租赁期内预计产生 **10亿美元税收**,用于支持当地学校和服务。 - **AI教育与培训**:作为更广泛承诺的一部分,OpenAI将投入 **4,500万美元**,用于提供AI工具和培训机会,确保当地居民能够分享技术红利。 **行业背景与意义** “The Barn”是OpenAI“星际之门”计划的首个大型数据中心,标志着AI基础设施从概念走向落地。当前,全球AI算力需求呈指数级增长,大规模数据中心成为支撑模型训练与推理的关键。密歇根州凭借政府支持、能源资源和劳动力优势,正成为AI基础设施投资的热土。该项目不仅巩固了OpenAI在算力领域的领先地位,也为其他科技企业树立了“社区友好型”基建的标杆。 **未来展望** 随着项目推进,OpenAI计划进一步扩展在密歇根州的布局,包括设立区域办事处和AI研发中心。州长惠特默表示,该项目将推动密歇根从传统制造业向智能经济转型,创造长期经济活力。

OpenAI26天前原文
撒丁岛人为何抵制可再生能源转型?2700年的入侵与剥削史给出答案

在全球加速拥抱可再生能源的当下,意大利撒丁岛却出现了强烈的抵制声音。当地居民反对风电、太阳能和储能项目,背后是长达2700年被外部势力入侵与资源剥削的历史记忆。 ## 历史创伤与现实困境 撒丁岛的历史是一部被征服与掠夺的编年史。从腓尼基人到罗马人,从比萨共和国到西班牙,再到近代的意大利统一,外族统治者不断开采岛上的矿产、木材和劳动力,却很少回馈当地。二战后,撒丁岛成为意大利的“能源殖民地”:大型火电厂和煤矿为大陆提供电力,却留下污染和健康问题。如今,可再生能源开发商再次将目光投向这片土地,计划建设大规模风电场、太阳能电站和储能设施,但当地居民认为这不过是“新殖民主义”——土地被占用,景观被破坏,而收益大多流向岛外。 ## 能源转型的信任赤字 撒丁岛的案例揭示了全球能源转型中一个被忽视的障碍:历史不公导致的信任赤字。尽管可再生能源对减缓气候变化至关重要,但如果开发过程不尊重当地社区的权利和记忆,就可能触发强烈的反弹。撒丁岛居民并非反对清洁能源本身,而是反对一种自上而下、忽视地方利益的发展模式。他们要求更透明的决策、更公平的利益分配,以及对文化遗产和环境的真正保护。 ## 结语:转型需要和解 撒丁岛的抵制并非孤例。从美国原住民保留地的管道抗议到欧洲乡村的风电争议,历史伤痕正在影响今天的能源政策。要推进公正的能源转型,开发者与政府必须首先承认并解决历史遗留的不公,与社区建立真正的伙伴关系。否则,清洁能源也可能成为新的冲突源。

IEEE AI26天前原文
OpenAI模型破解困扰人类80年的著名数学难题

今年5月中旬,OpenAI宣布其内部AI模型成功否定了**埃尔德什单位距离猜想**(Erdős unit distance conjecture),这是一个在离散几何领域困扰了数学家80年的著名问题。OpenAI将结果提前分享给多位数学家,并公开了他们的反应。菲尔兹奖得主蒂莫西·高尔斯(Tim Gowers)评价称,“毫无疑问,单位距离问题的解决是AI数学领域的一个里程碑”。多伦多大学教授丹尼尔·利特(Daniel Litt)则写道:“这是第一个由AI自主产生、让我本身就感到兴奋的结果,而不仅仅是作为领先指标。”这可以说是AI系统首次找到证明,解决了一个重要的公开猜想。 然而,这并非AI数学能力的突然飞跃,而是此前进步的自然延续。三年前,大语言模型(LLM)连算术题都难以应对;去年,它们才开始在高中数学竞赛中取得优异成绩。今年1月,我在全球最大的数学会议——联合数学会议上了解到,AI系统已开始对数学研究有所贡献,但仅限于受控场景,且需要大量人工解读才能将AI输出转化为可发表的定理。OpenAI的新结果是这一进程的下一步:模型巧妙运用了来自多个数学子领域的现有思想,构建了完整证明,但并未开创真正的新技术。该结果随后已被人类数学家整理和扩展。 这指向一个中期未来:人类数学家与AI模型互补。AI比任何在世的人类都更了解过往工作,也更愿意穷举那些可能无效的繁琐证明策略;但人类仍能对单一问题进行更深入思考,并提出更有趣的问题。不过,这种局面可能不会持续太久——AI在数学上的进步如此迅猛,十年后人类数学家将扮演什么角色,尚不可知。 **背景:埃尔德什单位距离猜想** 保罗·埃尔德什(Paul Erdős)是史上最多产的数学家之一,一生发表了超过1500篇论文。单位距离猜想是他提出的众多问题之一,核心是:平面上n个点中,单位距离(距离恰好为1的点对)的最大可能数量是多少?埃尔德什在1946年提出了上界和下界,但下界长期未被严格证明。OpenAI的模型通过构造一个点集,证明了该下界是紧的(即最优的),从而否定了原猜想的一个变体——实际上,它证明了原猜想中的某个上界并非紧致,而是存在更优的构造。 **对AI数学能力的思考** 尽管这一成就令人瞩目,但不应过度解读。模型并未发明全新数学工具,而是组合了已知技术。这表明当前AI在数学领域的强项是**广度搜索与组合创新**,而非深度概念突破。人类数学家随后对结果进行了清理和推广,说明人机协作模式在现阶段仍是最有效的。然而,随着AI系统持续进步——例如DeepMind的AlphaGeometry、OpenAI的o1系列等——未来AI可能独立发现真正新颖的数学结构。届时,数学研究的范式或将彻底改变。

Ars Technica26天前原文