SheepNav

AI 资讯

每日聚合最新人工智能动态

来源:OpenAI清除筛选 ×

## 速度至上:Codex 让客户反馈直达代码实现 在 AI 产品开发领域,**Braintrust** 作为一家专注于 AI 可观测性与评估的平台,始终致力于提升产品质量。近日,其创始人兼 CEO **Ankur Goyal** 分享了团队如何利用 OpenAI 的 **Codex** 模型(基于 GPT-5.5)彻底改变开发流程——将客户功能请求转化为可预览的代码分支,整个过程仅需数分钟。 ### 从积压到实时迭代 Goyal 指出,此前客户提出的功能请求通常会进入待办列表,等待后期优先级排序。而现在,工程师可以直接将需求复制粘贴到 Codex 中,生成预览分支并立即展示给客户。这种转变的核心在于 **Codex 的终端输出速度**:它能在不降速的情况下打印大量文本,这是其他模型难以复现的特性。 > “听起来很简单,但 Codex 的终端输出速度极快,其他模型无法做到这一点。最大的收获就是速度。”——Ankur Goyal 速度带来的不仅是效率提升,更是交互方式的变革。Goyal 表示,速度差异让他与 Codex 的互动方式与其他模型截然不同。团队现在能够将迭代融入日常开发流程,而非让需求等待。 > “Codex 让我们能够实时尝试客户功能请求。以前,如果收到一个功能请求,它会进入积压,然后被排期。现在,我们可以复制粘贴请求,创建预览分支,并在几分钟内向客户展示完成的结果。” ### 自主解决问题的可能性 对于 Goyal 而言,Codex 改变了尝试新想法所需的准备工作。使用其他模型时,他需要手动引导模型解决特定问题;而使用 Codex 时,他只需编写一个演示问题的测试,创建沙箱环境,然后让 Codex 在环境中自主运行。这种 **自主解决问题** 的能力降低了实验成本,扩大了工程实验的范围。 > “Codex 最酷的一点是,我们可以与客户实时迭代和构思功能请求。我们写的代码越多,能解决的客户问题就越多,而 Codex 是目前最有效的方式。” ### 团队快速迁移与商业价值 令人瞩目的是,在引入 Codex 的一个月内,**Braintrust 团队中 50% 的成员** 转向了 Codex。这种快速采纳反映了 Codex 在提升开发效率方面的显著成效。对于一家面向企业、服务北美技术行业的公司而言,更快的反馈循环意味着更高的客户满意度和更快的产品迭代。 Goyal 强调,速度不仅是工具属性,更是一种改变工作流程的催化剂。Codex 让 Braintrust 能够以更低的成本进行更多实验,从而解决更多客户问题。这种能力在竞争激烈的 AI 市场中尤为重要——快速响应客户需求已成为核心竞争优势。 ### 小结 Braintrust 的案例展示了 Codex 如何将 AI 模型从辅助编码工具转变为开发流程的核心引擎。通过大幅缩短从需求到代码的周期,Codex 不仅提升了工程师的生产力,更重塑了团队与客户的互动方式。对于追求快速迭代的 AI 企业而言,这种速度驱动的开发模式或许将成为标配。

OpenAI2天前原文

波士顿儿童医院(Boston Children’s Hospital)正将人工智能从实验性工具升级为基础设施级别的核心能力。该院通过整合OpenAI技术(包括ChatGPT企业版)到临床与运营流程中,已成功诊断**超过40例此前长期无法确诊的罕见病**,同时节省了**6万小时的人工工时**,并重新部署了**价值700万美元**的劳动力资源。 ### 从“一次性方案”到“企业AI层” 波士顿儿童医院是全球最大的儿科医疗机构之一,每年服务近100万门诊患者,涵盖40多个专科。和许多医疗系统一样,它面临着财务紧张与行政负担加重的双重压力。从发票处理到排班协调,大量重复性工作消耗着医护人员的精力。 最初,医院尝试了零散的AI应用——比如文档处理和翻译工具。但很快,首席创新官John Brownstein意识到这种“一次性方案”的局限:“你不能只靠一个个孤立的解决方案。”于是,医院转向构建一个**企业级AI层**:一个安全、内嵌的ChatGPT实例,能够与现有系统深度集成,覆盖从财务到临床的多个场景。 ### 罕见病诊断:打破人类认知极限 在临床端,AI的价值尤为突出。罕见病病例往往涉及碎片化的基因数据、不完整的病史以及海量的医学文献。即使是在顶尖研究机构,医生也无法快速综合所有信息来做出诊断。Brownstein直言:“问题不在于努力不够,而在于人类认知的极限。” 通过AI辅助分析,医院团队能够**将基因数据、临床记录与最新研究进行交叉比对**,从而锁定此前被忽略的病因。目前,已有超过40种罕见病在这一流程下获得确诊——这些病例之前都曾被认为“无解”。 ### 运营效率:50多个自动化流程支撑日常 除了诊断突破,AI在运营层面的效果同样显著。医院部署了**超过50个自动化工作流**,覆盖供应链、计费和排班等领域。这些流程累计节省了6万小时的人工时间,相当于将价值700万美元的人力重新调配到更高价值的任务上。 例如,发票处理从手动逐条核对变为AI自动匹配与异常标记;排班系统则能根据历史数据和实时需求动态优化。这些改进直接降低了运营成本,也让医护人员有更多精力专注于患者。 ### 行业启示:AI作为医疗基础设施 波士顿儿童医院的实践表明,AI在医疗领域的真正潜力不在于替代医生,而在于**扩展人类能力边界**。当AI被作为基础设施而非孤立工具来部署时,它能够同时解决效率瓶颈和认知局限这两个核心问题。 对于其他医疗机构而言,这一案例提供了清晰的路径:从顶层设计开始,构建安全、可扩展的企业AI平台,而非零散采购工具。正如Brownstein所强调的,**“AI必须成为医院运营的‘操作系统’,而不是一个附加功能。”** 随着更多医院跟进类似策略,AI辅助诊断有望从罕见病拓展到更广泛的临床领域,医疗系统也将逐步从“被动治疗”转向“主动发现”。

OpenAI2天前原文

OpenAI 于 2026 年 5 月 29 日宣布推出 **Rosalind Biodefense** 计划,旨在通过受信访问模式,将前沿 AI 能力交给经过审查的开发者和美国政府合作伙伴,用于生物防御、公共卫生和流行病防范。此举是 OpenAI 更广泛防御加速战略的一部分,包括开发医疗对策、建立早期预警系统、加强诊断和响应能力,以及支持稳健的评估生态。 ## 核心举措 Rosalind Biodefense 面向两类群体: - **开发者**:可申请构建新的生物防御和流行病防范应用。 - **美国政府及盟友合作伙伴**:可申请受信访问 **GPT‑Rosalind**,支持公共卫生与生物防御任务。 OpenAI 强调,随着 AI 在生物学领域的能力增强,必须确保防御者拥有同样强大的工具,并建立负责任的部署结构。 ## 安全与韧性基础 自 2025 年 7 月发布 ChatGPT agent 起,OpenAI 已将其视为生物学领域的“高能力”模型,并启动了《准备框架》下的多层防护: - 生物专用能力评估 - 针对双重用途生物请求的安全行为训练 - 专家红队测试 - 高风险能力的安全管控 Rosalind Biodefense 正是这一安全策略的延伸,通过受信访问将高级能力精准交付给可信的防御方。 ## 行业背景与意义 当前,AI 在蛋白质设计、基因编辑、流行病预测等领域加速突破,但同时也带来生物安全风险。OpenAI 的选择是“防御优先”,而非单纯限制能力。通过为政府机构和受信开发者提供专用工具,可在不公开高风险能力的前提下,推动疫苗研发、病原体监测和应急响应等关键任务。 这一模式与业界“负责任的 AI 部署”趋势一致,也为其他 AI 公司提供了参考:如何平衡创新与安全,让前沿技术优先服务于公共利益。

OpenAI2天前原文

OpenAI 近日发布了一份关于第三方 AI 评估的指导性文章,分享了在评估前沿模型能力和安全性方面积累的经验,并提出了设计有效评估的建议。文章指出,随着模型能力的进化,评估方式也需要随之改变,从简单的“问答式”转向更复杂的“环境+任务”模式。评估报告应明确测试的“主张”和“有效性证据”,并关注奖励黑客、拒绝回答、数据污染等影响结果有效性的因素。

OpenAI2天前原文

全球软件承包巨头 Endava 正通过 OpenAI Codex 重塑其交付模式,将资深工程师的经验“编码”为智能体,与团队并肩工作。其欧洲 CTO Joe Dunleavy 表示,需求分析时间已从“数周”缩短至“数小时”,代码质量也呈指数级提升。 ## 从“写代码”到“管代码” 对于一家为银行、保险、零售和媒体客户交付高质量软件的企业而言,Endava 的角色正发生根本转变。Joe Dunleavy 指出:“我们过去自己写大量代码,现在则转为监督 Codex 产出的工作。”这一转变使得小团队能在极短时间内交付巨大价值,这正是他们自称“智能体组织”的底气——将资深专业知识固化到智能体中,贯穿从需求接入、构思到交付的整个客户参与生命周期。 ## 技能放大:资深经验的可复制性 Endava 全球智能体架构高级副总裁 Mike Krolnik 强调,Codex 改变了资深与初级工程师的协作方式。“像我这样来自复杂环境的资深架构师,能够表达出想要什么,Codex 则将其转化为团队中初级成员可理解的信息。”初级开发者可以接手通常留给资深工程师的任务,而 Codex 充当实时的最佳实践与架构决策指南。Krolnik 补充道:“我可以给 Codex 一个观点,当开发人员工作时,它会帮助他们理解这个观点。他们可以就自己不懂的地方提问。作为开发过程中的学习工具,我能将自己的经验编码,让 Codex 与团队一起传授更好的软件架构与开发实践。”这种知识转移成为智能体组织的核心价值之一——原本需要数年结对编程、代码审查和指导才能获得的资深判断力,现在团队可以实时与之协同。 ## 行业启示:智能体组织的新范式 Endava 的实践为软件服务行业提供了重要参照。在 AI 编码工具日益普及的背景下,如何将工具从“辅助写代码”升级为“组织能力的基础设施”成为关键。Endava 没有简单地将 Codex 视为效率工具,而是将其嵌入到组织架构和人才培养体系中。这种模式不仅加速了交付,更创造了可复制的“经验杠杆”——资深工程师的智慧不再受限于个人时间与精力,而是通过智能体持续赋能整个团队。对于面临人才短缺和成本压力的科技企业而言,这或许是一条值得探索的路径。

OpenAI3天前原文

日本最大金融集团之一三菱日联金融集团(MUFG)正通过部署ChatGPT Enterprise,加速向AI原生企业转型。截至2026年5月,已有约35,000名三菱UFJ银行员工在日常工作中使用该工具。MUFG集团CDTO山田忠史表示,AI将从根本上改变金融的本质,而OpenAI的技术与协作让这一愿景成为可能。从2024年10月起,双方开始合作,计划通过生成式AI实现运营现代化、提升效率,并创造全新的客户体验。MUFG不仅将AI视为效率工具,更将其视为拓展人类思维与创造力的方式,致力于构建员工与AI共同学习的文化。 ## 从试点到规模化:35,000名员工的AI实践 2024年10月,MUFG与OpenAI启动合作,探索生成式AI在金融业务中的应用。2026年初,三菱UFJ银行开始分阶段部署ChatGPT Enterprise,目标覆盖约35,000名员工。这一规模在金融行业属于前列,体现了MUFG对AI落地的决心。 MUFG集团CDTO山田忠史强调:“我相信AI将从根本上改变金融的本质。要让AI快速融入组织,关键在于营造一个每位员工都能自然使用AI的环境和文化。”为此,MUFG采取了自上而下的领导承诺与自下而上的员工赋能相结合的策略。 ## OpenAI:从设计到落地的深度伙伴 在选择AI合作伙伴时,MUFG看重的是OpenAI的前沿技术与协作精神。山田忠史评价道:“OpenAI与我们共享成为AI原生公司的愿景。凭借其前沿技术和模型,我们看到了一个能将愿景变为现实的合作伙伴。”OpenAI不仅在技术层面提供支持,更从服务设计到实施落地全程参与,帮助MUFG同时推进客户服务创新和银行业务转型。 ## AI原生:超越效率工具的战略定位 MUFG对AI的定位远不止于提升效率。集团认为,AI是延伸人类思维和创造力的方式,员工与AI可以相互学习,共同构建更好的金融服务。这种理念体现在三个方面: - **运营转型**:通过ChatGPT Enterprise优化内部流程,降低重复性工作耗时。 - **客户体验创新**:利用AI提供个性化、智能化的金融服务,例如智能客服、投资建议等。 - **文化变革**:培养“AI原生”思维,让每位员工都能在日常工作中自然使用AI,形成人机协作的新工作模式。 ## 金融业的AI竞赛:MUFG的先行者优势 在全球金融业,AI已成为竞争焦点。MUFG的大规模部署不仅提升了内部效率,更可能在客户服务、风险控制等领域形成差异化优势。通过OpenAI的先进模型,MUFG有望在零售银行、财富管理、信贷审批等场景中率先推出AI驱动的创新服务。 值得注意的是,MUFG的转型并非一蹴而就。从2024年10月开始探索,到2026年初的规模化部署,整个过程体现了金融机构在技术应用上的谨慎与稳健。随着35,000名员工的逐步接入,MUFG正从“使用AI”迈向“成为AI原生”的新阶段。 ## 未来展望 MUFG的案例为金融行业提供了重要参考:AI原生不是简单的工具部署,而是涉及战略、文化、流程的系统性变革。随着更多员工熟悉AI工具,MUFG有望在内部创新和外部服务上释放更大价值。OpenAI与MUFG的合作也表明,前沿AI技术正在深入垂直行业,推动传统金融服务的重构。

OpenAI3天前原文

OpenAI 于 2026 年 5 月 28 日正式发布《前沿治理框架》(Frontier Governance Framework),这是一份旨在说明其安全实践如何与新兴法律要求保持一致的公开文件。该框架重点回应了**加州《前沿 AI 透明度法案》**以及**欧盟 AI 法案中通用 AI 行为准则**的相关规定。 尽管《准备框架》仍作为 OpenAI 定义和管理高级 AI 系统最严重风险的基石,但《前沿治理框架》将其中相关部分提炼为一份面向公众的治理文件,聚焦具体的监管义务。其覆盖范围包括: - **风险评估与缓解**:涵盖网络攻击、CBRN(化学、生物、辐射与核)风险、有害操纵以及失控风险等关键领域。 - **模型报告与安全风险管理**:要求对模型能力进行定期报告,并建立系统化的安全风险管理流程。 - **事件响应与外部专家输入**:明确事故响应机制,并引入独立外部专家参与评估。 - **框架更新机制**:承诺随着模型能力、评估方法和监管要求的发展,持续迭代该框架。 OpenAI 强调,其内部实践已经超出了当前法律的最低要求,而《前沿治理框架》正是将这些“超额”实践系统化、公开化的尝试。这一举措正值全球 AI 监管加速推进的关键时期——欧盟 AI 法案即将全面实施,美国加州也率先通过了针对前沿 AI 模型的透明度法案。 值得注意的是,OpenAI 并未将《前沿治理框架》视为终点,而是将其定位为“动态文档”。随着技术演进与法规完善,该框架将定期更新,以保持与最新监管环境的同步。 对于行业而言,OpenAI 的这一动作具有双重意义:一方面,它为其他 AI 公司提供了一个将内部安全实践转化为合规框架的可参考模板;另一方面,它也向监管者传递了信号——行业领先者愿意主动拥抱透明度与问责制。 在 AI 安全日益成为全球焦点的当下,《前沿治理框架》的发布不仅是一次合规动作,更是对“负责任 AI”理念的一次实质性落地。

OpenAI3天前原文

思科(Cisco)与OpenAI正通过Codex重新定义企业级软件工程。这一合作不仅让思科在AI原生开发上实现规模化,还加速了其AI安全产品AI Defense的构建,并将缺陷修复效率提升了10-15倍。 ## 从工具到队友:Codex的进化 对于思科这样一家运营着全球最复杂、最关键软件系统的企业而言,生成式AI的成熟意味着必须找到一种既能保障安全合规、又能真正落地的工程化路径。思科没有将Codex当作一个独立的开发者效率工具,而是直接将其嵌入生产级工程流程,与庞大的多仓库系统、C/C++密集代码库以及全球企业的安全与治理要求深度融合。 这一过程中,Codex从“开发者生产力工具”演变为“企业级AI工程队友”。思科工程领导层成员Ching Ho表示:“我发现将Codex集成到思科企业软件生命周期工作流中的新机会非常令人兴奋。与OpenAI团队合作让Codex达到企业生产就绪状态,也让我收获良多。” ## AI Defense:从几个季度压缩到几周 AI Defense是思科推出的端到端AI安全解决方案,旨在防范AI引入的安全与风险。Codex在该产品的构建中发挥了核心作用——**思科团队使用Codex编写了AI Defense的绝大部分代码,以及几乎所有正在构建的新功能**。 思科AI软件与平台高级副总裁兼总经理DJ Sampath指出:“原本需要几个季度才能交付给客户的功能,现在缩短到了几周。”这种效率飞跃背后,是Codex对复杂工程任务的深度理解与自动化能力。 ## 数据说话:效率与规模的突破 思科部署Codex后取得了一系列可量化的成果: - **95%以上的新AI功能由Codex编写** - **使用Codex CLI后,缺陷修复吞吐量提升10-15倍** - **每月节省超过1500个工程工时** 这些数字表明,Codex已从辅助编码工具升级为工程流程的核心驱动力,尤其在大规模、高复杂度的企业环境中,其价值尤为突出。 ## 更广泛的安全生态:Daybreak计划 思科的工作还体现了其在推进AI安全方面的更广泛角色。思科是参与OpenAI Daybreak计划的主要安全组织之一。该计划将OpenAI模型、Codex与安全合作伙伴结合在一起,以加速网络防御并持续保护软件安全。这意味着Codex不仅改变思科自身的工程方式,也在重塑整个行业的安全开发范式。 ## 小结 思科与OpenAI的合作案例表明,企业级AI工程化已经进入新阶段。当AI工具被深度整合到生产流程、安全合规体系以及大规模代码库中时,它带来的不仅是效率提升,更是产品交付节奏与质量的根本性改变。对于其他寻求AI原生转型的企业而言,思科的经验提供了一个可参考的范本:从“用AI写代码”到“与AI共同构建系统”,关键不在于工具本身,而在于如何将AI嵌入到企业最核心的工程血脉中。

OpenAI4天前原文

OpenAI 与 Thrive Holdings 共同为 Crete 旗下 30 多家会计师事务所开发了 Tax AI,该系统基于 Codex 构建,能够在生产环境中自动从使用反馈中学习并改进。在试点季中,Tax AI 处理了 7000 份纳税申报表,大幅节省了数据录入时间,并且系统性能在三个月内实现了可量化的自我提升。 ## 从手动调试到自动进化 传统 AI 系统部署后,工程师需要手动分析失败案例、调整提示词,再重新部署。这个过程耗时且依赖人工。Tax AI 的突破在于:它利用 Codex 的**前沿智能体能力**,将生产环境的实际使用转化为结构化信号,驱动系统自主改进。 ## 税务场景的痛点 Crete 的会计师每个报税季要准备数万份申报表,处理数百万份底层文档。对于中高复杂度的申报,仅数据录入就需要每份 **8 小时**,涉及杂乱的数据源、往年文档以及手动提取和计算。Tax AI 的目标就是自动化这一瓶颈环节。 ## 可量化的自我改进 在本次试点中,Tax AI 处理了 7000 份 1040 和 1041 申报表。更值得注意的是,**三个月后系统的性能明显优于初始部署版本**。它通过内置的评估基础设施,直接连接从业者的实际工作流,让 Codex 能够持续优化提取、计算和提交逻辑。 ## 启示 Tax AI 展示了一条新路径:不是让工程师去修复每个失败案例,而是让系统自己从实践中学习。这种“生产即训练”的模式,可能成为未来专业 AI 代理的标准范式。

OpenAI4天前原文

初创公司 Warp 正借助 OpenAI 最新模型 GPT-5.5,将其终端产品从“开发者工具”升级为“代理化开发平台”。通过开源终端客户端并引入 Open Agentic Development 模式,Warp 让人类开发者定义目标、监督结果,而 AI 代理则负责规划、编码、测试甚至提交 Pull Request。在内部基准测试中,GPT-5.5 比上一代模型减少了 30% 的 token 消耗,使长期运行的代理工作流更加高效。目前,Warp 已拥有近 100 万开发者,覆盖超过 56% 的财富 500 强企业,其内部 90% 的 Pull Request 由代理协同创建。CEO Zach Lloyd 表示:“通过与社区共同监督代理集群,我们可以更快地交付更好的 Warp。”这一模式预示着软件开发的未来:代理写代码,人类做决策。

OpenAI4天前原文

2026年将是生成式AI普及后的第二个重大选举年。OpenAI在2024年基础上持续深化选举保护措施,聚焦四大方向:提供可靠投票信息、支持网络防御者、提升AI内容透明度、打击滥用行为并监控模型偏见。 ## 可靠信息获取 用户已通过ChatGPT查询选举相关问题,如注册、投票地点、截止日期等。OpenAI与合作伙伴协作,引导用户获取权威信息。今年秋季起,在美国和巴西,OpenAI将提供美联社的实时计票结果;在美国,还将与Democracy Works合作,展示投票地点等可靠信息。全球范围内,将继续优化网络搜索功能,提供带来源链接的答案。 ## 网络基础设施防御 OpenAI认为AI在加固数字基础设施中扮演关键角色。近期推出的Daybreak项目旨在改变软件构建与防御方式,提升软件安全性与韧性,包括支持选举执行的相关系统。 ## AI内容透明度与偏见监控 OpenAI持续提升生成内容的透明度,并监控模型偏见,确保ChatGPT的回应保持政治中立。自2024年以来,已改进ChatGPT在选举话题和突发新闻上的信息质量,通过联网搜索提供更准确的答案并附带来源链接。 ## 小结 2026年,OpenAI通过技术合作与产品优化,致力于在信息准确性、网络安全和内容透明度三个维度为全球选举保驾护航,同时保持模型的政治中立性。

OpenAI4天前原文

OpenAI 宣布与巴西两大媒体集团 Grupo Folha 和 Grupo UOL 达成战略内容合作,这是 OpenAI 在巴西的首个媒体合作伙伴关系。即日起,全球超过 9 亿周活跃 ChatGPT 用户将能够通过 ChatGPT 获取来自《圣保罗页报》和 UOL 的高质量新闻报道摘要,并附有原文链接。 ## 合作背景与意义 巴西是 ChatGPT 全球最大的市场之一,拥有超过 **5000 万月活跃用户**,日均消息交换量约 **1.4 亿条**。此次合作将帮助 OpenAI 为巴西用户提供更及时、更具本地相关性的答案,同时支持更广泛的新闻生态系统。 OpenAI 媒体合作副总裁 Varun Shetty 表示:“《圣保罗页报》和 UOL 是巴西最权威的原创报道来源之一。通过让 ChatGPT 用户访问它们的新闻内容,我们希望能带来更有用、更及时、更本地化的回答。” ## 双方表态与行业影响 《圣保罗页报》联合首席执行官 Carlos Ponce de Leon 指出:“AI 将定义新闻业的下一阶段,Folha 希望参与塑造这一未来。通过与 OpenAI 合作,我们将 Folha 置于这一变革的前沿,并创造新方式来扩大可信新闻的覆盖范围、相关性和影响力。” UOL 首席执行官 Paulo Samia 强调:“AI 平台需要可靠的新闻来源,它们与高质量内容创作者合作是自然而然的事。”UOL 内容总监 Murilo Garavello 补充说:“我们希望我们的新闻出现在巴西人使用的每一个环境中,让真实信息尽可能广泛传播。” ## 透明性与溯源机制 此次合作延续了 OpenAI 与全球多家新闻机构(包括美国、英国、法国、德国)的合作模式,核心原则是**强调归属、透明度和原文链接**。ChatGPT 中展示的新闻摘要会明确标注来源,并提供指向原始报道的链接,方便用户深入阅读和核实。 《圣保罗页报》主编 Sérgio Dávila 评论道:“像 OpenAI 这样的人工智能巨头对展示《圣保罗页报》和 UOL 内容感兴趣,这只会强化专业新闻的重要性。” ## 未来展望 随着 AI 技术深度融入内容消费,媒体与 AI 平台的合作模式正在成为行业焦点。OpenAI 与巴西媒体巨头的合作不仅为当地用户提供了可信信息渠道,也为其他市场探索类似合作树立了范例。 对于新闻机构而言,与 AI 平台合作意味着新的受众触达机会和商业模式可能性;对于用户而言,则意味着在 AI 生成内容泛滥的时代,能够更便捷地获取经过专业编辑核实的高质量新闻。

OpenAI6天前原文

OpenAI 近日宣布,其在 2026 年 Gartner 企业 AI 编码代理魔力象限中被评为领导者,旗下的 Codex 产品凭借创新能力和企业级部署表现获此殊荣。目前,Codex 每周已被超过 400 万开发者使用,客户包括 Cisco、Datadog、Dell Technologies 和 NVIDIA 等知名企业。 ## 从自动补全到智能代理 软件开发的范式正在发生根本性转变。开发者不再仅仅依赖 AI 进行代码自动补全,而是将更复杂的任务委托给像 Codex 这样的智能代理。Codex 能够理解大型代码库、调用工具、修改代码、运行测试,并将结果准备就绪供人工审查。这种“速度与控制并存”的能力,让企业团队在加速开发的同时,依然可以维持所需的治理、安全和审计标准。 ## Gartner 评价的核心优势 在 Gartner 的评估中,Codex 在**执行能力**和**愿景完整性**两个维度均获得认可。报告特别强调了 Codex 在**代理式软件开发**、**企业治理**、**沙箱机制**以及**灵活部署选项**方面的突出表现。 具体而言,Gartner 指出了 Codex 广泛的开发者触达面——包括 Codex 应用、IDE 扩展、命令行工具、SDK 以及云端编排能力。同时,企业级控制功能如审批关卡、基于角色的访问控制(RBAC)、可自定义策略、操作系统级沙箱以及可审计的工作空间治理,也成为其获评领导者的关键因素。 ## 真实案例:Cisco 的 AI 防御平台 OpenAI 声称,这些优势使其成为 Cisco 的理想合作伙伴。Cisco 利用 Codex 开发了其 AI Defense 安全平台的大部分代码,将交付时间从原来的几个季度缩短至几周。Cisco 的 AI 软件与平台产品高级副总裁 DJ Sampath 分享了 Codex 如何改变 Cisco 构建软件的方式。 ## 未来方向:前沿模型与深度集成的结合 在 OpenAI 看来,最优秀的编码代理需要将前沿模型能力与深度集成的产品体验相结合。这正是 OpenAI 打造 Codex 的核心理念:让它能够推理复杂任务、使用开发者工具、在受控环境中运行,并提供企业所需的治理、安全和管控能力。 随着 GPT-5.5 的引入,Codex 在工具调用、性能速度和企业软件开发工作流支持方面得到了显著增强。OpenAI 认为,企业不再仅仅询问 AI 能否编写高质量代码,而是开始关注如何安全、可控地将 AI 融入整个软件开发生命周期。

OpenAI9天前原文

维珍航空(Virgin Atlantic)借助 OpenAI 的 Codex 工具,在圣诞出行高峰这一高风险窗口内成功交付了新版移动应用,实现了近乎 100% 的单元测试覆盖率和零 P1 缺陷。这一成果不仅保障了旅客的出行体验,也展示了 AI 辅助编程在企业级软件开发中的巨大潜力。 ## 挑战与窗口 作为一家运营型航空公司,维珍航空对软件上线的稳定性要求极高。其数字工程副总裁 Neil Letchford 表示:“人们正在用这个应用办理登机、登机,我们必须极其谨慎。”圣诞出行季是全年 bug 引入风险最高的时期之一,传统做法往往需要缩减功能或牺牲测试来赶工期。 ## Codex 带来的改变 借助 Codex,维珍航空的工程团队在保持完整功能的同时,大幅提升了代码质量。新应用的单元测试覆盖率接近 **100%**,上线时未出现任何 **P1(最高优先级)缺陷**。Letchford 指出:“在应用交付到客户手中之前,利用 Codex 提升质量,这对我们来说是颠覆性的。” 这种改进不仅体现在新应用上,在遗留代码重构中同样显著。团队维护多年的代码库,重构时间从 **两周** 缩短到 **30 分钟**,代码库体积减少了 **78%–80%**。 ## 更广泛的影响 除了移动应用,维珍航空的分析团队也开始在数据仓库之上直接使用 Codex 构建工具。Letchford 认为,Codex 让团队能够更自信地向领导层汇报“一切就绪”,而不再习惯性地推迟交付。 ## 行业启示 维珍航空的案例表明,AI 代码生成工具不仅适用于初创公司,也能在大型企业的关键业务系统中发挥价值——尤其是在时间紧迫、质量要求苛刻的场景下,Codex 帮助团队在速度与质量之间找到了新的平衡。

OpenAI9天前原文

美国医疗系统 AdventHealth 正在全面部署 **ChatGPT for Healthcare**,以减轻临床工作负担、优化流程并释放更多时间用于患者护理。该机构首席 AI 官 Rob Purinton 指出,AI 在医疗领域的最大挑战并非技术本身,而是让人类安全、持续地使用它。AdventHealth 将“采用”视为核心目标,通过系统化部署实现 **行政任务时间减少 80%**,让医生从繁琐的文档工作中解脱,专注于更高价值的临床决策。 ## 从“观望”到“规模化应用” AdventHealth 横跨美国九个州,每年服务数百万患者。面对紧张的利润空间、不断增长的需求和日益复杂的行政流程,传统工作模式已难以为继。例如,医生顾问在审核病例时,平均每个病例需要花费约 **10 分钟** 完成阅读、识别关键信息、核对标准并撰写结构化理由——这些重复性劳动在数千个病例中累积为巨大的时间成本。 与此同时,员工对 AI 的兴趣早已在组织内部萌发。许多人开始尝试使用聊天机器人,但受限于正式政策而无法大规模应用。Purinton 表示:“我们有些员工迫不及待想尝试,但还有大量人持观望态度,他们不确定如何在日常工作中有效使用 AI。” ## 采用率才是关键 AdventHealth 的领导层很快意识到,零散的试点项目无法带来实质性变革。真正的挑战在于推动大规模、一致且安全的使用。“医疗 AI 中最难的部分是让人类安全地使用它,”Purinton 强调。因此,该机构将 **AI 采用本身视为目标**,而非技术部署的附属品。 通过引入 ChatGPT for Healthcare,AdventHealth 实现了 **80% 的行政任务时间缩减**。自动化文档处理和辅助支持任务让医护团队每周节省数小时,从而将更多精力直接投向患者。这不仅提升了运营效率,还扩大了临床容量、加快了就医速度,并显著改善了患者体验。 ## 超越临床:全链条的 AI 赋能 AI 的价值并不局限于临床场景。财务、人力资源、IT 等部门的员工同样花费大量时间起草文件、总结信息和准备材料。这些必要但耗时的任务长期占据着团队精力,使许多部门陷入“持续运营模式”,难以腾出手进行更高价值的工作。 AdventHealth 的案例表明,在医疗健康领域,AI 的成功落地需要 **自上而下的战略支持** 与 **自下而上的使用意愿** 相结合。当工具足够安全、易用且与工作流无缝集成时,从观望到主动采用的自然转变便会发生。 ## 结语:AI 重塑医疗的“人文”内核 AdventHealth 的实践揭示了一个重要趋势:AI 在医疗中的真正价值不是取代医生,而是将医生“还给”患者。当技术默默承担起文档、审核、协调等幕后工作时,临床工作者得以回归医疗的本质——人与人之间的关怀与决策。

OpenAI10天前原文

OpenAI 在数学推理领域取得里程碑式突破。其内部通用推理模型成功解决了困扰数学界近 80 年的**平面单位距离问题**,推翻了该领域自 1946 年以来的核心猜想。该成果已被外部数学家验证,标志着 AI 首次独立攻克一个子领域内的著名开放问题。 ## 问题背景:从 Erdős 到今日 1946 年,匈牙利数学家 Paul Erdős 提出了一个看似简单的问题:如果在平面上放置 n 个点,最多能有多少对点之间的距离恰好为 1?这便是**平面单位距离问题**,也是组合几何中最著名、最难解的问题之一。Erdős 本人曾为此设立奖金。长期以来,学界普遍认为“方格点阵”构造在最大化单位距离对数方面已接近最优——这一信念持续了约 80 年。 ## 突破:AI 给出反例 OpenAI 的一个**通用推理模型**(并非专为数学设计,也未针对该问题做特别训练)在测试一组 Erdős 问题时,意外地找到了一个**无限族反例**,证明了原猜想不成立。这些新构造在多项式意义上优于方格点阵,从而推翻了长期以来的猜想。 外部数学家团队已审阅并验证了该证明,并撰写了配套论文来解释论证过程及其意义。值得注意的是,该模型并未依赖专门的数学搜索工具或脚手架,而是凭借**通用推理能力**独立完成证明。这是 AI 第一次自主解决一个在数学子领域中具有核心地位的开放问题。 ## 意义与展望 这一成果不仅是对离散几何的重要贡献,更标志着 AI 推理能力的跃升。数学因其精确性和可验证性,成为测试 AI 推理能力的理想场所。OpenAI 表示,该模型在多个 Erdős 问题上的表现,展示了深度推理系统在**前沿研究**中的潜力。未来,AI 或将成为数学家的得力助手,协助发现新定理、构造反例,甚至独立开辟新的研究方向。

OpenAI11天前原文

在伦敦教育世界论坛上,OpenAI 分享了其“国家教育计划”(Education for Countries)的早期进展,并宣布新加坡正式加入。该计划于今年达沃斯论坛启动,首批成员包括爱沙尼亚、希腊、意大利(CRUI)、斯洛伐克、特立尼达和多巴哥、哈萨克斯坦、阿联酋及约旦。计划围绕三大支柱展开:**研究驱动的部署**(使用学习成果测量套件评估AI影响)、**本地化AI工具**(提供合规的ChatGPT、Codex及API平台)以及**教师培训与赋能**(AI素养、专业发展与认证)。 爱沙尼亚作为数字先锋,其教育部通过AI Leap基金会已在**全国20,000多名学生和4,600名教师**中部署ChatGPT Edu,实现本地化体验并建立负责任的采用基础。OpenAI强调,随着AI工具快速发展,负责任部署不能事后弥补,需要政府主导的大规模研究伙伴关系。目前全球每周有**超过9亿人使用ChatGPT**,超过400万人使用Codex,代理型AI有望将更大的创造力、智力和技术能力交到每位学生手中。

OpenAI11天前原文

Ramp 的 AI 开发者体验团队正在利用 OpenAI Codex(基于 GPT-5.5)来加速代码审查并开发内部代理工具。通过 Codex 的深度推理能力,工程师们能在几分钟内获得实质性的拉取请求反馈,而非过去数小时的等待。Codex 的审查覆盖了人类审查者常遗漏的细节,已成为 Ramp 代码审查流程中的强制性环节。此外,团队还基于 Codex 构建了“On-Call Assistant”代理,大幅减轻工程师在值班轮换中的负担。 ## 代码审查的行业标杆 Ramp 的 AI DevEx 负责人 Austin Ray 指出,Codex 的代码审查“是行业金标准”。工程师们会主动要求 Codex 审查每一个 PR,其深度和全面性甚至超过大多数人类审查者。Codex 不仅能在 CLI 中满足偏好底层操作的工程师,其应用程序也提供了丰富的视觉提示和实用工具,帮助团队提升工作效率。 ## 从审查到自动化工具 除了代码审查,Ramp 还利用 Codex 开发了 **On-Call Assistant**——一个代理工具,能够接管值班轮换中的大部分工作。Ray 表示,值班任务往往复杂且耗费精力,而 Codex 结合 GPT-5.5 后,能高效处理这类复杂性,减少工程师的精神负担和专注时间。 ## 未来展望 Ramp 的实践表明,AI 不仅能辅助代码审查,还能进一步深入开发流程,自动化繁琐的运维任务。随着 Codex 能力的持续进化,开发者体验和生产力有望迎来更大突破。

OpenAI11天前原文

2026年5月19日,在ATxSummit峰会上,OpenAI宣布启动“OpenAI for Singapore”计划,与新加坡数字发展及信息部(MDDI)合作,支持其国家AI战略。该计划获得超过**3亿新元**(约合人民币16亿元)的承诺资金,聚焦三大领域:帮助本地组织部署前沿AI并解决最棘手问题;培养本地下一代AI人才;让更多新加坡个人和企业受益于AI。 作为核心举措,OpenAI将在新加坡设立其**首个海外“应用AI实验室”(Applied AI Lab)**,未来几年内创造超过200个技术岗位,并将新加坡打造为全球**前向部署工程师**(Forward-Deployed Engineer)枢纽之一。这些工程师将直接与企业合作,将前沿研究转化为实际应用,重点覆盖**公共服务、金融、医疗和数字基础设施**等国家AI使命优先领域。 OpenAI首席营收官Denise Dresser表示:“新加坡拥有优秀的技术人才、值得信赖的机构以及利用AI推动长期增长的明确雄心。通过这一伙伴关系,我们希望帮助更多组织受益于前沿AI,支持本地AI人才成长,并扩大全国范围内对这些工具的获取。” 此举标志着OpenAI首次在海外建立深度本地化研发与部署能力,也凸显新加坡作为全球AI领导者的吸引力。随着团队扩张,OpenAI还计划逐步扩大在当地办公室的规模。

OpenAI11天前原文

OpenAI 与戴尔科技宣布合作,旨在将 AI 编程助手 **Codex** 部署到企业的混合云和本地(on-premises)环境中。这一举措标志着 Codex 从云端的开发者工具向企业级 AI 代理平台的关键跃迁。 ## 合作背景与核心内容 Codex 已成为 OpenAI 增长最快的企业产品之一,**每周有超过 400 万开发者使用**。企业不仅用它辅助代码审查、测试覆盖和事件响应,还开始将其用于跨工具的信息收集、报告生成、产品反馈路由、销售线索筛选等业务场景。 然而,许多企业的核心数据、系统和流程仍运行在本地或混合云环境中。为了规模化部署 AI 代理,企业需要 Codex 在安全可控的前提下接入这些内部环境。为此,OpenAI 与戴尔达成合作: - **集成戴尔 AI 数据平台**:Codex 将连接戴尔的 AI 数据平台,该平台已用于本地数据存储、组织和治理,使 Codex 能更贴近企业的代码库、文档、业务知识和团队工作流。 - **探索戴尔 AI 工厂**:双方还将研究 Codex、ChatGPT Enterprise 及其他 API 解决方案如何与戴尔 AI 工厂协同,以在混合或本地基础设施上完成数据准备、系统管理、测试运行和 AI 应用部署。 ## 行业意义与影响 戴尔基础设施解决方案集团 CTO Ihab Tarazi 表示:“与 OpenAI 的合作将戴尔业界领先的企业级基础设施与 OpenAI 前沿的代理 AI 模型结合起来,让企业能在数据所在的位置——本地环境中——安全地大规模部署 AI 代理。” 对于企业客户而言,这意味着一条更务实的 AI 落地路径:无需将所有数据迁移至云端,即可在本地获得强大的 AI 能力,同时保持对数据的控制权。这一合作也反映出 AI 行业从“通用云服务”向“混合云+本地化”部署模式的转变,尤其对金融、医疗、制造等对数据主权要求严格的行业至关重要。 ## 未来展望 随着 Codex 从编程助手扩展到更广泛的业务代理场景,其与戴尔基础设施的深度集成将加速企业 AI 应用的普及。可以预见,未来更多企业将采用“混合 AI”策略,在本地和云端之间灵活调度 AI 工作负载,而 OpenAI 与戴尔的合作正是这一趋势的典型注脚。

OpenAI13天前原文