AI 资讯

每日聚合最新人工智能动态

全部 🔥 精选 🆕 新上线 🔄 更新

721

Your old Android phone can be turned into a dashcam for free - how I did it in 5 easy steps

新上线

Want a dashcam? Before buying one, repurpose an old phone. It's free, takes minutes, and works well.

ZDNet AI20天前原文

722

SpaceX 被曝研发 AI 设备原型：比 iPhone 更薄，自带 xAI 技术

新上线

据《华尔街日报》报道，SpaceX 在上市前曾向投资者展示了一款“手持设备状”的 AI 设备原型。该原型比 iPhone 更薄更轻，设计可能介于小型触屏手机与 Rabbit R1 之间。不过，Elon Musk 已否认该报道，称其“完全虚假”。如果消息属实，这将是 SpaceX 进军无线通信领域的又一信号。SpaceX 旗下 Starlink Mobile 已有潜力与 Verizon、AT&T 等运营商竞争，而 AI 设备可能成为其生态的延伸。分析师甚至猜测，SpaceX 可能收购 T-Mobile 或 AT&T 以加速布局，但成本将极其高昂。从技术能力看，SpaceX 及其姊妹公司 Tesla 在制造和芯片供应方面具备优势，有能力大规模生产 AI 设备。据报道，该原型将运行专有操作系统，并整合 Musk 旗下 xAI 的技术——SpaceX 此前已收购 xAI。这一设计旨在摆脱对 Android 等第三方平台的依赖，构建原生 AI 交互体验。值得注意的是，OpenAI 也在与苹果前设计总监 Jony Ive 合作开发 AI 设备，Sam Altman 称其将比 iPhone 更“平和”。然而，Humane、Rabbit 等公司的 AI 设备此前均未获得市场成功，消费者对这类产品的接受度仍是未知数。 Musk 的否认给此事增添变数，但考虑到他过去多次“先否认后推进”的作风，SpaceX 的 AI 设备计划仍值得关注。若项目成真，它将与 OpenAI 形成直接竞争，并可能重新定义移动设备的形态。

TechCrunch20天前原文

723

阿什顿·库彻离开 Sound Ventures，与摩根·贝勒联手创办新风投公司

新上线

阿什顿·库彻（Ashton Kutcher）即将离开他共同创立的 Sound Ventures，并与前合伙人摩根·贝勒（Morgan Beller）联手创办一家新的风险投资公司。Sound Ventures 以其在顶级 AI 实验室中集中、高信念的押注而闻名，而库彻的新基金似乎将目光投向了这些公司之下的底层——即支撑它们的基础设施和能源领域。这一动向反映了 AI 投资领域的重心正在从模型本身转向支撑模型运行的基础设施。随着 AI 算力需求激增，能源和硬件基础设施成为新的投资热点。库彻的新基金将专注于这一“底层”机会，包括数据中心、能源解决方案和芯片设计等领域。贝勒此前曾参与 Sound Ventures 的投资工作，并以其在加密货币和 Web3 领域的洞察而知名。两人的合作将结合库彻在娱乐和科技领域的广泛人脉与贝勒在技术投资方面的经验。行业观察人士指出，这一转变可能预示着风投对 AI 投资策略的进一步分化：一部分基金继续押注前沿模型和算法，另一部分则转向更“笨重”但需求确定的基础设施。库彻的举动表明，他相信 AI 的下一个增长点不在于软件，而在于支撑软件的物理世界。目前，新公司的名称和具体投资规模尚未披露，但预计将在未来几个月内正式启动。

TechCrunch20天前原文

724

我测试了新款模块化ThinkPad，这正是我期待的可修复未来

新上线

在CES上亮相的**第14代联想ThinkPad X1 Carbon Aura Edition**，凭借重新设计的双面主板和模块化组件，为笔记本电脑的可修复性树立了新标杆。ZDNet的编辑在亲身体验后表示，这款设备代表了“我期待的可修复未来”。 ## 模块化设计的核心亮点 ThinkPad X1 Carbon Aura Edition 的最大革新在于其**双面主板**设计。与传统主板将所有组件集成在单面不同，双面布局将处理器、内存等核心部件分布在主板两侧，使得关键模块更易于更换。此外，设备采用了**模块化接口**，用户无需专业工具即可拆卸或更换USB-C端口、散热风扇等易损部件。这种设计不仅降低了维修门槛，还延长了设备的使用寿命，减少了电子垃圾。 ## 对行业的意义在智能手机领域，模块化设计（如Fairphone）已取得一定进展，但笔记本电脑市场仍以焊接组件和封闭结构为主。联想此举可能推动行业变革：一方面，企业用户可降低长期维护成本；另一方面，环保组织对减少废弃物的呼吁也有了回应。不过，模块化设计是否会影响设备轻薄度或性能，仍需市场验证。 ## 性能与体验除了可修复性，该机型还搭载了**英特尔酷睿Ultra处理器**（第14代），并配备OLED显示屏和高达64GB的LPDDR5x内存。在测试中，其性能和续航表现均属顶尖水平，并未因模块化而妥协。联想还强调，新设计通过了军规级耐用性测试，确保模块结构稳定。 ## 总结 ThinkPad X1 Carbon Aura Edition 不仅是联想对“用户维修权”运动的回应，更是对可持续技术的一次务实探索。它证明了高性能与可修复性可以共存，为消费者提供了一个既环保又实用的选择。

ZDNet AI20天前原文

725

为何公众演讲技能值得投资

新上线

在当今职场中，技术能力固然重要，但软技能往往成为职业发展的关键分水岭。**公众演讲**正是这样一项被低估却极具回报的投资。它不仅能提升个人领导力，还能增强职业可见度与持久性。 ## 演讲：领导力的核心优秀的领导者往往是出色的沟通者。当你能清晰、有说服力地向团队或公众表达观点时，你自然会被视为权威和引领者。无论是内部会议、行业大会还是客户提案，演讲能力都能帮你建立信任，推动决策。 ## 可见度与职业机会在信息过载的时代，能够有效传递信息的人更容易脱颖而出。通过演讲，你可以打造个人品牌，扩大专业网络，甚至获得晋升或合作机会。数据显示，擅长演讲的职场人士获得领导职位的概率显著更高。 ## 持久性的价值与某些快速过时的技术不同，演讲能力具有长期价值。它不会因行业变迁而贬值，反而随着经验积累而愈发精进。投资于演讲培训、加入俱乐部（如Toastmasters）或主动争取发言机会，都是低成本高回报的自我提升方式。 ## 如何开始？ - **从小规模开始**：先在团队内分享，逐步过渡到大型场合。 - **寻求反馈**：录制自己的演讲，分析改进点。 - **系统学习**：参加专业课程或工作坊。总之，公众演讲是一项值得每个人认真对待的长期投资。它带来的领导力、可见度和职业韧性，将让你在AI与自动化时代依然保持不可替代的竞争力。

IEEE AI20天前原文

726

在 AWS GovCloud (US) 上通过 Amazon Bedrock 运行 NVIDIA Nemotron 和 OpenAI GPT OSS 模型

新上线

美国联邦政府机构现在可以在 AWS GovCloud (US) 环境中使用前沿的开放权重基础模型。亚马逊云科技宣布，Amazon Bedrock 现已支持 OpenAI 的 GPT OSS 模型（120B 和 20B）以及 NVIDIA 的 Nemotron 系列模型（Nano 9B v2、Nano 12B v2、Nano 30B、Super 120B），所有推理均在 AWS GovCloud 隔离边界内完成。 ## 安全合规与数据驻留 AWS GovCloud (US) 专为托管敏感数据和受监管工作负载而设计，其区域位于美国境内，由美国公民管理，支持 FedRAMP High、DoD SRG Impact Levels 2/4/5、ITAR 和 CJIS 等合规框架。通过 Amazon Bedrock，机构可以在不将敏感数据移出合规边界的前提下，调用高性能 AI 模型，满足情报分析、任务规划、合同审查、安全日志分析等关键任务需求。 ## 模型能力与灵活性此次新增的模型覆盖了从 9B 到 120B 参数规模的多种选择，兼顾效率与性能。**OpenAI GPT OSS 模型**（120B 和 20B）适用于复杂推理与文本生成；**NVIDIA Nemotron 系列**则提供从轻量级 Nano 到高性能 Super 的多种规格，适配不同计算约束场景。通过统一的 API，用户无需修改代码即可在多个模型间切换，选择最适合特定用例的模型。 ## 统一的推理体验 Amazon Bedrock 作为完全托管服务，所有推理均在 AWS 基础设施上运行，确保性能与安全。用户可以通过单一 API 访问包括 OpenAI、NVIDIA 在内的多种模型，简化 AI 应用开发与部署流程。这一发布标志着 AWS GovCloud 在支持前沿 AI 能力方面迈出重要一步，为政府机构提供了兼顾创新与合规的 AI 基础设施。

AWS ML20天前原文

727

AI 行为不端？现在你可以公开举报了

新上线

你是否曾担心你的 AI 聊天机器人在试图制造炸弹或泄露你的个人信息？现在有一个专门的网站可以让你发出警报。一群 AI 研究人员创建了一个名为 **FLARE-AI**（Flaw Reporting for AI）的众包网站，用于报告和追踪 AI 的危害行为。例如，如果聊天机器人生成恶意软件、提供制造炸弹的配方、泄露个人隐私或引发用户的妄想思维，用户都可以通过 FLARE-AI 进行举报。该系统采用开源代码，允许他人验证问题，并将报告转发给模型制造商以及像 MITRE 这样的非营利组织（该组织专门追踪技术系统的问题）。这有点像 Downdetector，后者汇总用户关于应用程序和网站等全球服务中断的实时报告。该网站是研究团队在 AI 报告方面持续工作的最新一步，我去年曾首次报道过他们的工作。团队成员还参与了今年 6 月宣布的一项国会法案的咨询工作，该法案将让美国政府承担追踪这类 AI 不当行为的核心角色。 “目前，还没有一个集中、可靠的方式来报告 AI 系统的缺陷，”HuggingFace 的 AI 政策研究员 **Avijit Ghosh** 表示，他与计算机科学家 Elaine Zhu 和 Shayne Longpre 共同领导了 FLARE-AI 的开发。这个警报系统是与来自 32 个不同组织的 49 位 AI 专家合作开发的。在一篇概述该工作的论文中，研究人员认为，随着 AI 被更广泛地采用以及自主系统获得更大的权力，他们的倡议可能变得至关重要。他们认为，缺乏一致的 AI 缺陷报告方式是一个重大问题。智库“安全与新兴技术中心”的研究员 **Jessica Ji** 表示：“我认为这是一个非常好的倡议。”她指出，研究人员正确地认识到现有报告机制是零散的，而 AI 模型则是黑箱。“我支持任何能让 AI 更透明的事情，”她说。虽然漏洞和网络安全问题备受关注（尤其是最近），但 Ghosh 告诉我，AI 系统的问题涉及心理伤害、歧视或偏见以及错误信息等主题。他补充说，不同的公司对这些问题有不同的标准，这意味着一些问题会被忽视。FLARE-AI 旨在填补这一空白，提供一个统一的举报平台，让公众的声音能够被听到，并推动 AI 行业更加负责任地发展。

WIRED AI20天前原文

728

构建无服务器 A2A 网关：实现智能体发现、路由与访问控制

新上线

随着企业跨团队、供应商和基础设施部署 AI 智能体，管理智能体之间的通信正成为日益增长的运营负担。没有集中式层，每个新智能体集成都会增加点对点连接、独立凭证和自定义路由逻辑。团队花费工程周期建立连接，而不是构建智能体能力。访问控制变得分散，没有单一位置来强制执行哪些客户端可以访问哪些智能体。其结果是新智能体工作流上市速度变慢，来自不一致身份验证策略的安全风险增加，以及运营开销随网络中每个新智能体的加入而呈二次方增长。 **网关模式**通过在智能体前放置单个入口点来解决这一问题，无论它们是在 Amazon Elastic Container Service (Amazon ECS)、AWS Lambda、Amazon Bedrock AgentCore Runtime、非 AWS 云还是混合环境中运行。它集中处理路由并强制执行细粒度权限，而不会将团队绑定到特定的运行时、框架或编排层。此模式基于 **Agent-to-Agent (A2A) 协议**，该协议标准化了智能体之间的通信方式。没有中央编排器，20 个智能体的部署需要多达 190 个点对点连接。在这篇文章中，您将学习如何在 AWS 上构建一个无服务器 A2A 网关，该网关使用基于路径的路由 (`/agents/{agentId}`) 在单个域后面托管多个智能体。标准的 A2A 客户端无需修改即可工作。该解决方案具有三层： - **管理层**：集中式智能体注册表，支持发现和语义搜索。 - **控制层**：使用 JSON Web Token (JWT) 范围和 Lambda 授权器进行细粒度访问控制。 - **执行层**：具有 OAuth 后端身份验证和服务器发送事件 (SSE) 流式传输支持的单域路由。按照本文操作，您将部署一个由 Terraform 配置的网关，A2A 兼容的智能体可以连接到该网关。 ## 架构概览下图显示了网关的组件以及请求如何流经系统。Amazon API Gateway (REST API) 作为单入口点。该架构使用 REST API，因为 REST API 支持响应流式传输。流式传输对于基于 SSE 的实时智能体响应是必需的。Lambda 授权器检查 JWT 范围并生成 AWS Identity and Access Management (IAM) 策略。

AWS ML20天前原文

729

AgentCore Memory 元数据过滤：为 AI 代理检索精度提效 64%

新上线

## 元数据过滤：让 AI 代理的记忆更精准当你的客户支持代理询问“账单问题”时，却返回了技术支持工单、销售对话中的收据问题以及账单纠纷——这是团队在代理积累数周交互历史后常遇到的**检索精度瓶颈**。仅靠语义相似性搜索会找到所有语义相近的结果，却无法按问题类型、状态或时间等关键维度进行限定。 **Amazon Bedrock AgentCore Memory** 是一项全托管记忆服务，支持 AI 代理跨对话记录和回忆信息。它通过**命名空间**（如 `clients/client-123`）隔离不同实体的数据。但随着记忆增长，相关信号会被语义相似但上下文不相关的结果淹没，仅靠命名空间无法区分。 ### 元数据过滤如何工作？现在，你可以在命名空间隔离之上叠加细粒度的**基于属性的过滤器**，在相似性搜索之前按业务维度（如优先级、部门、时间范围）限定检索范围。在基于长期记忆基准（LoCoMo 风格的多会话对话）构建的 **151 个问题测试集** 上，启用元数据过滤后，整体问答准确率从 **40% 提升至 64%**。对于依赖上下文边界的问题（如时间限定查询、优先级过滤、部门范围搜索），准确率从 **16% 跃升至 69%**。 ### 关键概念与配置命名空间提供基础隔离，元数据则添加业务属性标签。例如，可以为每个记忆记录附加 `priority: high`、`department: billing`、`timestamp: 2025-03-01` 等键值对。 **配置步骤：** 1. **定义元数据 schema**：明确预期的属性名称和类型（如字符串、数字、日期）。 2. **在记忆注入时附加元数据**：当代理存储新记忆时，同时提供元数据。 3. **在检索时指定过滤条件**：查询时通过条件表达式（如 `department == "billing" AND priority == "high"`）缩小范围。 ### 企业用例：多代理与多租户架构 - **多代理场景**：不同代理（如客服、销售、技术）共享同一记忆库，但通过 `agent_type` 元数据过滤，确保每个代理只访问相关记忆。 - **多租户场景**：在命名空间隔离基础上，添加 `tenant_id` 元数据，实现租户内的精细权限控制。 - **时间敏感查询**：通过 `timestamp` 元数据，代理可只检索最近 7 天的记录，避免旧数据干扰。 ### 最佳实践 - **元数据与命名空间互补**：命名空间用于粗粒度隔离，元数据用于细粒度筛选，两者结合而非替代。 - **避免冗余元数据**：不要在每条记录上重复命名空间已有的信息（如客户 ID），而是添加业务相关的维度。 - **合理设计索引**：高频过滤字段应建立索引以提升性能。 - **测试过滤覆盖率**：确保过滤条件覆盖所有关键查询维度，避免遗漏。 ### 小结元数据过滤解决了 AI 代理记忆检索中的关键痛点——在语义相似但上下文无关的结果中精准定位。通过将准确率从 40% 提升至 64%，它为企业级多代理、多租户系统提供了可落地的精度保障。如果你正在构建需要长期记忆的代理，不妨从命名空间和元数据的组合设计入手。

AWS ML20天前原文

730

HippoRAG：基于神经生物学启发的RAG，结合Amazon Bedrock、Neptune和个性化PageRank

新上线

大型语言模型（LLM）在处理和生成信息方面已取得显著进展，但在跨多源知识整合方面仍存在不足，尤其是面对需要连接不同文档信息的多跳推理任务时，标准检索增强生成（RAG）方法往往力不从心。受人类海马体记忆系统启发，HippoRAG 提出了一种新型RAG框架，通过构建知识图谱并利用个性化PageRank算法实现单步多跳检索，显著提升了复杂推理能力。本文展示了如何在AWS基础设施上完整实现HippoRAG，核心组件包括： - **Amazon Bedrock**：提供LLM能力，用于知识图谱三元组提取、问答和命名实体识别。 - **Amazon Neptune Database**：存储知识图谱结构，支持基本图操作。 - **Amazon Neptune Analytics**：执行高级图算法，特别是**个性化PageRank**用于相关性排序。 - **Amazon Titan Embeddings**：生成文本的向量表示，用于相似度匹配。 ### 神经生物学灵感与背景 HippoRAG 借鉴了人类长期记忆的海马体索引理论：新皮层处理感知输入，而海马体建立记忆之间的关联索引。这种双组件系统使人类能够高效整合不同经历中的信息。标准RAG将每个文档独立处理，难以回答需要跨文档连接信息的问题。HippoRAG 通过以下方式解决： 1. 构建**知识图谱**，表示实体间关系。 2. 使用**个性化PageRank**算法进行高效的图遍历和相关性排序。 3. 实现**单步多跳检索**，无需多次迭代。 ### 解决方案架构 AWS实现包含四个主要部分，如上所述。该架构充分利用了个性化PageRank的威力，同时保持了企业级应用所需的可扩展性。通过将知识图谱与向量检索相结合，HippoRAG 在需要连接分散信息的场景中表现出色，例如多文档问答、研究报告综合等。 ### 应用与展望 HippoRAG 适用于企业级知识管理、智能客服、法律文档分析等领域。其神经生物学启发的设计使其在处理复杂、关联性强的信息时具有天然优势。未来，随着图算法和LLM的进一步发展，此类框架有望成为下一代RAG系统的核心范式。

AWS ML20天前原文

731

用Amazon Bedrock秒杀文件欺诈：Inscribe如何将检测时间缩短20倍

新上线

金融文件欺诈正以惊人速度增长——根据Inscribe《2026年文件欺诈报告》，每16份文件中就有1份存在欺诈，AI生成的伪造文件在2025年4月至12月间增长了5倍。面对每天处理数千份申请的金融机构，传统人工审核每份需30分钟，不仅效率低下，更难以识别深度伪造和AI生成的欺诈文件。自2017年起专注AI反欺诈的Inscribe，借助Amazon Bedrock构建了一套**智能体AI系统**，模仿资深欺诈分析师的多文档推理逻辑，将检测时间从30分钟压缩至**90秒以内**，实现20倍效率提升，同时保持金融监管所需的准确性和可解释性。 ### 挑战：三重困境以中型银行的贷款申请为例：客户提交银行流水、工资单、税单和身份证明，分析师需逐一验证真伪、交叉核对信息、识别篡改与深度伪造，并调查雇主和地址。这一过程面临三重挑战： - **规模瓶颈**：申请量增长迫使机构成比例增加人力，成本攀升但检测精度未提升。 - **适应不足**：传统规则系统难以应对AI生成的动态伪造手法，欺诈者利用生成式AI快速迭代攻击方式。 - **速度与精度矛盾**：快速审批与严格风控难以兼顾，延迟导致客户流失。 ### 解决方案：智能体AI + Amazon Bedrock Inscribe的方案核心是**多智能体协作架构**，每个智能体专精于特定任务：文档真实性验证、跨文档信息比对、异常模式识别等。这些智能体通过Amazon Bedrock调用高性能基础模型（如Claude等），自主推理并交换结论。关键优势包括： 1. **专家级推理**：系统模拟人类分析师的多步骤验证逻辑，而非简单规则匹配。 2. **秒级响应**：端到端检测在90秒内完成，满足实时业务需求。 3. **可解释性**：每个决策步骤可追溯，符合金融监管对审计追踪的要求。 4. **持续进化**：利用Amazon Bedrock的模型灵活性，快速集成最新AI能力以应对新型欺诈。 ### 行业影响 Inscribe的案例表明，**智能体AI正在重塑金融风控范式**。传统上，反欺诈需要在速度与深度之间取舍，而智能体架构通过分工协作实现了“既要又要”。对于银行和金融科技公司，这意味着： - 在不增加人力的情况下处理数倍申请量 - 识别人工难以发现的AI生成伪造文件 - 保持监管合规的透明决策链 Amazon Bedrock作为底层平台，提供了安全、可扩展的模型调用和治理能力，使Inscribe能专注于业务逻辑而非基础设施。 ### 展望随着AI欺诈手段持续进化，静态规则系统终将失效。Inscribe的实践为行业指明方向：结合智能体AI与托管基础模型服务，金融机构能够建立**自适应反欺诈体系**。未来，这种模式或将从文档审核扩展到身份验证、交易监控等更多场景，成为金融安全的基础设施。

AWS ML20天前原文

732

六个月的亲测：这个小工具是我对抗无意义刷屏的秘密武器

新上线

在数字生活全面渗透的今天，屏幕成瘾几乎成了现代人的标配。我身边的朋友、家人和同事，每天花在手机上的时间从3小时到8小时不等——而我自己也平均每天4小时。直到半年前，我尝试了一款名为 **Brick** 的小设备，它正改变着我的内容消费习惯。 ### 它是什么？ Brick 并非普通的手机配件，而是一个专注于阻断无意义刷屏的物理干预工具。它的设计理念很直接：通过物理按键或插件，在你试图打开某些成瘾性应用（如社交媒体、短视频、新闻聚合）时，制造一个“暂停”动作。这个短暂的延迟足以让你意识到自己的行为，从而减少自动化的冲动点击。 ### 我的体验最初，我抱着怀疑的态度开始使用。毕竟，市面上已有大量数字健康类应用，但效果往往有限。Brick 的不同之处在于它的物理性——你需要主动按下或插入它才能继续操作。这种有意识的动作，就像在告诉我：“你真的需要现在看这个吗？” 半年下来，我发现自己刷社交媒体的时间减少了约 **40%**。更重要的是，我不再频繁陷入无意识的“僵尸刷屏”状态。Brick 帮助我重新掌握了注意力，让我在休息时间更倾向于阅读、散步或与家人面对面交流。 ### 行业背景在 AI 和算法推荐日益强大的今天，科技公司正以前所未有的方式争夺用户注意力。从无限滚动的设计到个性化推送，这些机制让用户难以自拔。Brick 这类产品的出现，可以看作是一种“对抗性工具”——它们不依赖于软件层面的自我约束，而是通过物理交互来打破数字成瘾的循环。这类似于近年来兴起的“数字极简主义”运动，强调有意识、有目的地使用技术。 ### 购买途径好消息是，Brick 现在终于可以在 **Amazon** 上购买，不再需要通过小众渠道或等待预售。对于正在寻找数字健康解决方案的人来说，这无疑是一个更便捷的选择。 ### 小结当然，Brick 并非万能药。它更适合那些已经意识到自己刷屏问题，但缺乏有效干预手段的人。如果你每天花数小时在手机上，却总感觉时间被浪费，或许可以试试这个物理小工具。毕竟，在算法无孔不入的时代，任何能帮助我们夺回注意力的工具都值得一试。

ZDNet AI20天前原文

733

Cloudflare 新规：AI 公司须为出版商内容付费，否则面临默认屏蔽

新上线

Cloudflare 近日宣布了一项重大政策变化，将要求 AI 公司在 2025 年 9 月 15 日之前，将用于搜索的网络爬虫与用于 AI 训练和智能代理的爬虫明确分离。否则，这些混合用途的爬虫将在 Cloudflare 网络上托管广告的站点上被默认屏蔽。这项新规适用于新的 Cloudflare 客户、现有客户的新站点以及所有现有的免费客户。Cloudflare 表示，此举旨在保护网站所有者的知识产权，同时确保内容仍可通过搜索和 AI 服务被发现。该公司特别指出，全球最大的搜索引擎（暗指 Google）因其爬虫策略，比其他 AI 公司多获取约两倍的信息。Cloudflare 还推出了新工具和合作伙伴关系，以帮助网站所有者获得更多可见性和商业机会。这一政策变化反映了网络流量中机器人已超过人类的新现实，Cloudflare CEO 强调需要更快行动以建立可持续的生态系统。

TechCrunch20天前原文

734

开源工具 Model Profiler 简化 Amazon Bedrock 模型选择流程

新上线

随着生成式 AI 在各行各业加速落地，Amazon Bedrock 作为托管服务平台，提供了超过 100 个来自 Anthropic、OpenAI、Meta、Mistral AI、Cohere 和亚马逊等厂商的基础模型。然而，模型选择并非易事——能力、定价、区域可用性、上下文窗口限制和吞吐量等信息分散在控制台页面、文档和区域 API 调用中，给团队评估新工作负载、优化成本或从其他 AI 系统迁移带来了巨大障碍。针对这一痛点，AWS 发布了开源工具 **Amazon Bedrock Model Profiler**。该工具将来自多个 AWS API 和外部来源的模型元数据聚合到一个统一、可搜索的界面中，支持高级筛选、并排比较和详细模型卡，帮助团队快速浏览整个 Bedrock 模型目录并做出数据驱动的决策。 ## 核心功能与架构 Model Profiler 是一个 Web 应用，用户无需在多个控制台页面和文档站点间来回切换，即可在一个界面中获取模型卡、并排比较、区域可用性地图和每日更新的定价信息。其背后是一套完全自动化的无服务器流水线，从 **7 个数据源** 收集和处理信息，包括 5 个 AWS API（如 ListFoundationModels、Price List、Service Quotas 等）和 2 个公共 URL。这些数据源涵盖模型规格、能力、模态、在 33 个区域的可用性、按需/批处理/预留层定价、每分钟令牌数（TPM）限制等关键指标，且无需手动干预即可保持目录准确。 ## 实际应用场景 Model Profiler 在多个真实场景中能显著提升效率： - **新工作负载评估**：团队需要对比不同模型的上下文窗口、支持语言和模态，以找到最适合特定任务的模型。通过筛选和排序，几分钟内即可缩小候选范围。 - **成本优化**：结合定价和 TPM 限制，开发者可以快速找到性价比最高的模型，避免过度配置或预算超支。 - **迁移规划**：从其他 AI 平台迁移到 Bedrock 时，Model Profiler 帮助识别功能对等的模型，并比较区域可用性和定价差异。 ## 快速部署根据官方说明，用户可以在 **5 分钟以内** 在自己的环境中完成部署。工具以开源形式提供，代码托管在 GitHub 上，支持通过 AWS CDK 或 SAM 快速启动。部署后，团队即可获得一个私有的模型探索门户，无需依赖外部服务。 ## 行业意义模型选择是生成式 AI 落地中的关键瓶颈之一。Bedrock 虽然提供了丰富的模型选择，但信息分散增加了决策摩擦。Model Profiler 的出现填补了这一空白，通过自动化数据聚合和直观的比较界面，降低了实验成本，加速了从评估到生产的周期。对于正在构建多模型应用或需要持续优化成本的组织来说，这是一个实用且及时的工具。

AWS ML20天前原文

735

海信电视用户必看：调整这些专家设置，画质立竿见影

新上线

海信电视开箱即用的画质已经不错，但通过调整菜单中的几项设置，你还能让画面表现更上一层楼。无论是刚入手新电视，还是已经使用了一段时间，这篇指南都能帮你快速找到最佳画质方案。 ### 快速上手：一键优化选项如果你只想简单设置几个选项就开始追剧、看电影或玩游戏，海信电视提供了丰富的“即设即忘”预设。共有七种**画面模式**：标准、体育、节能、影院夜间、影院日间、Filmmaker和鲜艳。每种模式针对不同内容优化了亮度、对比度、色彩处理和刷新率，让你在不同场景间无缝切换。要进一步提升预设的效果，可以开启以下选项： - **设置 > 画面 > 自动画面模式/内容类型检测/智能场景/自动光传感器**：全部开启，电视会根据播放内容和环境光线自动调整。 - **画面 > 亮度 > 主动对比度**：开启；**HDR增强器**：开启。 - **色彩 > 低蓝光**：开启；**动态色彩增强**：设为中等。 - **清晰度 > 超级分辨率**：开启；**运动增强**：设为标准；**运动清晰度**：关闭。 ### 进阶调校：挖掘全部潜力对于追求极致画质的用户，海信电视还提供了更深入的调节选项。你可以调整**色域**（如BT.709、BT.2020）、**伽马值**，甚至支持**Calman校准**（需专业设备）。这些高级功能允许你为每个信号源单独设置，创建多个自定义画面模式，并随时切换。 ### 注意事项 - 所有更改可以**全局应用**，也可以**针对单一输入源**，非常灵活。 - 如果不小心调乱了，无需担心：在画面设置菜单底部有一个**重置按钮**，可一键恢复所有选项到出厂默认值。通过以上设置，你的海信电视将呈现出更精准的色彩、更丰富的细节和更流畅的动态画面。无论是观看HDR电影、体育赛事还是玩游戏，都能获得沉浸式的视觉体验。

ZDNet AI20天前原文

736

借助 BoltzGen 在 Amazon SageMaker AI 上加速蛋白质设计

新上线

蛋白质设计正从实验室走向工业化，但 GPU 基础设施的管理常常成为瓶颈。本文将展示如何利用 Amazon SageMaker AI 部署 BoltzGen——一个基于扩散模型的蛋白质生成工具，实现从快速验证到批量生产的设计流程。 ## 蛋白质设计的算力挑战在蛋白质 binder 设计中，每个候选分子都需要经过**骨架生成、逆向折叠、结构验证和候选排序**等多个 GPU 密集型步骤。以 1000 个样本为例，在 4 卡 GPU 实例（ml.g5.12xlarge）上运行约需 **375 小时**。传统方式下，研究人员需要自行管理实例生命周期、构建 CUDA 环境、协调步骤间数据流转，并处理长时间运行任务的故障恢复，这些运维工作消耗了大量精力。 ## SageMaker AI 的自动化方案 Amazon SageMaker AI 通过端到端托管解决了上述痛点： - **自动资源编排**：提交任务后，SageMaker AI 自动配置 GPU 实例，运行 BoltzGen 容器，结果写入 Amazon S3，任务完成后释放实例。 - **按秒计费**：无闲置成本，例如在 ml.g4dn.xlarge 上运行 2 小时设计任务，按需费用仅约 **1.5 美元**。 - **多 GPU 支持**：可扩展至多卡并行，加速大规模候选筛选。 - **步骤级缓存**：迭代工作流中重复使用中间结果，进一步降低计算开销。 ## 两种执行模式适配不同阶段该方案提供两种运行模式：**快速验证模式**适用于小批量测试和算法调优，**生产批量模式**则面向大规模筛选任务。研究人员可以根据实验阶段灵活切换，无需额外配置基础设施。 ## 应用场景与价值这套方案主要面向学术实验室、生物科技初创公司、制药研发团队以及教育机构，覆盖蛋白质 binder 设计、治疗性蛋白质工程和从头蛋白质架构等方向。通过将基础设施管理交给 SageMaker AI，团队可以专注于设计迭代本身，加速从概念到候选分子的转化。 ## 小结 BoltzGen 与 Amazon SageMaker AI 的结合，为蛋白质设计提供了一条低门槛、高可扩展的路径。它解决了 GPU 资源的弹性供给、成本控制和流程自动化问题，使得大规模蛋白质设计不再是算力密集型团队的专属。

AWS ML20天前原文

737

Déjà Dup 与另外 4 款小巧 Linux 工具：我的每日必备清单

新上线

在 Linux 生态中，大型应用固然重要，但那些小巧的工具往往能带来意想不到的便利。作为一名资深 Linux 用户，我每天依赖的不仅是浏览器、办公套件等主流软件，还有几款轻量级工具，它们虽小，却不可或缺。以下是我最珍视的五款工具。 ## Déjà Dup Backups：备份从未如此简单备份是数据安全的最后防线。对于我这样的小说创作者来说，丢失两个月的工作成果简直是一场噩梦。Déjà Dup Backups 是我用过的最简单的备份工具——无论是什么操作系统。只需几次点击，就能设置好备份计划，甚至支持自动化“设置即忘”。一个小提醒：若想使用自动备份，建议通过发行版的默认包管理器安装，因为 Flatpak 版本可能需要调整权限，且在某些桌面环境（如 COSMIC）中可能无法访问会话。 ## COSMIC Text Editor：简洁与专注的文本编辑体验文本编辑器的争论在 Linux 社区从未停歇。硬核用户偏爱 vi 或 emacs，但我更看重简洁与效率。COSMIC 文本编辑器正是为此而生。它界面清爽，功能聚焦于写作本身，没有冗余的干扰。无论是写代码还是记笔记，它都能让我保持专注。 ## 其他三款工具除了上述两款，还有 **KCalc**（科学计算器）、**GNOME 截图工具**（快速截图与标注）和 **Baobab**（磁盘使用分析器）。它们各自解决特定的小问题，却大大提升了我的日常效率。 ## 小结这些工具证明了“小即是美”的理念。它们免费、轻量，却能在关键时刻发挥巨大作用。如果你也在寻找提升 Linux 体验的实用小工具，不妨从它们开始。

ZDNet AI20天前原文

738

吓坏特朗普后，Anthropic AI 模型全球发布

新上线

美国国家安全机构日前解除了对 Anthropic 旗下两款高级 AI 模型 **Fable** 和 **Mythos** 的出口限制，允许其面向全球市场发布。这一政策转向颇具戏剧性：此前，特朗普政府曾因担忧模型可能被滥用而紧急叫停其海外部署，并要求进行安全测试。如今，在 Anthropic 配合完成一系列安全评估后，禁令被撤销。 ## 从“惊吓”到放行：安全测试成关键 Anthropic 一直以“负责任的 AI”为定位，其模型在可解释性和安全性上投入巨大。**Fable** 和 **Mythos** 是该公司最新一代大语言模型，在推理、代码生成和长文本理解上表现突出。然而，美国国家安全委员会（NSC）曾评估认为，这些模型可能被用于生成虚假信息或自动化网络攻击，因此一度禁止其出口。特朗普政府在 AI 安全议题上态度反复：一方面强调技术领先，另一方面又忌惮“双刃剑”效应。此次解禁的条件是 Anthropic 必须持续提供模型行为监控报告，并确保关键安全机制（如“红队测试”和内容过滤）始终在线。 ## 全球 AI 竞赛中的“安全牌” 这一事件折射出美国在 AI 治理上的两难：既要维护技术霸权，又要防范失控风险。Anthropic 的模型能力与 OpenAI 的 GPT-4 和 Google 的 Gemini 处于同一梯队，其全球发布将加剧市场竞争。但更深层看，**安全测试成为新贸易壁垒**——其他国家若想部署美国高端 AI，可能需要接受类似的审查框架。对于开发者而言，Fable 和 Mythos 的开放意味着更多选择。Anthropic 的 API 定价略低于 OpenAI，且强调“宪法 AI”训练方法，在伦理合规上更具卖点。不过，企业用户仍需警惕潜在的合规风险，尤其是涉及敏感行业的应用。 ## 小结 Anthropic 的全球发布标志着美国在 AI 出口管控上的一次务实调整。安全测试不再是“绊脚石”，反而成为技术输出的通行证。未来，**“先测试，后放行”** 可能成为高端 AI 模型国际流通的新常态。

Ars Technica20天前原文

739

我让Gemini和Claude代写邮件回复——但只有一款写出了我的风格

新上线

在AI写作助手领域，Google的Gemini和Anthropic的Claude各有所长，但当我让它们代写邮件回复时，结果却出乎意料。经过一周的测试，我发现Claude在匹配语气和个性化要求上更胜一筹，甚至让我觉得“这就是我写的”。以下是详细对比和体验。 ## 测试背景与方法我选择了**Gemini 3.5 Flash**（通过Pro账户访问，并开启了Google Labs的“Personal Intelligence”功能）和**Claude Sonnet 4.6**（免费版，Effort设为High）。两者都用于代写邮件回复，我要求它们根据上下文生成符合我个人风格的回复。 ## 关键发现 - **Gemini**：在效率上表现出色，尤其是与Gmail深度集成的“Help Me Write”功能，能快速生成草稿。但开启Personal Intelligence后，虽然能参考历史对话，但生成的回复仍略显模板化，缺乏真正的个性。 - **Claude**：在语气和风格匹配上明显更优。它能准确捕捉我的措辞习惯和表达方式，生成的回复更自然，几乎不需要修改。此外，Claude的语音转文字功能对非母语使用者更友好，识别准确率更高。 ## 为什么Claude更胜一筹？测试中，我为每封邮件提供了明确的写作目标，并附上两条标准化指令。Claude能更灵活地调整语气，从正式到随意都能自如切换，而Gemini有时会过度依赖预设模板。此外，Claude的“Effort”设置允许更深入的思考，在复杂场景下表现更佳。 ## 结论虽然Gemini在速度和集成度上有优势，但如果你追求“听起来像自己”的邮件，**Claude是更可靠的选择**。不过，两者都是强大的工具，具体选择取决于你的需求：效率优先选Gemini，个性优先选Claude。

ZDNet AI20天前原文

740

Anthropic 为重返特朗普政府青睐，新增安全措施

新上线

特朗普政府解除了对 Anthropic 的 Fable 5 和 Mythos 5 AI 模型的出口管制，但附带条件。据知情人士透露，Anthropic 同意延长现有防护措施，防止用户尝试访问某些受限功能。这意味着任何试图解锁这些功能的用户将收到请求被阻止的通知，并由较不先进的 Opus 4.8 模型处理查询。此前，Anthropic 切断对 Fable 5 的访问时，与敏感网络安全和生物学能力相关的用户请求应由 Opus 4.8 处理。新防护措施将扩展至与亚马逊论文中确定的特定行为相关的请求。网络安全专家 Katie Moussouris 的分析指出，用户通过要求模型修复代码而非识别安全问题，绕过了 Fable 5 的限制。尽管专家认为此行为不令人担忧，但政府了解后导致了对 Anthropic 的出口管制，实际上使模型离线。商务部长 Howard Lutnick 的信函宣布解除对 Fable 5 和 Mythos 5 的限制，称 Anthropic 已同意主动检测和解决模型安全风险。商务部标准与创新中心最终认为模型防护足够稳健，放行 Fable 5。然而，国防部长 Pete Hegseth 已告知顾问，解除其 2 月 28 日将 Anthropic 指定为供应链风险的命令尚无明确路径。因此，Anthropic 与政府的挑战虽有所缓解，但并未完全结束。

WIRED AI20天前原文