SheepNav

AI 资讯

每日聚合最新人工智能动态

曾获数百次引用的ChatGPT教育研究论文因数据问题被撤稿

一篇曾宣称ChatGPT能显著提升学生学习效果的研究论文,在发表近一年后因分析数据存在“不一致”而被撤稿。该论文由Springer Nature旗下期刊《人文与社会科学通讯》于2025年5月6日发表,撤稿声明指出对结论缺乏信心。然而,在撤稿前,该论文已被引用262次,并在社交媒体上广泛传播。 ## 研究内容与争议焦点 该论文通过元分析整合了51项先前研究,试图量化ChatGPT对学生学习表现、学习感知和高阶思维的影响。结果显示,ChatGPT对学习表现有“较大的积极影响”,对学习感知有“中等积极影响”,并能促进高阶思维。但批评者指出,这些结论建立在质量参差不齐的研究基础上。 爱丁堡大学数字教育研究中心高级讲师Ben Williamson表示,该论文“合成了一些质量极低的研究,或将方法、人群和样本差异巨大的研究结果混为一谈”,根本不应发表。他还质疑论文的发表时机:ChatGPT于2022年11月发布,仅两年半后就声称汇总了数十项高质量研究,这“在时间上不可行”。 ## 撤稿后的影响 尽管已被撤稿,该论文的引用量已高达262次,其结论可能继续影响后续研究和公众认知。这一事件再次凸显了AI教育领域快速发表热潮中的质量风险——当AI技术迭代速度远超学术验证周期时,元分析等综合研究更需警惕“垃圾进垃圾出”的问题。 ## 行业启示 此次撤稿提醒研究者,面对生成式AI在教育中的效果评估,应更注重研究设计的严谨性和数据的可验证性。对于政策制定者和教育工作者而言,需谨慎对待早期、未经充分验证的“积极证据”,避免基于有缺陷的研究仓促推动AI教育应用。

Ars Technica1个月前原文

传统IT运维模式正面临瓶颈。随着企业规模扩张,威胁面、用户数量与支持工单同步增长,迫使团队不断叠加新的点状解决方案,导致工具泛滥——工程师被困在监控仪表盘、远程控制台和安全警报的循环中,效率与可见性双双受损。 据调查,超过半数的托管服务提供商(MSP)正遭受供应商泛滥之苦,由此带来的运营拖累不仅侵蚀效率与利润,更造成安全盲区。当核心平台(如远程管理、工单系统)无法互通时,工程师被迫充当“人工中间件”,在上下文切换与重复录入中耗费精力。仅在美国,此类低效工作每年造成的价值损失高达 **2.38万亿美元**(Freshworks《全球AI工作场所报告》)。 ### 碎片化环境的隐患 碎片化的IT环境不仅是运营瓶颈,更直接威胁安全。由于访问策略冲突,威胁情报与修复工具脱节:警报在一个系统触发,但理解上下文与执行修复的工具却分散在其他系统。从检测异常到部署修复的关键窗口被拉长,为攻击者创造了可乘之机。 ### AI驱动的整合之道 面对这一挑战,行业领导者正转向集成化、AI驱动的解决方案。例如,**Kaseya** 提供了一系列AI赋能的IT管理与网络安全产品,帮助决策者以更少资源实现更高效率。其核心理念是:通过打通远程监控、工单管理、自动化脚本和安全响应等环节,构建一个协同的IT生态系统,让AI自动处理例行任务、关联威胁情报并加速修复流程。 ### 未来趋势 AI与自动化的融合正在重塑IT服务交付模式。对于MSP和企业IT团队而言,选择一体化平台而非孤立工具,将成为提升竞争力、降低风险的关键。未来的赢家将是那些能够利用AI实现“每端点、每技术人员增长最大化”的组织。 (本文为赞助内容,由ZDNET BrandX与合作伙伴共同撰写。)

ZDNet AI1个月前原文

## 导航应用对决:谷歌地图 vs. 苹果地图 在导航应用领域,谷歌地图和苹果地图一直是两大热门选择。经过全面测试,结论是明确的:**谷歌地图在路由速度、AI功能和发现丰富度上全面领先**,而苹果地图则在简洁性和与苹果生态的整合上表现出色。 ### 路由与导航性能 谷歌地图在实时交通数据和路由优化方面优势明显。其**AI驱动的预测算法**能更准确地估计到达时间,并在拥堵时快速提供替代路线。苹果地图虽然近年来大幅改进,但在复杂路况下的动态调整能力仍稍逊一筹。 ### 发现与本地搜索 谷歌地图的**本地商家信息、用户评论和街景功能**构成了强大的发现生态。无论是查找餐厅、查看停车场实景,还是规划旅行路线,谷歌地图都提供了更丰富的数据。苹果地图的界面更简洁,但信息深度不足。 ### 苹果用户的选择 对于深度绑定苹果生态的用户,苹果地图的**无缝集成**(如与CarPlay、日历和Siri的联动)使其成为便捷之选。但其功能范围相对有限,尤其在企业信息和公共交通支持上不如谷歌地图全面。 ### 最终结论 尽管苹果地图取得了长足进步,但**谷歌地图凭借更快的路由、更智能的AI和更强大的发现功能,在综合体验上胜出**。对于追求效率和丰富信息的用户,谷歌地图是更可靠的选择。

ZDNet AI1个月前原文

## 坚固耐用的追踪标签:Ugreen Finder Pro 评测 在智能追踪标签市场,**Apple AirTag** 凭借其生态系统优势占据主导地位,但许多替代品在耐用性方面表现不佳。ZDNET 资深编辑 Adrian Kingsley-Hughes 对 **Ugreen Finder Pro** 标签进行了极限测试,发现这款产品在抗摔抗压方面远超同类产品。 ### 为什么耐用性如此重要? 追踪标签通常用于钥匙、背包、行李箱等日常物品,这些场景下标签难免会经历跌落、碰撞和挤压。大多数标签采用塑料外壳,容易开裂或损坏,导致内部电路暴露或电池脱落,从而失去追踪功能。 **Ugreen Finder Pro** 在设计上特别注重耐用性: - **外壳材质**:采用高强度材料,能承受钥匙链上的日常磨损和意外跌落。 - **结构设计**:整体结构紧凑,无明显脆弱点,测试中即使施加较大压力也未出现裂纹。 ### 核心功能与优势 除了耐用性,这款标签还具备以下特点: 1. **USB-C 可充电电池**: - 无需更换纽扣电池,通过 USB-C 接口即可充电,更环保且使用成本更低。 - 充电口设计有独立小盖,但需注意保管以防丢失。 2. **跨平台兼容性**: - 支持 iPhone 和 Android 设备,不局限于单一生态系统,适用性更广。 3. **价格与性价比**: - 亚马逊售价 **$30.99**,相比 AirTag 更具价格优势,且耐用性测试表现突出。 ### 测试背景与可信度 ZDNET 以独立测试和严格评测流程著称: - 编辑团队基于数小时的实际测试、研究和比价,确保推荐客观公正。 - 内容不受广告商影响,旨在为读者提供准确的购买建议。 - 本次测试由资深编辑亲自进行,聚焦产品在实际使用中的极限表现。 ### 行业启示与用户建议 在 AI 和物联网设备普及的今天,硬件耐用性常被忽视。Ugreen Finder Pro 的成功表明: - **消费者需求**:用户不仅关注追踪精度和电池续航,对物理耐用性也有更高要求。 - **市场机会**:通过强化硬件设计,非头部品牌也能在细分领域建立竞争优势。 **选购建议**: - 如果你需要一款能承受日常粗暴使用的追踪标签,且预算有限,Ugreen Finder Pro 值得考虑。 - 但若你已深度融入 Apple 生态系统,AirTag 的 seamless 体验可能仍是首选。 ### 小结 Ugreen Finder Pro 以出色的耐用性和实用功能,为追踪标签市场提供了可靠的选择。其跨平台兼容性和可充电设计,进一步提升了长期使用价值。对于注重性价比和耐用性的用户,这款产品无疑是一个强有力的竞争者。

ZDNet AI1个月前原文

苹果最新推出的 **MacBook Neo** 以 **599 美元** 的起售价,与 11 英寸 **iPad Air M4** 持平,为消费者带来了一个全新的选择。这不仅是价格上的巧合,更反映了苹果在入门级计算设备市场的战略布局。两款设备虽然价位相同,但在设计理念、操作系统、使用场景和性能表现上却有着本质区别。 ## 核心差异:macOS 与 iPadOS 的较量 MacBook Neo 搭载的是完整的 **macOS** 操作系统,这意味着用户可以运行所有传统的桌面级应用,如 Final Cut Pro、Xcode、Adobe Creative Suite 等专业软件,并享受多窗口管理、文件系统自由访问等桌面级体验。它本质上是一台 **传统笔记本电脑**,配备物理键盘和触控板,适合需要长时间打字、编程、视频编辑或进行复杂多任务处理的用户。 而 iPad Air M4 运行的是 **iPadOS**,这是一个以触摸为核心、强调移动性和即时性的操作系统。它拥有庞大的 App Store 应用生态,尤其在创意绘画、笔记、媒体消费和轻量级办公方面表现出色。配合 Apple Pencil 和妙控键盘等配件,它能变身为 **混合设备**,但其应用生态和文件管理方式仍与 macOS 有显著不同。 ## 性能与便携性:M 系列芯片的两种形态 两款设备都采用了苹果自研的 **M 系列芯片**(具体型号未在原文中明确,但 iPad Air M4 暗示为 M4 芯片,MacBook Neo 可能搭载相近或稍低规格的 M 系列芯片),确保了出色的能效比和流畅体验。 - **MacBook Neo**:作为笔记本电脑,它可能更注重 **持续性能释放** 和散热,适合处理较重的计算任务,如代码编译、图像渲染等。其 **物理键盘和触控板** 提供了更高效的人机交互方式,但便携性通常略低于平板形态。 - **iPad Air M4**:凭借平板形态,它在 **便携性和即时启动** 上更具优势,适合移动办公、课堂笔记、旅途娱乐等场景。搭配 Apple Pencil 后,在 **手写、绘图** 等创意输入方面远超传统笔记本。 ## 如何选择?关键看你的使用场景 面对这两款 599 美元的设备,选择并非简单的好坏之分,而是取决于你的 **核心需求**: - **如果你需要一台主力生产力工具**:经常进行文字处理、编程、视频剪辑,或依赖特定 macOS 专业软件,**MacBook Neo** 是更合适的选择。它提供了完整的桌面级体验,无需额外配件即可高效工作。 - **如果你追求灵活性与创意表达**:更多用于阅读、笔记、绘画、视频观看,或需要极致的便携性,**iPad Air M4** 更能满足需求。搭配键盘和 Apple Pencil 后,它也能处理轻量级办公任务,但体验更偏向移动端。 - **预算与生态考量**:两者价格相同,但 iPad Air 若需搭配妙控键盘和 Apple Pencil,总成本会显著上升。而 MacBook Neo 作为一体式设备,初始投入即包含完整输入体验。同时,考虑你已有的苹果生态设备(如 iPhone、Apple Watch)如何协同工作。 ## 行业背景:苹果的入门市场战略 MacBook Neo 的推出,标志着苹果在 **入门级计算市场** 的进一步细分。过去,预算有限的用户往往只能在 iPad 和二手 Mac 之间选择,现在则有了全新的官方入门笔记本选项。这不仅能吸引更多学生、初次用户和预算敏感型消费者,也可能对 Windows 阵营的平价笔记本构成直接竞争,正如 ZDNET 另一篇文章所指出的,这迫使 Windows PC 重新思考其策略。 同时,这也反映了 **计算设备形态的持续融合与分化**:笔记本在保持专业性的同时追求轻薄平价,平板则在强化生产力属性。苹果通过两款同价不同形态的设备,覆盖了更广泛的用户场景,强化了其生态系统的吸引力。 ## 小结 **MacBook Neo** 和 **iPad Air M4** 在 599 美元价位上提供了两种截然不同的计算体验:前者是 **专注生产力的传统笔记本**,后者是 **灵活多能的混合平板**。你的选择应基于日常任务类型、软件依赖性和使用习惯。对于苹果而言,这一布局不仅丰富了产品线,更在竞争激烈的入门市场投下了一枚重要棋子,未来如何平衡两者定位,值得持续关注。

ZDNet AI1个月前原文

企业领导者依赖运营仪表盘作为日常执行的共享事实来源,但仪表盘仅能回答已知问题。当团队需要探索临时、多维或未知问题时,往往会遇到瓶颈——等待BI团队数小时甚至数天来构建新视图或更新报告。Amazon QuickSight 的数据集问答(Dataset Q&A)功能打破了这一僵局:用户可以用自然语言提问,在几秒内获得准确答案,无需构建新仪表盘或排队等待。它让你与现有数据集进行交互式对话,同时不干扰团队已依赖的仪表盘。 以AWS技术领域社区(TFC)项目为例,该项目每年支持数十万次客户互动,涵盖数十个专业领域。项目领导者和现场团队需要快速回答复杂运营问题,例如:客户需求在哪里增长?哪些团队具备合适的专业能力?客户互动是否得到及时解决?哪里有影响客户成果的潜在缺口? 随着互动规模扩大,传统静态仪表盘在多维度复杂查询面前力不从心。利益相关者不得不在不同系统间手动交叉引用数据集,才能看清如何更好地服务客户。问题的核心在于工作流:领导者的提问打断BI工程师的计划工作,后者运行聚合后返回答案,而答案又引发下一个问题。真正的时间损失不在查询本身,而在提问者与拥有工具的人之间的交接。 数据集问答功能通过自然语言处理直接理解业务问题,从底层数据模型生成准确SQL查询,即时返回结果。它让业务用户独立探索数据,将BI团队从重复的临时查询中解放出来,专注于更高价值的分析工作。这不仅提升了决策速度,还推动了数据民主化——让每个决策者都能与数据对话。 对于希望构建数据驱动文化的组织,这一功能标志着从“被动响应”到“主动探索”的转变。当提问不再需要排队,洞察的获取就变成了连续的对话,而非离散的报告。

AWS ML1个月前原文

OpenAI 近日为 ChatGPT 用户推出了 **Advanced Account Security(高级账户安全)** 功能,这是一套包含四项可选设置的安全增强方案,旨在为账户和数据提供更全面的保护。该功能主要面向对安全性有较高要求的用户群体,如政治异见人士、记者、民选官员和研究人员,但任何 ChatGPT 用户都可以选择启用。 ## 四项安全设置详解 1. **要求使用通行密钥或安全密钥登录**:用户必须设置通行密钥(passkey)或物理安全密钥才能登录账户,从而避免因密码泄露导致的未授权访问。 2. **强化账户恢复方式**:在找回账户时,不再仅依赖电子邮件或短信验证,而是要求使用更强的身份验证方法,防止账户被轻易盗取。 3. **缩短登录会话有效期**:主动登录会话的时长被缩短,以减少会话被劫持或滥用的风险窗口。 4. **默认禁止 AI 训练使用对话数据**:自动阻止你的聊天内容被用于 OpenAI 的模型训练,保护隐私。 ## 如何启用 要启用该功能,请访问 OpenAI 的 enrollment 网页,确保已登录你的 ChatGPT 账户,然后点击 **Enroll** 按钮即可开始设置流程。整个过程需要用户按照指引依次配置上述四项设置。 ## 行业背景与意义 随着 AI 助手在日常工作与生活中的渗透,用户对隐私和安全的需求日益增长。此前,OpenAI 已提供双因素认证等基础安全措施,但 **Advanced Account Security** 更进一步,通过强制使用通行密钥、缩短会话时间等措施,大幅提升了账户的安全性。尤其是“默认禁止 AI 训练”这一设置,直接回应了用户对数据隐私的关切,也符合全球监管机构对 AI 数据使用的合规要求。 值得注意的是,ZDNET 的母公司 Ziff Davis 曾于 2025 年 4 月对 OpenAI 提起诉讼,指控其在训练和运行 AI 系统时侵犯版权。此次安全功能的推出,或许也是 OpenAI 在加强用户信任方面迈出的重要一步。 ## 小结 对于重视账户安全的 ChatGPT 用户而言,**Advanced Account Security** 提供了一套实用的工具,但需要用户主动选择开启。如果你有敏感信息或文件在对话中共享,强烈建议立即启用这些设置,以降低账户被盗或数据泄露的风险。

ZDNet AI1个月前原文

The smallest manufacturing error can cause big issues with your PC. Here's how to prevent it from happening in the first place.

ZDNet AI1个月前原文
iRobot创始人想把“机器人精灵”带进你家

还记得 Roomba 吗?扫地机器人鼻祖 iRobot 的创始人如今有了新野心,这次不是清洁工具,而是一个名为 **Familiar** 的“机器人精灵”。 Familiar Machines & Magic(一家由 iRobot 联合创始人新创的公司)希望打造一种全新的家用机器人:它不是玩具,不是宠物,也不是朋友,而是 **Familiar**——一种带有魔法感的陪伴型机器人。这个概念源自西方 folklore 中的“精灵”(Familiar),常被描绘成与巫师相伴的灵性动物。 **Familiar 机器人的核心定位是“帮你活出最好的自己”**。它不会像 Roomba 那样默默执行清扫任务,也不会像社交机器人那样单纯卖萌。相反,它被设计成主动感知用户情绪、日常习惯,并给出建议或提醒——比如在你低落时播放音乐,或在你久坐时提醒起身活动。 从技术路线上看,Familiar 可能集成语音交互、面部识别、环境感知等能力,但更关键的是它的“个性”设计:它要有“性格”,要让用户觉得它是家庭的一员,而非冷冰冰的设备。这让人联想到《哈利·波特》中的家养小精灵,或是《星球大战》中的 R2-D2——它们都有情感和主动性。 不过,机器人“精灵”化也面临挑战:隐私问题(持续感知用户行为)、用户粘性(如何避免沦为摆设)、以及伦理边界(机器人是否该主动干预用户生活)。目前公司尚未公布具体产品形态和上市时间,但这一概念已引发行业关注。 在 AI 与机器人行业,家用陪伴型机器人一直是个“雷区”——从 Jibo 的倒闭到 Anki 的清算,无数公司折戟。但 iRobot 创始人的履历让 Familiar 多了一分可信度:他深知家用机器人如何从“工具”进化为“伙伴”。如果成功,Familiar 可能重新定义人机关系:不是主仆,而是共生。

IEEE AI1个月前原文

如果你怀念Windows XP或7的经典界面,但又不想投入Linux的怀抱,开源操作系统ReactOS或许正是你需要的选择。这款操作系统旨在提供与Windows相似的外观和体验,但完全独立于微软。近日,ReactOS开发团队宣布合并了LiveCD和文本安装器ISO,使得安装过程更加直观易用,向Windows用户友好度迈出了一大步。 ## 安装体验升级:从“麻烦”到“简单” 此前,ReactOS的安装过程相对传统:用户需要先下载LiveCD体验系统,再下载Boot CD进行文本式安装,步骤繁琐且容易让人困惑。如今,两个版本合二为一,用户只需一个ISO文件即可同时体验和安装系统,类似于主流Linux发行版的安装方式。这意味着,你可以在启动Live环境后直接点击安装,无需重启或切换镜像,大大降低了上手门槛。 不过,需要注意的是,虽然Live环境提供了现代化的图形界面,但安装过程仍采用文本模式,类似于早期Windows的安装界面。开发团队表示,这并非最终形态,未来将进一步优化安装向导的图形化体验。 ## ReactOS的定位与意义 ReactOS是一个自由开源的操作系统,目标是与Windows应用程序和驱动程序二进制兼容。对于因硬件老旧或软件依赖而无法升级Windows的用户,ReactOS提供了一条“复古”但不失实用的路径。它尤其适合那些需要运行Windows XP或7时代软件的场景,比如工业控制、教育或遗产系统维护。 与Linux相比,ReactOS的优势在于无需学习全新的操作逻辑:界面布局、快捷键、甚至部分系统工具的名称都与Windows高度相似。但需要注意的是,ReactOS目前仍处于Alpha阶段,稳定性和兼容性有限,并非日常主力系统的理想选择。 ## 未来展望:图形化安装已在路上 据开发者透露,除了合并ISO之外,他们还在开发图形化的安装程序,预计将在后续版本中推出。届时,ReactOS的安装体验将更加接近Windows,彻底消除新用户的“劝退”因素。对于想要尝鲜的用户,现在就可以从官网下载最新的LiveCD+安装器合并版,通过U盘启动体验。 总的来说,ReactOS的这次更新虽然看似微小,却体现了项目对用户体验的重视。如果你怀念过去的Windows时光,不妨一试。

ZDNet AI1个月前原文

AI 智能体在发布时表现良好,但随着时间的推移,模型迭代、用户行为变化以及提示词被用于未曾预料的新场景,智能体的质量会悄然下降。许多团队直到用户投诉增加或关键指标下滑,才意识到问题所在。为此,AWS 现推出 **AgentCore 优化功能预览**,旨在通过一个完整的“智能体质量闭环”帮助开发者持续监控和提升智能体性能。 该功能的核心流程分为三步:首先,从生产环境的追踪数据中自动生成优化建议;其次,通过批量评估和 A/B 测试验证这些建议的有效性;最后,将经过验证的改进方案放心地部署上线。这一闭环机制将智能体的质量维护从被动响应转变为主动管理。 具体来说,AgentCore 能够分析智能体在生产中的实际表现,识别出响应质量下降、提示词冲突或上下文漂移等问题,并基于这些分析给出具体的优化推荐。开发者可以直接在 AWS 控制台中查看这些建议,并通过内置的评估工具进行批量测试,对比优化前后的效果。A/B 测试功能则允许在真实流量中逐步验证改进,降低上线风险。 这一功能的推出背景是 AI 智能体在生产环境中的长期维护难题。随着企业将越来越多的任务交给智能体处理,确保其稳定性和准确性变得至关重要。AgentCore 的优化循环不仅适用于初始开发阶段,更强调持续迭代——正如软件工程中的 CI/CD 流水线,智能体也需要一套持续改进的流程。 目前该功能处于预览阶段,AWS 用户可申请试用。对于构建复杂智能体应用的团队而言,这无疑是一个值得关注的工具,它有望将智能体运营从“消防模式”转向“预防模式”,减少因质量退化带来的业务影响。

AWS ML1个月前原文

AI 智能体在发布时表现良好,但随着模型更新、用户行为变化以及提示词被复用到新场景,其性能会悄然下降。传统的调试方式依赖开发者手动分析追踪日志、猜测问题根源并反复修改,效率低且易引入新问题。Amazon Bedrock AgentCore 新推出的智能体质量优化功能,通过自动化推荐、批量评估和 A/B 测试,帮助团队系统性提升智能体性能。 ### 核心能力 - **智能推荐**:基于生产追踪日志和评估结果,自动优化系统提示词或工具描述,以更好地适配你指定的评估标准。 - **批量评估**:使用预定义测试数据集验证推荐效果,输出聚合评分,快速发现关键场景的回归问题。如果手工测试用例不足,还可利用 LLM 驱动的模拟用户生成数据集。 - **A/B 测试**:通过 AgentCore Gateway 在生产环境中进行流量分割,对比不同版本智能体的表现,并给出置信区间和统计显著性结果。 ### 行业背景 智能体质量下降是 AI 工程中的常见痛点。多数团队缺乏自动反馈闭环,只能被动响应投诉。大型团队虽有专门团队和基准测试,但更新周期往往以周或月计,而智能体每天都可能发生漂移。AgentCore 的新功能将评估-优化循环自动化,让产品团队能基于数据而非直觉做出改进。 ### 实践价值 这套工具链覆盖了从问题发现、根因分析到变更验证的完整流程。开发者不再需要手动翻阅海量追踪日志,系统会自动给出优化建议,并通过批量测试和线上 A/B 实验双重验证,确保每个改动都经得起推敲。这对于高频迭代的智能体应用尤为重要,能显著降低维护成本并提升用户体验。

AWS ML1个月前原文

AI 智能体在发布时表现优异,但随着模型迭代、用户行为变化以及提示词在未预期场景中的复用,其性能会悄然退化。传统修复方式依赖人工排查:开发者翻阅追踪记录、形成假设、重写提示词、测试少量案例后发布修复,但此循环效率低下且易引入新问题。Amazon Bedrock AgentCore 现推出全新优化能力,补齐“观察-评估-改进”闭环中的关键环节。新功能包括:基于生产追踪和评估结果生成**优化建议**,自动改进系统提示词或工具描述;**批量评估**允许使用预定义测试数据集验证建议,并报告聚合分数以捕捉回归;**A/B 测试**通过 AgentCore Gateway 在真实流量中按比例分流,以置信区间和统计显著性报告对比结果。此外,当手工编写的测试场景不足时,可利用 LLM 驱动的模拟器生成用户行为数据集。这一系列工具将开发者从依赖直觉的调试模式中解放出来,转向数据驱动的系统化优化流程,使智能体质量维护从周/月级周期提升至日常可持续改进。

AWS ML1个月前原文

每个组织都能访问相同的基础模型,真正的竞争优势来源于用专有数据和领域知识定制模型。但这一过程充满挑战:需要掌握监督微调(SFT)、直接偏好优化(DPO)、强化学习可验证奖励(RLVR)等技术,处理碎片化的API和数据格式,设计严格的评估,并管理长达数月的实验周期。 Amazon SageMaker AI 现在提供了一种**基于Agent的体验**来改变这一切。开发者只需用自然语言描述用例,AI编码Agent便会简化从用例定义、数据准备到技术选择、评估和部署的整个流程。 ### 核心能力:Agent技能(Agent Skills) **Agent技能**是预构建的模块化指令集,编码了AWS和数据科学在模型定制全生命周期中的深度专业知识。当你描述用例时,AI编码Agent会激活相关技能,引导其完成: - **数据准备与验证**:自动转换数据为所需格式,确保质量。 - **技术选择**:根据用例推荐SFT、DPO或RLVR等微调技术。 - **超参数配置**:提供最佳实践建议。 - **模型评估**:使用LLM-as-a-Judge指标进行质量评估。 - **部署**:灵活部署到Amazon Bedrock或SageMaker AI端点。 这些技能不仅提升了生产力,还**减少了Token消耗**。所有生成的代码完全可编辑,产生可复用的工件,无缝集成到现有工作流中。 ### 定制化与可扩展性 技能完全可定制,你可以修改它们以匹配团队的工作流、治理标准和工具偏好,从而实现可重复的组织最佳实践——这是通用编程助手常见的难题。 ### 集成开发环境 SageMaker AI Studio JupyterLab中集成了Agent开发环境支持(通过ACP)。默认情况下,亚马逊的AI软件Kiro提供了内嵌的Agent体验。 ### 总结 通过Agent引导的工作流,Amazon SageMaker AI 将模型定制的复杂性抽象化,让开发者专注于高价值任务。这不仅加速了实验周期,还降低了技术门槛,使更多团队能够利用专有数据构建差异化AI应用。

AWS ML1个月前原文

在Elon Musk试图阻止OpenAI向营利性转型的庭审中,唯一一位直接针对AI技术作证的专家证人——加州大学伯克利分校计算机科学教授Stuart Russell——表达了对AGI军备竞赛的深切忧虑。 ## 庭审焦点:AI安全与营利动机的冲突 Musk的法律团队主张,OpenAI最初作为专注于AI安全的慈善机构成立,如今却因追逐利润而迷失方向。为佐证这一论点,他们引用了创始团队早期关于需要以公共利益制衡Google DeepMind的邮件和声明。而Russell作为资深AI研究者,他的证词旨在提供AI技术背景,并确立这项技术具有足够危险性,值得警惕。 Russell在2023年3月签署了一封呼吁暂停AI研究六个月的公开信。颇具讽刺意味的是,Musk本人也签署了同一封信,尽管他当时正在创办自己的营利性AI实验室xAI。 ## Russell的证词:风险与矛盾 Russell向陪审团和法官Yvonne Gonzalez Rogers指出,AI发展伴随多重风险,包括网络安全威胁、对齐问题,以及开发通用人工智能(AGI)时赢家通吃的特性。他最终表示,追求AGI与确保安全之间存在内在张力。 然而,在OpenAI律师的反对下,法官限制了Russell的证词范围,使他无法在公开法庭上详细阐述对无约束AI生存威胁的更大担忧。Russell长期以来一直批评前沿实验室在全球范围内竞相率先实现AGI所引发的军备竞赛动态,并呼吁政府加强对该领域的监管。 ## 交叉质询:证词的局限 OpenAI的律师在交叉质询中着力证明,Russell并未直接评估OpenAI的企业结构或其具体安全政策。这暗示了庭审的局限性:法律辩论聚焦于公司治理与合同义务,而非AI安全的深层技术问题。 ## 行业背景:AI安全争论持续升温 此次庭审折射出AI行业的核心矛盾:那些曾呼吁谨慎发展的声音,如今却身处营利性AI竞赛的最前沿。Musk一边签署暂停研究的公开信,一边加速推进xAI,这种双重立场让他的诉讼动机备受质疑。而Russell的证词虽被限制,却再次将AGI军备竞赛的风险置于聚光灯下。 随着OpenAI、Google、Anthropic等实验室持续突破能力边界,如何平衡创新速度与安全约束,已成为悬在整个行业头顶的达摩克利斯之剑。

TechCrunch1个月前原文

Colin Angle,这位曾将 5000 万台 Roomba 扫地机器人送入千家万户的 iRobot 创始人,如今带着全新机器人重返舞台。但这一次,他的目标不是清洁,而是陪伴。 Angle 的新公司 **Familiar Machines & Magic** 推出的首款产品名为“Familiar”(灵伴),这是一只狗大小的四足机器人,外形融合了熊、仓鸮和金毛犬的特征,拥有可动的眉毛、耳朵和眼睛,表情丰富。在演示视频中,它能像宠物一样在家中自主移动。 ### 从工具到伴侣:机器人的情感转向 Familiar 被定位为“物理化身的 AI 系统”,通过内置的生成式 AI 模型与主人互动,旨在建立情感联系并发展出“独特的个性”。Angle 在采访中表示,能够对人类做出反应和交流的机器人在“高情感连接角色”中会更有效,例如陪伴、娱乐、酒店服务、智能家居、养老和育儿支持。 这一理念与当前机器人行业的主流趋势形成鲜明对比——许多公司正竞相开发人形机器人,强调灵巧操作和通用性。Angle 则认为:“机器人的下一个时代不仅仅是关于灵巧性或人形形态,而是关于能够建立和维持人类连接的机器。” ### 硬件与场景:不只是另一个宠物 Familiar 并非简单的电子宠物。它作为自主智能体,能够识别家庭成员、学习日常习惯,并主动发起互动。例如,它可以在孩子放学回家时迎接,或在老人独处时提供陪伴。其毛茸茸的外观和拟人化表情设计,旨在降低人们的心理防备,促进更自然的交互。 Angle 的愿景是让机器人从“工具”进化为“伙伴”。这一方向也呼应了近年来社交机器人(如索尼 Aibo)的复兴,但 Familiar 的差异化在于更强的 AI 自主性和更广泛的应用场景——它不局限于宠物替代品,而是瞄准了情感支持、儿童教育、老年护理等刚需领域。 ### 行业挑战与机遇 尽管概念引人,但 Familiar 面临不少挑战。社交机器人历史上有过多次失败尝试(如 Jibo、Kuri),消费者对“有情感”的机器人既期待又怀疑。此外,隐私问题不可忽视:一个在家中长期观察、学习并记录用户行为的机器人,如何确保数据安全? Angle 的过往成功——将 Roomba 从新奇品变成家庭标配——让人们对他的新尝试多了几分信心。但这一次,他需要证明机器人不仅能干活,还能“走心”。 Familiar 预计将在未来一年内进行小范围测试,具体售价和上市时间尚未公布。如果成功,它可能开启一个全新的机器人品类:不是为你打扫房间,而是成为家庭的一员。

The Verge1个月前原文

Amazon Quick 推出了一项生成式 AI 新功能,允许用户通过自然语言提示自动生成包含多工作表、筛选控件和计算字段的完整分析仪表盘,将原本数小时的手动搭建工作缩短至几分钟。 ## 背景与痛点 传统 BI 仪表盘的创建流程繁琐且耗时。即便是经验丰富的 BI 专业人士,也需要手动配置数据源、拖拽图表、设置筛选器和编写计算字段。对于需要频繁生成运营报告的数据分析师、准备领导层审阅的项目经理,或是探索新数据集的工程师而言,这一过程往往成为效率瓶颈。 ## 核心功能:从提示到仪表盘 Amazon Quick 的新能力直接嵌入到 **Analysis(分析)** 创作界面中。用户只需遵循三个步骤: 1. **选择数据集**:支持选择 1–3 个数据集,可跨表关联(如订单表和产品表)。 2. **描述需求**:用自然语言写出想要分析的内容,例如“创建一个运营仪表盘,展示订单量趋势、收入关键指标和交付绩效对比”。 3. **审查并生成**:系统会先生成一个交互式计划,展示建议的图表布局、筛选器和计算字段(如同比/环比增长),用户可在此阶段调整确认,然后一键生成完整的分析文件,并可直接发布为仪表盘。 ## 技术亮点与用户体验 - **智能图表选择**:系统会根据数据特征自动匹配最合适的可视化类型(如折线图、柱状图、表格等)。 - **多工作表组织**:复杂的业务问题通常需要多维度展示,新功能会自动将分析内容拆分到多个工作表中,逻辑清晰。 - **计算字段自动生成**:常见的 KPI 如 **年同比增长(YoY)** 和 **月环比(MoM)** 无需手动编写公式。 - **筛选控件**:为利益相关者提供按不同维度(如时间、地区、产品类别)探索数据的能力。 ## 适用场景 - **运营报告**:数据团队可快速生成定期报告模板,减少重复劳动。 - **领导层汇报**:管理者可直接用自然语言描述关注指标,即时获得可视化结果。 - **数据探索**:工程师面对新数据集时,无需手动拖拽即可获得初步洞察。 ## 行业影响 这一功能进一步降低了 BI 工具的使用门槛,将 **生成式 AI** 从“聊天机器人”延伸至“生产力工具”。与 Microsoft Power BI 的 Copilot、Tableau 的 Ask Data 等竞品相比,Amazon Quick 的优势在于与 AWS 生态的深度集成(如 Redshift、S3),以及对多数据集关联的原生支持。 对于企业而言,这意味着**数据分析民主化**的加速——业务人员不必依赖数据团队即可自主创建仪表盘,而专业分析师则能将精力集中在更复杂的建模和洞察上。 ## 前提条件 使用该功能需要 **AWS 账户** 和 **Amazon Quick Enterprise Edition** 订阅。 ## 小结 Amazon Quick 的自然语言生成仪表盘功能,不仅提升了效率,更改变了 BI 的交互范式。从“手动搭建”到“对话式创作”,AI 正在重塑数据分析的工作流。对于正在寻求敏捷 BI 解决方案的团队,这无疑是一个值得关注的新选项。

AWS ML1个月前原文

由 Bret Taylor 创立的 AI 初创公司 Sierra 于周一宣布完成 9.5 亿美元融资,由 Tiger Global 和 GV 领投,投后估值超过 150 亿美元。此轮融资使 Sierra 持有资金超过 10 亿美元,公司称将用于打造“AI 驱动客户体验的全球标准”。 在竞争激烈的 AI 市场中,Sierra 积极展示增长:从两年前的 4 个设计合作伙伴,到如今声称拥有超过 40% 的财富 50 强企业客户,其平台上的 AI 代理处理着数十亿次交互,涵盖抵押贷款再融资、保险理赔、退货管理及非营利筹款等场景。 Sierra 的营收增长尤为迅猛:去年 11 月首次达到 1 亿美元年度经常性收入(ARR),今年 2 月初又宣布 ARR 达 1.5 亿美元。这一节奏既反映了企业部署 AI 的紧迫性,也体现了高昂的投入成本。Taylor 亦担任 OpenAI 董事长,他认为 AI 代理的最佳前景是为客户降低成本、增加收入,但前期投入巨大。 类似情况在 Uber 身上得到印证。Uber CTO Praveen Neppalli Naga 在 TechCrunch 的 StrictlyVC 活动中透露,公司去年底开放 AI 代理工具后很快超支,但已看到显著成效:在约 8000 名工程师中,10% 的代码由 AI 自主生成;一个酒店预订集成项目,原本需一年,使用代理工作流仅六个月完成。 Sierra 也在扩展平台能力,今年 4 月推出 Ghostwriter——一种“代理即服务”工具,用户用自然语言描述需求,Ghostwriter 即可自主创建并部署专用 AI 代理。 ### 行业视角 这轮融资标志着企业级 AI 代理赛道的竞争进入新阶段。Sierra 的高估值和快速增长的 ARR 表明,大型企业正积极拥抱 AI 代理来优化客户体验。然而,高投入与高回报并存,企业需在前期成本与长期收益间权衡。随着 Sierra 等玩家不断推陈出新,AI 代理有望从实验性工具转变为业务核心。

TechCrunch1个月前原文

在 OpenAI 诉马斯克案开庭前夕,一段私人短信交流被公之于众,揭示了这位科技亿万富翁在寻求和解未果后的激烈反应。据 OpenAI 律师在周日提交的新法庭文件显示,马斯克在庭审开始前两天向 OpenAI 总裁兼联合创始人 Greg Brockman 发送了一条短信,建议 OpenAI 和解此案。Brockman 回复提议双方各自撤诉,但这一建议迅速激怒了马斯克。 马斯克随后回复称:“到本周末,你和 Sam 将成为全美最令人憎恨的人。如果你们坚持,那就这样吧。”这封短信内容虽未作为证据被法官采纳,但 OpenAI 方面意图借此证明马斯克的诉讼并非出于对 AI 安全的真诚关切,而是试图通过法律手段从其成功中牟利,同时打击竞争对手。 **案件背景与核心诉求** 马斯克于去年对 OpenAI 提起诉讼,指控其背离了非营利的初始使命,要求法院强制 OpenAI 拆解其营利性架构、公开其技术、终止与微软的授权协议,并支付包括惩罚性赔偿在内的巨额赔偿金。OpenAI 则提起反诉,称马斯克的诉讼本质是“勒索式的商业攻击”。 **短信事件的法律意义** 尽管主审法官最终裁定该短信内容不可作为证据,但 OpenAI 律师在公开文件中披露这一细节,已成功将舆论焦点引向马斯克动机的争议。法律观察人士指出,这类“和解或毁灭”式的威胁在商业诉讼中并不罕见,但由马斯克这样具有巨大公众影响力的人物发出,其冲击力远超普通案件。 **庭审进展与行业影响** 目前庭审仍在进行中。马斯克一方的专家证人阵容备受关注,但其唯一一位 AI 专家证人的资质已受到质疑。这场诉讼不仅关乎 OpenAI 的未来治理结构,更可能对整个 AI 行业的开源与商业化路径产生深远影响。若马斯克胜诉,OpenAI 的营利模式将被颠覆,微软等合作伙伴的权益也将受损。 值得注意的是,马斯克本人并未出庭作证,其法律团队试图将案件聚焦于 OpenAI 是否违背了创建时的非营利承诺。而 OpenAI 则强调,其转型为“有限营利”公司是为了吸引必要资本以推动 AGI 研发,且始终在使命框架内运作。 随着庭审深入,更多内部文件与证词可能浮出水面。这场 AI 领域最具标志性的法律对决,正在从技术理念之争演变为关于权力、金钱与 AI 治理的全面博弈。

TechCrunch1个月前原文

美国加州民主党参议员亚当·希夫提出了一项名为“未来技术人工智能素养法案”(LIFT AI Act)的两党法案,旨在将“AI素养”纳入K-12(幼儿园至高中)课程。该法案得到了OpenAI、谷歌和微软等全球顶级AI开发商的公开支持。根据法案内容,国家科学基金会(NSF)主任将有权通过择优评审和竞争性方式,向高等教育机构或非营利组织发放资助,用于开发AI素养相关的课程、教学材料、教师培训及评估方法。 法案将AI素养定义为:具备适龄的知识和能力,能够有效使用人工智能、批判性解读AI输出、在AI赋能的世界中解决问题,并降低潜在风险。这一定义涵盖了从基础使用到风险管理的多个层面,旨在为学生应对未来AI普及的社会做好准备。 尽管得到了科技巨头的背书,该法案也引发了讨论。有观点认为,在学业压力本就沉重的K-12阶段增加“AI素养”内容,可能加重学生和教师的负担,且如何平衡技术教育与核心学科的关系尚需探讨。此外,AI技术的快速迭代使得课程内容容易过时,如何保持教材的时效性也是一大挑战。 目前,该法案尚处于立法初期,后续需要经过国会审议。如果通过,将标志着美国联邦层面首次系统性地将AI教育纳入基础教育体系。OpenAI、谷歌和微软的参与也表明,科技行业正积极寻求与教育系统合作,以培养未来AI时代的合格公民和劳动力。 这一动向与中国近期推动的“人工智能+教育”政策不谋而合,全球范围内AI素养教育正在成为各国竞争的焦点。然而,如何避免陷入“为教AI而教AI”的误区,真正实现技术与人文素养的融合,仍是教育者和政策制定者需要深思的问题。

Hacker News1201个月前原文