SheepNav
新上线昨天0 投票

Facebook前高管创立Moonbounce:用AI引擎为内容审核注入“政策即代码”新思路

当Brett Levenson于2019年离开苹果加入Facebook负责商业诚信业务时,他本以为能通过技术手段解决这家社交媒体巨头的内容审核难题。然而,现实远比想象复杂。他发现,人工审核员需要记忆一份长达40页、经过机器翻译的政策文件,而每一条被标记的内容只有约30秒的处理时间——不仅要判断是否违规,还要决定采取何种措施(如屏蔽、封禁用户或限制传播)。Levenson坦言,这些快速决策的准确率“仅略高于50%”,几乎等同于“抛硬币”。

延迟与被动:传统审核的致命缺陷

这种延迟且被动的审核方式在当今敏捷且资金充足的恶意行为者面前显得不堪一击。随着AI聊天机器人的兴起,问题进一步加剧:内容审核的失败已导致一系列备受关注的事件,例如聊天机器人向青少年提供自残指导,或AI生成图像绕过安全过滤器。

Levenson的挫败感催生了“政策即代码”的理念——将静态政策文件转化为可执行、可更新的逻辑,并与执行机制紧密耦合。这一洞察最终促成了Moonbounce的创立。该公司近日宣布获得1200万美元融资,此轮融资由Amplify Partners和StepStone Group共同领投。

Moonbounce的AI控制引擎如何运作?

Moonbounce的核心是为企业提供额外的安全层,无论内容是由用户还是AI生成。公司训练了自己的大型语言模型,能够:

  • 解析客户的政策文件
  • 在运行时评估内容
  • 300毫秒或更短时间内提供响应
  • 根据预设采取行动

具体行动取决于客户偏好:可能是系统减缓内容传播以等待后续人工审核,也可能是即时拦截高风险内容

三大垂直领域布局

目前,Moonbounce主要服务于以下三个领域:

  1. 用户生成内容平台:如约会应用等
  2. AI公司:开发角色或伴侣型AI的企业
  3. AI图像生成器:需要内容安全过滤的视觉AI工具

AI时代内容审核的范式转变

Levenson的经历揭示了传统内容审核的深层困境:依赖人工记忆与快速判断不仅效率低下,更难以应对规模化、实时化的内容洪流。Moonbounce的“政策即代码”方案试图将审核从“事后补救”转向“事前预防与实时干预”,通过AI引擎将政策转化为可预测、一致的行为逻辑。

在生成式AI爆发式增长的背景下,内容安全已成为行业不可回避的挑战。Moonbounce的融资与业务方向,或许标志着AI驱动的内容审核正从辅助工具走向核心基础设施。

延伸阅读

  1. 油价飙升如何省钱?我常用的5款寻找附近最便宜加油站的App
  2. 出差两个月,我让智能花盆自己照顾植物——结果令人惊喜
  3. 如何清理Android手机缓存——以及为何它能显著提升性能
查看原文