SheepNav
精选18天前0 投票

ChatGPT 安全升级:更好地理解敏感对话中的上下文

OpenAI 宣布了 ChatGPT 的新安全更新,旨在提升模型在敏感对话中对上下文的识别能力。这些改进帮助 ChatGPT 在风险逐渐显现时做出更安全的响应,例如通过缓和对话、拒绝提供有害细节或引导用户寻求支持。更新聚焦于自杀、自残和伤害他人等急性场景,通过模型训练和与心理健康专家的合作,使 ChatGPT 能够更好地识别对话中随时间演变的警示信号,并基于上下文采取谨慎行动。这一举措旨在平衡安全性与日常对话的自然流畅,避免过度反应。

延伸阅读

  1. 结构诱导信息助力重根列文树搜索:隐式子任务分解的新范式
  2. EHRBench:基于电子健康记录的大模型临床决策能力自动化评估基准
  3. 不确定性感知与时间调控的专家建议:让自动驾驶强化学习更安全
查看原文