澳洲OpenAI：我们正在努力改善 ChatGPT 的“牙牙学语”

日期：2023-03-05 栏目：Australia 澳洲新闻

在澳大利亚澳洲新闻

当 OpenAI 在 2022 年 11 月下旬推出 ChatGPT 时，几乎没有人对它有什么特别的期望，而当 ChatGPT 开始在网上疯传时，OpenAI 争相追赶，并使用借此机会完善您的模型。

周五，在接受《麻省理工科技评论》采访时，OpenAI 团队对这一“成功”表现得特别谦虚。

OpenAI 人工智能政策研究员 Sandhini Agarwal 表示，这在内部被视为一项已有两年历史的技术的“研究预览”。一个更完善的版本，也试图通过收集用户反馈来弥补它的缺陷。另一位研究人员 Liam Fedus 指出，OpenAI 不想将其夸大为重大突破。

自11月以来，OpenAI对ChatGPT进行了数次更新，研究人员正在使用一种名为“对抗训练”的技术来防止ChatGPT“越狱”（jailbreaking）。这项工作让多个聊天机器人相互对抗：一个聊天机器人充当对手，针对另一个聊天机器人生成文本，迫使它打破通常的约束。

在此外，OpenAI 与微软签署了数十亿美元的协议，并宣布与全球管理咨询公司贝恩结盟，目标是通过突破性的人工智能技术赋能客户的商业潜力。在 OpenAI 之外，出现了一个“大模型” 》围绕ChatGPT的淘金热，来自世界各地的公司和投资者积极参与。

以下为采访具体内容：

< p style="text-align: center;">

这场火灾完全“出乎意料” 、会话数据对ChatGPT产生了巨大的积极影响

Jan Leike（负责提高系统安全性的团队负责人）：老实说，这确实是压倒。

我们很惊讶，并一直在努力改进。 John Schulman（联合创始人）：在发布后的几天里，我经常查看 Twitter，在这段疯狂的时间里，它充斥着 ChatGPT 的截图。

我希望它能得到更多关注，但我没想到它会走这么远。

Sandhini Agarwal（人工智能政策研究员）：我认为人们开始使用它绝对让我们所有人感到惊讶。我们对这些模型研究得太多了，以至于忘记了它们有时会让外界感到惊讶。

Liam Fedus（人工智能政策研究员）：我们对反应感到惊讶，很多人以前尝试过聊天机器人，但是，我们的私人测试版让我们相信我们拥有人们可能真正喜欢的东西。 Jan Leike：我想更好地理解是什么驱动了这一切，是什么驱动了病毒式传播。

老实说，我们不知道。（团队的部分困惑来自于 ChatGPT 中的大部分技术都不是新的，ChatGPT 是 GPT-3.5 的微调版本，OpenAI 在聊天机器人发布前几个月就开发了一个大型语言模型.

GPT-3.5 本身是 GPT-3 的更新版本，于 2020 年发布。

OpenAI 还在 2022 年 1 月发布了 GPT-3.5 的微调版本，称为 InstructGPT。但这些早期版本的技术都没有向公众发布。）Liam Fedus：ChatGPT 模型是从同一种语言微调而来的model as InstructGPT 是的，我们添加了一些会话数据，并在训练过程中做了一些微调。

我们不想将此夸大为一项重大突破，但事实证明会话数据对 ChatGPT 具有巨大的积极影响。

使用标准基准评估原始技术能力，模型之间几乎没有实质性差异，但 ChatGPT 更易于访问和使用。

< /p>

"不要等到完美"

Sandhini Agarwal：当我们准备发布时，我们认为这个模型没有其他新的风险，GPT-3.5 已经发布了，我们知道它足够安全。

通过ChatGPT对人类偏好的训练，模型可以自动学习拒绝行为，即拒绝大量请求。

Jan Leike：我们确实为 ChatGPT 做了一些额外的“红队”，OpenAI 的每个人都在努力打破这种模式。

我们有外部团体在做同样的事情。我们还有一个�具有受信任用户反馈的早期访问程序。

Sandhini Agarwal：我们确实发现它输出了一些不必要的内容，所以作为“研究预览”的意图是好的。

John Schulman：您不能等到您的系统完美后再发布它。我们已经对早期版本进行了几个月的测试，测试人员对该产品的印象很好。

我们最关心的是真实性，因为模特喜欢编造东西。

但 InstructGPT 和其他大型语言模型已经存在，所以我们认为只要 ChatGPT 在真实性和其他安全问题上优于那些模型，它就应该更好选择。

在发布之前，根据我们有限的评估，确认这些模型确实比其他模型更真实和安全，所以我们决定继续发布。

< /p>

大量问题浮出水面，“越狱”亟待解决

Sandhini Agarwal：随着 ChatGPT 病毒式传播，许多问题真正浮出水面，这是一个我们希望尽快解决的关键问题。

例如，ChatGPT 非常擅长拒绝不良请求，但它也很容易编写提示，因此它不会拒绝我们希望它拒绝的内容.

Liam Fedus：看到我们的用户提供多样化和创造性的应用程序令人兴奋，但我们始终关注需要改进的领域

< p style="text-align: justify;">.我们相信，通过我们的部署、获取反馈和改进的迭代过程，我们可以产生最强大的技术。随着技术的发展，新的问题不可避免。

Sandhini Agarwal：我们最需要解决的问题是“越狱”，当我们发现越狱时，我们会将其添加到训练和测试数据中。

简雷克：每次有更好的模型出来，我们都想发布出来测试一下。

我们非常乐观地认为，一些有针对性的对抗训练可以大大提高越狱能力。

尚不清楚这些问题是否会完全消失，但我们认为这至少会使许多越狱变得更加困难。

我认为一旦部署了这些系统，就很难预测它们的真正安全问题。

因此我们非常重视监控人们使用系统的目的，了解发生了什么，然后做出反应。但是很难预测当系统进入现实世界时会发生什么。

Sandhini Agarwal：现在的风险肯定比六个月前高得多，但仍低于一年后的水平。

显然，这些模型真正重要的是它们的使用环境。像谷歌和微软一样，它们注定是搜索引擎。

像搜索这样的大型模型所需要的东西不同于一个有趣的聊天机器人所需要的东西。

我们需要弄清楚如何平衡所有这些不同的用途，并创造出适合不同环境中的人们的东西。

在这些环境中，预期的行为可能会发生变化，从而增加更多的压力。

我们正在构建这些模型，以便将它们转化为产品。

ChatGPT 是一个产品，现在我们有一个 API。

我们正在构建这种通用技术，需要确保它在各个方面都能很好地发挥作用，这是我们目前面临的关键挑战之一。

澳洲中文论坛热点

悉尼部份城铁将封闭一年，华人区受影响！只能乘巴士（组图）: 据《逐日电讯报》报导，从明年年中开始，因为从Bankstown和Sydenham的城铁将因Metro South West革新名目而

联邦政客们具有多少房产？: 据本月早些时分报导，绿党副首领、参议员Mehreen Faruqi已获准在Port Macquarie联系其房产并建造三栋投资联

中文新闻,澳洲经济,时事,华人论坛动态,悉尼本地消息,墨尔本,珀斯,布里斯班,澳洲新闻,澳大利亚华人网,澳洲华人论坛

澳洲新闻

澳洲OpenAI：我们正在努力改善 ChatGPT 的“牙牙学语”

2020年墨尔本杀害四名警察的卡车所属公司破产，不会支付231万澳元罚款

近3000人在等待父母移民签证时死亡

“一家人”老鼠在 Westfield 购物中心跳来跳去

警方在悉尼西部追捕嫌疑人，警车遭到射击

今晚悉尼跨年夜活动指南：烟花、交通和天气预报

23岁男子节礼日在新南威尔士州徒步失踪，搜救今日继续

2019年黑夏后首次在南极洲发现澳大利亚丛林大火烟雾

一名30多岁的维多利亚男子在塔斯马尼亚徒步旅行时从高处坠落身亡。

高峰时段前往西澳西南部的船只严重拥堵

32岁阿德曼在巴厘岛帕苏特海滩度蜜月时去世

总理命令维多利亚工党删除批评达顿及其家人的“恶意”帖子

定时炸弹：澳大利亚人警告要谨防节后债务

青年从栈桥跳下疑脊椎受伤

布里斯班北部小镇一名男子被控强奸 11 岁女孩

高新宇再次爆冷，中国队联手德国队晋级八强

2024年澳大利亚养老金回报预计将达到两位数

过去24小时内，西澳发生三起车祸，造成四人死亡

墨尔本战争纪念馆附近有两人被树枝掉落压伤