澳洲人工智能已经厌倦了我们吗? ChatGPT 的制造商承认该机器人已开始拒绝响应用户的请求 - 他们不知道为什么

在澳大利亚中文新闻




今年感恩节后的第二天,一位 ChatGPT 用户收到了来自 AI 聊天机器人的异常懒惰、人性化的回复:“您可以填写其余的数据。”

自此之后,OpenAI 的 ChatGPT 开发者对其大型语言模型 (LLM) AI 在过去一个月表现迟缓提出了一波投诉,引发了笑话以及一些关于机器人“季节性抑郁症”的真诚数据分析。

“我们已收到您关于 GPT4 变得更加懒惰的所有反馈!” OpenAI 的 ChatGPT 团队在 X 上发布了消息。

“我们自 11 月 11 日以来就没有更新过模型,这当然不是故意的,”该团队表示。 “模型行为可能是不可预测的,我们正在研究解决它。”

但是一位人工智能研究人员进行了一项实验,要求 ChatGPT 最新的 LLM 模型 GPT4 Turbo 执行任务,就像是 5 月,然后就像是 12 月 -他对这个“疯狂的结果”感到震惊。

自去年感恩节以来,OpenAI 的 ChatGPT 制作者收到了一波投诉他们的大语言模型 (LLM) AI 在过去一个月表现迟缓 ¿ 导致了关于机器人“季节性抑郁症”的笑话和一些真诚的数据分析 < p class="imageCaption">自去年感恩节以来,OpenAI 的 ChatGPT 开发者对其大型语言模型 (LLM) AI 在过去一个月表现迟缓提出了一波投诉,引发了笑话,并针对机器人的“进行了一些真诚的数据分析”。季节性抑郁症'

But one knowledgeable AI researcher, Rob Lynch, has run an experiment: asking ChatGPT 最新的 LLM 模型 GPT4 Turbo 执行任务,首先好像是 5 月,然后好像是 12 月。他对“疯狂的结果”感到震惊

但是一位知识渊博的人工智能研究人员 Rob Lynch 运行了一项实验:要求 ChatGPT 最新的 LLM 模型 GPT4 Turbo 执行任务,先假装是 5 月,然后假装是 12 月。他对“疯狂的结果”感到震惊

AI 和 LLM 研究员 Rob Lynch 在 X 上发帖称,他对 12 月的实验性 ChatGPT 任务和 5 月的对照组任务进行了 477 次测试。

林奇说,他在所有 954 项测试中的提示都是“代码完成”请求。

“狂野的结果。GPT-4-Turbo Lynch 报告称,“当 API 认为是 12 月时,它会产生比认为是 5 月时更短的完成时间(具有统计显着性)”。

“希望如此”看看这是否会在其他人身上重现。”他补充道。

“天啊,人工智能寒假假说可能真的是真的?”一位 X 用户做出了回应,呼应了一种在网上流行的流行理论,该理论是对 ChatGPT 因季节性抑郁症而倒下的笑话的稍微合理的即兴重复。

作为另一位 ChatGPT用户 Mike Swoopskee 建议道:“如果它从训练数据中了解到,人们通常会在 12 月放慢脚步,将更大的项目推迟到新年,而这就是它最近变得更加懒惰的原因,该怎么办?”

AI 和 LLM 研究员 Rob Lynch 在 X 上发布说,他对两者进行了 477 次测试实验组 12 月的 ChatGPT 任务和对照组 5 月的任务。林奇说,他在所有 954 项测试中的提示都是“代码完成”请求

AI 和 LLM 研究员Rob Lynch 在 X 上发帖称,他针对 12 月的实验性 ChatGPT 任务和 5 月的对照组任务运行了 477 次测试。林奇表示,他在所有 954 次测试中的提示都是“代码完成”请求

“狂野的结果。GPT-4-Turbo 在 API 上产生的完成时间(统计上显着)在“认为”是 12 月时比认为是 5 月时要短,”Lynch 报告道。平均结果(如图)超过 200 12 月与 5 月相比,分数更短,因此完成的工作更少

林奇分享了他的实验中的代码(上面)并说“很想看看这是否可以为其他人重现。”到目前为止,其他人还没有成功地重现他的实验

Lynch 分享了他的实验代码(上图)并说“很想看看这是否可以复制到其他人身上。”到目前为止,其他人尚未成功重现他的实验

阅读更多:ChatGPT 因声称通过发布虚假信息伤害人们并意外泄露而受到 FTC 调查电子邮件地址和付款详细信息

本周,FTC 向 OpenAI 发送了一份 20 页的要求,要求提供有关如何记录的记录OpenAI 解决了与其人工智能模型相关的风险,因为它正在调查该公司是否因发布有关消费者的虚假信息而对消费者造成“声誉损害”。

广告

将情感归因于一段内容听起来很奇怪即使是像 ChatGPT 这样复杂的软件,研究人员也发现了一些奇怪的案例,其中对 ChatGPT 最新的 GPT-4 和其他人工智能的鼓励性提示提高了性能。

Google DeepMind 的例如,人工智能研究人员去年 9 月在 Arxiv 上发布了一篇同行评审前的文章,他们发现,当要求一些 LLM 人工智能机器人先“深呼吸”时,它们在解决数学问题时表现得更好。

< p class="mol-para-with-font">有趣的是,其他人发现,当类似的 LLM 聊天机器人被告知他们将因完成指定任务而获得付费小费,或者被提醒他们没有手指并且可以打字时,他们似乎会更加努力地工作服务器速度允许的尽可能快。

但是,并非所有研究人员都相信 ChatGPT 在今年冬天正在冬眠、放松或陷入恐慌。

人工智能研究员 Ian Arawjo 发布了他重现林奇结果的尝试,称他无法将季节性差异与任何统计意义相匹配。

由于存在许多随机元素,这证明了大型语言模型人工智能聊天机器人的真正“规模”,人工智能专家指出,聊天机器人的变化响应输出——这意味着需要更大的样本量来建立这个“寒假假设”的可靠统计数据。

但许多人仍然支持它,包括人工智能研究员杰弗里·利特 (Geoffrey Litt) 在 C 上发帖称这是“有史以来最有趣的理论”。

“我希望这是真正的解释,”利特说。 “无论它是否真实,[我]喜欢它很难排除。”

许多 AI 研究人员都在支持“寒假”假说,其中包括人工智能研究员 Geoffrey Litt,他在 C 上发帖称这是“有史以来最有趣的理论”。上面,一位 ChatGPT 用户为 ChatGPT 在假期期间的轻松方式提供了数据集解释

As将情感归因于一款软件(即使是像 ChatGPT 这样复杂的软件)听起来可能很奇怪,但 Google DeepMind 的研究人员发现了一些奇怪的案例,其中对 ChatGPT 最新版本、GPT-4 和其他人工智能的鼓励提示提高了性能” class=

将情感归因于一款软件听起来很奇怪,即使是像 ChatGPT 这样复杂的软件,研究人员Google 的 DeepMind 发现了一些奇怪的案例,其中对 ChatGPT 最新的 GPT-4 和其他 AI 的鼓励性提示提高了性能

并非所有研究人员都相信 ChatGPT 今年冬天正在冬眠、放松或陷入恐慌。 AI 研究员 Ian Arawjo 尝试重现 Lynch 的结果,称他无法将季节性差异与任何统计显着性相匹配

并非所有研究人员都相信 ChatGPT 今年冬天正在冬眠、放松或陷入恐慌。人工智能研究员 Ian Arawjo 发表了他重现林奇结果的尝试,称他无法将季节性差异与任何统计显着性相匹配

< p class="mol-para-with-font">无论问题背后的真相是什么,ChatGPT 用户都感受到了真实的懒惰,他们在今年感恩节后的第二天发现该应用程序不合作。

用户指出他们的假期周末请求“非常简单”。

'我要求 ChatGPT 填写一份用户上个月在 Reddit 上发布了一个名为 Acceptable-Amount-14 的用户,他说:“我正在创建一个 .csv 文件[即电子表格文件],包含 15 个条目,每个条目有 8 列,基于单个 html 页面。”

根据该用户的说法,ChatGPT 的回应是什么? “由于数据的广泛性,所有产品的完整提取将相当漫长,”人工智能回答道。

“但是,我可以提供包含此单个条目作为模板的文件,”ChatGPT 继续说道,“您可以将其余数据填写为”

Reddit 发帖者非常愤怒,并希望该社交媒体网站的 ChatGPT 社区能够回答有关人工智能未来的更大问题。

“这就是人工智能应有的样子吗?”他们问过。 “一个霸道的懒惰机器人让我自己做这项工作?”

DepressionAITwitterThanksgivingChatGPT
澳洲中文论坛热点
悉尼部份城铁将封闭一年,华人区受影响!只能乘巴士(组图)
据《逐日电讯报》报导,从明年年中开始,因为从Bankstown和Sydenham的城铁将因Metro South West革新名目而
联邦政客们具有多少房产?
据本月早些时分报导,绿党副首领、参议员Mehreen Faruqi已获准在Port Macquarie联系其房产并建造三栋投资联

澳洲新闻,澳大利亚华人网,澳洲华人论坛