ChatGPT 将其不同的功能组合到一个“战神金刚风格”的聊天中

2023-10-31

自近一年前的 2022 年 11 月 30 日发布以来，初创公司 OpenAI 一直在稳步改进其广受欢迎的人工智能聊天机器人 ChatGPT，但根据已经推出该体验的用户表示，最新的更新吸收了之前的所有内容，并且似乎将其合并为一个。。

多名用户在社交媒体上向他们的 ChatGPT 帐户分享了一条更新消息，内容如下：

无需切换即可使用工具：现在可以自动访问浏览、高级数据分析和 DALL-E。（如果愿意，在 GPT-4 下仍然可以进行手动选择。）”

而这些功能——分析和回答有关 PDF 和其他文档的问题、网页浏览和数据分析，以及与 OpenAI 的图像生成模型 DALL-E 3 集成，允许用户使用文本提示来制作新图像——都一一介绍了在过去的几个月里，用户之前必须在其 ChatGPT 会话的“GPT-4”下拉菜单下独立打开每一项。换句话说：用户以前一次只能使用这些 ChatGPT 功能之一。

这意味着，如果您想分析文档，然后生成有关它的图像，则必须在单个聊天会话中完成第一个任务，手动复制从 ChatGPT 返回的分析文本，然后使用以下命令启动新的聊天窗口： DALL-E 3 已启用。然后，您可以粘贴第一个聊天会话中遗留下来的文本，并要求新的 DALL-3 会话中的 ChatGPT 生成图像。现在，借助 OpenAI 的最新更新，您可以在同一个聊天会话中完成所有这些任务，从而大大提高了服务效率。

用户认为此更新和模式是“所有工具”。

最初的反应非常有利，对其他基于 GPT 的初创公司来说是颠覆性的

“突发事件：ChatGPT4 刚刚将其疯狂的工具整合到一个单独的聊天中，就像战神金刚 (Voltron) 风格！无缝处理 PDF、数据、DALLE、视觉、浏览。你的力量刚刚提升了，”纽约大学斯特恩商学院学生主任康纳·格伦南 (Connor Grennan) 在周日的 LinkedIn 帖子中写道，他引用了 20 世纪 80 年代颇具影响力的漫画，其中由人们驾驶的大型机械狮子组合成一个战士。（20 世纪 90 年代的《恐龙战队》在真人表演中也采取了类似的方法）。

p-AI 孵化器创始人 Alex Ker 在 X（以前的 Twitter）上宣称：“今天许多初创公司都死了，因为 OpenAI 添加了 PDF 聊天功能。您还可以与数据文件和其他文档类型聊天。我们有一波更适合作为功能而不是独立公司的产品。包装器一方面受到 OpenAI 的挤压，另一方面受到现有企业的挤压。外面的世界很艰难。”

Nvidia 高级 AI 科学家 Jim Fan 对此表示同意，他在 X 上发帖称：“在你的肾上腺素激增之前，先问问自己：OpenAI/Anthropic/Microsoft 能否在黑客马拉松中与 3 名工程师一起添加此功能？”他还建议，遵循这种模式的初创公司最终将陷入“薄包装墓地”。

在你的肾上腺素激增之前，先问问自己这个问题：

OpenAI/Anthropic/Microsoft 能否在黑客马拉松中与 3 名工程师一起添加此功能？

对上述问题表示“是”的数量令人震惊。在薄薄的包装墓地里万圣节快乐。？ https://t.co/ehnGvxBQaG

— 吉姆·范 (@DrJimFan) 2023 年 10 月 29 日 Ker 和 Fan 提到了自从 OpenAI 支持 API 访问其 GPT-3.5 和 GPT-4 大语言模型 (LLM) 以来涌现的许多公司，这些 AI 模型支撑着不同版本的 ChatGPT。

第三方公司已经能够访问这些模型来构建自己的由 OpenAI 技术支持的应用程序和产品，其中一些提供 PDF 和文档分析。这些应用程序和产品被技术社区成员视为“包装器”，有时甚至是嘲笑的，因为它们本质上只是围绕底层 GPT-3.5/4 技术“包装”的不同用户界面。

事实上，OpenAI 在今年 3 月开放了自己的 ChatGPT 第三方插件库，以及第三方开发者提供的一些产品，包括 PDF 和文档分析工具。然而，使用它们的体验对于用户来说通常有点麻烦（至少在 VentureBeat 的测试中是这样），需要他们将文档上传到单独的网站并将 URL 粘贴到 ChatGPT 中。

新的更新似乎使这些插件基本上过时了。此外，有用户指出，得益于上传功能结合DALL-E 3图像生成和ChatGPT现有的对话理解，“All Tools”更新可以使用自然语言指令编辑用户提供的图像，有效与Adobe竞争Photoshop 可以完成此任务。

......但有些人有安全顾虑

为了提高效率并为用户提供更强大的体验，将 ChatGPT 不断扩展的功能列表捆绑到一个类似“Voltron”的形式中是有意义的。尽管如此，一些人还是提出了安全担忧。

Django Python Web 框架的联合创建者 Simon Willison 表示：“我真的很惊讶地看到浏览器和代码解释器在同一个会话中可用，感觉就像是针对两者组合进行创造性提示注入攻击的有力载体。”以及 X 上数据发布/探索工具 Datasette 的创始人。

我真的很惊讶地看到浏览和代码解释器在同一个会话中可用 - 感觉就像是针对两者组合的创造性提示注入攻击的有效载体 https://t.co/NASxP3Qv7B

— 西蒙·威利森 (@simonw) 2023 年 10 月 29 日 “代码解释器”是 ChatGPT 中“高级数据分析”设置的名称，它允许上传和分析文档。

然而，正如各种用户所表明的那样，ChatGPT 很容易被包含某些信息的上传内容所欺骗，例如给出秘密指令的白色文本。

Willison 在随后的 X 帖子中详细阐述了他的担忧，他写道：“浏览模式是提示注入的载体，因为恶意指令可能隐藏在浏览模式访问的页面中。现在这些恶意指令可以访问沙箱中的 Python，其输出可能包括触发浏览的进一步指令？”

浏览模式是提示注入的载体，因为恶意指令可能隐藏在浏览模式访问的页面中

现在，这些恶意指令可以访问沙箱中的 Python，并且其输出可能包括触发浏览的进一步指令？

— 西蒙·威利森 (@simonw) 2023 年 10 月 29 日 Willison 的观点很好理解：如果 ChatGPT 可以读取网页，那么黑客或恶意行为者就会构建网页，为其提供秘密指令，以便使用“高级数据分析”模式中提供的代码生成功能（以前与浏览和其他操作隔离）进行编程。攻击者可以让 ChatGPT 为他们的利益、恶作剧、破坏或更糟的目的做各种各样的事情，包括让它编写程序，理论上在安装时劫持一个人的计算机或设备。

OpenAI 之前尚未宣布 ChatGPT 的新捆绑版本 - 在本文发表时，官方公司博客和 ChatGPT 发行说明网页均未更新以包含有关捆绑功能的新信息。首席执行官 Sam Altman、首席技术官 Mira Murati 和开发者关系倡导者 Logan Kilpatrick 也尚未通过他们的 X 帐户发布相关信息。我们已联系发言人以获取有关此问题的更多信息，并将在收到回复后更新我们的文章。