2023-10-31
自近一年前的 2022 年 11 月 30 日发布以来,初创公司 OpenAI 一直在稳步改进其广受欢迎的人工智能聊天机器人 ChatGPT,但根据已经推出该体验的用户表示,最新的更新吸收了之前的所有内容,并且似乎将其合并为一个。 。
notion image
多名用户在社交媒体上向他们的 ChatGPT 帐户分享了一条更新消息,内容如下:
无需切换即可使用工具:现在可以自动访问浏览、高级数据分析和 DALL-E。 (如果愿意,在 GPT-4 下仍然可以进行手动选择。)”
而这些功能——分析和回答有关 PDF 和其他文档的问题、网页浏览和数据分析,以及与 OpenAI 的图像生成模型 DALL-E 3 集成,允许用户使用文本提示来制作新图像——都一一介绍了在过去的几个月里,用户之前必须在其 ChatGPT 会话的“GPT-4”下拉菜单下独立打开每一项。换句话说:用户以前一次只能使用这些 ChatGPT 功能之一。
这意味着,如果您想分析文档,然后生成有关它的图像,则必须在单个聊天会话中完成第一个任务,手动复制从 ChatGPT 返回的分析文本,然后使用以下命令启动新的聊天窗口: DALL-E 3 已启用。然后,您可以粘贴第一个聊天会话中遗留下来的文本,并要求新的 DALL-3 会话中的 ChatGPT 生成图像。现在,借助 OpenAI 的最新更新,您可以在同一个聊天会话中完成所有这些任务,从而大大提高了服务效率。
用户认为此更新和模式是“所有工具”。
最初的反应非常有利,对其他基于 GPT 的初创公司来说是颠覆性的
“突发事件:ChatGPT4 刚刚将其疯狂的工具整合到一个单独的聊天中,就像战神金刚 (Voltron) 风格!无缝处理 PDF、数据、DALLE、视觉、浏览。你的力量刚刚提升了,”纽约大学斯特恩商学院学生主任康纳·格伦南 (Connor Grennan) 在周日的 LinkedIn 帖子中写道,他引用了 20 世纪 80 年代颇具影响力的漫画,其中由人们驾驶的大型机械狮子组合成一个战士。 (20 世纪 90 年代的《恐龙战队》在真人表演中也采取了类似的方法)。
p-AI 孵化器创始人 Alex Ker 在 X(以前的 Twitter)上宣称:“今天许多初创公司都死了,因为 OpenAI 添加了 PDF 聊天功能。您还可以与数据文件和其他文档类型聊天。我们有一波更适合作为功能而不是独立公司的产品。包装器一方面受到 OpenAI 的挤压,另一方面受到现有企业的挤压。外面的世界很艰难。”
Nvidia 高级 AI 科学家 Jim Fan 对此表示同意,他在 X 上发帖称:“在你的肾上腺素激增之前,先问问自己:OpenAI/Anthropic/Microsoft 能否在黑客马拉松中与 3 名工程师一起添加此功能?”他还建议,遵循这种模式的初创公司最终将陷入“薄包装墓地”。
在你的肾上腺素激增之前,先问问自己这个问题:
OpenAI/Anthropic/Microsoft 能否在黑客马拉松中与 3 名工程师一起添加此功能?
对上述问题表示“是”的数量令人震惊。在薄薄的包装墓地里万圣节快乐。 ? https://t.co/ehnGvxBQaG
— 吉姆·范 (@DrJimFan) 2023 年 10 月 29 日 Ker 和 Fan 提到了自从 OpenAI 支持 API 访问其 GPT-3.5 和 GPT-4 大语言模型 (LLM) 以来涌现的许多公司,这些 AI 模型支撑着不同版本的 ChatGPT。
第三方公司已经能够访问这些模型来构建自己的由 OpenAI 技术支持的应用程序和产品,其中一些提供 PDF 和文档分析。这些应用程序和产品被技术社区成员视为“包装器”,有时甚至是嘲笑的,因为它们本质上只是围绕底层 GPT-3.5/4 技术“包装”的不同用户界面。
事实上,OpenAI 在今年 3 月开放了自己的 ChatGPT 第三方插件库,以及第三方开发者提供的一些产品,包括 PDF 和文档分析工具。然而,使用它们的体验对于用户来说通常有点麻烦(至少在 VentureBeat 的测试中是这样),需要他们将文档上传到单独的网站并将 URL 粘贴到 ChatGPT 中。
新的更新似乎使这些插件基本上过时了。此外,有用户指出,得益于上传功能结合DALL-E 3图像生成和ChatGPT现有的对话理解,“All Tools”更新可以使用自然语言指令编辑用户提供的图像,有效与Adobe竞争Photoshop 可以完成此任务。
......但有些人有安全顾虑
为了提高效率并为用户提供更强大的体验,将 ChatGPT 不断扩展的功能列表捆绑到一个类似“Voltron”的形式中是有意义的。尽管如此,一些人还是提出了安全担忧。
Django Python Web 框架的联合创建者 Simon Willison 表示:“我真的很惊讶地看到浏览器和代码解释器在同一个会话中可用,感觉就像是针对两者组合进行创造性提示注入攻击的有力载体。”以及 X 上数据发布/探索工具 Datasette 的创始人。
我真的很惊讶地看到浏览和代码解释器在同一个会话中可用 - 感觉就像是针对两者组合的创造性提示注入攻击的有效载体 https://t.co/NASxP3Qv7B
— 西蒙·威利森 (@simonw) 2023 年 10 月 29 日 “代码解释器”是 ChatGPT 中“高级数据分析”设置的名称,它允许上传和分析文档。
然而,正如各种用户所表明的那样,ChatGPT 很容易被包含某些信息的上传内容所欺骗,例如给出秘密指令的白色文本。
Willison 在随后的 X 帖子中详细阐述了他的担忧,他写道:“浏览模式是提示注入的载体,因为恶意指令可能隐藏在浏览模式访问的页面中。现在这些恶意指令可以访问沙箱中的 Python,其输出可能包括触发浏览的进一步指令?”
浏览模式是提示注入的载体,因为恶意指令可能隐藏在浏览模式访问的页面中
现在,这些恶意指令可以访问沙箱中的 Python,并且其输出可能包括触发浏览的进一步指令?
— 西蒙·威利森 (@simonw) 2023 年 10 月 29 日 Willison 的观点很好理解:如果 ChatGPT 可以读取网页,那么黑客或恶意行为者就会构建网页,为其提供秘密指令,以便使用“高级数据分析”模式中提供的代码生成功能(以前与浏览和其他操作隔离)进行编程。攻击者可以让 ChatGPT 为他们的利益、恶作剧、破坏或更糟的目的做各种各样的事情,包括让它编写程序,理论上在安装时劫持一个人的计算机或设备。
OpenAI 之前尚未宣布 ChatGPT 的新捆绑版本 - 在本文发表时,官方公司博客和 ChatGPT 发行说明网页均未更新以包含有关捆绑功能的新信息。首席执行官 Sam Altman、首席技术官 Mira Murati 和开发者关系倡导者 Logan Kilpatrick 也尚未通过他们的 X 帐户发布相关信息。我们已联系发言人以获取有关此问题的更多信息,并将在收到回复后更新我们的文章。
百度文心一言专业版开启邀测:每日早上 9 点申请,可体验文心大模型 4.0百川智能推出大模型Baichuan2-192K,一次可输入35万字超越Claude2