如何使用 ChatGPT 的新语音命令和图像功能
如果您是 ChatGPT Plus 或 Enterprise 订阅者并且想要亲自查看新功能,那么这样做再简单不过了。只需打开 ChatGPT 并确保您已登录高级帐户,然后导航至“设置”>“新功能”,您就可以选择加入语音对话。请记住,如果您现在找不到此选项,可能只是因为它尚未推出,无需惊慌。
一旦您获得了安全访问权限,接下来就是学习如何通过 ChatGPT 使用语音以达到最佳效果。请记住,它仅适用于移动设备,您可能会因为能够要求它执行最佳的ChatGPT 提示(而不必键入它们)而获得最大的便利。当它更广泛地可用时,看看人们如何进行交互将会很有趣,OpenAI 表示这将在适当的时候发生。
如何在 ChatGPT 上使用图像输入
ChatGPT 的另一个主要新增功能是能够将图像输入聊天机器人。考虑到我们生活的社会的视觉本质,这里的用例更加明显,OpenAI 已经就如何使用新功能提供了一些建议。
“在旅行时拍摄一个地标的照片,并实时讨论它的有趣之处。当您回到家时,拍下冰箱和食品储藏室的照片,以了解晚餐吃什么(并询问后续问题以获取逐步食谱)。晚餐后,通过拍照、圈出问题集并让它与你们俩分享提示来帮助您的孩子解决数学问题,”该公司写道。
ChatGPT 上的语音实际上是如何工作的?
对于那些对语音如何与 ChatGPT 配合使用的更多技术方面感兴趣的人,我们现在知道的是,该功能由全新的 OpenAI 文本转语音模型提供支持,该模型“能够仅从文本生成类似人类的音频”以及几秒钟的演讲样本。”
OpenAI 补充说,它正在与专业配音演员合作,创建使用该功能时提供的不同语音配置文件,而该公司的 Whisper 系统可以将用户的话转录为文本。