OpenAI
页面内容为机器翻译。查看英文原文

ChatGPT 图片输入常见问题

带你了解如何使用 ChatGPT 全新的图片输入功能、如何更高效地使用,以及它的局限性

更新于:15 days ago

什么是图片输入?它在 ChatGPT 中如何工作?

ChatGPT 现已具备图片能力,可以理解并解读你在对话中添加的图片输入。

我应该如何在对话中使用图片输入?

基本用法:先上传一张照片开始。你可以询问图片中的物体、分析文档,或探索视觉内容。你也可以在后续轮次继续添加更多图片,以加深或转移讨论。随时都可以带着新照片回来继续问。

标注图片:若想让注意力集中在特定区域,建议在上传前使用图片编辑标记工具在图片上做标注。这能引导 ChatGPT 聚焦你认为重要的元素。

哪些套餐可以使用图片输入?

Plus 和 ChatGPT Enterprise。

哪些模型可以接受图片输入?

所有 ChatGPT 模型都可以接受图片输入。

哪些平台支持图片输入?

所有平台均支持,包括网页(chatgpt.com)和移动端(iOS / Android)。

我的图片会被用来改进你们的模型吗?

我们对内容(包括图片)的使用方式在各产品中保持一致。

请参阅如何使用你的数据来改进模型性能,以更好地了解 ChatGPT 上的内容可能如何被用于改进模型性能,以及用户可选择的选项。

对于ChatGPT Enterprise,我们不会使用内容来训练我们的模型。

如何在 ChatGPT 中添加图片输入?

在提示输入框中点按 + 图标,然后选择 添加照片和文件。或者,你也可以将图片文件拖入文本框,或粘贴剪贴板中已复制的图片。

图片输入支持视频吗?

不支持,它无法处理视频。目前仅支持处理静态图片。

支持哪些文件类型?

PNG(.png)、JPEG(.jpeg 和 .jpg),以及非动态的 GIF(.gif)。

我一次可以上传多少张图片?

你能添加到对话中的图片数量取决于多种因素,包括图片大小以及随附文本的数量。一般来说,如果你遇到问题,建议减少图片数量或缩小图片大小。

每张图片的大小限制是多少?

20MB。

图片能力如何处理模糊或不清晰的图片?

如果图片含义不明确或不清晰,模型会尽力解读,但结果可能不够准确。

使用带图片输入的 ChatGPT 时,用户需要注意哪些局限?

如果你在使用 ChatGPT 全新的图片输入功能,请务必了解以下局限:

  1. 医疗:模型不适合解读 CT 等专业医学影像,也不应用于提供医疗建议。

  2. 非英语:对于包含非拉丁字母文本(如日语或韩语)的图片,模型的处理效果不如英文。

  3. 大段文字:可放大图片中的文字以提升可读性,但请避免裁剪掉重要细节。

  4. 旋转:对于旋转/倒置的文字或图片,模型可能会误读。

  5. 视觉元素:对于图表,或颜色/样式(如实线、虚线、点线)存在差异的文本,模型可能较难理解。

  6. 空间:模型在需要精确空间定位的任务上表现较弱,例如识别棋盘上的棋子位置。

  7. 准确性:在某些场景下,模型可能会生成不正确的描述或图注。

  8. 形状:模型对全景图和鱼眼图片的处理较困难。

  9. 元数据与缩放:模型不会处理原始文件名或元数据,并且图片会在分析前被缩放,从而影响其原始尺寸。

  10. 计数:对图片中的物体数量可能只能给出大致估计。

这篇文章对你有帮助吗?