什么是图片输入?它在 ChatGPT 中如何工作?
ChatGPT 现已具备图片能力,可以理解并解读你在对话中添加的图片输入。
我应该如何在对话中使用图片输入?
基本用法:先上传一张照片开始。你可以询问图片中的物体、分析文档,或探索视觉内容。你也可以在后续轮次继续添加更多图片,以加深或转移讨论。随时都可以带着新照片回来继续问。
标注图片:若想让注意力集中在特定区域,建议在上传前使用图片编辑标记工具在图片上做标注。这能引导 ChatGPT 聚焦你认为重要的元素。
哪些套餐可以使用图片输入?
Plus 和 ChatGPT Enterprise。
哪些模型可以接受图片输入?
所有 ChatGPT 模型都可以接受图片输入。
哪些平台支持图片输入?
所有平台均支持,包括网页(chatgpt.com)和移动端(iOS / Android)。
我的图片会被用来改进你们的模型吗?
我们对内容(包括图片)的使用方式在各产品中保持一致。
请参阅如何使用你的数据来改进模型性能,以更好地了解 ChatGPT 上的内容可能如何被用于改进模型性能,以及用户可选择的选项。
对于ChatGPT Enterprise,我们不会使用内容来训练我们的模型。
如何在 ChatGPT 中添加图片输入?
在提示输入框中点按 + 图标,然后选择 添加照片和文件。或者,你也可以将图片文件拖入文本框,或粘贴剪贴板中已复制的图片。
图片输入支持视频吗?
不支持,它无法处理视频。目前仅支持处理静态图片。
支持哪些文件类型?
PNG(.png)、JPEG(.jpeg 和 .jpg),以及非动态的 GIF(.gif)。
我一次可以上传多少张图片?
你能添加到对话中的图片数量取决于多种因素,包括图片大小以及随附文本的数量。一般来说,如果你遇到问题,建议减少图片数量或缩小图片大小。
每张图片的大小限制是多少?
20MB。
图片能力如何处理模糊或不清晰的图片?
如果图片含义不明确或不清晰,模型会尽力解读,但结果可能不够准确。
使用带图片输入的 ChatGPT 时,用户需要注意哪些局限?
如果你在使用 ChatGPT 全新的图片输入功能,请务必了解以下局限:
医疗:模型不适合解读 CT 等专业医学影像,也不应用于提供医疗建议。
非英语:对于包含非拉丁字母文本(如日语或韩语)的图片,模型的处理效果不如英文。
大段文字:可放大图片中的文字以提升可读性,但请避免裁剪掉重要细节。
旋转:对于旋转/倒置的文字或图片,模型可能会误读。
视觉元素:对于图表,或颜色/样式(如实线、虚线、点线)存在差异的文本,模型可能较难理解。
空间:模型在需要精确空间定位的任务上表现较弱,例如识别棋盘上的棋子位置。
准确性:在某些场景下,模型可能会生成不正确的描述或图注。
形状:模型对全景图和鱼眼图片的处理较困难。
元数据与缩放:模型不会处理原始文件名或元数据,并且图片会在分析前被缩放,从而影响其原始尺寸。
计数:对图片中的物体数量可能只能给出大致估计。
