gpt-4-V(支持分析图片URL)
POST
/v1/chat/completionsgpt-4-V是逆向官方plus账号的模型,支持以图片URL形式识别分析图片内容
提示词结构:img_url+空格+prompt (一定要用空格分割链接和prompt,以判断链接是否结束)
请求参数
要使用的模型的 ID。有关哪些模型适用于聊天 API 的详细信息,请参阅模型端点兼容性表。
以聊天格式生成聊天完成的消息。分析图片时提示词结构:img_url+空格+prompt
使用什么采样温度,介于 0 和 2 之间。较高的值(如 0.8)将使输出更加随机,而较低的值(如 0.2)将使输出更加集中和确定。 我们通常建议改变这个或top_p
但不是两者。
一种替代温度采样的方法,称为核采样,其中模型考虑具有 top_p 概率质量的标记的结果。所以 0.1 意味着只考虑构成前 10% 概率质量的标记。 我们通常建议改变这个或temperature
但不是两者。
为每个输入消息生成多少个聊天完成选项。
API 将停止生成更多令牌的最多 4 个序列。
聊天完成时生成的最大令牌数。 输入标记和生成标记的总长度受模型上下文长度的限制。
-2.0 和 2.0 之间的数字。正值会根据到目前为止是否出现在文本中来惩罚新标记,从而增加模型谈论新主题的可能性。 查看有关频率和存在惩罚的更多信息。
-2.0 和 2.0 之间的数字。正值会根据新标记在文本中的现有频率对其进行惩罚,从而降低模型逐字重复同一行的可能性。 查看有关频率和存在惩罚的更多信息。
修改指定标记出现在完成中的可能性。 接受一个 json 对象,该对象将标记(由标记器中的标记 ID 指定)映射到从 -100 到 100 的关联偏差值。从数学上讲,偏差会在采样之前添加到模型生成的 logits 中。确切的效果因模型而异,但 -1 和 1 之间的值应该会减少或增加选择的可能性;像 -100 或 100 这样的值应该导致相关令牌的禁止或独占选择。
代表您的最终用户的唯一标识符,可以帮助 OpenAI 监控和检测滥用行为。了解更多。
{
"model": "gpt-4-V",
"messages": [
{
"role": "user",
"content": "https://www.baidu.com/img/PCtm_d9c8750bed0b3c7d089fa7d55720d6cf.png 分析一下百度的logo"
}
]
}
示例代码
返回响应
{
"id": "chatcmpl-89DHaZ5064WmtRd1FymTaMAb5xiL1",
"object": "chat.completion",
"created": 1705050601,
"model": "gpt-4-V",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "这个百度的logo使用了简洁而醒目的设计元素。logo由两部分组成:图形和文字。\n\n图形部分是一个脚印形状,代表搜索引擎帮助人们在信息的海洋中追踪和发现所需内容。蓝色和白色的对比寓意着技术和纯净,暗示了百度提供的信息服务旨在提供清晰、准确的搜索结果。\n\n文字部分是“百度”两个汉字,采用红色,这在中国文化中常常与好运、热情和活力相关联。红色也是非常吸引注意的颜色,可以帮助品牌在众多竞争对手中脱颖而出。\n\n整体来说,百度的logo设计简单、直观,易于识别,而且颜色的使用强化了其在中国市场的品牌形象。"
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 40,
"completion_tokens": 270,
"total_tokens": 310
}
}