GPT-4 Turbo with Vision现已通过API提供

日前OpenAI方面宣布，旗下最新大模型GPT-4 Turbo具有视觉能力的版本GPT-4 Turbo with Vision，现已通过API向开发者提供，并且该模型也已支持JSON模式和函数调用。同时OpenAI方面还透露，后续GPT-4 Turbo with Vision也将会接入ChatGPT 。

据了解，GPT-4 Turbo此前于2023年11月举行的OpenAI首届开发者大会上正式发布，其支持12.8万个token的窗口大小。GPT-4 Turbo with Vision则不仅同样支持12.8万个token的窗口大小，还将训练数据截止日期更新为2023年12月。相比GPT-4 Turbo，GPT-4 Turbo with Vision最主要的更新在于它的视觉功能，即可以理解图像和视觉内容。因此这也就意味着GPT-4 Turbo with Vision可以极大简化开发者的开发流程，使得其不必再调用不同的模型来处理文本和图像信息。

在日前发布的相关公告中，OpenAI方面还分享了一些开发者使用GPT-4 Turbo with Vision构建产品的案例。例如，AI软件工程助手Devin是一个由GPT-4 Turbo with Vision提供支持的AI软件工程助手，可使用视觉执行各种编码任务；健康健身应用程序 Healthify借助GPT-4 Turbo with Vision的支持扫描用户饮食照片，通过图像识别提供营养分析；创意平台 Make Real则利用该模型将用户的草图转化为可运行的网站等。

但需要注意的是，日前有相关报道称，有研究发现GPT-4 Turbo with Vision的编码能力相对较差。在这一研究结果中指出，GPT-4 Turbo with Vision在aider的编码基准套件中的表现比之前所有的GPT-4系列模型都要差，尤其是与现有的GPT-4 Turbo preview相比，似乎更容易在编码方面“偷懒”。

目录

归档

近期文章

搜索

AI · 2024-04-11

GPT-4 Turbo with Vision现已通过API提供

您可能还喜欢...