GPT-4V(ision)
GPT-4V(ision) 是由 OpenAI 发布的 AI 模型,发布时间为 2023-09-25,定位为 多模态大模型,参数规模约为 0.0B,上下文长度为 32K,采用 不开源 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
GPT-4V是OpenAI开发的多模态版本的GPT-4模型。该模型在2022年训练完成,2023年五月份提供早期访问。
由于GPT-4是GPT-4V视觉能力背后的技术,因此其训练过程也是相同的。首先训练预训练模型,使用来自互联网以及许可数据源的大量文本和图像数据集来预测文档中的下一个单词。然后,使用一种称为强化学习的人工反馈算法(RLHF),对其他数据进行微调,以产生人类训练者偏好的输出。
与基于文本的语言模型相比,大型多模态模型引入了不同的限制,扩大了风险面。GPT-4V具有每种模态(文本和视觉)的局限性和能力,同时呈现出由所述模态的交叉以及大规模模型提供的智能和推理而产生的新能力。
GPT-4V的产品是多模态的ChatGPT,详情参考: https://www.datalearner.com/blog/1051695648010042
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
