国内大模型较ChatGPT4落后至少两个代差

AIGC行业资讯3年前 (2023)发布编辑员

目前，针对大型语言模型的商业化应用，主要有两种观点被广泛认可：

首先，主要建立一个类似于安卓操作系统的通用大模型。

第二，利用大模型技术来培育AIGC在特定领域的应用，例如提供专业写作平台Notion、智能绘画工具Midjourney、AI 编程工具Copilot等。

在通用大模型领域，OpenAI在今年3月中旬推出了多模态ChatGPT4.0的功能，成为了最先进的模型。相较于ChatGPT3.5，它在处理复杂长文本、实现图片和文本之间的转换，以及在回答准确率和智能涌现方面都有显著提升。

目前，国内一些大公司如BAT、字节跳动、华为、科大讯飞、昆仑万维等纷纷推出了自己的超大规模模型。然而，智谱AI的CEO张鹏指出，总体而言，国内的大模型水平大约只能与GPT-3相媲美，甚至还要稍逊一筹。不过，ChatGPT模型却是GPT-3.5的新版本，相较于GPT-3，它的性能优势更为明显，能够带来更为出色的表现。而据悉，最新推出的ChatGPT4.0甚至能领先GPT-3两代，可见其在性能方面的实力非常强大。

换句话说，国内的大型模型与ChatGPT4相比，落后至少两代。

就像操作系统一样，大型模型的功能比较广泛。ChatGPT4是目前功能最先进的模型之一，能够处理文本数据，同时对图片也具备一定的理解能力。

GPT4拥有处理长达25000字文本的能力，使其具备编写剧本或短篇小说的能力。OpenAI官方视频展示，GPT4还可以通过识别网站草图，自动生成建成这个网页所需的全部代码。

微软在GPT-4发布后，立刻将其应用到了新版必应搜索上，但目前仅开放了人工智能文本能力的使用。微软的CEO纳德拉表示，在率先接入GPT后，他们的搜索已经比谷歌更加出色了。

然而，即使是大型模型的泛化能力也无法解决所有问题。当你咨询关于微软股价是否将上涨的问题时，GPT4只会提供一些“笼统而广泛”的基础知识，而这些知识对于专业投资者来说几乎没有任何价值。

程浩是远望资本的创始人，他认为，每个行业都有其自身的专业技术和知识。这些最为宝贵的信息很可能无法在互联网上找到，而是存储在企业的私有数据库或少部分专家的头脑中。

为了应对特定领域的高价值和关键任务，需要采用垂直模型。例如彭博公司推出的BloombergGPT，是专门针对金融领域开发的大型语言模型，能够帮助金融专业人士更好地理解和分析金融数据。

程浩认为，垂直模型的价值将是非常巨大的。垂直模型的出现将会带来很多创业机会，因为需要应对的行业非常多。此外，垂直模型企业的开发成本也相对较低，因为这些企业只需要找到一个经过预训练的不错的大模型，然后对其进行指令微调即可。

可惜的是，国内的ChatGPT概念股大多只关注开发通用的大模型，在程浩看来这样的机会并不多。

毕竟OpenAI能够开发出GPT4，这要归功于背后的金主微软。据国盛证券的测算，以ChatGPT在1月份的独立访客平均数为1300万人次，相应的芯片需求达到3万多片英伟达A100GPU。初始投入成本大约为8亿美元，而每天的电费开销在5万美元左右。

因此，对于大多数涉及GPT概念股的公司而言，重要的是要开发适用于自身业务的垂直模型，以实现AIGC的利用。