国内大模型较ChatGPT4落后至少两个代差

AIGC行业资讯1年前 (2023)发布 编辑员
1.6K 0

目前,针对大型语言模型的商业化应用,主要有两种观点被广泛认可:

首先,主要建立一个类似于安卓操作系统的通用大模型

第二,利用大模型技术来培育AIGC在特定领域的应用,例如提供专业写作平台Notion、智能绘画工具MidjourneyAI编程工具Copilot等。

国内大模型较ChatGPT4落后至少两个代差

在通用大模型领域,OpenAI在今年3月中旬推出了多模态ChatGPT4.0的功能,成为了最先进的模型。相较于ChatGPT3.5,它在处理复杂长文本、实现图片和文本之间的转换,以及在回答准确率和智能涌现方面都有显著提升。

目前,国内一些大公司如BAT、字节跳动、华为、科大讯飞、昆仑万维等纷纷推出了自己的超大规模模型。然而,智谱AI的CEO张鹏指出,总体而言,国内的大模型水平大约只能与GPT-3相媲美,甚至还要稍逊一筹。不过,ChatGPT模型却是GPT-3.5的新版本,相较于GPT-3,它的性能优势更为明显,能够带来更为出色的表现。而据悉,最新推出的ChatGPT-4.0甚至能领先GPT-3两代,可见其在性能方面的实力非常强大。

换句话说,国内的大型模型与ChatGPT4相比,落后至少两代。

就像操作系统一样,大型模型的功能比较广泛。ChatGPT4是目前功能最先进的模型之一,能够处理文本数据,同时对图片也具备一定的理解能力。

GPT4拥有处理长达25000字文本的能力,使其具备编写剧本或短篇小说的能力。OpenAI官方视频展示,GPT4还可以通过识别网站草图,自动生成建成这个网页所需的全部代码。

微软GPT-4发布后,立刻将其应用到了新版必应搜索上,但目前仅开放了人工智能文本能力的使用。微软的CEO纳德拉表示,在率先接入GPT后,他们的搜索已经比谷歌更加出色了。

然而,即使是大型模型的泛化能力也无法解决所有问题。当你咨询关于微软股价是否将上涨的问题时,GPT4只会提供一些“笼统而广泛”的基础知识,而这些知识对于专业投资者来说几乎没有任何价值。

程浩是远望资本的创始人,他认为,每个行业都有其自身的专业技术和知识。这些最为宝贵的信息很可能无法在互联网上找到,而是存储在企业的私有数据库或少部分专家的头脑中。

为了应对特定领域的高价值和关键任务,需要采用垂直模型。例如彭博公司推出的BloombergGPT,是专门针对金融领域开发的大型语言模型,能够帮助金融专业人士更好地理解和分析金融数据。

程浩认为,垂直模型的价值将是非常巨大的。垂直模型的出现将会带来很多创业机会,因为需要应对的行业非常多。此外,垂直模型企业的开发成本也相对较低,因为这些企业只需要找到一个经过预训练的不错的大模型,然后对其进行指令微调即可。

可惜的是,国内的ChatGPT概念股大多只关注开发通用的大模型,在程浩看来这样的机会并不多。

毕竟OpenAI能够开发出GPT4,这要归功于背后的金主微软。据国盛证券的测算,以ChatGPT在1月份的独立访客平均数为1300万人次,相应的芯片需求达到3万多片英伟达A100GPU。初始投入成本大约为8亿美元,而每天的电费开销在5万美元左右。

因此,对于大多数涉及GPT概念股的公司而言,重要的是要开发适用于自身业务的垂直模型,以实现AIGC的利用。

 

    © 版权声明

    相关文章

    暂无评论

    暂无评论...