AGI（通用人工智能）专题之二：“文心一言”发布国内厂商距离复现ChatGPT有多远？

资源描述

1、请仔细阅读在本报告尾部的重要法律声明 “文心一言”发布，国内厂商距离复现 ChatGPT 有多远？AGI（通用人工智能）专题之二 “文心一言”表现一如预期，不必过度悲观 3 月 16 日“文心一言”发布，从官方 demo 来看，文心一言具备文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成能力，存在超预期亮点，但事前录屏降低了其演示的真实性，也并未对外直接开放，多因素导致公众反馈不佳。我们认为尽管上下文理解、语义逻辑、多轮对话方面尚有欠缺，“文心一言”展现了足够的文案创作能力，为 B 端降本增效的起始逻辑已经明晰，尽管尚未对公众大范围开放，企业用户已经能够申请内测邀请码，若邀请范围持续

2、扩大，飞轮效应将推进“文心一言”表现改善，且优化空间极大。复现 ChatGPT 的难点在哪里？AI 三要件略逊一筹，但差距并非不可逾越 1）算法上，去开源化极大增加了国内科技企业的复现难度，但学术界已有相对成功复现先例，随着人才流动、时间推移和研究进步，大模型性能很可能逐渐趋同。2）数据上，数据集质量、标注细节处理、用户真实交互是关键，尽管优质的中文标注数据集匮乏，使用英文数据进行预训练并不影响中文输出，科技企业能够参考 GPT3 的路径，利用海量用户交互提升数据质量。3）算力上，国内头部科技企业多已完成数据中心建设，能够实现算力资源部分自给，此外算力更接近于自由流通的商品，战略押注意愿明确、

3、现金流充沛的国内厂商有希望弥合算力上的差距。工程化和应用分发能力是隐形壁垒，头部厂商优势明显国产 ChatGPT 的落地在技术准备之外还需要两项核心要素：工程化与分发能力。1）工程化能力，即能够利用更低的成本和更高效的迭代做出先进的大模型应用，制作更高效、廉价、贴合市场的产品，能够同时容纳亿级用户在线。2）充沛的 C 端用户及 B 端应用场景，即更低的分发触达成本、更快速的产品应用迭代。国内厂商完全具备大 DAU 场景下 AI 工程化处理的潜力，且应用分发是国内企业的长项，头部厂商本身已经建起规模及心智壁垒，且商业模式无需再探索，如要落地 AGI 相关应用，获客成本远低于新进入者。若“文心一

4、言”对外开放，增量成本仍可控短期我们关注“文心一言”等产品对科技企业财务状况的影响，将增量成本拆分为训练成本、推理成本及数据标注成本（暂不考虑人力支出及维护费用），测算大模型落地搜索页面后年均增量成本约为 16 亿元。但考虑到国产模型参数量及数据集 token 数量均是未知，且 Azure 云计算价格与实际成本存在偏差，此外实际落地后各项成本均存在优化可能、具体会计处理方式还存在探讨空间，我们判断 10-20 亿元为其增量成本的合理范围（暂不考虑人力支出及维护费用），参评级及分析师信息行业评级：推荐行业走势图分析师：赵琳邮箱： SAC NO：S1120520040003 -19%-1

5、3%-7%-2%4%10%2022/032022/062022/092022/122023/03传媒沪深300证券研究报告|行业深度研究报告仅供机构投资者使用 Table_Date 2023 年 03 月 17 日证券研究报告|行业深度研究报告请仔细阅读在本报告尾部的重要法律声明 219626187/21/2019028 16:59考百度 2022 年经营现金流净额 261.7 亿元，对公司正常经营影响可控。投资建议 GPT4、Office365（Copilot）对公众的震撼只是前期技术突破后的余韵，而非 AGI 领域想象力的终点，产品的成功会驱动更多学术资源与产业投资的倾斜，人工智能必

6、然成为产业发展长期主线，国产替代具有需求上的紧迫性。依然重点推荐百度（BIDU.US），判断“文心一言”表现符合预期，公司目前仍处于低估区间，尽管技术差距依然存在，短期内研发投入可能上行，我们看好人工智能领域投入对公司业绩及估值的长线提振。同时关注已在视频、营销、阅读等相关细分领域抢跑的重点标的，推荐当虹科技、捷成股份、蓝色光标、风语筑、浙文互联。风险提示“文心一言”落地效果不及预期风险；ToB 服务推进节奏不及预期风险；成本大幅增长风险；AI 产品道德及监管风险。证券研究报告|行业深度研究报告请仔细阅读在本报告尾部的重要法律声明 319626187/21/2019028 16:59正文目录

7、 1.“文心一言”答卷未知，但国产替代并不遥远.4 1.1.细究算法、数据、算力三要件，略逊一筹但仍有追平可能.5 1.2.工程化处理与分发能力是更高的壁垒.10 1.3.商业化路径已经明晰，搜索场景鲜明契合.12 2.若“文心一言”成功对公众开放，年化增量成本可控.15 2.1.训练：前期固定投入较大，莱特定律驱动下成本必然下行.15 2.2.推理：与用户数量成正比，成本优化路径明确.16 2.3.数据标注：取决于人力价格，成本量级较低.17 3.投资建议.18 4.风险提示.18 图表目录图 1“文心一言”生成图片.4 图 2“文心一言”生成视频.4 图 3 2005 年起中国 AI 论

8、文总数超美国.5 图 4 海外 AI 机构预测中国高引论文占比将超过美国.5 图 5 类 ChatGPT 产品的技术发展示意图.5 图 6 ChatGPT 的技术突破点在于引入了 RLHF（基于人类反馈的强化学习）.6 图 7 主流大模型数据集来源可分为六类.8 图 8 各类数据来源大小.8 图 9 全球前十大科技企业数据中心容量排名.9 图 10 百度昆仑一、二代芯片与英伟达 A100 参数对比.9 图 11 2013 年起公司资本开支及经营现金流情况.10 图 12 2013 年起公司现金及现金等价物充沛（亿元）.10 图 13 AGI 产业链及底层支撑示意图.10 图 14 未接入 GP

9、T4 的 Bing 仅对搜索结果进行简单整合.12 图 15 NewBing 的 Chat 入口可以对搜索结果进行人性化整合.12 图 16 NewBing 能够帮助用户编写代码.13 图 17 NewBing 能够帮助用户进行文件阅读.13 图 18 New Bing 发布次日 Bing 下载量猛增 758%.13 图 19 百度知识图谱的首要应用场景即为搜索.13 图 20 用户输入“宝可梦朱紫”后出现游戏购买链接.14 图 21 用户输入健美运动员姓名后出现健身补剂广告.14 表 1 Github 社区中主流 AI 框架情况（2022.1）.6 表 2 类 ChatGPT 模型年均训练成

10、本测算.15 表 3 类 ChatGPT 应用中期年均推理成本测算.16 表 4 类 ChatGPT 应用中期年均成本测算.17 证券研究报告|行业深度研究报告请仔细阅读在本报告尾部的重要法律声明 419626187/21/2019028 16:591.“文心一言”答卷未知，但国产替代并不遥远3 月 16 日百度 AI 对话模型“文心一言”发布，我们据发布会信息总结，“文心一言”基于此前 ERNIE 大模型、PLATO 对话模型训练而成，是对百度 2019 年起便已开始的 NLP 实践的延续。从技术角度看，除百度已有的知识增强、检索增强、对话增强技术外，“文心一言”引入了有监督的精调、RLH

11、F（基于人类反馈的强化学习）、提示学习等ChatGPT 基础技术，但具体参数量、数据量、耗能、对话时效等均未公开。事前录屏而非实机演示，对外界信心产生负面影响。从现场发布的 demo 来看，文心一言具备文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成能力，同类问题下中文理解能力强于 GPT4，且随输入内容生成音频、视频尚属 AI 对话模型中的首例，存在超预期亮点，但发布会未能展示模型的编程能力，且事前录屏降低了其演示的真实性，也并未对公众开放，多种因素导致公众反馈不佳。“文心一言”展现了足够的文案创作能力，为 B 端降本增效的起始逻辑已经明晰。出于商业角度考虑和高昂的端侧微调成本，厂

12、商普遍放弃开源，转而以提供 API的方式供下游用户在特定场景下进行推理使用。以 ChatGPT 为例，OpenAI 并未公布其基础模型（GPT3.5、GPT4）技术细节，用户仅能够在自身应用内通过API调用其模型。从第一批用户实际使用来看，“文心一言”已经展示了基础文案工作能力，除此前接入 650 家企业外，发布当日有 6.5 万家企业申请测试，签约 5 家客户，一定程度反映了企业客户的认可程度。用户交互能够进一步改善模型表现，我们判断这也是公司急于推动模型面世的原因之一。OpenAI 自 GPT-3 便开始对外提供服务，通过开放给公众，GPT3 收集来自用户输入内容的多样性数据，从而迭代出效

13、果更好的模型，这就决定了 GPT4 是站在用户交互飞轮的巨人肩膀上，与文心一言并不在同一起跑线。但是海量用户群也是百度的长处之一，GPT 的飞轮效应是可复制的。尽管尚未对公众大范围开放，企业用户已经能够申请内测邀请码，邀请范围若持续扩大，飞轮效应将推进“文心一言”表现改善，且优化空间极大。我们判断，尽管上下文理解、语义逻辑、多轮对话方面尚有欠缺，“文心一言”在部分问题处理上已经能够对标 GPT3 水平，但具体表现仍需时间和公众验证。我们依然认为，人工智能必然成为产业发展长期主线，国产替代具有需求上的紧迫性。以“文心一言”发布为契机，我们重点分析国内主流科技企业在复现 ChatGPT 领域需要克

14、服的差距，判断对国产大模型的发展不必过度悲观。图 1“文心一言”生成图片图 2“文心一言”生成视频资料来源：百度，华西证券研究所资料来源：百度，华西证券研究所证券研究报告|行业深度研究报告请仔细阅读在本报告尾部的重要法律声明 519626187/21/2019028 16:591.1.细究算法、数据、算力三要件，略逊一筹但仍有追平可能 1.1.1.算法：核心差距在于方法及细节处理大模型的技术积累已经行至一个质变节点。我们将 NLP（自然语言处理）及 CV（计算机视觉）技术视作类 ChatGPT 产品的技术底座，从深度学习的角度分析其发展历程，残差网络及 Transformer 的出现

15、使得模型的深度和参数量指数级增加，大模型成为可能；大语言模型出现后，大模型的使用方式从预训练的单一任务模型迭代到多模态模型，微调时所需的标注数据量显著减少，从而降低了业务的使用成本。国内 AI 领域积累深厚，历年论文发表及专利申请占优。Elsevier 数据显示 2012-2021 年中国 AI 相关论文篇数始终排在首位，到 2021 年增至美国 2 倍。从论文引用次数进入前 10的篇数来看，中国 2019 年跃居首位。2021 年达到比美国多 7 成的7401 篇；斯坦福大学数据显示2021 年中国提交的人工智能专利申请全球占比超50%。图 3 2005 年起中国 AI 论文总数超美国图

16、4 海外 AI 机构预测中国高引论文占比将超过美国资料来源：Wired，华西证券研究所资料来源：Allen Institute for AI，华西证券研究所图 5 类 ChatGPT 产品的技术发展示意图资料来源：公开资料整理，华西证券研究所证券研究报告|行业深度研究报告请仔细阅读在本报告尾部的重要法律声明 619626187/21/2019028 16:59从基本操作系统看，国内已经具备建立 AI 底层框架的能力。深度学习框架是实现算法的基础架构和工具，可类比为开发过程中必须使用的操作系统（如游戏制作过程中的虚幻引擎）。从技术定位看，AI 框架对下调用底层硬件计算资源，能够屏蔽底层差异并提供良好的执行性能,对上支撑 AI 应用算法模型搭建，提供算法工程化实现的标准环境，是 AI 体系的关键核心。目前海外 AI 框架领域已经形成TensorFlow(Google)、PyTorch(Meta)双寡头格局，国内主流 AI 框架主要有PaddlePaddle（百度）、MindSpore（华为）、MegEngine（旷视）

展开阅读全文