计算机行业:ChatGPT开启AI新纪元AIGC投资框架梳理 20230217 -银河证券

文档编号:2601191 上传时间:2023-05-27 格式:PDF 页数:26 大小:2.07MB
下载 相关 举报
计算机行业:ChatGPT开启AI新纪元AIGC投资框架梳理 20230217 -银河证券_第1页
第1页 / 共26页
计算机行业:ChatGPT开启AI新纪元AIGC投资框架梳理 20230217 -银河证券_第2页
第2页 / 共26页
计算机行业:ChatGPT开启AI新纪元AIGC投资框架梳理 20230217 -银河证券_第3页
第3页 / 共26页
点击查看更多>>
资源描述

1、 证券研究报告 请务必阅读正文最后的中国银河证券股份有限公司免责声明 行业深度报告计算机2023 年 2 月 17 日ChatGPT 开启 AI 新纪元,AIGC 投资框架梳理计算机行业推荐维持评级核心观点:ChatGPT 指明了 NLP 生成领域的技术方向,从技术本源上加速 AIGC发展。我们认为,ChatGPT 对 AIGC 发展的意义在于:一方面,GPT 作为 NLP 生成领域模型的突破,将迅速解决 AI 文本生成、AI 代码生成等领域的痛点;另一方面,AI 文本生成、AI 代码生成作为 AI 音视频、游戏等其他领域的技术基础,其突破发展也将加速 AIGC 在音视频、游戏等场景中的渗透(

2、比如生成 AI 绘画提示词,或生成调用计算引擎等)。全球巨头争相追赶,与 ChatGPT 水平尚存一定差距。国外公司中,谷歌发布的聊天机器人 Bard 具有与 ChatGPT 接近的技术水平,大约相差半年左右。国内公司中,百度、华为、字节跳动、阿里、腾讯等巨头均在大模型方向布局,整体发展水平与 ChatGPT 相差大概一到两年左右,约接近 GPT-3 的水平。AIGC 多场景应用处于爆发前夜,千亿市场打开。随着大模型算法突破以及算力成本下降,AIGC 发展痛点逐步解除,亟待爆发;同时又有ChatGPT 助力,文本、代码、图像生成有望率先成熟,视频、游戏将紧随其后。我们预测,到 2025 年 A

3、IGC 在网络文学领域、文本分析领域、绘画及图片领域、数字音乐领域技术将相对成熟,因此渗透率分别为70%/60%/60%/50%;网络视频领域、游戏领域由于技术原因渗透率相对较低,分别约为 30%/25%。基于上述假设,我们分别对 AIGC 细分领域做市场规模预测,预计 2025 年中国 AIGC 市场规模有望达到 1600 亿。AIGC 产业链:基础层最先受益,中间层巨头占优。AIGC 产业链可大致分为基础层、中间层和应用层三层架构。鉴于大模型训练需要巨大的算力规模,基础层中的芯片、服务器等硬件提供商将最先受益。而对于中间层来说,技术积累以及资金实力都是关键竞争力,因此我们认为科技巨头更具有

4、竞争优势。应用层中,可类比移动互联网时代,会爆发出很多杀手级应用,用户体验和模式创新都将成为“杀手钳”。GPT-3 训练所需总成本:模型的算力需求几乎与参数量呈同比增长。单一 V100 GPU 芯片进行一次 GPT-3 13B 模型的训练,大约需要 2144天;进行一次 GPT-3 175B 模型的训练,大约需要 29120 天。我们测算GPT-3 13B 训练总成本约为:$3.06/H*24 H/D*365 D/Y*26Y=$0.7 Million;同理,GPT-3 175B 训练总成本约为$9.5 Million。在不计 RAM、CPU、SSD 驱动器、电源等其他情况下,GPT-3 运行所

5、需芯片成本至少在 20 万美元以上。投资建议:ChatGPT 开启 AI 新纪元,AIGC 千亿市场处于爆发前夜。产业链基础层中,我们重点推荐全球 AI 服务器龙头浪潮信息(000977.SZ),关注中科曙光(603019.SH)、中国长城(000066.SZ);中间层中,推荐人工智能技术积累深厚的拓尔思(300229.SZ)、科大讯飞(002230.SZ);应用层中,推荐彩讯股份(300634.SZ)、嘉和美康(688246.SH)、金山办公(688111.SH)、同花顺(300033.SZ),关注万兴科技(300624.SZ)。风险提示:行业竞争加剧的风险;产业发展进度不达预期的风险;技术

6、风险;政策风险。分析师吴砚靖:(8610)66568589:执业证书编码:S0130519070001邹文倩:(8610)86359293:执业证书编码:S0130519060003行业数据2023-2-17资料来源:Wind,中国银河证券研究院整理获取更多最新资料请加微信:chensasa666行业深度报告/计算机行业 请务必阅读正文最后的中国银河证券股份有限公司免责声明。2目 录一、ChatGPT 开启 AI 新纪元,指明 NLP 生成领域的技术方向.3(一)ChatGPT 通过引入 RLHF 技术解决生成模型的核心问题,大大提高类人成熟度.3(二)ChatGPT 商业化规划及仍需讨论的问

7、题.4(三)全球巨头争相追赶,与 ChatGPT 水平尚存一定差距.6 二、AIGC 多场景应用处于爆发前夜,千亿市场打开.6(一)AIGC 发展痛点逐步解除,亟待爆发.6(二)ChatGPT 助力,文本、代码、图像生成有望率先成熟,视频、游戏紧随其后.8(三)AIGC 海外公司布局梳理.12(四)AIGC 细分市场规模预测:2025 年有望百倍增长.14 三、AIGC 产业链:基础层最先受益,中间层巨头占优.16(一)AIGC 产业链结构及巨头布局.16(二)GPT 模型所需算力测算.18 四、A 股相关公司介绍.20 五、投资建议与风险提示.23 获取更多最新资料请加微信:chensasa

8、666行业深度报告/计算机行业 请务必阅读正文最后的中国银河证券股份有限公司免责声明。3一、ChatGPT 开启 AI 新纪元,指明 NLP 生成领域的技术方向 ChatGPT 指明了 NLP 生成领域的技术方向。预训练语言模型对于 NLP 理解领域以及生成领域的问题都是相当有效的,在过去几年里,发展出的主要模型有 Bert 和 GPT。从文本对话的过程来看,理解到生成之间的连接是一个关键问题。然而,Bert 在 NLP 理解领域获得了巨大的成功,但是在 NLP 生成领域却表现不佳,这是由于 Bert 训练时所采用的语言模型所决定的。Bert 采用的是 DAE 语言模型,只学习到了词的上下文表

9、征的能力,即理解语言的能力,但没有学习到如何组织语言的能力。而 chatGPT 成功解决了这个问题,可以说 ChatGPT指明了 NLP 生成领域的技术方向。ChatGPT 从技术本源上加速 AIGC 发展。AIGC 的底层技术主要有 NLP、GAN、扩散模型等,其中的代表就是语言生成中的 chatGPT 和图像生成中的扩散模型(Diffusion Model)。2022 年 8 月 StabilityAI 宣布开源 Stable Diffusion 模型,AI 图像生成成本迅速下降,并且能获得惊人的高质量绘画作品,达到学习几年、十几年的画师同等水平。而 2022 年 11 月 OpenAI

10、发布的 chatGPT 虽然是自然语言生成领域的产品,但是可以生成 AI 绘画提示词,或生成调用计算引擎,从而进一步加速 AI 绘画、AI 游戏、AI 音视频领域的应用。我们认为,ChatGPT 对 AIGC 发展的意义在于:一方面,GPT 作为 NLP 生成领域模型的突破,将迅速解决 AI 文本生成、AI 代码生成等领域的痛点;另一方面,AI 文本生成、AI代码生成作为 AI 音视频、游戏等其他领域的技术基础,其突破发展也将加速 AIGC 在音视频、游戏等场景中的渗透(比如生成 AI 绘画提示词,或生成调用计算引擎)。(一)ChatGPT 通过引入 RLHF 技术解决生成模型的核心问题,大大

11、提高类人成熟度 ChatGPT 是在 GPT 3.5 大语言模型(LLM,即 Large Language Model)的基础上,加入“基于人类反馈的强化学习(RLHF,Reinforcement Learning from Human Feedback)”来不断微调(Fine-tune)预训练语言模型,使得 LLM 模型学会理解不同类型的命令指令,并通过多重标准合理判断基于给定的 prompt 输入指令,输出的是否为优质信息(这些标准包括:富含信息、内容丰富、对用户有帮助、无害、不包含歧视信息等)。因此,ChatGPT 使得人机对话更加人性化,更富有逻辑性,大大提高了 AI 的类人成熟度。C

12、hatGPT 的技术发展路径:从 GPT-1 到 InstructGPT,数据量与参数量不断增加,模型精度和语言能力提升。1)2018 年,在自然语言处理领域(NLP)刚兴起时,OpenAI 就推出了初代 GPT,它的运行逻辑是:先通过无标签数据学习生成语言模型,并能够运用于一些与有监督任务无关的 NLP 任务中。此后再根据特定的下游任务进行有监督的微调,提高其泛化能力。2)2019 年推出的 GPT-2 扩展了网络参数和数据集,进行多任务学习,可以在数据量足够丰富且模型容量足够大时,通过训练语言模型就能够完成有监督学习的任务。3)对比 GPT-2,2020年推出的 GPT-3 最显著的特征是

13、庞大的数据量和参数投入,整体训练过程耗资 1200 万美元,投入数据量达上万亿,模型参数量达到 1750 亿。GPT-3 延续了前两代 GPT 的技术架构,但改变了“大规模数据集预训练+下游数据标注微调”的方式,采用情境学习(in-context learning)来提高模型对话输出的性能。GPT-3 的规模和语言能力几乎是最强大的。它能在不做微调的情况获取更多最新资料请加微信:chensasa666行业深度报告/计算机行业 请务必阅读正文最后的中国银河证券股份有限公司免责声明。4下,在一些传统的 NLP 任务中表现得更好,包括实现闭卷问答、模式解析、纯语言建模、机器翻译等;在新的领域,GPT

14、-3 将 NLP 的应用扩展到缺乏足够训练数据的领域,例如在开发程序代码、文章生成和信息检索领域取得了实质性的进展。然而,GPT-3 在推理和理解能力上还有较长的路要走,在自然语言推理(NLI)任务中表现不佳。ChatGPT 在 InstructGPT 模型上做改进,实现更好地遵循用户意图、更少的虚假信息。OpenAI 在 2022年 3月发布了 InstructGPT。该语言模型通过“基于人类反馈的强化学习(RLHF)和监督学习”来提高输出质量。虽然 InstructGPT 的参数量仅为 13 亿左右,相比于 GPT-3 缩小了 100 倍以上;但在遵循指令方面,能够更好地遵循用户意图,将有

15、害的、不真实或者有偏差的信息输出最小化。在优化的模型上,ChatGPT 基于 InstructGPT 进一步改进,在模型结构和训练流程上遵循上述方式,但收集和标注数据的方式上发生了变化,通过采取监督学习的方式让模型学习人类排序的方式。表 1:GPT 四代的对比模型发布时间参数量预训练数据量预估成本消耗资源GPT-12018 年 6 月1.17 亿约 5GB在 8 个 GPU 上训练一个月GPT-22019 年 2 月15 亿40GB在 256 个 Google Cloud TPU v3 上训练一周GPT-32020 年 5 月1750 亿45TB训练一次 460 万美元,总成本1200 万美元

16、在 355 个 GPU 上训练一年ChatGPT2022 年 12 月13-1750 亿数十 GB训练一次的成本高达 1 千万美元根据参数量而定资料来源:人民数字,品玩,中国银河证券研究院 (二)ChatGPT 商业化规划及仍需讨论的问题 ChatGPT 成为史上最快达到 1 亿月活跃用户的应用。ChatGPT 在 1 月达到 1 亿月活跃用户,平均每天有 1300 多万访客。目前 OpenAI 已推出每月 20 美元(约合 135 人民币)的 ChatGPT用户个人订阅计划,即使在软件的使用高峰时段,订阅用户也可以优先使用 AI 聊天机器人。表 2:各大软件月活数突破一亿所用时间软件名ChatGPTTikTokInstagramFacebookTwitter所用时间两个月九个月两年半四年半五年资料来源:新浪,中国银河证券研究院 在 Gartner 发布的 2022 年新兴技术成熟度曲线中,生成性 AI 处于技术萌芽期并加速发展中。Gartner 将生成性 AI 列为 2022 年五大影响力技术之一,预测到 2025 年生成性 AI 所创造的数据可占到所有已生产数据的 10%。获取更多

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 行业资料 > IT网络

启牛文库网为“电子文档交易平台”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。

本站是网络服务平台方,若您的权利被侵害,请立刻联系我们并提供证据,侵权客服QQ:709425133 欢迎举报。

©2012-2025 by www.wojuba.com. All Rights Reserved.

经营许可证编号:京ICP备14006015号