计算机行业周报：ChatGPT：AI时代资本定价标杆性事件-230108

资源描述

1、本公司具备证券投资咨询业务资格，请务必阅读最后一页免责声明证券研究报告 1 计算机周报 20230108 ChatGPT：AI 时代资本定价标杆性事件 2023 年 01 月 08 日市场回顾本周（01.03-01.06），沪深 300 指数上涨 2.82%，中小板指数上涨 2.30%，创业板指数上涨 3.21%，计算机（中信）板块上涨 5.77%。板块个股涨幅前五名分别为：中远海科、易华录、金溢科技、创意信息、*ST 实达；跌幅前五名分别为：立思辰、紫晶存储、捷顺科技、安硕信息、万达信息。行业要闻中国信通院：2022 年 11 月国内市场手机出货量 2323.8 万部，同比下降34.

2、1%，5G 手机出货量 1.91 亿部，同比下降 20.2%中国信通院：发布大数据白皮书（2022）报告，2021 年我国大数据产业规模增加到 1.3 万亿元百度：即将发布全球首个独立元宇宙解决方案希壤元宇宙底座 MetaStack 公司动态龙软科技：公司中标神东矿区智能化煤矿建设关键技术研究与示范工程课题3 子课题神东矿区透明地质保障系统建设项目，金额为 5018.7 万元南威软件：公司及下属子公司共收到了国家知识产权局颁发的 7 项发明专利证书，专利名称为一种地图页面的打印方法及系统三维天地：公司首次公开发行人民币普通股（A 股）19,350,000.00 股，并于 2022 年

3、1 月 7 日起在深圳证券交易所创业板上市交易银江技术：1 月 4 日消息，公司向特定对象发行股票的申请于 2022 年 12月 28 日获得深圳证券交易所上市审核中心审核通过鸥玛软件：1 月 6 日消息，公司中标国家认证人员注册全国统一考试项目，中标总金额 2670.00 万元本周观点根据华尔街日报 1 月 6 日报道，爆红的聊天机器人 ChatGPT 背后的研究实验室OpenAI 正在谈判以收购要约的形式出售现有股份，交易对该公司的估值达到290 亿美元左右，使其在没有什么收入的情况下成为账面上最值钱的美国初创公司之一，成为 AI 时代资本定价的标杆事件。ChatGPT 作为生成式

4、 AI，不仅能够免去用户检索过程直接给用户提供答案，还能够凭借强大的语言组织能力为用户带来深度交互体验，某些领域搜索评价甚至超过谷歌，或具备颠覆搜索引擎市场的潜力，打开了 AI 商业化的空间，建议投资者关注科大讯飞、拓尔思等 NLP 技术深度布局企业。风险提示：核心技术研发不及预期；技术市场化不及预期；行业竞争加剧推荐维持评级分析师吕伟执业证书：S0100521110003 电话：021-80508288 邮箱：lvwei_ 相关研究 1.计算机行业点评：V2X：数字新基建的战略抓手-2023/01/07 2.计算机周报 20230102：民生计算机 2023年十大预测-2023/0

5、1/02 3.计算机周报 20221225：英雄的黎明：计算机 Q4 业绩高增有哪些方向？-2022/12/25 4.计算机行业 2023 年度投资策略：信创立地，数据顶天-2022/12/22 5.计算机行业事件点评：数据要素重磅政策落地，行业开启发展新阶段-2022/12/20 获取更多最新资料请加微信：chensasa666行业定期报告/计算机本公司具备证券投资咨询业务资格，请务必阅读最后一页免责声明证券研究报告 2 目录 1 ChatGPT 的前生今世.3 1.1 ChatGPT 在类人助手的道路上开拓全新模式.3 1.2 ChatGPT：从 0 到 1 的征程.5 1.3 人工智

6、能 ChatGPT 走红出圈.7 1.4 有望颠覆谷歌搜索引擎的伟大商业价值.7 2 下周投资提示.10 3 行业新闻.11 4 公司新闻.13 5 本周市场回顾.18 6 风险提示.20 附录.21 插图目录.22 表格目录.22 获取更多最新资料请加微信：chensasa666行业定期报告/计算机本公司具备证券投资咨询业务资格，请务必阅读最后一页免责声明证券研究报告 3 1 ChatGPT 的前生今世根据华尔街日报 1 月 6 报道，爆红的聊天机器人 ChatGPT 背后的研究实验室OpenAI 正在谈判以收购要约的形式出售现有股份，交易对该公司的估值达到 290亿美元左右，使其在没

7、有什么收入的情况下成为账面上最值钱的美国初创公司之一，成为 AI 时代资本定价的标杆事件。1.1 ChatGPT 在类人助手的道路上开拓全新模式根据艾瑞咨询，仅对话式 AI 在 2026 年市场规模即突破百亿，并带动约三到四倍相关产业规模。而 ChatGPT 的加速迭代推动世界劳动力向数字化转变，在“基于人类反馈的强化学习”的模式下，证明千亿规模模型训练+人类反馈可以融合世界的知识和规则，极大提升模型表现，取得接近人的水准。而在企业端与政府端对对话服务资源的需求将持续增加的趋势下，政府端在全国各地继续推进服务热线归并工作，和新冠疫情常态化下固化了“智能通知”“智能核查”等对话式 AI 产品防

8、疫需求；企业端在流量红利天花板、竞争态势日益激烈的行业背景下，企业纷纷加强对客服、营销等服务资源部门的投入，持续深化服务领域的智能洞察以优化用户服务体验。G+B 双端的需求持续催化下，延伸出以信息查询类、专家咨询类、助手类、交流类为主的四大对话式应用场景：1）信息查询类：数字化劳动力替代枯燥重复性劳动；2）专家咨询类：数字化劳动力扩充资源稀缺劳动力；3）助手类：数字化劳动力协助人类完成相应任务；4）交流类：数字化劳动力满足人类情感交流的需求。获取更多最新资料请加微信：chensasa666行业定期报告/计算机本公司具备证券投资咨询业务资格，请务必阅读最后一页免责声明证券研究报告 4 图1：

9、中国对话式 AI 产品及相关产业规模资料来源：艾瑞咨询，民生证券研究院 ChatGPT 是 OpenAI 开发的一种大型预训练语言模型，基于 Transformer架构，在对话中生成类似人类的文本响应。ChatGPT 可以通过从数百万个网站收集信息，以对话式、人性化的方式生成独特的答案，为用户提供写论文、写代码、设计商业策划、担任人们的治疗师等一系列服务。它代表了 OpenAI 最新一代的大型语言模型，在设计上非常注重交互性。图2：ChatGPT 回复代码问题图3：ChatGPT 写短文资料来源：OpenAI 官网，民生证券研究院资料来源：OpenAI 官网，民生证券研究院 ChatG

10、PT 的工作原理是使用人类反馈强化学习（RLHF）的训练方法，以最小获取更多最新资料请加微信：chensasa666行业定期报告/计算机本公司具备证券投资咨询业务资格，请务必阅读最后一页免责声明证券研究报告 5 化无益、失真或偏见的输出。该方法总体上包括三个步骤：1）有监督的调优：预训练的语言模型在少量已标注的数据上进行调优，以学习从给定的 prompt 列表生成输出的有监督的策略（Supervised Fine-Tuning,SFT）；2）模拟人类偏好：标注者们对相对大量的 SFT 模型输出进行投票，创建一个由比较数据组成的新数据集，在此数据集上训练新模型，被称为训练回报模型（Rewar

11、d Model，RM）；3）近端策略优化（Proximal Policy Optimization,PPO）：RM 模型用于进一步调优和改进 SFT 模型，PPO 输出结果是策略模式。图4：ChatGPT 的 RLHF 训练方法资料来源：OpenAI 官网，民生证券研究院 1.2 ChatGPT：从 0 到 1 的征程 ChatGPT 是从 GPT3.5 系列中的模型进行微调而诞生，此前 OpenAI 还设计了 GPT-1、GPT-2 和 GPT-3 模型。1）GPT-1：无监督学习 2018 年 6 月，GPT-1 诞生。GPT-1 使用预训练+微调两阶段模型完成下游自然语言处理（NLP）

12、任务；使用 BooksCorpus 数据集；处理的有监督任务包括自然语言推理、问答和常识推理、语义相似度以及分类。但 GPT-1 存在数据局限性和泛化性不足的问题。2）GPT-2：多任务学习 2019 年 2 月，GPT-2 发布，在 GPT-1 的基础上使用了更多的网络参数与更获取更多最新资料请加微信：chensasa666行业定期报告/计算机本公司具备证券投资咨询业务资格，请务必阅读最后一页免责声明证券研究报告 6 大的数据集：参数量达 15 亿，数据量达 40GB；旨在使用相同的无监督模型学习多个任务；文章取自于 Reddit 上高赞的文章，命名为 WebText；在生成方面第一次表

13、现出强大的天赋阅读摘要、聊天、续写、编故事，网上角色扮演等。但是很多实验表明，GPT-2 的无监督学习的能力还有很大的提升空间。3）GPT-3：海量参数 2020 年 5 月，GPT-3 面世，基于一个更加复杂全面的数据集进行训练，使用45TB 的训练数据和 175B 的参数量；不使用样本（Zero-shot）、使用 1 条样本（One-shot）或使用极少量的样本（Few-shot）完成下游 NLP 任务；数据集包括 Common Crawl，WebText2，Books1，Books2 和 Wikipedia；几乎可以完成问题搜索、阅读理解、语义推断、机器翻译、文章生成、自动问答等功能。但

14、是 GTP-3 并不完美，它有时在自然语言推断、填空、阅读理解任务等方面表现得不太好；复杂和昂贵的模型推理受限；训练的语言可能存在性别、民族、种族或宗教偏见。4）ChatGPT：人工标注数据+强化学习 2022 年 11 月，ChatGPT 发布。ChatGPT 是在 GPT 3.5 系列模型的基础上，引入人工标注数据+强化学习的 RLHF 模型，不断微调预训练语言模型，旨在让大型语言模型（LLM）学会理解人类的命令，并根据给定的 prompt 给出最优的答案。ChatGPT 专为会话任务设计，实现了在与人类互动时从反馈中强化学习。ChatGPT 在语言识别、判断和交互层面存在巨大优势，依托大

15、量文本数据，具有类似人类的反应和情境感知。OpenAI 官网明确提示，ChatGPT 准确性不足，偶尔会一本正经地胡说八道。从 GPT-1 到 ChatGPT 的纵向演变，可以看到 OpenAI 不断朝着自然语言理解这一目标前进，用更大的模型、更先进的架构，为实现通用人工智能开辟路径。表1：GPT 系列产品升级情况每代 GPT 时间核心升级功能不足 GPT-1 2018.6 使用预训练+微调两阶段模型完成下游NLP 任务;采用约 5GB 的训练数据和117M 的参数量自然语言推理、问答和常识推理、语义相似度以及分类数据局限性；泛化性不足 GPT-2 2019.2 使用相同的无监督模

16、型学习多个任务，在下游任务中实现 Zero Shot；采用40GB 的训练数据和 1.5B 的参数量理解能力，内容生成能力（阅读摘要、聊天、续写、编故事、角色扮演等）无监督学习能力还有很大的提升空间 GPT-3 2020.5 不使用样本（Zero-shot）、使用 1 条样本（Zero-shot）或使用极少量的样本（Few-shot）完成下游 NLP 任务；采用 45TB 的训练数据和 175B 的参数量几乎可以完成自然语言处理的绝大部分任务，包括问题搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等自然语言推断、填空、阅读理解任务等方面表现得不太好；复杂和昂贵的模型推理受限；训练语言可能存在偏见 ChatGPT 2022.11 使用人工标注数据+强化学习的 RLHF模型不断微调和输出内容；专为会话任语言识别、判断和交互；依托大量文本数据，具有类似人类的反应和情境偶尔生成不正确信息；产生关于真实世界的错误信息；获取更多最新资料请加微信：chensasa666行业定期报告/计算机本公司具备证券投资咨询业务资格，请务必阅读最后一页免责声明证券研究报告 7 务设计感知胡说

展开阅读全文