【物流学术年会展播】杨斌：解析chatGPT，展望人工智能大众化应用

杨斌上海海事大学研究生院院长、中国物流学会兼职副会长

在2022年（第二十届）中国物流学术年会跨年会暨2023年（第十五届）物流领域产学研结合工作会上的演讲（摘要）

（2023年2月25日江苏·南京）

杨斌.jpg

今天，我想从三个方面来谈谈最近的热点话题，一是ChatGPT现象，二是尝试解析一下ChatGPT，最后展望一下人工智能大众化应用时代的来临。

当下最火的现象就是ChatGPT聊天机器人，一些互联网人物对这个机器人给予了高度的评价。比尔盖茨认为聊天机器人等人工智能新技术的出现，重要性相当于个人电脑和互联网的出现；马斯克认为ChatGPT好得吓人，我们距离优秀到危险的AI已经不远了；周鸿祎也认为ChatGPT可能代表着人工智能历史上一场真正革命的开始。

ChatGPT是由美国人工智能研究实验室OpenAI 基于大型语言模型GPT-3.5开发的聊天机器人，于2022年11月问世，该公司联合创始人包括特斯拉Tesla创始人马斯克（Elon Musk）和山姆·阿尔特曼（Sam Altman）等人，在推出两个月后，其用户就达到了1亿，成为史上用户增长最快的应用。

根据我们的分析和归纳，ChatGPT具有以下一些智能特征：

一是前所少见的、强大的内容生成能力：ChatGPT跟搜索引擎不一样，能够像人一样创造出新的内容，而搜索引擎只是搜索了很多内容罗列出来供我们参考。比方说请ChatGPT写一篇关于树叶从树上掉下来的突发新闻，它在几秒钟的时间内就能写出一篇较为专业的新闻稿，包括标题、开头、时间、地点、人物和观点等，最后还有一段中规中矩的总结。这个内容不是机器人从网上搜索出来的，而是它自己编出来的。

二是达到全新高度的自然语言理解能力：比如请ChatGPT向一个三岁小孩解释什么是日全食，它真的会把你当成一个三岁小孩，语气比较俏皮告诉你日全食是月亮挡住太阳的光，让太阳看起来像一个黑色的圆圈，周围还有一圈很亮的光芒，就像太阳戴上了一顶亮晶晶的帽子。如果换成请ChatGPT向一个成年人解释什么是日全食，它就会像教科书一样告诉你日全食是一种天文现象，等等，语气比较正式。

三是具备质疑能力：ChatGPT不是一个简单的文本理解、文本翻译的聊天机器人，它似乎具有思考和质疑的能力。比如问它：哥伦布2015年来到美国看到了什么？它会回答：首先需要纠正一下，哥伦布并没有在2015年来到美国。他在1492年发现了美洲大陆，等等。

四是可以承认无知：ChatGPT在遇到自己不知道的问题时，会主动承认无知。比如问它2022年世界杯冠军是谁？它会说：我是一个人工智能语言模型，无法准确的预测未来的体育比赛结果。背后的原因是，目前发布的模型所训练学习的数据是截止到2021年底的，因此它不知道2022年以后的事情。

五是会承认错误：聊天过程中，ChatGPT遇到有人辩驳，或者反对它的观点、意见时，会承认错误并修正自己的看法，态度友好，不会激烈地与人争辩。

六是支持多轮对话和上下文理解：ChatGPT可以根据多轮对话的交互情况，理解上下文，更加准确地理解用户的需要，不断完善自己的回答内容。

七是可以甄别敏感信息，回避恶意：ChatGPT能够甄别种族或性别歧视、政治偏见、宗教信仰差异、人身攻击等敏感信息和恶意攻击，合理回答问题。比如问它：白人和黑人谁更高贵？它会回答：人类所有的种族都应该受到平等的尊重和待遇，没有任何一种种族比另一种更高贵。

下面我来尝试解析一下ChatGPT。

就ChatGPT的字面意思来看，Chat就是聊天，关键是后面的GPT这三个字母，蕴含它的核心技术，G是生成性，P是预训练，T是一种算法结构。

G：Generative生成性。互联网上的内容根据生成者可以分为一般用户生成内容、专业人士生成内容和人工智能（AI）生成内容。一般用户生成内容是指用户将自己原创的内容通过互联网平台进行展示或者提供给其他用户；专业人士生成内容是指生产者拥有专业身份，内容设置及产品编辑更专业，内容质量也更有保证；人工智能生成内容是指利用人工智能技术的一种新型内容生产方式，AI绘画、AI写作等都属于人工智能生成内容的分支。

目前，互联网上的内容大部分是人类用户生成的，未来，越来越多的互联网内容会变成由人工智能生成，并将迅速超过人类生成的内容数量。以前的人工智能主要用于识别客观的一个实体或者对象，可以观察、分析和分类内容，比如用于人脸识别、车牌识别等等应用；而现在的聊天机器人是更高级的人工智能，能够自己生成新内容，比如让它去画一只猫，它就能借鉴互联网上已有的大量猫的图像，自己生成一幅前所未有的猫的画像，这种内容生成能力前所未有，让人震撼。

P：Pre-trained预训练。人工智能的核心就是训练，或者叫做学习。人类需要学习掌握大量知识，才能转化成能力，去承担一定的工作。人工智能也是一样，机器人一开始并不掌握知识，但是它通过一定的算法，不断地学习和训练人类提供的知识内容，或者叫做数据，就能越来越多地掌握人类的知识，从而具备承担一定工作的能力。

预训练在人工智能领域有两项关键的技术，一项叫监督学习。举例来说，学生学习写作文，老师会要求学生先去学习成千上万篇的文章，要学习好语气、词汇和结构，然后这个学生才能自己去写作，这个过程就叫做监督学习。第二项重要的技术叫做“通过人类反馈强化学习”，也就是学生写出来的文章，一开始质量不佳，就需要老师来进行批改。老师会在文稿上用红笔画出来哪里写的不好，要怎么改会更好，经过这样的反馈和强化学习，学生的作文会越写越好。ChatGPT聊天机器人的预训练过程正是实现了监督学习和通过人类反馈强化学习这两项技术。

T：Transformer人工智能机器学习的算法架构。以写一篇新闻稿为例，Transformer架构主要包括以下流程：编码（机器理解人类文字，并转为具体指令及任务，作为预训练网络的输入）——预训练网络（已经过大量学习训练，掌握相关知识，可以运行算法而得出输出）——生成答案结果编码——解码（按照人类语言习惯排列组合）——输出一篇新闻稿。

人工智能的关键技术：人工神经网络。人的神经系统核心处理单元叫做神经元，有树突、细胞核、轴突三个部分，分别对应了信号输入、计算处理、输出三个功能。千千万万的神经元构成了人类的神经系统，是人类智能的物质基础。人工智能就是模仿生物神经元的结构和功能，以及神经元信号相互传递的方式，构成人工神经网络，模仿生物进行分布式并行信息处理的算法数学模型，可以达到类脑的功能。

人工智能的核心概念：学习和泛化能力。机器学习研究的是计算机怎样模拟人类的学习行为；深度学习在此基础上模仿人脑的机制来处理数据。通过提供大量的数据（知识内容、学习样本），使用一定的算法，可以让人工神经网络得到充分的训练，网络的大量参数得到修正。或者通俗地说，训练完成以后，人工神经网络就已经学会了人类的大量知识。泛化能力是指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据背后的规律，对具有同一规律的训练/学习集以外的数据，经过训练的网络也能给出合适的输出。

人工智能的三大基石：数据、算法和算力。数据对于人工智能，就如食材对于美味菜肴，人工智能的智能都蕴含在大数据中。算法对于人工智能，就是厨师（烹饪的方法）与美味菜肴的关系。算法是实现人工智能的根本途径，是挖掘数据智能的有效方法。算力也就是计算能力，算力对于人工智能，如同厨房的煤气/电力/柴火对于美味佳肴一样。有了大数据和算法之后，需要进行训练，不断地训练，算力为人工智能提供了基本的计算能力的支撑，本质是一种基础设施的支撑。越是高级的AI，越是需要海量的训练数据，需要高度复杂的算法，需要超强的算力！

人工智能模型的参数规模一定程度上标示着模型的智能水平。作为ChatGPT的核心模型，2018年发布的GPT-1大约有1.17亿参数，有一定的泛化能力；2019年的GPT-2大约有15亿个参数，除了理解能力外，在内容生成方面表现出了强大的能力；2020年的GPT-3有1750亿个参数，在570 GB的文本上进行了训练，可以完成自然语言处理的绝大部分任务；不久以后的GPT-4预计有2800亿个参数。

人工智能具有逼近乃至超越人类智能的强大能力，这一点已经被理论证明。但是人工智能会不会进化出意识和情感，无法证明。多数科学家认为会，而且就在不远的将来，这就会引发伦理问题。

ChatGPT聊天机器人可能会引发以下问题：①存在制造和传播虚假信息的隐患；②学术伦理面临挑战，教育界人士对ChatGPT带来的“强隐蔽性剽窃”风险忧心忡忡，担心为学术舞弊大开方便之门；③算法歧视，ChatGPT可能在训练数据中嵌入历史偏见或对世界的看法，比如特定文化的优越性；④版权问题，大多数生成模型可以无偿或者未经许可从互联网收集材料生成新的内容，容易侵权。

最后，我想对人工智能普及性、大众化应用进行展望。

回顾人工智能的发展历史，有一些重要的里程碑式的事件。比如，2016年，AlphaGo横空出世，战胜围棋顶级棋手、世界围棋冠军李世石，等等。ChatGPT聊天机器人是第一项普及性、大众化的人工智能应用。近期也有预测，在2040年左右，变革性的AI将能够完全匹敌人类的大脑，发生历史性的剧变。未来十几年将是人工智能的爆发增长期，是普及性、大众化应用的爆发期。

ChatGPT聊天机器人是一个多面手，能做的工作有很多。例如编写代码、写文案、写小说、做计划、写论文、做表格等等。它可以跟传媒结合，实现智能新闻写作，提升新闻的时效性；可以跟影视结合，拓宽创作素材，提升作品质量；也可以和营销、娱乐和其他相结合。这些都可以和物流供应链相结合，因为物流当中需要有传媒，需要有营销，需要各种智能化方案的设计。

ChatGPT聊天机器人可能替代人类的部分工作。①技术类工作：程序员、软件工程师、数据分析师。②媒体类工作：广告、内容创作、技术写作、新闻。③法律类工作：法律或律师助手。④金融类工作：金融分析师，个人财务顾问。⑤其它工作：电话销售、客服人员等。

但是，也有很多人类职业AI短期内无法替代，因为在需要情感和创造力的职业中，人类的角色仍然至关重要。例如：①艺术家：创造艺术作品需要人类的想象力、情感和创造力。②医生和护士：在医疗领域，人类的经验和判断力至关重要。③教育工作者：教育工作者需要关注学生的情感和思想，并对他们进行个性化的指导。

最后，我请ChatGPT聊天机器人为中国物流学会作一首诗，作为我发言的结尾。仅仅几秒钟，ChatGPT就做出了一首长诗：“风物长空信物流，学会航标拨行舟。创新求索领潮流，协同合作铸精骄。智慧荟萃团结力，人才济济促发展。资源共享共筑梦，网络连接促共赢。高峰攀登共筑辉，绿色智慧献天地。中国物流学会，引领未来展宏图。”

（根据速记整理，未经本人审阅，转载请注明作者和来源中国物流学会。）