来源:《平安校园》杂志2024-12-16 15:26:43
数月以来,人工智能在应用领域取得了夺目的进展。2022年11月30日,一款名为ChatGPT的人工智能应用正式推出,短时间内风靡全球,成为有史以来增长最快的消费类应用程序,其月活用户数量在推出仅两个月后便达到了1亿,在办公、教育、娱乐、新闻、制造业、科技等诸多领域掀起了一场应用风暴。
ChatGPT是美国人工智能研究实验团队OpenAI开发的一种大型语言模型,它以聊天机器人形式出现,既能解答用户的简单提问,还能对用户提出的关于文案写作、编程、解数学题等相对复杂的问题作出详细回应,呈现出高质量人机交互水平。该应用助力人工智能突破瓶颈期并上升至前所未有的高度,在潜移默化中影响着全球一些领域,被媒体、学界和业界誉为现象级、革命级的应用。
本文通过详细阐释ChatGPT的本质属性和技术特征、应用特点及“双刃剑”效应,引出笔者对这一人工智能应用现状与发展的几点思考,以期对国内人工智能应用领域的发展有所裨益。
一、本质属性和技术特征
与元宇宙相比,热度居高不下的ChatGPT并非昙花一现的炒作,它是人工智能在应用方面的一次重大飞跃,是本轮以机器学习为特征的人工智能技术由量变向质变转化进程中的里程碑之作。它可能成为人类一直期待的第一种通用型人工智能应用、智能社会的一个强大引擎和迈向智能时代的一个动力源,具备强悍的赋能作用。它的推出,标志着网络空间的智能化日益显著,预示着人类社会向智能化社会演进是大势所趋。
(一)ChatGPT是人工智能领域的应用型革命性成果
一些学者指出,目前,ChatGPT的突破仍属于在深度学习领域的应用突破,属于联结主义和行为主义经典学派的范畴,是本轮人工智能技术发展脉络的延续。
ChatGPT运用机器学习技术,根据接收到的用户输入的信息生成类似人类语言的文本,在人工生成的大量文本数据集上进行训练,并针对各种自然语言处理任务进行微调,最终在与用户的交互对话中生成类人响应。另外,它还采用最简单直观的聊天界面对话框,操作门槛低、适用范围广、知识存量大,回答迅速、可嵌入性比较强。
它的研发团队革命性地实现了人工智能的落地,使各行各业、普罗大众都看到了人工智能的赋能作用,对其他领域、行业的影响可能是颠覆性的。
(二)ChatGPT是大模型的经典应用
本轮人工智能发展在近年遭遇瓶颈,如何构建更有效更可靠的大模型是一个拦路虎。构建大模型,需要将大数据、大算力、强算法进行有效组合。
看算力,支撑ChatGPT的背后是超强的算力。有数据显示,ChatGPT的总算力消耗约为3640PF-days,即假如每秒计算一千万亿次,需要计算3640天。为此,微软公司斥资数亿美元,在自己公司的Azure云计算平台上将英伟达公司生产的上万个A100芯片连接在一起,并改造了服务器机架。看大模型,ChatGPT基于GPT-3大型自然语言模型构建,这是生成式人工智能技术(AIGC)的代表作,是一种先进的语言模型。构建大模型需要做到上述多维度的有效结合,其艰辛程度从研发团队的创业史中可见一斑。
(三)ChatGPT是人工智能在自然语言理解、处理等方面的巨大进步
根据OpenAI官方介绍,ChatGPT的构建大致包括搜集对话数据、搜集对比数据和搜集说明数据三个步骤。
一是搜集对话数据,训练有监督的微调模型(Supervised Fine-tuning,即SFT模型)。人类标注员选择提示词并写下期望的输出回答,然后利用这些数据对一个预训练的语言模型进行微调,从而学习到一个有监督的微调模型。
二是搜集用于对比的数据,训练一个奖励模型(Reward Model,即RM模型)。标注员对SFT模型的大量输出进行投票,从而创建一个包含比较数据的新数据集,并在此数据集上训练一个新模型,用以模仿人类的偏好。
三是搜集说明数据,使用近端优化策略(Proximal Policy Optimization, 即PPO策略)强化学习来进行优化。利用奖励模型进一步微调并改进SFT模型,最终得到优化完毕的SFT模型。
总体而言,相较于以往的模型,除了海量的无标注语料数据之外,ChatGPT还具有超大的专门语料库,它具备对话与追问、上下文理解、用户意图捕捉以及敢于质疑的能力,同时还能够对用户的不合理请求说“不”并作出解释。曾有专家评估称ChatGPT目前的综合智力水平已经相当于一个九岁的孩童,但是这个“孩童”每天都在成长,并且可以不断扩展升级。
二、应用特点及“双刃剑”效应
ChatGPT的出现宣告了AI技术将迎来广泛普及应用,也预示着通用型的人工智能应用的出现指日可待。它已成为近年来人工智能发展的标志性应用,如同智能引擎,开始嵌入并赋能人类社会的各行业各领域。但是,它所具备的应用特点也为它在各领域中的使用带来“双刃剑”效应。
(一)它是人类的超级助手和知识顾问
人类进入信息社会的最大特征,是计算终端和网络广泛触达大众。而人类进入智能社会的特征,则是个人拥有类似ChatGPT此类性能优越的通用人工智能应用。
ChatGPT能以助手方式为人类在生产、生活、发明创造等各方面提供快速知识协助。2023年2月8日,微软将ChatGPT接入了自己的搜索引擎Bing,开放给普通大众无偿使用。3月14日,OpenAI团队趁热打铁发布了GPT-4语言模型,这种模型回答准确性不仅大幅提高,还具备更高水平的识图能力等功能,对于英语以外的语种支持也得到更多优化。据称该新系统在美国41个州和地区的律师资格考试中获得的分数,排名位于前10%左右。它在生物学、微积分、宏观经济学、心理学、统计学和历史等先修课程高中考试中均获得满分。
目前,展示、传授其如何应用的各类信息案例充斥网络,新业态正在产生。在可预见的未来,ChatGPT或将快速遍及人类社会的各个领域。
(二)它的“双刃剑”效应同样突出
目前,ChatGPT的回答覆盖范围很广,表现出“万能型”知识助手的特点,可发挥积极作用的空间广泛。例如,它提供的答案比较灵活,不千篇一律,为提问者提供了较充分的对比和选择空间;它呈现回答的方式具有直观性,甚至可以按用户指定的格式输出,便于用户使用;它的反应速度极快,据了解,新的版本已经支持超过2.5万字的文字输出量,效率很高。在记忆能力、知识储备、文字逻辑、上下文识别、连续对话、敏感话题内容规避等方面,ChatGPT的表现超过了以往所有的类似应用。
然而,ChatGPT也是一把双刃剑,使用不当会造成危害。
ChatGPT一旦被不法分子使用,必然会产生巨大的副作用。在网络攻击方面,有文章警示,ChatGPT的功能可使其成为恶意网络攻击者的武器,用来制造钓鱼邮件、撞库攻击、虚假信息等,并进一步通过生成恶意软件、创建虚假社交媒体资料或聊天机器人账户等多种方式发动网络攻击。在军事领域,它能够快速吸纳和分析军事情报,在战前推演模拟、战场快速决策并制定作战路线,进而实现战场单向透明化,以及威胁评估、通信保障、作战任务管理及战后评估等。鉴于ChatGPT在收集和整理情报方面的功能,据报道,有的情报机构已着手探索使用ChatGPT来辅助完成日常工作和情报任务。
综上,每个ChatGPT的用户存在一体两面,有收集各类情报信息的充足机会,但本身也是被采集信息的对象。在ChatGPT大规模应用的背景下,如何更好维护国家安全、保护企业的商业秘密和公民的个人信息,需要早做思考。
(三)ChatGPT具有一定的局限性
世界经济论坛指出,ChatGPT等生成式人工智能存在一系列局限性。
一是生成结果可能不准确,ChatGPT经常会生成没有实质内容的文本或低效的代码,甚至产生错误输出;二是结果可能带有误导性,ChatGPT需要在大量开源数据集上进行训练,一旦这些数据集不准确或者存在偏见,结果就会出现错误,如在生成图像时,这种问题就将非常明显;三是可能引发知识产权保护问题,它依托海量数据发现规律,按规则将数据串联在一起形成文本,其内容著作归属权不明确,因而有学者称ChatGPT是一种“高级的剽窃工具”。人工智能自动生成的作品,难以受到版权法保护。
此外,它还存在c语言的缺陷。ChatGPT对特定领域的深入程度有限, 生成的内容经常出现“永远正确的废话”;它的敏感内容过滤系统也能被轻易破解。例如,当ChatGPT拒绝回答涉及敏感内容的问题时,如果提问者“拐个弯”去问,它就会说出答案。
三、启示与思考
在中国日益取得丰硕科技成果后,美国聚焦“大国竞争”,对中国的高科技围追堵截、打压封锁,试图巩固美国的霸权。拜登就任伊始便对首席科技顾问提出了五大问题,其中一个关键问题是“在对美国的经济繁荣和国家安全至关重要的未来技术和产业中,美国如何确保自身处于世界领先地位?”这体现出以拜登为代表的美国战略界十分担忧遭遇“科技意外”。美国把以华为公司为代表的中国企业在5G领域的“意外领先”定性为美国科技史在“斯普特尼克时刻”后的又一次“科技意外”,并且不希望在人工智能、量子等新领域“重蹈覆辙”。中国坚持维护世界和平,促进共同发展,美国在ChatGPT方面取得突破,亦值得我国借鉴并进一步发展科技等综合实力。
(一)朝着“人无我有,人有我特”目标努力
ChatGPT是新生事物,有利于提高生产力,可能成为人类走进智能社会的引擎,但也是美国自认为可以对华围追堵截的“尖兵利器”。OpenAI团队目前封堵了中国等部分国家用户使用,对中国实施了技术封锁。
因此,我们要坚持“趋利避害”的原则,以“人无我有,人有我特”为目标,在确保自身数据安全和总体国家安全的前提下,研发此类人工智能应用并合理合法使用,并逐步完善使之更加适合我国社会及用户的特点。这既是理解和学习,更是塑造与创造。
(二)奋起赶超,从“小”处入手
创造ChatGPT类似的高科技人工智能,需要号召力、意志力、凝聚力、创新环境、资金链条、非营利和商业运作等诸多方面综合作用,也需要大数据(尤其是高质量数据集)、大算力、强算法、强大的资金链在背后长期持续支撑。
在算力方面,微软的Azure云服务为ChatGPT提供了超级算力支持——一台有超过1万枚英伟达A100 GPU芯片的AI计算集群,且还在不断增加和升级换代。2022年10月起根据美国政府的禁令,英伟达公司已对中国彻底断供A100GPU,随着“中美博弈”的加剧,类似核心设备对华断供的形势可能会日益严峻。
然而,我国也有自己的优势和发展潜力,中国在5G领域快速发展产生出的大量数据,可以通过整理挖掘形成高质量的庞大可用数据集。为了稳步发展,目前国内可以鼓励具备实力的企业将人工智能与实体产业和特定领域相结合,发展成为“小”的行业通用型人工智能,并在发展中逐步跻身国际前列。
(三)认真思考和把握人工智能发展既定路径,避免“意外”
国际人工智能领域目前的基本态势是“美国占优势,中国有特色”。当前,从全球范围内来看,只有中美两国有大规模发展人工智能的机会。中国作为重要的“后来者”,需要多点布局,力避“押宝型”发展可能产生的意外,这就要求持续打通科技创新过程中的资金融通渠道。未来,既要集中力量突破重点,又要在人工智能的不同分支和技术路线上布下“闲棋冷子”,且持续投入。这需要鼓励民营资本、社会资本聚焦创新,并更多发挥作用,还需要更多利用国际创新资本,整合国际资源和网络。只有认真思考和把握人工智能发展路径,多点布局、多措并举,才能有效避免“意外”发生。
(四)及早布局人工智能领域的治理
中国需要持续设计、制定和影响人工智能领域的规则。
OpenAI团队在这方面率先采取了行动,列举出“三原则”:行善、普惠和应对风险。他们呼吁全球就如何使用人工智能达成共识,并就三个关键问题展开全球对话,即如何治理这些系统,如何公平分配它们产生的收益,以及如何公平共享访问权限等。这也是OpenAI团队试图以自己的理念影响相关国际规则的制定并赢得话语权的尝试。
我国在人工智能治理领域也有所作为。2021年 9月25日国家新一代人工智能治理专业委员会发布了《新一代人工智能伦理规范》;2021年12月,我国发布《关于规范人工智能军事应用的立场文件》;2022年11月16日我国向联合国大会提交了《中国关于加强人工智能伦理治理的立场文件》等,以与时俱进的思考和研究,为人工智能治理规则贡献“中国智慧”,持之以恒提升中国在国际人工智能领域中的影响力和话语权。
(五)预警预判相关安全风险
我国还需加强对安全风险的预警预判。OpenAI团队呼吁世界主要政府对超过一定规模的机器学习训练保持监管,反映出创作团队对人工智能应用安全的担忧。ChatGPT及类似应用风靡全球,为个别国家威胁全球数据资源安全提供了可能,相关军方、情报部门正密切关注,并以此为工具带动军事和情报变革。
关于相关应用潜在的国家安全隐患、数据安全风险以及应对之策等,我国都需要尽早规划,力求有备无患。然而在目前阶段,还是应当采取“趋利避害、鼓励发展、行业自律、监管跟进”的原则。为此我国政府开展了最新实践,2023年4月11日,为促进生成式人工智能技术健康发展和规范应用,根据《中华人民共和国网络安全法》等法律法规,国家互联网信息办公室起草了《生成式人工智能服务管理办法(征求意见稿)》,向社会公开征求意见。
ChatGPT可能引发政治安全风险,因为它能快速产出大量虚假信息内容,也可能为不法分子提供各种经整理后的信息致危害社会,这一方面也值得重点关注。
(张力 作者单位:中国现代国际关系研究院)
选自《平安校园》2023.04(总第257期)