曲建仲:在人工智能的时代,对科技一定要有20%的了解

ChatGPT一本正经地胡说八道,需要智者仔细确认答案是否正确

「什么是人工智能?」曲博士说,「人工智能不是人类用计算机仿真人脑,而是一种数据分析技术,以及数据统计的方法。」打破大部分人认为,人工智能是电机工程领域或资讯工程领域的范畴,但实际上是一种资料分析技术与统计,在人工智能的时代,对科技一定要有20%的了解,这20%的深度为自学科技门坎(Knowledge tipping point),对各种科技需要有一点基本的认知,才能对相关的信息有感。

更进一步解释,其实就是以大脑学习来比照人工智能的学习方式,人工智能可分成「训练(Training)与学习(Learning)」以及「推论(Inference)与预测(Prediction)」两阶段。人类的数据是透过大脑经由眼耳鼻舌皮肤收集大量的数据与经验储存认知,科学家在训练计算机,则是将大量数据输入计算机,前者有意识,后者则无。因此,人工智能的训练是非常昂贵与花时间,ChatGPT训练一次需要一千万美金,然而人工智能建构后的推论只需一瞬间,10秒内呈现预测结论,爆发力惊人。

人工智能模型中的生成式(Generative)的分类,并非简单分析已有的数据,而是更深度的学习数据中的机率分布,根据已有的数据进行分析后创造生成全新的内容,主要应用包括内容创作、基础科学研究、人机交互、文案写作、文字转图片、智能配音、海报生成、智能特效、代码生成及医疗诊断等。

生成式预训练变换模型(GPT: Generative Pre-trained Transformer)的语言模型,就是使用深度学习让计算机产生人类听懂的自然语言,生成式(Generative)代表它会重新排列组合旧的文字生成新的句子;预训练(Pre-trained)代表它必须事先输入大量数据训练产生语料库(Text corpus);变换模型(Transformer)指的是2017年由Google大脑团队所推出的GPT前几代模型。

企业对AI的应用为何?怎么跟机器人沟通?
让计算机听得懂人类说的话,就要建构在语言学上大量的文章数据,完整的语料库(Text corpus),记录词汇之间的相关性,聊天机器人,代写学术论文、代读报告选股、代回客服信函、代工程师写程序,而且中英文都通,未来的语系就看世界各国投入AI世界的速度与资本。企业对AI的应用为何?怎么跟机器人沟通?

预料未来企业内每一位工程师都是提示(Prompt)工程师,计算机会以我们输入的文字做为提示,到数据库里把之前输入一大堆人类的文字或话语中计算器率重新排列组合,选择机率最高的文字拼凑出一个字句输出,这个过程自始至终计算机都是无意识的进行数学计算器率而已,并非让我们错觉的以为计算机知道人类在说什么,这个结果肯定是没有灵魂的。

聊天机器人好像听得懂我的意思
很多人在和ChatGPT聊天后,觉得这个回答太贴切了,就会误以为它具有思考能力,且听懂自己在说什么,曲建仲强调,「事实上完全不是这样!」他解释,ChatGPT是利用人类询问的问题找出特征,利用特征到数据库中寻找适合的关键词,再运用机率计算出最适合的回复。曲建仲幽默地说道:「很多时候我们都以为它听懂了,其实他从头到尾都没有听懂。」

即使ChatGPT无法真正听懂人类的问题,人工智能仍在未来扮演极度重要的角色,无论是陪人聊天的APP或电话客服等,都是未来两、三年的产业趋势。虽然人工智能将带来生活上的便捷,曲建仲仍担忧地表示,「这个对人类来说是蛮大的影响。」因人工智能倚靠调制解调器率再由文字的形式回复,可能会导致错误讯息于网络上流传,ChatGPT一本正经地胡说八道,需要智者仔细确认答案是否正确,因此正确运用人工智能成为关键。

值得一提的是,人工智能生成图像工具Midjourney作画,参加Fine Arts Exhibition数字艺术竞赛夺得首奖,人工智能自编自导自演的影片,受人争议的深度伪造(Deepfake)技术等,其中的真真假假,再度考验企业随时代变革建立自身的AI超级大脑系统同时,在生成式数据检索(GIR: Generative Information Retrieval)对封闭型或开放型的数据安全保护,数字助手的优化与AI应用的精准质量等,更费心力。

 

曲建仲博士课后与文晔董事群及参与同仁们大合照

曲建仲博士精彩授课,文晔同仁们踊跃参与

文晔董事长郑文宗于课程中提问交流

文晔董事长郑文宗亲自颁赠小礼物予曲建仲博士表达谢意