一些过往半年学习的感悟

敬爱的邢老师:

您好!

老师,自上次三四月份之后已经有半年没见了,上次见面时我们聊起人工智能,您说:目前我对人工智能的理解也不算很多,回头还需要多去学习了解。返校后的这半年,我看了一些国际内外很出名的人工智能教材、了解并动手实现了很多经典的人工智能模型、翻阅过两三篇有划时代意义的人工智能论文。过往半年我有机会跟广东省气象局还有我们学校的一些科研研究室有过交流,这让我对当下人工智能从理论概念走入实际应用有了更多的认识。在此有一些经历与看法想要与您分享。

首先我想向老师您按我现在的认识介绍一下人工智能,当下的人工智能其实就是一个复杂的数学运算机器,不同的人工智能模型有不同的计算方式,但有一点是完全相同的 —— 输入和输出都只能是数字。目前我们能了解到的人工智能可能会涉及到图片、音频、文字……的处理其实本质上都是对数字的处理。计算机用数字来表示像素,一张图片可以被拆分成很多的像素点,所以图片可以用数字表示;音频也可以用数字来表示波形;文字也可以用数字来做映射表示。当我们把需要处理的媒介全部转换成数字后,人工智能模型就可以对这些数字做数学计算,最后得到输出。

人工智能模型的输入只能是数字,类似的,人工智能(以下简称为 AI )模型的输出也只能是数字。以人脸识别为例,AI 会先将人脸保存为一张照片,接着将这副照片转化为很多很多的数字,然后对这些数字做数学运算,一番复杂的计算后会得到一个输出,这个输出通常是 0 或 1,分别表示这次人类识别是否匹配成功。再以 ChatGPT为例,ChatGPT 接受一段文本输入,这段文本会被转换成很多的数字,ChatGPT 对这些数字做数学运算,得到输出,只不过 ChatGPT 的输出跟人脸识别不太一样,人类识别只输出一个数字,ChatGPT 会输出很多数字,将这很多的输出数字转换成文本后,就得到了 ChatGPT 的回答 —— 这在 AI 概念中被称为多对多模型,意思是输入多个数字同时输出也为很多个数字;人脸识别则被称为多对一模型,意思是输入多个数字只给出一个输出。

Emmmm 前面讲了这么多其实就说明了一件事情,那就是当下的 AI 本质上是一个复杂的数学运算机器,并且应用很局限只能处理数学运算。当然,这也意味着只要是能转换为数字的媒介,我们都可以用 AI 来介入,比如医学影像数据、气象数据。在此我想特别讲一下 AI 在气象数据中的应用,这也是我写这封信的目的。

首先有个大前提,那就是气象数据是完全可以数字化的!降水量、湿度、气温、风速、风向……这一系列气象数据我们完全可以用数字来表示,而凡是可以用数字来表示的媒介我们都可以用 AI 来介入,于是当今的 AI 科研从业者们就在这个领域上研究,并取得了一个重要突破 —— 华为盘古大模型。华为盘古大模型是一个全球性的气象预测模型,但就从本质上而言它还是个复杂的数学计算机器。它接受前一时刻的全球气象数据,经过一系列复杂的数学运算后得到后一个时刻的全球气象数据输出,于是它可以被归类为多对多的模型。

我记得那是 9.10 号,那一整天的时间我都用来看华为盘古大模型的论文,说实话,那篇论文看的我酣畅淋漓!华为盘古大模型是一个大尺度下的气象预测模型,它的预测空间分辨率是 0.25° x 0.25°,时间分辨率是 1h。于是它把全球划分为了 1,440 x 720 = 1,036,800 个 0.25° x 0.25° 小区域,在每个区域上取 13 个海拔,每个海拔上取五个数据,分别是湿度、气温、气压、经向风速、纬向风速。所以华为盘古大模型一共接受 1,440 x 720 x 13 x 5 = 67,392,000 个数据作为前一个时刻的输入,接着它会进行一系列复杂的数学运算,最后得到 67,392,000 个输出数据,作为下一个时刻的全球气象预测!而更加恐怖的是,华为他们训练这个模型时用到了从 1960 – 2010 年每个小时的全球气象数据,也就是一共 67,392,000 x (2,010 – 1,960) x 365 x 24 = 29,517,696,000,000 个数据,换算成存储单位大概是 160TB 的数据量,当亲手去计算大模型背后的具体数据量时,才能体会到大模型有多大!

这些经历真的很有趣,9.10 号那天正好是教师节,所以我才会记得那么清楚,那一天我确确实实看了一天的华为盘古大模型的论文,当然最令我惊喜的不是这个大模型究竟有多大,而是它背后所隐藏的计算模式极其新颖!

过后我有幸拜访了广东省气象局,与里面的从业人员交谈了一番。进而我了解到当今的气象预测采用的是传统的公式计算方法,结合气体热力学、流体力学、大气力学等自然科学的知识,建立偏微分方程并通过经典数学计算得到下一个时刻的气象预测结果。在这里我想指出传统公式计算方法跟新兴的人工智能预测方法的异同 —— 相同之处在于两者都是复杂的数学计算模型,都是输入数字输出数字;不同之处在于前者采用可解释的自然科学理论来人为建立公式、后者采用不可解释的人工智能大模型来预测计算,而也是因为这一个差异,当下气象局的从业者并不认可 AI 在气象预报领域的可信度。

是的,当下的 AI 大模型可解释性很低,人们只知道它是一个复杂的数学计算机器,对里面的计算原理知晓得很少。但是,AI 的计算结果却能非常逼近真实结果,我感觉……这背后可能潜藏了一种全新的计算模式,即不完全计算、采用 AI 来逼近计算。

比如在气象预测领域,如果用传统的计算方式,那么我们需要有专门的人员去研究自然科学,并依据自然科学的原理来建立计算模型,并且后期还需要反复的去调整公式,让它能更好得拟合现实情况。假如我们采用 AI 来预测,那么从业者不需要了解太多的自然科学知识也可以依据历史数据来训练出有效的大模型,这个大模型可能在预测结果上不会 100% 准确,但却能做到逼近准确,我觉得这是一种很新的计算思路。

我在这里做一个假设,从气象预测领域跳出来,假如现实生活出现了一个更加复杂的问题 —— 比如在流体模拟种研究大量水分子的运动,按照传统的方法,我们需要借助物理的知识分别给每个水分子建模,并给出每个时刻每个水分子的受力方程,这会是一件非常复杂的工程。那么这时我们可以用 AI 介入,让 AI 不依据自然科学的原理来建模,但依然能在计算上逼近真实结果。这种“不精确计算、逼近计算”的计算体系可能在未来会变得频繁。

目前我能感受到 AI 在学术圈遍地生花,各个领域的学科都在拥抱 AI,物化地生化环材哲法医都某个或多个分支在跟 AI 结合,比如:肿瘤预测、水稻长势预测、蛋白质合成、法律问答机器人、AI 哲学(胡懿学长与我谈论过这个),AI 在跨学科领域扩张得有点过度了,以至于很多问题的研究完全没必要用上 AI,也为了发论文硬生生地带上 AI……;而在应用领域,还很少能看到真正能投入使用的 AI 产品,我感觉 AI 距离被人们真正接受还有几年的时间,就像是早期的支付宝一样。

最近我在研究保研到清华北大的方法,所幸我在大学期间表现还算可以,多多少少认识了一些很厉害的学长,他们有的已经在北大读研,有的刚刚收到清华直博的 offer。我最近与他们交谈,得知清北保研的唯一途径是夏令营,而夏令营的筛选条件莫过于大学绩点排名、科研成就、计算机竞赛经历、英语水平。大学绩点排名和英语水平我不觉得我能达到极其优异。我不久后会写一份简历,投递到中大最优秀的人工智能实验室那里,希望那边的导师能够接纳我,我有好朋友已经在那个实验室里了;今年寒假我会去再报名中大的超算队伍;我会试着向清北保研努力,如果失败了的话……没事,我学长说还有复交浙做下位替代hh。

跟老师想说的话就这些了,我觉得老师您是能理解我想法的人,10月5日我恰好返回惠中,便写了这封信来交代一下近况,也正好把我心里思索的东西吐出来,我不会觉得我说的内容绝对正确,但也想要说出来跟全世界的大家分享一下 hh。

祝邢老师生活顺心!
许睿林
2023年10月5日