近日,菲尔茨奖获得者、华裔数学家、加州大学洛杉矶分校教授陶哲轩在牛津数学公开讲坛中,探讨了AI(人工智能)在数学和科学范围中的潜力,与它将怎么样与人类的智商协同用途,推进一个全新的数学年代。他详述了 人工智能 在数学证明和计算中的应用,并展望了将来 人工智能 可能带来的革命性变化。从智能化证明到改变传统的数学研究方法,陶哲轩的见解为大家揭示了一个充满无限可能的将来。
他表示,他对 人工智能 怎么样潜在地改变数学感到很开心。虽然变革还没发生,但它即将来临。核心看法如下:
AI是一项了不起的技术,会加速科学和数学,但它不是一种“魔法”,有时有点被夸大了。
AI基本上是一台猜测机器,是一个可以叫你输入信息的软件,达成方法在数学上是相当普通的。
当AI发挥用途时,真是太神奇了,但当它不起用途时,状况或许会很糟糕。
尽管AI具备巨大潜力,但安全性尚未达标。在下行风险非常小的场景,AI有非常不错的应用前景。
与很多其他学科相比,将AI应用于数学的负面影响要小得多。
AI使得真的的大型数学项目成为可能。
AI和数学将会产生巨大的协同用途,催生出一个大数学年代。
学术头条在不改变原文大意的状况下,做了简单的编译。演讲内容如下:(文字仅为演讲部分,完整版版请见文末视频)
陶哲轩:非常高兴来到这里,我真的非常享受在伦敦的时光,这里很热情好客。
我要谈谈AI(人工智能),当然每一个人都听说过它,它有望改变世界,我确实觉得它会改变科学和数学,这是一项了不起的技术,但有时有点被夸大了,它不是一项神奇的技术。
假如你真的知道AI系统运行的具体细节,你会发现其中有的数学,但事实上在大部分状况下并非最早进的数学,从非技术角度来讲,AI基本上是一台猜测机器,是一个可以叫你输入信息的软件,像是文字查看之类的,并产生输出,或许是一些文字、图像或一些数字。
事实上,它的达成方法在数学上是相当普通的,仅需同意你的输入,把它分成小部分,将每一个单词或任何东西编码为数字,将这类数字乘以网站权重,然后将它们结合起来,或许会先截断它们,然后再将它们乘以网站权重并将它们结合起来,如此做几百次左右,就会得到答案。从数学上来讲,这其实相当无聊,怎么样找到网站权重,更有趣一点,AI不是魔法,但它可以加速各种东西。
我打一个比方,想像一下,在这个世界上,动力飞行器还没有被创造,大家只有汽车、卡车、船只与海上的交通,然后有人在某一天创造了喷气发动机,刚开始这类发动机很小,只不过一个玩具,什么也做不了,但之后愈加强大,最后可以达成旅游,比最快的汽车还要快十倍。然而,你仍然需要创造飞机,你不可以只不过将喷气发动机绑在汽车上,并期待好的结果,这不是一个好主意,你需要改变对交通的怎么看,设计新的安全协议、新的仪器和理解物理定律的新办法。它仍然不是魔法,它不像《星际迷航》中的运输器,它仍然遵守物理定律,只不过规模不同。
事实上,AI与不少大家天天都在用的软件类似,但有一个重点的差异是,大家目前用的软件有点无聊且没创意,你给定一个输入,每次都会得到相同的输出,你在网页浏览器中输入地址,你将获得该地址下的任何内容,假如你输入错误的地址,你将被带到其他地方,很可预测。AI恰恰相反,特别是目前时尚的大语言模型(LLM),它们更有创意,你不一定要学习某种程序语言,你仅需输入自然语言,就能用它们,即便你输入了一些错误的信息,它仍然可以理解你的意思,但这是以牺牲靠谱性或可预测性为代价的,你给它两次相同的查看,会得到不一样的答案,且不可以保证答案是正确的,这是一台猜测机器,它试图给你一个猜测的答案,它事实上并没考虑怎么样实质生成这类东西,但有时能做的事情却是惊人的。
去年 GPT-4 刚出来时,有团队测试了它的能力,他们给了它一些数学奥林匹克竞赛中的问题,这是角逐很激烈的高中数学竞赛,事实上,巴斯目前就有一个如此的一个活动,这个周末我将前往那里参加闭幕式,大家的主办单位 XTX 也资助了一场大型AI竞赛,最后目的是看看AI是不是真的可以解决同样的问题,只有几百名高中数学学生可以完美解答这个问题,因此,他们向它提出了很多近期的奥数问题,有时它完全正确地回答了问题,这是它们发布的一个大家可能看不到的答案,但对高中数学的真的拔尖学生来讲,这是一个相当具备挑战性的问题,而 GPT-4 一步一步给了这个特定问题的完全正确的证明。这是一个精心挑选的例子,我觉得他们测试了几百个问题,成功率只有 1%。
所以,当它发挥用途时,真是太神奇了,但当它不起用途时,状况或许会很糟糕。
在同一篇论文中,他们需要它计算一个简单的算术问题 7*4+8*8,它所做的就是猜测,直接给出了 120,随后它停了下来,仿佛说,“或许我需要给出一些讲解”,它于是计算出了每一步,7*4 和 8*8,然后放在一块,得到了与刚开始猜测不一样的答案,92。然后,实验者说,“等等,你之前说答案是 120”,它们说,“这是一个错误,正确答案是 92”。
所以,从本质上讲,这类技术,至少在现在的层次上,还没能力……它们事实上没正确性的基本事实,大家尝试通过实验来迫使它一步一步地考虑,而不止是猜测答案,如此做确实有一点帮助,但这类都是“黑客”行为,大家不是……它们不像专家那样靠谱,尽管它们有时可以给出专家级的输出,或至少是类似专家级的输出。
那样问题来了,大家要怎么用这项技术呢?这是一种不一样的技术,大家已经习惯了以前会犯了错误的技术,这类糟糕的技术会产生劣质的输出,但一般当一个程序或技术产生不好的输出时,你可以说它非常糟糕,就像……它看着不像真的。但事实上,AI在设计上,网站权重是专门选择的,以便答案尽量接近正确答案,因此,即便它们错了,它们看着也很有说服力,因此,现有些感知怎么样测试某事物何时看着很好和看着非常糟糕,特别是当你想以任何可能导致实质伤害的方法用它时。
比如,假如你想用AI来做出医疗决策或财务决策,甚至作为治疗师,这类文本生成器大概成为非常不错的伙伴,但也会给出很糟糕的建议。
因此,在很多范围,尽管AI存在巨大潜力,但安全性尚未达标。这就像你创造了喷气发动机一样,你可以用它迅速模拟出某种动力飞行器,但要真的达到让公众都感觉安全的状况可能还需要几十年的时间,航空旅游现在是当今按英里小时计最安全的旅游,尽管这显然是一项危险的技术,这类问题将会得到解决并且是可以解决的,但你需要真的考虑安全问题,你需要假设它会发生。
其次,在下行风险非常小的场景,AI也有非常不错的应用前景。比如,你可能已经注意到,报告中的所有背景幻灯片都是由AI产生的,或许你已经注意到一些缺点,AI在生成文字方面仍然非常糟糕,但它正在慢慢变得更好,且下行风险非常小,所以它仅需看着让人信服即可,背景图片不是我演讲的主要、核心部分。因此,在某些应用中,如此的下行风险确实是可以同意的。
特别是,在科学范围,减少错误和偏见风险的一种办法是科学验证,特别是独立验证。假如有一些办法可以结合AI真的强大的输出,通过独立验证把垃圾过滤掉,只保留好东西,就会有不少潜在的应用程序出现。
再打个比方,水龙头可以产生适量的饮用水,但它能产生的数目是有肯定限制的,忽然间,大家有了大型消防水龙带,它可以产生 100 倍的水,但这类水不可以直接饮用,假如你有一个过滤装置,过滤掉那些不可饮用的部分,你就拥有了很多的饮用水。这就是我所看到的科学和数学的进步方向。
现在,不少科学范围都面临着瓶颈,需要好的候选者来解决问题,或许你正在从事药物设计,想找到一种治疗某种疾病的药物,你需要先想出一种药物,或许来自自然或通过修改药物的方法,然后你需要合成它,你需要进行一个多年的试验,第一阶段试验,第二阶段试验......而且这类试验很昂贵,所以现在只有大的药厂才能一直做到这一点。事实上,你试验的很多药物并不起用途,而且你需要要在这个过程中的某一时刻舍弃它们,有时你非常幸运,虽然它们并不可以治愈疾病,但它们在其它方面可以发挥用途,问题是,你仍然需要进行不少次尝试、面对不少个错误。
AI技术有望降低候选者的数目,而且大家目前已经在用它来模拟蛋白质了,有了足够的数据,你就能对各种药物的功能进行建模,基于现有临床试验的数据等,你可以找到借助AI治疗各种疾病的有期望的候选药物,但之后你仍然需要进行临床试验,所以你仍然需要科学验证的黄金标准,但不再是 100 个候选者,或许你仅需测试 10 个,就能找到好办法。
材料科学是另一个将获得巨大突破的范围。几十年来,大家一直期望找到一种可以在室温下工作的超导体,尝试过不一样的材料,但都失败了,尽管有时至少获得了非常大的进步,但最后还是失败了。同样,你可能可以跳过昂贵的合成过程,假如你还可以大幅缩小候选者的数目,这将是变革性的。事实上,AI不仅仅是使科学问题的设计环节变得智能化,在合成方面也是这样,大家已经在开发AI驱动的实验室,在整个合成过程中,有时需要用危险化学品,目前可以以更智能化的方法完成。
这是AI加速科学的一方面,降低参加昂贵试验的候选者。其次,是加速建模。
大家需要对现代世界中的各种事物进行建模。在气候条件下,大家需要对大方和其它地球科学过程进行建模;假如你想建造一条新的高速公路,大家需要对交通进行建模;在宇宙学中,大家要对宇宙进行建模。但,模型需要要遵守物理定律。假如你想模拟将来 20 年地球的气候,你需要采集很多的数据,遵循物理定律,但为了使其准确,你需要采取很小的时间步长,你需要把地球分成很很小的网格,你还需要超级计算机和数月的时间。假如你想做一个气候预测,比如,假如二氧化碳水平处于这个水平,20 年后会发生什么?你需要耗费几个月的时间,才可以真的得到合理准确的答案。
原则上,AI可以大大简化这个过程。有了超级计算机和很多模拟数据,AI可以对这类模型进行练习,并找到适当的最好拟合,给出预测结果。基于资料中未见的输入,在气候模拟范围,AI可以成功恢复传统超级计算机模拟的准确性,仅需几个小时,而不是几个月,这种加速很惊人。
对于中长期天气预报,相比于传统办法,AI的预测速度要快 10000 倍,但这并不意味着事实上整个天气预报速度提升了一万倍,由于大家不可以一直相信AI的输出,大家还不了解怎么样对这类输出的靠谱性进行基准测试。
对于很多预测来讲,模拟过程只不过步骤之一,其中有一个数据模拟步骤,你需要进行实质测量,并将它们放入模型中,这事实上是一个巨大的瓶颈,尤其是对于气候建模,采集数据并将它放入其中,并在运行AI模型之前对其进行格式化,这仍然是一个大问题。
但,AI已经开始实质部署,它对于飓风等罕见事件的预测特别有效,你可以在其中借助现有些飓风资料进行练习,不必实质运行物理定律。有一些成功的例子,AI已经可以即时预测飓风登陆的地方,比美国国家气象局的预测更准确。因此,任何存在模拟瓶颈的地方,都可能是另一个非常不错的用例。
事实上,对于气候建模来讲,现在可以预见的一件事是,由于运行一个场景需要数月的时间,政府间气候变化专门委员会的预测可能只包括三到四种可能发生的状况,但AI可以运行数千个场景,事实上可以获得更丰富的预测。
我是一名数学家,对AI怎么样潜在地改变数学感到很开心,现在已经有了一些用例,但变革性还没发生,但我觉得它即将来临。
与很多其他学科相比,将AI应用于数学的负面影响要小得多,假如你需要AI解决一道数学问题,而它给的答案是错的,这不会是世界末日。
更要紧的是,大家可以独立验证这类证据,在数学中,大家有一个证明正确或不正确的规范,所以你不必相信AI。事实上,你可以用其他电脑软件来验证证明的正确性,而且因为很多其它问题都有一些数学成分,假如你能叫人工智能改变数学推理,那是完全大概的,这可能是一个很广阔的机会,使AI在很多其它用例中愈加有用。因此,它们应该与单独的技术很好地结合起来。这就是所谓的证明助手。
证明助手是一种电脑软件,事实上,它就像一种计算机语言。计算机语言一般输出的是可实行程序,但证明辅助语言不是用于实质做一件事,而是验证一件事,它产生某些陈述正确的证书,既用于数学,也用于工程。
因此,你真的很想百分之百确定某些电子软件,根据程序设计去做,就像飞机上的电路一样,你想让这个按钮准确地完成这件事,有多种办法可以用软件来验证这类电子设施,但同样的技术也可以用来验证证据。不幸的是,这很耗时。
我觉得,当代数学家仅需几个月的时间,就能写出一个中等规模问题的证明,而将它形式化则需要至少 10 倍的时间。一般你没办法一个人完成这件事,你需要一群人,但它变得愈加快。
数学范围内有很多著名的结果被证明,然后在不少年后才得到形式化验证,但这个过程总是需要相当长的时间,你可能听过四色定理,它在上世纪 70 年代就得到了证明,直到 2000 年代才形式化,克卜勒猜想在 1998 年就被证明了,但它实在太复杂了,以至于产生了很多疑问,证明是不是正确?因此,作者托马斯·黑尔斯提出了一个为期 20 年的计划来将它形式化,当他们只用了 12 个小时就完成时,他感到特别高兴。
近期,我和一些合著者解决了组合数学中的一个猜想,大家觉得这是一个非常不错的测试案例,看看现代形式化技术是怎么样运作的,大家有一个 20 人的团队,在三周内就完成了形式化验证,虽然愈加快了,每一个定理非常快都会被形式化,但还是不太便捷。
我看到凯文·巴札德,他计划将费马大定理形式化,他预计五年内就能完成其中的要紧部分,我觉得他并没声称自己做了全部事情,是的,所以这类变得更快了。
现在,加速主要来自传统办法,大家一直在开发更好的软件库来认识怎么用这类语言,大家用 GitHub 等现代协作工具,协调怎么样让不少人一块工作。
大家都了解,到了肯定规模之后,数学家们就非常难再一块工作了,或许大家五个人可以一块工作,但假如你想要 20 个人一块工作,你们需要相信别的人的数学。这事实上是一个巨大的瓶颈。所以,大家还没在其他科学范围做大型数学项目,但形式化项目可以规模化,这事实上非常有趣,你可以运行 20 人、50 人的项目,其中的不少人都不是专业数学家,或许他们有程序设计背景,但他们做出了有益的贡献。因此,它也使得真的的大型数学项目成为可能。
事实上,大家已经开始尝试用AI来加速形式化项目。这就是弗雷曼-鲁格猜想形式化项目,这事实上是步骤之一,所以这是一个特殊的陈述,它涉及熵,但它到底是什么并无关紧要,这就是我需要的倡导,这种语言有一两行证明,它被叫做 Lean,用于验证这一点,你需要准确地考虑什么是正确的代码,Lean 是一种很挑剔的语言,但,GitHub Copilot 提出了这条特定线路的正确证明应该是什么,在这种特殊状况下,仅需第二行,事实上第一行没办法编译,但它足够接近正确,它确实有效,所以大家开始用AI自动填写这类证明的一小步。
伴随时间的推移,AI将不仅能够做一行证明,甚至自动完成两行、三行证明,最后它将比传统方法更快。我预计,这将成为一种常见做法,将来大家撰写证明的方法是大家将它口授给AI,大家将像学生一样与AI交谈并讲解证明,大家讲解的每一步,它都会尝试形式化验证,假如它能做到,那就太好了,假如它不可以,它会返回,你仅需来回迭代即可,我觉得这会比传统方法做数学更快。
另外,假如你想稍微改一下证明,改变其中一个假设,一般你需要改变每一行,并且如此做会犯不少错误,事实上,即便以现在的技术,在证明过程中改变一个小参数要快得多,并且可以保证你不会犯任何错误,仅需更改需要更改的行,事实上,正式做要便捷得多。
所以,我觉得AI和数学将会产生巨大的协同用途,将会催生出一个大数学年代。是的,有不少事情都将要发生。