深夜漫谈
半夜有点睡不着,给你们随便聊聊吧。
图片里涉及深度学习的三起三落中的前五次。有关第一次起落,图片里有件事没讲——当时感知机的发明者把感知机吹得特别神,说它能解决各种各样问题,和今天的ChatGPT差不多,所以后来摔得才那么惨,美国苏联才觉得自己被忽悠了。第三次落,是在2020-2022年间,有标签数据不够用了,所有有标签的图片也都被拿去训练了。第三次落的一个很明显的标志,就是我之前发给过你们的 Deep Learning Is Hitting A Wall,这文章的作者是符号学派的拥趸,他觉得AGI需要预先定义的符号以及符号间的操作来达到。但是谁也没想到(当然也包括LeCun这些人),2022年11月,那个东西就横空出世。ChatGPT以前,很多人都在怀疑Deep Learning这种方法能否达到AGI,但是在它之后,几乎没有人怀疑。在那之前,做AI的人也大都相信实现AGI需要神经科学的帮助,毕竟生物是唯一一种已知的智能;在那之后,做神经科学的人自己都不信实现AGI需要神经科学的帮助了。
虽然深度学习火了,但我从未后悔我18岁时选了物理。我还记得高中时候,老师讲电荷周围有电场、磁铁周围有磁场,我问老师你为什么相信电场磁场是真实存在的、凭什么超距作用就是错的?老师只是说它们就是存在的;我还记得初中时候,我和朋友们讨论,为什么$Ca^{2+}$的电子排布是2-8-8-2,而不是2-8-9-1?
这两个问题,如果本科不学物理,我一辈子都无法回答了。也无法告诉我的孩子们。我难道真的要一辈子都不知道这两个问题的答案?当然有人可能会说,你之后自学也一样。但是我知道我数理能力的上限,我没有严济慈、李政道、丘成桐那样的才华(他仨传记里写他们本科主要靠自学),如果没有一大群人和我一起学,我一个人自学是肯定自学不下去的。我如果不是物院的,我不可能自学学会电动力学和量子力学,就像我作为一个物院学生不可能自学学会实分析和泛函分析一样。
第一个问题无非是因为法拉第和麦克斯韦的理论更简洁,可能纽曼、韦伯、高斯、黎曼他们的加上一些修修补补也能解释电磁感应、电磁波、电磁辐射,但我们肯定相信简洁的那个;第二个问题,用薛定谔方程推导一下或者模拟一下就可以了,至于为什么我们相信薛定谔方程是对的,因为解出来氢原子的光谱和实验很像。
我看过你们这些次的作业,我能感觉出来,你们中有20%的人论数理能力是明显在我之上的。但是你想成数学家或者物理学家,光有数理能力是不够的,还要求知欲、勇气、面对挫折的不屈不挠、和他人合作、表达能力。这五者我是非常优秀的(自我吹嘘一下)。
我现在觉得,统计也是很有意思的学科。她们的那些故事,优生学、女士品茶、普希金的诗、英语的香农熵,都是非常有趣的。只是我高中对于统计、机器学习了解得太少了。我高中听说过“人工智能”,但压根就没听说过“机器学习”这四个字。我高中时候听说亚里士多德、托勒密、哥白尼、开普勒、伽利略、牛顿、法拉第、麦克斯韦、爱因斯坦的故事,但从未听说过高尔顿、皮尔逊、费雪、马尔可夫、香农的故事。
大三时候,我心里觉得物理有点老了,old-fashioned,不想去做凝聚态、原子分子、天文学、粒子物理这些,想去做交叉学科。当时有三个方向供我选择,去做生物物理/神经科学,还是做医学物理,还是机器学习/深度学习。后来我选择了第一个。其实这三个选哪个现在我都不会后悔,因为都还蛮有意思。
总之希望你们能找到自己喜欢做的事情。可能是一个你一直想回答的问题(比如我文中的这两个问题),可能是你闲聊时喜欢和别人扯的话题(比如我对于统计、机器学习、深度学习),可能是你觉得你这辈子不做就亏了的事情(比如我对于物理),也可能是没有任何原因就是喜欢(好吧,以上那些原因也可能是因为我就是喜欢物理和统计,才想出这些原因说服自己 :) )。