0%

横看成岭侧成峰 | 理工科思维论现象与本质

众所周知,现象不等于本质。所谓“本质”,一定是隐藏在现象背后的“真理”。

但如果现象与本质不同,那二者又究竟是何种关系呢?为什么我们需要透过现象才能看到本质,而不能直接看到本质?

笔者最近看到一篇文章,又重新思考起这个问题来。

人类思维?计算机思维?

这篇文章介绍了计算机视觉领域中的一种识别PS处理过的图片的方法[1]。文中通过对原图(Authentic image)和修改图(Tampered image)进行运算,获取了二者的噪声谱(Noise map)。再通过模型识别出噪声谱中的异常来对异常增加(或减少)的物体进行识别。

如上图,PS中被增加或者减少的物体都逃不过这种算法的“火眼金睛”。这似乎让人们觉得,计算机实在是比人类强大很多,人类都不能分辨真假的东西,却仍然逃不过计算机的眼睛。

但我们也应该认识到,计算机也是可以被欺骗的。我们人类至少不会因为一个或几个像素的改变而轻易改变对一个图像的判断。但目前的计算机人工智能会。一些具有明确意义的图片,通过一个像素的改变就可以显著降低计算机(现有深度学习算法)对其识别率[2]。

对无明确意义的图片,也可以通过一个像素点的改变欺骗计算机,将其归于任何一个分类(近乎100%的置信度)[2]。

在以上研究的基础上,我们也开始质疑计算机的可靠性了。不过,在这个世界上还真是没有什么东西是完全靠谱的。在笔者狭隘的眼中,还是会认为,普遍地计算机会比人类更靠谱些。毕竟人类比计算机更容易被欺骗,例如目前发展很快的GAN(生成式对抗网络)技术,可以极其方便地生成以假乱真的图片[3]。

你真的能相信图中虚拟世界(Virtural world)不是真实世界(Real world)吗?

当然,我们不需要对此感到绝望。因为这个世界本就是如此。

我们人类的思维与计算机的思维是看待世界的不同角度

而真理,永远隐藏在我们所看到的现象背后。

现象与本质的量子物理意义

测量(Measurement)是需要通过干扰我们所需测量的系统,获得其干扰反馈,从而实现分析我们感兴趣系统内部信息的一个过程。如果说$A$是一个需要我们测量的系统,$M$是我们测量$A$时所采用的一种(干扰)方法,而$B$是我们最终的测量结果。那么三者之间的关系可以被表示为

在公式中,$M$可以理解为算符,其作用在$A$这个对象上,结果是获得了$B$这个对象。很好理解对不对?

我们能够看到东西,也正是通过光作用于我们关注的物体并与之作用,我们利用眼睛接收到光信号,最终大脑对光信号作出处理和判断的这样一个过程。在这个现实过程中,我们关注的物体是$A$,光(包括其所经历的一切过程)是$M$,而我们大脑最终接收到的信号是$B$。容易理解,因为经过了复杂方法$M$的作用,$A$与$B$在大多数情况下都是难以相等的(理论上存在相等的可能,但目前在现实世界中没有遇到过二者相等的例子)。

如果简单地,将$A$、$B$对象看作向量,$M$算符看作矩阵,那么当且仅当$M$为单位矩阵时,可以满足$A=B$。这时可以实现所谓“现象即本质”。但这在现实生活中并没有被观测的例子。可以理解,当$M$可以为任何算符,其取单位矩阵值的可能性无限趋近于零。

线性代数与现象本质的关系

从数学角度来看,$M$算符属于一种变换(Transform)。那么$B = MA$可以看作是一种降维(投影)变换

从上图中简单的二维投影一维的例子中,我们不难得知,降维会损失维度信息(从x、y坐标到只剩下x坐标)。低维度信息难以完美重构高维度的情况。正如上图,只从x轴上的投影无法得知是以上哪种二维图线投影得到的。当然,如果我们再获得了二维图线在y轴上的投影,那么就可以重构出原来的二维图线了。这也正是我们需要多角度看待事物的原因。

另外,从上图我们还可以得到启发:当各观测角度相互正交(相互独立,毫不相关)时,我们能够在最少的观测次数下得到事物的“本质”。当然这是后话了。

给我们带来启发

作为一个材料科研工作者,笔者还希望从自然科学发展的角度思考思考我们能够前进的方向。

生物信息中基因组的利用最初是从孟德尔遗传定律开始的。笔者认为这个思想的基础是“确定的基因决定了生物的特性”。这与材料科学中“成分结构决定性能”的理论基础不谋而合。

在电催化研究中,我们常使用“描述符(descriptor)”尝试对电极催化剂的催化活性进行“描述”。从线性代数的角度上说,也可以说,它是在试图做一种“投影”。把复杂无比的影响催化活性的各种因素,全都包含在一个“描述符”中去。那这个描述符可以认为是各种混杂因素在催化活性这个角度的一个投影。

在计算机优化算法中,有些目标优化函数会过于复杂,会占用很长的机时才能得到答案,也就是寻找最优解所需机时以及最优解。针对此,我们可以采用较简单的代价估计函数来替代目标优化函数,进行一个机时估计,从而缩短调试算法的时间。

在材料研究中,我们实际也面临着这样一个规模巨大的优化问题。我们在思考,何种成分,何种工艺处理,在何种条件下,能够获得期望的最佳材料性能。这么说来,材料与计算机都使用“炼丹”的原理,但到底是什么限制了材料学科的发展速度呢?笔者认为是反馈速度。计算机学科拥有相对更确定的物理规律,也就能够拥有对目标函数更好的掌控能力。这意味着,“代价估计函数来替代目标优化函数”的这条道路对计算机学科来说是相对容易的。但对自然科学,如材料学科来说,不然。材料缺少的就是这样一个(更准确说是”多个“)好用的代价估计函数,更本质的,可以认为其也是一种描述符。

在笔者眼中,高通量计算与高通量实验(材料基因组)的研究工作,正是材料学科模仿生物学科进行的描述符快速搜索的研究工作。找到了材料某种性能的描述符,也即建立起了目标和材料结构参数(或其它可调控参数)之间的桥梁。与工程经验公式同理,这也就意味着该性能在工程上已经具有实际应用的价值(或可能),材料研发速度将会迎来质的飞跃。届时,限制材料研发速度的关键很可能会重新回到计算速度和机械自动化的速度上,极大地解放了材料领域科研人员的劳动力。可以预见,材料(科学与工程)学科将会迎来新的发展机会。

目前已经有很多研究者在进行着描述符的研究。描述符的发现方面,笔者已经发现不少文章利用近年来大热的机器学习方法对影响材料最终性能的因素进行研究[4];描述符的理解方面,每种材料体系已经总结出了“各自不同”的物理描述符,但对影响材料性能的物理本质理解还有待加深[5-7]。

我们能做些什么

说了那么多,那现象与本质关系的理解能给我们一般的生活带来什么启发呢?

笔者认为至少应该有两点。

第一,日常生活中的判断我们应该能够做到多角度听取意见。任何个体、组织所发表的意见言论都是片面的,他们只能从自己的角度去看待一个问题。甚至是新闻媒体,也无法回避(如政治倾向)。或许他们本意不坏,但人类认识事物、做成判断的片面性物理本质已经限制了其作出完全立体判断的能力。所以好的(或理想的)新闻和学术论文应该能够把相左的意见都陈列出来,并基于此给出自己的判断。这就给读者留下了自己独立判断的空间(笔者认为,个体独立思考的空间总是有的,不过是个体进入的难度有差异)。

第二,在获得多角度意见后,我们还应该多角度分析问题。由于个体受到所处环境和所受教育等因素的限制,作出完全客观无偏见的判断是十分困难的。但这不意味着我们不能去追求一种相对理性客观的思考方式。当我们意识到自己已经具有某种偏见,或者已经盲从大流时,就应该提醒自己需要从另一个角度去思考问题了。在最近大热的电影《我不是药神》中,就涉及了多个利益角度。从人民角度来说,药企制定的过高药价是不人道的行为;从药企角度来说,需要制定足够高的药价,以维持给研发人员提供的有吸引力的工资,从而持续进行新药的研发;从政府的角度来说,每个阶段社会所面对的主要矛盾都有所不同,同时保证人民的生命权益和药企的可持续发展并不是一朝一夕就能完成的。虽然对问题的全面(多角度)分析并不意味着能够解决问题本身(矛盾无处不在),但却可以从根本上为我们提供对问题更深入的理解。


以上便是笔者近日对“现象与本质”关系的一些微小的思考。

欢迎各位读者提出意见与建议!

Email: mozheyang@outlook.com

参考文献

[1] Zhou P, Han X, Morariu V I, et al. Learning rich features for image manipulation detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018: 1053-1061.

[2] Su J, Vargas D V, Sakurai K. One pixel attack for fooling deep neural networks[J]. IEEE Transactions on Evolutionary Computation, 2019, 23(5): 828-841.

[3] Li P, Liang X, Jia D, et al. Semantic-aware grad-gan for virtual-to-real urban scene adaption[J]. arXiv preprint arXiv:1801.01726, 2018.

[4] Jonayat, A. S. M.; Janik, M. J.; Senftle, T. P. Interaction Trends between Single Metal Atoms and Oxide Supports Identified with Density Functional Theory and Statistical Learning. Nat. Catal. 2018.

[5] Suntivich, J.; Gasteiger, H. A.; Yabuuchi, N.; Nakanishi, H.; Goodenough, J. B.; Shao-Horn, Y. Design Principles for Oxygen-Reduction Activity on Perovskite Oxide Catalysts for Fuel Cells and Metal-Air Batteries. Nat. Chem. 2011, 3 (7), 546–550.

[6] Wei, C.; Feng, Z.; Scherer, G. G.; Barber, J.; Shao-Horn, Y.; Xu, Z. J. Cations in Octahedral Sites: A Descriptor for Oxygen Electrocatalysis on Transition-Metal Spinels. Adv. Mater. 2017, 29 (23), 1–8.

[7] Tang, C.; Wang, H. F.; Chen, X.; Li, B. Q.; Hou, T. Z.; Zhang, B.; Zhang, Q.; Titirici, M. M.; Wei, F. Topological Defects in Metal-Free Nanocarbon for Oxygen Electrocatalysis. Advanced Materials. 2016, 7030.