从另一个角度理解机器学习的特殊性

强大的机器学习

从2012年(AlexNet)到现在的十多年间,我们可以顺着一个非常清晰的脉络看到来自机器学习领域一个又一个热门话题引爆了学术圈和舆论。先是人脸/目标识别,图像语义分析等计算机视觉领域的成果叩开了新一代人工智能(深度学习)结合互联网的应用场景。接着,强化学习技术在游戏/对弈领域的运用让人们第一次感受到AI之于人类本已熟悉的领域令人惊叹的学习能力。再到现在集各方向之大成的大语言模型基本颠覆了人们对已有生产力工具的认知。

越来越多公司和机构认识到AI的重要性和潜力,MachineLearningEngineer这个岗位也逐渐进入更多人的视野中。它意味着相对更高的薪资,但有着区别于传统软件开发的问题空间和工具箱;众多数学和概率知识乍一看令人眼花缭乱。

特殊的机器学习

对我来说,ML之所以特殊,经常需要区别于一般的软件工程,是在于其特殊的“问题空间”及对应的“解决方案空间”。 ML的问题空间内包含的任务都有一个共性:(可承受代价内)不可枚举。判断一张照片是猫还是狗时,我们并不确定即将看到的照片是什么样的;围棋落子,我们也并不知道即将面对的棋局是什么样... 这些都意味着我们要解决的问题的是无法枚举的,其搜索空间是(基本)无限的。

这就意味着我们要区别于传统的方法来应对,同时也是ML解决方案的共性:关联和拟合。 我们不知道未来会看到什么图片,没有关系,我们让模型看一部分照片(关联),自己学会提取一些关键特征,自己判断(拟合); 我们并不知道未来会面对什么样的棋局,我们也让模型自己和自己对弈(关联)来学会一套策略去提取必要的信息,作出必要的模拟,再来判断落子的最优位置(拟合)。

这也是为什么我们需要“训练”模型,也就是利用大量的关联数据去让模型拟合出一个策略来进行更general的判断。 而数据挖掘,特征工程则是在“关联数据”这一块下功夫,毕竟更优质和更大量的数据能够更好地帮助模型掌握这样一种关联性;另一方面,对于模型架构自身的优化则是帮助模型更好地拟合出一套策略。

年轻的机器学习

机器学习自身的历史虽然很悠久了,但其实深度学习和其在互联网中的运用也就是这短短十几年的时间。这十几年的运用在彰显了ML的能力同时,也暴露了很多ta亟需改进的部分。 一个非常明显的例子就是内容推荐领域的Echo Chamber:用户只看到自己愿意看到的,或者和曾经看到过所相似的内容。

An echo chamber is "an environment where a person only encounters information or opinions that reflect and reinforce his or her own."

这一方面阻碍了用户发现更多内容,进而实现一个更健康的体验闭环;另一方面更多新鲜的,不同的内容迟迟得不到流量,造成了产品质量的折扣。

我想,未来10年的ML领域又会有更多不可思议的创造和发明,更加成熟的机器学习运用会给人类带来更高层次的科技体验。