据报道,美国洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory,简称LANL)的一项突破性理论证明表明,使用一种称为“过参数化”的技术可以提高量子机器学习的性能,从而挑战传统计算机的任务。
过参数化(Overparametrization),是人工智能机器学习中使用的一种技术,通过引入比必要情况更多的参数或变量来提高模型的性能和训练动态。在这种方法中,模型中的参数数量被有意设置为远大于可用训练样本或数据维度的数量。尽管参数多于所需数量是违反直觉的,但人们发现过参数化在训练复杂的机器学习模型方面具有多种好处。
据悉,“过参数化”可以帮助模型适应数据中存在的变化和复杂性,从而可能在出现新的、未见过的数据时提高泛化性能。过参数化本质上为模型提供了更多的自由度来学习和表示数据中的潜在关系。因此,这一技术的主要优点之一是它可以避免在优化过程中陷入次优解决方案。
不过,到目前为止,人们对量子机器学习模型中的“过参数化”还知之甚少。在最新研究中,LANL团队建立了一个理论框架,用于预测量子机器学习模型过参数化的临界参数数。在某个临界点上,增加参数会使网络性能有一个飞跃,模型变得明显容易训练。
该论文的主要作者、LANL的研究员Martin Larocca解释说:“通过建立量子神经网络中过参数化的理论,我们的研究为优化训练过程和在实际量子应用中实现增强的性能铺平了道路。”
最新研究成果已于近期发表在了《自然计算科学》杂志上。
为了更好地说明该团队的发现,研究人员描述了一个思维实验,在这个实验中,一个徒步旅行者在黑暗的环境中寻找最高的山峰,代表了训练过程。徒步旅行者只能朝着特定的方向前进,并通过使用有限的GPS系统测量高度来评估他们的进度。
在这个类比中,模型中参数的数量对应于徒步旅行者可以移动的方向。他们说,“一个参数允许前后移动,两个参数允许横向移动,等等。与我们假设的徒步旅行者的世界不同,数据景观可能有三个以上的维度。”
但由于参数太少,步行者无法彻底探索,可能会把一座小山丘误认为最高的山峰,或者被困在平坦的地区,任何一步都显得徒劳无益。然而,随着参数数量的增加,步行者可以在更高的维度上向更多的方向移动。有了额外的参数,徒步者就可以避免被困,找到真正的山峰或问题的解决方案。
该研究论文的合著者、LANL的研究员Diego Garcia-Martin说,“总而言之,我们相信我们的研究结果对于使用机器学习来学习量子数据的属性将会非常有用,例如在量子材料研究中对不同相进行分类,这在经典计算机上非常困难。”
编辑/范辉