什么是降维技术

什么是降维技术

降维是指将一组维度较大的数据转换为维度较小的数据,以确保其简洁地传达相似信息的过程。这些技术通常用于解决机器学习问题,便于为分类或回归任务获取更好的特征。

让我们看看下面显示的图像。它显示了 2 个维度 x1 和 x2,让我们以厘米(x1)和英寸(x2)为单位表示几个物体的测量值。现在,如果您在机器学习中同时使用这两个维度,它们将传达相似的信息并在系统中引入大量噪声,因此您最好只使用一个维度。这里我们将数据的维度从2D(从x1和x2)转换为1D(z1),这使得数据相对更容易解释。

以类似的方式,我们可以将数据集的 n 维减少到 k 维 (k < n) 。这 k 个维度可以直接识别(过滤),也可以是维度的组合(维度的加权平均值)或新维度,它们可以很好地代表现有的多个维度。

这种技术最常见的应用之一是图像处理。你可能遇到过这个 Facebook 应用程序——“你像哪位名人?“。但是,你有没有想过这背后使用的算法?

答案如下:为了识别匹配的名人图像,我们使用像素数据,每个像素相当于一个维度。在每个图像中,都有大量的像素,即大量的维度。每个维度在这里都很重要。您不能随机省略维度以更好地了解整个数据集。在这种情况下,降维技术可帮助您使用各种方法找到重要的维度。

发表评论

您的电子邮箱地址不会被公开。