自動編碼器的一個典型應(yīng)用是特征降維,和PCA的作用一樣,但是比PCA的性能更強(qiáng)。
可回以想這樣答一個場景:我們要訓(xùn)練一個CNN模型,這個模型最終可以識別貓、狗、船等,那么我們需要給它喂入大量的貓狗等圖像,假如這些圖像都是高清的,即數(shù)據(jù)維度很大,那么CNN訓(xùn)練的時間就會變長。這時候需要將圖片壓縮一下,我們當(dāng)然可以考慮使用圖像壓縮算法,這里只是舉一個例子,如果某些數(shù)據(jù)集不是圖片,如何壓縮呢?
答案可以使用自編碼器,自編碼器可以將高維的數(shù)據(jù)特征用一個低維的特征來表示,
自動編碼器的作用是通過編碼器只學(xué)習(xí)其典型特征(維度降低了),該特征通過解碼器可以大致復(fù)原原來的數(shù)據(jù)即可。這樣再將這個學(xué)習(xí)到的低維特征輸入到相應(yīng)的神經(jīng)網(wǎng)絡(luò)中,可以大大減少訓(xùn)練的時間。在實際應(yīng)用中,我們訓(xùn)練好自動編碼器后,一般只使用其編碼器部分,從而獲得低維的數(shù)據(jù)。再將這個數(shù)據(jù)輸入到其它分類模型中進(jìn)行訓(xùn)練。