亚洲精品中文免费|亚洲日韩中文字幕制服|久久精品亚洲免费|一本之道久久免费

<dl id="hur0q"><div id="hur0q"></div></dl>

AI課堂第9講：DL深度學習-模型欠擬合和過擬合問題分析

用戶投稿 ? 2022年6月20日 06:12 ? 社會

#我在頭條搞創(chuàng)作#

上節(jié)課我們講了MLP在MNIST數(shù)據(jù)集上的分類應用，我們在構建模型時涉及到的模型結構和超參數(shù)可以自行更改去驗證更好的模型效果。我們在實驗過程中常會出現(xiàn)一種情況：模型在訓練數(shù)據(jù)集上效果很好，但是在測試數(shù)據(jù)集上效果一般或者比較差，這種現(xiàn)象被稱為——過擬合（overfitting）。

與過擬合相對應的是欠擬合（underfitting），我們常用訓練誤差（training error）和泛化誤差（generalization error）區(qū)分兩者，誤差由損失函數(shù)計算所得（比如前面講的線性回歸用到的平方損失函數(shù)和 softmax 回歸用到的交叉熵損失函數(shù)）。

即訓練數(shù)據(jù)集表現(xiàn)得好，不代表實際測試數(shù)據(jù)集就一定表現(xiàn)好。因此，模型在訓練選擇時應更多地關注如何降低泛化誤差，提高泛化能力。

模型選擇

我們在訓練前需要確定超參數(shù)和模型參數(shù)，過程中通過多次epoch來達到較好的訓練效果，每個epoch對應一個模型文件，那么如何選擇最佳的模型和設置超參數(shù)呢？此時需要驗證數(shù)據(jù)集（validation data set）輔助判斷，因為理論上，我們之前用的測試集只能在所有超參數(shù)和模型參數(shù)確定后使用一次，因此引入了驗證集。驗證集一般是從訓練集中隨機選取一部分作為驗證集。

訓練集、驗證集和測試集比例一般是6:2:2。

即驗證集可以輔助我們選擇誤差較小的模型文件。

過擬合VS欠擬合

欠擬合

欠擬合可理解為模型對訓練數(shù)據(jù)的特征提取不充分，沒有學習到數(shù)據(jù)背后的規(guī)律，或者評判標準過于寬松，導致模型在測試數(shù)據(jù)集上無法做出正確判斷。表現(xiàn)為：訓練誤差和泛化誤差都相對較高。

當樣本特征較少、模型復雜度較低時，對樣本的特征提取不夠充分，就可能導致欠擬合問題。

過擬合

過擬合可理解為模型對特征信息提取過多，把數(shù)據(jù)噪聲當作規(guī)律學習，評判標準過于嚴格。表現(xiàn)為：訓練誤差低，泛化誤差高。

當數(shù)據(jù)集質量不高、噪聲較大、訓練樣本數(shù)較少，或是模型復雜度較高、參數(shù)過多，就會導致學習到的特征并不普遍適用，模型高度擬合訓練數(shù)據(jù)，出現(xiàn)過擬合問題。

過擬合與欠擬合比喻圖解

這兩種擬合問題是所有深度學習從事人員“深惡痛絕”的問題，打個比喻，某同學平時學習認真，模擬考試成績也很好，但是期末考試成績卻很難保證會一樣好或者更好?？陀^原因一般是試卷難或者是平時模擬試卷做的少導致一些題型沒遇到。

類比到深度學習模型擬合問題的導致因素主要有兩方面：模型復雜度（試卷難）和訓練數(shù)據(jù)集大?。ㄆ綍r學習的題型少）。

模型復雜度

為了模擬過擬合和欠擬合兩種現(xiàn)象，我們選擇一個復雜的模型和一個簡單的模型來測試。

高復雜度模型選擇高階多項式函數(shù)

低復雜度模型選擇低階多項式函數(shù)：一階多項式函數(shù)又稱為線性函數(shù)：y=wx+b

上面兩個模型函數(shù)均采用平方損失函數(shù)來擬合模型。

給定訓練數(shù)據(jù)集，如果模型的復雜度過低，很容易出現(xiàn)欠擬合；如果模型復雜度過高，很容易出現(xiàn)過擬合。應對擬合和過擬合的個辦法是針對數(shù)據(jù)集選擇合適復雜度的模型。

訓練數(shù)據(jù)集

影響欠擬合和過擬合的另一個重要因素是訓練數(shù)據(jù)集的大小。一般來說，如果訓練數(shù)據(jù)集中樣本數(shù)過少，特別是模型參數(shù)數(shù)量（按元素計）更少時，過擬合更容易發(fā)生。隨著我們增加訓練數(shù)據(jù)量，泛化誤差通常會減少。因此，在硬件允許的情況下應盡可能增加訓練數(shù)據(jù)集，特別是當模型復雜度較高時。

實驗過程展示如下(基于Pytorch)：

我們將生成一個人工數(shù)據(jù)集。在訓練數(shù)據(jù)集和測試數(shù)據(jù)集中，給定樣本特征x，我們使用如下的三階多項式函數(shù)來生成該樣本的標簽

噪聲項服從正態(tài)分布，平均值為0，標準差為0.1。我們將為訓練集和測試集各合成100個樣本

1.三階多項式函數(shù)擬合(正常情況)

我們先是與數(shù)據(jù)生成函數(shù)同階的三階多項式函數(shù)擬合。實驗表明，這個模型的訓練誤差和在測試數(shù)據(jù)集的誤差都較低。訓練出的模型參數(shù)也接近真實值：w1 = 1.2, w2 = 3.4, w3 = 5.6, b= 5。

2.線性函數(shù)擬合（擬合）

我們再試試線性函數(shù)擬合。很明顯，該模型的訓練誤差在迭代早期下降后便很難繼續(xù)降低。在完成最后次迭代周期后，訓練誤差依舊很大，即模型復雜度不夠。

3.訓練量不足（過擬合）

事實上，即便是與數(shù)據(jù)成模型同階的三階多項式函數(shù)模型，如果訓練量不足，該模型依然容易過擬合。讓我們僅僅使用5個樣本來訓練模型。顯然，訓練樣本過少了，甚至少于模型參數(shù)的數(shù)量。這使模型顯得過于復雜，以至于容易被訓練數(shù)據(jù)中的噪音影響。在迭代過程中，即便訓練誤差較低，但是測試數(shù)據(jù)集上的誤差卻很大。這是典型的過擬合現(xiàn)象。

前面提到，增大訓練數(shù)據(jù)集可能會減輕過擬合，但是獲取額外的訓練數(shù)據(jù)往往代價高昂。在訓練數(shù)據(jù)集固定的情況下，一般使用權重衰減和丟棄法來解決過擬合問題。后續(xù)我們將繼續(xù)講解解決過擬合問題的方法。

鄭重聲明：本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng)，不代表本站立場，版權歸原作者所有，如有侵權請聯(lián)系管理員(admin#wlmqw.com)刪除。

函數(shù)參數(shù)復雜度多項式數(shù)據(jù)樣本模型深度特征線性誤差課堂

618黑龍江米面糧油引全民搶購熱潮寶青等5縣區(qū)省內(nèi)購買力最強

上一篇 2022年6月20日 06:12

華為打造的6座SUV，長超5米+449馬力，余承東：質感超越百萬豪車

下一篇 2022年6月20日 06:12

cad連續(xù)標注快捷鍵(cad連續(xù)標注快捷鍵)
本文主要講的是cad連續(xù)標注快捷鍵，以及和cad連續(xù)標注快捷鍵相關的知識，如果覺得本文對您有所幫助，不要忘了將本文分享給朋友。 cad中連續(xù)標注快捷鍵 CAD尺寸標準快捷命令：DL…
2022年11月27日
0
存儲過程語法(sql server存儲過程語法)
今天小編給各位分享存儲過程語法的知識，其中也會對sql server存儲過程語法進行解釋，如果能碰巧解決你現(xiàn)在面臨的問題，別忘了關注本站，現(xiàn)在開始吧！ oracle存儲過程基本語法…
2022年11月26日
0
什么是推廣cpa一篇文章帶你看懂CPA推廣渠道
CPA渠道 CPA指的是按照指定的行為結算，可以是搜索，可以是注冊，可以是激活，可以是搜索下載激活，可以是綁卡，實名認證，可以是付費，可以是瀏覽等等。甲乙雙方可以根據(jù)自己的情況來定…
2022年11月25日
0
抖音直播帶貨有哪些方法技巧(抖音直播帶貨有哪些痛點)
如今抖音這個短視頻的變現(xiàn)能力越來越突顯了，尤其是在平臺上開通直播，更具有超強的帶貨屬性，已經(jīng)有越來越多的普通人加入到其中了。不過直播帶貨雖然很火，但是也不是每個人都能做好的，那么在…
2022年11月24日
0
銳龍97900x參數(shù)規(guī)格跑分評測銳龍97900x屬于什么檔次
銳龍9 7900X是銳龍7000系列處理器中性能頂尖的型號之一，它采用了這一代標配的zen4架構和5nm制程工藝，那么它具體的參數(shù)跑分如何，在電腦上世紀發(fā)揮怎么樣呢，下面就來看看銳…
2022年11月24日
0
明查｜美國新冠后遺癥患者中有16%癥狀嚴重以致無法工作？
點擊進入澎湃新聞全球事實核查平臺速覽 – 網(wǎng)傳數(shù)據(jù)比例無權威信源佐證，該比例有可能是結合了美國疾病防控中心和布魯金斯學會的數(shù)據(jù)得出，但這兩個機構的調(diào)研目的和樣本都不同…
2022年11月24日
0
vivox90pro配置參數(shù)跑分詳情 vivox90pro是什么屏幕
vivox90pro參數(shù)配置詳情怎么樣？vivo手機在昨晚舉行了X90系列發(fā)布會，有普通款、pro款以及pro+款三個版本，那么vivox90pro具體配置怎么樣呢？下面就讓小編為…
2022年11月23日
0
vivox90參數(shù)配置詳情 vivox90處理器功耗跑分介紹
vivox90參數(shù)配置詳情怎么樣？vivo手機在昨晚舉行了X90系列發(fā)布會，有普通款、pro款以及pro+款三個版本，那么vivox90具體配置怎么樣呢？下面就讓小編為大家介紹一下…
2022年11月23日
0
分享做網(wǎng)絡營銷技術的2種方法(網(wǎng)絡營銷技術有哪些)
如何借助互聯(lián)網(wǎng)賺錢？相信這是很多人的真實想法，掌握了網(wǎng)絡營銷的技術，即使你不工作，也能獲得穩(wěn)定的收入來維持你的生活狀態(tài)，當然假設你已經(jīng)有了一份固定的正常工作，那么掌握了網(wǎng)絡營銷的技…
2022年11月22日
0
淘寶運營數(shù)據(jù)分析的3個指標解析(運營數(shù)據(jù)分析怎么做)
我們知道淘寶運營工作中對于數(shù)據(jù)的分析與整理是很重要的，這些工作乍一聽可能比較難，但是也有一些相關的技巧可以讓我們能夠有效的找出對我們有用的數(shù)據(jù)，這樣我們也能夠更加直觀的看出我們店鋪…
2022年11月20日
0

聯(lián)系我們

聯(lián)系郵箱：admin#wlmqw.com
工作時間：周一至周五，10:30-18:30，節(jié)假日休息