❶ 【高分求助】Matlab擬合問題!!!!我已知兩組數據,用polyfit擬合後,得出P值,但是將數據回帶後誤差很大
6次擬合,誤差小點
x=[1.9 2.2 2.7 3.0 3.4 3.6 3.9 4.0 5.1 6.8 8.5 9.2 10.7 11.6 12.9 15.3 17.1 18 19 20 21.6 22.4 23.7 24 26.8 33.7 36.7 44.9 57 67 72 81 98 116 122 140 190 210 220 231 267 680 950 1210 1370 1430 1470 1480 1500 1500];
y=[11 12 13 14 15 16 17 19 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 120 140 160 180 200 250 300 350 400 450 500 600 700 800 900 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000];
plot(x,y,'green')
p=polyfit(x,y,6);
y1=p(1)*x.^6+p(2)*x.^5+p(3)*x.^4+p(4)*x.^3+p(5)*x.^2+p(6)*x+p(7);
x2 = 1:1500;
y2=p(1)*x2.^6+p(2)*x2.^5+p(3)*x2.^4+p(4)*x2.^3+p(5)*x2.^2+p(6)*x2+p(7);
hold on
plot(x,y1,'red')
plot(x2,y2,'b')
hold off
% axis([10,11000,1,1600]);
xlabel('功率/mw');
ylabel('電壓');
❷ SVR進行回歸預測時為什麼誤差那個大
1、參數設置問題,-c,-g,-p的設置都會影響,一般都是通過GA,PSO,CV等方法進行優化參數,選擇最適合的參數。
2、樣本問題,可能輸入樣本沒有結果歸一化預處理。
❸ 多項式回歸後公式,曲線非常吻合,但是驗證時卻發現偏差比較大,不知為什麼。
樓主驗證的結果誤差大,應該是因為你做的是整體回歸,也就是說一次就把所有的點用完了,這樣造成的結果往往是回歸出的結果多項式次數過高,這樣就導致在回歸點以外的地方多項式震盪非常劇烈,誤差很大。若要減小誤差,可以進行分段回歸,從而降低震盪;或者回歸成更合適的函數而不用多項式,比如用對數函數或者指數函數等。
❹ Excel處理疫情數據做多元線性回歸擬合很好誤差卻很大
一是過度擬合,二是直接用多元線性回歸怕不是太好,可能得考慮什麼生存函數之類的
❺ spss非線性回歸 標准誤差很大怎麼辦
要先核實原始數據的質量,然後考究是否存在多重共線性等問題,原因很多的,要逐一分析
❻ 多元logistic回歸分析標准誤很大是什麼原因
logistic回歸與多重線性回歸一樣,在應用之前也是需要分析一下資料是否可以採用logistic回歸模型。並不是說因變數是分類變數我就可以直接採用logistic回歸,有些條件仍然是需要考慮的。 首要的條件應該是需要看一下自變數與因變數之間是什麼樣的一種關系。多重線性回歸中,要求自變數與因變數符合線性關系。而logistic回歸則不同,它要求的是自變數與logit(y)符合線性關系,所謂logit實際上就是ln(P/1-P)。也就是說,自變數應與ln(P/1-P)呈線性關系。當然,這種情形主要針對多分類變數和連續變數。對於二分類變數就無所謂了,因為兩點永遠是一條直線。 這里舉一個例子。某因素y與自變數x之間關系分析,y為二分類變數,x為四分類變數。如果x的四分類直接表示為1,2,3,4。則分析結果為p=0.07,顯示對y的影響在0.05水準時無統計學意義,而如果將x作為虛擬變數,以1為參照,產生x2,x3,x4三個變數,重新分析,則結果顯示:x2,x3,x4的p值分別為0.08,0.05和0.03。也就是說,盡管2和1相比無統計學意義,但3和1相比,4和1相比,均有統計學意義。 為什麼會產生如此結果?實際上如果仔細分析一下,就可以發現,因為x與logit(y)並不是呈線性關系。而是呈如下圖的關系: 這就是導致上述差異的原因。從圖中來看,x的4與1相差最大,其次是2,3與1相差最小。實際分析結果也是如此,上述分析中,x2,x3,x4產生的危險度分別為3.1,2.9,3.4。 因此,一開始x以1,2,3,4的形式直接與y進行分析,默認的是認為它們與logit(p)呈直線關系,而實際上並非如此,因此掩蓋了部分信息,從而導致應有的差異沒有被檢驗出來。而一旦轉換為虛擬變數的形式,由於虛擬變數都是二分類的,我們不再需要考慮其與logit(p)的關系,因而顯示出了更為精確的結果。 最後強調一下,如果你對自變數x與y的關系不清楚,在樣本含量允許的條件下,最好轉換為虛擬變數的形式,這樣不至於出現太大的誤差。 如果你不清楚應該如何探索他們的關系,也可以採用虛擬變數的形式,比如上述x,如果轉換的虛擬變數x2,x3,x4他們的OR值呈直線關系,那x基本上可以直接以1,2,3,4的形式直接與y進行分析。而我們剛才也看到了,x2,x3,x4的危險度分別為3.1,2.9,3.4。並不呈直線關系,所以還是考慮以虛擬變數形式進行分析最好。
❼ 為什麼遺傳演算法優化後的的神經網路得到的模擬結果誤差比不優化的還大呢求高手解答。
有可能不優化的結果出現了過擬合現象
❽ 為什麼Excel做多元線性回歸擬合很好誤差卻很大
說明你擬合的函數不是太完美,需要調整函數類型和參數。具體情況具體分析。
❾ 將測試值帶入回歸曲線後差別較大是什麼原因呢
不知道你要怎樣比較預測值和真實值,比如計算一下殘差值,或者計算一下均方誤差之類?
在Linear Regression對話框,點Save按鈕,會出現Linear Regression: Save對話框,在Predicted Values(預測值)和Resials(殘差)欄都選Unstandardized,會在數據表中輸出預測值和殘差,然後你想怎麼比較都行。
判斷模型是否有預測能力,其實就是模型檢驗,模型檢驗除了統計意義上的檢驗,還有實際意義上的檢驗,就是檢驗是否跟事實相符,比如收入與消費應該是正相關的,如果消費為被解釋變數、收入為解釋變數,如果收入的系數小於零,那肯定是不對的。
統計意義上的檢驗,包括參數的T檢驗,方程的F檢驗,還要檢驗殘差是否白雜訊。
檢驗模型是否具有外推預測能力,還可以這樣做:比如,你收集了一個容量為50的樣本,你可以用其中的48個樣本點估計模型,然後估計另兩個樣本點,把估計值跟實際值做一個比較。