国产激情视频,在线观看97无码视频

<menuitem id="fd2nn"><dl id="fd2nn"></dl></menuitem>

<dfn id="fd2nn"><thead id="fd2nn"></thead></dfn>

<big id="fd2nn"><form id="fd2nn"><label id="fd2nn"></label></form></big>

當前位置： OFweek 人工智能網(wǎng) > 其他 > 正文

Python數(shù)據(jù)科學(xué)：線性回歸

2019-01-24 09:31

Python進階學(xué)習(xí)交流

變量分析：

①相關(guān)分析：一個連續(xù)變量與一個連續(xù)變量間的關(guān)系。

②雙樣本t檢驗：一個二分分類變量與一個連續(xù)變量間的關(guān)系。

③方差分析：一個多分類分類變量與一個連續(xù)變量間的關(guān)系。

④卡方檢驗：一個二分分類變量或多分類分類變量與一個二分分類變量間的關(guān)系。

本次介紹：

線性回歸：多個連續(xù)變量與一個連續(xù)變量間的關(guān)系。

其中線性回歸分為簡單線性回歸和多元線性回歸。

／ 01 ／數(shù)據(jù)分析與數(shù)據(jù)挖掘

數(shù)據(jù)庫：一個存儲數(shù)據(jù)的工具。因為Python是內(nèi)存計算，難以處理幾十G的數(shù)據(jù)，所以有時數(shù)據(jù)清洗需在數(shù)據(jù)庫中進行。

統(tǒng)計學(xué)：針對小數(shù)據(jù)的數(shù)據(jù)分析方法，比如對數(shù)據(jù)抽樣、描述性分析、結(jié)果檢驗。

人工智能／機器學(xué)習(xí)／模式識別：神經(jīng)網(wǎng)絡(luò)算法，模仿人類神經(jīng)系統(tǒng)運作，不僅可以通過訓(xùn)練數(shù)據(jù)進行學(xué)習(xí)，而且還能根據(jù)學(xué)習(xí)的結(jié)果對未知的數(shù)據(jù)進行預(yù)測。

／ 02 ／回歸方程

01 簡單線性回歸

簡單線性回歸只有一個自變量與一個因變量。

含有的參數(shù)有「回歸系數(shù)」「截距」「擾動項」。

其中「擾動項」又稱「隨機誤差」，服從均值為0的正態(tài)分布。

線性回歸的因變量實際值與預(yù)測值之差稱為「殘差」。

線性回歸旨在使殘差平方和最小化。

下面以書中的案例，實現(xiàn)一個簡單線性回歸。

建立收入與月均信用卡支出的預(yù)測模型。

import numpy as np

import pandas as pd

import statsmodels．a(chǎn)pi as sm

import matplotlib．pyplot as plt

from statsmodels．formula．a(chǎn)pi import ols

＃消除pandas輸出省略號情況及換行情況

pd．set＿option（＇display．max＿columns＇， 500）

pd．set＿option（＇display．width＇， 1000）

＃讀取數(shù)據(jù)，skipinitialspace：忽略分隔符后的空白

df ＝ pd．read＿csv（＇creditcard＿exp．csv＇， skipinitialspace＝True）

print（df．head（））

讀取數(shù)據(jù)，數(shù)據(jù)如下。

對數(shù)據(jù)進行相關(guān)性分析。

＃獲取信用卡有支出的行數(shù)據(jù)

exp ＝ df［df［＇avg＿exp＇］．notnull（）］．copy（）．iloc［：， 2：］．drop（＇age2＇， axis＝1）

＃獲取信用卡無支出的行數(shù)據(jù)，NaN

exp＿new ＝ df［df［＇avg＿exp＇］．isnull（）］．copy（）．iloc［：， 2：］．drop（＇age2＇， axis＝1）

＃描述性統(tǒng)計分析

exp．describe（include＝＇all＇）

print（exp．describe（include＝＇all＇））

＃相關(guān)性分析

print（exp［［＇avg＿exp＇，＇Age＇，＇Income＇，＇dist＿home＿val＇］］．corr（method＝＇pearson＇））

輸出結(jié)果。

發(fā)現(xiàn)收入（Income）和平均支出（avg＿exp）相關(guān)性較大，值為0．674。

使用簡單線性回歸建立模型。

＃使用簡單線性回歸建立模型

lm＿s ＝ ols（＇avg＿exp ～ Income＇， data＝exp）．fit（）

print（lm＿s．params）

＃輸出模型基本信息，回歸系數(shù)及檢驗信息，其他模型診斷信息

print（lm＿s．summary（））

一元線性回歸系數(shù)的輸出結(jié)果如下。

從上可知，回歸系數(shù)值為97．73，截距值為258．05。

模型概況如下。

其中R值為0．454，P值接近于0，所以模型還是有一定參考意義的。

使用線性回歸模型測試訓(xùn)練數(shù)據(jù)集，得出其預(yù)測值及殘差。

＃生成的模型使用predict產(chǎn)生預(yù)測值，resid為訓(xùn)練數(shù)據(jù)集的殘差

print（pd．DataFrame（［lm＿s．predict（exp）， lm＿s．resid］， index＝［＇predict＇，＇resid＇］）．T．head（））

輸出結(jié)果，可與最開始讀取數(shù)據(jù)時輸出的結(jié)果對比一下。

使用模型測試預(yù)測數(shù)據(jù)集的結(jié)果。

＃對待預(yù)測數(shù)據(jù)集使用模型進行預(yù)測

print（lm＿s．predict（exp＿new）［：5］）

輸出結(jié)果。

1 2 下一頁>

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報。

發(fā)表評論

共0條評論，0人參與

登錄登錄即可訪問所有OFweek服務(wù)

用戶名/郵箱/手機：
密碼：
忘記密碼？
用其他賬號登錄： QQ | 微信 | 新浪微博

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新發(fā)布

最新活動更多

即日-11.13
立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
11月28日
立即報名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
12月19日
立即報名>> 【線下會議】OFweek 2024（第九屆）物聯(lián)網(wǎng)產(chǎn)業(yè)大會
即日-12.26
火熱報名中>> OFweek2024中國智造CIO在線峰會
即日-2025.8.1
立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
精彩回顧
立即查看>> 【限時免費下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案

一周熱點月點擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報告

人工智能獵頭職位更多

高級軟件工程師廣東省/深圳市
自動化高級工程師廣東省/深圳市
光器件研發(fā)工程師福建省/福州市
銷售總監(jiān)（光器件）北京市/海淀區(qū)
激光器高級銷售經(jīng)理上海市/虹口區(qū)
光器件物理工程師北京市/海淀區(qū)
激光研發(fā)工程師北京市/昌平區(qū)
技術(shù)專家廣東省/江門市
封裝工程師北京市/海淀區(qū)
結(jié)構(gòu)工程師廣東省/深圳市

掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯

x

_*文字標題：

_*糾錯內(nèi)容：

聯(lián)系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網(wǎng)安備 44030502002758號

<i id="voyaf"></i>

<menuitem id="voyaf"><input id="voyaf"></input></menuitem><dd id="voyaf"></dd>