Prophet:Facebook 簡(jiǎn)單高效的時(shí)間序列模型
3.1 趨勢(shì)模型
首先是趨勢(shì)模型 g(t)。
在 Prophet 算法里,趨勢(shì)模型有兩個(gè)選擇,一個(gè)是基于飽和增長(zhǎng)模型 (saturating growth model),另一個(gè)是基于分段線性函數(shù) (piecewise linear model)。
3.1.1 飽和增長(zhǎng)模型
Prophet 使用如下形式的飽和增長(zhǎng)模型:
其中,C 為承載能力(如可上網(wǎng)人數(shù)、可處理事件等),k 為增長(zhǎng)率,m 為偏移參數(shù)。
當(dāng) C=1,k=1,m=0 時(shí)就是大家常見的 Sigmoid 函數(shù)的形式。
在現(xiàn)實(shí)生活中,承載能力、增長(zhǎng)率和偏移參數(shù)并不是一成不變的,所以作者將其轉(zhuǎn)換為隨時(shí)間變化的函數(shù):
除此之外,現(xiàn)實(shí)中的時(shí)間序列其走勢(shì)也不是不變的,在某些特定的時(shí)候會(huì)發(fā)生改變,這就需要用戶去研究變點(diǎn)檢測(cè) (change points)。
在 Prophet 中,變點(diǎn)的位置是需要設(shè)置的,每一段的趨勢(shì)和走勢(shì)也會(huì)隨著變點(diǎn)的設(shè)置而改變。目前有兩種方法去設(shè)置變點(diǎn),一種是人工指定的方式,另一種是通過(guò)算法來(lái)自動(dòng)選擇。
假設(shè)現(xiàn)在有 S 個(gè)變點(diǎn),變點(diǎn)的時(shí)間戳為
,
,
每個(gè)變點(diǎn)都會(huì)出現(xiàn)增長(zhǎng)率的變化 。如果初始增長(zhǎng)率為 k 的話,那么時(shí)間戳 t 上的增長(zhǎng)率為:
其中
為指示函數(shù):
一旦初始增長(zhǎng)率 k 確定,那么偏移參數(shù) m 也會(huì)隨之確定。
既然是分段函數(shù),我們也需要處理好分段邊界:
所以分段邏輯回歸模型為:
此外我們含有一個(gè)重要參數(shù) C(t),該參數(shù)需要用戶根據(jù)市場(chǎng)規(guī)模來(lái)進(jìn)行調(diào)整。
3.1.2 分段線性模型我們?cè)賮?lái)看一下分段線性函數(shù),根據(jù)
給出基本模型:
其中 k 表示增長(zhǎng)率,
表示增長(zhǎng)率的變化量,m 為偏移參數(shù),
值得注意的是,分段線性函數(shù)并沒有表示承載能力的
參數(shù)。
3.1.3 序列中的變點(diǎn)變點(diǎn)可以由分析師人工設(shè)定,相應(yīng)的參數(shù)有變點(diǎn)的位置、個(gè)數(shù)、增長(zhǎng)的變化率。
當(dāng)然,也可以根據(jù)候選對(duì)象進(jìn)行自動(dòng)選擇。自動(dòng)選擇主要是利用了先驗(yàn)知識(shí)
,參數(shù)
控制模型變換的靈活性,當(dāng)
趨于 0 時(shí),增長(zhǎng)函數(shù)將蛻變?yōu)?Logistic 函數(shù)或者線性函數(shù)。默認(rèn)情況下,Prophet 會(huì)在時(shí)間序列前 80% 的范圍里,通過(guò)等份的方法找到 25 個(gè)變點(diǎn),而變點(diǎn)的增長(zhǎng)率滿足 Laplace 分布
3.1.4 趨勢(shì)預(yù)測(cè)現(xiàn)在,歷史 T 個(gè)數(shù)據(jù)點(diǎn)中有 S 個(gè)變點(diǎn),且對(duì)應(yīng)的增長(zhǎng)率的變化量服從
,但預(yù)測(cè)未來(lái)也需要考慮未來(lái)的變點(diǎn)位置。
作者通過(guò)歷史數(shù)據(jù)推斷出方差,從而替換
來(lái)模擬未來(lái)的速率變化。在一個(gè)完全貝葉斯框架下,可以通過(guò)先驗(yàn)知識(shí)來(lái)獲得它的后驗(yàn)概率,或者我們也可以用最大似然估計(jì)來(lái)評(píng)估速率尺度參數(shù):
。
未來(lái)變點(diǎn)位置將通過(guò)隨機(jī)抽樣的方法使變點(diǎn)的平均頻率與歷史數(shù)據(jù)相匹配:
因此,我們保證了未來(lái)和歷史具有相同平均頻率和變點(diǎn)變化率,從而衡量預(yù)測(cè)未來(lái)趨勢(shì)中的不確定性,一旦從數(shù)據(jù)中推斷出了 λ ,我們便可以使用生成模型來(lái)模擬未來(lái)可能的趨勢(shì),并使用模擬的趨勢(shì)來(lái)計(jì)算不確定區(qū)間。
3.2 季節(jié)性模型
季節(jié)性(這里指周期性)是大部分時(shí)間序列都會(huì)考慮其中的,因?yàn)闀r(shí)間序列通常會(huì)隨著天、周、月、年等的變化而呈現(xiàn)周期性變化。為了擬合和預(yù)測(cè)這些數(shù)據(jù),作者制定了季節(jié)模型。
作者利用傅立葉級(jí)數(shù)來(lái)提供一個(gè)靈活的周期性影響:
其中,P 為周期(一年 P=365.25,一個(gè)星期 P=7);N 為經(jīng)驗(yàn)所得(年 N=10,周N=3)。
我們另傅立葉級(jí)數(shù)的參數(shù)為
,則可以用這個(gè)來(lái)構(gòu)造一個(gè)季節(jié)性向量矩陣。
例如當(dāng) N=10 時(shí):
季節(jié)項(xiàng)表示為:
作者用標(biāo)準(zhǔn)化
對(duì)參數(shù)
進(jìn)行初始化, σ 為可設(shè)置參數(shù),值越大,季節(jié)效應(yīng)越明顯;值越小,季節(jié)效應(yīng)越不明顯。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
推薦專題
- 1 【一周車話】沒有方向盤和踏板的車,你敢坐嗎?
- 2 特斯拉發(fā)布無(wú)人駕駛車,還未迎來(lái)“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 6 馬斯克致敬“國(guó)產(chǎn)蘿卜”?
- 7 神經(jīng)網(wǎng)絡(luò),誰(shuí)是盈利最強(qiáng)企業(yè)?
- 8 比蘋果偉大100倍!真正改寫人類歷史的智能產(chǎn)品降臨
- 9 諾獎(jiǎng)進(jìn)入“AI時(shí)代”,人類何去何從?
- 10 Open AI融資后成萬(wàn)億獨(dú)角獸,AI人才之爭(zhēng)開啟
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市