轉帖|行業資訊|編輯:況魚杰|2020-05-11 15:57:16.737|閱讀 868 次
概述:在所有的可視化儀表板中,和時間相關的圖表是最常見的。除了最基本的折線圖外,我們還有很多方式來呈現和分析時間序列的數據。本文幫你掌握時間序列的基礎知識與常見的分析場景,讓你在用數據講故事時,更有自信。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
在所有的可視化儀表板中,和時間相關的圖表是最常見的。除了最基本的折線圖外,我們還有很多方式來呈現和分析時間序列的數據。本文幫你掌握時間序列的基礎知識與常見的分析場景,讓你在用數據講故事時,更有自信。
時間序列的模式(Time series patterns)
在開始探查分析前,我們需要先確定時間序列的模式。
常見的模式有:
很多時候時間序列會同時包含趨勢、季節以及周期性。
美國新建房屋銷售額表現出強烈的年度季節性,以及周期為 6~10 年的周期性。同時數據并沒有表現出明顯的趨勢性。
柏林的游客數據同時包含了趨勢性與季節性,即總的游客數量是穩步上升的,同時又有明顯的季節性。
為了更清楚的看到季節性的分布,我們可以將多年的數據對齊到以月的方式查看。
時間的粒度/級別
不借助外部儀器,人類的極限反應速度可以到 100 毫秒。在科學分析場景,如物理學,時間精度可以更高。
在商業分析場景,一般拿到的數據粒度會以:年、季度、月、周、日、小時 居多。細粒度的時間可以向上聚合到粗粒度的,比如:拿到的是去年每一天的銷售額數據,但作為年度的總結,只要看每個月的銷售額即可。
時間的連續與離散
連續的時間
等間距,一個接一個的。如3月1日、3月2日、3月3日、一直到 3月15日每天的數據。如果缺了某幾天的數據,在時間軸上仍然會保留對應的位置。
離散/序數的時間
假設我們想看一周中每天的銷售表現,這時可以從連續的時間中,提取出離散的周幾時間來進行分析。
在具體分析時,我們一般還會區分下工作日與周末,并分別看平均值。
帶著問題去分析
當前相比過去的變化
總結過去,展望未來。我們總是希望知道當前相比過去的變化。
以各個地區在過去幾年銷售額的變化為例,我們可以看到6個地區詳細到每個月的銷售額數據,但當我們想知道相比過去是否有增長或哪個地區的增長最快時,就沒法看清了。
這個時候,可以通過斜率圖(slopegraphs)來更好的分析與呈現,具體做法是只保留頭尾時間的數據,然后用折線圖來呈現,為了更容易發現上升下降,還可以用顏色來區分。
某個時間點前后的比較
從假設分析(What-If Analysis)的角度,我們會關心如果在某個時間點做了某個行動所帶來的收益。
以買房為例,我們會關心如果我在某個時間點買了房,那么截止到當前的漲幅變化,以及相比更早的時間的變化。
這個是紐約的房價變化圖,如果在 2012 年買入,那么到了 2017 時,會有 21% 的漲幅。而如果是在 2006 年的高點購入,則只有 6% 的漲幅。在做這樣的假設分析時,我們一般會允許用戶指定時間參數,以更靈活的分析前后的變化。
如何查看排名變化
相比過程本身,人們更容易關注結果。
假設我們有不同類別的商品在銷售,每年的銷售額穩步上升,除了關心具體的收入外,我們還想知道各個類別的排名變化。如果通過顏色來細分各個類別的銷售額,雖然也可以看出一些排名變化,但還是會不直觀。
這時我們可以先計算每年的銷售額排名,然后用排名變化圖(Bump Chart)來呈現。相比銷售額隨時間的大幅波動,排名變化圖可以讓你更好的聚焦于關心的點。
不同事件的增長速度
以玩具總動員三部曲為例,這3部電影發行于不同的年份,也都獲得了很高的收入。
如果只看累計的票房收入,我們可以知道第二部的表現最好。但如果我們想知道這幾部電影從首映日開始的增長變化或火爆程度就沒法看出了。
從這個圖上我們可以按周看發生在不同年份的,三部曲的每周票房收入。
更好的方式把時間對齊到一個公共基準點來查看分析,而不是查看一段絕對時間范圍的數據。按星期看自首映日開始的總收入,就更容易比較增長曲線了。
如何分析事件的持續時間
在項目管理的場景,一個項目會拆分為多個可以并行或有前后依賴關系的任務。
為了查看總的用時,以及同時進行的任務,我們可以用甘特圖(Gantt charts)來呈現和分析。這兒的 205 天是整個項目的用時。如果要算人天成本,可以把這兒的每個任務的用時加起來,即投入了 4 個人,總的人天是:292 。
與此同時可以撥打慧都熱線023-68661681或咨詢慧都在線客服,我們將幫您轉接BI專業團隊,并發送相關資料給您!
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn
文章轉載自:Tableau社區