C&R Tree全稱是Classification and Regression Tree,即分類及回歸樹(shù),它是由美國(guó)斯坦福大學(xué)和加州大學(xué)伯克利分校的Breiman等人于1984年提出的,從名稱中不難理解,它包含了分類樹(shù)和回歸樹(shù),分類樹(shù)用于目標(biāo)變量是分類型的,回歸樹(shù)用于目標(biāo)變量是連續(xù)型的。
IBM SPSS Statistics 最新版本 24.0, 它是世界上最早的統(tǒng)計(jì)分析軟件,由美國(guó)斯坦福大學(xué)的三位研究生Norman H. Nie、C. Hadlai (Tex) Hull 和 Dale H. Bent于1968年研究開(kāi)發(fā)成功,算算到現(xiàn)在已經(jīng)有48年的歷史了。
作為 IBM 分析與預(yù)測(cè)解決方案的重要組成部分,IBM SPSS Modeler 是一組數(shù)據(jù)挖掘工具,通過(guò)這些工具可以采用商業(yè)技術(shù)快速建立預(yù)測(cè)性模型,并將其應(yīng)用于商業(yè)活動(dòng),從而改進(jìn)決策過(guò)程。
對(duì)于決策樹(shù)算法來(lái)說(shuō),核心技術(shù)就是如何確定最佳分組變量和分割點(diǎn),上次我們介紹的CHAID是以卡方檢驗(yàn)為標(biāo)準(zhǔn),而今天我們要介紹的C5.0則是以信息增益率作為標(biāo)準(zhǔn),所以首先我們來(lái)了解下信息增益(Gains),要了解信息增益(Gains),先要明白信息熵的概念。
大家是不是有這樣的習(xí)慣,每天早上起床第一件事,先看看天氣預(yù)報(bào),天氣的好壞,可能會(huì)影響我們一天的工作、生活、或者身體的狀態(tài)。對(duì)于某些行業(yè)來(lái)說(shuō),比如零售業(yè),天氣的好壞也隨時(shí)影響著他們的營(yíng)業(yè)情況。天氣信息對(duì)我們來(lái)說(shuō)非常重要,對(duì)企業(yè)也一樣,那么今天就教大家如何獲取真實(shí)有效的天氣數(shù)據(jù),來(lái)輔助我們的業(yè)務(wù)分析。
經(jīng)過(guò)國(guó)稅、 地稅的長(zhǎng)期建設(shè), 兩者都在稅務(wù)監(jiān)管方面積累了多年的數(shù)據(jù), 過(guò)去簡(jiǎn)單的統(tǒng)計(jì)分析已經(jīng)滿足不了客戶增長(zhǎng)的需求, 全 國(guó)各地已經(jīng)開(kāi)始步入稅務(wù)預(yù)測(cè)分析的時(shí)期。
本文主要通過(guò)運(yùn)用 IBM SPSS Modeler 中 C5.0 節(jié)點(diǎn)所具有的特殊算法對(duì)電信客戶的屬性特征進(jìn)行分析,得出流失客戶的基本特征,以幫助企業(yè)管理者對(duì)該類客戶的行為特性進(jìn)行預(yù)警分析,采取針對(duì)性的措施改善客戶關(guān)系,避免客戶流失或者挽留客戶,達(dá)到亡羊補(bǔ)牢的效果。
商業(yè)保險(xiǎn)公司希望通過(guò)分析以往的固定資產(chǎn)保險(xiǎn)理賠案例,能夠預(yù)測(cè)理賠金額,借以提高其服務(wù)中心處理保險(xiǎn)理賠業(yè)務(wù)的速度和服務(wù)質(zhì)量,并降低公司運(yùn)營(yíng)風(fēng)險(xiǎn)。業(yè)界領(lǐng)先的預(yù)測(cè)分析軟件 IBM SPSS Statistics 提供了強(qiáng)大的線性回歸分析功能,能夠有效地解決此類問(wèn)題。本文結(jié)合該商業(yè)實(shí)例介紹了線性回歸模型的基本概念,以及使用 Statistics 進(jìn)行線性回歸分析,解決該商業(yè)問(wèn)題的基本步驟和方法。
全球某知名大型汽車制造商需要能管理和分析由車載診斷工具,通過(guò)慧都的大力支持,促成與IBM合作,部署IBM SPSS 數(shù)據(jù)和文本挖掘軟件,使整個(gè)BMW Group的工作效率和競(jìng)爭(zhēng)力進(jìn)一步大幅度提升,在市場(chǎng)獲得極高的評(píng)價(jià)。
本文要介紹的預(yù)測(cè)分析模型是“關(guān)聯(lián)規(guī)則模型”,我們將為大家簡(jiǎn)要介紹關(guān)聯(lián)規(guī)則的理論,然后結(jié)合 IBM SPSS Modeler 產(chǎn)品為大家詳細(xì)講述如何利用關(guān)聯(lián)規(guī)則模型來(lái)解決客戶的具體商業(yè)問(wèn)題——如何優(yōu)化超市商品的擺放以提高銷量。