原創(chuàng)|行業(yè)資訊|編輯:陳俊吉|2016-07-28 09:44:18.000|閱讀 335 次
概述:SPSS Modeler 是一個(gè)數(shù)據(jù)挖掘工作臺(tái),提供了一個(gè)可了解數(shù)據(jù)并生成預(yù)測(cè)模型的最先進(jìn)的環(huán)境。Streams 提供了一個(gè)可伸縮的高性能環(huán)境,對(duì)不斷變化的數(shù)據(jù)進(jìn)行實(shí)時(shí)分析,在實(shí)時(shí)處理需要高級(jí)分析時(shí),使用Streams和SPSS集成,實(shí)現(xiàn)實(shí)時(shí)評(píng)分預(yù)測(cè)。實(shí)時(shí)應(yīng)用預(yù)測(cè)分析的用例的示例包括網(wǎng)絡(luò)安全、銀行和信用卡欺詐檢測(cè)、預(yù)測(cè)性維護(hù),以及實(shí)時(shí)營(yíng)銷產(chǎn)品。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
是一個(gè)數(shù)據(jù)挖掘工作臺(tái),提供了一個(gè)可了解數(shù)據(jù)并生成預(yù)測(cè)模型的最先進(jìn)的環(huán)境。Streams 提供了一個(gè)可伸縮的高性能環(huán)境,對(duì)不斷變化的數(shù)據(jù)進(jìn)行實(shí)時(shí)分析,這些數(shù)據(jù)中包括傳統(tǒng)結(jié)構(gòu)的數(shù)據(jù)和半結(jié)構(gòu)化到非結(jié)構(gòu)化數(shù)據(jù)類型。
在實(shí)時(shí)處理需要高級(jí)分析時(shí),使用Streams和SPSS集成,實(shí)現(xiàn)實(shí)時(shí)評(píng)分預(yù)測(cè)。實(shí)時(shí)應(yīng)用預(yù)測(cè)分析的用例的示例包括網(wǎng)絡(luò)安全、銀行和信用卡欺詐檢測(cè)、預(yù)測(cè)性維護(hù),以及實(shí)時(shí)營(yíng)銷產(chǎn)品。
SPSS Analytics Toolkit for Streams
SPSSScoring operator
SPSSScoring operator實(shí)現(xiàn)在Streams應(yīng)用中使用預(yù)定義的SPSS的預(yù)測(cè)模型進(jìn)行評(píng)分預(yù)測(cè),它假設(shè)預(yù)測(cè)模型已經(jīng)在SPSS Moduler定義好并通過SPSS Solution Publisher導(dǎo)出這三個(gè)文件:
SPSSScoring 代碼例子
stream<DataSchemaPlus> scorer = com.ibm.spss.streams.analytics::SPSSScoring(data) { param pimfile: getThisToolkitDir() +"/etc/PimParXml/model.pim"; parfile: getThisToolkitDir() +"/etc/PimParXml/model.par"; xmlfile: getThisToolkitDir() +"/etc/PimParXml/model.xml"; modelFields: "sex","income"; streamAttributes: s_sex, baseSalary+bonusSalary; output scorer: income = fromModel("income"), predLabel = fromModel("$C-beer_beans_pizza"), confidence = fromModel("$CC-beer_beans_pizza"); }
SPSSPublish operator
SPSSPublish operator 自動(dòng)“發(fā)布”的一個(gè)模型文件的評(píng)分分支并總結(jié)所生成的文件,以便下游的Operator可以通過“分布”操作所創(chuàng)建或更新的PIM、PAR和XML文件,刷新他們的評(píng)分標(biāo)準(zhǔn)實(shí)施。通常情況下,SPSSPublish operator配合上游的DirectoryScan 或 SPSSRepository operator,及下游的SPSSScoring operator,即:
DirecoryScan/SPSSRepository -> SPSSPublish -> SPSSScoring
其中DirectoryScan 或 SPSSRepository operator檢測(cè)到有新的模型文件可用,就將新模型的文件名發(fā)生個(gè)SPSSPublish operator。SPSSPublish的下游通常是SPSSSoring。當(dāng)SPSSPublish獲取到新模型,它就會(huì)生成SPSSSoring所需的PIM、PAR和XML文件,然后發(fā)生通知給SPSSSoring,通知也新的模型可用了。SPSSScoring收到通知后會(huì)刷新內(nèi)部模型。
SPSSPublish代碼例子:
stream<rstring strFilePath> strFile = DirectoryScan(){ param directory : "/tmp"; pattern : "newmodel.str"; ignoreExistingFilesAtStartup : true; config placement : host(P1); } stream<rstring fileName> notifier = com.ibm.spss.streams.analytics::SPSSPublish(strFile){ param sourceFile: "newmodel.str"; targetPath: "/tmp"; config placement : host(P1); } stream<DataSchemaPlus> scorer = com.ibm.spss.streams.analytics::SPSSScoring(data;notifier) { param pimfile: getThisToolkitDir() +"/etc/PimParXml/model.pim"; parfile: getThisToolkitDir() +"/etc/PimParXml/model.par"; xmlfile: getThisToolkitDir() +"/etc/PimParXml/model.xml"; modelFields: "sex","income"; streamAttributes: s_sex, baseSalary+bonusSalary; output scorer: income = fromModel("income"), predLabel = fromModel("$C-beer_beans_pizza"), confidence = fromModel("$CC-beer_beans_pizza"); config placement : host(P1); }
SPSSRepository operator
SPSSRepository operator監(jiān)視部署在SPSS Collaboration and Deployment Services庫(kù)的對(duì)象的變化。當(dāng)被監(jiān)控的對(duì)象發(fā)生變化,相關(guān)通知?jiǎng)t會(huì)發(fā)給所有的Listener。收到通知,SPSSRepostory會(huì)從Repostory下載該對(duì)象的新版本文件并將文件寫到目標(biāo)目錄,這步操作成功之后,SPSSRepostory再提交描述文件已更新的事件給下游Operator。
Streams + 的參考架構(gòu)
根據(jù)前面對(duì)SPSS Analytics Toolkit的功能描述,Streams + SPSS的參考架構(gòu)可以由下圖表示:
小結(jié)
本文通過對(duì)SPSS Analytics Toolkit和這些Toolkit與Streams集成參考架構(gòu)的描述,為讀者呈現(xiàn)了如何使用業(yè)界最好的數(shù)據(jù)挖掘工具SPSS和流數(shù)據(jù)分析平臺(tái)Streams進(jìn)行實(shí)時(shí)評(píng)分和預(yù)測(cè)。
詳情請(qǐng)咨詢!
客服熱線:023-66090381
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn