翻譯|使用教程|編輯:況魚杰|2020-08-31 11:12:49.123|閱讀 483 次
概述:本文將會(huì)介紹一些Minitab統(tǒng)計(jì)規(guī)程中的一些最常見的錯(cuò)誤,這些錯(cuò)誤涉及從分析結(jié)果中得出錯(cuò)誤的結(jié)論。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
Minitab Statistical Software是一款無與倫比的可視化統(tǒng)計(jì)分析軟件,它會(huì)審視當(dāng)前及過往的數(shù)據(jù),以找出趨勢(shì)并預(yù)測(cè)規(guī)律、發(fā)現(xiàn)變量之間隱藏的關(guān)系、可視化數(shù)據(jù)交互作用并識(shí)別重要因素,從而解答最棘手的問題、應(yīng)對(duì)最嚴(yán)峻的難題。
本文將會(huì)介紹一些Minitab統(tǒng)計(jì)規(guī)程中的一些最常見的錯(cuò)誤,這些錯(cuò)誤涉及從分析結(jié)果中得出錯(cuò)誤的結(jié)論。
在比較多個(gè)均值時(shí),有時(shí)建議統(tǒng)計(jì)從業(yè)人員比較置信區(qū)間的結(jié)果并確定區(qū)間是否重疊。如果兩個(gè)獨(dú)立總體的均值的95%置信區(qū)間不重疊,則均值之間確實(shí)存在統(tǒng)計(jì)學(xué)上的顯著差異(顯著性水平為0.05)。但是,情況不一定 相反。 CI可能會(huì)重疊,但均值之間可能存在統(tǒng)計(jì)上的顯著差異。
舉個(gè)例子:
兩個(gè)重疊的95%置信區(qū)間在95%置信度水平上可能會(huì)顯著不同。
t檢驗(yàn)P值的意義是什么?在這種情況下,P值小于0.05(0.049 <0.05),這告訴我們平均值之間存在統(tǒng)計(jì)差異(但CI的重疊程度很大)。
利用統(tǒng)計(jì)數(shù)據(jù),我們可以分析一個(gè)小的樣本來推斷整個(gè)人口。但是在某些情況下,您應(yīng)該避免對(duì)樣本不代表的總體進(jìn)行推斷:
為避免這些情況,請(qǐng)?jiān)诓蓸忧岸x總體,并采取能真正代表總體的樣本。
它有時(shí)會(huì)被過度使用,但是在處理統(tǒng)計(jì)信息時(shí),“相關(guān)性并不意味著因果關(guān)系”是一個(gè)很好的提醒。兩個(gè)變量之間的關(guān)聯(lián)并不意味著一個(gè)變量會(huì)引起另一個(gè)變量的變化,特別是如果關(guān)聯(lián)統(tǒng)計(jì)是您在數(shù)據(jù)分析中使用的唯一統(tǒng)計(jì)時(shí)。
例如,數(shù)據(jù)分析顯示襯衫尺寸和鞋子尺寸之間有很強(qiáng)的正相關(guān)性。隨著襯衫尺寸的增加,鞋子的尺寸也隨之增加。這是否意味著穿大襯衫會(huì)使您穿大鞋子?當(dāng)然不是!這里可能還有其他“隱藏”因素在起作用,例如身高。 (高個(gè)子的人傾向于穿更大的衣服和鞋子。)
查看此散點(diǎn)圖,該散點(diǎn)圖顯示HIV抗體假陰性率與患者年齡相關(guān):
這是否表明HIV抗體測(cè)試不適用于老年患者?也許會(huì) …
但是,您不能止步于此,并假設(shè)僅僅因?yàn)榛?者年齡較大,才是導(dǎo)致他們獲得假陰性測(cè)試結(jié)果的因素(假陰性是指患者在測(cè)試中測(cè)試為陰性,但被確認(rèn)具有這種病)。
讓我們深入一點(diǎn)。在下面,您可以看到患者的年齡和有風(fēng)險(xiǎn)的暴露與測(cè)試之間經(jīng)過的天數(shù)是相關(guān)的:
老年患者的檢測(cè)速度更快……在HIV抗體能夠完全發(fā)育并顯示出陽(yáng)性檢測(cè)結(jié)果之前。
閱讀媒體上公布的許多研究中的某些內(nèi)容時(shí),請(qǐng)牢記“相關(guān)性并不意味著因果關(guān)系”的想法。不論有意還是無意,媒體經(jīng)常暗示一項(xiàng)研究已經(jīng)揭示了某種因果關(guān)系,即使該研究的作者精確地詳述了他們研究的局限性。
重要的是要記住,使用統(tǒng)計(jì)數(shù)據(jù),我們可以發(fā)現(xiàn)統(tǒng)計(jì)上的顯著差異,在“現(xiàn)實(shí)世界”中沒有明顯的影響。換句話說,僅僅因?yàn)榇嬖诓町惒⒉灰馕吨町愔匾6夷赡軙?huì)浪費(fèi)大量時(shí)間和金錢來嘗試“校正”無統(tǒng)計(jì)學(xué)意義的重大差異。
假設(shè)您喜歡Tastee-O的谷物。制造工廠的他們使用自動(dòng)測(cè)量系統(tǒng)在灌裝線的末端稱重每個(gè)谷物盒。假設(shè)每個(gè)班次裝滿18,000箱,目標(biāo)裝填重量為360克,標(biāo)準(zhǔn)偏差為2.5克。
使用統(tǒng)計(jì)數(shù)據(jù),工廠可以在90%的時(shí)間內(nèi)檢測(cè)到0.06克的平均填充重量偏移。但是,僅因?yàn)?.06克偏移具有統(tǒng)計(jì)意義,并不意味著它具有實(shí)際意義。 0.06克的差異可能相當(dāng)于兩到三個(gè)Tastee-O,不足以吸引您,客戶,注意或關(guān)心。
在大多數(shù)假設(shè)檢驗(yàn)中,我們知道原假設(shè)并不完全正確。在這種情況下,我們不希望平均填充重量精確地為360克-我們只是在嘗試查看是否存在有意義的差異。代替假設(shè)檢驗(yàn),谷物制造商可以使用置信區(qū)間來查看差異可能有多大,并決定是否需要采取措施。
在假設(shè)檢驗(yàn)中,您將構(gòu)成原假設(shè)(H0)和替代假設(shè)(H1)。然后,您可以收集數(shù)據(jù),對(duì)其進(jìn)行分析,并使用統(tǒng)計(jì)信息來評(píng)估數(shù)據(jù)是否支持替代假設(shè)。如果p值大于0.05,則表示“沒有足夠的證據(jù)可以得出H5為0.05 /顯著性水平”。
換句話說,即使我們沒有足夠的證據(jù)支持替代假設(shè),原假設(shè)也可能是正確的,也可能不是。
例如,可以擲3次公平硬幣并進(jìn)行測(cè)試:
H0:正面比例= 0.40
H1:正面比例≠0.40
在這種情況下,保證p值大于0.05。因此,不能得出H1。但是不能得出H1并不能證明H0是正確或正確的!這就是為什么說“未能拒絕”原假設(shè),而不是“接受”原假設(shè)的原因。
Minitab是做質(zhì)量分析的工具,不知道您是否有產(chǎn)品質(zhì)量這方面的困擾呢?不妨試試產(chǎn)品質(zhì)量分析及預(yù)測(cè)方案吧!點(diǎn)擊咨詢在線客服
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn
文章轉(zhuǎn)載自:minitab