增加網址:
文章備註、標題(會記錄下來,但是暫時不會顯示):
[綜合]無題 無名 ID:YEgxRrQE 16/10/06(四)23:32:12 No.8341010
評分:0, 年:0, 月:0, 週:0, 日:0, [+1 / -1] 最後更新:2016-10-06 23:55:02
附圖
信度是指一致性、可靠性
效度是指正確性、精確性

如果以智力測驗來舉例的話
信度:一群成績好的學生,於測驗的題目的時候,
   結果都能顯示其智商達到高標
效度:題目的問法有助於測量,成績好的學生是否屬於高智商

請問我這樣解釋是對的嗎?
無題 無名 ID:IZJsLw8I 16/10/06(四)23:39:02 No.8341039
文組跟理組最大的差別在於
定義新概念時都不用數學作輔助
搞得最後一堆指標性的東西通通混淆在一起
講白點就是蹉跎時間浪費生命
很多事情吵半天繞了一大圈結果出在定義不同而已
無題 無名 ID:D/65fNLQ 16/10/06(四)23:42:47 No.8341056
信度應該是一對多結果趨近於一致
>主詞A一群成績好的學生,受辭B於測驗的題目的時候,
結果都能顯示其智商達到高標
你說同一群學生做一次相同考題嗎? 那代表這考題的效度高
能分辨出優秀學生
>效度:題目的問法有助於測量,成績好的學生是否屬於高智商
你說的這樣算引導式問法要怎麼分辨 不懂?
無題 無名 ID:vsVMHVKc 16/10/06(四)23:42:47 No.8341057
我覺得是這樣
智商測驗的信度:出來的IQ是否能夠符合標準差的定義(也就是說受測群體夠大的時候,標準差仍然維持在15)

效度:智商是否能真的反應學習能力
成績太單向了,應該不是智商想反應的東西
無題 無名 ID:YEgxRrQE 16/10/06(四)23:59:21 No.8341211
先感謝各位島民的回答!感恩!

信度所指的一致性
是不是說,這份測驗的內容,只要針對智商高的學生,
都能測出一定的分數?

例如A、B、C、D四位優秀學生,做該智力測驗時,
得到的分數都一致落在120~130分。

而效度則是指
這份測驗內容有助於篩選智商高的優秀學生
無題 無名 ID:wvY0ROiQ 16/10/07(五)00:03:10 No.8341239
int a,b;
if( a==b )
{
printf("信度")
}

double c,d;
const double acc = 0.000001;
if( fabs(c-d) < acc )
{
printf("效度")
}
無題 無名 ID:wbNQIp6Y 16/10/07(五)00:04:34 No.8341251
附圖
無本文
無題 無名 ID:b5/Cr6QY 16/10/07(五)00:08:38 No.8341272
>A、B、C、D四位優秀學生,做該智力測驗時,
得到的分數都一致落在120~130分。

ABCD算變動因子吧
通常的問題是多筆問券都拿給同一個人寫
而得到的結果會趨近一致 代表設計的問券的信度很高
你這樣未確認變動因子的穩定性造成的誤差值會偏高
無題 無名 ID:wbNQIp6Y 16/10/07(五)00:08:10 No.8341274
爛一點的比喻是

信度是你的槍口有沒有對準到目標

效度是子彈打出去會不會射到你瞄準的地方
無題 無名 ID:kJfNOll6 16/10/07(五)00:09:31 No.8341277
信度:
指的是測驗的穩定度,例如一學生考一張考卷第一天考87分,第二天也考87分,則代表此測驗具有再測信度(相同題目做2次時,分數會差不多),反例則像是部分民調一堆牆頭草。除再測信度外,還有復本信度、內部一致性信度等...。

效度:指得是該測驗是否真的能夠測出所需要的能力,例如把數學考題的應用題題目用一長串文言文來寫,則無法有效測出低分的人是否數學不好抑或題目看不懂。

信度跟效度都有分許多種類,在此就不詳述了 :3
無題 無名 ID:ZbrX9COs 16/10/07(五)00:27:24 No.8341368
附圖
感恩、感恩!我瞭解了!

還好有問島民
不然自己在讀的時候一直鬼打牆
多謝島民!!
無題 無名 ID:kJfNOll6 16/10/07(五)00:31:12 No.8341380
借用No.8341251靶圖

圖一:有信度但沒效度(手很穩可是打不到目標)
圖二:沒有信度也沒效度(手不穩...當然打不中目標囉)
圖四:兼具效度及信度(手很穩而且能打中目標)

圖三就不確定了 (信度有,但不是很夠?)
另外:圖二很好的說明了沒有信度就不會有效度的理由
無題 無名 ID:N6ubbk4k 16/10/07(五)00:37:38 No.8341402
一看就是要考社會行政的
無題 無名 ID:b5/Cr6QY 16/10/07(五)00:39:08 No.8341407
信度就是你的精準度
打中限縮的範圍越小代表信度越高
圖一可能中的都那區塊但很多在同一區塊的靶外
結果中靶數只有55/100

效度就是你射出去的子彈有多少打中靶
99/100那你的效度超高
但可能打中的區塊不穩導致最後分數很低如圖二

第三個我覺得就是對比 畫的不夠好

最後一個是神槍手 中的次數多分數又高
無題 無名 ID:kJfNOll6 16/10/07(五)00:39:52 No.8341409
教檢教甄也要 G_G
無題 無名 ID:ptKdgjhM 16/10/07(五)00:42:07 No.8341412
看英文
原來信度=可靠度阿(Reliable)
在統計品管上我們叫可靠度
無題 無名 ID:sta38Iz. 16/10/07(五)00:42:36 No.8341413
回覆: >>8341461
文組最智障的不就是把直觀的東西弄得很複雜
只為了讓自己看起來很博學w
雖然現在理工組也一樣
把簡單的理論衍伸研究弄得很複雜
搞得自己的研究好像牽扯一堆重大理論
最奇怪的是硬要自己想一堆莫名其妙的專有名詞
無題 無名 ID:hBjdObZM 16/10/07(五)00:46:23 No.8341426
附圖
你要做問卷喔
教你喔
我自己架問卷系統
用fb認證
有了一部分的真人之後
在去撈id生測試資料
fake了整個實驗數據
本來只有2X人來實驗
因為我用了魔法,新增了三千人
這個實驗走向就符合了信度
但是效度要怎麼來,你要讓資料的噪點增加
也就是要隨機亂數產生亂填寫的啊
故意填低分的,許多接近極端但不是極端的資料
知道原理之後,你會發現效度和信度都是自由心證
要做,都能fake出來
無題 無名 ID:kJfNOll6 16/10/07(五)00:56:43 No.8341461
>>>No.8341413

沒辦法,如果不用專有名詞或先解釋文內詞語意義的話會產生許多漏洞與誤解,不是做研究的人全都喜歡咬文嚼字:3
無題 無名 ID:RDWMruQ6 16/10/07(五)01:02:20 No.8341476
回覆: >>8341503
信度:同一批人考很多次名次排序都差不多
效度:名次高的真的是你定義中的高智力族群

高信度低效度:每次考都是智障考得最好
高效度低信度:每次考得最好的那批都很聰明,但都是不同批人

這兩個概念科學上比較常稱為精度與準度
無題 無名 ID:kJfNOll6 16/10/07(五)01:12:26 No.8341503
>>>No.8341476
高效度低信度:每次考得最好的那批都很聰明,但都是不同批人

厄...求理論來源,或是大師準備開創高效度低信度的理論,台灣之光(´・_・`)
無題 無名 ID:RDWMruQ6 16/10/07(五)01:21:32 No.8341524
回覆: >>8341545
高效度低信度(高準度低精度)是存在的
以那張靶圖來說,第二張圖就是高效度低信度
子彈打得很亂,但是如果你多打幾發並取平均
會發現平均點剛好在靶中心
這就是高效度低信度

以數學一點的方式來說
就是統計的誤差很大,但是整體趨勢是對的
如果你衝高取樣數把誤差降低,那始終還是能得到對的答案
而低信度低效度則是不只誤差很大無法得到確切答案,平均起來看也是錯的

最後
那張靶圖上都寫了圖二是Valid but not Reliable
你自己發明一套理論說那個叫沒效度也沒信度麻煩不要出來誤導別人
無題 無名 ID:RDWMruQ6 16/10/07(五)01:26:02 No.8341536
補充
當你在打靶時,打到的點平均起來在中心並不是理所當然的
你要真的知道靶在哪並且去瞄準才可能讓平均點打在中心
如果你矇著眼隨便亂打,中心也會隨便亂飛(飛到靶圖外)
所以那張看起來好像很爛、毫無意義的靶圖
其實是要花一段心力去瞄準才能打得那麼平均、才能都打到靶上
只是槍爛導致你打不中正中心而已
無題 無名 ID:b5/Cr6QY 16/10/07(五)01:29:16 No.8341545
>No.8341524
https://yamol.tw/item-28.+%E8%AB%8B%E5%95%8F%E4%B8%8B%E8%BF%B0%E4%BD%95%E8%80%85%E6%98%AF%E9%8C%AF%E8%AA%A4%E7%9A%84%EF%BC%9F++(A)%E4%BF%A1%E5%BA%A6%E4%BD%8E%EF%BC%8C%E6%95%88%E5%BA%A6%E4%B8%80%E5%AE%9A%E4%BD%8E+(B)%E6%95%88%E5%BA%A6%E9%AB%98%EF%BC%8C%E4%BF%A1%E5%BA%A6%E4%B8%80..-79495.htm

畢竟都中靶了也比0分強 所以信度也相對高 你說那張圖少了圈外所以你才有這種誤解
無題 無名 ID:kJfNOll6 16/10/07(五)01:32:16 No.8341552
No.8341524

所以圖二照你的信效度與準精度類比論來囉

第二張圖射得很準囉 真是受教了(´・_・`)
無題 無名 ID:RDWMruQ6 16/10/07(五)01:40:18 No.8341567
回覆: >>8341627
對,很準
整個學界都這樣定義
就你一個文組廢物自創理論說不準
因為你不懂得用數學角度去分析準度的本質
而只憑自己的直覺認知眼前的假象

中靶位置平均起來是中心點,你到現在還不知道這有多重要的意義
你可以自己去畫個靶然後自己丟丟看,你會發現你不管怎麼丟都沒辦法讓平均進中心
因為你菜逼巴不會丟靶,你丟不準
只有丟得很準的老手才能丟得出一個平均點在中心的靶圖

另外一個想法
如果你只看得到那些黑點,而看不到後面的靶
你有沒有辦法從黑點正確推斷出靶中心在哪?
圖一跟三都不行,因為他沒效度
圖四理所當然可以
而圖二,你只要把那些黑點平均,你就抓得到靶中心
這就叫做準度
學界定義的準度,而不是你自創的理論
無題 無名 ID:CDP8QIP6 16/10/07(五)01:47:50 No.8341590
文組不會想去理解人家為什麼這樣分
同樣都射不中靶心
透過分析理解我們能夠了解問題出在哪 才知道如何去解決
而不像智障文組
看到沒中靶只會說:

你會不會丟阿 下來啦!
(此案例可套用在各種鄉愿智障現象上)
無題 無名 ID:RDWMruQ6 16/10/07(五)02:00:44 No.8341626
附圖
那兩個文組廢物好像看不懂靶圖上的英文
所以我還是翻譯一下好了
(明明是文組卻看不懂英文,科科)

>>效度不要求每次測量都得到近似的結果,而信度要
>>一個測量有信度不一定就有效度,反之亦然
無題 無名 ID:kJfNOll6 16/10/07(五)02:00:46 No.8341627
>>>No.8341567

看來你還是沒搞懂,我就直接講明好了,我根本沒說精準度是錯的,而是信效度跟你說的精準度用途不同。

舉例來說,將靶的中心為考試所能測出想要的能力(ex:數學測驗測數學能力),愈往圈外則是愈測不出所要的能力(要測數學能力結果文章很難讀),請問這樣還像你說的用準確度精確度多打幾發平均起來?

https://www.ptt.cc/bbs/Statistics/M.1443593611.A.A3A.html

串內有人問為什麼要搞一堆專有名詞?就是因為會發生這種情況阿(´・_・`)
無題 無名 ID:RDWMruQ6 16/10/07(五)02:13:33 No.8341654
>>請問這樣還像你說的用準確度精確度多打幾發平均起來?
如果一種考試,對同一批人考多次
蠢蛋偶爾會賽到爆高分,但平均分數還是低分
聰明人偶爾會連環錯爆低分,但平均分數還是高分
這就叫高準度低精度、高效度低信度

你那個PTT裡面
doomx查到的說法是精度=信度
celestialgod查一般字典認為那兩個詞意義不同
但學界定義本來就會跟日常用法不同,所以查字典沒有意義
(如同靶圖二,一般對話一定說他不準,但他準度就是高)
kerwinhui沒有提出任何佐證,空口說白話認為兩者不同
andrew43查維基百科對於精度與信度的說明,認為兩者相同
yhliu也說在統計裡差不多,除非你要扯到工程
無題 無名 ID:RDWMruQ6 16/10/07(五)02:15:10 No.8341656
回覆: >>8341693
然後你無視那三個把學界定義的「精度」與「信度」拿來討論的人
選擇相信拿日常定義的「精準的」與「可靠的」來討論的查日常字典跟口說無憑的人

所以我說
文組,就是廢物
無題 無名 ID:kJfNOll6 16/10/07(五)02:32:45 No.8341693
>>>No.8341656
你說的精確度、準確度理論沒有問題,而且也不是討論的重點。
http://albert1225.pixnet.net/blog/post/41394304-%E7%B2%BE%E5%AF%86%E5%BA%A6(precision)%E8%88%87%E6%BA%96%E7%A2%BA%E5%BA%A6(accuracy)

但問題是:
效度(Validity)即有效性,它是指測量工具或手段能够準確測出所需測量的事物的程度。
準確度(accuracy)是每一次獨立的測量之間,其平均值與已知的數據真值之間的差距(與理論值相符合的程度)。

兩者不一樣的用途你卻一直硬要湊再一起才是問題所在,還是說開串的人在問準確度精密度?
無題 無名 ID:b5/Cr6QY 16/10/07(五)02:33:14 No.8341694
回覆: >>8341709
你別一直承諾升高看了就可憐 考題是騙不了人的 有問題一堆專家早就砲了
無題 無名 ID:kJfNOll6 16/10/07(五)02:41:52 No.8341709
>>>No.8341694
謝謝妳贊同我的說法,不過我想這樣的理由說服不了他,地方的RDWMruQ6需要理論與實證:3
無題 無名 ID:KFebEkvI 16/10/07(五)02:53:56 No.8341722
回覆: >>8341734
附圖
原po讓整個綜合的水準都降低了
配合點發粗乃玩費雯好ㄇ?
無題 無名 ID:RDWMruQ6 16/10/07(五)03:00:03 No.8341733
回覆: >>8341768
如果你覺得靶圖上的文字與維基百科不叫理論與實證的話
那我也沒辦法

我剛稍微認真估狗了一下
發現這個問題眾說紛紜
有些人認為可以有效度沒信度,有些人認為不行
同樣的一張靶圖,有些人認為那是Valid but not Reliable
有些人則認為是Low Validity and low Reliability
(精度與準度叫Precision and Accuracy,R跟V確定是信效度)

我想這應該就是答案了:根本沒有共識,外面有兩派人各執己見

當然我會繼續相信認為那沒效度的人是不懂得取平均的文組廢物
正如同你們文廢會繼續相信我是錯的
無題 無名 ID:NvTs3yEk 16/10/07(五)03:01:42 No.8341734
回覆: >>8341739
>No.8341722
我寧願整版都這種文 也不要看那種智障廢文
無題 無名 ID:ep3POuEM 16/10/07(五)03:05:44 No.8341739
回覆: >>8341748
>No.8341734
同意 不過我一直以為這應該是要在綜合學術板出現的文
無題 無名 ID:NvTs3yEk 16/10/07(五)03:16:31 No.8341748
附圖
>No.8341739
學術島不是叫假的 話題對了要戰四處都行
只是越來越少看到了
無題 無名 ID:RDWMruQ6 16/10/07(五)03:29:06 No.8341758
附圖
http://gzone-anime.info/UnitedSites/academic/pixmicat.php?res=184017
綜合學術續戰

好吧,不是續戰
我已經接受了「沒有共識」這個答案
只是想看看那邊還有沒有其他高見
這個議題不是綜合的串的存活時間內可以討論得完的
無題 無名 ID:ep3POuEM 16/10/07(五)03:30:28 No.8341759
不過說真的
雖然我不討厭這類文出現在綜合 但總覺得有點可惜
明明挺有內容的 卻會很快被洗掉 還好現在是半夜
多少可以留久一點

既有學到新知 又能看人秀下限 這類好串真希望能多一點阿
無題 無名 ID:kJfNOll6 16/10/07(五)03:44:08 No.8341768
>>>No.8341733
可能有點誤會 我這句:「地方的RDWMruQ6需要理論與實證。」指的是需要用理論與實證說服你。

詞彙的解釋可能正如你所說的:要嘛分為兩派各持己見,要嘛是有人用錯詞彙沒想到積非成是。

不過在實際的用法上一種如你說的,上下左右的偏移平均起來後落點在中央,在槍枝的調教上這樣的結果是高準確度,低精密度
https://zh.wikipedia.org/zh-tw/%E6%BA%96%E7%A2%BA%E8%88%87%E7%B2%BE%E5%AF%86

但開串者問的是測驗統計,在這之中:
信度指的是學生每次考試的分數都會落在差不多的位置中,並不是考高分就等於有信度,就這點而言與精密度雷同(不管有沒有設到靶心,集中在一起就是了)。
--(P1)--
無題 無名 ID:kJfNOll6 16/10/07(五)03:47:29 No.8341769
而效度則是這個測驗的內容是否真的能測到施測者所想測出來的能力。
例如職業能力測驗要測出你在未來工作上的表現,如果有人考了高分卻工作情況不理想責這份測驗沒有效度,需要重編測驗。
並不會因為工作不理想的人多了就能被平均成具有工作能力。

--(P2)--
無題 無名 ID:RDWMruQ6 16/10/07(五)03:53:59 No.8341774
回覆: >>8341783
>>詞彙的解釋可能正如你所說的:要嘛分為兩派各持己見,要嘛是有人用錯詞彙沒想到積非成是。
當積非成是的人佔了約一半的比例時
各持己見就是客觀事實
這兩個狀況並不是二選一

如果你要繼續跟我戰哪派才是積非成是那也OK
但是你就別拿其他人的使用狀況當佐證
因為那些在我眼中就是那一半的積非成是之一
正如你大概覺得寫維基百科那頁的人是積非成是

一個四張一組的靶圖
有人說是兩種獨立性質乘開,2*2=4
有人說是有效度有信度+有信度沒效度+低信度低效度+沒信度沒效度
不管怎樣我都不可能認同後者是正確的
那套理論明明靶圖應該就只有三張,為什麼會有第四張標上很奇怪的文字?
答案只有一個可能:後者是拿前者做的圖亂掰的
無題 無名 ID:RDWMruQ6 16/10/07(五)04:05:53 No.8341782
>>例如職業能力測驗要測出你在未來工作上的表現,如果有人考了高分卻工作情況不理想
則這個樣本測試失敗
如同一發子彈沒打中靶心
但單一一個個案不能代表什麼
就算是高信度高效度的測試也偶爾會有幾個失敗樣本

如果追蹤每個做了測試的人的工作情況
發現高分群的實績平均起來就是比低分群好
即使高分群裡有些實績很爛的、低分群裡有些實績很好的
你也可以認為這份測試是有效的、可用的
你依照這份測試去分派工作,可以預期得到比不做測試更好的結果
即使你不能完全信任測試結果,但測試還是具有他的效果
無題 無名 ID:kJfNOll6 16/10/07(五)04:10:34 No.8341783
>>No.8341774

沒錯,一開始在我測驗統計的認知中也只有三張靶圖 所以我才說看不太懂圖3

關於靶圖的問題,有沒有可能只是原本就2兩個相似但不同的理論系統(工業用的精度準度(4張圖)、測驗統計用的信度效度(3張圖)同樣用了靶圖作為例子,之後後人因兩者相似最後混淆用詞?

體力不支,無力續戰(倒
無題 無名 ID:kJfNOll6 16/10/07(五)04:19:26 No.8341785
一回完又看到 救命RRR

所謂信效度並非達到1才能使用,基本上測驗統計數據要達到信度1、效度1在自然情況下不太可能發生
例如在這職業測驗之中效度0.8
代表10個高分的人8個工作績效好 2個不理想
10個低分的人8個不理想,2個績效好
至於效度要多高才算得上是有效測驗,則會依所欲測得的項目不一樣而不同
例如記憶性題目通常效度要求高
而情意態度取向的題目通常效度要求較低(人心難測阿 :3
無題 無名 ID:RDWMruQ6 16/10/07(五)04:21:59 No.8341787
附圖
另一個問題:效度的數值如何定義?

精度與準度有非常明確的數學定義
可以扎扎實實地算出數字來比較
而這套定義具有怎樣的性質也清清楚楚

信效度有一派認為直接對應到精準度
另一派則認為有所不同
前者可以直接拿精準度的數學定義套用到信效度上
而後者不行
然而我卻找不到任何後者那派自行定義的、不能相容高效度低信度的效度算法

一個沒有辦法算出值來的性質,意義何在?
做統計的人能接受這樣的東西存在嗎?
無題 無名 ID:RDWMruQ6 16/10/07(五)04:30:49 No.8341791
回覆: >>8341799
>>例如在這職業測驗之中效度0.8
>>代表10個高分的人8個工作績效好 2個不理想
有趣
話才剛講就看到一個有數字的例子

在這個例子、這個定義下
信度低會讓效度的數字往中間靠攏
信度不達到100%效度確實就不會真的達到100%
但那是因為職業測試這例子導致的
是你做統計的對象的性質導致了效度<信度,而不是因為效度本身的性質

你用成功與否的零和判斷來做統計
成功則1、失敗則0,兩者都是邊界值,做平均只會越來越偏離邊界
然而打靶的例子,成功則座標為0,失敗則正很多或負很多
沒有邊界值,可以把正負的抽樣結果抵銷,做平均就會接近成功值
無題 無名 ID:kJfNOll6 16/10/07(五)04:41:39 No.8341799
>>No.8341791

再繼續就要天亮了,我直接推薦書目吧
<教育概論-下冊>陳嘉陽 2014 教甄策略研究中心

至於精度準度我就沒有專書了,我對它的認知僅有在網路上隨手找的一些資料而已(當然了,網路資訊正確度世界第一,你懂得)x_x

如果有專業的出版物能解決這串的戰點就太好了呢 ;3

真的要睡啦!!