新聞類別
副刊
詳情#
【明報文章】立法會選舉曲終人散,但是研究者另一波工作才剛展開,就是就結果作一分析,探討各陣營、政團的力量分佈、變化趨勢,進而窺視社會思潮走向。
其中一個常見的分析方法是集體數據分析,普遍使用的數據來自特區政府公布的票站點票結果。部分研究者也會把其他地區性變數納入分析,例如該區人口的性別、年齡、住屋類型等分佈,以推估參選名單的主要支持者來源。
此種分析方法的好處是數據可靠、成本較低、方便快捷等。但是它面對的局限也不容忽視。其中一個局限是集體資料分析結果未必跟個體情况相符。道理其實不難明白,假設某票站有100名選民並全都投票,當中佔大多數的為40名年輕選民。某張名單在該票站取得40%的選票,遠高於它於其他票站取得的選票比率,而其40票均來自年輕選民以外的其他年齡層選民。然而若然未有留意個體資料情况,而只是以該票站有較多年輕選民,以及某張參選名單的得票率較突出,進而指出該張名單的支持者主要來自年輕選民,那麼集體資料分析結果便跟個體實際情况並不相符。事實上,早於1950年學者Robinson便提出此等「區位相關」(ecological correlations)問題,學界也對此種分析特別小心。
當然,筆者並非指有「區位相關」的風險便不應使用「區位推論」(ecological inference),只是當集體數據並非唯一資料來源時,研究者若然能引用其他個體數據分析,結果將更具說服力。事實上,香港大學民意研究計劃便在投票日進行票站調查(exit poll),並已釋出2008年及2012年的數據,這是研究者必須掌握的個體數據材料。
另外,集體數據分析可以讓我們了解各陣營的力量分佈、變化趨勢等,但是也有盲點。舉例而言,建制派與泛民主派於2012年立法會選舉中分別取得43%與56%的得票率,2016年則分別取得43%與55%的得票率(必須指出,有關得票率分佈可能因研究者的定義而異,但這裏只是舉例說明集體數據分析的盲點,定義並非重點,所以在此省略不提)。若研究者信納此結果,便會認為其實是次立法會選舉裏各陣營的力量分佈並無大變,進而可能預測日後選情走勢維持平穩的結論。
但是若然研究者把握個體數據,可能得出另一結論。舉例而言,研究者利用票站調查結果,並使用世代分析(cohort analysis),發現是次選舉中年輕世代的選民「一面倒」投票予泛民主派,而此情况較上屆立法會選舉的同一世代有進一步擴闊的趨勢,而兩大陣營力量維持過往格局,是因為建制派在其他世代尤其年長世代中擴大了支持力量,那麼研究者便預測世代交替對未來選舉結果帶來的重要影響。
個體數據難取得 是研究重大障礙
因此,若然要對選舉結果有全面系統性的分析,必須結合集體數據和個體數據,才能互相補足、消除盲點。可惜可靠、公開、詳細的個體數據,卻在香港難以取得,這也是香港選舉研究的重大障礙。反觀台灣方面早有政治學界跨校合作進行的大型面訪民調,名為「台灣選舉與民主化調查」(Taiwan's Election and Democratization Study, TEDS)。學者會深入探討問卷問題設計,並以嚴謹程序收集和整理數據,進而向社會釋出,為研究者提供很大的方便。這點是香港應該急起直追的。
作者是香港青年時事評論員協會秘書長
其中一個常見的分析方法是集體數據分析,普遍使用的數據來自特區政府公布的票站點票結果。部分研究者也會把其他地區性變數納入分析,例如該區人口的性別、年齡、住屋類型等分佈,以推估參選名單的主要支持者來源。
此種分析方法的好處是數據可靠、成本較低、方便快捷等。但是它面對的局限也不容忽視。其中一個局限是集體資料分析結果未必跟個體情况相符。道理其實不難明白,假設某票站有100名選民並全都投票,當中佔大多數的為40名年輕選民。某張名單在該票站取得40%的選票,遠高於它於其他票站取得的選票比率,而其40票均來自年輕選民以外的其他年齡層選民。然而若然未有留意個體資料情况,而只是以該票站有較多年輕選民,以及某張參選名單的得票率較突出,進而指出該張名單的支持者主要來自年輕選民,那麼集體資料分析結果便跟個體實際情况並不相符。事實上,早於1950年學者Robinson便提出此等「區位相關」(ecological correlations)問題,學界也對此種分析特別小心。
當然,筆者並非指有「區位相關」的風險便不應使用「區位推論」(ecological inference),只是當集體數據並非唯一資料來源時,研究者若然能引用其他個體數據分析,結果將更具說服力。事實上,香港大學民意研究計劃便在投票日進行票站調查(exit poll),並已釋出2008年及2012年的數據,這是研究者必須掌握的個體數據材料。
另外,集體數據分析可以讓我們了解各陣營的力量分佈、變化趨勢等,但是也有盲點。舉例而言,建制派與泛民主派於2012年立法會選舉中分別取得43%與56%的得票率,2016年則分別取得43%與55%的得票率(必須指出,有關得票率分佈可能因研究者的定義而異,但這裏只是舉例說明集體數據分析的盲點,定義並非重點,所以在此省略不提)。若研究者信納此結果,便會認為其實是次立法會選舉裏各陣營的力量分佈並無大變,進而可能預測日後選情走勢維持平穩的結論。
但是若然研究者把握個體數據,可能得出另一結論。舉例而言,研究者利用票站調查結果,並使用世代分析(cohort analysis),發現是次選舉中年輕世代的選民「一面倒」投票予泛民主派,而此情况較上屆立法會選舉的同一世代有進一步擴闊的趨勢,而兩大陣營力量維持過往格局,是因為建制派在其他世代尤其年長世代中擴大了支持力量,那麼研究者便預測世代交替對未來選舉結果帶來的重要影響。
個體數據難取得 是研究重大障礙
因此,若然要對選舉結果有全面系統性的分析,必須結合集體數據和個體數據,才能互相補足、消除盲點。可惜可靠、公開、詳細的個體數據,卻在香港難以取得,這也是香港選舉研究的重大障礙。反觀台灣方面早有政治學界跨校合作進行的大型面訪民調,名為「台灣選舉與民主化調查」(Taiwan's Election and Democratization Study, TEDS)。學者會深入探討問卷問題設計,並以嚴謹程序收集和整理數據,進而向社會釋出,為研究者提供很大的方便。這點是香港應該急起直追的。
作者是香港青年時事評論員協會秘書長
回應 (0)