All Projects → shevajia → Taiwanreferendum

shevajia / Taiwanreferendum

2018台灣公投結果中的不合理數據

Projects that are alternatives of or similar to Taiwanreferendum

Woe And Iv
Stars: ✭ 109 (-0.91%)
Mutual labels:  jupyter-notebook
Prisma abu
用机器学习做个艺术画家-Prisma
Stars: ✭ 109 (-0.91%)
Mutual labels:  jupyter-notebook
Nvidia Gpu Tensor Core Accelerator Pytorch Opencv
A complete machine vision container that includes Jupyter notebooks with built-in code hinting, Anaconda, CUDA-X, TensorRT inference accelerator for Tensor cores, CuPy (GPU drop in replacement for Numpy), PyTorch, TF2, Tensorboard, and OpenCV for accelerated workloads on NVIDIA Tensor cores and GPUs.
Stars: ✭ 110 (+0%)
Mutual labels:  jupyter-notebook
Hass Data Detective
Explore and analyse your Home Assistant data
Stars: ✭ 109 (-0.91%)
Mutual labels:  jupyter-notebook
Ml Da Coursera Yandex Mipt
Machine Learning and Data Analysis Coursera Specialization from Yandex and MIPT
Stars: ✭ 108 (-1.82%)
Mutual labels:  jupyter-notebook
Spark R Notebooks
R on Apache Spark (SparkR) tutorials for Big Data analysis and Machine Learning as IPython / Jupyter notebooks
Stars: ✭ 109 (-0.91%)
Mutual labels:  jupyter-notebook
Isl Python
Solutions to labs and excercises from An Introduction to Statistical Learning, as Jupyter Notebooks.
Stars: ✭ 108 (-1.82%)
Mutual labels:  jupyter-notebook
Hgn
Hierarchical Gating Networks for Sequential Recommendation
Stars: ✭ 110 (+0%)
Mutual labels:  jupyter-notebook
Alexnet Experiments Keras
Code examples for training AlexNet using Keras and Theano
Stars: ✭ 109 (-0.91%)
Mutual labels:  jupyter-notebook
Kubeflowdojo
Repository to hold code, instructions, demos and pointers to presentation assets for Kubeflow Dojo
Stars: ✭ 110 (+0%)
Mutual labels:  jupyter-notebook
Street to shop experiments
Stars: ✭ 108 (-1.82%)
Mutual labels:  jupyter-notebook
Nb pdf template
A more accurate representation of jupyter notebooks when converting to pdfs.
Stars: ✭ 109 (-0.91%)
Mutual labels:  jupyter-notebook
Densecap
Dense image captioning in Torch
Stars: ✭ 1,469 (+1235.45%)
Mutual labels:  jupyter-notebook
Histbook
Versatile, high-performance histogram toolkit for Numpy.
Stars: ✭ 109 (-0.91%)
Mutual labels:  jupyter-notebook
Leetcode Course
A guide to crushing tech interviews.
Stars: ✭ 110 (+0%)
Mutual labels:  jupyter-notebook
Simple mf
Simple but Flexible Recommendation Engine in PyTorch
Stars: ✭ 109 (-0.91%)
Mutual labels:  jupyter-notebook
Credit score
data from the kaggle 'give me some credit" competition
Stars: ✭ 109 (-0.91%)
Mutual labels:  jupyter-notebook
Gtc2019 Numba
Numba tutorial for GTC2019
Stars: ✭ 109 (-0.91%)
Mutual labels:  jupyter-notebook
Sklearn
Data & Code associated with my tutorial on the sci-kit learn machine learning library in python
Stars: ✭ 110 (+0%)
Mutual labels:  jupyter-notebook
Mtcnn
MTCNN face detection implementation for TensorFlow, as a PIP package.
Stars: ✭ 1,689 (+1435.45%)
Mutual labels:  jupyter-notebook

簡述

剛剛看到yutin1987上傳的2018台灣公投的所有開票所的結果,出於對資料的手癢,就立即下載下來跑了分析。不跑不知道,一跑嚇一跳。通過初步的描述分析就可以發現,中選會公佈的有些開票所的結果出現了明顯不合理的數據!

廢話不多說,直接上結果。

首先,這是所有公投案之間的散點圖。可以看到,與鄉鎮層級的結果不同的是,在每張圖上,垂直和水平方向都出現了不少的觀測值,這是不合常理的。

我們隨便看看其中的一張。

我一開始以為是極端值特有的屬性,但是看到下面這張圖,就發現有些開票結果是明顯有問題的。這是第14案vs第15案的散點圖。我們知道這兩案都是平權方提出的,兩案的開票結果應該是高度正相關的。在絕大多數的開票所,結果也確實是高度正相關。但是,散點圖也顯示,有不少的奇怪的觀測值出現在圖的正上方和正右方。若仔細看這些極端值的話,他們在兩個公投案的結果上是負相關的!

畫上兩條線後,一目了然!兩條斜度是1和-1的斜線可以完美地貫穿所有的觀測值。+1斜線附近的觀測值是正常的。-1斜線附近的觀測值是不正常的,在這些開票所,有一案的公投結果應該是報反了!

我們可以直接在中選會的網站上找到這些開票所的結果。例如,以南投縣中寮鄉0373開票所為例。下面是兩案結果的鏈接:

http://referendum.2018.nat.gov.tw/pc/zh_TW/08/10008000800000373.html

http://referendum.2018.nat.gov.tw/pc/zh_TW/09/10008000800000373.html

我們可以看到,14案和15案的結果是相反的。隨便再舉一例:高雄市三民區0943開票所。

http://referendum.2018.nat.gov.tw/pc/zh_TW/08/64000000500000943.html

http://referendum.2018.nat.gov.tw/pc/zh_TW/09/64000000500000943.html

這些結果都是明顯不合理的。

結論:中選會公佈的公投案結果有重大瑕疵。投票中少數人因為看不懂公投題目投反了是有可能的,但是一整個投票所所有人都投反了,這是難以用常理解釋的。雖然出問題的投票所應該不是很多,當不會影響總體的結果。經過我進一步的檢驗(見更新3),應該可以基本斷定,是中選會的系統內出現了故障,造成了全國接近1%(見更新2)的投票所的結果報反,這應該是個不小的事故。

疑問 1

不合理的結果並不僅僅是出現在第14、15案,下面是第7、8案的散點圖。

為什麼所有的極端值都出現在一條水平和一條垂直線上?左邊的極端值可以用一條-1斜線完美貫穿,也就是說那些投票所的結果應該也是有一案報反了,但是我無法解釋上面和下面的極端值。

報反的案例:桃園市八德區370。

http://referendum.2018.nat.gov.tw/pc/zh_TW/01/68000000800000370.html

http://referendum.2018.nat.gov.tw/pc/zh_TW/02/68000000800000370.html

更新 1

有幾個問題可以立即回答。首先,中選會公佈的全國總的開票數結果是否等於各投開票結果之和呢?

答案:是!以下是各投開票所結果之和,與中選會公佈的總開票結果完全一致。也就是說,不僅僅是網站報錯了,中選會的原始數據就是錯的。

同意票數 不同意票數
案件
第10案 7658008 2907429
第11案 7083379 3419624
第12案 6401748 4072471
第13案 4763086 5774556
第14案 3382286 6949697
第15案 3507665 6805171
第16案 5895560 4014215
第7案 7955753 2109157
第8案 7599267 2346316
第9案 7791856 2231425

更新 2

那麼,結果報反的投票所有多少呢?如果把-1斜線附近的投票所都抓出來的話(詳情見代碼),以下為統計結果。可以看到,絕大多數的報反的案例出現在第14、15案,有141個,佔全國投票所數量的0.89%。這141個投票所的投票數為93306,佔全國總投票數的0.9%,對總的投票結果的影響應該不大。

第7、8案 第8、9案 第10、11案 第14、15案 合集
不合理結果數量 23 19 12 141 184

這裡是所有有疑問的結果。

更新3

雖然我很難想出有什麼正常的原因讓一個投票所所有的人在14、15案上面都投反,但還是不能排除我的想像力有限。為了確保我的結論是正確的,我又做了進一步的檢驗。思路是這樣的,有很多投票所的地址是相同的,如果一間投票所的結果是反的,那麼同地址的其他投票所的結果也是反的嗎?我找出了所有14、15案投反的投票所的地址,並找出了和這些投票所地址相同的其他投票所,以下是其他投票所結果的散點圖。這些結果大部分都在+1斜線附近,也就是說,這些結果都是正常的。

隨便舉個例子,嘉義市東區新店里林森東路346號有兩個投票所,分別在嘉義市東區林森國小一年甲班教室和一年乙班教室,選民都來自同一個里,只是街牌號不同。我們可以看到,19號開票所的兩案結果是一致的,20號開票所的結果是相反的。所以,應該不是有什麼神奇的里長可以有扭轉乾坤之力。

案件 縣市 鄉鎮市區 編號 投開票所 地址 同意票數 不同意票數 有效票數 無效票數 投票數 已領未投票數 發出票數 用於票數 投票權人數 投票率(%) 有效同意票數對投票權人數百分比(%) 有效不同意票數對投票權人數百分比(%) 有效同意與不同意票數對投票權人數百分比差值
地址
嘉義市東區新店里林森東路346號 第14案 嘉義市 東區 新店里 2,6-9,15,18,19 19 嘉義市東區林森國小(一年甲班教室) 嘉義市東區新店里林森東路346號 296 547 843 48 891 0 891 667 1558 57.19% 19.00% 35.11% -16.11
嘉義市東區新店里林森東路346號 第14案 嘉義市 東區 新店里 10-14 20 嘉義市東區林森國小(一年乙班教室) 嘉義市東區新店里林森東路346號 181 411 592 30 622 1 623 439 1062 58.57% 17.04% 38.70% -21.66
嘉義市東區新店里林森東路346號 第15案 嘉義市 東區 新店里 2,6-9,15,18,19 19 嘉義市東區林森國小(一年甲班教室) 嘉義市東區新店里林森東路346號 316 528 844 46 890 0 890 668 1558 57.12% 20.28% 33.89% -13.61
嘉義市東區新店里林森東路346號 第15案 嘉義市 東區 新店里 10-14 20 嘉義市東區林森國小(一年乙班教室) 嘉義市東區新店里林森東路346號 406 188 594 30 624 0 624 438 1062 58.76% 38.23% 17.70% 20.53

再舉個例子:

案件 縣市 鄉鎮市區 編號 投開票所 地址 同意票數 不同意票數 有效票數 無效票數 投票數 已領未投票數 發出票數 用於票數 投票權人數 投票率(%) 有效同意票數對投票權人數百分比(%) 有效不同意票數對投票權人數百分比(%) 有效同意與不同意票數對投票權人數百分比差值
地址
臺北市松山區敦化北路2號 第14案 臺北市 松山區 敦化里 1-7,12-13 629 敦化國小1年1班 臺北市松山區敦化北路2號 345 476 821 30 851 1 852 600 1452 58.61% 23.76% 32.78% -9.02
臺北市松山區敦化北路2號 第14案 臺北市 松山區 敦化里 8-10,20-24 630 敦化國小1年2班 臺北市松山區敦化北路2號 319 486 805 38 843 7 850 632 1482 56.88% 21.52% 32.79% -11.27
臺北市松山區敦化北路2號 第14案 臺北市 松山區 敦化里 16,25-28,30 631 敦化國小1年3班 臺北市松山區敦化北路2號 321 523 844 35 879 0 879 581 1460 60.21% 21.99% 35.82% -13.83
臺北市松山區敦化北路2號 第14案 臺北市 松山區 敦化里 11,14-15,17-19,29 632 敦化國小1年4班 臺北市松山區敦化北路2號 309 459 768 41 809 0 809 589 1398 57.87% 22.10% 32.83% -10.73
臺北市松山區敦化北路2號 第15案 臺北市 松山區 敦化里 1-7,12-13 629 敦化國小1年1班 臺北市松山區敦化北路2號 349 465 814 23 837 12 849 603 1452 57.64% 24.04% 32.02% -7.98
臺北市松山區敦化北路2號 第15案 臺北市 松山區 敦化里 8-10,20-24 630 敦化國小1年2班 臺北市松山區敦化北路2號 338 481 819 29 848 0 848 634 1482 57.22% 22.81% 32.46% -9.65
臺北市松山區敦化北路2號 第15案 臺北市 松山區 敦化里 16,25-28,30 631 敦化國小1年3班 臺北市松山區敦化北路2號 329 512 841 31 872 7 879 581 1460 59.73% 22.53% 35.07% -12.54
臺北市松山區敦化北路2號 第15案 臺北市 松山區 敦化里 11,14-15,17-19,29 632 敦化國小1年4班 臺北市松山區敦化北路2號 464 297 761 48 809 0 809 589 1398 57.87% 33.19% 21.24% 11.95
Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].