2017年7月6日 星期四

菜鳥筆記:從資料的生命之旅,看開放政府的「透明」機制有哪些環節

前陣子因為參與 民主深化在臺灣?!系列講座&研討會 開始接觸開放政府議題,在某網兇的循循善誘下,終於累積一些初步的心得。最近和臉友閒聊時順手整理了一下其中跟開放資料相關的部分,然後發現自己跟別人解釋時還蠻常引用這份整理的,所以就貼一份上來部落格,比較不會不見。

講座照片。左二:「如果你們要打起來的話,我想先換位子。(設計對白)」

問:

前陣子 open government 議題圈 業力引爆 ,這些人的怨氣,來自哪裡?

答:


你看喔,一份資料從產生到開放的生產鏈上,有幾個關卡:

首先,如果資料內容牽涉到民眾的個資,會遇到隱私保護的議題,在這一關,需要決定個資的去識別化要到什麼程度,不同的去識別化程度會有什麼風險,如何取得個資擁有者的授權,可否 opt out 等。在資料釋出前不處理這一關的話,就是將來有受害者出現時要處理。(e.g. 因為擁有某些罕見的特質,被人利用不同來源的去識別化資料集反推肉搜)

再來,會遇到數位化的問題,比方說,台灣公務革新力量聯盟粉專有講過目前的電子公文其實有很多是紙本掃描成 pdf 儲存,如果要把這些公文的資料釋出,可以想見要做大量額外的文書工作,例如得先找到原本的 .doc / .odf 檔案、把各欄位的文字複製出來貼到某處,但公務員各有業務,怎麼擠得出時間做這些事情呢?所以在這一關,需要處理的是讓內部使用的資訊系統本身,盡可能可以身兼維護資料的系統,讓公務員正常作業的過程中就能自動產生結構化資料,而不是被長官或議員臨時索資的時候,才很苦命地用手工剪貼的方式撈資料。

接著,會遇到政府資訊公開的問題,很多時候對公部門來說,釋出越多資料其實對自己越不利,因為越容易被監督跟課責,台面下的官商勾結也越容易被抓包,但往往民間最需要的資料,就是公部門越不想釋出的資料。這種情況下,只能靠法律的強制性,這裡依靠的法源是政府資訊公開法,但前面說過,這法並沒有罰則,所以在真正利害交關的議題上起不了作用,所以綠盟才需要做透明足跡這種案子去把資料逼出來。要處理這個問題,就得要修法才行。

再接著,才是公開後的資料的格式要怎麼做、怎麼讓工程師們更好用的問題,這一層就是所謂的開放資料,所謂的五顆星。到這邊應該看得出來,對於前面三個步驟都已經到位的先進國家來說,處理這件事情,是很自然而然的發展。

然後,開放資料的更下游,才是這些資料怎麼做成 api,這邊要處理的,是決定政府要不要插手,該不該給民間專業的來做(例如 ronnywang 的 sheethub)以免與民爭利。

再更之後,才是 api 手冊怎麼寫的問題,也就是所謂的 open api。

從這個生產鏈應該可以看出,影響 data 品質的是在上游,也就是前面的步驟,而 api 相關的東西,是在末端的下游。

所以說 open gov 倡議的困難之處,就是有一堆東西感覺都很像,但對實際要推動的人來說,可是天差地遠。因此當政府沒有做前面「裏」的步驟,但拿後面「表」的步驟來宣傳的時候,一般人會覺得很棒、很進步,但巷子內的人會怒到不行。

以上是我剛入門到現在的心得,如果有講錯的話請樓下專業的來指正... XD

--
前後文脈絡詳本文的 臉書原始討論串