2.1 立法與框架方法
立法努力(例如GDPR嘅前身)旨在規範數據使用。技術上,好似OpenPDS呢類框架提議將數據保留喺用戶度,只分享計算結果,而唔係原始數據。OAuth呢類認證協議仍然依賴集中式權威機構。
我哋正目睹數據生成同收集嘅爆炸性增長,前所未有。全球數據嘅一大部分係近期產生嘅,好似Facebook呢類實體就積累咗PB級嘅個人資訊。雖然呢啲數據推動創新同經濟增長,但亦導致咗控制權嘅高度集中,以及相應嘅個人私隱侵蝕。監控同安全漏洞事件凸顯咗現行模式嘅脆弱性,即係由第三方囤積同控制敏感個人數據。本文認為,根本問題在於架構——集中式架構本質上容易遭到濫用同破壞。本文要解決嘅核心問題係:我哋點樣重新設計個人數據管理嘅架構,將擁有權同控制權歸還俾個人?
Facebook嘅個人數據收集量(約300 PB)估計係美國國會圖書館200多年收藏量嘅100倍。
私隱挑戰一直從多個角度被應對,每個角度都有其固有嘅權衡。
立法努力(例如GDPR嘅前身)旨在規範數據使用。技術上,好似OpenPDS呢類框架提議將數據保留喺用戶度,只分享計算結果,而唔係原始數據。OAuth呢類認證協議仍然依賴集中式權威機構。
呢啲技術包括:
比特幣引入咗區塊鏈——一個去中心化、不可篡改、可公開驗證嘅帳本。佢喺冇中央銀行嘅情況下解決咗「雙重支付」問題。呢個證明咗可信、可審計嘅計算喺一個最小化信任嘅環境中係可能嘅。隨後嘅「比特幣2.0」項目開始探索區塊鏈喺非金融應用上嘅潛力,標誌住佢作為通用信任層嘅可能性。
核心論點: 本文嘅主要貢獻係構思同設計一個將區塊鏈嘅去中心化信任結合個人數據管理嘅系統。佢提議將區塊鏈唔係用作數據存儲(咁樣會效率低且唔私隱),而係作為一個自動化存取控制管理器同審計日誌。
系統有兩個主要組成部分:
區塊鏈維護一個防篡改嘅記錄,記載邊個可以喺乜嘢條件下存取邊啲數據。當一個服務想查詢用戶數據時,佢必須提交一個請求,並根據區塊鏈上記錄嘅權限進行驗證。用戶嘅客戶端軟件可以根據呢啲不可變嘅規則自動批准或拒絕存取。
同比特幣唔同,呢個系統中嘅交易($T_x$)帶有指令性負載:
協議定義咗用戶($U$)、區塊鏈($B$)同數據請求者($R$,例如服務提供商)之間嘅交互。
描述: 一個順序圖會說明上述三步協議。欄位標題:用戶客戶端、區塊鏈網絡、鏈下存儲、數據請求者。箭頭顯示:1) 將帶有哈希值同策略嘅 Store Tx 發送到區塊鏈;2) 將 Access Grant Tx 發送到區塊鏈;3) 從請求者到用戶客戶端嘅查詢請求;4) 從用戶客戶端到區塊鏈嘅權限檢查;5) 從鏈下存儲到用戶客戶端嘅數據檢索;6) 喺用戶客戶端上進行計算;7) 結果發送回數據請求者。關鍵視覺要點係原始數據同計算從未離開用戶嘅控制;只有權限同哈希值公開喺區塊鏈上。
系統依賴標準公鑰密碼學。每個用戶都有一個密鑰對 $(PK_U, SK_U)$。數據用對稱密鑰 $K_{data}$ 加密,而 $K_{data}$ 本身再用用戶嘅公鑰加密:$E_{PK_U}(K_{data})$。存取策略可以編碼為區塊鏈上嘅智能合約或更簡單嘅腳本。一個策略 $P$ 可能係一個布林函數 $P(R, Q, t) \rightarrow \{True, False\}$,用於評估請求者身份 $R$、查詢類型 $Q$ 以及時間 $t$ 等上下文數據。
對比集中式模型(Facebook/Google): 呢個系統根本上係對立嘅,提倡去中心化而非集中化,用戶控制而非企業控制。對比私隱保護技術(FHE、差分私隱): 呢啲係互補工具,可以喺呢個架構內使用(例如,對查詢結果應用差分私隱)。本文提供咗治理框架;而呢啲技術則為框架內嘅計算提供數學私隱保證。
本文正確指出呢個只係開始。未來方向包括:
核心見解: Zyskind、Nathan 同 Pentland 於2015年發表嘅論文唔只係另一個區塊鏈應用;佢係數字自主權嘅基礎架構藍圖。佢正確識別咗Web 2.0時代嘅核心缺陷——將數據託管同數據擁有權混為一談——並提出使用區塊鏈作為不可變權利帳本進行職責分離嘅激進方案。呢種遠見早於歐盟GDPR(2018年)同「自主權身份」概念嘅主流採納。論文嘅精妙之處在於佢務實地避免將數據存儲喺鏈上,呢個係許多早期項目犯過嘅幼稚錯誤,佢早喺可擴展性三難困境成為普遍討論之前就已經預見到。
邏輯流程與優勢: 論證邏輯嚴密:1) 集中式數據控制已失效(由漏洞同濫用證明)。2) 比特幣展示咗去中心化、可信嘅共識。3) 因此,將該共識層應用於管理數據存取權限,而非數據本身。咁樣創造咗一個可驗證、不可否認嘅同意歷史——一個按設計嘅「GDPR合規引擎」。該模型優雅地避開咗鏈上數據存儲嘅性能噩夢,同時利用咗區塊鏈嘅核心優勢:為狀態轉換(邊個可以存取乜嘢)提供單一真相來源。
缺陷與關鍵矛盾: 然而,論文嘅願景直面前沿嘅持久實踐同哲學矛盾。首先,可用性與安全性悖論:密鑰管理對普通用戶嚟講係一場災難,持續嘅加密貨幣損失就係證明。其次,不可變性與被遺忘權嘅衝突:存取授權嘅不可變帳本根本上同數據刪除要求相衝突,呢個問題而家嘅項目試圖用複雜嘅密碼學技術(例如用於策略撤銷嘅零知識證明)解決。第三,其模型假設用戶客戶端係一個可信、永遠在線嘅計算節點——一個主要嘅脆弱點。正如IEEE安全與私隱研討會嘅研究經常強調,端點安全仍然係最弱嘅一環。
可行見解與遺產: 儘管存在呢啲矛盾,論文嘅遺產係巨大嘅。佢直接啟發咗Tim Berners-Lee嘅Solid項目(旨在通過讓用戶將數據存儲喺「pods」中來去中心化網絡),並支撐住W3C去中心化身份標準嘅哲學。對於企業嚟講,可行嘅見解係唔好將呢個視為全面替代,而係作為高敏感數據共享場景(例如醫療記錄、金融KYC)嘅互補控制層。未來在於混合架構,好似呢類系統管理來源同同意,而私隱增強計算(好似Dwork等人嘅開創性差分私隱工作中描述嘅)喺安全飛地中進行。呢篇論文係一個火花;佢點燃嘅火仍然喺度燃燒,塑造緊從數據封建主義到以用戶為中心嘅數字經濟嘅痛苦但必要嘅轉變。
場景: 一位病人Alice想參與由「GenomicsLab」進行嘅醫學研究,同時保留對其原始基因組數據嘅控制權。
提議框架嘅應用: