快速了解「台灣社交距離 APP 」保護個資的原理

最近台灣本土疫情又升溫了,每天關注衛福部發布的確診者足跡、比對自己有沒有重疊,又成為一件保護自己、家人、朋友的重要大事。這款「台灣社交距離 APP是透過手機藍牙來檢測與別人之間的距離,如果不幸確診,APP 會通知曾與確診者有過長達2分鐘、2公尺內接觸的人。而且不會洩漏個資、沒有追蹤疑慮、做到民眾在意的保護隱私。究竟技術原理又是什麼呢?

「台灣社交距離 APP 」 想解決什麼問題?

一方面要回溯確診者本身足跡就有一定程度困難,另一方面民眾生活中就可能接觸到不特定風險人群,憑藉記憶回溯是否曾經和確診者在同一地點,甚至近距離接觸過,也是一大難點。

而台灣的超前部署真的很強,早在一年前衛福部就和台灣人工智慧實驗室合作,推出了「台灣社交距離 APP 」,為的就是解決這個問題。

但!為什麼這一年來都沒有在推廣使用呢?有2個原因:

  1. 台灣的疫情維持在一個穩定情況,沒有大力推廣的必要性。
  2. 當時外界對個資安全有疑慮、覺得可能有隱私隱憂,指揮中心經評估認為「在和民眾充分溝通前,暫不適合使用。」

AI 產品蒐集資料面臨的問題:「在和用戶充分溝通前,暫不適合使用」

AI 產品的基礎是數據,沒有數據,就只是一堆學術、實驗模型而已。可以說模型是骨頭,但數據是血肉,是讓機器得以學習、調整而成為更趨近人工智慧的重要元素。
所有的 AI 產品都會面臨:「數據怎麼來」的問題。而現階段用戶只要一碰到「蒐集跟自身相關數據」這個超級無敵敏感話題,心中就出現強大的抗性,而拒絕使用。於是產品即使做出來了,卻無法被使用,這是一件超級可惜的事情,也是 AI 產品開發的一大痛點。

延伸閱讀:AI 產品我踩過九個坑

「台灣社交距離 APP」又是如何處理的 – 原理

首先,從 APP Store 的介紹畫面中,就可以看到非常直白努力的在溝通隱私安全問題。

「台灣社交距離 APP 」技術原理是透過手機藍牙來檢測與別人之間的距離。而且不會洩漏個資、沒有追蹤疑慮、做到民眾在意的保護隱私

只是從一般人的角度,還是蠻難判斷究竟是不是真的「個資安全」。就讓宇鯨智能來一一解析:

當你是一般使用者時:

  1. 無需註冊
    • 代表不蒐集個人資料,僅蒐集「接觸史」資料。
  2. 使用手機之間「藍牙訊號」的強弱做「接觸史」判斷
    • 一般直覺作法會選擇紀錄 GPS 紀錄來做移動路徑判斷,但如果用這個數據,就能知道使用者的切確位置,而產生追蹤疑慮。而藍牙必須「近距離」才能發生資料互換,超過距離就無法發生。代表:
      1. 只有當2支手機在近距離內才能產生資料。
      2. 產生的資料只能知道「曾經靠很近」這個單一訊息,而無法知道地理位置、或其他了。所以安全。
  3. 資料去識別化
    • 去識別化的意思是,透過處理後,個人資料就無法直接或間接被拿來判斷具體是誰。所謂能知道具體是誰,就類似:當你知道住址、年齡、在該家庭的身份-例如爸爸,這3個資料後,就能知道在說的是XXX。但如果你只能知道可能是OOO or XXX or YYY,則代表這些資料並無法判斷具體對象了,也代表已經去識別化。
    • 而這個 APP 每15分鐘自動給手機一組隨機、不可回溯、無法還原的雜湊值( HashedID / 隨機 ID ),每次的 ID 都不同。概念上就是把一隻手機變成一堆無意義的 ID 。所以看了一堆 ID 也看不出來這到底是誰。
  4. 無任何資料上傳政府單位/開發單位,僅留存本機
    • 上面產生的那些本來就已經很稀少、而且就算被拿到也無個資意義的資料,全部都在使用者自己手上。就像是一堆在自家亂畫的塗鴉紙,也都存在你房間裡一樣,沒有人拿得到。
    • 雖然沒有在 APP 介紹畫面中提及,但因為保護個人隱私,使用者也無法查詢自己手機裡的資料。概念就是:不只沒出過你房間門,而且還被鎖在保險櫃裡,自己也拿不出來。
  5. 14天後自動刪除
    • 資料會在你保險櫃裡自焚的概念,你的塗鴉從來沒出過房門,就被燒掉消失不見了。

如果不幸變成確診者時:

  1. 擁有資料自主性
    • 這時衛生單位會主動詢問分享意願,由使用者自主決定是否同意提供紀錄(那堆亂七八糟的 ID )。
  2. 避免出現自主宣布確診情況
    • 如果使用者願意,衛生單位會給予一組驗證碼,由使用者上傳這隻手機裡存下的隨機 ID ,發通知給所有曾經跟這堆隨機 ID 接觸過的手機。也就是這時,你的塗鴉紙們才能用你自己的手、別人告訴你的保險櫃密碼,打開保險櫃,取出來後交給對方。
    • 如果沒有衛生單位的驗證碼,是無法宣布確診的。
  3. 不會透露個人資料
    • 因為上傳的是一堆隨機 ID ,所以無法知道個人資訊,只能用來判斷「曾經接觸與否」。也因為從來都沒有紀錄「誰」、「在哪裡」這些資訊,因此通知的訊息也只能知道「有接觸過」,無法知道在哪裏、是誰。
  4. 10天後自動刪除
    • 僅「同意分享的確診者」的資料才會上傳衛福部,而且僅保留10天。10天後就自動刪除。(同上述自焚概念)

個資/隱私安全結論:

經過上面的原理解釋,我們認為算是非常安全的一款 APP 。而且社交距離 APP 比口頭疫調的訊息更中立。只會定義兩使用者間的任何接觸為「曾接觸」,而不會再透露接觸形式是一同搭車或曾有親密關係。

不論是在資料技術的處理上、保護使用者隱私、個資的面向上,都處理得很好。

台灣的技術人才真的非常優秀。雖然一部分原因是,這是一款應用場景很單一、非常簡單的 APP 。所以只需要很單純簡單的資料即可達成目的。也因此讓它能容易的避開疑慮。但同時也是因為開發人員的努力。

例如,新加坡的需要手機註冊,而且所有 ID 是由政府統一發的。而一般最直覺的開發方式會使用 GPS 定位,但這就容易牽扯到個資疑慮了。相信也因為這樣所以開發人員才選擇藍牙技術,從一開始就只存「相對距離」這個數據,避開能判斷切確地理位置的 GPS 定位數據。如果沒有開發人員花費了許多心力去思考如何處理這個議題,可能就沒有這些細緻的處理。真的要給這些不為自己大聲宣傳的開發人員大大的掌聲👏。

文末保留有不確定的地方,歡迎提供指教!


[Ref]

總結

宇鯨的團隊非常看好大型語言模型這波浪潮,技術上的成熟度已經非常接近可商用,如果你本身已有產業經驗,非常容易就能透過 AI 工具來加速工作事務,甚至開始組建屬於自己企業的解決方案。OpenAI 在 2023/11 有一億個週活躍用戶, AI 工具在未來是必修課,現在不開始嘗試,以後將無法其他企業競爭。若想了解真實落地場景,歡迎找宇鯨聊聊!宇鯨在電商、法律、醫療的 AI 與自動化經驗,一定能讓你建立未來 10 年的競爭優勢!

關於宇鯨

提供全方位的 AI 解決方案:

  • 專案型技術開發合作:用戶與商品貼標、光學文字辨識 OCR、自然語言處理 NLP、音訊分析 SED、語音合成 TTS、產品概念驗證 POC
  • 宇鯨產品:CS Tagging 顧客分群貼標、LegalTech 智能書狀生成