關於方法 | 中國聯通 - 香港城市大學智能反詐聯合實驗室

如懷疑受騙，切勿猶疑，請立即報警。

ABOUT 關於

主任致辭關於方法媒體報導

關於方法

目標

本研究旨在對香港社交媒體平台上有關詐騙的討論進行即時分析。透過每天更新資料庫中來自BabyKingdom和LIHKG論壇的相關帖子，分析過去一周內的信息，以回答以下研究問題：

最流行的詐騙手法是什麼？
騙子如何利用不同的科技？
騙子如何利用新的通訊技術來接觸他們的目標？
詐騙內容的語言特徵是什麼？
最常見的詐騙訴求是什麼？
我們可以採取哪些措施幫助市民防範詐騙？

數據收集

每日更新：
- 持續更新資料庫，收集來自BabyKingdom和LIHKG論壇的詐騙相關貼文。
- 僅保留論壇貼文的標題、內容、回覆、發文時間和URL資訊。

數據處理

批量處理：
- 從資料庫中讀取近一周的數據，並以每批10行的方式進行切分。
- 每個批次的資料包含10條評論的字串，以確保分析的一致性。

分析過程

透過GPT-4o進行分析：
- 將每個批次的資料傳遞給GPT-4o模型進行詳細分析。
- 取得每個批次的分析結果。

結果整合

檢查現有分析結果：
- 如果之前沒有分析結果，則直接將目前批次的結果儲存為主要分析結果。
- 如果已有先前的分析結果，則將目前批次的結果與已有結果合併，並傳遞給GPT進行去重和綜合分析。

綜合分析

結果合成：
- GPT將基於目前批次和先前合併的資料輸出一個綜合分析結果。
- 將合併去重後的結果儲存為更新的分析結果。

迭代處理

重複過程：
- 對每個資料批次重複上述步驟，直到處理完所有批次的資料。

最終輸出

最終結果：
- 保存最終的綜合分析結果，確保結果完整、去重且全面。

透過遵循此方法論，本研究旨在對香港社交媒體平台上的詐騙討論進行即時、準確且全面的洞察，有效回答指定的研究問題。