如懷疑受騙,切勿猶疑,請立即報警。

關於方法

目標

本研究旨在對香港社交媒體平台上有關詐騙的討論進行即時分析。透過每天更新資料庫中來自BabyKingdom和LIHKG論壇的相關帖子,分析過去一周內的信息,以回答以下研究問題:

  1. 最流行的詐騙手法是什麼?
  2. 騙子如何利用不同的科技?
  3. 騙子如何利用新的通訊技術來接觸他們的目標?
  4. 詐騙內容的語言特徵是什麼?
  5. 最常見的詐騙訴求是什麼?
  6. 我們可以採取哪些措施幫助市民防範詐騙?

數據收集

  • 每日更新:
    • 持續更新資料庫,收集來自BabyKingdom和LIHKG論壇的詐騙相關貼文。
    • 僅保留論壇貼文的標題、內容、回覆、發文時間和URL資訊。

數據處理

  • 批量處理:
    • 從資料庫中讀取近一周的數據,並以每批10行的方式進行切分。
    • 每個批次的資料包含10條評論的字串,以確保分析的一致性。

分析過程

  • 透過GPT-4o進行分析:
    • 將每個批次的資料傳遞給GPT-4o模型進行詳細分析。
    • 取得每個批次的分析結果。

結果整合

  • 檢查現有分析結果:
    • 如果之前沒有分析結果,則直接將目前批次的結果儲存為主要分析結果。
    • 如果已有先前的分析結果,則將目前批次的結果與已有結果合併,並傳遞給GPT進行去重和綜合分析。

綜合分析

  • 結果合成:
    • GPT將基於目前批次和先前合併的資料輸出一個綜合分析結果。
    • 將合併去重後的結果儲存為更新的分析結果。

迭代處理

  • 重複過程:
    • 對每個資料批次重複上述步驟,直到處理完所有批次的資料。

最終輸出

  • 最終結果:
    • 保存最終的綜合分析結果,確保結果完整、去重且全面。

透過遵循此方法論,本研究旨在對香港社交媒體平台上的詐騙討論進行即時、準確且全面的洞察,有效回答指定的研究問題。