關於方法

目標
本研究旨在對香港社交媒體平台上有關詐騙的討論進行即時分析。透過每天更新資料庫中來自BabyKingdom和LIHKG論壇的相關帖子,分析過去一周內的信息,以回答以下研究問題:
- 最流行的詐騙手法是什麼?
- 騙子如何利用不同的科技?
- 騙子如何利用新的通訊技術來接觸他們的目標?
- 詐騙內容的語言特徵是什麼?
- 最常見的詐騙訴求是什麼?
- 我們可以採取哪些措施幫助市民防範詐騙?
數據收集
- 每日更新:
- 持續更新資料庫,收集來自BabyKingdom和LIHKG論壇的詐騙相關貼文。
- 僅保留論壇貼文的標題、內容、回覆、發文時間和URL資訊。
數據處理
- 批量處理:
- 從資料庫中讀取近一周的數據,並以每批10行的方式進行切分。
- 每個批次的資料包含10條評論的字串,以確保分析的一致性。
分析過程
- 透過GPT-4o進行分析:
- 將每個批次的資料傳遞給GPT-4o模型進行詳細分析。
- 取得每個批次的分析結果。
結果整合
- 檢查現有分析結果:
- 如果之前沒有分析結果,則直接將目前批次的結果儲存為主要分析結果。
- 如果已有先前的分析結果,則將目前批次的結果與已有結果合併,並傳遞給GPT進行去重和綜合分析。
綜合分析
- 結果合成:
- GPT將基於目前批次和先前合併的資料輸出一個綜合分析結果。
- 將合併去重後的結果儲存為更新的分析結果。
迭代處理
- 重複過程:
- 對每個資料批次重複上述步驟,直到處理完所有批次的資料。
最終輸出
- 最終結果:
- 保存最終的綜合分析結果,確保結果完整、去重且全面。
透過遵循此方法論,本研究旨在對香港社交媒體平台上的詐騙討論進行即時、準確且全面的洞察,有效回答指定的研究問題。