Kung pinaghihinalaang naloko, huwag mag-atubiling ipagbigay-alam agad sa pulisya

Tungkol sa Paraan

Mga layunin

Ang pag-aaral na ito ay naglalayong magsagawa ng real-time na pagsusuri ng mga diskusyon na nauugnay sa scam sa mga platform ng social media ng Hong Kong. Sa pamamagitan ng pag-update ng database araw-araw na may mga nauugnay na post mula sa BabyKingdom at LIHKG forums, sinusuri nito ang impormasyon mula sa nakaraang linggo upang matugunan ang mga sumusunod na tanong sa pananaliksik:

  1. Ano ang pinakasikat na pamamaraan ng scam?
  2. Paano sinasamantala ng mga scammer ang iba't ibang teknolohiya?
  3. Paano ginagamit ng mga scammer ang mga bagong teknolohiya ng komunikasyon upang maabot ang kanilang mga target?
  4. Ano ang mga katangiang pangwika ng nilalaman ng scam?
  5. Ano ang mga pinakakaraniwang apela sa scam?
  6. Anong mga hakbang ang maaari nating gawin upang matulungan ang publiko na maiwasan ang mga scam?

Pangongolekta ng Datos

  • Araw-araw na Update:
    • Patuloy na mangolekta ng mga post na nauugnay sa scam mula sa mga forum ng BabyKingdom at LIHKG.
    • Panatilihin lamang ang pamagat, nilalaman, mga tugon, oras ng pag-post, at impormasyon ng URL ng mga post sa forum.

Pagproseso ng Data

  • Batch Processing:
    • Basahin ang data mula sa database para sa nakaraang linggo at hatiin ito sa mga batch ng 10 row bawat isa.
    • Ang bawat batch ay naglalaman ng isang string ng 10 komento upang matiyak ang pagkakapare-pareho ng analitikal.

Proseso ng Pagsusuri

  • Magsagawa ng pagsusuri gamit ang GPT-4o:
    • Ipasa ang bawat batch ng data sa modelong GPT-4o para sa detalyadong pagsusuri.
    • Kumuha ng mga resulta ng pagsusuri para sa bawat batch.

Pagsasama ng Resulta

  • Suriin ang mga kasalukuyang resulta ng pagsusuri:
    • Kung walang mga naunang resulta ng pagsusuri, direktang iimbak ang mga resulta ng kasalukuyang batch bilang pangunahing resulta ng pagsusuri.
    • Kung umiiral ang mga naunang resulta ng pagsusuri, isama ang mga resulta ng kasalukuyang batch sa mga umiiral na, pagkatapos ay ipasa ang mga ito sa GPT para sa deduplikasyon at komprehensibong pagsusuri.

Komprehensibong Pagsusuri

  • Synthesis ng resulta:
    • Ang GPT ay bubuo ng komprehensibong resulta ng pagsusuri batay sa kasalukuyang batch at dating pinagsamang data.
    • Itabi ang mga na-deduplicate at pinagsamang resulta bilang na-update na resulta ng pagsusuri.

Paulit-ulit na Pagproseso

  • Ulitin ang proseso:
    • Ilapat ang mga hakbang sa itaas sa bawat batch ng data hanggang sa maproseso ang lahat ng batch.

Pangwakas na Output

  • Mga huling resulta:
    • I-save ang panghuling resulta ng komprehensibong pagsusuri, tinitiyak na kumpleto, na-deduplicate, at kumpleto ang mga ito.

Sa pamamagitan ng pagsunod sa pamamaraang ito, ang pag-aaral na ito ay naglalayong magbigay ng real-time, tumpak, at komprehensibong mga insight sa mga diskusyon na nauugnay sa scam sa mga platform ng social media ng Hong Kong, na epektibong tumutugon sa mga tinukoy na tanong sa pananaliksik.