เทคโนโลยีจับทุจริตผู้บริหาร ด้วยการวิเคราะห์ Text

Text-based analysis, Fraud and Deception Detection

เทคโนโลยีจับทุจริตผู้บริหาร ด้วยการวิเคราะห์ Text

ผมไปอ่านเจอบทความน่าสนใจ  คนเขียนคุณ Jason Voss เค้าเป็น CFA และเป็นคนที่ทำพวกโปรแกรมสำหรับวิเคราะห์ข้อความเพื่อจับสัญญาณการหลอก  ในบทความเค้าพยายามจะบอกว่าการจับทุจริตโดยคนมันไม่ได้ผล  เราควรจะเริ่มหันมาใช้โปรแกรมคอมได้แล้ว  โอเคบางส่วนเค้าอาจจะพยายามขายตัวบริการของบริษัทเค้าแต่เหตุผลที่เค้าอ้างก็น่าสนใจทีเดียว

  1. ในรายงานประจำปี  ตัวเลขเป็นแค่ 13.5% ของทั้งหมด  ส่วนใหญ่เป็นข้อความ  
  2. ดังนั้นการวิเคราะห์ใดๆก็สมควรที่จะให้ความสำคัญกับการวิเคราะห์ตัวข้อความด้วย  ไม่ใช่ตัวเลขเฉยๆ

  3. การใช้คนทำติดปัญหาเรื่องข้อจำกัดด้านเวลา
  4. รายงานประจำปีมันยาว  บริษัทส่วนใหญ่ก็เป็นร้อยหน้า  ถ้าจะใช้คนอ่านทั้งหมดก็ใช้เวลาเยอะมากและไม่ใช่ทุกหน่วยงานจะสามารถจ้างนักวิเคราะห์จำนวนมากพอที่จะอ่านข้อมูลพวกนี้ทั้งหมด

  5. เคยมีการทดสอบและพบว่าความสามารถในการจับโกหกของคนค่อนข้างห่วย
  6. เฉลี่ยจากการวิจัยจำนวนมากพบว่าทำได้ดีกว่าสุ่มแค่ 4%  และคนเขียนมีทำทดสอบคนในสายงานการเงินพบว่าเดาถูกแค่ 49.4% เท่านั้น  หรือถ้าทดสอบด้วยเนื้อหาที่เกี่ยวกับไฟแนนซ์เช่น earnings call ก็เดาถูกเยอะขึ้นแต่ก็แค่ 51.8% เท่านั้น

  7. ผู้ตรวจสอบบัญชีเองก็มีข้อจำกัด
  8. เป็นการตรวจตัวเลขเช่นกัน  ไม่ได้วิเคราะห์จากตัวข้อความที่เป็นส่วนใหญ่ของรายงาน

  9. การวิเคราะห์ตัวข้อความได้ผล
  10. เคยมีการใช้ NLP (Natural Language Processing) ในการวิเคราะห์  มีการเอาคำที่ใช้, ภาษาที่ใช้, ความถี่ของการใช้คำบางประเภทมาทดสอบว่าสามารถจับการหลอกลวงได้มั้ย  ผลคือทำได้อยู่ประมาณ 64-80%  ซึ่งดีกว่าคนมาก  และที่สำคัญใช้เวลาน้อยกว่าให้คนมานั่งอ่านเยอะมาก

    จนในภายหลังเมื่อมีคนใช้วิธีการนี้มากขึ้น  บริษัทก็เริ่มจ้างคนที่ทำ NLP มาใช้กับรายงานของตัวเองเพื่อกำจัดการใช้คำที่มีปัญหาออกไป  เลยทำให้การจับโกหกด้วยการมองหา keyword คำบางประเภททำได้ยากขึ้น

  11. สิ่งที่บริษัทเค้าทำเพื่อแก้ปัญหานี้คือการวิเคราะห์โครงสร้างของประโยคหรือการใช้ภาษา  ไม่ใช่แค่ว่าใช้คำว่าอะไรเฉยๆ
  12. อันนี้เค้าก็อ้างว่าใช้จับโกหกได้เกิน 70%  และจากการทดสอบกับเคสโกหกใหญ่ๆในอดีตก็ใช้ได้ผล  สามารถจับว่ามีการหลอกได้ล่วงหน้าก่อนที่บริษัทจะเริ่มเกิดปัญหายาวนานถึง 6 ปี

แล้วเค้าก็เล่าให้ฟังว่ามันมีสัญญาณบ่งชี้สำคัญอยู่ 5 อันที่ถ้าเจอในบริษัทไหน  บริษัทนั้นมีโอกาสจะผิดปกติเยอะขึ้นกว่าสัญญาณอันอื่น
 

สัญญาณ 5 อันมีดังนี้

  1. ใช้คำที่สื่อถึงความเป็นมิตรเป็นพวกเดียวกัน
  2. เค้าพบว่าบริษัทที่พยายามจะหลอกจะพยายามสร้างความรู้สึกว่าเป็นมิตรมากกว่าบริษัทปกติ  ตัวอย่างคำประเภทนี้เช่น “เพื่อน”, “พรรคพวก”, “แก๊งค์”, “เพื่อนบ้าน”, ฯลฯ

  3. ใช้คำที่สื่อถึงความเสี่ยง
  4. บริษัทที่พยายามหลอกมีการใช้คำที่สื่อหรือเกี่ยวข้องกับความเสี่ยงเยอะกว่าปกติ  ตัวอย่างคำก็เช่น “หลีกเลี่ยง”, “น่าเป็นห่วง”, “น่ากังวล”, “ป้องกัน”, “ยากลำบาก”, “หยุด”, ฯลฯ

  5. ใช้คำสรรพนามที่ไม่เจาะจง
  6. คำสรรพนามที่ไม่เจาะจงเช่น “คนอื่น”, “ทุกคน”, “ใครบางคน”, “อันไหนซักอัน”, ฯลฯ

  7. ไม่ใช้คำที่พูดถึงความแตกต่าง
  8. เค้าพบว่าบริษัทที่พยายามจะหลอกจะใช้คำที่สื่อถึงความแตกต่างหรือทำการเปรียบเทียบน้อยกว่า ประโยคที่พูดถึงความแตกต่างหรือการเปรียบเทียบเช่น “เมื่อเปรียบเทียบกับปีที่แล้วบริษัท …”

  9. ใช้คำที่เป็นการปฏิเสธ
  10. เช่น “ไม่ใช่”, “ไม่เคย”, “ไม่ควร”, “ไม่ได้ทำ”, “อย่าทำ”, ฯลฯ

    นอกเหนือจากนี้ก็จะมีอีกกรณีที่หายากซึ่งคือการใช้คำสบถ  แต่ถ้าเจอนี่คือส่อแววโอกาสจะมีปัญหาสูงมาก

โดยรวมเรื่องนี้อาจจะไม่ได้กระทบอะไรกับเราเท่าไหร่  เพราะเราที่เป็นนักลงทุนรายย่อยก็คงไม่ไปซื้อโปรแกรมมาทำอยู่แล้ว  แต่ผมว่าการศึกษาการใช้ภาษาว่าแบบไหนส่อแววจะโกหกก็เป็นการศึกษาที่น่าสนใจทีเดียว

เผื่อใครสนใจอ่านผมทิ้งลิ้งค์เอาไว้ให้ครับ https://blogs.cfainstitute.org/investor/2021/02/15/fraud-and-deception-detection-text-based-analysis/

https://blogs.cfainstitute.org/investor/2021/03/11/fraud-and-deception-detection-five-language-fingerprints/

 

ฟังแล้วเป็นยังไงบ้าง Comment ได้เลยนะครับ

หากชอบเนื้อหา อย่าลืมกด Like & Share และ Follow เราในช่องทางต่างๆ ได้ตามนี้ 🙂

ติดตามพวกเราได้บน Facebook https://www.facebook.com/smartstockinvestment/

หรือทาง YouTube https://www.youtube.com/channel/UCXXwuZIQdWiS1OIzy0uP1fg

ตอนนี้เรามีคอร์ส Workshop ออนไลน์แล้วด้วยนะ
https://www.adisonc.com/

หรือ ทดลองเรียนฟรี