อย่างที่เรารู้กันว่า AI นั้นสามารถเรียนรู้ คิด วิเคราะห์ และประมวลผลข้อมูลต่าง ๆ ได้ไม่ต่างจากมนุษย์ เรื่องภาษาที่มนุษย์ใช้สื่อสารก็เป็นหนึ่งในเส้นทางที่ AI ได้แตกแขนงไปเช่นกัน จนเกิดเป็นวิทยาการอีกแขนงหนึ่งที่ชื่อว่า ‘Natural Language Processing’ หรือ NLP แล้วเทคโนโลยีนี้คืออะไร? มีประโยชน์อย่างไร? วันนี้ Backyard จะพาทุกคนรู้จักกับ NLP ไปพร้อม ๆ กันในบทความนี้
Natural Language Processing หรือ NLP คืออะไร?
‘การประมวลผลภาษาธรรมชาติ’ หรือ Natural Language Processing (NLP) คือหนึ่งในวิทยาการของเทคโนโลยีปัญญาประดิษฐ์หรือ Artificial Intelligence (AI) ซึ่งถูกพัฒนาขึ้นมาเพื่อทำให้คอมพิวเตอร์สามารถเข้าใจภาษาธรรมชาติ ซึ่งไม่ใช่แค่เฉพาะภาษาที่มนุษย์ใช้สื่อสารกันเท่านั้น แต่ยังครอบคลุมไปถึงภาษาของสิ่งมีชีวิตต่าง ๆ ด้วย เช่น สุนัข แมว เป็นต้น หลายคนคงเคยเห็นข่าวเกี่ยวกับเครื่องแปลภาษาน้องหมาน้องแมวกันมาบ้างใช่มั้ย นั่นก็เป็นส่วนหนึ่งของ NLP เหมือนกันนะ
วิธีการทำงานโดยย่อของ NLP
NLP จะทำงานโดยการแปลงข้อความหรือประโยคในภาษาที่มนุษย์ใช้สื่อสารกันให้เป็นส่วนย่อย ๆ หรือชิ้นเล็ก ๆ ที่ง่ายต่อการทำความเข้าใจของคอมพิวเตอร์ก่อน ซึ่งสุดท้ายแล้วส่วนย่อย ๆ เหล่านั้นจะอยู่ในรูปแบบของตัวเลข (หรือถ้าละเอียดลงไปอีกหน่อยก็คือจะอยู่ในรูปแบบของเวกเตอร์) จากนั้นจึงวิเคราะห์แต่ละชิ้นส่วนว่าการรวมตัวกันขององค์ประกอบนี้มีความสัมพันธ์กันในรูปแบบใด เช่น คำว่า “บริษัท” กับ “แบ็คยาร์ด” และคำว่า “แบ็คยาร์ด” กับ “จำกัด” นั้นมีการปรากฏลำดับก่อนหลังอย่างไร เป็นต้น โดยใช้อัลกอริทึมหรือกระบวนการทางคณิตศาสตร์หรือกระบวนการทางภาษาต่าง ๆ เข้ามาช่วย สุดท้ายเราจะได้รูปแบบที่เป็นตัวแทนของความสัมพันธ์ทั้งหมด หรือที่เรียกว่า “แบบจำลอง” (Model) นั่นเอง
ประโยชน์ของ NLP
หลายคนอาจสงสัยว่า NLP มีประโยชน์อย่างไร? Backyard ขออธิบายแบบนี้คือเมื่อระบบคอมพิวเตอร์สามารถเข้าใจภาษาที่มนุษย์ใช้สื่อสารกันแล้วนั้น คอมพิวเตอร์จะสามารถตีความและใช้งานภาษานั้น ๆ เพื่อสื่อสารกับมนุษย์ได้ไม่ต่างจากที่มนุษย์ใช้ภาษาพูดคุยกันเอง
อาจมีคนสงสัยต่อว่าแล้วคนเราจะสื่อสารกับระบบคอมพิวเตอร์ไปเพื่ออะไร? Backyard ขอพูดโดยรวมว่าเพื่อเพิ่มความสะดวกสบายในการทำบางสิ่งบางอย่างนั่นเอง เราขอให้คุณลองนึกถึง Siri ของ Apple หรือ Bixby ของ Samsung ดูสิ เพราะจริง ๆ แล้วคุณอาจเคยได้ใช้เทคโนโลยีเหล่านี้ในชีวิตประจำวันอยู่แล้วด้วยซ้ำ เช่น สั่ง Siri ให้กดโทรหาแฟนขณะที่คุณกำลังขับรถอยู่ หรือในขณะที่คุณอาบน้ำอยู่ ก็สามารถสั่ง Bixby ให้เปิดเพลงโปรดให้ได้โดยไม่ต้องยื่นมือเปียก ๆ มาจับโทรศัพท์ เป็นต้น นอกจากนี้ยังมีงานหลายประเภทที่เราสามารถทำให้ง่ายขึ้นได้โดยใช้ NLP เช่น Chatbot, Autocorrection, Speech Recognition, Language Translator, Social Media Monitoring, Email Filtering และอีกมากมาย
สรุปได้ว่า NLP ถือเป็นเทคโนโลยีที่สร้างขึ้นมาเพื่อปิดช่องว่างในการสื่อสารระหว่างมนุษย์กับคอมพิวเตอร์อย่างแท้จริง และเราสามารถนำข้อมูลเชิงลึกที่ได้จากการทำงานของ NLP ไปใช้งานและต่อยอดอย่างอื่นได้อีกมากมาย
5 รูปแบบหลัก ๆ ของการนำ NLP ไปใช้งาน
1. Text Classification
เป็นการจำแนกประเภทข้อความหรือชุดการสื่อสารต่าง ๆ เพื่อจัดป็นหมวดหมู่ตามบริบทที่เราสนใจ เช่น การแยกประเภทข่าวสาร (News Classification) หากเรามีบทความที่พูดถึง Donald Trump เอกสารชิ้นนี้ก็จะถูกจัดอยู่ในหมวดหมู่การเมือง ส่วน Cristiano Ronaldo จะถูกจัดในหมวดกีฬา มัสตาร์ดอยู่ในหมวดอาหาร และ Lisa Blackpink อยู่ในหมวดหมู่บันเทิง เป็นต้น ซึ่งหากเราต้องการให้ NLP สามารถทำงานในรูปแบบนี้ได้นั้น เราก็จำเป็นต้องสร้างแบบจำลองของ NLP โดยการใช้ชุดฝึกสอน (Training Set) ก่อน หรือพูดง่าย ๆ คือต้องมีแบบเรียนให้คอมพิวเตอร์เข้าใจก่อน มันจึงจะสามารถสร้างแบบจำลองในการจำแนกเอกสารตามรูปแบบที่เรากำหนดได้
2. Topic Discovery and Modeling
เป็นการจัดหมวดหมู่เอกสารจำนวนมากแบบอัตโนมัติ โดยที่เรามีหน้าที่เพียงแค่กำหนด จำนวนหมวดหมู่ที่อยากให้แบ่ง และจำนวนของคำที่เป็นตัวแทนของแต่ละหมวดหมู่เท่านั้น ที่เหลือคือสามารถปล่อยให้เป็นหน้าที่ของอัลกอริธึมในการจำแนกและจัดกลุ่มได้เลย นั่นเป็นเหตุผลที่เราเรียกมันว่า “ระบบอัตโนมัติ” ยังไงล่ะ
ยกตัวอย่างเช่น เรามีข่าวของคู่แข่งจำนวน 1,000 ข่าว แล้วเราต้องการแยกหมวดหมู่ของข่าว ๆ นั้น เราสามารถกำหนดได้ว่าต้องการแบ่งออกเป็น 4 กลุ่ม โดยแต่ละกลุ่มมีตัวแทน 3 คำ ระบบก็อาจจะแบ่งออกมาได้ดังตัวอย่างนี้
กลุ่มที่ 1 เกี่ยวข้องกับโปรโมชั่น ราคา และแพ็กเกจ
กลุ่มที่ 2 เกี่ยวข้องกับเครื่องซักผ้า เครื่องใช้ไฟ้า และตู้เย็น
กลุ่มที่ 3 เกี่ยวข้องกับผู้บริหาร หุ้น และการเงิน
กลุ่มที่ 4 เกี่ยวข้องกับการบริการ Call center และการรับประกัน เป็นต้น
อยากให้คุณลองคิดดูสิว่าหากต้องใช้คนมาคัดแยกเอกสารทีละชิ้น ทีละหน้าแบบนั้นคงใช้ระยะเวลานานมากทีเดียว แต่หากเรามี NLP รูปแบบนี้ก็จะช่วยลดระยะเวลาไปได้เยอะเลยล่ะ
3. Document Summarization
เป็นการสรุปใจความสำคัญของบทความหรือเอกสารต่าง ๆ เช่น การสรุปบทความยาว ๆ ให้เหลือเพียง 2-3 ประโยค เป็นต้น ทำให้เราสามารถเข้าใจบริบทของเนื้อหาได้อย่างรวดเร็ว และอาจนำข้อมูลนี้ไปใช้ในการตัดสินใจทำบางสิ่งบางอย่างได้ทันที
4. Sentiment Analysis
เป็นการตรวจหาความรู้สึก อารมณ์ มุมมอง ความคิดเห็น หรือเจตนาที่อยู่เบื้องหลังข้อความหรือคำพูดหรือรูปแบบการสื่อสารต่าง ๆ โดยมีอยู่ 3 ลักษณะ ได้แก่ เป็นบวก เป็นลบ และเป็นกลาง
ยกตัวอย่างเช่น ร้านอาหารชื่อดังที่มีสาขาทั่วประเทศมีเว็บไซต์สำหรับสั่งอาหารออนไลน์ และลูกค้าสามารถแสดงความคิดเห็นเกี่ยวกับบริการหรือสินค้าได้ โดยมีลูกค้า 3 ท่านได้มาเขียนรีวิวดังต่อไปนี้
ลูกค้าท่านที่ 1 : ผมชอบไก่ทอดมากเลย อร่อยมาก = เป็นบวก
ลูกค้าท่านที่ 2 : มันบดรสชาติแย่มาก! = เป็นลบ
ลูกค้าท่านที่ 3 : วันนี้ผมไปซื้อพิซซ่าที่ร้านมา = เป็นกลาง
5. Machine Translation
เป็นการแปลข้อความจากภาษาของมนุษย์จากภาษาหนึ่งให้เป็นอีกภาษาหนึ่ง เช่น Google Translate
ตัวอย่างเทคโนโลยี NLP
GPT-3 ซึ่งเป็นโมเดลภาษาที่ใหญ่ที่สุดในโลก ณ ปัจจุบัน สิ่งที่ GPT-3 สามารถทำได้นั้นมีมากมาย เช่น
การเขียนบทกลอนภาษาอังกฤษด้วยสไตล์การประพันธ์แบบ William Shakespeare
การตอบคำถามเชิงปรัญชาเกี่ยวกับลัทธิ Stoicism ในบทสนทนาเสมือนระหว่าง Tim Ferriss นักจัดพอดแคสต์ชื่อดังชาวอเมริกัน กับ Marcus Aurelius จักรพรรดิของอาณาจักรโรมัน
การเขียนโค้ดตามรายละเอียดที่เราต้องการ เช่น สร้างโค้ด Javascript ในการออกแบบหน้าตาของส่วนประกอบเว็บไซต์แต่ละชิ้น
Virtual Assistant เช่น Siri จาก Apple, Bixby จาก Samsung, Alexa จาก Amazon เป็นต้น ที่สามารถโต้ตอบกับผู้ใช้งานได้อย่างเป็นธรรมชาติ
Google Translate เครื่องมือแปลภาษาที่สามารถแปลได้มากกว่า 100 ภาษา
Grammarly ซึ่งเป็น Writing Assistant ช่วยตรวจสอบไวยากรณ์ การสะกดคำ การคัดลอกผลงานทางวิชาการหรือวรรณกรรม (Plagiarism) รวมถึงรูปแบบการเขียนเพื่อให้เหมาะสมกับวัตถุประสงค์การใช้งาน
Project Debater นักโต้วาที AI จาก IBM ที่สามารถอภิปรายโต้ตอบกับมนุษย์ได้แม้แต่ในหัวข้อที่ยากและซับซ้อน
ฟังก์ชั่น Search ของ Search Engine ต่าง ๆ เช่น Google, Bing และ Yahoo ที่ใช้กันทั่วโลก หรือ Naver ของเกาหลี, Baidu ของจีน และ Yandex ของรัสเซีย เป็นต้น ที่พยายามทำให้การค้นหามีความเป็นธรรมชาติ สามารถใช้ภาษาพูดค้นหาได้เลย และผลการค้นหาก็เกี่ยวข้องกับสิ่งที่ผู้ใช้งานต้องการค้นหามากที่สุด
อ้างอิงข้อมูลจาก
Comments