top of page
Asset 2x20.png

5 ปัญหาด้านข้อมูลที่พบได้บ่อย ๆ ในโปรเจค AI


ในการทำโปรเจค AI ให้ประสบความสำเร็จนั้น นอกจากคุณจะต้องมีแนวทางและเป้าหมายของโปรเจค AI ที่ชัดเจนแล้ว รู้หรือไม่ว่ายังมีอีกส่วนที่สำคัญไม่แพ้กันนั่นก็คือ “ข้อมูล” วันนี้ Backyard จะพาไปดู 5 ปัญหาด้านข้อมูลที่พบบ่อย ๆ เมื่อองค์กรพยายามสร้างเทคโนโลยี AI บอกเลยว่าถ้ารู้แล้ว ชีวิตจะง่ายขึ้นแน่นอน!


🗃 Out-of-Date Data : ข้อมูลที่เก่าเกินไป ไม่อัปเดต

เคยรู้กันรึเปล่าว่าจริง ๆ แล้วข้อมูลก็มีวันหมดอายุเหมือนกันนะ เราสามารถแบ่งข้อมูลได้ 4 ประเภท ได้แก่ Real-time Data, Operational Data, Performance Data และ Strategic Data ยิ่งข้อมูลไหนที่สามารถเกิดขึ้นหรือเปลี่ยนแปลงได้อย่างรวดเร็ว ข้อมูลนั้นก็จะยิ่งหมดอายุเร็ว ยกตัวอย่างเช่น ข้อมูล Real-Time สามารถเกิดขึ้นใหม่ตลอดเวลา ก็เลยล้าสมัยอย่างรวดเร็ว เราขอให้คุณลองคิดถึงดราม่าต่าง ๆ ที่เกิดขึ้นในโซเชียลมีเดียดูสิ ไม่กี่วันกระแสพวกนี้ก็จะซาลง หรืออาจจะใช้เวลาแค่ไม่กี่ชั่วโมงด้วยซ้ำ



🗃 Incomplete Data : ข้อมูลที่ได้มาถูกต้อง แต่ไม่ครบถ้วนเพียงพอที่จะนำมาวิเคราะห์

บางครั้ง AI อาจมีประสิทธิภาพต่ำหรือทำงานผิดปกติได้ หากข้อมูลที่ใช้ในการเทรนนิ่ง AI นั้นมีไม่เพียงพอ เราสามารถสังเกตเห็นความผิดปกตินี้ได้เมื่อใส่ Input เข้าไป แต่ AI ไม่เข้าใจ หรืออาจจะแสดงผลลัพธ์แปลก ๆ มาให้ หลายคนคงสงสัยต่อว่าแล้วต้องใช้ข้อมูลมากแค่ไหนในการเทรน AI ให้ฉลาด จริง ๆ แล้วคำถามนี้ไม่มีคำตอบที่ตายตัว เพราะมันขึ้นอยู่กับประเภทของงานที่อัลกอรึทึมจะต้องทำงานให้ และประสิทธิภาพของ AI ที่คุณคาดหวัง


🗃 Irrelevant Data : มีข้อมูลจำนวนมาก แต่ไม่เกี่ยวข้องกับปัญหาที่กำลังแก้ไข

ข้อมูลที่ไม่เกี่ยวข้องอาจส่งให้โมเดลหรืออัลกอรึธึมของ AI มีความคิดผิด ๆ จนอาจนำไปสู่การตัดสินใจที่ผิดพลาดได้ ดังนั้นการทำความสะอาดข้อมูล (Data Cleaning) จึงมีความสำคัญมาก เพื่อที่เราจะได้กำจัดข้อมูลที่ไม่เกี่ยวข้องออกไป และคัดเอาเฉพาะข้อมูลที่มีคุณภาพเอาไว้



🗃 Duplicated Data : ข้อมูลซ้ำกัน

ในหลาย ๆ องค์กรอาจมีการเก็บรวบรวมข้อมูลจากหลายแห่งเพื่อตอบโจทย์ทางธุรกิจ แต่กลายเป็นว่าข้อมูลบางส่วนนั้นซ้ำซ้อนกัน เนื่องจากข้อมูลมาจากคนละระบบกัน เขียนกันคนละภาษา หรือมีรูปแบบ (Format) ที่แตกต่างกัน ยกตัวอย่างเช่น ข้อมูลจาก SAP Oracle, SQL และ mySQL จะมีความแตกต่างกัน ดังนั้นคุณควรสร้างระบบการจัดการข้อมูลที่ดีมากเพียงพอ เพื่อแก้ไขปัญหานี้


🗃 Biased Data : ข้อมูลที่มีอคติ

บางครั้งข้อมูลที่เราใช้ในการเทรน AI นั้นสามารถสร้างอคติโดยธรรมชาติได้ ตัวอย่างเช่น AI อาจมีแนวโน้มที่จะระบุว่าผู้หญิงในวงการแพทย์คือพยาบาล ส่วนผู้ชายคือแพทย์ อาจดูเหมือนไม่ใช่เรื่องใหญ่ แต่ข้อมูลที่มีอคตินี้อาจเป็นแรงกระเพื่อมที่ส่งผลกระทบต่อวิธีการทำงานของ AI และผลลัพธ์ที่จะได้


เป็นอย่างไรกันบ้าง รู้แล้วใช่ไหมว่าปัญหาด้านข้อมูลแบบไหนที่เราควรระวังบ้าง ดังนั้นตั้งใจจัดการข้อมูลให้ดีกันนะ เพราะประสิทธิภาพของ AI ขึ้นอยู่กับข้อมูลที่ใช้ในการเทรน AI นี่แหละ


และสำหรับใครที่สนใจนำ AI เข้ามาใช้ในองค์กร หรือมีข้อคำถามสงสัยเกี่ยวกับ AI ให้ Backyard ช่วยแนะนำ สามารถพูดคุย ปรึกษา ขอข้อมูลเพิ่มเติมกับผู้เชี่ยวชาญของเราได้ที่ โทร. 02-853-9131 หรือ info@backyard.in.th หรือกรอกแบบฟอร์มที่นี่ และสามารถติดตามข่าวสารเพิ่มเติมเกี่ยวกับ Backyard ได้ที่


อ้างอิงข้อมูลจาก

Comentarios


bottom of page