วิทยาการคำนวณ2 -กระบวนการวิทยาการข้อมูล

เมนูวิชาวิทยาการคำนวณ 2

กระบวนการวิทยาการข้อมูล
กระบวนการวิทยาการข้อมูลคือแนวทางที่มีโครงสร้างในการแก้ปัญหาโดยใช้ข้อมูล แม้ว่าขั้นตอนที่แน่นอนจะแตกต่างกันไป แต่กรอบการทำงานทั่วไปประกอบด้วย:

1.การกำหนดปัญหา (Problem Definition): ทำความเข้าใจคำถามที่คุณต้องการตอบหรือปัญหาที่คุณต้องการแก้ไขให้ชัดเจน คุณกำลังมองหาข้อมูลเชิงลึกอะไร?

2.การรวบรวมข้อมูล (Data Collection): รวบรวมข้อมูลที่เกี่ยวข้องจากแหล่งต่างๆ ซึ่งอาจเกี่ยวข้องกับฐานข้อมูล API การขูดเว็บ (Web Scraping) หรือการสำรวจ

3.การทำความสะอาดและเตรียมข้อมูล (Data Cleaning and Preparation): ขั้นตอนนี้มักใช้เวลานานที่สุด! เกี่ยวข้องกับการจัดการค่าที่ขาดหายไป การแก้ไขข้อผิดพลาด การลบข้อมูลที่ซ้ำกัน และการแปลงข้อมูลให้อยู่ในรูปแบบที่ใช้งานได้

4.การวิเคราะห์ข้อมูลเชิงสำรวจ (Exploratory Data Analysis – EDA): วิเคราะห์ชุดข้อมูลเพื่อสรุปคุณลักษณะหลัก ซึ่งมักใช้วิธีการแสดงภาพ สิ่งนี้ช่วยให้เข้าใจโครงสร้างของข้อมูล ระบุรูปแบบ และตรวจจับความผิดปกติ

5.การสร้างแบบจำลอง (Modeling): การประยุกต์ใช้แบบจำลองทางสถิติหรืออัลกอริทึมการเรียนรู้ของเครื่องกับข้อมูลที่เตรียมไว้ เพื่อค้นหาความสัมพันธ์ ทำนายผล หรือจำแนกข้อมูล

6.การประเมินผล (Evaluation): การประเมินประสิทธิภาพของแบบจำลองเพื่อให้แน่ใจว่ามีความถูกต้องและเชื่อถือได้

7.การนำไปใช้และการสื่อสาร (Deployment and Communication): นำเสนอผลลัพธ์ของคุณในลักษณะที่ชัดเจนและเข้าใจง่าย (เช่น รายงาน แดชบอร์ด การนำเสนอ) และนำโซลูชันไปใช้งาน ข้อมูลเชิงลึกที่ได้รับควรนำไปสู่การปฏิบัติ