Lecture 3 : เราทำ Data Analytics เพื่ออะไร?
เราจะทำ Data Anlytics ไปทำไม ?
Data Analytics นั้นทำเพื่อหาคำตอบบางอย่างจากข้อมูลที่เรามีอยู่ หรือใช้ในการตัดสินใจบางอย่าง
ในคอร์สเรียนนี้เราจะเรียนรู้ผ่านการทำ Data Analytics กับข้อมูล 2 อย่างก็คือ IMDB และ COVID-19
ฐานข้อมูล IMDB
เข้าไปที่ Kaggle (บน Kaggle ได้ถูกลบไปแล้วครับ สามารถดาวน์โหลดได้จากลิงก์นี้แทนครับ dataset_IMDb - Google ไดรฟ์)
ข้อมูลจะประกอบไปด้วยไฟล์ CSV จำนวน 4 ไฟล์- IMDb movies.csv ข้อมูลสำคัญที่จะใช้คือ จำนวนโหวต, งบประมาณ และรายได้ของภาพยนตร์
- IMDb names.csv ข้อมูลสำคัญที่จะใช้คือ ชื่อและนามสกุล
- IMDb ratings.csv เราจะใช้ข้อมูลเกี่ยวกับผู้ชมในการตัดสินใจของเรา
- IMDb title_principals.csv เป็นข้อมูลผู้มีส่วนเกี่ยวข้องในภาพยนตร์
ฐานข้อมูล COVID-29
เป็นข้อมูลที่เก็บรวบรวมจากประกาศจากประเทศต่างมีการอัพเดตอยู่ตลอดเข้าไปที่ COVID-19
ข้อมูลที่ในนี้ประกอบด้วย- ข้อมูลเกี่ยวปับประเทศต่างๆ เช่น ชื่อ, สถานที่ตั้ง
- ข้อมูลจำนวนผู้ป่วย เช่น รายวัน, จำนวนรวม