1: Introducing Data Analysis and Libraries
2: NumPy Arrays and Vectorized Computation
3: Data Analysis with Pandas
4: Data Visualization
1: Introducing Data Analysis and Libraries
จาก data รวบรวม , analysis , decision making จนเป็น knowledge

Data Analysis and processing
จาก data -> จนกลายเป็น knowledge ทำให้ value เพิ่มขึ้นมาก ซึ่งต้องใช้ knowledge เกี่ยวกับ computer science ,AI , ML , statistics and mathematics

Data analysis process ตาม steps
– Data requirement
– Data collection
– Data processing – kind of data structure eg analysis , statistic ,visualization ตามแต่ละจุดประสงค์
– Data cleaning – เมื่อ record data มา บางส่วน ก็จะอาจจะเกิด duplicate เราต้อง reduce situation เพื่อจะ increase quality
* common task คือ record matching , deduplication ,column segmentation
– Exploratory data analysis
* data visualization ก็เป็นอีกเทคนิกที่ทำให้ examing data ทาง graphs or charts
– Modelling and algorithms : มี mathematic formulas or algorithm มาใช้ predict จาก raw data
* เราสามารถ detech user’s gender base จาก news ที่เขาอ่าน , behavior แบ่งตาม classification models เรียกว่า Support Vector Machine (SVM) หรือ Linear regression
– Data product
An overview of the libraries in data analysis
p 8
2: NumPy Arrays and Vectorized Computation
3: Data Analysis with Pandas
4: Data Visualization
