
MDS2_Cleaning data: drop_duplicates, replace values, fillna, dropna
Quiz by Phuong Do Thi
Tag the questions with any skills you have. Your dashboard will track each student's mastery of each skill.
Tại sao cần xóa dữ liệu trùng trong DataFrame?
Cho dataframe student như sau:
Sinh viên có điểm thi chưa đạt sẽ được thi lại lần 2. Bạn xóa dữ liệu trùng lắp trên cột ID, với các dòng trùng ở cuối sẽ được giữ lại. Câu lệnh nào sau đây là đúng?

Cho dataframe student như sau:
Dữ liệu có một số dòng trùng. Bạn cần dữ liệu trùng lắp (trên tất cả các cột), với các dòng trùng ở đầu sẽ được giữ lại. Câu lệnh nào sau đây là đúng?
Tại sao cần phải xử lý giá trị không hợp lệ trong dữ liệu?
Cho dataframe student như sau:
Hãy thay thế giá trị -2 trong mỗi cột bằng giá trị trung bình của côt đó.

Cho dataframe student như sau:
Hãy thay thế giá trị -2 trong dataframe thành NaN (Not a Number).

Tác động của giá trị thiếu đến phân tích dữ liệu là gì?
Bạn có thể phát hiện dữ liệu thiếu trong dataframe df bằng cách nào?
Cho dataframe student như sau:
Cho biết tuổi của học viên Trần Thị Bình khi điền giá trị thiếu bằng câu lệnh
student.fillna(method = 'ffill')

Cho dataframe student như sau:
Cho biết điểm của học viên Trần Thị Bình khi điền giá trị thiếu bằng câu lệnh
student.fillna(method = 'bfill')

Cho dataframe student như sau:
Cho biết điểm của học viên Ngô Thị An khi thực hiện câu lệnh
student.interpolate()

Cho dataframe student như sau:
Để xóa bỏ các dòng dữ liệu có chứa NaN, bạn sử dụng câu lệnh nào dưới đây?
