Bài học này thuộc chương trình Toán 10 tập 1, chương VI: Thống kê. Chúng ta sẽ cùng tìm hiểu về các số đặc trưng quan trọng giúp mô tả và phân tích dữ liệu thống kê.
Nội dung bài học tập trung vào việc hiểu rõ khái niệm và cách tính trung bình cộng, trung vị và mốt của một mẫu số liệu. Đây là những công cụ cơ bản để đánh giá xu hướng tập trung của dữ liệu.
Trong thống kê, việc mô tả và tóm tắt dữ liệu là vô cùng quan trọng. Các số đặc trưng đo xu thế trung tâm đóng vai trò then chốt trong việc này, giúp chúng ta hiểu được giá trị điển hình của một tập dữ liệu. Bài 3 trong SGK Toán 10 Chân trời sáng tạo tập 1 đi sâu vào việc khám phá ba số đặc trưng chính: trung bình cộng, trung vị và mốt.
Trung bình cộng là số trung bình của tất cả các giá trị trong một tập dữ liệu. Nó được tính bằng cách cộng tất cả các giá trị lại và chia cho số lượng giá trị. Công thức tính trung bình cộng cho một mẫu số liệu x1, x2, ..., xn là:
x̄ = (x1 + x2 + ... + xn) / n
Trung bình cộng nhạy cảm với các giá trị ngoại lệ, tức là các giá trị quá lớn hoặc quá nhỏ so với phần còn lại của dữ liệu. Ví dụ, nếu chúng ta có một tập dữ liệu về chiều cao của học sinh trong lớp, và có một học sinh cao hơn rất nhiều so với những học sinh khác, thì trung bình cộng sẽ bị kéo lên cao hơn so với chiều cao điển hình của lớp.
Trung vị là giá trị nằm ở giữa một tập dữ liệu đã được sắp xếp theo thứ tự tăng dần hoặc giảm dần. Nếu số lượng giá trị là lẻ, trung vị là giá trị ở vị trí giữa. Nếu số lượng giá trị là chẵn, trung vị là trung bình cộng của hai giá trị ở vị trí giữa.
Ví dụ, nếu chúng ta có tập dữ liệu: 3, 1, 7, 5, 9. Sau khi sắp xếp: 1, 3, 5, 7, 9. Trung vị là 5.
Trung vị ít bị ảnh hưởng bởi các giá trị ngoại lệ hơn so với trung bình cộng. Do đó, nó thường được sử dụng khi dữ liệu chứa các giá trị ngoại lệ.
Mốt là giá trị xuất hiện nhiều nhất trong một tập dữ liệu. Một tập dữ liệu có thể có một mốt (unimodal), nhiều mốt (multimodal) hoặc không có mốt nào (nếu tất cả các giá trị đều xuất hiện với tần số bằng nhau).
Ví dụ, nếu chúng ta có tập dữ liệu: 2, 3, 3, 4, 5, 5, 5, 6. Mốt là 5, vì nó xuất hiện nhiều nhất (3 lần).
Mốt thường được sử dụng để mô tả các giá trị phổ biến nhất trong một tập dữ liệu.
Các số đặc trưng đo xu thế trung tâm được sử dụng rộng rãi trong nhiều lĩnh vực khác nhau, bao gồm:
Bài tập: Tính trung bình cộng, trung vị và mốt của tập dữ liệu sau: 10, 12, 15, 12, 18, 20, 12.
Giải:
Hiểu rõ về trung bình cộng, trung vị và mốt là nền tảng quan trọng để phân tích dữ liệu và đưa ra các kết luận chính xác. Việc lựa chọn số đặc trưng phù hợp phụ thuộc vào bản chất của dữ liệu và mục đích phân tích.