Thứ Ba, 14 tháng 7, 2015

TK3. Thống kê mô tả: Các loại biểu đồ

Đối với biến phân loại, ta có thể dùng biểu đồ hình bánh (pie chart) hoặc biểu đồ thanh (bar graph). Biểu đồ thanh dễ đọc và cho nhiều thông tin hơn so với biểu đồ bánh. Ví dụ khi muốn mô tả sự khác biệt rất nhỏ giữa từng nhóm hoặc muốn thể hiện độ lệch chuẩn của mỗi nhóm, ta nên chọn biểu đồ thanh.
Pareto chart là biểu đồ thanh trong đó ta sắp xếp các nhóm (thanh) theo thứ tự tần số giảm dần, tức cột cao nhất đến cột thấp nhất. Biểu đồ này phác họa nguyên lý Pareto: một vài nhóm chiếm tần số cao nhất trong tổng số lượng quan sát.

Đối với biến định lượng, có 3 loại biểu đồ đó là: dot plot, stem-and-leaf plot và histogram.

Dot plot: Bao gồm một đường thẳng nằm ngang, trên đó thể hiện các giá trị nhận được của biến. Tiêu đề thanh là tên biến. Mỗi quan sát sẽ được thể hiện bằng 1 dấu chấm tròn ngay bên trên của giá trị tương ứng.  

Stem and leaf plot: Sắp xếp dữ liệu theo thứ tự từ nhỏ đến lớn. Mỗi quan sát được thể hiện bởi một stem và 1 leaf. Thông thường cột stems sẽ bao gồm toàn bộ chữ số, riêng chữ số cuối cùng nằm ở cột leaves.


Cả hai biểu đồ này có điểm mạnh là có thể thể hiện rõ giá trị của từng quan sát, phù hợp để mô tả dữ liệu có cỡ mẫu nhỏ và có thể biểu diễn hình dạng (shape) của phân bố.

Histogram: là biểu đồ trong đó có các thanh (bar) đặt liên tiếp, sát cạnh nhau để diễn tả tần số hoặc tần số tương đối (%) của một biến số. 
*Nguồn biểu đồ: Statistics, The Art and Science of Learning from data_3e, Agresti & Franklin

Không có nhận xét nào:

Đăng nhận xét