Đối với biến phân loại, ta có thể dùng biểu đồ hình bánh
(pie chart) hoặc biểu đồ thanh (bar graph). Biểu đồ thanh dễ đọc và cho nhiều
thông tin hơn so với biểu đồ bánh. Ví dụ khi muốn mô tả sự khác biệt rất nhỏ giữa
từng nhóm hoặc muốn thể hiện độ lệch chuẩn của mỗi nhóm, ta nên chọn biểu đồ
thanh.
Pareto chart là biểu đồ thanh trong đó ta sắp xếp các nhóm
(thanh) theo thứ tự tần số giảm dần, tức cột cao nhất đến cột thấp nhất. Biểu đồ
này phác họa nguyên lý Pareto: một vài nhóm chiếm tần số cao nhất trong tổng số
lượng quan sát.
Đối với biến định lượng, có 3 loại biểu đồ đó là: dot plot,
stem-and-leaf plot và histogram.
Dot plot: Bao gồm một đường thẳng nằm ngang, trên đó
thể hiện các giá trị nhận được của biến. Tiêu đề thanh là tên biến. Mỗi quan
sát sẽ được thể hiện bằng 1 dấu chấm tròn ngay bên trên của giá trị tương ứng.
Stem and leaf plot: Sắp xếp dữ liệu theo thứ
tự từ nhỏ đến lớn. Mỗi quan sát được thể hiện bởi một stem và 1 leaf. Thông thường
cột stems sẽ bao gồm toàn bộ chữ số, riêng chữ số cuối cùng nằm ở cột leaves.
Cả hai biểu đồ này có điểm mạnh là có thể
thể hiện rõ giá trị của từng quan sát, phù hợp để mô tả dữ liệu có cỡ mẫu nhỏ
và có thể biểu diễn hình dạng (shape) của phân bố.
Histogram: là biểu đồ trong đó có các thanh
(bar) đặt liên tiếp, sát cạnh nhau để diễn tả tần số hoặc tần số tương đối (%)
của một biến số.
*Nguồn biểu đồ: Statistics, The Art and Science of Learning from data_3e, Agresti & Franklin
Không có nhận xét nào:
Đăng nhận xét