Để thiết kế một thí nghiệm tốt NNC cần lưu
ý đến các điểm chính sau :
- Nhóm chứng (control comparison group)
- Ngẫu nhiên hoá (randomization)
- Phương pháp ‘mù đôi’ (double blind)
- Cỡ mẫu đủ lớn (large sample size)
- Lặp lại thí nghiệm (replication)
1. Nhóm chứng thường
là nhóm nhận giả dược hoặc nhận loại điều trị hiện tại. Giả dược (placebo) là một
loại thuốc giả mà các nhà nghiên cứu bào chế sao cho nó hoàn toàn không có một
tác dụng sinh lí gì lên đối tượng nghiên cứu, nhưng đồng thời cũng không làm hại
đến sức khỏe của họ. Placebo được bào chế
có hình dạng và mùi vị giống y như thuốc thật, với ý định không cho người dùng
phân biệt được thuốc thật hay giả. Giả dược được đưa vào nhóm chứng để triệt
tiêu placebo effect- một hiện tượng tâm lý mà người dùng thuốc phản ứng tốt hơn
bởi vì họ tin rằng họ đang được chữa trị bằng thuốc trong khi thực tế họ chỉ nhận
được giả dược.
2. Ngẫu nhiên hoá nghĩa
là chọn những đối tượng thí nghiệm một cách ngẫu nhiên (mà NNC không được biết
họ). Điều này giúp ta cân bằng nhóm đối tượng nghiên cứu và tránh các biến giấu
cũng như loại bỏ các thiên kiến từ NNC.
3. Phương pháp ‘mù đôi’: Để bảo đảm tính khách quan trong
khi thẩm định kết quả thí nghiệm, các nhà nghiên cứu trực tiếp làm việc với đối
tượng thí nghiệm không biết người nào đang nhận thuốc thật hay giả. Đối tượng tham gia cũng không biết mình dùng
thuốc thật hay giả. Đây là cách nghiên cứu
“double-blind”, tức cả hai thành phần trong
cuộc thử nghiệm đều “mù”. Trong
nhóm nghiên cứu, chỉ có một nhà nghiên cứu độc lập có danh sách bệnh nhân nhận
thuốc nào, và chính nhà nghiên cứu này phân tích dữ kiện và căn cứu vào các dữ
kiện này để đánh giá sự hữu hiệu của thuốc.
4. Cỡ mẫu càng lớn thì càng tốt. Khi cỡ mẫu tăng, sai số biên giảm.
Khi ta lặp lại nhiều lần thí nghiệm và thu
được kết quả khác nhau ở hai nhóm với mức độ chênh lệch cao (ví dụ như kết quả
thí nghiệm cho thấy tỉ lệ khỏi bệnh khi dùng thuốc thật và giả dược lần lượt là
55% và 44%) thì ta có thể dự đoán rằng sự khác biệt giữa hai nhóm có ý nghĩa thống
kê (statistically significant). Tuy nhiên, cần xét 2 trường hợp nhóm điều trị
có n=215 quan sát và n=1000 quan sát để xem liệu sự khác biệt này có phải đơn
thuần do tính dao động (variability) ngẫu nhiên không hay thực sự đúng là do hiệu
quả của thuốc.
- Với n=215, sai số biên là 7%, nghĩa là nếu tỉ lệ khỏi bệnh của quần thể là 50% thì tỉ lệ khỏi bệnh của mẫu dao động trong khoảng 7% của 50%, tức là từ 43% đến 57%. Như vậy tỉ lệ khác biệt 55% và 44% giữa hai nhóm có thể là kết quả của sự dao động ngẫu nhiên bình thường. Thật khó để tin tưởng rằng kết quả tìm được trong thí nghiệm là có ý nghĩa thống kê với mức dao động cao như vậy.
- Với n=1000, sai số biên là 3%, nghĩa là nếu tỉ lệ khỏi bệnh của quần thể là 50% thì tỉ lệ khỏi bệnh của mẫu dao động trong khoảng 3% của 50%, tức là từ 47% đến 53%. Như vậy tỉ lệ khác biệt 55% và 44% giữa hai nhóm ko thể chỉ là kết quả của sự dao động ngẫu nhiên bình thường mà phải do tác động thực sự của thuốc. Khi đó, ta nói rằng khác biệt giữa hai nhóm thí nghiệm là có ý nghĩa thống kê và thuốc thật có tác dụng hơn so với giả dược.
5. Lặp lại thí nghiệm (replication)
Dù cỡ mẫu lớn, vẫn có thể tồn tại khả năng
rằng do may mắn đơn thuần mà những đối tượng NNC chọn vô tình có những ưu thế
hoặc khác biệt so với phần còn lại của quần thể, làm cho kết quả thí nghiệm
không chính xác và không có tính phổ quát. Để thực sự chắc chắn rằng kết quả
thí nghiệm có thể phổ quát hoá cho một quần thể lớn hơn thì một thí nghiệm cần
phải bảo toàn kết quả của nó qua nhiều lần thí nghiệm riêng lẻ được thiết kế
tương tự bởi nhiều nhà khoa học khác và trên những mẫu khác nhau.