Thứ Năm, 20 tháng 8, 2015

TK13. Thu thập thông tin : Thế nào là một thiết kế nghiên cứu quan sát tốt ?

Hai phương pháp nghiên cứu : Quan sát và Thí nghiệm.
Phương pháp quan sát (observational study) nghĩa là nhà nghiên cứu chỉ quan sát những giá trị của biến giải thích và biến kết quả ở những đối tượng trong mẫu mà không có bất kỳ tác động nào lên các đối tượng này. Trong khi đó, ở phương pháp thí nghiệm (experimental study), nhà nghiên cứu tiến hành một số thay đổi trên mẫu và sau đó quan sát kết quả xảy ra ở biến số mà họ quan tâm.
Phương pháp thí nghiệm có ưu điểm hơn so với phương pháp quan sát vì nó giúp ta tìm ra mối quan hệ giữa biến giải thích và biến kết quả một cách chính xác hơn nhờ khả năng loại bỏ các biến giấu (lurking variables) bằng kỹ thuật ngẫu nhiên hoá (randomization). Tuy nhiên trên thực tế có nhiều nguyên nhân (đạo đức nghề nghiệp, thời gian, chi phí…) mà không phải lúc nào ta cũng có thể làm thí nghiệm. Hơn nữa, nếu mục đích không phải là đi tìm mối quan hệ nhân-quả thì nghiên cứu quan sát vẫn tỏ ra rất hữu dụng. Vì vậy, ta sẽ xem xét những cách thức để thiết kế một nghiên cứu quan sát có hiệu quả.

Thiết kết một nghiên cứu quan sát tốt
Dữ liệu có sẵn
Để thu thập dữ liệu cho nghiên cứu, nhà nghiên cứu tuyệt đối không dùng các thông tin mang tính điển tích-giai thoại, nếu muốn dùng dữ liệu có sẵn thì chỉ nên dùng những dữ liệu có sẵn từ những nguồn đáng tin cậy từ các tập san khoa học uy tín hoặc trang web thống kê của chính phủ.
Hầu hết các quốc gia đều tổ chức điều tra dân số (census) định kì trong đó họ thu thập thông tin về dân số quốc gia và dân số từng vùng. Tuy nhiên, khi điều tra dân số khó tiến hành vì tốn nhiều thời gian và có khi dữ liệu không đầy đủ thì điều tra chọn mẫu (sample survey) trở thành một giải pháp thực tế hơn nhiều bởi vì nó  cho phép chọn ra và thu thập thông tin từ một nhóm nhỏ (mẫu) trong quần thể.
Tự tìm dữ liệu
Ngoài dữ liệu sẵn có, nhà nghiên cứu (NNC) dĩ nhiên có lúc phải tự thu thập dữ liệu cho riêng nghiên cứu của mình. Đó là khi họ tiến hành điều tra chọn mẫu, nghĩa là chọn đối tượng nghiên cứu và thu thập thông tin từ những đối tượng này. Đầu tiên NNC xác định quần thể mình quan tâm và thiết lập khung mẫu (sampling frame)- một danh sách những đối tượng trong quần thể mà từ đó ta muốn lấy mẫu. Ví dụ quần thể mà ta quan tâm là tất cả sinh viên trong trường. Vậy thì khung mẫu là kỷ yếu sinh viên (hoặc danh sách các sinh viên đã đăng ký).
Thiết kế mẫu (sampling design) là phương pháp dùng để chọn đối tượng từ khung mẫu. Nguyên tắc cốt lõi của thiết kế mẫu là tính ngẫu nhiên. Đây cũng là nguyên tắc cơ bản của môn khoa học thống kê. Phương pháp lấy mẫu ngẫu nhiên đơn giản (simple random sampling) là phương pháp lấy mẫu trong đó lấy ra n đối tượng từ một quần thể và đảm bảo chắc chắn rằng mỗi đối tượng lấy ra đó có cùng một cơ hội được chọn.
Làm thế nào để chọn mẫu ngẫu nhiên ?  
Có 3 bước như sau :
  1. Đánh số các đối tượng trong khung mẫu bằng những số có độ dài (số chữ số) tương đương nhau.
  2. Chọn những số có cùng độ dài từ phần mềm tạo số ngẫu nhiên (thường được tích hợp sẵn trong phần mềm thống kê hoặc máy tính điện tử)
  3. Chọn những đối tượng có số trùng với con số ngẫu nhiên được tạo ở bước 2.
Thu thập thông tin
Những cách thức phổ biến dùng để thu thập thông tin trong điều tra chọn mẫu như phỏng vấn qua điện thoại, phỏng vấn trực tiếp, bảng câu hỏi (tự điền).
Công cụ đo lường tính chính xác của kết quả thu được từ điều tra chọn mẫu ngẫu nhiên (survey with random sampling) là sai số biên (margin of error). Với mẫu ngẫu nhiên đơn giản có n đối tượng, công thức ước tính sai số biên xấp xỉ :
\frac{1}{{\sqrt n }}.100\%
Một số thiên kiến tiềm tàng (potential bias) trong điều tra chọn mẫu 
Thiên kiến- bias xảy ra khi một vài bộ phận của quần thể được ưu ái hơn khi chọn mẫu và khiến cho kết quả thu được không đại điện đầy đủ cho quần thể. Chia bias theo nguyên nhân, ta có các loại bias:
  1. Sampling bias- thiên kiến chọn mẫu : chọn mẫu không ngẫu nhiên, không bao quát hết quần thể. Hai cách chọn mẫu khá phổ biến nhưng có khả năng gây thiên kiến cao đó là chọn mẫu thuận tiện (convenience samples) và chọn mẫu tình nguyện (volunteer samples).
  2. Non-response bias- thiên kiến không phản hồi : dữ liệu khuyết quá lớn
  3. Response bias –thiên kiến phản hồi : trả lời dối, sai sự thật, câu hỏi đánh lạc hướng hoặc dễ gây hiểu lầm…
Để kiểm tra những thiên kiến tiềm tàng thì việc làm đầu tiên là phải xem thiết kế chọn mẫu có tốt không, cỡ mẫu là bao nhiêu ? trong đó tỉ lệ không phản hồi (missing data) là bao nhiêu ? từ ngữ dùng trong câu hỏi khảo sát ra sao ? (có mang tính dẫn dắt hoặc gây nhầm lẫn không ?) ai tài trợ nghiên cứu này ? Nếu bạn biết rất ít về những thông tin này thì bạn càng không nên tin vội những kết quả mang lại.

Tóm lại, những điểm chính trong một cuộc điều tra chọn mẫu mà ta cần lưu ý đó là :
  1. Xác định quần thể mình cần tìm hiểu
  2. Thiết lập khung mẫu
  3. Chọn mẫu bằng phương pháp lấy mẫu ngẫu nhiên đơn giản để lấy ra n đối tượng thuộc khung mẫu.
  4. Chọn cách thức thu thập dữ liệu
  5. Và cuối cùng là, luôn coi chừng các thiên kiến tiềm tàng !

Không có nhận xét nào:

Đăng nhận xét