5 C
Damascus
12/07/2020
المركز الوطني للأبحاث واستطلاع الرأي
Image default
استطلاعات المركز معلومات عامة

المسوحات العلمية التي تعتمد على أطر عينات غير مكتملة ومعدلات عالية من عدم الاستجابة

ملخص

ترتكز الطرق التقليدية للبحوث المسحية التي تعتمد على نظرية الاحتمالات لـ نايمان المستندة على نموذج المعاينة في عدد من الافتراضات الأساسية التي تصبح صعبة التحقق الى حد كبير في بيئة البحث المسحي اليوم. من جهة، تخضع الطرق الشائعة لأخذ العينات لقضايا التغطية التي لا يمكن تحسينها بشكل كامل من خلال تعديلات الترجيح بعد المسح. ومن جهة أخرى، لا تزال معدلات الاستجابة لجميع الاستطلاعات اَخذة في التدهور، حتى عندما تُستخدم استراتيجيات تعديل الرفض الكثيفة للمصادر. إضافة إلى الحاجة المتزايدة لاحتواء التكلفة، لذا لم يعد مستغرباً لماذا تكتسب طرق أخذ العينات البديلة شعبية. سوف يستعرض الكُتّاب عدداً من الأساليب التي تُستخدم حالياً لتطوير الاستنتاجات من العينات التي لا تلتزم بشكل كامل للألية الإحصائية المتوفرة حاليا لمسوحات العينة التي تعتمد نظرية الاحتمالات. بالإضافة الى، منهجية ترجيح سليمة سيتم تقديمها، يمكن أن تقلل من التحيزات الأساسية المرتبطة باختيار العينات غير المحتملة، بالإضافة الى مسوحات العينة التي تعتمد على الاحتمال الذي يعاني من إطارات غير مكتملة ومعدلات مرتفعة من عدم الاستجابة. يتم تقييم فعالية المنهجية المقترحة في ضوء مقارنات تقييمات المسح بمعايير خارجية، معتمدة على مسوحات موازية أُجريت في ولايتين مستخدمة العينات التي ترتكز على الاحتمال وتلك التي لا تعتمد على الاحتمال.

نظرة عامة

على مدى عقود، كانت الأساليب التقليدية لأخذ العينات على أساس نظرية الاحتمال بمثابة معيار ذهبي لتطبيقات البحث المسحي. وبالاعتماد على الآلات الإحصائية التي طورها نايمان (1934)، كان من الممكن تقديم استنتاجات قابلة للقياس حول السكان المستهدفين، عندما يتم اختيار احتمالات اختيار معروفة لوحدات العينات وعينات من أطر عينات كاملة. وعلاوة على ذلك، فإنه تم تفسير أي عدم استجابة ملحوظ إما بافتراض عشوائية عدم الاستجابة أو بتطبيق التعديلات التعويضية بعدم تجاهل التباينية. بالتأسيس على هذا الإطار الصلب والاعتماد على معدلات الاستجابة المرتفعة إلى حد ما، كانت المسوحات المصممة والمنفذة بشكل جيد قادرة على انتاج تقديرات موثوقة لمعايير السكان المرتكزة على عينات صغيرة نسبيا. على هذا النحو، كانت مسوحات العينة بمثابة اساس لصناعة القرارات المبنية على البيانات.

لكن، تأمين المبدئين الرئيسين لأخذ عينات المسوح– أي سهولة الحصول على أطر عينات كاملة ومعدلات مرتفعة للاستجابة – أصبح صعباً، لأن العديد من المسوحات تخضع لتزايد مشاكل التغطية و معدلات تدهور الاستجابة (بينير وآخرون. 2004؛ كيتر وآخرون 2006).

بناء على ذلك، يضطر الباحثون للاعتماد بشكل أكبر على تعديلات الترجيح لعلم السكان للتعويض عن التحيز اثناء الاختيار وعدم الاستجابة. ومع ذلك، هذا الحد من التحيز، يأتي على حساب تقلص دقة المسوحات، لأن الترجيح يضخم تباين تقديرات المسح (فهمي وآخرون 2007).

في هذا السياق، عندما يكون على الكثير من المسوحات تقبل معدلات الاستجابة المنخفضة واطارات العينات بمستويات مختلفة من التحيز في الاختيار، حيث تبدأ مسوحات العينات التي اعتمدت على الاحتمالية بفقدان حقوق التفاخر مقارنة مع البدائل ذات التكلفة الأقل التي تستخدم طرق أخذ عينات ملاءمة. بعد كل هذا، يوجد فقط الكثير من تعديلات ترجيح تقليدية يمكن أن تنجز بإعادة تنظيم المستطلعة اراءهم في المسح لتمثيل مجموعاتهم السكانية المستهدفة – حتى عند التغاضي عن ضربات كبيرة في دقة تقديرات المسح بسبب آثار ترجيح غير متساوية. في ضوء هذه التحديات الهائلة من المفترض أن يكون مستقبل أخذ العينات على الأرجح في أيدي شخصيات ممن لم يشملهم المسح بعد (برك 2011).

الحاجة إلى الابتكار

على عكس ما كان الحال عليه قبل قرن من الزمان عندما اُعتبر التعداد الكامل الطريقة الوحيدة التي يمكن الاعتماد عليها لدراسات السكان، في العقود الأخيرة، برزت نظرية الاحتمالات التي تعتمد على مسح العينات كبديل مقبول عالميا لخلق إحصاءات سكانية موثوقة وفعالة من حيث التكلفة (كروسكال وموستلر 1980). بالركائز الأساسية لهذه المنهجية – توفر أطر معاينة كاملة ومعدلات مرتفعة للاستجابة – بدأت تتقوض، يمكن القول أن مسح العينات سيخدم بشكل أفضل إذا ما اعتمد الباحثين مقاربة ذات شقين عندما تكون خيارات التحقيق مبتكرة للمستقبل.

أولا، لا بد من تطوير أساليب فعالة من حيث التكلفة لخيارات ادارة المسح وأخذ العينات، يمكنها تحسين التغطية والتقليل من عدم الاستجابة في الوقت نفسه. تُعتبر التحسينات الأخيرة في أخذ العينات على أساس العنوان (ABS) ومنهجيات الاطر المزدوجة RDD (DFRDD) أمثلة على هذا النوع من التحقيق (فهمي 2009a، 2009 b). علاوة على ذلك، ينبغي على بروتوكولات مسح عينة أخرى أن تعتبر ذلك غير متجذر في النموذج الذي يعتمد على الاحتمال الكلاسيكي. التسامح المتزايد مع مثل هذه البدائل أمر محتوم، لأن مسح العينات يرتكز على الطرق التقليدية – بالإضافة إلى أن قضايا التغطية ومعدل الاستجابة – غالبا ما تكون باهظة التكلفة للعديد من التطبيقات (بيكر وآخرون 2013).

ثانيا، يجب التحقيق في اتخاذ تدابير علاجية أكثر فعالية يمكن ان تعوض عن تزايد معدلات التحيز في الاختيار وعدم الاستجابة. هذا ينطبق على كل من العينات التي تعتمد على الاحتمال وتلك التي لا تعتمد على الاحتمال، لأنه يمكن لكلا العينتين أن تنتهيان الى التمثيل الخاطئ للسكان المستهدفين في طرق قابلة للقياس وطرق غير قابلة للقياس. ومن هذا المنظور تبحث هذه الورقة منهجية الترجيح (المعايرة) التي تتجاوز تعديلات ترجيح الجغرافيا السكانية التي يشيع استخدامها منذ ذلك الحين، في كثير من الحالات، مثل تعديلات الجغرافيا السكانية لم تعد توفر تصحيحات كافية بوجود تحيز شديد في الاختيار وحالة عدم الاستجابة.

معايرة 0.1

لوحة المعرفة، (KP, GfK أمريكا الشمالية، نيويورك، الولايات المتحدة الأمريكية) هي أكبر لوحة انترنت في الولايات المتحدة تضم أكثر من 55000 عضو لكل لجنة وقد تم اختيارهم مع احتمالات معروفة من إطار ABS الذي يمثل عائلات الولايات المتحدة. ومع ذلك، تعتمد معظم مسوحات الإنترنت على عينات متضمنة في العينات غير الاحتمالية، بما في ذلك جماعات غير معروفة من مستخدمي الانترنت ممن لديهم اختيار الانضمام الى هذه اللوحات المخصصة للمشاركة في المسح. اقترح دسوغرا وآخرون (2011) منهجية يتم من خلالها استكمال عينة KP التي ترتكز على الاحتمال مع تلك التي لا تعتمد على الاحتمال، المشتركة في لوحات (OP) لزيادة حجم العينة المركبة أو للتعامل مع مسوحات المجموعات الفرعية التي يصعب الوصول إليها. على وجه التحديد، تُستخدم أداة مطابقة بواسطة الانترنت لإدارة عمليات المسح لعينات اختيرت من لوحات KP و .OPدسوغرا وآخرون. أثبتت أن المشاركين من OP، مقارنة مع أولئك من KP، يميلون إلى تسجيل درجات أعلى بكثير على مجموعة قصيرة من الأسئلة التي تقيس الاعتماد المبكر (EA) لمنتجات وخدمات جديدة:

EA1. أجرب عادة منتجات جديدة قبل أن يجربها الآخرون

EA2. غالبا ما أجرب أنواع جديدة لأنني أحب التنوع واشعر بالملل مع الشيء القديم نفسه.

EA3. عندما اتسوق ابحث عما هو جديد0

EA4. أود أن أكون الأول من بين اصدقائي وعائلتي لتجريب شيء جديد.

EA5. أود أن أخبر الآخرين عن الانواع أو التكنولوجيا الجديدة المزودة بـ الاختلافات الملحوظة بين المستطلعة أرائهم من OP وKP، وقد طور تعديل ترجيح المعايرة تلك المحاولات لتصحيح التحيز المنهجي بسبب الميل العالي للمستطلعة آرائهم من OP لأن يكونوا المعتمدين الأولين. هذه المنهجية متجذرة في التقنيات التي وصفها سكينر (1999) وكوت(2006) حيث يتم الحصول على مقاييس المعايرة المطلوبة من مسح الاحتمال الموازي KP على الانترنت، الذي تم ترجيحه بشكل منفصل لمعايير الجغرافيا السكانية القياسية.

وفي وقت لاحق، حققت بيانات معايرة OP و KP المشتركة تقييمات مسح لا تطابق توزيعات EA فحسب- المطبقة في المعايرة – ولكن أيضا تظهر صحة داخلية متطورة فيما يتعلق بالمعلمات السكانية الأخرى حسب تقديرات بيانات KP المرجحة.

تجمع نسخة منقحة قليلا للمنهجية المذكورة أعلاه بين مسوحات KP وOP باستخدام عملية المزج المثلى التي ترتكز على أحجام عيناتها الفعالة (فهمي 1994). خاصة، عندما يتم ترجيح العنصر KP لمعايير الجغرافيا السكانية القياسية، ويتم احداث تصنيفات دراسة محددة للمجموعة EA لمعايرة المكون OP.

وفي وقت لاحق، يرُجح مكون العينة OP مع نفس مستوى معايير الجغرافيا السكانية بالإضافة الى تصنيفات EA المرتكزة على KP. ثم، يتم حساب أحجام عينة فعالة لهذين العنصرين، حيث يحسب تأثير التصميم لمكون KP فقط لتأثير ترجيح غير متساو وفق أخر الطبقات. وهذا ضروري لأنه لا يوجد لعينات OP احجام تصميم متاحة، وبالتالي، تعكس “اّثارهم التصميمية ” فقط أخر طبقة- عينات تحركها الحصة النسبية يمكن أن تسفر بشكل استثنائي عن تأثيرات تصميم شبه منخفضة. في الخطوة النهائية، يتم مزج العنصرين في نسب أحجام عيناتهم الفعالة يتم ترجيحهم للمرة الأخيرة لمجموعة معايير الجغرافيا السكانية وتصنيف EA.

في حين يحمل التعديل البسيط أعلاه مطالبة بديهية وواقعية، فإن خصائص EA ليست التدابير الوحيدة المتعلقة بأي من المستطلعة آرائهم من OP وKP المختلفة اختلافاً كبيراً. علاوة على ذلك، اظهرت مجموعة من تحليلات العوامل أن الاستفادة من كل خصائص الـ EA المذكورة أعلاه تستثمر في نفس القياس المحتمل، مما يجعل الطريقة المقترحة لتسوية المعايرة وحيد المتغير.

كما هو موضح في المقطع التالي، هناك تدابير أخرى تشير إلى أن المجموعتين المستطلعة آرائهم تفكر وتتصرف بشكل مختلف. يسعى هذا البحث لتحديد مجموعة من الاختلافات الأساسية وتطوير منهجية تسوية المعايرة متعددة المتغيرات التي لا تُحسن الصحة الداخلية وحسب، بل تحسن الصحة الخارجية للتقديرات المسحية. تُطبق هذه المنهجية على كلا المسحين التي تعتمد على العينات القائمة على الاحتمال أن تخضع إلى معدلات مرتفعة من التحيز في الاختيار وعدم الاستجابة، وكذلك لعينات OP التي تم اختيارها من احتمالات غير معروفة.

معايرة 0.2

بهدف تحسين وتطوير منهجية المعايرة الحالية من إجراء أحادي المتغير إلى اجراء أكثر شمولا ومتعدد المتغيرات في الطبيعة، تم تنفيذ عددا من التقييمات الموازية. أولا، كان من الضروري لتحديد أبعاد سلوكية و مواقفية اخرى يمكن أن تمييز بشكل فعال بين استطلاعين للمستطلعة اراءهم. تم انجاز هذه المهمة نحو رياضيات جديدة لمسح عينة في القرن الـ 21 من خلال إجراء عدة مسوحات KP وOP بالتوازي، شملت مجموعة مشتركة من الأسئلة على مجموعة متنوعة من الموضوعات. تم الحصول على هذه الأسئلة خلال سلسلة من جلسات العصف الذهني مع خبراء الموضوع، بالإضافة الى تيارات الأبحاث الأخرى التي تعالج مسألة الحد من التحيز لعينات غير محتملة، بما في ذلك: دافي وآخرون. (2005)؛ لي (2006)؛ ريني وآخرون.

(2013)؛ شونلو وآخرون. (2007)؛ سميث وآخرون. (2013)؛ تيرهانيان وبريمر (2012).

تم جمع بيانات المسح مرة واحدة في هذه القائمة الطويلة حول التفاضلات المحتملة، كانت القائمة المنبثقة مغربلة لتشمل بضع عشرات من الأسئلة فقط حول أي من KP وOP المستطلعة اراءهم قدم استجابات مختلفة إلى حد كبير في عدد من الدراسات الموازية. اُكتشفت الخلافات بعد أن تم ترجيح مجموعتين من البيانات لمجموعة شاملة من متغيرات الجغرافيا السكانية للقضاء على آثار الالتباس. قائمة مختصرة من التفاضلات الناشئة والأفكار الرئيسية وضعت في قائمة في الجدول 1.

في الخطوة الثالثة، أجريت عملية مسح إضافية موازية، لتحديد أي مجموعة فرعية من التفاضلات الهامة الناتجة يمكن أن تقدم متغيرات معايرة جديدة لتطوير الصحة الخارجية لنتائج المسح. بالإضافة الى تضمين قائمة أفضل من أسئلة التمييز، كما تم تضمين قائمة إضافية من الأسئلة في أدوات المسح لتحقيق الهدف من تقييم معلمات السكان لأي من التقديرات الخارجية الموثوقة التي كانت متاحة (انظر إلى الجدولين 2 و3). تم احتساب الخطأ التربيعي الوسطي (MSE) المطابق، لكل تقدير من خلال حساب مقياس التبدل والانزياح المبني على تصميمه الأصلي كالمفاضلات الكبيرة في الجدول 1 بين المستطلعة آرائهم من KP وOP.

 

.A الانخراط الاجتماعي

1. أخذ عطلة مع الآخرين

2 ممارسة / لعب الرياضة مع الآخرين

3. تناول وجبات الطعام مع الآخرين

B. الاعتداد بالذات

1. أهمية تبادل الآراء.

2. قوة الآراء

3. الثقة في الأوساط الاجتماعية

C. عادات التسوق

. استخدام الكوبونات للتسوق

. التمتع بالتسوق عبر الإنترنت

. تصنيف النوع أكثر أهمية من سعر

D. السعادة والأمن

1. السعادة في الحياة

2. الشعور بعدم الأمان والوحدة

3. الشعور بالقلق إزاء أمن الانترنت

E. السياسة

1. التأثير على السياسة

2. فعالية الحكومة

3. متابعة الأخبار عن كثب

F. المجتمع

1. الشعور كجزء من المجتمع

2. التحركات في السنوات الخمس الماضية

3. مدى التدين

G. الإيثار

1. التبرع بالدم

2. بنود التبرع

3. العمل التطوعي

H. المشاركات في المسح

1.تجربة المسوحات عبر الإنترنت

2.هام في اجراء المسوحات

3. تكرار المسوحات عبر الإنترنت

.I الإنترنت ووسائل الإعلام الاجتماعية

1. تكرار الرسائل البريدية الشخصية

2. تكرار دخول الانترنت

3. الوقت الذي يقضيه في مشاهدة التلفزيون يوميا

الجدول 2 أسئلة اضافية لتقييم فعالية نماذج المعايرة للإحصاءات الحكومية.

A. BRFSS (2013)

B. CPS (2014)

1. تدخين 100 سيجارة مدى الحياة

1. استلام الضمان الاجتماعي

2. الفحص البدني في السنة الماضية

2. الحالة الاجتماعية

3. تاريخ الاضطراب الاكتئابي

3. حالة ملكية المنزل

4. أيام في الشهر الصحة البدنية ليست جيدة

4. الدخل الاسري أقل من 25،000 $

5. ساعات النوم في الليلة

C. NSDUH (2012–2013)

(D.ACS (2011–2013

1. ارتداء حزام الأمان كـراكب في المقعد الامامي

1. عدد غرف النوم في المنزل

2. مخاطر التدخين علبة واحدة أو أكثر يوميا

2. عدد السيارات

3. المخاطر عند تجريب الهيروين مرة واحدة أو مرتين

مقارنة مع تقيم غير متحيز مفترض الحصول عليه المصادر حكومية التالية:

علاوة على ذلك، أجريت مقارنات مماثلة من فيما يتعلق بسلسلة من التدابير ذات الصلة بالانتخابات لأي تقديرات خارجية كانت موجودة.

المنهجية

كجزء من دراسة أكبر حول نتائج الانتخابات في ولايتين في عام 2014، أجريت مجموعتين من مسوحات موازية، إحداهما في ولاية إيلينوي، والثانية في جورجيا، وذلك باستخدام كلا من مكونات العينة

KP وOP. شملت الدراستان مجموعتين مماثلتين من الأسئلة التي يمكن استخدامها لثلاثة أغراض: أسئلة الجغرافيا السكانية القياسية للترجيح، اسئلة تمييز للاختبار بنماذج معايرة مختلفة، و اسئلة اضافية لتقييم فعالية النماذج المستخدمة المتعلقة بالمعايير الخارجية المتاحة. يقدم الجدول 4 ملخص حول احصاءات المستطلعة اراءهم لكل مسح ولكل ولاية. وفقا لذلك، تم انجاز 4982 مسح ؛ 2213 منها في جورجيا؛ والباقي وهو 2769 في ولاية إيلينوي. وكان عدد مسوحات OP المنجزة، تقريبا يبلغ ضعف مسوحات KP.

باستخدام المجموعات الفرعية المتنوعة لمتغيرات المعايرة الجديدة على النحو الموجز في الجدول 1، تم تقييم نماذج معايرة مختلفة بهدف تطوير الجدول 3 أسئلة اضافية لتقييم فعالية نماذج المعايرة لإحصاءات الانتخابات.

A. إلينوي

B. جورجيا

1. النسبة المئوية للناخبين المسجلين

4. النسبة المئوية للناخبين المسجلين

2. النسبة المئوية للجمهوريين

5. النسبة المئوية للجمهوريين

3. النسبة المئوية للمحافظين

6. النسبة المئوية للمحافظين

4. انتخابات مجلس الشيوخ

7. انتخابات مجلس الشيوخ في تشرين الثاني.

5. انتخابات المحافظين

8. انتخابات المحافظين في تشرين الثاني

6. التغطية التأمينية لتحديد النسل

الجدول 4 ملخص احصاء المستطلعة آراءهم حسب نوع المسح والدولة

الدولة

عدد المستطلعة آرائهم

KP

OP

Total

جورجيا

654

1559

2213

إلينوي

1017

1752

2769

الكلي

1671

3311

4982

صحة نتائج المسح الخارجية. قُدمت هذه التقييمات وفقاً لسيناريوهات المسح التالية:

.A رجحت بيانات مسح kp فقط لمتغيرات الجغرافيا السكانية القياسية.

  1. B. دُمج وُرجح مزيج من بيانات المسح المركبة من KP وOP لمتغيرات الجغرافيا السكانية القياسية، مع بيانات OP التي تمت معايرتها باستخدام المجموعة EA (المعايرة0.1)
  2. C. رُجحت بيانات مسح OP فقط لمتغيرات الجغرافيا السكانية.
  3. D. رُجحت بيانات مسح OP فقط لمتغيرات الجغرافيا السكانية وتمت معايرتها باستخدام المجموعة EA (المعايرة0.1)
  4. E. رُجحت بيانات مسح OP فقط لمتغيرات الجغرافيا السكانية، وتمت معايرتها باستخدام المجموعة الجديدة (المعايرة 0.2)؛

.F وتم مزج وترجيح بيانات المسح المدموجة من KP وOP لمتغيرات الجغرافيا السكانية القياسية، مع البيانات التي تمت معايرتها مع OP باستخدام المجموعة الجديدة (المعايرة 2.0).

النتائج

بعد فحص تخفيض معدل ​​MSE لتقييم إحصاءات الحكومة الموجزة في الجدول 2، حُددت المجموعة الفرعية لمتغيرات المعايرة الناتجة في أكبر انخفاض بمعدل تضخم أصغر تباين كـنموذج معايرة 0.2 الحالي. ونظرا للمحدودات البراغماتية لمعظم البحوث التجارية لا يمكن اضافة أكثر من 6-8 اسئلة حصريا لأغراض المعايرة، أُنجز التحديد لهذه الفرعية الشحيحة جداً في خطوتين. وتجدر الإشارة إلى أنه بهدف الإيجاز، تفصيل هذه الخطوات، التي تضمنت الكثير من التفاصيل الكمبيوترية، تُحفظ في حدها الأدنى، ويتم تسليط الضوء فقط على النقاط الرئيسية.

في الخطوة الأولى، أجريت سلسلة من تحليلات CHAID لتحديد المتغيرات وفقاً للأهمية النسبية للتمييز بين المستطلعة آرائهم من KP و OP.

من بين أفضل المفاضلات الناشئة، في الخطوة الثانية، تم حساب متوسط ​​MSE لمختلف نماذج المعايرة مع مجموعات فرعية مؤلفة من 6-8 متغيرات. في نهاية المطاف، تم اختيار المجموعة الفرعية بمعدل MSE وتأثير الترجيح غير المتساوي الاجمالي الأصفر عموما، كنموذج أفضل مجموعة فرعية. ​​ كما شملت معايرتنا نموذج2.0 المجموعة الفرعية التالية للمتغيرات:

  1. عدد المسوحات التي اتخذت في شهر على الإنترنت.
  2. الساعات التي اُنفقت على الانترنت في اسبوع لتلبية الاحتياجات الشخصية.
  3. الفائدة من تجريب المنتجات الجديدة قبل قيام الآخرين بذلك؛
  4. الوقت الذي تم قضاءه لمشاهدة التلفزيون في يوم واحد.
  5. استخدام القسائم أثناء التسوق.
  6. عدد إعادة التوطين في السنوات الخمس الماضية.

كما يتضح من الشكل 1، تطورت الصحة الخارجية لبيانات مسح كل منKP ومنKP + op بشكل ملحوظ عندما يتم استبدال تعديل المعايرة ( (0.1التي ارتكزت على EA.

بمعايرة متعددة الأبعاد باستخدام المتغيرات 6 المذكورة أعلاه (0.2). يتم قياس هذه الصحة فيما يتعلق بتقدير الإحصاءات التي ذُكرت في المسوحات الحكومية – BRFSS، NSDUH، CPS، وACS – التي لم خاضعة للرقابة أثناء عملية الترجيح / المعايرة. وهناك نقطة رئيسية يجب ملاحظتها، وهي أن نموذج المعايرة الجديد يتفوق على نهج المعايرة 0.1 حتى عندما يتم استخدام بيانات المسح OP دون أي مساهمة من عنصر عينة من KP. بالإضافة الى أن، بيانات المسح KP – وحدها أو مندمجة مع OP

– تقدم مستوى أعلى من الصحة الخارجية في كلا البلدين.

أجريت تقييمات مماثلة بالنسبة للمتغيرات المدرجة في الجدول 1 مطابقة لنتائج انتخابات تشرين الثاني لعام 2014 في جورجيا وإلينوي. كما رأينا في الشكل 2، يمكن استخلاص المجموعة نفسها من الاستنتاجات عند فحص مثل هذه النتائج. وهذا يعني أن منهجية المعايرة الجديدة تُحسن الصحة الخارجية لتقديرات المسح عند النظر في نتائج KP و OPالمندمجة، وكذلك عندما يتم استخدام بيانات OP لتقيمها وحدها.

الاستنتاجات

تخضع صناعة البحث المسحي حاليا لحالة تغير مستمر بسبب التحديات الهائلة التي تشكك في الصحة الخارجية للماكينات الإحصائية التي اعتمدنا عليها لعقود، لتطوير الاستنتاجات القابلة للقياس لمعايير السكان باستخدام عينات تعتمد على الاحتمال. ولعل من أهم هذه التحديات هي قضايا التغطية التي يخضع لها أطر المعاينة الحالية، حتى تلك التي تستخدم منهجيات ABS أو DFRDD. ربما يحدث تحديا كبيراً بمعدلات تدهور الاستجابة لكافة المسوحات تقريباً، حتى المسوحات الحكومية ذات النطاق الواسع. وبطبيعة الحال، فإن هذه التحديات أكثر وضوحا على النطاق الضيق و على المسوحات التجارية المقيدة بميزانيات أقل، وفترات ميدانية أقصر. على سبيل المثال، تسعى معظم مسوحات الإنترنت للحصول على معدلات استجابة أعلى من أرقام أحادية، وعلى المعدلات القائمة على عينات مشتركة حققت معدلات انجاز تقل عن واحد في المئة.

الشكل 1 معدل ​​ MSE تقييم الإحصاءات الحكومية بموجب /تسويات معايرة ترجيح مختلفة من جانب الدولة.

s_p1

الشكل 2 معدل MSE تقييم احصاءات الانتخاب بموجب /تسويات معايرة ترجيح مختلفة من جانب الدولة.

s_p2

بينما في العقود الأخيرة تم تطوير حلول فعالة للتعامل مع مشاكل التغطية وعدم الاستجابة، خضعت فعالية مثل هذه العلاجات لتساؤلات جدية حول مشاكل حجم التحييز في الاختيار وعدم الاستجابة المستمر في التزايد. شيء واحد يفسر معدل ـ10٪ عدم استجابة لعينة تم اختيارها من إطار شبه كامل بافتراض عشوائية لعدم الاستجابة، وربما تطبيق شكل من أشكال تسوية عدم الاستجابة، ولكن شيء آخر تماما أن تلجأ إلى نفس التفسيرات عندما يبقى أكثر من 100 % من وحدات العينة غير مفسر. على هذا النحو، أصبحت طرقنا التقليدية في الترجيح التي تعتمد على تعديلات الجغرافيا السكانية الأساسية غير فعالة على نحو متزايد.

محاولاتنا المنهجية المقترحة لتجاوز إجراءات الترجيح التقليدي بواسطة تطبيق تسويات أكثر شمولا، وذلك باستخدام تدابير سلوكية و مواقفية بقيت تاريخياً خارج نطاق البحث لحسابات أهمية المسح. ، في حين لا أدعي أن أبحاثنا وجدت “الخلطة السرية” لكافة تطبيقات المعايرة، فقد أظهرت وعوداً كبيرة للتقليل من التحيز المنهجي في بيانات المسح اليوم. المنهجية المقترحة ليست مطبقة على عينات غير قابلة للاحتمال فحسب، بل مطبقة أيضاً على الاحتمال الذي يعتمد على عينات من أُطر غير مكتملة، خاضعة لمعدلات عالية من عدم الاستجابة.

يتم قياس فعالية منهجيتنا بالنظر الى الخصائص الاستنتاجية المحسنة لبيانات المعايرة عند تقدير معلمات السكان حيث تتوفر تقييمات ذات جودة العالية. وتشمل هذه التقييمات من مسوحات الحكومة، مثل CPS، ACS، BRFSS، وNSDUH، بالإضافة الى، تقديرات لهذا الغرض، مثل تلك المتعلقة بنتائج الانتخابات.

أخيرا، سنكون مقصرين إذا لم نذكر النتائج المحتملة المرتبطة بمنهجية معايرتنا المقترحة. بالنظر إلى أنه تتم ممارسة تخفيض التحيز من خلال الترجيح دائما على حساب معدل تضخم التباين، كلما تم تضمين متغيرات أكثر في عملية معايرة / الترجيح، يصبح حجم العينة الأصغر فعالاً للمسح. ربما التشبيه المناسب في الحقل الطبي في هذا السياق سيكون، كلما ترتفع شدة المرض ترتفع جرعة الدواء المطلوبة بالتزامن. بصورة متناظرة، كلما يصبح تشويه عينة أكثر تفاقماً، تصبح تسويات ترجيح أقوى، ضرورية لاسترداد الصحة (التمثيل) للعينة في السؤال. تجاهل هذه الحقيقة لصالح إعلان حجم عينة فعال أكثر فعالية سيكون تفكير رغبي، ممارسة متهورة يمكن أن تؤدي إلى استنتاجات خاطئة استنادا إلى تقييمات منحازة وهوامش خطأ تمت الاستهانة بها مع آثار مكلفة.

المراجع

Baker, R., J.M. Brick, N.A. Bates, M. Battaglia, M.P. Couper, J.A. Dever, K.J.

Gile and R. Tourangeau. 2013. The AAPOR Report on Non-Probability

Sampling. Available at: http://www.aapor.org/AAPORKentico/AAPOR_

Main/media/MainSiteFiles/NPS_TF_Report_Final_7_revised_FNL_6_22_13.pdf.

Biener, L., C.A. Garrett, E.A. Gilpin, A.M. Roman and D.B. Currivan. 2004.

Consequences of declining survey response rates for smoking prevalence

estimates. American Journal of Preventive Medicine 27(3): 254–257.

Brick, J.M. 2011. The future of survey sampling. Public Opinion Quarterly,

Special Issue 75(5): 872–888.

DiSogra, C., C. Cobb, M. Dennis and E. Chan. 2011. Calibrating nonprobability

Internet samples with probability samples using early adopter

characteristics. Proceedings of the American Statistical Association, Section

on Survey Research. Joint Statistical Meetings (JSM). Miami Beach, FL.

Duffy, B., K. Smith, G. Terhanian and J. Bremer. 2005. Comparing data from

online and face-to-face surveys. International Journal of Market Research

47(6): 615–639.

Fahimi, M. 1994. Post-stratification of pooled survey data. Proceedings of the

American Statistical Association. Survey Research Methods Section, Toronto, Canada.

Fahimi, M., D. Creel and P. Levy. 2007. Evaluation of weighting methodolog for the behavioral risk factor surveillance system. Joint Statistical Meetings

(JSM). Salt Lake City, UT.

Fahimi, M., D. Kulp and M. Brick. 2009a. A reassessment of list-assisted RDD

methodology. Public Opinion Quarterly 73(4): 751–760.

Fahimi, M. and D. Kulp. 2009b. Address-based sampling – alternatives for surveys that require contacts with representative samples of households.

Quirk’s Marketing Research Review, May 2009.

Towards a New Math for Sample Surveys in the 21st Century 11

Keeter, S., C. Kennedy, M. Dimock, J. Best and P. Craighill. 2006. Gauging

the impact of growing non-response on estimates from a National RDD

Telephone Survey. Public Opinion Quarterly 70(5): 759–779.

KnowledgePanel. 2015. Available at http://www.gfk.com/us/Solutions/

consumer-panels/Pages/GfK-KnowledgePanel.aspx.

Kott, P.S. 2006. Using calibration weighting to adjust for non-response and

coverage errors. Survey Methodology 32(2): 133–142.

Kruskal, W. and F. Mosteller. 1980. Representative sampling IV: the history of

the concept in statistics, 1895–1939. International Statistical Review/Revue

Internationale de Statistique 48: 169–195.

Lee, S. 2006. Propensity score adjustment as a weighting scheme for volunteer

panel web surveys. Journal of Official Statistics 22(2): 329–349.

Neyman, J. 1934. On the two different aspects of the representative method: the

method of stratified sampling and the method of purposive selection. Journal

of the Royal Statistical Society 97(4): 558–625.

Rainie, L., S. Kiesler, R. Kang and M. Madden. 2013. Anonymity, privacy, and

security online. Washington, DC: Pew Research Center’s Internet & American

Life Project. Available at: http://pewinternet.org/Reports/2013/Anonymityonline.

aspx.

Skinner, C. 1999. Calibration weighting and non-sampling errors. Research in

Official Statistics 2: 33–43.

Schonlau M., A. Van Soest and A. Kapteyn 2007. Are ‘webographic’ or

attitudinal questions useful for adjusting estimates from web surveys using

propensity scoring? Survey Research Methods 1(3): 155–163.

Smith, T.W., P. Marsden, M. Hout and J. Kim. 2013. General social surveys, 1972–

2012: cumulative codebook. National Opinion Research Center, Chicago.

Terhanian, G. and J. Bremer. 2012. A smarter way to select respondents for

surveys? International Journal of Market Research 54(6): 751–780

 

Related posts

أفضل الأساليب عند إجراء الأبحاث المسحية

admin

مجلس الاستطلاع البريطاني: دليل الصحفي لاستطلاعات الرأي

admin

عشرون سؤالاً يجب على الصحفي أن يسألها عن نتائج الاستطلاع

admin

2 comments

Leave a Comment