Tuesday 6 February 2018

البيانات في و الحسابية الفوركس التعامل مع المفقودين


16-1-2 160 المبادئ العامة لمعالجة البيانات الناقصة يوجد عدد كبير من المؤلفات من الأساليب الإحصائية لمعالجة البيانات الناقصة. هنا نستعرض بإيجاز بعض المفاهيم الأساسية ونقدم بعض التوصيات العامة لمؤلفي مراجعة كوكرين. من المهم التفكير في سبب فقدان البيانات. وغالبا ما يستخدم الإحصائيون المصطلحات المفقودة عشوائيا وغير المفقودين عشوائيا لتمثيل سيناريوهات مختلفة. ويقال إن البيانات مفقودة عشوائيا إذا كانت المفقودات غير ذات صلة بالقيم الفعلية للبيانات المفقودة. فعلى سبيل المثال، إذا فقدت بعض الاستبيانات المتعلقة بنوعية الحياة في النظام البريدي، فمن غير المحتمل أن تكون ذات صلة بنوعية حياة المشاركين في التجربة الذين أكملوا الاستمارات. وفي بعض الحالات، يميز الإحصائيون بين البيانات المفقودة عشوائيا والبيانات المفقودة تماما بشكل عشوائي، وإن كان من غير المرجح أن يكون التمييز مهما في سياق استعراض منهجي. قد لا تكون البيانات المفقودة عشوائيا مهمة. والتحليلات المستندة إلى البيانات المتاحة تميل إلى أن تكون غير متحيزة، وإن كانت تستند إلى حجم عينة أصغر من مجموعة البيانات الأصلية. ويقال إن البيانات ليست مفقودة عشوائيا إذا كانت المفقودات تتعلق بالبيانات المفقودة الفعلية. على سبيل المثال، في تجربة الاكتئاب، قد يكون المشاركين الذين يعانون من انتكاس الاكتئاب أقل احتمالا لحضور مقابلة المتابعة النهائية، وأكثر عرضة لنقص البيانات النتيجة. وهذه البيانات لا يمكن تجاهلها بمعنى أن تحليل البيانات المتاحة وحدها سيتحيز عادة. إن التحيز في النشر والتحيز الانتقائي في التقارير يؤدي، بحكم تعريفه، إلى البيانات التي لا تكون مفقودة عشوائيا، كما أن الاستنزاف والاستبعاد للأفراد ضمن الدراسات غالبا ما يحدث أيضا. والخيارات الرئيسية لمعالجة البيانات الناقصة هي. 1.160160160160160160160 لا تستعمل سوى البيانات المتاحة (أي تجاهل البيانات المفقودة) 2.160160160160160160160 تبقي البيانات المفقودة مع قيم الاستبدال، ومعاملتها كما لو أنها تمت ملاحظتها (على سبيل المثال، نقلت الملاحظة الأخيرة إلى الأمام، مما ينطوي على نتيجة مفترضة مثل افتراض أن كل النتائج كانت ضعيفة، متوسط، إمبوسينغ على أساس القيم المتوقعة من تحليل الانحدار) 3.160160160160160160160 تبسيط البيانات المفقودة والمحاسبة لحقيقة أن هذه كانت محسوبة مع عدم اليقين (على سبيل المثال حساب متعددة، وأساليب حساب بسيطة (كنقطة 2) مع تعديل للخطأ القياسي) 4.160160160160160160160 باستخدام نماذج إحصائية تسمح بالبيانات المفقودة، ووضع افتراضات حول علاقتها بالبيانات المتاحة. وقد يكون الخيار 1 مناسبا عندما يمكن افتراض أن البيانات مفقودة عشوائيا. والخيارات من 2 إلى 4 هي محاولات لمعالجة البيانات غير المفقودة عشوائيا. والخيار 2 عملي في معظم الحالات ويستخدم عادة في استعراضات منهجية. ومع ذلك، فإنه لا يعترف بعدم اليقين في القيم والنتائج المحسوبة، وعادة، في فترات الثقة التي هي ضيقة جدا. والخياران 3 و 4 يتطلبان مشاركة إحصائي معرفي. وفيما يلي أربع توصيات عامة لمعالجة البيانات الناقصة في مراجعات كوكرين. كلما كان ذلك ممكنا، اتصل المحققين الأصلي لطلب البيانات المفقودة. وضح بوضوح افتراضات أي طرائق تستخدم للتعامل مع البيانات الناقصة: على سبيل المثال، افتراض أن البيانات مفقودة عشوائيا، أو افتراض أن القيم المفقودة لها قيمة معينة مثل النتيجة الضعيفة. إجراء تحاليل الحساسية لتقييم مدى حساسية النتائج للتغيرات المعقولة في الافتراضات التي يتم إجراؤها (انظر الفصل 9، القسم 9.7). معالجة التأثير المحتمل للبيانات المفقودة على نتائج المراجعة في قسم المناقشة. مرحبا بكم في معهد البحوث والتعليم الرقمي وحدة التعليم ستاتا البيانات المفقودة 1. مقدمة ستستكشف هذه الوحدة البيانات المفقودة في ستاتا، مع التركيز على البيانات المفقودة الرقمية. وسوف تصف كيفية الإشارة إلى البيانات المفقودة في ملفات البيانات الخام الخاصة بك، وكذلك كيفية معالجة البيانات المفقودة في أوامر منطقية ستاتا وبيانات التعيين. سوف نقوم بتوضيح بعض خصائص البيانات المفقودة في ستاتا باستخدام بيانات من دراسة وقت رد الفعل مع ثمانية مواضيع أشار إليها المتغير معرف. وقياس زمن التفاعلات في ثلاث نقاط زمنية (trial1 trial2 trial3). يتم عرض ملف بيانات الإدخال أدناه. قد تلاحظ أن بعض أوقات التفاعل مشفرة باستخدام واحد. كما هو الحال بالنسبة للموضوع 2. الشخص الذي يقيس الوقت لتلك المحاكمة لم يقيس وقت الاستجابة بشكل صحيح، وبالتالي فإن البيانات عن المحاكمة الثانية مفقودة. 2. كيف تعالج ستاتا البيانات المفقودة في إجراءات ستاتا كقاعدة عامة، أوامر ستاتا التي تقوم بإجراء حسابات من أي نوع التعامل مع البيانات المفقودة عن طريق حذف القيم المفقودة. ومع ذلك، فإن الطريقة التي يتم حذف القيم المفقودة ليست متسقة دائما عبر الأوامر، لذلك Let39s نلقي نظرة على بعض الأمثلة. أولا، يلخص Let39s متغيرات وقت رد الفعل ونرى كيف ستاتا يعالج القيم المفقودة. كما ترون في الناتج أدناه، تلخيص وسائل محسوبة باستخدام 4 ملاحظات للمحاكمة 1 و trial2 و 6 ملاحظات للمحاكمة 3. وباختصار، أجرى الأمر تلخيص الحسابات على جميع البيانات المتاحة. مثال ثان، يوضح كيف يعالج الأمر تابولاتيون أو tab1 البيانات المفقودة. مثل تلخيص، tab1 يستخدم البيانات المتاحة فقط. ويلاحظ أن النسب المئوية تحسب استنادا إلى العدد الكلي للحالات غير المفقودة. من المحتمل أن تكون قد تم حساب النسب المئوية من إجمالي عدد المشاهدات، والنسبة المئوية مفقودة لكل متغير موضحة في الجدول. ويمكن تحقيق ذلك من خلال تضمين الخيار المفقود بعد الجدولة. الأمر، Let39s ننظر في كيفية معالجة الأمر ارتباط البيانات المفقودة. ونتوقع أن تؤدي الحسابات استنادا إلى البيانات المتاحة، وأن تحذف القيم المفقودة. هنا هو مثال الأمر. الإخراج هو عرض أدناه. لاحظ كيف تم استبعاد القيم المفقودة. سوف ستاتا تنفيذ حذف ليستويز وعرض فقط الارتباط للملاحظات التي لها قيم غير مفقودة على كافة المتغيرات المدرجة. ستاتا كما يسمح لحذف زوجي. يتم عرض الارتباطات للملاحظات التي لها قيم غير مفقودة لكل زوج من المتغيرات. يمكن القيام بذلك باستخدام الأمر بوكور. نحن نستخدم الخيار أوبس لعرض عدد من الملاحظات المستخدمة لكل زوج، كما ترون، فإنها تختلف اعتمادا على كمية المفقودين. 3. ملخص لكيفية معالجة القيم المفقودة في إجراءات ستاتا تلخيص لكل متغير، يتم استخدام عدد القيم غير المفقودة. الجدولة افتراضيا، يتم استبعاد القيم المفقودة وتستند النسب المئوية على عدد القيم غير المفقودة. إذا كنت تستخدم الخيار المفقود في أمر علامة التبويب، تستند النسب المئوية إلى إجمالي عدد المشاهدات (غير المفقودة والمفقودة) والنسبة المئوية للقيم المفقودة مذكورة في الجدول. كور افتراضيا، يتم حساب الارتباطات استنادا إلى عدد الأزواج مع البيانات غير المفقودة (حذف زوجي للبيانات المفقودة). يمكن استخدام الأمر بوكور لطلب أن يتم حساب الارتباطات فقط للملاحظات التي تحتوي على بيانات غير مفقودة لجميع المتغيرات المدرجة بعد أمر بوكور (حذف قائمة البيانات المفقودة). ريج إذا كان أي من المتغيرات المدرجة بعد أمر ريج مفقودا، فإن الملاحظات التي تفتقد تلك القيمة (القيم) مستبعدة من التحليل (أي حذف قائمة البيانات المفقودة). للحصول على إجراءات أخرى، راجع دليل ستاتا للحصول على معلومات حول كيفية معالجة البيانات المفقودة. 4. القيم المفقودة في بيانات التخصيص من المهم أن نفهم كيف يتم التعامل مع القيم المفقودة في بيانات التخصيص. فكر في المثال الموضح أدناه. يوضح أمر القائمة أدناه كيفية معالجة القيم المفقودة في عبارات التعيين. ويستند المتغير sum1 على المتغيرات trial1 trial2 و trial3. إذا كان أي من هذه المتغيرات مفقودة، فقد تم تعيين قيمة المجموع 1 على المفقودين. ولذلك فإن القيمة 1 مفقودة للملاحظات 2 و 3 و 4، كما هو الحال بالنسبة للملاحظة 7. وكقاعدة عامة، فإن الحسابات التي تنطوي على قيم مفقودة تعطي قيم مفقودة. على سبيل المثال، 2 2 ينتج 4 2. عائدات . 2 2 الغلة 1. 2 الغلة. 2 3 الغلة 6 2. عائدات . كلما قمت بإضافة، طرح، ضرب، تقسيم، الخ القيم التي تنطوي على البيانات المفقودة، والنتيجة مفقودة. في تجربة وقت رد الفعل لدينا، مجموع الوقت رد الفعل 1 مفقود لأربع من أصل سبع حالات. يمكننا محاولة تجميع البيانات للمحاكمات غير المفقودة باستخدام الدالة روتوتال كما هو موضح في المثال أدناه. تظهر النتائج أدناه أن المجموع 2 يحتوي الآن على مجموع التجارب غير المفقودة. لاحظ أن الدالة روتوتال يعامل مفقود كقيمة صفر. عند جمع عدة متغيرات قد لا يكون من المعقول معالجة المفقودين على أنه صفر إذا كانت الملاحظات مفقودة على جميع المتغيرات التي سيتم تلخيصها. الدالة روتوتال مع الخيار المفقود سيعود قيمة مفقودة إذا كانت الملاحظة مفقودة على جميع المتغيرات. وهناك بيانات أخرى تعمل بالمثل. على سبيل المثال، لاحظ ما حدث عندما نحاول إنشاء متغير متوسط ​​دون استخدام وظيفة (كما هو موضح في المثال أدناه). إذا كان أي من المتغيرات trial1، trial2 أو trial3 مفقودة، يتم تعيين قيمة avg1 إلى مفقودة. بدلا من ذلك، الدالة رومين متوسط ​​البيانات للمحاكمات غير المفقودة في نفس طريقة الدالة روتوتال. ملاحظة: لو كان هناك عدد كبير من التجارب، ويقول 50 المحاكمات، ثم سيكون مزعج أن يكون لكتابة أفغرومان (المحاكمة 1 trial2 trial3 المحاكمة 4). هنا هو اختصار يمكنك استخدامه في هذا النوع من الوضع: وأخيرا، يمكنك استخدام روميس و رونوميس وظائف لتحديد عدد المفقودين وعدد من القيم غير المفقودة، على التوالي، في قائمة المتغيرات. وهذا موضح أدناه. للمتغير نوميس. كان للملاحظات 1 و 5 و 6 ثلاث قيم صحيحة، وكان للملاحظتين 2 و 3 قيمتان صحيحتان، وكانت الملاحظة 4 ذات قيمة صحيحة واحدة فقط ولم تكن للمراقبة 7 قيم صالحة. المتغير يغيب يظهر العكس، فإنه يوفر عدد من عدد من القيم المفقودة. 5. القيم المفقودة في البيانات المنطقية من المهم أن نفهم كيف يتم التعامل مع القيم المفقودة في التصريحات المنطقية. على سبيل المثال، قل أنك تريد إنشاء متغير 01 ل trial1 1 إذا كان 1.5 أو أقل و 0 إذا كان أكثر من 1.5. نعرض هذا أدناه (بشكل غير صحيح، كما سترى). يبدو أن شيئا ما حدث خطأ مع متغيرنا الجديد الذي أنشأ حديثا newvar1. تم تعيين الملاحظات مع القيم المفقودة ل trial2 صفر ل newvar1. Let39s استكشاف لماذا حدث هذا من خلال النظر في جدول التردد من trial2. كما ترون في الإخراج، والقيم المفقودة هي في المدرجة بعد أعلى قيمة 2.1 وذلك لأن ستاتا يعامل قيمة مفقودة كأكبر قيمة ممكنة (على سبيل المثال اللانهاية الإيجابية) وهذه القيمة أكبر من 2.1، وبالتالي فإن القيم ل newvar1 تصبح 0. الآن بعد أن نفهم كيف ستاتا يعامل القيم المفقودة، وسوف نستبعد صراحة القيم المفقودة للتأكد من أنها تعامل بشكل صحيح، كما هو مبين أدناه. كما ترون في الناتج ستاتا أدناه، متغير newvar2 الجديد لديه قيم مفقودة للملاحظات التي هي أيضا مفقودة ل trial2. 6. القيم المفقودة في التصريحات المنطقية عند إنشاء أو إعادة ترميز المتغيرات التي تتضمن قيم مفقودة، يجب الانتباه دائما إلى ما إذا كان المتغير يتضمن قيم مفقودة أم لا. 7. لمزيد من المعلومات لا ينبغي أن يفسر محتوى هذا الموقع على أنه تأييد لأي موقع على شبكة الإنترنت، كتاب، أو منتج البرمجيات من قبل جامعة كاليفورنيا.

No comments:

Post a Comment