Thursday, 11 January 2018

3 أشهر الحركة من المتوسط - الحسابية


أريد أن أسجل في متغير (تسمى أبسولوتيونديستانس) القيمة المطلقة لمسافة متغير رقمي (تسمى v1) بين موضوع معين (معرفة مع فار إد مجموع 50 موضوعا) في سنة معينة (مع تحديد فار المدة الكلية 13 سنة ) التي هي عرضة للحصول على المرضى (لتجربة الحدث، التي تم التقاطها من قبل ديبندنتوتكوم ثنائي فار يسمى المرضى مشفرة 1 عندما يخضع موضوع الحدث في سنة معينة، 0 خلاف ذلك) وقيمة V1 من جميع الموضوعات التي حصلت على المرضى ( الموضوعات التي سبق أن شهدت الحدث). قيمة المواد التي كانت مريضة في السابق هي قيمة الموضوعات من V1 في وقت حدوث الحدث (في السنة عندما مرضى المواد). قيمة v1 في وقت سقوط المرضى هو المتوسط ​​المتحرك المرجح حيث أن أحدث موضوع للمرضى لديهم نفس الوزن كما في جميع الموضوعات المرضى الأخرى. وهكذا، لكل سنة في مجموعة البيانات، أود أن حساب المسافة (أبسولوتيونديستانس) لكل موضوع صحي باستخدام الصيغة التالية: المرضى يمكن أن يكون أكثر من مرة، ولكن للبساطة، دعونا نركز على مجموعة البيانات حيث نحن المهتمين في الوقت حتى المرضى الأول (أوبس بعد الحدث الأول سيكون رقابة الحق وسقطت من التحليل سيتم تحليل البيانات مع تقنيات بريفالدوراتيون). الآن، الأمور أكثر تعقيدا عندما نعتبر أن بعض المواضيع شهدت الحدث (مرضى) في نفس العام (يتيح التعرف على هذه العلاقات). تساهم العلاقات في متوسط ​​V1 من جميع المواد الأخرى التي سقطت قبل مع متوسط ​​v1 من تلك العلاقات. مثلا فقد سقطت ثلاثة موضوعات في عام 2000. وستسهم هذه العلاقات في متوسط ​​عدد جميع المواد الأخرى التي سقطت قبل عام 2001 فصاعدا بمعدل 1 في المائة من هذه المواضيع الثلاثة في عام 2000. وسأكون ممتنا للتعليقات على كيفية حساب هذا في ستاتا أو R. للحصول على الحل اليدوي غير فعالة والخطأ في حساب هذا في إكسيل، انظر مقالتي: إكسيل الحل البديل بنية البيانات هذه غير صالحة تماما للغرض. بافتراض معرف معرف تحتاج إلى إعادة تشكيل. مثلا ثم المتوسط ​​المتحرك سهل. استخدام تسموث أو مجرد توليد. مثلا مزيد من المعلومات عن سبب عدم ملاءمة بنية البيانات: ليس فقط حساب المتوسط ​​المتحرك بحاجة إلى حلقة (لا تتضمن بالضرورة إغن)، ولكنك ستخلق العديد من المتغيرات الإضافية الجديدة. استخدام تلك في أي تحليل لاحق سيكون في مكان ما بين محرجا ومستحيلا. إديت إل إعطاء حلقة عينة، في حين لا تتحرك من موقف بلدي أنها تقنية سيئة. أنا لا أرى سبب وراء التسمية التسمية حيث P1947 هو وسيلة ل 1943-1945 أفترض أن هذا مجرد خطأ مطبعي. لنفترض أن لدينا بيانات عن 1913-2018. لمدة 3 سنوات، ونحن نفقد سنة واحدة في كل نهاية. يمكن كتابة ذلك بشكل أكثر إيجازا، على حساب موجة من وحدات الماكرو داخل وحدات الماكرو. استخدام الأوزان غير المتكافئة أمر سهل، كما هو موضح أعلاه. والسبب الوحيد لاستخدام إغن هو أنه لا يتخلى إذا كان هناك أخطاء، والتي سوف تفعل أعلاه. وكمسألة اكتمال، لاحظ أنه من السهل التعامل مع الفشل دون اللجوء إلى إغن. والمقام إذا كانت جميع القيم مفقودة، يقل هذا إلى 00، أو مفقود. وإلا، إذا كان أي قيمة مفقودة، نضيف 0 إلى البسط و 0 إلى المقام، وهو نفس تجاهل ذلك. وبطبيعة الحال يمكن تحمل الرمز كما هو مبين أعلاه للمتوسطات البالغة 3 سنوات، ولكن إما لهذه الحالة أو لمتوسط ​​المتوسط ​​على مدى سنوات أخرى، فإننا سوف تحل محل خطوط أعلاه من قبل حلقة، وهو ما يفعل إغن. Stata: تحليل البيانات والبرامج الإحصائية نيكولاس J كوكس، جامعة دورهام، المملكة المتحدة كريستوفر بوم، كلية بوسطن إيجن، ما () وحدودها ستاتارسكوس الأمر الأكثر وضوحا لحساب المتوسطات المتحركة هي وظيفة ما () من إغن. ونظرا للتعبير، فإنه يخلق المتوسط ​​المتحرك-بيريود من هذا التعبير. افتراضيا، يؤخذ على النحو 3. يجب أن تكون غريبة. ومع ذلك، كما يشير الإدخال اليدوي، إغن، ما () قد لا تكون مقترنة مع فارليست:. ولهذا السبب وحده، فإنه لا ينطبق على بيانات الفريق. في أي حال، فإنه يقف خارج مجموعة من الأوامر المكتوبة خصيصا لسلاسل زمنية انظر سلسلة زمنية للحصول على التفاصيل. النهج البديلة لحساب المتوسطات المتحركة لبيانات اللوحة، هناك خياران على الأقل. كلاهما يعتمد على مجموعة البيانات التي كانت تسيت مسبقا. هذا هو الكثير يستحق القيام به: ليس فقط يمكنك حفظ نفسك مرارا وتكرارا تحديد متغير لوحة ومتغير الوقت، ولكن ستاتا يتصرف بذكاء إعطاء أي ثغرات في البيانات. 1. اكتب التعريف الخاص بك باستخدام توليد باستخدام مشغلي سلسلة الوقت مثل L. و F.. تعطي تعريف المتوسط ​​المتحرك كحجة إلى بيان توليد. إذا قمت بذلك، فإنك، بطبيعة الحال، لا تقتصر على الوزن المرجح (غير مرجحة) المتوسطات المتحركة المتمركزة المحسوبة بواسطة إغن، ما (). على سبيل المثال، سيتم إعطاء متوسطات متحرکة متساوية الترجيح لثلاث فترات من خلال بعض الأوزان يمكن تحديدها بسهولة: يمكنك، بالطبع، تحديد تعبير مثل سجل (ميفار) بدلا من اسم متغير مثل ميفار. ميزة واحدة كبيرة من هذا النهج هو أن ستاتا تلقائيا يفعل الشيء الصحيح للبيانات لوحة: القيم الرائدة والتخلف يتم العمل بها داخل لوحات، تماما كما يملي المنطق يجب أن تكون. والعيب الأبرز هو أن سطر الأوامر يمكن أن يكون طويلا إذا كان المتوسط ​​المتحرك ينطوي على عدة مصطلحات. مثال آخر هو متوسط ​​متحرك من جانب واحد يعتمد فقط على القيم السابقة. ويمكن أن يكون ذلك مفيدا لتوليد توقعات تكيفية لما يمكن أن يستند إليه المتغير فقط على المعلومات حتى الآن: ما يمكن أن يتنبأ به شخص ما للفترة الحالية استنادا إلى القيم الأربع الماضية، باستخدام مخطط الترجيح الثابت (قد يكون الفارق الزمني 4 فترات (تستخدم عادة مع أوقات الفصول الربع سنوية.) 2. استخدام إغن، مرشح () من سك استخدم مرشح وظيفة إغن المكتوب من المستعمل () من حزمة إغنمور على سك. في ستاتا 7 (تحديث بعد 14 نوفمبر 2001)، يمكنك تثبيت هذه الحزمة التي بعد ذلك مساعدة إغنمور نقاط للتفاصيل على مرشح (). سيتم تقديم المثالين أعلاه (في هذه المقارنة قد يكون نهج التوليد أكثر شفافية، ولكننا سنرى مثالا على العكس في لحظة). يؤدي إلى تأخر سلبي: في هذه الحالة -11 يوسع إلى -1 0 1 أو الرصاص 1، تأخر 0، تأخر 1. و فيسينتس كويف، نومليست آخر، مضاعفة المتخلفة أو العناصر الرائدة المقابلة: في هذه الحالة هذه البنود هي F1.myvar . ميفار و L1.myvar. ويتمثل تأثير خيار التطبيع في قياس كل معامل بمجموع المعاملات بحيث يكون معامل التطبيع (1 1 1) معادلا لمعاملات 13 13 13 و كوف (1 2 1) تطبيع يعادل معاملات 14 12 14 يجب أن تحدد ليس فقط التأخر ولكن أيضا المعاملات. ونظرا لأن إغين، ما () توفر الحالة المرجحة بالتساوي، فإن الأساس المنطقي الرئيسي ل إغين، فيلتر () هو دعم الحالة المرجحة غير المتكافئة، والتي يجب أن تحدد معاملاتها. ويمكن القول أيضا أن إلزام المستخدمين بتحديد المعاملات هو ضغط إضافي قليلا عليهم للتفكير في المعاملات التي يريدون. المبرر الرئيسي لأوزان متساوية هو، ونحن نخمن، والبساطة، ولكن الأوزان متساوية لديها خصائص نطاق التردد رديء، على سبيل المثال الاعتبار واحد فقط. والمثال الثالث أعلاه يمكن أن يكون إما معقدا تماما مثل نهج التوليد. هناك حالات حيث إغن، مرشح () يعطي صياغة أبسط من توليد. إذا كنت ترغب في مرشح ثنائي الحدين لمدة تسعة، والتي يجد علماء المناخ مفيدة، ثم يبدو ربما أقل رهيبة من وأسهل للحصول على الحق من، تماما كما هو الحال مع نهج توليد، إغن، تصفية () يعمل بشكل صحيح مع بيانات لوحة. في الواقع، كما ذكر أعلاه، فإنه يعتمد على مجموعة البيانات التي كانت تسيت مسبقا. نصيحة رسومية بعد حساب المتوسطات المتحركة الخاصة بك، وربما كنت تريد أن ننظر إلى الرسم البياني. الأمر المكتوب المستخدم تسغراف هو الذكية حول تسيت مجموعات البيانات. تثبيته في ما يصل إلى تاريخ ستاتا 7 التي كتبها سك إنست تسغراف. ماذا عن التقسيم الفرعي إذا لم يستفد أي من الأمثلة أعلاه من القيود. في الواقع إغن، ما () لن تسمح إذا كان سيتم تحديدها. أحيانا الناس يريدون استخدام إذا عند حساب المتوسطات المتحركة، ولكن استخدامه هو أكثر تعقيدا قليلا مما هو عليه عادة. ما الذي تتوقعه من المتوسط ​​المتحرك المحسوب إذا كان. دعونا نحدد إمكانيتين: التفسير الضعيف: أنا لا أريد أن أرى أي نتائج للملاحظات المستبعدة. تفسير قوي: أنا لا أريد حتى لك لاستخدام القيم للملاحظات المستبعدة. هنا مثال ملموس. لنفترض كنتيجة لبعض إذا الشرط، الملاحظات 1-42 مدرجة ولكن لا الملاحظات 43 جرا. ولكن المتوسط ​​المتحرك ل 42 سيعتمد، من بين أمور أخرى، على قيمة الملاحظة 43 إذا كان المتوسط ​​يمتد إلى الوراء وإلى الأمام، وهو طوله 3 على الأقل، وسيعتمد بالمثل على بعض الملاحظات 44 وما بعدها في بعض الظروف. تخميننا هو أن معظم الناس سوف تذهب للتفسير الضعيف، ولكن ما إذا كان هذا هو الصحيح، إغن، مرشح () لا يدعم إذا كان أي منهما. يمكنك دائما تجاهل ما كنت دونرسكوت تريد أو حتى تعيين القيم غير المرغوب فيها إلى المفقودين بعد ذلك باستخدام استبدال. ملاحظة حول النتائج المفقودة في نهايات السلسلة لأن المتوسطات المتحركة هي وظائف تأخر و يؤدي، إغن، ما () تنتج مفقودة حيث لا توجد تأخرات و يؤدي في بداية ونهاية السلسلة. وهناك خيار نوميس يجبر على حساب المتوسطات المتحركة الأقصر غير المقوسة للتيول. في المقابل، لا تولد ولا إيجين، تصفية () يفعل، أو يسمح، أي شيء خاص لتجنب النتائج المفقودة. إذا كان أي من القيم المطلوبة للحساب مفقود، فإن هذه النتيجة مفقودة. والأمر متروك للمستعملين لتحديد ما إذا كانت الجراحة التصحيحية مطلوبة لهذه الملاحظات وما إذا كان ذلك مفترضا بعد النظر إلى مجموعة البيانات والنظر في أي علم أساسي يمكن حمله.

No comments:

Post a Comment