Sunday 4 February 2018

نقل متوسط ستاتا


تجانس: لويس سنعمل مع البيانات من مسح الأسرة مؤتمر القمة العالمي للأغذية، الذي أجري في 1975-76. قمت بتبويب التوزيع العمري لجميع أفراد الأسرة وحفظه في ملف أسكي، الذي نقرأه الآن ونقوله: كما ترون، يبدو التوزيع أقل سلاسة إلى حد ما من البيانات التي قدمتها الفلبين في وقت سابق. هل يمكنك حساب فهرس مايرز لهذا التوزيع طرق التشغيل والخطوط إن أبسط طريقة لتلطيف سكاتيربلوت هي استخدام متوسط ​​متحرك. المعروف أيضا باسم يعني تشغيل. النهج الأكثر شيوعا هو استخدام نافذة من الملاحظات 2k 1، k إلى اليسار و k إلى يمين كل ملاحظة. قيمة k هو التبادل بين نعومة الخير مناسبا. ويجب إيلاء عناية خاصة في أقصى الحدود. ستاتا يمكن حساب تشغيل يعني عبر لويس مع خيارات يعني و نويت. وهناك مشكلة مشتركة مع وسائل تشغيل هو التحيز. والحل هو استخدام الأوزان التي تعطي أهمية أكبر لأقرب الجيران وأقل إلى تلك أبعد. وتتمثل دالة الوزن الشائعة في المكوك ثلاثي المكعب الذي يعرف ب w (d) (1-d 3) 3 لل d لوت 1 و 0، حيث تكون d هي المسافة إلى النقطة المستهدفة المعبر عنها كجزء من عرض النطاق. ستاتا يمكن أن تفعل هذا الحساب عن طريق لويس مع الخيار يعني إذا قمت بإلغاء نويت. الحل الأفضل هو استخدام خطوط التشغيل. نحدد مرة أخرى حي لكل نقطة، عادة k أقرب الجيران على كل جانب، تناسب خط الانحدار إلى نقاط في الحي، ومن ثم استخدامها للتنبؤ قيمة أكثر سلاسة لرصد المؤشر. هذا يبدو وكأنه الكثير من العمل، ولكن الحسابات يمكن القيام به بكفاءة باستخدام الانحدار تحديث الصيغ. ستاتا يمكن حساب خط تشغيل عبر لويس إذا حذفت يعني ولكن تشمل نايت. والأفضل من ذلك هو استخدام خطوط التشغيل المرجحة. مما يعطي المزيد من الوزن لأقرب الملاحظات، وهو ما يفعله لاويس أكثر سلاسة. يتبع المتغير هذا التقدير مع عدد قليل من التكرارات للحصول على خط أكثر قوة. هذا هو بوضوح أفضل تقنية في الأسرة. يستخدم ستاتاس لويس خط تشغيل مرجح إذا كنت تحذف يعني و نويت R تنفذ لويس أكثر سلاسة من خلال وظائف لويس () ولويس الأحدث ()، والذي يستخدم واجهة صيغة مع واحد أو أكثر من التنبؤات وقيم افتراضية مختلفة إلى حد ما. درجة المعلمة تسيطر على درجة الحدود المحلية الافتراضي هو 2 للتربيعية، والبدائل هي 1 للخطي و 0 لتشغيل يعني. يمكن لكل من التطبيقات استخدام مقدر قوي، مع عدد من التكرارات التي تسيطر عليها المعلمة إيتر أو التكرارات. اكتب لووس و لويس في وحدة التحكم R لمزيد من المعلومات. في غبلوت () يمكنك تراكب لويس أكثر سلاسة عن طريق استدعاء جيومزموث () ويبين الشكل أدناه البيانات الكولومبية و لويس أكثر سلاسة مع نطاق أو عرض النطاق الترددي يساوي 25 من البيانات. قد ترغب في تجربة بدويدثس مختلفة لنرى كيف تختلف النتائج. إعادة تفضيل الأرقام الرقمية إن تمهيد التوزيع العمري يوفر طريقة أفضل لتقييم تفضيلات الأرقام من مزج مايرز. دعونا نحسب الرقم الأخير من العمر وجدول عليه على كامل مجموعة من البيانات باستخدام الترددات لوحظ و لويس أكثر سلاسة. تظهر الترددات الخام دليلا على تفضيل للأعمار التي تنتهي في 0 و 5، وهو أمر شائع جدا، وربما 2 كذلك. ونحن الآن استخدام السلس كما الوزن وتظهر ترددات ممهدة أننا نتوقع عدد أقل من الناس في أرقام أعلى، حتى في توزيع سلس، مع أكثر تنتهي في 0 من 9. ونحن الآن على استعداد لحساب مؤشر تفضيل رقم، وتعرف بأنها نصف مجموع الفروق المطلقة بين الترددات الملحوظة والناعمة: نرى أننا سوف نحتاج إلى تعديل 5.5 من الملاحظات للقضاء على تفضيل الرقم. قد ترغب في مقارنة هذه النتيجة مع فهرس مايرز. نسخة 2017 جيرماكوتن رودرياكوتيغيز، جامعة برينستون هذا هيكل البيانات غير صالحة تماما للغرض. بافتراض معرف معرف تحتاج إلى إعادة تشكيل. مثلا ثم المتوسط ​​المتحرك سهل. استخدام تسموث أو مجرد توليد. مثلا مزيد من المعلومات عن سبب عدم ملاءمة بنية البيانات: ليس فقط حساب المتوسط ​​المتحرك بحاجة إلى حلقة (لا تتضمن بالضرورة إغن)، ولكنك ستخلق العديد من المتغيرات الإضافية الجديدة. استخدام تلك في أي تحليل لاحق سيكون في مكان ما بين محرجا ومستحيلا. إديت إل إعطاء حلقة عينة، في حين لا تتحرك من موقف بلدي أنها تقنية سيئة. أنا لا أرى سبب وراء التسمية التسمية حيث P1947 هو وسيلة ل 1943-1945 أفترض أن هذا مجرد خطأ مطبعي. لنفترض أن لدينا بيانات عن 1913-2012. لمدة 3 سنوات، ونحن نفقد سنة واحدة في كل نهاية. يمكن كتابة ذلك بشكل أكثر إيجازا، على حساب موجة من وحدات الماكرو داخل وحدات الماكرو. استخدام الأوزان غير المتكافئة أمر سهل، كما هو موضح أعلاه. والسبب الوحيد لاستخدام إغن هو أنه لا يتخلى إذا كان هناك أخطاء، والتي سوف تفعل أعلاه. وكمسألة اكتمال، لاحظ أنه من السهل التعامل مع الفشل دون اللجوء إلى إغن. والمقام إذا كانت جميع القيم مفقودة، يقل هذا إلى 00، أو مفقود. وإلا، إذا كان أي قيمة مفقودة، نضيف 0 إلى البسط و 0 إلى المقام، وهو نفس تجاهل ذلك. وبطبيعة الحال يمكن تحمل الرمز كما هو مبين أعلاه للمتوسطات البالغة 3 سنوات، ولكن إما لهذه الحالة أو لمتوسط ​​المتوسط ​​على مدى سنوات أخرى، فإننا سوف تحل محل خطوط أعلاه من قبل حلقة، وهو ما يفعل إغن. Stata: تحليل البيانات والبرامج الإحصائية نيكولاس J كوكس، جامعة دورهام، المملكة المتحدة كريستوفر بوم، كلية بوسطن إيجن، ما () وحدودها ستاتارسكوس الأمر الأكثر وضوحا لحساب المتوسطات المتحركة هي وظيفة ما () من إغن. ونظرا للتعبير، فإنه يخلق المتوسط ​​المتحرك-بيريود من هذا التعبير. افتراضيا، يؤخذ على النحو 3. يجب أن تكون غريبة. ومع ذلك، كما يشير الإدخال اليدوي، إغن، ما () قد لا تكون مقترنة مع فارليست:. ولهذا السبب وحده، فإنه لا ينطبق على بيانات الفريق. في أي حال، فإنه يقف خارج مجموعة من الأوامر المكتوبة خصيصا لسلاسل زمنية انظر سلسلة زمنية للحصول على التفاصيل. النهج البديلة لحساب المتوسطات المتحركة لبيانات اللوحة، هناك خياران على الأقل. كلاهما يعتمد على مجموعة البيانات التي كانت تسيت مسبقا. هذا هو الكثير يستحق القيام به: ليس فقط يمكنك حفظ نفسك مرارا وتكرارا تحديد متغير لوحة ومتغير الوقت، ولكن ستاتا يتصرف بذكاء إعطاء أي ثغرات في البيانات. 1. اكتب التعريف الخاص بك باستخدام توليد باستخدام مشغلي سلسلة الوقت مثل L. و F.. تعطي تعريف المتوسط ​​المتحرك كحجة إلى بيان توليد. إذا قمت بذلك، فإنك، بطبيعة الحال، لا تقتصر على الوزن المرجح (غير مرجحة) المتوسطات المتحركة المتمركزة المحسوبة بواسطة إغن، ما (). على سبيل المثال، سيتم إعطاء متوسطات متحرکة متساوية الترجيح لثلاث فترات من خلال بعض الأوزان يمكن تحديدها بسهولة: يمكنك، بطبيعة الحال، تحديد تعبير مثل السجل (ميفار) بدلا من اسم متغير مثل ميفار. ميزة واحدة كبيرة من هذا النهج هو أن ستاتا تلقائيا يفعل الشيء الصحيح للبيانات لوحة: القيم الرائدة والتخلف يتم العمل بها داخل لوحات، تماما كما يملي المنطق يجب أن تكون. والعيب الأبرز هو أن سطر الأوامر يمكن أن يكون طويلا إذا كان المتوسط ​​المتحرك ينطوي على عدة مصطلحات. مثال آخر هو متوسط ​​متحرك من جانب واحد يعتمد فقط على القيم السابقة. ويمكن أن يكون ذلك مفيدا لتوليد توقعات تكيفية لما يمكن أن يستند إليه المتغير فقط على المعلومات حتى الآن: ما يمكن أن يتنبأ به شخص ما للفترة الحالية استنادا إلى القيم الأربع الماضية، باستخدام مخطط الترجيح الثابت (قد يكون الفارق الزمني 4 فترات (تستخدم عادة مع أوقات الفصول الربع سنوية.) 2. استخدام إغن، مرشح () من سك استخدم مرشح وظيفة إغن المكتوب من المستعمل () من حزمة إغنمور على سك. في ستاتا 7 (تحديث بعد 14 نوفمبر 2001)، يمكنك تثبيت هذه الحزمة التي بعد ذلك مساعدة إغنمور نقاط للتفاصيل على مرشح (). سيتم تقديم المثالين أعلاه (في هذه المقارنة قد يكون نهج التوليد أكثر شفافية، ولكننا سنرى مثالا على العكس في لحظة). يؤدي إلى تأخر سلبي: في هذه الحالة -11 يوسع إلى -1 0 1 أو الرصاص 1، تأخر 0، تأخر 1. و فيسينتس كويف، نومليست آخر، مضاعفة المتخلفة أو العناصر الرائدة المقابلة: في هذه الحالة هذه البنود هي F1.myvar . ميفار و L1.myvar. ويتمثل تأثير خيار التطبيع في قياس كل معامل بمجموع المعاملات بحيث يكون معامل التطبيع (1 1 1) معادلا لمعاملات 13 13 13 و كوف (1 2 1) تطبيع يعادل معاملات 14 12 14 يجب أن تحدد ليس فقط التأخر ولكن أيضا المعاملات. ونظرا لأن إغين، ما () توفر الحالة المرجحة بالتساوي، فإن الأساس المنطقي الرئيسي ل إغين، فيلتر () هو دعم الحالة المرجحة غير المتكافئة، والتي يجب أن تحدد معاملاتها. ويمكن القول أيضا أن إلزام المستخدمين بتحديد المعاملات هو ضغط إضافي قليلا عليهم للتفكير في المعاملات التي يريدون. المبرر الرئيسي لأوزان متساوية هو، ونحن نخمن، والبساطة، ولكن الأوزان متساوية لديها خصائص نطاق التردد رديء، على سبيل المثال الاعتبار واحد فقط. والمثال الثالث أعلاه يمكن أن يكون إما معقدا تماما مثل النهج المولد. هناك حالات حيث إغن، مرشح () يعطي صياغة أبسط من توليد. إذا كنت ترغب في مرشح ثنائي الحدين لمدة تسعة، والتي يجد علماء المناخ مفيدة، ثم يبدو ربما أقل رهيبة من وأسهل للحصول على الحق من، تماما كما هو الحال مع نهج توليد، إغن، تصفية () يعمل بشكل صحيح مع بيانات لوحة. في الواقع، كما ذكر أعلاه، فإنه يعتمد على مجموعة البيانات التي كانت تسيت مسبقا. نصيحة رسومية بعد حساب المتوسطات المتحركة الخاصة بك، وربما كنت تريد أن ننظر إلى الرسم البياني. الأمر المكتوب المستخدم تسغراف هو الذكية حول تسيت مجموعات البيانات. تثبيته في ما يصل إلى تاريخ ستاتا 7 التي كتبها سك إنست تسغراف. ماذا عن التقسيم الفرعي إذا لم يستفد أي من الأمثلة أعلاه من القيود. في الواقع إغن، ما () لن تسمح إذا كان سيتم تحديدها. أحيانا الناس يريدون استخدام إذا عند حساب المتوسطات المتحركة، ولكن استخدامه هو أكثر تعقيدا قليلا مما هو عليه عادة. ما الذي تتوقعه من المتوسط ​​المتحرك المحسوب إذا كان. دعونا نحدد إمكانيتين: التفسير الضعيف: أنا لا أريد أن أرى أي نتائج للملاحظات المستبعدة. تفسير قوي: أنا لا أريد حتى لك لاستخدام القيم للملاحظات المستبعدة. هنا مثال ملموس. لنفترض كنتيجة لبعض إذا الشرط، الملاحظات 1-42 مدرجة ولكن لا الملاحظات 43 جرا. ولكن المتوسط ​​المتحرك ل 42 سيعتمد، من بين أمور أخرى، على قيمة الملاحظة 43 إذا كان المتوسط ​​يمتد إلى الوراء وإلى الأمام، وهو طوله 3 على الأقل، وسيعتمد بالمثل على بعض الملاحظات 44 وما بعدها في بعض الظروف. تخميننا هو أن معظم الناس سوف تذهب للتفسير الضعيف، ولكن ما إذا كان هذا هو الصحيح، إغن، مرشح () لا يدعم إذا كان أي منهما. يمكنك دائما تجاهل ما كنت دونرسكوت تريد أو حتى تعيين القيم غير المرغوب فيها إلى المفقودين بعد ذلك باستخدام استبدال. ملاحظة حول النتائج المفقودة في نهايات السلسلة لأن المتوسطات المتحركة هي وظائف تأخر و يؤدي، إغن، ما () تنتج مفقودة حيث لا توجد تأخرات و يؤدي في بداية ونهاية السلسلة. وهناك خيار نوميس يجبر على حساب المتوسطات المتحركة الأقصر غير المقوسة للتيول. في المقابل، لا تولد ولا إيجين، تصفية () يفعل، أو يسمح، أي شيء خاص لتجنب النتائج المفقودة. إذا كان أي من القيم المطلوبة للحساب مفقود، فإن هذه النتيجة مفقودة. والأمر متروك للمستعملين لتحديد ما إذا كانت الجراحة التصحيحية مطلوبة لهذه الملاحظات وما إذا كان ذلك مفترضا بعد النظر إلى مجموعة البيانات والنظر في أي علم أساسي يمكن حمله.

No comments:

Post a Comment