نماذج أريما مقدمة تسهل زلينر تحليل مجموعات البيانات من خلال استخدام تقنيات اكتشاف الاتجاه (الارتباط الذاتي والعلاقة الذاتية الجزئية) وطرق النمذجة الشاملة (أريما والتجانس الأسي). أريما أوتوريغريسيف نموذج النقل المتحرك المتكامل هو واحد من أساليب النمذجة الأكثر شعبية المستخدمة في التنبؤ السلاسل الزمنية، ويرجع ذلك إلى حد كبير إلى تركيزها على استخدام تقنيات الارتباط الذاتي البيانات لتحقيق نماذج عالية الجودة. زلمينر يستخدم بالكامل جميع جوانب تنفيذ أريما، بما في ذلك التحديدات المتغيرة، تعريفات المعلمة الموسمية غير الموسمية، والخيارات المتقدمة مثل الحد الأقصى التكرار، والإخراج، وخيارات التوقعات. أريما نمذجة في زلمينر نموذج أريما هو نموذج الانحدار من نوع الذي يتضمن الارتباط الذاتي. عند تقدير معاملات أريما، فإن الافتراض الأساسي هو أن البيانات هي معنى ثابت، فإن الاتجاه أو الموسمية لا يمكن أن يؤثر على التباين. وهذا ليس صحيحا عموما. من أجل تحقيق البيانات الثابتة، زلمينر يحتاج إلى تطبيق الاختلاف: العادية، الموسمية، أو كليهما. بعد زلينر يناسب النموذج، وسوف تكون النتائج المختلفة المتاحة. ويمكن تقييم نوعية النموذج بمقارنة المؤامرة الزمنية للقيم الفعلية مع القيم المتوقعة. إذا كان كل من المنحنيات قريبة، ثم يمكن الافتراض أن النموذج هو مناسبا. وينبغي أن يعرض النموذج أي اتجاهات وموسمية، إن وجدت. وبعد ذلك، ينبغي أن ينقل تحليل البقايا ما إذا كان النموذج مناسبا أم لا: فالمخلفات العشوائية تعني أن النموذج دقيق، ولكن إذا كانت المخلفات تظهر اتجاها فإن النموذج قد يكون غير دقيق. تركيب نموذج أريما مع المعلمات (0،1،1) سيعطي نفس النتائج كما تمهيد الأسي، في حين أن استخدام المعلمات (0،2،2) سيعطي نفس النتائج كما تجانس الأسي المزدوج. كيفية الوصول إلى إعدادات أريما في إكسيل إطلاق إكسيل. في شريط الأدوات، انقر فوق زلمينر بلاتفورم. في الشريط، انقر فوق أريما. في القائمة المنسدلة، حدد نموذج أريما. أريما ملخص النموذج أريما. أوتوغريسيف المتكاملة المتحرك المتوسط. نموذج التنبؤ المستخدم في تحليل السلاسل الزمنية. أريما المعلمة بناء الجملة. أريما (p، d، q) حيث p عدد المصطلحات ذات الانحدار التلقائي، d عدد الاختلافات غير الموسمية، q عدد متوسطات المتوسط المتحرك. مثال سلسلة الوقت. عرض مثال لكيفية تطبيق نموذج أريما. استخدام سلسلة الوقت. كيفية استخدام وظيفة تحليل سلسلة زمنية داخل زلمينر. تجانس النماذج. كيف يمكن تطبيق تقنيات التمهيد على نماذج التنبؤ بالسلاسل الزمنية. زلينر المساعدة عبر الإنترنت. (520) 621-3457 الفاكس: (520) 621-8229 ساعات العمل الجمعة، 1: 00-6: 00 بيإم (يرجى إرسال بريد إلكتروني إلى الجدول الزمني للاجتماع) ) كورس دسكريبتيون أدوات التحليل في مجالات الوقت والتردد يتم إدخالها في سياق السلاسل الزمنية للعينة. يمكنني استخدام مجموعة بيانات من سلسلة زمنية عينة لتوضيح الطرق، وتغيير مجموعة البيانات في كل فصل دراسي وتقدم الدورة. هذا العام مجموعة البيانات عينة يأتي من مشروع جبهة الخلاص الوطني على التباين سنوباك في حوض نهر أمريكا في ولاية كاليفورنيا. وتشمل مجموعة البيانات هذه التسلسل الزمني للحلقات الشجرية، والمؤشرات المناخية، وسجلات تدفق المجاري المائية، والمسلسلات الزمنية لمكافئ ثلج الماء المقاسة في محطات الدورة الثلجية. سوف تجميع سلسلة الوقت الخاص بك لاستخدامها في الدورة. قد تكون هذه من مشروع البحث الخاص بك. العودة إلى أعلى الصفحة هذه دورة تمهيدية، مع التركيز على الجوانب العملية لتحليل السلاسل الزمنية. يتم عرض طرق هرمية - بدءا من المصطلحات والرسومات الاستكشافية، والانتقال إلى الإحصاءات الوصفية، وتنتهي مع إجراءات النمذجة الأساسية. وتشمل الموضوعات ديترندينغ، والتصفية، والنمذجة الانحدار الذاتي، والتحليل الطيفي والانحدار. يمكنك قضاء أول أسبوعين تثبيت ماتلاب على جهاز الكمبيوتر المحمول الخاص بك، والحصول على مقدمة أساسية لماتلاب، وتجميع مجموعة البيانات الخاصة بك من سلسلة زمنية للدورة. ثم يتم تغطية اثني عشر موضوعات، أو الدروس، كل تخصيص أسبوع، أو فترتين الدرجة. اثنا عشر تعيينات فئة جنبا إلى جنب مع الموضوعات. وتتكون الواجبات من تطبيق الأساليب من خلال تشغيل مخطوطات ماتلاب مكتوبة مسبقا (البرامج) على سلسلة الوقت الخاص بك وتفسير النتائج. بالطبع 3 وحدات دراسية للطلاب في الحرم الجامعي في جامعة أريزونا في توكسون، و 1 الائتمان للطلاب على الانترنت. أي سلسلة زمنية مع زيادة الوقت المستمر (على سبيل المثال اليوم والشهر والسنة) هو مرشح لاستخدامها في الدورة. ومن الأمثلة على ذلك قياسات هطول الأمطار اليومية، وتدفق التيار الكلي الموسمية، ودرجة حرارة الهواء المتوسط في الصيف، والمؤشرات السنوية لنمو الأشجار، ومؤشرات درجة حرارة سطح البحر، والزيادة اليومية في ارتفاع الشجيرة. نتيجة لأخذ بالطبع، يجب عليك: فهم المفاهيم الأساسية سلسلة الوقت والمصطلحات تكون قادرة على تحديد الأساليب سلسلة زمنية مناسبة للأهداف تكون قادرة على تقييم نقدي الأدب العلمي تطبيق السلاسل الزمنية الأساليب المشمولة تحسنت فهم خصائص سلسلة الوقت من الخاص بك مجموعة البيانات الخاصة تكون قادرة على تلخيص بإيجاز نتائج تحليل السلاسل الزمنية في الكتابة المتطلبات الأساسية دورة إحصائية تمهيدية الوصول إلى جهاز كمبيوتر محمول قادر على وجود ماتلاب مثبتة على ذلك إذن من المدرب (الطلاب الجامعيين والطلاب عبر الإنترنت) متطلبات أخرى إذا كنت في جامعة أريزونا (وا) طالب في الحرم الجامعي في توكسون، لديك حق الوصول إلى ماتلاب وأدوات الأدوات المطلوبة من خلال ترخيص موقع وا كما لا البرمجيات التكلفة. لا خبرة سابقة مع ماتلاب مطلوب، وبرمجة الكمبيوتر ليست جزءا من الدورة. إذا كنت على الانترنت، وليس في الحرم الجامعي في وا، سوف تكون قادرة على اتخاذ الدورة في فصل الربيع 2017 الفصل الدراسي باعتباره إكورس. يجب التأكد من أن لديك حق الوصول إلى ماتلاب وأدوات الأدوات المطلوبة (انظر أدناه) في موقعك. الوصول إلى الإنترنت. لا يوجد تبادل الورق في الدورة. يتم تبادل الملاحظات والتعيينات إلكترونيا وإكمال يتم تقديم التخصيصات إلكترونيا من خلال نظام جامعة أريزونا Desire2Learn (D2L). ماتلاب الإصدار. تحديث البرامج النصية والوظائف الآن ومن ثم استخدام الإصدار الحالي ترخيص الموقع من ماتلاب، والتحديثات قد تستخدم ميزات ماتلاب غير متوفرة في الإصدارات السابقة ماتلاب. لعام 2017، أنا باستخدام ماتلاب الإصدار 9.1.0.441655 (R2016b). إذا كنت تستخدم إصدار سابق، تأكد من أنه ماتلاب الإصدار 2007b أو أعلى. بالإضافة إلى حزمة ماتلاب الرئيسية، يتم استخدام أربع مجموعات أدوات: الإحصائيات ومعالجة الإشارات وتحديد النظام وإما سبلين (إصدار ماتلاب 2010a أو إصدار سابق) أو تركيب المنحنى (إصدار ماتلاب 2010b أو أحدث) توفر الدورة في فصل الربيع كل سنة أخرى (2015، 2017، وما إلى ذلك). وهو مفتوح لطلاب الدراسات العليا ويمكن أيضا أن تؤخذ من قبل كبار السن الجامعيين بإذن من المدرب. يتم تسجيل الطلاب المسجلين في وا 18 في فصل الربيع 2017. كما تم استيعاب عدد قليل من الطلاب على الانترنت عادة من خلال تقديم الدورة بطرق مختلفة. الطريق الآن هو مكان إكورس المذكورة أعلاه. العودة إلى أعلى الصفحة مخطط الدورة (الدروس) يسمح الجدول عادة حوالي أسبوعين لجمع البيانات والتعرف على ماتلاب. ثم يتم تخصيص أسبوع واحد (اثنان من الفصول الدراسية) لكل من الدروس أو الموضوعات ال 12. تجتمع الطبقة يومي الثلاثاء والخميس. يتم عرض موضوع جديد يوم الثلاثاء، ويستمر يوم الخميس التالي. تنتهي فئة الخميس بتعيين وعرض توضيحي لتشغيل النص البرمجي على بيانات نموذجي. ومن المقرر أن تكون مهمة (يجب أن يتم تحميلها من قبل لك إلى D2L) قبل الصف يوم الثلاثاء التالي. وتستخدم ال 12 ساعة الأولى من تلك الدرجة من أيام الثلاثاء في التقييم الذاتي الموجه ودرجات التخصيص وتحميل المهام المقدرة (متدرجة) إلى D2L. يتم استخدام 45 دقيقة المتبقية لتقديم الموضوع التالي. يجب إحضار الكمبيوتر المحمول إلى الفصل في أيام الثلاثاء. يتم سرد الدروس 12 أو الموضوعات التي تغطيها الدورة في مخطط الصف. ومن المتوقع أن يتبع الطلاب على الانترنت نفس الجدول الزمني لتقديم التعيينات كما الطلاب المقيمين، ولكن لا يمكن الوصول إلى المحاضرات. لا يتم تقييم المهام المقدمة من الطلاب على الانترنت الذاتي، ولكن متدرجة من قبلي. يجب أن يكون الطلاب على الانترنت الوصول إلى D2L لتقديم المهام. ربيع 2017 الفصل الدراسي. تجتمع الفئة مرتين في الأسبوع لمدة 75 دقيقة، 9: 00-10: 15 صباحا ت، في غرفة 424 (قاعة المؤتمرات) من براينت بانيستر بناء شجرة الدائري (بناء 45B). اليوم الأول من الصف هو 12 يناير (الخميس). آخر يوم من الفصل هو 2 مايو (الثلاثاء). لا توجد فئة خلال أسبوع عطلة الربيع (11-11 مارس). يمكنك تحليل البيانات من اختيارك في مهام فئة. كما جاء في نظرة عامة بالطبع. هناك الكثير من المرونة في اختيار السلاسل الزمنية. وسوف جعل كتالوج من سلسلة زمنية مناسبة المتاحة، ولكن من الأفضل أن تركز الدورة على مجموعة البيانات الخاصة بك. تتضمن المهمة الأولى تشغيل برنامج نصي يقوم بتخزين البيانات والبيانات الوصفية التي قمت بتجميعها في ملف حصيرة، تنسيق ماتلاب الأصلي. وتستخلص المهام اللاحقة البيانات من ملف حصيرة تحليل السلاسل الزمنية. التعيينات يتم تناول المواضيع 12 بالتتابع خلال الفصل الدراسي، والذي يغطي حوالي 15 أسبوعا. حول الأسبوعين الأولين (4-5 اجتماعات الصف) وتستخدم لبعض المواد التمهيدية، واتخاذ قرار بشأن وجمع سلسلة الوقت الخاص بك، وإعداد ماتلاب على جهاز الكمبيوتر المحمول الخاص بك. كل أسبوع بعد ذلك مكرس لأحد المواضيع 12 دورة. وتتكون كل مهمة من قراءة فصل من الملاحظات، تشغيل برنامج نصي ماتلاب المرتبط الذي يطبق أساليب مختارة من تحليل السلاسل الزمنية للبيانات الخاصة بك، وكتابة تفسيرك للنتائج. المهام تتطلب فهم الموضوعات المحاضرة وكذلك القدرة على استخدام الكمبيوتر والبرمجيات. يمكنك إرسال المهام عن طريق تحميلها إلى D2L قبل فئة الثلاثاء عندما يتم عرض الموضوع التالي. وتستخدم ساعة النصف الأول من تلك الدرجة يوم الثلاثاء للتقييم الذاتي الموجه للمهمة، بما في ذلك تحميل ملفات بدف ذاتية التدرج إلى D2L. أتحقق من واحد أو أكثر من التعيينات الذاتي متدرج كل أسبوع (عن طريق اختيار عشوائي)، ويمكن تغيير الصف. لمعرفة كيفية الوصول إلى المهام، انقر فوق ملفات التعيين. تتكون القراءات من ملاحظات الطبقة. هناك اثني عشر مجموعات من ملفات. pdf الملاحظات. واحد لكل من المواضيع بالطبع. يمكن الوصول إلى ملفات بدف هذه عبر الويب. ويمكن الاطلاع على مزيد من المعلومات حول مختلف الموضوعات التي تغطيها الدورة من خلال المراجع المدرجة في نهاية كل فصل من الملاحظات الطبقة. وتستند الدرجات كليا على الأداء في المهام، كل منها يستحق 10 نقطة. لا توجد امتحانات. مجموع عدد النقاط المحتملة للموضوعات 12 هو 12 × 10 120. درجة A المطلوبة 90-100 في المئة من النقاط المحتملة. تتطلب درجة B من 80-90٪. درجة C تتطلب 70-80 في المئة، وهكذا دواليك. يتم تعيين الدرجات عن طريق التقييم الذاتي يسترشد في عنوان المقدمة في الصف. وينبغي وضع علامة على عدد النقاط المكتسبة في أعلى كل مهمة متدرجة. وينبغي أن يتضمن ترميز التخصيص الخاص بك شرحا لأي عمليات هبوط بالرجوع إلى نقطة فصلية موضحة في الصف (على سبيل المثال -0.5، يشير rp3 إلى خصم -0.5 بسبب خطأ يتعلق بنقطة النقطة 3) يكون مستحقا (تحميلها إلى D2L من قبلك) قبل بداية الصف الثلاثاء التالي. وستخصص ساعة النصف الأول من فترة اجتماع الثلاثاء لتقديم عرض الدرجات والتقييم الذاتي للمهام المنجزة وتحميل المهام ذات التصنيف الذاتي إلى D2L. هذا الجدول الزمني يمنحك 4 أيام لإكمال وتحميل المهمة إلى D2L قبل 9:00 صباحا الثلاثاء. D2L بتتبع الوقت الذي تم تحميل المهمة، ويتم تقييم أي عقوبة طالما يتم تحميلها قبل 9:00 صباحا يوم الثلاثاء من تاريخ الاستحقاق. إذا كان لديك بعض الحاجة المجدولة إلى أن تكون بعيدا عن الفصل (مثل حضور المؤتمر)، فأنت مسؤول عن تحميل المهمة قبل الساعة 9:00 صباحا يوم الثلاثاء ومن المقرر، وتحميل النسخة ذاتي التدرج بحلول الساعة 10:15 صباحا نفس اليوم. وبعبارة أخرى، فإن الجدول الزمني هو نفسه بالنسبة للطلاب الذين هم في الصف. إذا ظهرت حالة طوارئ (على سبيل المثال تحصل على الإنفلونزا) ولا تستطيع القيام بالمهمة أو التقييم في الموعد المحدد، يرجى إرسال رسالة إلكترونية إلينا وسنصل إلى بعض أماكن الإقامة. وبخلاف ذلك، سيتم تقييم عقوبة قدرها 5 نقاط (نصف مجموع النقاط المتاحة للممارسة). مقدمة لسلسلة زمنية تنظيم البيانات للتحليل يتم تعريف سلسلة زمنية على نطاق واسع على أنه أي سلسلة من القياسات التي اتخذت في أوقات مختلفة. بعض الفئات الوصفية الأساسية من السلاسل الزمنية هي 1) طويلة مقابل قصيرة، 2) حتى خطوة الوقت مقابل متفاوتة خطوة الوقت، 3) منفصلة مقابل مستمرة، 4) الدوري مقابل أبيريوديك، 5) ثابتة مقابل غير ثابتة، و 6) متغير المتغير مقابل متعددة المتغيرات . يجب النظر في هذه الخصائص وكذلك التداخل الزمني لسلاسل متعددة في اختيار مجموعة بيانات للتحليل في هذه الدورة. سوف تحليل سلسلة الوقت الخاص بك في الدورة. الخطوات الأولى هي تحديد تلك السلسلة وتخزينها في هياكل في ملف حصيرة. التوحيد في التخزين في البداية هو مناسب لهذه الفئة بحيث يمكن أن تركز الاهتمام بعد ذلك على فهم أساليب سلسلة الوقت بدلا من تصحيح كود الكمبيوتر إلى استعداد البيانات للتحليل. هيكل هو متغير ماتلاب مماثلة لقاعدة بيانات في أن يتم الوصول إلى محتويات من قبل المصممين مجال النص. يمكن للهيكل تخزين البيانات من أشكال مختلفة. على سبيل المثال، قد يكون حقل واحد مصفوفة سلسلة زمنية رقمية، قد يكون نص آخر يصف مصدر البيانات، وما إلى ذلك. في التخصيص الأول سوف تقوم بتشغيل برنامج نصي ماتلاب يقرأ سلسلة الوقت والبيانات الوصفية من ملفات النص أسي التي تقوم بإعدادها مسبقا و تخزين البيانات في هياكل ماتلاب في ملف حصيرة واحدة. في التخصيصات اللاحقة سيتم تطبيق أساليب التسلسل الزمني على البيانات عن طريق تشغيل البرامج النصية ماتلاب والوظائف التي تقوم بتحميل ملف حصيرة وتعمل على تلك الهياكل. حدد نموذج البيانات لاستخدامها في التعيينات أثناء الدورة اقرأ: (1) Notes1.pdf، (2) الشروع في العمل، يمكن الوصول إليها من قائمة المساعدة ماتلاب الجواب: تشغيل البرنامج النصي geosa1.m والإجابة على الأسئلة المدرجة في الملف في a1.pdf كيفية التمييز بين الفئات من السلاسل الزمنية كيفية بدء وإنهاء ماتلاب كيفية إدخال أوامر ماتلاب في موجه الأوامر كيفية إنشاء أرقام في إطار الشكل كيفية تصدير الأرقام إلى معالج كلمة الفرق بين البرامج النصية ماتلاب وظائف كيفية تشغيل البرامج النصية والوظائف و شكل متغير هيكل ماتلاب كيفية تطبيق البرنامج geosa1.m للحصول على مجموعة من السلاسل الزمنية والبيانات الوصفية في هياكل ماتلاب يوضح توزيع الاحتمالات لسلسلة زمنية احتمال أن تقع الملاحظة في نطاق محدد من القيم. ويمكن التوصل إلى توزيع الاحتمال التجريبي لسلاسل زمنية عن طريق فرز وترتيب قيم السلسلة. وتعتبر الكميات والمعدلات المئوية إحصاءات مفيدة يمكن أن تؤخذ مباشرة من التوزيع الاحتمالي التجريبي. تفترض العديد من الاختبارات الإحصائية البارامترية أن السلاسل الزمنية هي عينة من مجموعة سكانية ذات توزيع احتمالي معين للسكان. وكثيرا ما يفترض أن يكون السكان طبيعيين. ويعرض هذا الفصل بعض التعاريف الأساسية والإحصاءات والمؤامرات المتعلقة بتوزيع الاحتمالات. وبالإضافة إلى ذلك، يتم تقديم اختبار (اختبار ليليفورس) لاختبار ما إذا كانت العينة تأتي من التوزيع العادي مع متوسط غير محدد والتباين. الجواب: تشغيل البرنامج النصي geosa2.m والإجابة على الأسئلة المدرجة في الملف في a2.pdf تعريفات المصطلحات: سلسلة زمنية، ومحطة، وكثافة الاحتمال، وظيفة ديستريبيتيون، كوانتي، انتشار، والموقع، يعني، الانحراف المعياري، والانحراف كيفية تفسير الرسم الأكثر قيمة في تحليل السلاسل الزمنية - مؤامرة سلسلة زمنية كيفية تفسير مؤامرة مربع، الرسم البياني واحتمال الاحتمال الطبيعي معلمات وشكل التوزيع الطبيعي ليليفورس اختبار من أجل الحياة الطبيعية: الوصف الرسومي، والافتراضات، والفرضيات الفارغة والافتراضية تحذير على تفسير مستويات دلالة من الاختبارات الإحصائية عند السلاسل الزمنية غير العشوائية في الوقت المناسب كيفية تطبيق geosa2.m للتحقق من خصائص التوزيع لسلسلة زمنية واختبار السلسلة من أجل الحياة الطبيعية يشير الارتباط الذاتي إلى ارتباط سلسلة زمنية بقيمها السابقة والمستقبلية. ويسمى الارتباط الذاتي أحيانا ارتباطا مترابطا أو ارتباطا مسلسليا. الذي يشير إلى الارتباط بين أعضاء سلسلة من الأرقام مرتبة في الوقت المناسب. ويمكن اعتبار الارتباط الذاتي الإيجابي شكلا محددا من أشكال الثبات. وهو ميل إلى أن يبقى النظام في نفس الحالة من ملاحظة إلى أخرى. على سبيل المثال، احتمال الغد يكون ممطر أكبر إذا اليوم ممطر مما إذا كان اليوم جافة. وغالبا ما ترتبط سلاسل الوقت الجيوفيزيائية بسبب القصور الذاتي أو عمليات نقل في النظام المادي. فعلى سبيل المثال، فإن نظم الضغط المنخفض المتغيرة والمتحركة ببطء في الغلاف الجوي قد تضفي استمرارا على هطول الأمطار اليومي. أو قد يؤدي التصريف البطيء لاحتياطيات المياه الجوفية إلى ربط الترابط بالتدفقات السنوية المتتالية للنهر. أو قد تؤدي عمليات التمثيل الضوئي المخزنة إلى ربط الارتباط بالقيم السنوية المتعاقبة لمؤشرات الحلقات الشجرية. ويؤدي الترابط الذاتي إلى تعقيد تطبيق الاختبارات الإحصائية عن طريق تقليل عدد الملاحظات المستقلة. ويمكن أن يؤدي الارتباط الذاتي أيضا إلى تعقيد تحديد التباين أو الترابط الكبير بين السلاسل الزمنية (مثل هطول الأمطار مع سلسلة من حلقات الأشجار). ويمكن استغلال الترابط الذاتي للتنبؤات: يمكن التنبؤ بسلسلة زمنية ذاتية الارتباط، احتمالية، لأن القيم المستقبلية تعتمد على القيم الحالية والسابقة. وهناك ثلاث أدوات لتقييم الترابط الذاتي لسلسلة زمنية هي (1) مؤامرة التسلسل الزمني، (2) مبعثر الانتثار المتأخر، و (3) دالة الترابط الذاتي. الجواب: تشغيل البرنامج النصي geosa3.m والإجابة على الأسئلة المدرجة في الملف في a3.pdf التعريفات: الارتباط الذاتي، والمثابرة، والارتباط التسلسلي، وظيفة الارتباط الذاتي (أكف)، وظيفة أوتوكوفاريانس (أكف)، حجم عينة فعالة كيفية التعرف على الارتباط الذاتي في السلاسل الزمنية مؤامرة كيفية استخدام سكاتيربلوتس متخلفة لتقييم الارتباط الذاتي كيفية تفسير أسف تآمر كيفية ضبط حجم العينة للعلاقة الذاتية التعريف الرياضي لوظيفة الارتباط الذاتي الشروط التي تؤثر على عرض الفرقة الثقة المحسوبة من أكف الفرق بين واحد من جانب واثنين من جانب واحد. كيفية تطبيق geos3.m لدراسة الترابط الذاتي لسلسلة زمنية طيف السلاسل الزمنية هو توزيع التباين في السلسلة كدالة للتردد. والهدف من التحليل الطيفي هو تقدير ودراسة الطيف. الطيف يحتوي على أي معلومات جديدة تتجاوز ذلك في وظيفة أوتوكوفاريانس (أكف)، وفي الواقع الطيف يمكن حسابيا من خلال تحويل أكف. ولكن الطيف و أسف يقدمان المعلومات عن تباين السلاسل الزمنية من وجهات النظر التكميلية. وتلخص أكف المعلومات في المجال الزمني والطيف في مجال التردد. الجواب: تشغيل البرنامج النصي geosa4.m والإجابة على الأسئلة المدرجة في الملف في a4.pdf التعريفات: التردد، الفترة، الطول الموجي، الطيف، تردد نيكويست، ترددات فورييه، عرض النطاق الترددي أسباب تحليل الطيف كيفية تفسير الطيف المرسوم من حيث التوزيع التباين الفرق بين الطيف والطيف المعياري تعريف نافذة التأخر المستخدمة في تقدير الطيف بواسطة طريقة بلكمان-توكي كيف يؤثر اختيار نافذة التأخر على عرض النطاق والتباين للطيف المقدر كيفية تحديد طيف ضوضاء أبيض وطيف الانحدار الذاتي كيفية رسم بعض الأشكال الطيفية النموذجية: الضوضاء البيضاء، الانحدار الذاتي، شبه الدورية، التردد المنخفض، وارتفاع وتيرة كيفية تطبيق geosa4.m لتحليل الطيف من سلسلة زمنية من قبل طريقة بلاكمان-توكي الانحدار التلقائي تتحرك متوسط النمذجة (أرما) نماذج الانحدار الذاتي الانتحاري (أرما) هي نماذج رياضية للاستمرارية أو الترابط الذاتي في سلسلة زمنية. وتستخدم نماذج أرما على نطاق واسع في علم الهيدرولوجيا، وعلم الديناصور، الاقتصاد القياسي، وغيرها من المجالات. هناك عدة أسباب محتملة لتركيب نماذج أرما للبيانات. النمذجة يمكن أن تسهم في فهم النظام المادي من خلال الكشف عن شيء عن العملية المادية التي تبني الثبات في السلسلة. فعلى سبيل المثال، يمكن أن يظهر نموذج بسيط للتوازن المائي المادي يتكون من شروط مدخلات الهطول والتبخر والتسلل وتخزين المياه الجوفية ليؤدي إلى سلسلة تدفق تدفق تتبع نموذجا معينا من نموذج أرما. ويمكن أيضا أن تستخدم نماذج أرما للتنبؤ بسلوك سلسلة زمنية من القيم السابقة وحدها. ويمكن استخدام هذا التنبؤ كخط أساس لتقييم الأهمية المحتملة للمتغيرات الأخرى على النظام. وتستخدم نماذج أرما على نطاق واسع للتنبؤ السلاسل الزمنية الاقتصادية والصناعية. ويمكن أيضا استخدام نماذج أرما لإزالة الثبات. في علم الأحياء، على سبيل المثال، يتم تطبيق النمذجة أرما بشكل روتيني لتوليد التسلسل الزمني المتبقية سلسلة زمنية من مؤشر حلقة العرض مع عدم الاعتماد على القيم السابقة. وتهدف هذه العملية، التي يطلق عليها بريويتينينغ، لإزالة الثبات ذات الصلة بيولوجيا من سلسلة بحيث البقايا قد تكون أكثر ملاءمة لدراسة تأثير المناخ وغيرها من العوامل البيئية الخارجية على نمو الشجرة. الإجابة: تشغيل البرنامج النصي geosa5.m والإجابة على الأسئلة المدرجة في الملف في a5.pdf الشكل الوظيفي لأبسط نماذج أر و أرما لماذا يشار إلى هذه النماذج باسم الانحدار الذاتي أو المتوسط المتحرك الخطوات الثلاث في نمذجة أرما إن الأنماط التشخيصية لل الترابط الذاتي ووظائف الترابط الذاتي الجزئي لسلسلة زمنية أر (1) تعريف خطأ التنبؤ النهائي (فبي) وكيفية استخدام فبي لتحديد أفضل نموذج أرما تعريف إحصائية بورتمانتيو وكيف يمكن أن تكون أكف من البقايا تستخدم لتقييم ما إذا كان نموذج أرما نموذجا فعالا استمرار في سلسلة كيف يتم تطبيق مبدأ بارسيموني في النمذجة أرما تعريف بريوينتينغ كيف يؤثر بريويتينينغ (1) ظهور سلسلة زمنية، و (2) الطيف من سلسلة زمنية كيفية تطبيق geosa5.m ل أرما نموذج سلسلة زمنية التحليل الطيفي - تمهيد طريقة بيريوديغرام هناك العديد من الطرق المتاحة لتقدير الطيف من سلسلة زمنية. في الدرس 4 نظرنا إلى طريقة بلاكمان-توكي، التي تقوم على تحويل فورييه من ممهدة، وظيفة أوتوكوفاريانس مقطوعة. طريقة بيريوديغرام ممهدة التحايل على التحول من حزب العدالة والتنمية عن طريق تحويل فورييه المباشر من السلاسل الزمنية وحساب الفترة الزمنية الخام، وهي وظيفة أدخلت لأول مرة في 1800s لدراسة السلاسل الزمنية. يتم تمهيد الفاصل الزمني الخام من خلال تطبيق مجموعات أو فترات مرشاح واحد أو أكثر لإنتاج الطيف المقدر. يتم التحكم في نعومة، قرار وتفاوت التقديرات الطيفية عن طريق اختيار المرشحات. وتؤدي عملية تمهيد أكثر وضوحا للخط الفاصل الخام إلى وجود طيف متغير بسلاسة متفاوتة، أو استمرارية خالية، يمكن اختبار الذروة الطيفية من أجلها. وهذا النهج بديل عن تحديد شكل وظيفي للاستمرارية الفارغة (مثل طيف أر). الجواب: تشغيل البرنامج النصي geosa6.m والإجابة على الأسئلة المدرجة في الملف في a6.pdf تعريفات: فايلوغرام الخام، مرشح دانيل، فترة من تصفية، نول استمرارية نعومة والاستقرار ودقة من مستدق الطيف، والحشو، والتسرب الخطوات الرئيسية الأربع في تقدير الطيف بواسطة الفاصل الزمني المسطح كيف يؤثر تأثير اختيار المرشح على نعومة واستقرار وحل الطيف كيف تستعمل السلسلة الباطلة في اختبار أهمية الذروة الطيفية كيفية تطبيق geosa6.m لتقدير طيف الوقت سلسلة من خلال طريقة بيريوديوغرام ممهدة واختبار دورية في تردد محدد الاتجاه في سلسلة زمنية هو التغيير التدريجي البطيء في بعض الممتلكات من سلسلة على مدى الفاصل الزمني بأكمله قيد التحقيق. ويعرف الاتجاه أحيانا بشكل فضفاض على أنه تغيير طويل الأجل في المتوسط (الشكل 7.1)، ولكن يمكن أن يشير أيضا إلى التغير في الخصائص الإحصائية الأخرى. على سبيل المثال، سلسلة حلقات الأشجار من عرض الحلقة المقاسة غالبا ما يكون لها اتجاه في التباين وكذلك متوسط (الشكل 7.2). في تحليل السلاسل الزمنية التقليدية، تم تحليل سلسلة زمنية في اتجاه، مكونات موسمية أو دورية، والتقلبات غير النظامية، ودراسة أجزاء مختلفة على حدة. وكثيرا ما تعالج تقنيات التحليل الحديثة هذه السلسلة دون تحلل روتيني، ولكن لا يزال هناك حاجة إلى دراسة منفصلة للاتجاه. ديترندينغ هو العملية الإحصائية أو الرياضية لإزالة الاتجاه من سلسلة. وكثيرا ما يطبق التجريد لإزالة ميزة يعتقد أنها تشوه أو تحجب العلاقات ذات الاهتمام. ففي علم المناخ، على سبيل المثال، قد يحجب اتجاه درجة الحرارة بسبب الاحترار الحضري علاقة بين الغيوم ودرجة حرارة الهواء. كما يتم استخدام التجزيء أحيانا كخطوة معالجة أولية لإعداد السلاسل الزمنية للتحليل بالطرق التي تفترض الاستبانة. هناك العديد من الطرق البديلة المتاحة للتفكيك. يمكن إزالة الاتجاه الخطي البسيط في الوسط بطرح خط مستقيم على الأقل مربعات. وقد تتطلب الاتجاهات الأكثر تعقيدا إجراءات مختلفة. على سبيل المثال، يتم استخدام خيط التمهيد مكعب عادة في علم الأوعية الدموية لتناسب وإزالة الاتجاه حلقة العرض التي قد لا تكون خطية، أو حتى لا تتزايد روتيني أو تناقص مع مرور الوقت. في دراسة وإزالة الاتجاه، من المهم أن نفهم تأثير ديترندينغ على الخصائص الطيفية للسلاسل الزمنية. ويمكن تلخيص هذا التأثير من خلال استجابة التردد للدالة ديترندينغ. الجواب: تشغيل البرنامج النصي geosa7.m والإجابة على الأسئلة المدرجة في الملف في a7.pdf تعاريف: استجابة التردد، سبلين، مكعب تجانس مكعب إيجابيات وسلبيات نسبة مقابل الفرق ديفرندينغ تفسير المصطلحات في معادلة المعلمة سبلين كيفية اختيار سكلين بشكل تفاعلي من استجابة التردد المطلوبة كيف يتأثر الطيف بتباعد كيفية قياس أهمية مكون الاتجاه في سلسلة زمنية كيفية تطبيق geosa7.m لاختيار تفاعلي دترندينغ وظيفة سبرليند و ديتريند سلسلة زمنية الطيف المقدر من وقت السلسلة يعطي توزيع التباين كدالة للتردد. وتبعا للغرض من التحليل، قد تكون بعض الترددات ذات فائدة أكبر من غيرها، وقد يكون من المفيد تقليل اتساع التغيرات في الترددات الأخرى عن طريق ترشيحها إحصائيا قبل عرض السلسلة وتحليلها. على سبيل المثال، قد تكون التغيرات العالية التردد (من سنة إلى أخرى) في سجل التفريغ المقاس لمستجمعات المياه غير مهمة نسبيا لإمدادات المياه في حوض يحتوي على خزانات كبيرة يمكنها تخزين عدة سنوات من الجريان السنوي المتوسط. وفي الحالات التي تكون فيها الاختلافات ذات التردد المنخفض ذات أهمية رئيسية، من المستصوب تسهيل سجل التصريف من أجل القضاء على التقلبات القصيرة المدة أو تقليلها قبل استخدام سجل التصريف لدراسة أهمية التغيرات المناخية في إمدادات المياه. والتلميع هو شكل من أشكال التصفية التي تنتج سلسلة زمنية يتم فيها تقليل أهمية المكونات الطيفية عند الترددات العالية. ويدعو المهندسون الكهربائيون هذا النوع من الفلتر إلى مرشح تمرير منخفض، لأن الاختلافات ذات التردد المنخفض يسمح لها بالمرور عبر الفلتر. وفي مرشح تمرير منخفض، تتأثر موجات التردد المنخفض (فترة طويلة) بالكاد بالتنعيم. ومن الممكن أيضا تصفية سلسلة بحيث يتم تقليل الاختلافات التردد المنخفض والاختلافات عالية التردد لم تتأثر. يسمى هذا النوع من الفلتر مرشح تمريرة عالية. إن التشتيت هو شكل من أشكال الترشيح العالي التمرير: يتتبع خط الاتجاه المجهز أدنى ترددات، كما أن بقايا خط الاتجاه قد أزيلت تلك الترددات المنخفضة. وهناك نوع ثالث من التصفية، يسمى الترشيح باند-باس، ويقلل أو يصف الترددات العالية والمنخفضة، ويترك بعض نطاقات التردد المتوسطة غير متأثرة نسبيا. في هذا الدرس، نحن نغطي عدة طرق لتلطيف، أو تمرير منخفض الترشيح. وقد ناقشنا بالفعل كيف يمكن أن يكون خط التمرير المكعب مفيدا لهذا الغرض. يتم مناقشة أربعة أنواع أخرى من المرشحات هنا: 1) المتوسط المتحرك البسيط، 2) ذو الحدين، 3) الغوسية، و 4) النوافذ (طريقة هامنج). الاعتبارات في اختيار نوع من مرشح تمريرة منخفضة هي استجابة التردد المطلوب ومدى، أو عرض، من المرشح. الجواب: تشغيل البرنامج النصي geosa8.m والإجابة على الأسئلة المدرجة في الملف في a8.pdf تعريفات: مرشح، وأوزان التصفية، وفترة مرشح، مرشح تمريرة منخفضة، مرشح تمريرة عالية، باند تمرير استجابة تردد فلتر مرشح كيف الغاوس يرتبط فلتر لتوزيع غاوس كيفية بناء مرشح ثنائي الحدين بسيط يدويا (بدون الكمبيوتر) كيفية وصف وظيفة استجابة التردد من حيث نظام مع المدخلات والمخرجات جيبية كيفية تطبيق geosa8.m لتصميم تفاعلي غاوس، ذات الحدين أو عامل تصفية هامينغ-ويندو لوباس لسلسلة زمنية معامل ارتباط بيرسون-برودوكت اللحظي هو على الأرجح الإحصائية الأكثر استخداما على نطاق واسع لتلخيص العلاقة بين متغيرين. إن الدلالات الإحصائية ومحاذير تفسير معامل الارتباط كما هو مطبق على السلاسل الزمنية هي موضوعات هذا الدرس. وفي إطار بعض الافتراضات، تعتمد الدلالة الإحصائية لمعامل الارتباط على مجرد حجم العينة، الذي يعرف بأنه عدد الملاحظات المستقلة. إذا كانت السلاسل الزمنية ذات علاقة ذاتية، يجب استخدام حجم عينة فعال، أقل من حجم العينة الفعلي، عند تقييم الأهمية. ويمكن أن تؤدي العلاقات العابرة أو الزائفة إلى ارتباط كبير لبعض الفترات وليس للآخرين. ويمكن النظر في الاختلاف الزمني لقوة الارتباط الخطي مع قطع من الارتباط المحسوب لنافذة منزلقة. ولكن إذا تم تقييم العديد من معاملات الارتباط في وقت واحد، ينبغي تعديل فترات الثقة (تعديل بونفيروني) للتعويض عن زيادة احتمال مراقبة بعض الارتباطات العالية في حالة عدم وجود علاقة. ويمكن أيضا أن يكون تفسير الارتباطات الانزلاقية معقدا بسبب الاختلافات الزمنية لمتوسط التباين في السلسلة، لأن الارتباط الانزلاقي يعكس التباين من حيث الانحراف المعياري عن الوسائل في نافذة الوقت ذات الاهتمام، والتي قد تختلف عن الوسائل الطويلة الأجل. وأخيرا، ينبغي التأكيد على أن معامل ارتباط بيرسون يقيس قوة العلاقة الخطية. سكاتيربلوتس مفيدة للتحقق مما إذا كانت العلاقة الخطية. الإجابة: تشغيل البرنامج النصي geosa9.m والإجابة عن الأسئلة المدرجة في الملف في a9.pdf التعريف الرياضي لمعامل الارتباط الافتراضات وفرضية اختبار دلالة معامل الارتباط كيفية حساب مستوى دلالة معامل الارتباط وتعديل مستوى دلالة الارتباط الذاتي في the individual time series Caveats to interpretation of correlation coefficient Bonferroni adjustment to signficance level of correlation under multiple comparisons Inflation of variance of estimated correlation coefficient when time series autocorrelated Possible effects of data transformation on correlation How to interpret plots of sliding correlations How to apply geosa9. m to analyze correlations and sliding correlations between pairs of time series Lagged relationships are characteristic of many natural physical systems. Lagged correlation refers to the correlation between two time series shifted in time relative to one another. Lagged correlation is important in studying the relationship between time series for two reasons. First, one series may have a delayed response to the other series, or perhaps a delayed response to a common stimulus that affects both series. Second, the response of one series to the other series or an outside stimulus may be smeared in time, such that a stimulus restricted to one observation elicits a response at multiple observations. For example, because of storage in reservoirs, glaciers, etc. the volume discharge of a river in one year may depend on precipitation in the several preceding years. Or because of changes in crown density and photosynthate storage, the width of a tree-ring in one year may depend on climate of several preceding years. The simple correlation coefficient between the two series properly aligned in time is inadequate to characterize the relationship in such situations. Useful functions we will examine as alternative to the simple correlation coefficient are the cross-correlation function and the impulse response function. The cross-correlation function is the correlation between the series shifted against one another as a function of number of observations of the offset. If the individual series are autocorrelated, the estimated cross-correlation function may be distorted and misleading as a measure of the lagged relationship. We will look at two approaches to clarifying the pattern of cross-correlations. One is to individually remove the persistence from, or prewhiten, the series before cross-correlation estimation. In this approach, the two series are essentially regarded on equal footing . An alternative is the systems approach: view the series as a dynamic linear system -- one series the input and the other the output -- and estimate the impulse response function. The impulse response function is the response of the output at current and future times to a hypothetical pulse of input restricted to the current time. Answer: Run script geosa10.m and answer questions listed in the file in a10.pdf Definitions: cross-covariance function, cross-correlation function, impulse response function, lagged correlation, causal, linear How autocorrelation can distort the pattern of cross-correlations and how prewhitening is used to clarify the pattern The distinction between the equal footing and systems approaches to lagged bivariate relationships Which types of situations the impulse response function (irf) is an appropriate tool How to represent the causal system treated by the irf in a flow diagram How to apply geos10.m to analyze the lagged cross-correlation structure of a a pair of time series Multiple linear regression Multiple linear regression (MLR) is a method used to model the linear relationship between a dependent variable and one or more independent variables. The dependent variable is sometimes also called the predictand, and the independent variables the predictors. MLR is based on least squares: the model is fit such that the sum-of-squares of differences of observed and predicted values is minimized. MLR is probably the most widely used method in dendroclimatology for developing models to reconstruct climate variables from tree-ring series. Typically, a climatic variable is defined as the predictand and tree-ring variables from one or more sites are defined as predictors. The model is fit to a period -- the calibration period -- for which climatic and tree-ring data overlap. In the process of fitting, or estimating, the model, statistics are computed that summarize the accuracy of the regression model for the calibration period. The performance of the model on data not used to fit the model is usually checked in some way by a process called validation. Finally, tree-ring data from before the calibration period are substituted into the prediction equation to get a reconstruction of the predictand. The reconstruction is a prediction in the sense that the regression model is applied to generate estimates of the predictand variable outside the period used to fit the data. The uncertainty in the reconstruction is summarized by confidence intervals, which can be computed by various alternative ways. Answer: Run script geosa11.m (Part 1) and answer questions listed in the file in a11.pdf The equation for the MLR model Assumptions for the MLR model Definitions of MLR statistics: coefficient of determination, sums-of-squares terms, overall-F for the regression equation, standard error of the estimate, adjusted R-squared, pool of potential predictors The steps in an analysis of residuals How to apply geosa11.m (part 1) to fit a MLR regression model to predict one variable from a set of several predictor variables Validating the regression model Regression R-squared, even if adjusted for loss of degrees of freedom due to the number of predictors in the model, can give a misleading, overly optimistic view of accuracy of prediction when the model is applied outside the calibration period. Application outside the calibration period is the rule rather than the exception in dendroclimatology. The calibration-period statistics are typically biased because the model is tuned for maximum agreement in the calibration period. Sometimes too large a pool of potential predictors is used in automated procedures to select final predictors. Another possible problem is that the calibration period itself may be anomalous in terms of the relationships between the variables: modeled relationships may hold up for some periods of time but not for others. It is advisable therefore to validate the regression model by testing the model on data not used to fit the model. Several approaches to validation are available. Among these are cross-validation and split-sample validation. In cross-validation, a series of regression models is fit, each time deleting a different observation from the calibration set and using the model to predict the predictand for the deleted observation. The merged series of predictions for deleted observations is then checked for accuracy against the observed data. In split-sample calibration, the model is fit to some portion of the data (say, the second half), and accuracy is measured on the predictions for the other half of the data. The calibration and validation periods are then exchanged and the process repeated. In any regression problem it is also important to keep in mind that modeled relationships may not be valid for periods when the predictors are outside their ranges for the calibration period: the multivariate distribution of the predictors for some observations outside the calibration period may have no analog in the calibration period. The distinction of predictions as extrapolations versus interpolations is useful in flagging such occurrences. Answer: Run script geosa11.m (Part 2) and answer questions listed in the file in a12.pdf Definitions: validation, cross-validation, split-sample validation, mean square error (MSE), root-mean-square error (RMSE) standard error of prediction, PRESS statistic, hat matrix, extrapolation vs interpolation Advantages of cross-validation over alternative validation methods How to apply geosa11.m (part 2) for cross-validated MLR modeling of the relationship between a predictand and predictors, including generation of a reconstruction and confidence bands Downloading Files -- tsfiles. zip The Matlab class scripts and user-written functions are zipped in a file called tsfiles. zip. To get the files, first create an empty directory on your computer. This is where you will store all functions, scripts and data used in the course. Go to D2L, or click on tsfiles. zip to download the zip file to that directory and unzip it there. When you run matlab, be sure that directory is your current matlab working directory. Powerpoint lecture outlines miscellaneous files. Downloadable file other. zip has miscellaneous files used in lectures. Included are Matlab demo scripts, sample data files, user-written functions used by demo scripts, and powerpoint presentations, as pdfs (lect1a. pdf, lect1b. pdf, etc.) used in on-campus lectures. I update other. zip over the semester, and add the presentation for the current lecture within a couple of days after that lecture is given. To run the Matlab scripts for the assignments, you must have your data, the class scripts, and the user-written Matlab functions called by the scripts in a single directory on your computer. The name of this directory is unimportant. Under Windows, it might be something like C:geos585a. The functions and scripts provided for the course should not require any tailoring, but some changes can be made for convenience. For example, scripts and functions will typically prompt you for the name of your input data file and present Spring17 as the default. That is because Ive stored the sample data in Spring17.mat. If you want to avoid having to type over Spring17 with the name of your own data file each time you run the script, edit the matlab script with the Matlab editordebugger to change one line. In the editor, search for the string Spring17 and replace it with the name of your. mat storage file (e. g. Smith2017), then be sure to re-save the edited script. Autocorrelation Function Note that 0 is the variance of the stochastic process. The autocovariance function at lag k . for k 0, of the time series is defined by The autocorrelation function ( ACF ) at lag k . for k 0, of the time series is defined by The variance of the time series is r 0 . A plot of r k against k is known as a correlogram . Observation . The definition of autocovariance given above is a little different from the usual definition of covariance between 1 . , y n-k and k 1 . , y n in two respects: (1) we divide by n instead of nk and we subtract the overall mean instead of the means of 1 . , y n-k and k 1 . , y n respectively. For values of n which are large with respect to k . the difference will be small. مثال 1 . Calculate s 2 and r 2 for the data in range B4:B19 of Figure 1. Figure 1 ACF at lag 2 The formulas for calculating s 2 and r 2 using the usual COVARIANCE. S and CORREL functions are shown in cells G4 and G5. The formulas for s 0 . s 2 and r 2 from Definition 2 are shown in cells G8, G11 and G12 (along with an alternative formula in G13). Note that the values for s 2 in cells E4 and E11 are not too different, as are the values for r 2 shown in cells E5 and E12 the larger the sample the more likely these values will be similar Real Statistics Function . The Real Statistics Resource Pack supplies the following functions: ACF (R1, k ) the ACF value at lag k for the time series in range R1 ACVF (R1, k ) the autcovariance at lag k for the time series in range R1 Note that ACF(R1, k ) is equivalent to SUMPRODUCT(OFFSET(R1,0,0,COUNT(R1)- k )-AVERAGE(R1),OFFSET(R1, k ,0,COUNT(R1)- k )-AVERAGE(R1))DEVSQ(R1) Observation . There are theoretical advantages for using division by n instead of nk in the definition of s k . namely that the covariance and correlation matrices will always be definite non-negative (see Positive Definite Matrices ). Observation . Even though the definition of autocorrelation is slightly different from that of correlation, k (or r k ) still takes a value between -1 and 1, as we see in Property 2. Example 2 . Determine the ACF for lag 1 to 10 for the Dow Jones closing averages for the month of October 2015, as shown in columns A and B of Figure 2 and construct the corresponding correlogram. The results are shown in Figure 2. The values in column E are computed by placing the formula ACF(B4:B25, D5) in cell E5, highlighting range E5:E14 and pressing Ctrl-D . Figure 2 ACF and Correlogram As can be seen from the values in column E or the chart, the ACF values descend slowly towards zero. This is typical of an autoregressive process. Observation . A rule of thumb is to carry out the above process for lag 1 to n 3 or n 4, which for the above data is 224 6 or 223 7. Our goal is to see whether by this time the ACF is significant (i. e. statistically different from zero). We can do this by using the following property. Property 3 ( Bartlett ): In large samples, if a time series of size n is purely random then for all k Example 3 . Determine whether the ACF at lag 7 is significant for the data from Example 2. As we can see from Figure 3, the critical value for the test in Property 3 is .417866. Since r 7 .303809 lt .417866, we conclude that is not significantly different from zero. Figure 3 Bartletts Test Note that values of k up to 5 are significant and those higher than 5 are not significant. A more statistically powerful version of Property 4, especially for smaller samples, is given by the next property. Example 4 . Use the Box-Pierce and Ljung-Box statistics to determine whether the ACF values in Example 2 are statistically equal to zero for all lags less than or equal to 5 (the null hypothesis). The results are shown in Figure 4. Figure 4 Box-Pierce and Ljung-Box Tests We see from these tests that ACF( k ) is significantly different from zero for at least one k 5, which is consistent with the correlogram in Figure 2. Real Statistics Functions . The Real Statistics Resource Pack provides the following functions to perform the tests described by the above properties. BARTEST ( r, n, lag ) p-value of Bartletts test for correlation coefficient r based on a time series of size n for the specified lag . BARTEST (R1. lag ) BARTEST( r, n, lag ) where n the number of elements in range R1 and r ACF(R1, lag ) PIERCE (R1,, lag ) Box-Pierce statistic Q for range R1 and the specified lag BPTEST (R1,, lag ) p-value for the Box-Pierce test for range R1 and the specified lag LJUNG (R1,, lag ) Ljung-Box statistic Q for range R1 and the specified lag LBTEST (R1,, lag ) p-value for the Ljung-Box test for range R1 and the specified lag In the above functions where the second argument is missing, the test is performed using the autocorrelation coefficient (ACF). If the value assigned instead is 1 or pacf then the test is performed using the partial autocorrelation coefficient (PACF) as described in the next section. Actually if the second argument takes any value except 1 or pacf, then the ACF value is used. مثلا BARTEST(.303809,22,7) .07708 for Example 3 and LBTEST(B4:B25,acf,5) 1.81E-06 for Example 4.
No comments:
Post a Comment