close
تبلیغات در اینترنت
دانلود پایان نامه :تحليل مقايسه­اي كارآمدي مدل­هاي رگرسيون بردار پشتيبان، شبكه عصبي و ARIMA با ...
loading...

سایت دانلود پایان نامه

  فهرست مطالب   فصل اول: 1-1) مقدمه……………………………………………………………………………………………………………………………………………………………………………………………………………………..…

دانلود پایان نامه :تحليل مقايسه­اي كارآمدي مدل­هاي رگرسيون بردار پشتيبان، شبكه عصبي و ARIMA با ...

 

فهرست مطالب

 

فصل اول:

1-1) مقدمه…………………………………………………………………………………………………………………………………………………………………………………………………………………….. 8

1-2) تشريح و بيان موضوع…………………………………………………………………………………………………………………………………………………………………………………………….. 9

1-3) ضرورت انجام تحقيق…………………………………………………………………………………………………………………………………………………………………………………………….. 9

1-4) سابقه تحقيقات و مطالعات انجام گرفته……………………………………………………………………………………………………………………………………………………………… 10

1-5) فرضيه‌هاي تحقيق………………………………………………………………………………………………………………………………………………………………………………………………. 12

1-6) اهداف اساسي از انجام تحقيق…………………………………………………………………………………………………………………………………………………………………………….. 12

1-7) نتايج مورد انتظار پس از انجام اين تحقيق………………………………………………………………………………………………………………………………………………………… 13

1-8) روش انجام پژوهش………………………………………………………………………………………………………………………………………………………………………………………………. 13

1-8-1 ) روش تحقيق…………………………………………………………………………………………………………………………………………………………………………………………………. 14

1-8-2) روشهاي گردآوري اطلاعات……………………………………………………………………………………………………………………………………………………………………………. 14

1-8-3) قلمرو تحقيق…………………………………………………………………………………………………………………………………………………………………………………………………… 14

1-8-4) جامعه­ی آماري……………………………………………………………………………………………………………………………………………………………………………………………… 15

1-8-5) نمونه­ی آماري……………………………………………………………………………………………………………………………………………………………………………………………….. 15

1-8-6) روش يا روش­هاي نمونه گيري…………………………………………………………………………………………………………………………………………………………………  15

1-8-7) روشهاي مورد نظر براي تجزيه و تحليل اطلاعات و آزمون فرضيه‌ها…………………………………………………………………………………………………………. 15

1-9)تعريف واژه­ها و اصطلاحات تخصصي طرح………………………………………………………………………………………………………………………………………………………… 17

فصل دوم:

2-1)  مقدمه………………………………………………………………………………………………………………………………………………………………………………………………………………… 19

2-2) انواع داده ها………………………………………………………………………………………………………………………………………………………………………………………………………                             . 21

2-2-1 ) داده­های سری زمانی……………………………………………..                          ……………………………………………………………………………………………………………………………………….21

2-2-2) داده­های مقطعی………………………………………………………………………………………………………………………………………………………………………………………………21

2-2-3) داده­های پانل……………………………………………………………………………………………………………………………………………………………………………………………………22

2-3) مدل­های سری زمانی تک متغیره………………………………………………………………………………………………………………………………………………………………………. 22

2-4) مفاهیم مهم در تحلیل سری­های زمانی……………………………………………………………………………………………………………………………………………………………… 22

2-4-1)  مانایی…………………………………………………………………………………………………………………………………………………………………………………………………………….. 22

2-4-2 ) خودکوواریانس، خودهمبستگی و خودهمبستگی جزئی………………………………………………………………………………………………………………………………. 24

2-4-3)  تابع خودهمبستگی و خودهمبستگی جزئی…………………………………………………………………………………………………………………………………………………. 24

2-4-4)  فرآیند نوفه­ی سفید…………………………………………………………………………………………………………………………………………………………………………………….. 25

2-4-5 ) آماره­ی Q……………………………………………………………………………………………………………………………………………………………………………………………………. 25

2-5)  فرآیندهای خودرگرسیو(AR)……………………………………………………………………………………………………………………………………………………………………………. 27

2-6)  فرآیندهای میانگین متحرک (MA)……………………………………. ………………………………………………………………………………………………………………………. 28

2-7)  فرآیندهای خودرگرسیو  میانگین متحرک (ARMA) …………………………………………………………………………………………….. ………………………………….. 28

2-8)  مدل­های خودرگرسیو میانگین متحرک انباشته (ARIMA) …………………………………………………………………………………………….. ………………………….. 30

2-9)  مراحل ساخت مدل­های  ARIMA……………………………………. …………………………………………………………………………………………………………………………….. 30

2-10 ) انواع نامانایی……………………………………. ……………………………………………………………………………………………………………………………………………………………. 31

2-11 ) آزمون ریشه­ی واحد……………………………………. ………………………………………………………………………………………………………………………………………………… 32

2-12)  معیارهای اطلاعاتی……………………………………. ………………………………………………………………………………………………………………………………………………….. 33

2-13)  شبکه­های عصبی مصنوعی……………………………………. ………………………………………………………………………………………………………………………………………. 33

2-13-1) نرون­های بیولوژیکی……………………………………. ……………………………………………………………………………………………………………………………………………. 33

2-13-2) سیر تاریخی شبکه­های عصبی……………………………………. …………………………………………………………………………………………………………………………….. 34

2-13-3) کاربرد شبکه­های عصبی……………………………………. …………………………………………………………………………………………………………………………………….. 36

2-13-4) اجزا و ساختار شبکه­های عصبی……………………………………. …………………………………………………………………………………………………………………………. 38

2-13-5) مدل ریاضی نرونها………………………………………………………………………………………………………………………………………………………………………………………… 40

2-13-6)  الگوریتم پس­انتشار خطا……………………………………………………………………………………………………………………………………………………………………………… 44

2-13-7) معماری شبکه­های پس­انتشار………………………………………………………………………………………………………………………………………………………………………. 45

2-13-8) طراحی شبکه­ی عصبی………………………………………………………………………………………………………………………………………………………………………………….45

2-13-9) الگوریتم یادگیری Levenberg- Marquardt……………………………………………………………………………………………………………………………………… 48

2-13-10) مزایا و معایب شبکه­ی عصبی………………………………………………………………………………………………………………………………………………………………….. ..49

2-14) ماشین بردار پشتيبان……………………………………………………………………………………………………………………………………………………………………………………50

2-15) ماشین بردار پشتیبان دو کلاسه………………………………………………………………………………………………………………………………………………………………………..52

2-16) ماشین بردار پشتیبان با حاشیه ثابت…………………………………………………………………………………………………………………………………………………………………54

2-17) ماشین بردار پشتیبان با حاشیه منعطف……………………………………………………………………………………………………………………………………………………………58

2-18) ماشین بردار پشتیبان چند کلاسه…………………………………………………………………………………………………………………………………………………………………….59

2-19)رویکرد طبفه بندی غیر خطی در ماشین بردار پشتیبان……………………………………………………………………………………………………………………………………60

2-20) رگرسیون بردار پشتیبان…………………………………………………………………………………………………………………………………………………………………………………….63

2-20-1) رگرسیون خطی بردارپشتیبان……………………………………………………………………………………………………………………………………………………………………….63

2-20-2) رگرسیون غیرخطی بردار پشتیبان………………………………………………………………………………………………………………………………………………………………..66

2-21) مزایا و معایب ماشین بردار پشتیبان………………………………………………………………………………………………………………………………………………………………….67

2-22)  شبکه­های عصبی و عملکردهای متفاوت……………………………………………………………………………………………………………………………………………………. ……68

2-23)  مروری بر مطالعات ترکیبی…………………………………………………………………………………………………………………………………………………………………………….. .73

فصل سوم:

3-9) آزمون دایبولد- ماریانو………………………………………………………………………………………………………………………………………………………………………………………….87

3-10) جمع بندي………………………………………………………………………………………………………………………………………………………………………………………………………..89

فصل چهارم:

4-1) مقدمه……………………………………………………………………………………………………………………………………………………………………………………………………………………91

4-2) بررسی مانایی بازده­های لگاریتمی……………………………………………………………………………………………………………………………………………………………………….. 92

4-3)محاسبه­ی معیار میانگین مجذور خطا………………………………………………………………………………………………………………………………………………………………….. 93

4-4) محاسبه­ی تابع زیان قدر مطلق درصد خطا…………………………………………………………………………………………………………………………………………………………. 96

4-5) آزمون فرضیه­های تحقیق……………………………………………………………………………………………………………………………………………………………………………… 100

 فصل پنجم:

5-1) نتیجه­گیری…………………………………………………………………………………………………………………………………………………………………………………… 116

5-2) پیشنهادات برای تحقیقات آتی………………………………………………………………………………………………………………………………………………………. 118

منابع و مآخذ

منابع داخلی…………………………………………………………………………………………………………………………………………………………………………………………… 119

منابع خارجی…………………………………………………………………………………………………………………………………………………………………………………………… 121

 

فهرست اشکال

شکل 2-1) ساختار پایه­ای شبکه­ی عصبی…………………………………………………………………………………………………………………………………………………………………. 38

شکل 2-2) نرون با یک ورودی عددی………………………………………………………………………………………………………………………………………………………………………. 40

شکل 2-3) شبکه تک لایه با چندین نرون و بردار ورودی…………………………………………………………………………………………………….. ……………………………….. 43

شکل 2-4) شبکه­های عصبی با چندین لایه و چندین نرون……………………………………………………………………………………………………………………………………. 43

شکل 2-5) شبکه­ی عصبی پیش­خور با تابع فعال سازی تانژانت هیپربولیک………………………………………………………………………………………………………….. 45

شکل2-6) طبقه بندی کلاس داده ها توسط ماشین بردار پشتیبان……………………………………………………………………………………………………………………………53

شکل 2-7) طبقه بندی بهینه کلاس داده ها توسط ماشین بردار پشتیبان……………………………………………. …………………………………………………………………54

شکل2-8) ماشین بردار پشتیبان با حاشیه ثابت…………………………………………………………………… …………………………………………………………………………………..55

شکل2-9) فرآیند ماشین بردار پشتیبان……………………………………………………………………………………………… …………………………………………………………………….57

شکل 2-10) ماشین بردار پشتیبان با حاشیه نرم…………………………………………………………… ………………………………………………………………………………………..59

شکل 2-11) طبقه بندی غیر خطی ماشین بردارپشتیبان………………………………………….. ……………………………………………………………………………………………60

شکل 2-12) تابع ضرر وپنیک و متغیرهای slack………………………………………….. ……………………………………………………………………………………………………….64

 

فهرست جداول

جدول 4-1) آزمون دیکی و فولر برای بازده لگاریتمی سری زمانی شاخص کل……………………………………………………………………………………………………… …94

جدول 4-2) قدرمطلق خطا برای مقایسه مدل ترکیبی آریما و شبکه عصبی با هر یک از اجزای تشکیل دهنده…………………………………………………… 95

جدول 4-6) آزمون مقایسه زوجی مدل ترکیبی آریما و شبکه عصبی با آریما(قدرمطلق خطا) ………………………………………………………………………….. 102

جدول 4-7) آزمون مقایسه زوجی مدل ترکیبی آریما و شبکه عصبی با شبکه عصبی(قدرمطلق خطا) ……………………………………………………………. 105

جدول 4-9) آزمون مقایسه زوجی مدل ترکیبی آریما و شبکه عصبی با آریما (قدرمطلق درصد خطا) ………………………………………………………………. 105

جدول 4-10) آزمون مقایسه زوجی مدل ترکیبی آریما و شبکه عصبی با شبکه عصبی(قدرمطلق درصدخطا)………………………………….. 106

جدول 4-11) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه مدل ترکیبی آریما و شبکه عصبی با هر یک بطور مجزا(قدر مطلق درصد خطا)………………………… ………………………………………. ………………………….. …………………………………………………………………………………………………………….. 107

جدول 4-12) آزمون مقایسه زوجی مدل ترکیبی آریما و رگرسیون بردار پشتیبان با آریما( قدر مطلق خطا)……………………………………………………………………………………………………………………………………………………………………………………………………108

جدول4-13) آزمون مقایسه زوجی مدل ترکیبی آریما و رگرسیون بردار پشتیبان با SVR( قدر مطلق خطا)………………………………….108

جدول4-14) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه مدل ترکیبی آریما و SVR با هر یک بطور مجزا(قدر مطلق خطا)………………………………………………………………………………………………………………………………………………………………………………………………….109

جدول 4-15) آزمون مقایسه زوجی مدل ترکیبی آریما و رگرسیون بردار پشتیبان با آریما( قدر مطلق درصد خطا)……………………..112

جدول 4-16) آزمون مقایسه زوجی مدل ترکیبی آریما و شبکه عصبی با شبکه عصبی( قدر مطلق خطا)……………………………………..112

جدول4-17) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه مدل ترکیبی آریما و SVR با هر یک بطور مجزا(قدر مطلق

درصد خطا)………………………………………………………………………………………………………………………………………………………………………………………..112

جدول 4-18) آزمون مقایسه زوجی دو مدل ترکیبی(قدر مطلق خطا)…………………………………………………………………………………………….113

جدول4-19) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه دو مدل ترکیبی(قدر مطلق خطا)……………………………………….114

جدول 4-20) آزمون مقایسه زوجی دو مدل ترکیبی( قدر مطلق درصد خطا)………………………………………………………………………………..114

جدول4-21) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه دو مدل ترکیبی(قدر مطلق درصد خطا)……………………………115

 

فصل اول:

طرح تحقیق

1-1) مقدمه

سرمایه و نیروی انسانی از ارکان اصلی تولید هستند و تامین این عوامل و تخصیص بهینه آنها لازمه رشد اقتصادی است. این تخصیص مستلزم وجود بازار و عملکرد مطلوب نیروهای بازار است. دررابطه با سرمایه بازار بورس می­تواند این وظیفه را بر عهده داشته باشد. مهم­ترین وظیفه بازار بورس، جذب سرمایه­های پراکنده و هدایت آنها بسوی فعالیت­های سرمایه­گذاری از طریق یک فرآیند تخصیص بهینه است.

نوسان قیمت سهام نیز در تمام بازارهای بورس امر طبیعی و عادی است، اما در هر صورت می­توان با یک پیش­بینی از قیمت سهام ترکیبی مطلوب از آنها را انتخاب و نوسان­ها را کاهش داد. پیش­بینی شاخص­های مهم بازار بورس می­تواند گامی در جهت افزایش و شفاف نمودن اطلاعات در بازار سرمایه باشد.

پیش­بینی شاخص­های بورس یا بازار سرمایه همواره مورد توجه مطالعات بوده است. این توجه در سال­های اخیر منجر به پیشرفت الگوهای مورد استفاده در پیش­پیش‌بینی شده است. لیکن باید پیش­بینی را مورد توجه قرار داد که با دقت بیشتری صورت گیرد و نسبت به نتایج واقعی مشاهده شده خطای کمتری داشته باشد.

پیش­بینی­ سری­های زمانی یکی از مهم­ترین روش­های پیش­بینی است که در آن از مشاهدات گذشته­ی یک متغیر به منظور توسعه­ی مدل و پیش­بینی در آینده استفاده می­گردد. روش­های سری زمانی، درطول چند دهه گذشته توسعه بسیاری یافته اند، اما یکی از مهمترین و پرکاربردترین آن­ها مدل خودرگرسیو میانگین متحرک انباشته (ARIMA[1]) می­باشد که  تحت عنوان روش باکس و جنکینز شناخته می­شود.

خودرگرسیو میانگین متحرک انباشته (ARIMA) که خلاصه شده‌ی (Autoregressive Integrated Moving Average) می‌باشد، یکی از پرکاربردترین مدل‌ها در پیش‌بینی سری‌های زمانی در طول سه دهه‌ی گذشته بوده است، اما پیش‌فرض اصلی آن این است که رابطه‌ی خطی میان ارزش‌های سری برقرار باشد. بنابراین رابطه‌های غیرخطی بوسیله‌ی مدل خودرگرسیو میانگین متحرک انباشته نمی‌توانند خوب توضیح داده شوند.

یکی دیگر از روش‌های مورد استفاده در پیش‌بینی سری‌های زمانی  شبکه‌ی عصبی است که توان تخمین روابط غیر‌خطی مختلفی را دارا می‌باشد (اصطلاحاً به شبکه‌ی عصبی تخمین زننده‌ی همگانی[2] می‌گویند). اما استفاده از شبکه، طبق ادبیات تحقیق در روابط خطی نتایج پیچیده‌ای در بر داشته است.

نوع دیگر از روش­های پیش­بینی سری زمانی رگرسیون بردار پشتیبان(SVR [3] ) است. ماشین بردار پشتیبان، تابع رگرسیون را با به کارگیری یک دسته تابع خطی تخمین می زند و عملیات رگرسیون را با تابعی که انحراف از مقدار واقعی در آن به میزان کمتر از ɛ مجاز است انجام می دهد سپس با کمینه کردن ریسک ساختاری ، بهترین جواب را ارائه می دهد.[57]

بطور کلی باید به این نکته اشاره کرد که دانستن الگوی داده‌ها، مبنی بر خطی و غیرخطی بودن در دنیای واقعی کمی دشوار است و به ندرت سری‌های زمانی به طور خالص خطی و غیرخطی می‌باشند و اغلب از هر دو الگو تبعیت می‌کنند. بنابراین مسأله اینجاست که چگونه می‌توانیم قیمت پایانی و دامنه‌ی نوسان قیمت را با خطای کمتری پیش‌بینی کنیم؟

1-2) تشريح و بيان موضوع

در زمینه مدل‌سازی سری­های زمانی، روش­های متفاوتی مورد استفاده قرار می‌گیرد. مدل‌های سنتی مانند میانگین متحرک، هموارسازی نمایی و خودرگرسیو میانگین متحرک انباشته پیش‌بینی آینده را به روابط خطی از گذشته محدود می‌نمایند و الگوهای خطی را مدل سازی می­کنند. از این مدل‌ها به دلیل سادگی در فهم و کاربرد در دهه‌های اخیر بسیار استفاده شده است. با وجود انعطاف پذیری بالای مدل خودرگرسیو میانگین متحرک انباشته در مدل سازی الگوهای خطی این مدل نمی­تواند الگوهای غیر خطی را خوب مدل سازی کند.

به دلیل مشاهده الگوهای غیرخطی در دنیای واقعی یک سری از مدل‌های غیرخطی مانند[4]ARCH GARCH,  [5]  ،[6]TGARCH  مطرح گردیدند. همگی این مدل‌ها، الگوهای غیرخطی بخصوصی­ را­ توضیح می‌دهند.

اما شبکه عصبی مجازی([7]ANN) توان و قدرت پیش‌بینی روابط غیرخطی را داراست و کاملاً انعطاف پذیر عمل می‌نماید. شبکه­های عصبی مصنوعی از عناصر عملیاتی ساده­ای ساخته می­شوند که به صورت موازی در کنار یکدیگر عمل می­کنند. این عناصر که از سیستم­های عصبی زیستی الهام گرفته شده­اند، در تلاش­اند که به صورت ناپارامتریک، مغز انسان را شبیه سازی نمایند. نكته حائز اهميت در استفاده از مدل شبکه عصبی وجود نتایج متفاوت برای روابط خطی است. برای مثال مارکهام[8] و راکس[9] اذعان داشتند عملکرد شبکه عصبی برای مساله‌های رگرسیون خطی وابسته به اندازه نمونه و سطح شوک (Noise) می‌باشد. [53]

از طرفي ماشین بردار پشتیبان (SVM)[10] به عنوان تکنیک نوین یکی از روش­های یادگیری ماشینی است که بر مبنای تئوری یادگیری آماری واپنیک[11] در دهه 90 میلادی توسط واپنیک و همکارانش ارائه گردید.  این روش از جمله روش‌های نسبتاً جدیدی است که در سال‌های اخیر کارایی خوبی نسبت به روش‌های قدیمی‌تر از جمله شبکه‌های عصبی پرسپترون نشان داده است. رگرسيون بردار پشتيبان اين عمل را با تابعي كه انحراف از مقدار واقعي در آن به ميزان كمتر از ɛ مجاز است، انجام مي­دهد.

همانطور که ذکر شد با وجود مزایای متعدد، شبکه های عصبی با محدودیت هایی از جمله مدل­سازی روابط خطی و همچنین نیازمند بودن به شمار بالای نمونه برای آموزش(به منظور انجام فرآیند یادگیری) مواجه می­باشد. اما چون دانستن خصوصیات داده­ها مبنی بر خطی و یا غیر خطی بودن در واقعیت کمی دشوار است و از طرفی به ندرت روابط کاملا خطی و یا کاملا غیر خطی مشاهده می­شود، بنابراین این ایده به ذهن می­رسد که ترکیب مدل خطی آریما با مدل­های غیر خطی شبکه عصبی پیشخور و ماشین بردار پشتیبان می­تواند باعث بهبود دقت پیش­بینی گردد.

در مدل ترکیبی سعی بر این داریم ابتدا روابط غیر­خطی در پسماندها را با استفاده از شبکه­ی عصبی و رگرسيون بردار پشتيبان شناسایی کرده سپس پسماندهای بدست آمده را به مدل خودرگرسیو میانگین متحرک انباشته اضافه کنیم. با این ترکیب، بخش خطی بوسیله‌ی مدل خودرگرسیو میانگین متحرک انباشته و بخش غیرخطی بوسیله‌ی شبکه عصبي و رگرسيون بردار پشتيبان پیش‌بینی خواهد شد.

با عنايت به مطالبي كه ذكر شد اين سوال پيش مي­آيد كه کدامیک از مدل­های رگرسيون بردار پشتيبان، شبكه عصبي، خودرگرسیو میانگین متحرک انباشته و مدل­هاي تركيبي، با دقت بالاتر و خطاي كمتري توانايي پیش­بینی شاخص بورس اوراق بهادار تهران را دارد؟

[10]-Support vector machine

ارسال نظر برای این مطلب

نام
ایمیل (منتشر نمی‌شود) (لازم)
وبسایت
:) :( ;) :D ;)) :X :? :P :* =(( :O @};- :B /:) :S
نظر خصوصی
مشخصات شما ذخیره شود ؟ [حذف مشخصات] [شکلک ها]
کد امنیتی
تبلیغات
Rozblog.com رز بلاگ - متفاوت ترين سرويس سایت ساز
درباره ما
متن کامل پایان نامه های این وبلاگ را در سایت www.arshadha.ir می توانید ببینید
اطلاعات کاربری
نام کاربری :
رمز عبور :
  • فراموشی رمز عبور؟
  • آرشیو
    آمار سایت
  • کل مطالب : 1366
  • کل نظرات : 0
  • افراد آنلاین : 2
  • تعداد اعضا : 0
  • آی پی امروز : 16
  • آی پی دیروز : 18
  • بازدید امروز : 191
  • باردید دیروز : 122
  • گوگل امروز : 0
  • گوگل دیروز : 0
  • بازدید هفته : 481
  • بازدید ماه : 4,052
  • بازدید سال : 10,248
  • بازدید کلی : 69,751