فهرست مطالب

فصل اول:

1-8-6) روش يا روشهاي نمونه گيري………………………………………………………………………………………………………………………………………………………………… 15

1-8-7) روشهاي مورد نظر براي تجزيه و تحليل اطلاعات و آزمون فرضيه‌ها…………………………………………………………………………………………………………. 15

1-9)تعريف واژهها و اصطلاحات تخصصي طرح………………………………………………………………………………………………………………………………………………………… 17

فصل دوم:

2-1) مقدمه………………………………………………………………………………………………………………………………………………………………………………………………………………… 19

2-2) انواع داده ها……………………………………………………………………………………………………………………………………………………………………………………………………… . 21

2-2-1 ) دادههای سری زمانی…………………………………………….. ……………………………………………………………………………………………………………………………………….21

2-2-2) دادههای مقطعی………………………………………………………………………………………………………………………………………………………………………………………………21

2-2-3) دادههای پانل……………………………………………………………………………………………………………………………………………………………………………………………………22

2-3) مدلهای سری زمانی تک متغیره………………………………………………………………………………………………………………………………………………………………………. 22

2-4) مفاهیم مهم در تحلیل سریهای زمانی……………………………………………………………………………………………………………………………………………………………… 22

2-4-1) مانایی…………………………………………………………………………………………………………………………………………………………………………………………………………….. 22

2-4-2 ) خودکوواریانس، خودهمبستگی و خودهمبستگی جزئی………………………………………………………………………………………………………………………………. 24

2-4-3) تابع خودهمبستگی و خودهمبستگی جزئی…………………………………………………………………………………………………………………………………………………. 24

2-4-4) فرآیند نوفهی سفید…………………………………………………………………………………………………………………………………………………………………………………….. 25

2-4-5 ) آمارهی Q……………………………………………………………………………………………………………………………………………………………………………………………………. 25

2-5) فرآیندهای خودرگرسیو(AR)……………………………………………………………………………………………………………………………………………………………………………. 27

2-6) فرآیندهای میانگین متحرک (MA)……………………………………. ………………………………………………………………………………………………………………………. 28

2-7) فرآیندهای خودرگرسیو میانگین متحرک (ARMA) …………………………………………………………………………………………….. ………………………………….. 28

2-8) مدلهای خودرگرسیو میانگین متحرک انباشته (ARIMA) …………………………………………………………………………………………….. ………………………….. 30

2-9) مراحل ساخت مدلهای ARIMA……………………………………. …………………………………………………………………………………………………………………………….. 30

2-10 ) انواع نامانایی……………………………………. ……………………………………………………………………………………………………………………………………………………………. 31

2-11 ) آزمون ریشهی واحد……………………………………. ………………………………………………………………………………………………………………………………………………… 32

2-12) معیارهای اطلاعاتی……………………………………. ………………………………………………………………………………………………………………………………………………….. 33

2-13) شبکههای عصبی مصنوعی……………………………………. ………………………………………………………………………………………………………………………………………. 33

2-13-1) نرونهای بیولوژیکی……………………………………. ……………………………………………………………………………………………………………………………………………. 33

2-13-2) سیر تاریخی شبکههای عصبی……………………………………. …………………………………………………………………………………………………………………………….. 34

2-13-3) کاربرد شبکههای عصبی……………………………………. …………………………………………………………………………………………………………………………………….. 36

2-13-4) اجزا و ساختار شبکههای عصبی……………………………………. …………………………………………………………………………………………………………………………. 38

2-13-5) مدل ریاضی نرونها………………………………………………………………………………………………………………………………………………………………………………………… 40

2-13-6) الگوریتم پسانتشار خطا……………………………………………………………………………………………………………………………………………………………………………… 44

2-13-7) معماری شبکههای پسانتشار………………………………………………………………………………………………………………………………………………………………………. 45

2-13-8) طراحی شبکهی عصبی………………………………………………………………………………………………………………………………………………………………………………….45

2-13-9) الگوریتم یادگیری Levenberg- Marquardt……………………………………………………………………………………………………………………………………… 48

2-13-10) مزایا و معایب شبکهی عصبی………………………………………………………………………………………………………………………………………………………………….. ..49

2-14) ماشین بردار پشتيبان……………………………………………………………………………………………………………………………………………………………………………………50

2-15) ماشین بردار پشتیبان دو کلاسه………………………………………………………………………………………………………………………………………………………………………..52

2-16) ماشین بردار پشتیبان با حاشیه ثابت…………………………………………………………………………………………………………………………………………………………………54

2-17) ماشین بردار پشتیبان با حاشیه منعطف……………………………………………………………………………………………………………………………………………………………58

2-18) ماشین بردار پشتیبان چند کلاسه…………………………………………………………………………………………………………………………………………………………………….59

2-19)رویکرد طبفه بندی غیر خطی در ماشین بردار پشتیبان……………………………………………………………………………………………………………………………………60

2-20) رگرسیون بردار پشتیبان…………………………………………………………………………………………………………………………………………………………………………………….63

2-20-1) رگرسیون خطی بردارپشتیبان……………………………………………………………………………………………………………………………………………………………………….63

2-20-2) رگرسیون غیرخطی بردار پشتیبان………………………………………………………………………………………………………………………………………………………………..66

2-21) مزایا و معایب ماشین بردار پشتیبان………………………………………………………………………………………………………………………………………………………………….67

2-22) شبکههای عصبی و عملکردهای متفاوت……………………………………………………………………………………………………………………………………………………. ……68

2-23) مروری بر مطالعات ترکیبی…………………………………………………………………………………………………………………………………………………………………………….. .73

فصل سوم:

3-9) آزمون دایبولد- ماریانو………………………………………………………………………………………………………………………………………………………………………………………….87

3-10) جمع بندي………………………………………………………………………………………………………………………………………………………………………………………………………..89

فصل چهارم:

4-1) مقدمه……………………………………………………………………………………………………………………………………………………………………………………………………………………91

4-2) بررسی مانایی بازدههای لگاریتمی……………………………………………………………………………………………………………………………………………………………………….. 92

4-3)محاسبهی معیار میانگین مجذور خطا………………………………………………………………………………………………………………………………………………………………….. 93

4-4) محاسبهی تابع زیان قدر مطلق درصد خطا…………………………………………………………………………………………………………………………………………………………. 96

4-5) آزمون فرضیههای تحقیق……………………………………………………………………………………………………………………………………………………………………………… 100

فصل پنجم:

5-1) نتیجهگیری…………………………………………………………………………………………………………………………………………………………………………………… 116

5-2) پیشنهادات برای تحقیقات آتی………………………………………………………………………………………………………………………………………………………. 118

منابع و مآخذ

منابع داخلی…………………………………………………………………………………………………………………………………………………………………………………………… 119

منابع خارجی…………………………………………………………………………………………………………………………………………………………………………………………… 121

فهرست اشکال

شکل 2-1) ساختار پایهای شبکهی عصبی…………………………………………………………………………………………………………………………………………………………………. 38

شکل 2-2) نرون با یک ورودی عددی………………………………………………………………………………………………………………………………………………………………………. 40

شکل 2-3) شبکه تک لایه با چندین نرون و بردار ورودی…………………………………………………………………………………………………….. ……………………………….. 43

شکل 2-4) شبکههای عصبی با چندین لایه و چندین نرون……………………………………………………………………………………………………………………………………. 43

شکل 2-5) شبکهی عصبی پیشخور با تابع فعال سازی تانژانت هیپربولیک………………………………………………………………………………………………………….. 45

شکل2-6) طبقه بندی کلاس داده ها توسط ماشین بردار پشتیبان……………………………………………………………………………………………………………………………53

شکل 2-7) طبقه بندی بهینه کلاس داده ها توسط ماشین بردار پشتیبان……………………………………………. …………………………………………………………………54

شکل2-8) ماشین بردار پشتیبان با حاشیه ثابت…………………………………………………………………… …………………………………………………………………………………..55

شکل2-9) فرآیند ماشین بردار پشتیبان……………………………………………………………………………………………… …………………………………………………………………….57

شکل 2-10) ماشین بردار پشتیبان با حاشیه نرم…………………………………………………………… ………………………………………………………………………………………..59

شکل 2-11) طبقه بندی غیر خطی ماشین بردارپشتیبان………………………………………….. ……………………………………………………………………………………………60

شکل 2-12) تابع ضرر وپنیک و متغیرهای slack………………………………………….. ……………………………………………………………………………………………………….64

فهرست جداول

جدول 4-1) آزمون دیکی و فولر برای بازده لگاریتمی سری زمانی شاخص کل……………………………………………………………………………………………………… …94

جدول 4-2) قدرمطلق خطا برای مقایسه مدل ترکیبی آریما و شبکه عصبی با هر یک از اجزای تشکیل دهنده…………………………………………………… 95

جدول 4-6) آزمون مقایسه زوجی مدل ترکیبی آریما و شبکه عصبی با آریما(قدرمطلق خطا) ………………………………………………………………………….. 102

جدول 4-7) آزمون مقایسه زوجی مدل ترکیبی آریما و شبکه عصبی با شبکه عصبی(قدرمطلق خطا) ……………………………………………………………. 105

جدول 4-9) آزمون مقایسه زوجی مدل ترکیبی آریما و شبکه عصبی با آریما (قدرمطلق درصد خطا) ………………………………………………………………. 105

جدول 4-10) آزمون مقایسه زوجی مدل ترکیبی آریما و شبکه عصبی با شبکه عصبی(قدرمطلق درصدخطا)………………………………….. 106

جدول 4-11) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه مدل ترکیبی آریما و شبکه عصبی با هر یک بطور مجزا(قدر مطلق درصد خطا)………………………… ………………………………………. ………………………….. …………………………………………………………………………………………………………….. 107

جدول 4-12) آزمون مقایسه زوجی مدل ترکیبی آریما و رگرسیون بردار پشتیبان با آریما( قدر مطلق خطا)……………………………………………………………………………………………………………………………………………………………………………………………………108

جدول4-13) آزمون مقایسه زوجی مدل ترکیبی آریما و رگرسیون بردار پشتیبان با SVR( قدر مطلق خطا)………………………………….108

جدول4-14) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه مدل ترکیبی آریما و SVR با هر یک بطور مجزا(قدر مطلق خطا)………………………………………………………………………………………………………………………………………………………………………………………………….109

جدول 4-15) آزمون مقایسه زوجی مدل ترکیبی آریما و رگرسیون بردار پشتیبان با آریما( قدر مطلق درصد خطا)……………………..112

جدول 4-16) آزمون مقایسه زوجی مدل ترکیبی آریما و شبکه عصبی با شبکه عصبی( قدر مطلق خطا)……………………………………..112

جدول4-17) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه مدل ترکیبی آریما و SVR با هر یک بطور مجزا(قدر مطلق

درصد خطا)………………………………………………………………………………………………………………………………………………………………………………………..112

جدول 4-18) آزمون مقایسه زوجی دو مدل ترکیبی(قدر مطلق خطا)…………………………………………………………………………………………….113

جدول4-19) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه دو مدل ترکیبی(قدر مطلق خطا)……………………………………….114

جدول 4-20) آزمون مقایسه زوجی دو مدل ترکیبی( قدر مطلق درصد خطا)………………………………………………………………………………..114

جدول4-21) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه دو مدل ترکیبی(قدر مطلق درصد خطا)……………………………115

فصل اول:

طرح تحقیق

1-1) مقدمه

سرمایه و نیروی انسانی از ارکان اصلی تولید هستند و تامین این عوامل و تخصیص بهینه آنها لازمه رشد اقتصادی است. این تخصیص مستلزم وجود بازار و عملکرد مطلوب نیروهای بازار است. دررابطه با سرمایه بازار بورس میتواند این وظیفه را بر عهده داشته باشد. مهمترین وظیفه بازار بورس، جذب سرمایههای پراکنده و هدایت آنها بسوی فعالیتهای سرمایهگذاری از طریق یک فرآیند تخصیص بهینه است.

نوسان قیمت سهام نیز در تمام بازارهای بورس امر طبیعی و عادی است، اما در هر صورت میتوان با یک پیشبینی از قیمت سهام ترکیبی مطلوب از آنها را انتخاب و نوسانها را کاهش داد. پیشبینی شاخصهای مهم بازار بورس میتواند گامی در جهت افزایش و شفاف نمودن اطلاعات در بازار سرمایه باشد.

پیشبینی شاخصهای بورس یا بازار سرمایه همواره مورد توجه مطالعات بوده است. این توجه در سالهای اخیر منجر به پیشرفت الگوهای مورد استفاده در پیشپیش‌بینی شده است. لیکن باید پیشبینی را مورد توجه قرار داد که با دقت بیشتری صورت گیرد و نسبت به نتایج واقعی مشاهده شده خطای کمتری داشته باشد.

پیشبینی سریهای زمانی یکی از مهمترین روشهای پیشبینی است که در آن از مشاهدات گذشتهی یک متغیر به منظور توسعهی مدل و پیشبینی در آینده استفاده میگردد. روشهای سری زمانی، درطول چند دهه گذشته توسعه بسیاری یافته اند، اما یکی از مهمترین و پرکاربردترین آنها مدل خودرگرسیو میانگین متحرک انباشته (ARIMA^{^[1]}) میباشد که تحت عنوان روش باکس و جنکینز شناخته میشود.

خودرگرسیو میانگین متحرک انباشته (ARIMA) که خلاصه شده‌ی (Autoregressive Integrated Moving Average) می‌باشد، یکی از پرکاربردترین مدل‌ها در پیش‌بینی سری‌های زمانی در طول سه دهه‌ی گذشته بوده است، اما پیش‌فرض اصلی آن این است که رابطه‌ی خطی میان ارزش‌های سری برقرار باشد. بنابراین رابطه‌های غیرخطی بوسیله‌ی مدل خودرگرسیو میانگین متحرک انباشته نمی‌توانند خوب توضیح داده شوند.

یکی دیگر از روش‌های مورد استفاده در پیش‌بینی سری‌های زمانی شبکه‌ی عصبی است که توان تخمین روابط غیر‌خطی مختلفی را دارا می‌باشد (اصطلاحاً به شبکه‌ی عصبی تخمین زننده‌ی همگانی^{^[2]} می‌گویند). اما استفاده از شبکه، طبق ادبیات تحقیق در روابط خطی نتایج پیچیده‌ای در بر داشته است.

نوع دیگر از روشهای پیشبینی سری زمانی رگرسیون بردار پشتیبان(SVR ^{^[3]} ) است. ماشین بردار پشتیبان، تابع رگرسیون را با به کارگیری یک دسته تابع خطی تخمین می زند و عملیات رگرسیون را با تابعی که انحراف از مقدار واقعی در آن به میزان کمتر از ɛ مجاز است انجام می دهد سپس با کمینه کردن ریسک ساختاری ، بهترین جواب را ارائه می دهد.[57]

بطور کلی باید به این نکته اشاره کرد که دانستن الگوی داده‌ها، مبنی بر خطی و غیرخطی بودن در دنیای واقعی کمی دشوار است و به ندرت سری‌های زمانی به طور خالص خطی و غیرخطی می‌باشند و اغلب از هر دو الگو تبعیت می‌کنند. بنابراین مسأله اینجاست که چگونه می‌توانیم قیمت پایانی و دامنه‌ی نوسان قیمت را با خطای کمتری پیش‌بینی کنیم؟

1-2) تشريح و بيان موضوع

در زمینه مدل‌سازی سریهای زمانی، روشهای متفاوتی مورد استفاده قرار می‌گیرد. مدل‌های سنتی مانند میانگین متحرک، هموارسازی نمایی و خودرگرسیو میانگین متحرک انباشته پیش‌بینی آینده را به روابط خطی از گذشته محدود می‌نمایند و الگوهای خطی را مدل سازی میکنند. از این مدل‌ها به دلیل سادگی در فهم و کاربرد در دهه‌های اخیر بسیار استفاده شده است. با وجود انعطاف پذیری بالای مدل خودرگرسیو میانگین متحرک انباشته در مدل سازی الگوهای خطی این مدل نمیتواند الگوهای غیر خطی را خوب مدل سازی کند.

به دلیل مشاهده الگوهای غیرخطی در دنیای واقعی یک سری از مدل‌های غیرخطی مانند^{^[4]}ARCH GARCH, ^{^[5]} ،^{^[6]}TGARCH مطرح گردیدند. همگی این مدل‌ها، الگوهای غیرخطی بخصوصی را توضیح می‌دهند.

اما شبکه عصبی مجازی(^{^[7]}ANN) توان و قدرت پیش‌بینی روابط غیرخطی را داراست و کاملاً انعطاف پذیر عمل می‌نماید. شبکههای عصبی مصنوعی از عناصر عملیاتی سادهای ساخته میشوند که به صورت موازی در کنار یکدیگر عمل میکنند. این عناصر که از سیستمهای عصبی زیستی الهام گرفته شدهاند، در تلاشاند که به صورت ناپارامتریک، مغز انسان را شبیه سازی نمایند. نكته حائز اهميت در استفاده از مدل شبکه عصبی وجود نتایج متفاوت برای روابط خطی است. برای مثال مارکهام^{^[8]} و راکس^{^[9]} اذعان داشتند عملکرد شبکه عصبی برای مساله‌های رگرسیون خطی وابسته به اندازه نمونه و سطح شوک (Noise) می‌باشد. [53]

از طرفي ماشین بردار پشتیبان (SVM)^{^[10]} به عنوان تکنیک نوین یکی از روشهای یادگیری ماشینی است که بر مبنای تئوری یادگیری آماری واپنیک^{^[11]} در دهه 90 میلادی توسط واپنیک و همکارانش ارائه گردید. این روش از جمله روش‌های نسبتاً جدیدی است که در سال‌های اخیر کارایی خوبی نسبت به روش‌های قدیمی‌تر از جمله شبکه‌های عصبی پرسپترون نشان داده است. رگرسيون بردار پشتيبان اين عمل را با تابعي كه انحراف از مقدار واقعي در آن به ميزان كمتر از ɛ مجاز است، انجام ميدهد.

همانطور که ذکر شد با وجود مزایای متعدد، شبکه های عصبی با محدودیت هایی از جمله مدلسازی روابط خطی و همچنین نیازمند بودن به شمار بالای نمونه برای آموزش(به منظور انجام فرآیند یادگیری) مواجه میباشد. اما چون دانستن خصوصیات دادهها مبنی بر خطی و یا غیر خطی بودن در واقعیت کمی دشوار است و از طرفی به ندرت روابط کاملا خطی و یا کاملا غیر خطی مشاهده میشود، بنابراین این ایده به ذهن میرسد که ترکیب مدل خطی آریما با مدلهای غیر خطی شبکه عصبی پیشخور و ماشین بردار پشتیبان میتواند باعث بهبود دقت پیشبینی گردد.

در مدل ترکیبی سعی بر این داریم ابتدا روابط غیرخطی در پسماندها را با استفاده از شبکهی عصبی و رگرسيون بردار پشتيبان شناسایی کرده سپس پسماندهای بدست آمده را به مدل خودرگرسیو میانگین متحرک انباشته اضافه کنیم. با این ترکیب، بخش خطی بوسیله‌ی مدل خودرگرسیو میانگین متحرک انباشته و بخش غیرخطی بوسیله‌ی شبکه عصبي و رگرسيون بردار پشتيبان پیش‌بینی خواهد شد.

با عنايت به مطالبي كه ذكر شد اين سوال پيش ميآيد كه کدامیک از مدلهای رگرسيون بردار پشتيبان، شبكه عصبي، خودرگرسیو میانگین متحرک انباشته و مدلهاي تركيبي، با دقت بالاتر و خطاي كمتري توانايي پیشبینی شاخص بورس اوراق بهادار تهران را دارد؟

[10]-Support vector machine

سایت دانلود پایان نامه

فهرست مطالب فصل اول: 1-1) مقدمه………………………………………………&he

دانلود پایان نامه :تحليل مقايسهاي كارآمدي مدلهاي رگرسيون بردار پشتيبان، شبكه عصبي و ARIMA با ...

1-1) مقدمه

1-2) تشريح و بيان موضوع

دانلود پایان نامه :تحليل مقايسه­اي كارآمدي مدل­هاي رگرسيون بردار پشتيبان، شبكه عصبي و ARIMA با ...

1-1) مقدمه

1-2) تشريح و بيان موضوع

دانلود پایان نامه :تحليل مقايسهاي كارآمدي مدلهاي رگرسيون بردار پشتيبان، شبكه عصبي و ARIMA با ...