فهرست مطالب
فصل اول:
1-1) مقدمه…………………………………………………………………………………………………………………………………………………………………………………………………………………….. 8
1-2) تشريح و بيان موضوع…………………………………………………………………………………………………………………………………………………………………………………………….. 9
1-3) ضرورت انجام تحقيق…………………………………………………………………………………………………………………………………………………………………………………………….. 9
1-4) سابقه تحقيقات و مطالعات انجام گرفته……………………………………………………………………………………………………………………………………………………………… 10
1-5) فرضيههاي تحقيق………………………………………………………………………………………………………………………………………………………………………………………………. 12
1-6) اهداف اساسي از انجام تحقيق…………………………………………………………………………………………………………………………………………………………………………….. 12
1-8) روش انجام پژوهش………………………………………………………………………………………………………………………………………………………………………………………………. 13
1-8-1 ) روش تحقيق…………………………………………………………………………………………………………………………………………………………………………………………………. 14
1-8-2) روشهاي گردآوري اطلاعات……………………………………………………………………………………………………………………………………………………………………………. 14
1-8-3) قلمرو تحقيق…………………………………………………………………………………………………………………………………………………………………………………………………… 14
1-8-4) جامعهی آماري……………………………………………………………………………………………………………………………………………………………………………………………… 15
1-8-5) نمونهی آماري……………………………………………………………………………………………………………………………………………………………………………………………….. 15
1-8-6) روش يا روشهاي نمونه گيري………………………………………………………………………………………………………………………………………………………………… 15
1-9)تعريف واژهها و اصطلاحات تخصصي طرح………………………………………………………………………………………………………………………………………………………… 17
فصل دوم:
2-1) مقدمه………………………………………………………………………………………………………………………………………………………………………………………………………………… 19
2-2) انواع داده ها……………………………………………………………………………………………………………………………………………………………………………………………………… . 21
2-2-1 ) دادههای سری زمانی…………………………………………….. ……………………………………………………………………………………………………………………………………….21
2-2-2) دادههای مقطعی………………………………………………………………………………………………………………………………………………………………………………………………21
2-2-3) دادههای پانل……………………………………………………………………………………………………………………………………………………………………………………………………22
2-3) مدلهای سری زمانی تک متغیره………………………………………………………………………………………………………………………………………………………………………. 22
2-4) مفاهیم مهم در تحلیل سریهای زمانی……………………………………………………………………………………………………………………………………………………………… 22
2-4-1) مانایی…………………………………………………………………………………………………………………………………………………………………………………………………………….. 22
2-4-2 ) خودکوواریانس، خودهمبستگی و خودهمبستگی جزئی………………………………………………………………………………………………………………………………. 24
2-4-3) تابع خودهمبستگی و خودهمبستگی جزئی…………………………………………………………………………………………………………………………………………………. 24
2-4-4) فرآیند نوفهی سفید…………………………………………………………………………………………………………………………………………………………………………………….. 25
2-4-5 ) آمارهی Q……………………………………………………………………………………………………………………………………………………………………………………………………. 25
2-5) فرآیندهای خودرگرسیو(AR)……………………………………………………………………………………………………………………………………………………………………………. 27
2-6) فرآیندهای میانگین متحرک (MA)……………………………………. ………………………………………………………………………………………………………………………. 28
2-7) فرآیندهای خودرگرسیو میانگین متحرک (ARMA) …………………………………………………………………………………………….. ………………………………….. 28
2-9) مراحل ساخت مدلهای ARIMA……………………………………. …………………………………………………………………………………………………………………………….. 30
2-10 ) انواع نامانایی……………………………………. ……………………………………………………………………………………………………………………………………………………………. 31
2-11 ) آزمون ریشهی واحد……………………………………. ………………………………………………………………………………………………………………………………………………… 32
2-12) معیارهای اطلاعاتی……………………………………. ………………………………………………………………………………………………………………………………………………….. 33
2-13) شبکههای عصبی مصنوعی……………………………………. ………………………………………………………………………………………………………………………………………. 33
2-13-1) نرونهای بیولوژیکی……………………………………. ……………………………………………………………………………………………………………………………………………. 33
2-13-2) سیر تاریخی شبکههای عصبی……………………………………. …………………………………………………………………………………………………………………………….. 34
2-13-3) کاربرد شبکههای عصبی……………………………………. …………………………………………………………………………………………………………………………………….. 36
2-13-4) اجزا و ساختار شبکههای عصبی……………………………………. …………………………………………………………………………………………………………………………. 38
2-13-5) مدل ریاضی نرونها………………………………………………………………………………………………………………………………………………………………………………………… 40
2-13-6) الگوریتم پسانتشار خطا……………………………………………………………………………………………………………………………………………………………………………… 44
2-13-7) معماری شبکههای پسانتشار………………………………………………………………………………………………………………………………………………………………………. 45
2-13-8) طراحی شبکهی عصبی………………………………………………………………………………………………………………………………………………………………………………….45
2-13-9) الگوریتم یادگیری Levenberg- Marquardt……………………………………………………………………………………………………………………………………… 48
2-13-10) مزایا و معایب شبکهی عصبی………………………………………………………………………………………………………………………………………………………………….. ..49
2-14) ماشین بردار پشتيبان……………………………………………………………………………………………………………………………………………………………………………………50
2-15) ماشین بردار پشتیبان دو کلاسه………………………………………………………………………………………………………………………………………………………………………..52
2-16) ماشین بردار پشتیبان با حاشیه ثابت…………………………………………………………………………………………………………………………………………………………………54
2-17) ماشین بردار پشتیبان با حاشیه منعطف……………………………………………………………………………………………………………………………………………………………58
2-18) ماشین بردار پشتیبان چند کلاسه…………………………………………………………………………………………………………………………………………………………………….59
2-19)رویکرد طبفه بندی غیر خطی در ماشین بردار پشتیبان……………………………………………………………………………………………………………………………………60
2-20) رگرسیون بردار پشتیبان…………………………………………………………………………………………………………………………………………………………………………………….63
2-20-1) رگرسیون خطی بردارپشتیبان……………………………………………………………………………………………………………………………………………………………………….63
2-20-2) رگرسیون غیرخطی بردار پشتیبان………………………………………………………………………………………………………………………………………………………………..66
2-21) مزایا و معایب ماشین بردار پشتیبان………………………………………………………………………………………………………………………………………………………………….67
2-22) شبکههای عصبی و عملکردهای متفاوت……………………………………………………………………………………………………………………………………………………. ……68
2-23) مروری بر مطالعات ترکیبی…………………………………………………………………………………………………………………………………………………………………………….. .73
فصل سوم:
3-9) آزمون دایبولد- ماریانو………………………………………………………………………………………………………………………………………………………………………………………….87
3-10) جمع بندي………………………………………………………………………………………………………………………………………………………………………………………………………..89
فصل چهارم:
4-1) مقدمه……………………………………………………………………………………………………………………………………………………………………………………………………………………91
4-3)محاسبهی معیار میانگین مجذور خطا………………………………………………………………………………………………………………………………………………………………….. 93
4-4) محاسبهی تابع زیان قدر مطلق درصد خطا…………………………………………………………………………………………………………………………………………………………. 96
4-5) آزمون فرضیههای تحقیق……………………………………………………………………………………………………………………………………………………………………………… 100
فصل پنجم:
5-1) نتیجهگیری…………………………………………………………………………………………………………………………………………………………………………………… 116
5-2) پیشنهادات برای تحقیقات آتی………………………………………………………………………………………………………………………………………………………. 118
منابع و مآخذ
منابع داخلی…………………………………………………………………………………………………………………………………………………………………………………………… 119
منابع خارجی…………………………………………………………………………………………………………………………………………………………………………………………… 121
فهرست اشکال
شکل 2-1) ساختار پایهای شبکهی عصبی…………………………………………………………………………………………………………………………………………………………………. 38
شکل 2-2) نرون با یک ورودی عددی………………………………………………………………………………………………………………………………………………………………………. 40
شکل 2-4) شبکههای عصبی با چندین لایه و چندین نرون……………………………………………………………………………………………………………………………………. 43
شکل2-6) طبقه بندی کلاس داده ها توسط ماشین بردار پشتیبان……………………………………………………………………………………………………………………………53
شکل 2-7) طبقه بندی بهینه کلاس داده ها توسط ماشین بردار پشتیبان……………………………………………. …………………………………………………………………54
شکل2-8) ماشین بردار پشتیبان با حاشیه ثابت…………………………………………………………………… …………………………………………………………………………………..55
شکل2-9) فرآیند ماشین بردار پشتیبان……………………………………………………………………………………………… …………………………………………………………………….57
شکل 2-10) ماشین بردار پشتیبان با حاشیه نرم…………………………………………………………… ………………………………………………………………………………………..59
شکل 2-11) طبقه بندی غیر خطی ماشین بردارپشتیبان………………………………………….. ……………………………………………………………………………………………60
شکل 2-12) تابع ضرر وپنیک و متغیرهای slack………………………………………….. ……………………………………………………………………………………………………….64
فهرست جداول
جدول 4-12) آزمون مقایسه زوجی مدل ترکیبی آریما و رگرسیون بردار پشتیبان با آریما( قدر مطلق خطا)……………………………………………………………………………………………………………………………………………………………………………………………………108
جدول4-13) آزمون مقایسه زوجی مدل ترکیبی آریما و رگرسیون بردار پشتیبان با SVR( قدر مطلق خطا)………………………………….108
جدول4-14) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه مدل ترکیبی آریما و SVR با هر یک بطور مجزا(قدر مطلق خطا)………………………………………………………………………………………………………………………………………………………………………………………………….109
جدول 4-15) آزمون مقایسه زوجی مدل ترکیبی آریما و رگرسیون بردار پشتیبان با آریما( قدر مطلق درصد خطا)……………………..112
جدول 4-16) آزمون مقایسه زوجی مدل ترکیبی آریما و شبکه عصبی با شبکه عصبی( قدر مطلق خطا)……………………………………..112
جدول4-17) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه مدل ترکیبی آریما و SVR با هر یک بطور مجزا(قدر مطلق
درصد خطا)………………………………………………………………………………………………………………………………………………………………………………………..112
جدول 4-18) آزمون مقایسه زوجی دو مدل ترکیبی(قدر مطلق خطا)…………………………………………………………………………………………….113
جدول4-19) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه دو مدل ترکیبی(قدر مطلق خطا)……………………………………….114
جدول 4-20) آزمون مقایسه زوجی دو مدل ترکیبی( قدر مطلق درصد خطا)………………………………………………………………………………..114
جدول4-21) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه دو مدل ترکیبی(قدر مطلق درصد خطا)……………………………115
فصل اول:
طرح تحقیق
1-1) مقدمه
سرمایه و نیروی انسانی از ارکان اصلی تولید هستند و تامین این عوامل و تخصیص بهینه آنها لازمه رشد اقتصادی است. این تخصیص مستلزم وجود بازار و عملکرد مطلوب نیروهای بازار است. دررابطه با سرمایه بازار بورس میتواند این وظیفه را بر عهده داشته باشد. مهمترین وظیفه بازار بورس، جذب سرمایههای پراکنده و هدایت آنها بسوی فعالیتهای سرمایهگذاری از طریق یک فرآیند تخصیص بهینه است.
نوسان قیمت سهام نیز در تمام بازارهای بورس امر طبیعی و عادی است، اما در هر صورت میتوان با یک پیشبینی از قیمت سهام ترکیبی مطلوب از آنها را انتخاب و نوسانها را کاهش داد. پیشبینی شاخصهای مهم بازار بورس میتواند گامی در جهت افزایش و شفاف نمودن اطلاعات در بازار سرمایه باشد.
پیشبینی شاخصهای بورس یا بازار سرمایه همواره مورد توجه مطالعات بوده است. این توجه در سالهای اخیر منجر به پیشرفت الگوهای مورد استفاده در پیشپیشبینی شده است. لیکن باید پیشبینی را مورد توجه قرار داد که با دقت بیشتری صورت گیرد و نسبت به نتایج واقعی مشاهده شده خطای کمتری داشته باشد.
پیشبینی سریهای زمانی یکی از مهمترین روشهای پیشبینی است که در آن از مشاهدات گذشتهی یک متغیر به منظور توسعهی مدل و پیشبینی در آینده استفاده میگردد. روشهای سری زمانی، درطول چند دهه گذشته توسعه بسیاری یافته اند، اما یکی از مهمترین و پرکاربردترین آنها مدل خودرگرسیو میانگین متحرک انباشته (ARIMA[1]) میباشد که تحت عنوان روش باکس و جنکینز شناخته میشود.
خودرگرسیو میانگین متحرک انباشته (ARIMA) که خلاصه شدهی (Autoregressive Integrated Moving Average) میباشد، یکی از پرکاربردترین مدلها در پیشبینی سریهای زمانی در طول سه دههی گذشته بوده است، اما پیشفرض اصلی آن این است که رابطهی خطی میان ارزشهای سری برقرار باشد. بنابراین رابطههای غیرخطی بوسیلهی مدل خودرگرسیو میانگین متحرک انباشته نمیتوانند خوب توضیح داده شوند.
یکی دیگر از روشهای مورد استفاده در پیشبینی سریهای زمانی شبکهی عصبی است که توان تخمین روابط غیرخطی مختلفی را دارا میباشد (اصطلاحاً به شبکهی عصبی تخمین زنندهی همگانی[2] میگویند). اما استفاده از شبکه، طبق ادبیات تحقیق در روابط خطی نتایج پیچیدهای در بر داشته است.
نوع دیگر از روشهای پیشبینی سری زمانی رگرسیون بردار پشتیبان(SVR [3] ) است. ماشین بردار پشتیبان، تابع رگرسیون را با به کارگیری یک دسته تابع خطی تخمین می زند و عملیات رگرسیون را با تابعی که انحراف از مقدار واقعی در آن به میزان کمتر از ɛ مجاز است انجام می دهد سپس با کمینه کردن ریسک ساختاری ، بهترین جواب را ارائه می دهد.[57]
بطور کلی باید به این نکته اشاره کرد که دانستن الگوی دادهها، مبنی بر خطی و غیرخطی بودن در دنیای واقعی کمی دشوار است و به ندرت سریهای زمانی به طور خالص خطی و غیرخطی میباشند و اغلب از هر دو الگو تبعیت میکنند. بنابراین مسأله اینجاست که چگونه میتوانیم قیمت پایانی و دامنهی نوسان قیمت را با خطای کمتری پیشبینی کنیم؟
1-2) تشريح و بيان موضوع
در زمینه مدلسازی سریهای زمانی، روشهای متفاوتی مورد استفاده قرار میگیرد. مدلهای سنتی مانند میانگین متحرک، هموارسازی نمایی و خودرگرسیو میانگین متحرک انباشته پیشبینی آینده را به روابط خطی از گذشته محدود مینمایند و الگوهای خطی را مدل سازی میکنند. از این مدلها به دلیل سادگی در فهم و کاربرد در دهههای اخیر بسیار استفاده شده است. با وجود انعطاف پذیری بالای مدل خودرگرسیو میانگین متحرک انباشته در مدل سازی الگوهای خطی این مدل نمیتواند الگوهای غیر خطی را خوب مدل سازی کند.
به دلیل مشاهده الگوهای غیرخطی در دنیای واقعی یک سری از مدلهای غیرخطی مانند[4]ARCH GARCH, [5] ،[6]TGARCH مطرح گردیدند. همگی این مدلها، الگوهای غیرخطی بخصوصی را توضیح میدهند.
اما شبکه عصبی مجازی([7]ANN) توان و قدرت پیشبینی روابط غیرخطی را داراست و کاملاً انعطاف پذیر عمل مینماید. شبکههای عصبی مصنوعی از عناصر عملیاتی سادهای ساخته میشوند که به صورت موازی در کنار یکدیگر عمل میکنند. این عناصر که از سیستمهای عصبی زیستی الهام گرفته شدهاند، در تلاشاند که به صورت ناپارامتریک، مغز انسان را شبیه سازی نمایند. نكته حائز اهميت در استفاده از مدل شبکه عصبی وجود نتایج متفاوت برای روابط خطی است. برای مثال مارکهام[8] و راکس[9] اذعان داشتند عملکرد شبکه عصبی برای مسالههای رگرسیون خطی وابسته به اندازه نمونه و سطح شوک (Noise) میباشد. [53]
از طرفي ماشین بردار پشتیبان (SVM)[10] به عنوان تکنیک نوین یکی از روشهای یادگیری ماشینی است که بر مبنای تئوری یادگیری آماری واپنیک[11] در دهه 90 میلادی توسط واپنیک و همکارانش ارائه گردید. این روش از جمله روشهای نسبتاً جدیدی است که در سالهای اخیر کارایی خوبی نسبت به روشهای قدیمیتر از جمله شبکههای عصبی پرسپترون نشان داده است. رگرسيون بردار پشتيبان اين عمل را با تابعي كه انحراف از مقدار واقعي در آن به ميزان كمتر از ɛ مجاز است، انجام ميدهد.
همانطور که ذکر شد با وجود مزایای متعدد، شبکه های عصبی با محدودیت هایی از جمله مدلسازی روابط خطی و همچنین نیازمند بودن به شمار بالای نمونه برای آموزش(به منظور انجام فرآیند یادگیری) مواجه میباشد. اما چون دانستن خصوصیات دادهها مبنی بر خطی و یا غیر خطی بودن در واقعیت کمی دشوار است و از طرفی به ندرت روابط کاملا خطی و یا کاملا غیر خطی مشاهده میشود، بنابراین این ایده به ذهن میرسد که ترکیب مدل خطی آریما با مدلهای غیر خطی شبکه عصبی پیشخور و ماشین بردار پشتیبان میتواند باعث بهبود دقت پیشبینی گردد.
در مدل ترکیبی سعی بر این داریم ابتدا روابط غیرخطی در پسماندها را با استفاده از شبکهی عصبی و رگرسيون بردار پشتيبان شناسایی کرده سپس پسماندهای بدست آمده را به مدل خودرگرسیو میانگین متحرک انباشته اضافه کنیم. با این ترکیب، بخش خطی بوسیلهی مدل خودرگرسیو میانگین متحرک انباشته و بخش غیرخطی بوسیلهی شبکه عصبي و رگرسيون بردار پشتيبان پیشبینی خواهد شد.
با عنايت به مطالبي كه ذكر شد اين سوال پيش ميآيد كه کدامیک از مدلهای رگرسيون بردار پشتيبان، شبكه عصبي، خودرگرسیو میانگین متحرک انباشته و مدلهاي تركيبي، با دقت بالاتر و خطاي كمتري توانايي پیشبینی شاخص بورس اوراق بهادار تهران را دارد؟