(۳-۱۰)
جمله خطای تصادفی با میانگین صفر و واریانس میباشد. در مدل اثرات احتمالی فرض بر آن است که همبستگی با متغیرهای توضیحی صفر میباشد:
(۳-۱۱)
با جایگزینی رابطه (۳-۹ ) در رابطه (۳-۱۰) خواهیم داشت:
(۳-۱۲)
در رابطه فوق، مقدار نشان دهنده خطای هر مشاهده بوده و به عنوان یک متغیر غیر قابل مشاهده نشان دهنده خطای (تصادفی) مقطعی معین میباشد. اگر نشان دهنده مقاطع یا افراد باشد، در این صورت در برخی موارد به آن اثر انفرادی[۱۹] و یا ناهمگونی فردی[۲۰] نیز اطلاق می شود. به صورت مشابه همین واژه ها را در مورد شرکت ها نیز می توان به کار برد. بدین ترتیب خطای کل با شرط برای تمام ها و ها است که آن را می توان به عنوان جمله خطای ترکیبی تعریف نمود. بدین ترتیب رابطه (۳-۱۰) را می توان بشکل زیر خلاصه نمود:
(۳-۱۳)
بنابرین در مدل اثرات تصادفی (بر خلاف مدل اثر ثابت که در آن هر واحد مقطعی مقدار عرض از مبدأ ثابت خود را دارد)، عرض از مبدأ ، میانگین تمام عرض از مبداهای مقطعی را نشان میدهد و جز خطای ، انحراف (تصادفی) عرض از مبدأ انفرادی را از میانگین مشخص می کند(مشکی، ۱۳۹۰).
تفاوت بین مفاهیم Pooled و Panel
اگر عرض از مبدأ و ضرایب شیب در طول زمان و مکان ثابت باشد، می گوییم برآورد از نوع Pooled بوده است. اگر مدل به گونه ای برآورد شود که در آن عرض از مبدأ، شیب، و یا هر دو در ابعاد زمانی، مکانی یا هر دو ثابت نباشد و تغییر کنند، می گوییم برآورد از نوع Panel است(افلاطونی و نیکبخت، ۱۳۸۹).
مدل داده های تلفیقی پویا
در صورتی مدل رگرسیون مورد تحلیل در برگیرنده یک یا چند عنصر با وقفه از متغیر وابسته به عنوان متغیر توضیحی باشد، در آن صورت مدل را مدل خودرگرسیونی یا مدل دینامیک (پویا) مینامند. این مدل ها در واقع بیانگر رگرسیون متغیر وابسته بر حسب خودش با وقفه زمانی معین میباشد. مدل های خود رگرسیونی از شکل مشترک زیر برخوردارند:
(۳-۱۴)
روش کلاسیک حداقل مربعات به طور مستقیم در مدل فوق قابل کاربرد نمی باشد. این موضوع ناشی از دو علت است: اول به لحاظ وجود متغیر توضیحی استوکاستیک و دوم به لحاظ امکان وجود همبستگی سریالی در اجزاء اخلال. به عبارت دیگر در صورتی که متغیر توضیحی در مدل رگرسیون با جز اخلال استوکاستیک همبسته باشد، در این صورت تخمین زنهای OLS تورش دار خواهند بود. یکی از راه حل های موجود برای حل مشکل استفاده از متغیرهای ابزاری است. به این معنی که بتوان برای متغیر جانشینی پیدا نمود که علی رغم همبستگی شدید با متغیر مذبور، همبسته نباشد. چنین جانشینی متغیر ابزاری نامیده می شود(مشکی، ۱۳۹۰).
تکنیک های تخمین سیستم معاملات
سیستم معاملات مشتمل بر مجموعه ای از معاملات با ضرایب نامعلوم میباشد که با بهره گرفتن از روش های متعددی می توان اقدام به برآورد ضرایب آن نمود. برخی از روش های تخمین برای برآورد ضرایب متغیرهای مستقل را می توان بشرح زیر خلاصه نمود:
روش حداقل مربعات معمولی(OLS)[21]
این روش به کارل فردریک گوس[۲۲] ریاضیدان نامی آلمان، نسبت داده می شود. روش مذبور مجموع مربعات جملات پسماند را کمینه می کند. روش OLS تخمین زننده هایی را ارائه میکند که خطی، بدون تورش و در بین تمام تخمین زننده های خطی و بدون تورش، دارای حداقل واریانس باشد.
روش حداقل مربعات تعمیم یافته (GLS)[23]
یکی از مهمترین مفروضات مدل کلاسیک رگرسیون خطی (CLR)[24] این است که واریانس هر جز جمله خطا ، به شرط مقدار معینی از متغیرهای توضیحی، مقدار ثابتی مساوی با میباشد. فرضی که در اصطلاح، همسانی واریانس[۲۵] نامیده می شود:
(۳-۱۵)
با قبول فرض فوق، تخمین زننده از طریق OLS معمولی بهترین تخمین زن خطی بدون تورش (BLUE) محسوب خواهد شد. اما چنانچه فرض ناهمسانی واریانس، جایگزین فرض همسانی گردد، دیگر تخمین زن مذبور بهترین (دارای حداقل واریانس یا کارایی) نخواهد بود.
مسایل مورد توجه در تخمین مدل
با توجه به اینکه قبل از تخمین و اجرای مدل های رگرسیونی لازم است از وجود برخی شرایط در بین متغیرها اطمینان حاصل شود بنابرین به منظور اطلاع از برخورداری داده های تحقیق از شرایط لازم، انجام تعدادی آزمون بر روی متغیرها ضروری میباشد که در ادامه فصل به اختصار به کلیات آن ها اشاره می شود.
نرمال بودن
برای بررسی نرمال بودن داده ها از آزمون های نرمال بودن[۲۶] استفاده می شود. این آزمون ها به طور کلی به دو گروه روش های ترسیمی[۲۷] و روش های عددی[۲۸] تقسیم میشوند. روش های ترسیمی تنها تصویری از توزیع متغیر تصادفی را ارائه میکنند اما روش های عددی قادرند معیاری عینی و کمی برای قضاوت در خصوص نرمال بودن توزیع متغیر تصادفی فراهم نماید. در روش های عددی می توان هم آمار توصیفی و هم از تکنیک ها و آزمون های مختلف آمار استنباطی استفاده کرد. در این تحقیق با استفاده ار آزمون های جارگ- برا و کولموگوروف- اسمیرنوف (KS ) به عنوان یک روش عددی به آزمون نرمال بودن داده ها پرداخته شده است.
در آزمون جارگ- برا از اختلاف بین ضریب کشیدگی و چولگی داده های مورد بررسی می توان به نرمال بودن توزیع داده ها پی برد. در این آزمون فرض صفر مبتنی بر نرمال نبودن است که در صورت به دست آمدن احتمال تأیید کمتر از ۵ درصد، فرض صفر با احتمال ۹۵ درصد اطمینان پذیرفته نمی شود (جعفری سرشت، ۱۳۸۹).
آزمون کولموگوروف- اسمیرنوف جهت بررسی ادعای مطرح شده در مورد توزیع داده های یک متغیر کمی مورد استفاده قرار میگیرد(مومنی و فعال قیومی، ۱۳۹۱). در این آزمون فرض صفر مبتنی بر نرمال نبودن است که در صورت به دست آمدن احتمال تأیید کمتر از ۵ درصد، فرض صفر با احتمال ۹۵ درصد اطمینان پذیرفته نمی شود(جعفری سرشت، ۱۳۸۹).
ناهمسانی واریانس
یکی از مهمترین فروض مدل کلاسیک رگرسیون خطی این است که اجزای اخلال uit که در تابع رگرسیون، جامعه ظاهر میشوند، دارای واریانس همسان میباشند یعنی i=1,2,…,n
اگر این فرض تأمین نشود دارای ناهمسانی واریانس خواهیم بود. مشکل ناهمسانی واریانس، در داده های مقطعی متداول تر از داده های زمانی است. از آن جایی که یکی از ابعاد داده های تابلویی، بعد مقطعی میباشد لذا در تحقیق حاضر امکان مواجه با مسأله ناهمسانی واریانس وجود دارد. برای رفع ناهمسانی واریانس می توان از روش حداقل مربعات تعمیم یافته (EGLS) استفاده کرد(ابریشمی، ۱۳۸۳). در این پژوهش، به منظور رفع ناهمسانی واریانس از تخمین زن های (EGLS) استفاده شده است.