آزمون دوربین-اسلینگر-مک (مقایسه چند گروه داده کمی وابسته)

اگر در انجام طرح آزمایش بلوکی کاملا تصادفی، برخی مشاهدات مربوط به جدول به دلایلی چون هزینه بالا، نیاز به صرف زمان زیاد و ... جمع آوری نشوند، مقادیر آن خانه ها گمشده به حساب می آید. طرح متناظر با این وضعیت را ناقص می نامند. در این نوشتار آزمون یکسانی میانه ها را در سطوح مختلف تیمارهای این طرح بررسی می کنیم. فرض صفر بیانگر تساوی اثر k سطح عامل مورد مورد نظر است.

 آزمون دوربین-اسلینگر-مک

در مقابل فرض 〖H 〗_1 می گوید که حداقل یکی از تساوی های فرض صفر برقرار نیست. 

اگر تعداد مشاهدات بی پاسخ (اندازه گیری نشده یا گمشده) در تمامی بلوک ها یکسان باشد، طرح بلوک ناقص را متعادل می نامیم. در این طرح فرض می شود که (

آزمون دوربین-اسلینگر-مک

 

تحت فرض H_0 و به شرط وجود مقادیر بزرگ b آماره D دارای نوزیع تقریبی χ^2 با k-1 درجه آزادی است. در سطح خطای α درصد، چنانچه آماره D بزرگتر از مقدار حاصل از جدول توزیع کای دو با k-1 درجه آزادی باشد، فرض صفر تأیید نمی شود. در ادامه ماتریس داده ها در یک طرح بلوکی را مشاهده می کنید. 

آزمون دوربین-اسلینگر-مک

مثال : اثر 7 ماده شیمیایی در 7روز مختلف بر روی عملکرد یک فرآیند شیمیایی بررسی شده است. چون هر آزمایشگر در هر روز تنها قادر بوده است 3 ماده شیمیایی را آزمایش کند، از یک طرح بلوکی ناقص استفاده شده است. با توجه به داده های جمع آوری شده مقدار اماره D برابر 7.71 حاصل می شود. با مقایسه مقدار D با مقدار حاصل از جدول توزیع کای دو با (1-7) درجه آزادی و در سطح خطای 0.05، مقدار D کوچکتر از مقدار حاصل از جدول بوده و فرض صفر مبنی بر یکسانی اثر نوع مواد شیمیایی رد نمی شود. 

منبع : مقدمه ای بر روش های آماری ناپارامتری / نوشته : اکبر گلدسته / انتشارات جهاد دانشگاهی / 1390.

 

آزمون مربع کای (آزمون مقایسه داده های مستقل رده ای)

به منظور بررسی ارتباط بین دو متغیر مستقل رده ای، چنانچه متغیرهای مورد نظر بیش از دو رده داشته باشند، داده های ان ها را در یک جدول r*c خلاصه می کینم. که در آن r تعداد رده های متغیر سطری و c تعداد رده های متغیر ستونی است.

آزمون مربع کای

فرض صفر مورد آزمون استقلال متغیرهای سطری و ستونی و یا به عبارت دیگر یکسان بودن نسبت یکی از رده های متغیر سطری در رده های دیگر متغیر ستونی (یا برعکس) می باشد که آن را به صورت H_0: p_i1=p_i2=⋯=p_ic ربا یک رده معین i از متغیر سطری نشان می دهند. (i=1,2,…,r). در صورت بزرگ بودن حجم نمونه از آماره آزمون از توزیع مجانبی مربع کای پیروی می کند. آماره آزمون به صورت زیر تعریف می شود :

آزمون مربع کای

 

که در آن O_ij فراوانی مشاهده شده در خانه ij جدول و E_ij مقدار مورد انتظار خانه ij تحت فرض H_0 می باشد. یعنی :

آزمون مربع کای

 

آزمون مربع کای

 

آزمون مربع کای (آزمون مقایسه داده های مستقل رده ای)

به منظور بررسی ارتباط بین دو متغیر مستقل رده ای، چنانچه متغیرهای مورد نظر بیش از دو رده داشته باشند، داده های ان ها را در یک جدول r*c خلاصه می کینم. که در آن r تعداد رده های متغیر سطری و c تعداد رده های متغیر ستونی است.

آزمون مربع کای

فرض صفر مورد آزمون استقلال متغیرهای سطری و ستونی و یا به عبارت دیگر یکسان بودن نسبت یکی از رده های متغیر سطری در رده های دیگر متغیر ستونی (یا برعکس) می باشد که آن را به صورت H_0: p_i1=p_i2=⋯=p_ic ربا یک رده معین i از متغیر سطری نشان می دهند. (i=1,2,…,r). در صورت بزرگ بودن حجم نمونه از آماره آزمون از توزیع مجانبی مربع کای پیروی می کند. آماره آزمون به صورت زیر تعریف می شود :

آزمون مربع کای

 

که در آن O_ij فراوانی مشاهده شده در خانه ij جدول و E_ij مقدار مورد انتظار خانه ij تحت فرض H_0 می باشد. یعنی :

آزمون مربع کای

 

آزمون مربع کای

 

آزمون فیشر (آزمون مقایسه داده های مستقل رده ای)

به منظور بررسی وابستگی میان دو گروه از داده های غیر زوجی، در صورتیکه داده های مورد نظر کیفی باشند از روش تحلیل جداول توافقی استفاده می شود. فرض صفر مورد آزمون در این حالت استقلال متغیرهای سطری و ستونی جدول و فرش مقابل وابستگی را بیان می کند. برای بررسی این فرضیات آزمون های مختلفی وجود دارد. آزمون فیشر از آن جمله است. 

آزمون فیشر

 

آزمون فیشر در حالت کلی برای هر تعداد از نمونه قابل استفاده است اما به طور خاص چنانچه حجم نمونه انتخابی کمتر از 10 باشد از این روش استفاده می شود. برای انجام این آزمون مقادیر فراوانی های مشاهده شده خانه های جدول و مقادیر فراوانی های مورد انتظار آن را به شرط برقراری فرض صفر محاسبه می کنیم. فراوانی های مورد انتظار خانه ij جدول (E_ij) از حاصلضرب جمع کناری سطر i ام در جمع کناری ستون j ام و تقسیم آن بر حجم کل نمونه (n) بدست می آید. یعنی :

آزمون فیشر

به این ترتیب مقدار آماره آزمون با استفاده از رابطه زیر حاصل می شود

آزمون فیشر

 

که در آن O_ij فراوانی مشاهده شده در خانه ij می باشد. اگر فرض صفر برقرار باشد آماره χ^2 از توزیع کای دو با 1 درجه آزادی پیروی می کند. بنابراین اگر آماره χ^2 در سطح معنی داری α بزرگتر از مقدار حاصل از جدول توزیع کای دو باشد، فرض صفر مبنی بر استقلال دو گروه پذیرفته نمی شود. 

نکته : توجه داشته باشید که این تقریب زمانی قابل اجرا است که E_ij≥5 برقرار باشد. چنانچه مقدار موجود در خانه های جدول کمتر از 5 باشد و یا به طور کلی حجم نمونه انتخابی کمتر از 10 مورد باشد، از مقدار آماره دقیق فیشر استفاده می شود. فیشر نشان داد که احتمال رخداد ترکیب تصادفی جدول 1 با استفاده از قانون احتمال فوق هندسی برابر است با : 

آزمون فیشر

 

انجام آزمون فرض H_0: p_1=p_2 (که رد آن p_1 نسبت موفقیت ها در رده اول و p_2 نسبت موفقیت ها در رده دوم است)، معادل فرض مستقل بودن متغیرهای سطری و ستونی می باشد. برای آزمون این فرض در برابر فرض های مقابل ممکن ترکیب های دیگر جدول 2*2 را که فراتر از ترکیب مشاهده شده در در مسئله مورد بحث هستند پیدا می کنیم . احتمال های متناظر با ان ها را با فرض برقراری H_0 محاسبه می نماییم. از جمع بستن احتمال مشاهده شدهاین ترکیب ها با ترکیب ابتدایی جدول سطح معناداری کلی آزمون محاسبه می شود. منظور از «فراتر بودن» ترکیب، مشاده اعدادی در خانه های جدول است که تفاوت های بیشتری از شکل اولیه را در جهت تأیید فرض مقابل نشان دهند. 

مثال : 24 نوجوان به تصادف انتخاب شده و برحسب اینکه آیا رژیم غذایی خاصی را دنبال می کنند یا خیر به دو گروه تقسیم شده اند. فرض صفر مورد آزمون این است که جنسیت و داشتن رژیم غذایی از یکدیگر مستقل هستند. در برابر فرض مقابل کمتر بودن نسبت پسران دارای رژیم را بیان می کند. فرض های مورد آزمون را به صورت مقابل نیز می توان نوشت :

آزمون فیشر

 

که در آن p_1 نسبت پسرانی است که رژیم غذایی دارند وp_2 نیز نسبت مشابه دختران را نشان می دهد.

آزمون فیشر

با استفاده از رابطه (1) سطح معناداری اولیه 0.0003 محاسبه می شود. ترکیب فراتر جدول فوق که به صورتی بهتر فرض مقابل یعنی کمتر بودن نسبت پسران دارای رژیم غذایی را تأیید می کند، به صورت جدول زیر است

آزمون فیشر

علت در نظر گرفتن این ترکیب از جدول آن است که فاصله بیشتر بین داده های دو رده (جنسیت یا رژیم غذایی) فرض مستقل بودن دو رده را بیشتر زیر سؤال می برد. به عبارت دیگر نزدیک شدن فراوانی رده های متغیرها و توزیع یکسان آن در رده های متغیر دیگر به معنای بی اثر بودن تغییرات یک متغیر بر دیگری است. با استفاده از جدول اخیر احتمال مورد نظر تقریبا برابر صفر حاصل می شود. و سطح معناداری کلی آزمون از جمع این دو مقدار برابر 0.0003 می باشد. اگر سطح خطای آزمون α=0.05 در نظر گرفته شود، فرض صفر مبنی بر استقلال متغیرهای رژیم غذایی و جنسیت، پذیرفته نمی شود. 

منبع : مقدمه ای بر روش های آماری ناپارامتری / نوشته : اکبر گلدسته / انتشارات جهاد دانشگاهی / 1390.

آزمون کوکران- منتل هانزل (آزمون مقایسه داده های مستقل رده ای)

از جمله آزمون های مورد استفاده برای مقایسه دو متغیر کیفی مستقل، آزمون منتل هانزل می باشد. به عنوان مثال فرض کنید می خواهیم توانایی دو روش درمانی برای رفع سنگ کلیه را مورد بررسی قرار دهیم. بیماران مورد نظر برحسب اندازه ی سنگ کلیه و موفق یا ناموفق بودن روش درمانی به صورت جدول زیر دسته بندی می شوند.

آزمون کوکران- منتل هانزل (آزمون مقایسه داده های مستقل رده ای)

 

در حالت کلی اگر ترکیب جدول 2*2 در i امین طبقه به شکل زیر باشد:

ترکیب کلی یک جدول توافقی در i امین طبقه یک ساختار k طبقه ای از جداول 2*2

آزمون کوکران- منتل هانزل (آزمون مقایسه داده های مستقل رده ای)

 

برای تهیه آماره مورد نظر فرض کنید k طبقه متوالی از جدول 2*2 توافقی وجود دارد و در طبقه i ام ، Pi احتمال رخداد رده اول (موفقیت) در i امین طبقه و ، Pi احتمال رخداد رده دوم (شکست) در i امین طبقه باشد، می خواهیم فرض استقلال دو متغیر را مورد بررسی قرار دهیم.فرض معادل برای این منظور به صورت، H0:P1i=P2iرا برای i=1,…,k آزمون کنیم آماره آزمون منتل هانزل به صورت زیر تعریف می شود:

آزمون کوکران- منتل هانزل (آزمون مقایسه داده های مستقل رده ای)

 

O11iاز توزیع فوق هندسی پیروی می کند و در رابطه فوق داریم :

آزمون کوکران- منتل هانزل (آزمون مقایسه داده های مستقل رده ای)

 

به این ترتیب با در نظر گرفتن Zαعنوان مقدار حاصل از جدول توزیع نرمال استاندارد در سطح α ، برای انجام آزمون، اگر فرض مقابل به شکل H1:P1i>P2iتعریف شود، فرض صفر را در سطح خطای α نمی پذیریم اگر MH ≥ Zα . چنانچه فرض مقابل به شکلH1:P1i< P2i تعریف شود، MH ≤ -Zα بیانگر عدم تأیید فرض صفر می باشد. به عنوان آخرین حالت اگر فرض مقابل دو طرفه باشد، فرض صفر در سطح خطای α پذیرفته نمی شود اگر MH|≥ Zα/2 | باشد.

مثال : فرض کنید 3 جدول با ترکیب زیر در اختیار داریم :

آزمون کوکران- منتل هانزل (آزمون مقایسه داده های مستقل رده ای)

مقدار آماره منتل هانزل با استفاده از رابطه (1) برابر 0.895 حاصل می شود. با در نظر گرفتنα=0.05 ، مقدار حاصل از جدول توزیع نرمال استاندارد برابر 1.96 خواهد بود. حال اگر فرض مقابل دوطرفه را مدنظر قرار دهیم، 1.96> 0.895بوده و فرض صفر مبنی بر یکسان بودن نتایج سه جدول ارائه شده رد نمی شود. به عبارت دیگر نسبت موفقیت ها و شکست ها در سه جدول فوق یکسان است.

منبع : مقدمه ای بر روش های آماری ناپارامتری / نوشته : اکبر گلدسته / انتشارات جهاد دانشگاهی / 1390.

آزمون مک نمار

آزمون مک نمار یک آزمون ناپارامتری است که اغلب در مورد داده های اسمی دو مقوله ای یا دوپاسخی مربوط به دو نمونه ی مرتبط یا همبسته به کار می رود. این آزمون به ویژه در مواردی به کار می رود که می خواهیم نظرهای یا عملکردهای قبلی یا بعدی موردها (معمولا افراد) را با هم مقایسه کنیم. برای نمونه می توان به بررسی نظرات افراد در مورد مشارکت در انتخابات ریاست جمهوری پیش از سخنرانی در آن مورد و پس از سخنرانی، اشاره نمود. پس اجرای آزمون مک نمار مستلزم وجود دو مجموعه از داده های دو مقوله ای است. این داده ها می توانند به طور ذاتی دو مقوله ای باشند نظیر «بلی یا خیر» و یا به صورت طبقه ای، رتبه ای یا فاصله ای باشند که پژوهشگر آن ها را به صورت دو مقوله ای کدبندی می کند نظیر گرایش سیاسی که به صورت فاصله ای اندازه گیری شود، اما پژوهشگر آن ها را به صورت «مثبت یا منفی» مقوله بندی نماید. 
جدول زیر داده های مربوط به این آزمون را نمایش می دهد :

 

آزمون مک نمار

آزمون مک نمار به افرادی که تغییر عقیده یا عملکرد نداده اند، یعنی مقادیر a وd اهمیت نمی دهد و تنها با مقادیری سروکار دارد که با تغییر عقیده مربوط می شوند یعنی b وc. منطق اصلی انجام این آزمون این است که اگر تدبیر یا عامل مورد نظر که پس از سنجش اول اعمال می شود مؤثر نباشد، می بایست یا در عقیده ها و عملکردها تغییری صورت نگیرد و یا تغییر در میان آزمودنی ها به سوی یکی از طرف ها (مثبت یا منفی، مخالف یا موافق و...) برابر با طرف دیگر باشد. بنابراین فرضیه پژوهش در این آزمون بیان می دارد که بین دو دسته از داده ها تفاوت معناداری ایجاد می شود. آماره ی آزمون مک نمار به صورت زیر تعریف می شود :
χ^2=(|b-c|-1)^2/(b+c) 
در این آزمون معناداری آماری با ارزیابی احتمال کای دو فوق و با استفاده از جدول توزیع کای دو تعیین می گردد. معنی داری آماری نشان می دهد که فراوانی یا احتمال های مشاهده شده به صورت همگنی نیستند و تفاوت معنی داری بین آن ها وجود دارد. چنانچه مقدار آماره از مقدار حاصل از جدول توزیع کای دو بزرگتر باشد فرضیه صفر پذیرفته نمی شود. 
نکته : وقتی مقادیر bیا c کوچک باشند، آزمون مک نمار به خوبی با توزیع کای دو منطبق نمی شود و بنابراین گفته می شود که جمع bوc حداقل باید 10 یا بیشتر باشد.
منبع : پژوهش، پژوهشگری و پژوهشنامه نویسی / نوشته خلیل میرزایی / انتشارات جامعه شناسان / 1388.

آزمون U من ویتنی

آزمون یومان ویتنی یک آزمون ناپارامتری است که به بررسی تفاوت بین دو گروه مستقل در خصوص یک متغیر دارایداده های رتبه ای یا ترتیبی می پردازد. در واقع این آزمون معادل ناپارامتری آزمونt مستقل است.، اما با این تفاوت که آزمون t از نوع پارامتری و داده های آن از نوع پیوسته است، در حالیکه آزمون یومان ویتنی از نوع ناپارامتری بوده و با داده های رتبه ای انجام می شد. البته در صورتیکه متغیر مورد مطالعه پیوسته باشد ولی سایر شرایط آزمون های پارامتری برقرار نباشد، می توان این آزمون را مورد استفاده قرار داد. در این حالت داده ها ابتدا به صورت رتبه ای درمی آیند و سپس تفاوت های بین رتبه بندی بررسی می شود. برای مثال فرض کنید پژوهشگری می خواهد اثر داروهای نیروبخش را بر وضعیت تمرینی ورزشکاران اندازه گیری نماید. بذای این منظور او 18 ورزشکار را به صورت تصادفی انتخاب و در دو گروه قرار می دهد، به گروه 1 دارونما و به گروه 2 دارو می دهد و بعد قدرت تمرینی آن ها را اندازه گیری می نماید. برای مقایسه این دو گروه که مستقلل از یکدیگر هستند از آزمون یو من ویتنی می توان استفاده نمود. 
آزمون من ویتنی برای محاسبه تفاوت های بین دو گروه مورد بررسی، مقادیر مربوط به هر دو گروه یا توزیع را به صورت یک مجموع واحد و بدون توجه به اینکه هر مقدار به کدام گروه تعلق دارد، از بیشترین صفت تا کمترین رتبه بندی می کند. اگر در زمان رتبه بندی مقادیر یکسان یا تکراری وجود داشته باشد، رتبه های مربوط به آن مقدارها با یکدیگر جمع شده و مجموع بدست آمده بر تعداد آن ها تقسیم می شود و رتبه بندی مشترکی برای تمام آن ها لحاظ می شود. آماره آزمون یو من ویتنی به صورت زیر تعریف می شود : 
U_1=R_1-n(n+1)/2 , U_2=R_2-(m(m+1))/2 که در آن n و m به ترتیب حجم گروه های 1 و2 و R_1 و R_2 نیز مجموع رتبه های گروه های 1 و 2 می باشد. مقدار کوچکتر بین U_1 و U_2 برای مقایسه در مرحله آزمون استفاده می شود. بنابراین
U=min{U_1,U_2} تعریف می کنیم و برای آزمون معناداری آماره U در صورتیکه حجم گروه کوچکتر 20 مورد یا کمتر و حجم نمونه بزرگتر 40 مورد یا کمتر باشد، از جدول مقادیر بحرانی یو من ویتنی استفاده می شود. در صورتیکه آماره U در سطح اطمینان 1-α بزرگتر از مقدار حاصل از جدول باشد، فرضیه صفر پذیرفته نمی شود. اما در حالتیکه حجم هر دو گروه بزرگتر از 20 و یا حجم یکی از آن ها بزرگتر از 40 باشد، جدول مقادیر بحرانی یو من ویتنی نمی تواند مورد استفاده قرار گیرد. اما در این صورت توزیع آمارهU به توزیع نرمال گرایش پیدا می کند. در این حالت با محاسبه میانگین و انحراف معیار U محاسبه شده و آماره Z را به کمک رابطه زیر محاسبه می کنیم. 
Z=(U-(n_1 n_2)/2)/√(((n_1 n_2)(n_(1+) n_(2+1)))/12) 
در این رابطه (n_1 n_2)/2 میانگین U و √(((n_1 n_2)(n_(1+) n_(2+1)))/12) نیز انحراف معیار U می باشد. در اینجا نیز چنانچه مقدار آماره Z از مقدار حاصل از جدول توزیع نرمال استاندارد برای سطح اطمینان 1-α بزرگتر باشد، فرضیه صفر تایید نمی شود. 
منبع : پژوهش، پژوهشگری و پژوهشنامه نویسی / نوشته خلیل میرزایی / انتشارات جامعه شناسان / 1388.

معرفی آزمون کوکران

آزمون کوکران یک آزمون ناپارامتری است که به بررسی متغیرهای دومقداری در حالتیکه بیش از دو گروه در دست است، می پردازد. این آزمون تعمیم یافته ی آزمون مک نمار به حساب می آید. این آزمون زمانی مورد استفاده قرار می گیرد که تعداد گروه ها 3یا تکرارها3 یا بیش از 3 باشند. در این روش متغیر پاسخ یا وابسته به صورت مقادیر دوارزشی مانند «موافق یا مخالف»، «بلی یا خیر» و نظیراینها باشد و بتوان کدهای صفر و یک را برای آن ها در نظر گرفت. در این روش نمره دهی به وجود صفت مورد نظر موافق، موفقیت و... عدد یک و در صورت عدم برقراری صفت مورد نظر عدد صفر برای آن منظور می شود.

فرضیه ی صفر در این آزمون بیان می دارد که میان گروه ها یا تکرارهای مختلف در زمینه متغیر مورد آزمون یا وابسته تفاوت معنی داری وجود ندارد. فرضیه ی مقابل (فرضیه ی پژوهش) وجود تفاوت معنی دار بین گروه های مورد بررسی را می رساند. برای آزمون این فرضیه با استفاده از آماره کوکران ابتدا داده ها را به صورت صفر و یک تبدیل می کنیم. آماره آزمون به صورت زیر تعریف می شود : 

 

که در آن k تعداد گروه ها یا تکرارها، n تعداد آزمودنی ها، x_i جمع مقادیر مربوط به آزمودنی i ام در گروه ها (تکرارها) ی مختلف، y_j جمع پاسخ های تمام آزمودنی ها در گروه (تکرار) j ام و همچنین

 

، میانگین مربوط به کل گروه ها می باشند. به منظور بررسی نتیجه حاصل از این آماره از جدول توزیع کای دو استفاده می شود. با توجه به سطح خطای مورد نظر که به طور معمول 0.05 درنظر گرفته می شود، مقدار کای دو بحرانی را با k-1 درجه آزادی از جدول آن بدست می آوریم. چنانچه مقدار آماره Q بزرگتر از مقدار بحرانی جدول باشد، فرضیه صفر یعنی «عدم وجود تفاوت بین گروه ها (تکرارها)» تأیید نمی شود. البته با توجه به p-مقدار آزمون نیزمی توان در مورد تأیید یا رد فرضیه تصمیم گیری نمود. چنانچه p-مقدار کمتر از 0.05 (سطح اطمینان آزمون) باشد، فرضیه صفر پذیرفته نمی شود. 

منبع : پژوهش، پژوهشگری و پژوهشنامه نویسی / نوشته خلیل میرزایی / انتشارات جامعه شناسان / 1388.

آزمون کروسکال والیس

زمون کروسکال والیس یک آزمون ناپارامتری است که برای مقایسه سه یا بیش از سه گروه مستقل که در سطح رتبه ای اندازه گیری می شوند، مورد استفاده قرار می گیرد. این آزمون در واقع معادل ناپارامتری آزمونF مستقل در روش تحلیل واریانس یکطرفه، می باشد. زمانی که فرض های بنیادی تحلیل واریانس مانند نرمال بودن توزیع داده ها و برابری واریانس گروه ها برقرار نباشد، از آزمون کروسکال والیس استفاده می شود. به همین دلیل گاهی به این آزمون «تحلیل واریانس رتبه ای» نیز گفته می شود. این آزمون می تواند در مورد داده های پیوسته (فاصله ای یا نسبی) نیز به کار برده شود، در این حالت باید توجه شود که داده ها به صورت داد های رتبه ای تبدیل شده و مورد استفاده قرار می گیرد. فرضیه ی صفر در این آزمون این است که میان گروه های مورد بررسی از نظر جمع رتبه هایشان تفاوتی وجود ندارد.
محاسبه ی آماره آزمون کروسکال والیس به دو روش امکان پذیر است که البته هر دو نتایج یکسانی را دربرخواهند داشت. در روش اول رابطه زیر تعریف می شود :

 آزمون کروسکال والیس

در این رابطه، SS_br مجموع مجذورات رتبه ای بین گروه ها و N تعداد کل رتبه ها یا مقادیر در گروه های مورد بررسی است. رابطه ی دیگری که در این زمینه مورد استفاده قرار می گیرد به صورت زیر تعریف می شود

 آزمون کروسکال والیس

N تعداد کل رتبه ها یا مقادیر در گروه های مورد بررسی، T_g مجموع رتبه های گروه g ام و n_g تعداد رتبه ها یا مقادیر موجود در گروه g ام می باشند. همچنین SS_br به صورت زیر تعریف می شود :

آزمون کروسکال والیس

 

T_all جمع کل رتبه های اختصاص داده شده به تمام گروه ها می باشد
آمارهH با مقدار حاصل از جدول توزیع کای دو با k-1 درجه آزدی مقایسه می شود؛ k تعداد گروه های مورد بررسی است. چنانچه مقدار H از مقدار جدول بزرگتر باشد فرضیه صفر مبنی بر برابری میانگین گروه ها پذیرفته نمی شود.
مثال : فرض کنید پژوهشگری می خواهد عملکرد 3 استاد درس روش تحقیق را ارزیابی نماید. او برای این کار یک آزمون مشابهی را روی 21 نفر دانشجو که تحت تحصیل این 3 استاد بودند اجرا می کند. نمره های هریک از دانشجویان محاسبه و رتبه بندی می شود. با استفاده از روابط معرفی شده مقدار آماره H برابر 8.752 حاصل می شود. مقدار حاصل از جدول توزیع کای دو با 2 درجه آزادی نیز در سطح 0.05 برابر 5.9 بدست می آید. چون مقدار آماره Hبزرگتر از 5.9 است، فرضیه صفر تأیید نمی شود. بنابراین با 95 درصد اطمینان می توان گفت رتبه بندی نمره ی درس روش تحقیق در 3 کلاس متفاوت یکسان توزیع نشده است و میان تدریس 3 استاد تفاوت معنی داری وجود دارد.

منبع : پژوهش، پژوهشگری و پژوهشنامه نویسی / نوشته خلیل میرزایی / انتشارات جامعه شناسان / 1388.

 

پیش آزمون

پیش آزمون پس از تنظیم اولیه سوال های پرسشنامه، به منظور بررسی کیفیت پرسشنامه طراحی شده و بررسی روایی محتوایی آن، باید به ارزیابی و آزمون مقدماتی پرسشنامه پرداخت. این مرحله از تحقیقات معمولا کمتر مورد توجه قرار می گیرد و باعث می شود محقق پس از توزیع کامل پرسشنامه ها و در جریان تحقیق متوجه اشکال های متعدد در فرم تهیه شده شود. یکی از مزایای بررسی مقدماتی،کسب نظرات کارشناسان و صاحب نظران در مورد نحوه جمل بندی، محتوای سؤال ها و ارزیابی روایی محتوایی پرسشنامه و در صورت لزوم اصلاح آن می باشد. از دیگر مزایای ارزیابی مقدماتی، بررسی پایایی گزینه های تدوین شده و روایی پرسشنامه، تعین زمان مناسب برای پرکردن پرسشنامه، میزان علاقه و توجه پاسخگو به پرسشنامه، میزان پاسخ‎دهی به سؤال ها و...می باشد. 

همچنین به منظور برآورد تقریبی واریانس متغیر وابسته یا صفت بارز برای برآورد حجم نونه، از آزمون مقدماتی استفاده می شود. پیش آزمون پرسشنامه را می توان به دو مرحله تقسیم نمود: پیش آزمون غیررسمی و پیش آزمون رسمی. 

پیش آزمون غیر رسمی : هدف اصلی در مرحله اول بررسی روایی محتوایی پرسشنامه و ارزیابی میزان انطباق سؤال های مطرح شده با موضوع تحقیق و توانایی گویه برای سنجش متغیرها و سازه های تحقیق، تعین نحجوه جمله بندی هر پرسش و بررسی این نکته که آیا دامنه پاسخ ها کافی است یا خیر، آیا لازم است سؤال های جدیدی اضافه شود یا برخی از گویه ها می بایست حذف گردند. در این مرحله امکان تغییر و تحول جدی در گویه ها وجود دارد. بررسی مقدماتی در این مرحله بیشتر جنبه مشورتی دارد تا این که از مخاطبین خواسته شود به سؤال ها پاسخ دهند و همه افرادی که در این مرحله به آن ها مراجعه می شود، جزو نمونه تحقیق نیستند. بلکه اکثرا اساتید، کارشناسان، محققان و کسانی هستند که در زمینه موضوع تحقیق تخصص دارند و ممکن است برخی از آن ها جزو جامعه آماری نیز باشند. 

دیلمن معتقد است که می بایست پرسشنامه را قبل از اجرا به صورت آزمایشی برای سه گروه از افراد به اجرا درآورد : 1) کسانی که قصد دارید یافته های پژوهش را به آن ها تعمیم دهید و یا به توصیف و تفسیر آن ها بپردازید. به عبارت دیگر کسانی که در جامعه آماری تحقیق قرار دارند. 2) صاحبنظران و کارشناسانی که در تهیه و تنظیم پرسشنامه تبحر دارند. 3) افرادی که از نتایج حاصل از تحقیق استفاده می کنند مانند سازمان ها، وزارتخانه ها و نهادهای اجرایی و برنامه ریزی. در این مرحله معمولا خود محقق و یا همکاران وی اقدام به مصاحبه با پاسخگویان مورد نظر می کنند. مصاحبه ها سازمان نیافته و عمیق می باشند و سؤال ها به نحوی تدوین می شوند که افراد مورد نظر بتوانند نظرات خود را در مورد نواقص و معایب پرسشنامه ارائه دهند. 

پیش آزمون رسمی : در این مرحله بعد از کسب نظرات کارشناسان و خبرگان، در مورد پرسش ها تجدید نظر می شود. در این مرحله گردآوری اطلاعات در سطح محدودی انجام می گیرد ولی هیچ گونه تفاوتی با مرحله اصلی گردآوری اطلاعات ندارد. به عبارت دیگر افرادی که می بایست به پرسشنامه پاسخ دهند باید حدالامکان مشابه نمونه گیری واقعی انتخاب شوند. هدف اصلی پیش آزمون رسمی، بررسی الگوی پاسخ ها است، به همین دلیل نمونه پیش آزمون باید به حد کافی بزرگ باشد. سایر اهداف مورد نظر در پیش آزمون را می توان به صورت زیر در نظر گرفت : 

1. در این بررسی باید دید به کدام سؤال کمتر پاسخ داده شده است. آیا این سؤال ها بخشی از پرسش های مشروط بوده است؟ آیا باید آن ها را بدون جواب می گذاشتند؟ سؤالاتی که در مرحله اول پیش آزمون باعث دودلی، اکراه یا امتناع پاسخگو از پاسخ دادن می شود، احتمالا بعدا تعداد زیادی از پرسشنامه ها را به خود اختصاص خواهد داد و می توان به کاهش حجم نمونه منجر شود. 

2. در مورد کدام سؤال ها اکثر افراد پاسخ یکسان داده اند؟ سؤالاتی که دامنه تغییرات پاسخ های آن ها محدود است فایده ای برای تحلیل ندارند زیرا امکان تمایز سطوح مختلف گزینه ها را فراهم نمی آورد. همچنین این پرسش ها باعث می شوند تعداد موارد برخی از طبقات بسیار کم شده و در تحلیل مسئله ساز گردد به خصوص انجام تحلیل همبستگی را بسیار دشوار می کند. همچنین یکسانی پاسخ ها ممکن است به علت وجود خصوصیت «پاسخ یکدست موافق» باشد. این حالت هنگامی پیش می آید که از پاسخگو خواسته می شود به مجموعه ای از گویه ها، پاسخ موافق یا مخالف دهد، در این موارد برخی افراد ممکن است بدون توجه محتوای سؤال با همه آن ها موافقت نمایند. یک راه تشخیص این مشکل، طرح سؤالات کاملا متضاد و در نظر گرفتن تعداد افرادی است که با هردو نوع سؤال موافق بوده اند. 

3. کدام سؤال ها تکراری هستند؟ سؤال های تکراری می بایست در پرسشنامه نهای حذف شوند. می توان از طریق بررسی همبستگی دو گویه که برای سنجش مفهوم واحدی به کار می روند، سؤال های تکراری را شناسایی کرد. 

4. کدامیک از سؤال های باز را می توان بدون کاهش محتوای غنی پاسخ به صورت گویه درآورد؟ مثلا فرض کنید در سؤالی نوع قومیت افراد پرسیده می شود. بعد از گردآوری پاسخ ها مکن است بتوان پاسخ های داده شده را به چند گروه تقسیم بندی کرد و برای اطمینان از این که تمام موارد لحاظ شده است، گزینه ی «سایر» را نیز قرار داد. در صورت انجام چنین کاری سرعت کار افزایش خواهد یافت و اجرای تحقیق و تحلیل آن ساده تر خواهد بود. البته در مورد سؤالات بسته نیز گاه ممکن است با بررسی پاسخ ها در مورد ادغام برخی از گزینه ها و یا حذف تعدادی از آن ها، اقدام نمود. مانند پرسش مربوط به درآمد. 

5. آیا چارچوب نمونه گیری رسایی لازم را دارد؟ فرض کنید قرار است از لیست حقوق و دستمزد کارکنان کارخانه ای به عنوان پایه جهت انتخاب واحدهای نمونه استفاده شود. در این حالت ممکن است لیست به هر دلیلی به طور نامناسبی مرتب شده باشد. چنین مواردی را می توان از طریق پیش آزمون شناسایی نمود. 

6. تغییر پذیری جامعه مورد مطالعه چگونه است؟ همانطور که اشاره شد به منظور برآورد حجم نمونه اطلاع از واریانس صفت مورد نظر اهمیت زیادی دارد. به طوری که با افزایش تغییرپذیری جامعه در صفت مورد نظر حجم نمونه افزایش و با کاهش تغییرپذیری آن، حجم نمونه کم می شود. بنابراین با شناخت از واریانس جامعه موررد نظر می توان در برآورد حجم نمونه با دقت بیشتری تصمیم گیری نمود. 

7. هزینه و مدت احتمالی انجام بررسی اصلی و مراحل گوناگون آن چقدر است؟ اگر معلوم شود که انجام بررسی مدت زیادی به طول می انجامد یا هزینه آن زیاد است، بررسی مقدماتی می توان در تعین میزان کاهش در هزینه ها و زمان انجام بررسی کارساز باشد. 

8. آیا پرسشنامه دارای پایایی لازم است؟ یکی از اهداف اصلی پیش آزمون ارزیابی پایایی یا قابلیت اعتماد پرسشنامه می باشد. پایایی عبارت از پایداری اندازه گیری در زمان های مختلف است و با تکرار تحقیق نتایج چندان تغییر نمی کنند. ارزیابی پایایی از طریق آزمون های پایایی از جمله آلفای کرونباخ، روش بازآزمایی، روش کورد ریچاردسون ، دو نیمه سازی و ...، انجام می شود. 

بدون ارزیابی پایداری و قابلیت اعتماد پرسشنامه نمی توان به اجرای نهایی آن پرداخت. در صورتی که پیش آزمون مرحله دوم به خوبی انجام گرفته و اصلاحات لازم روی آن اجرا شده باشد، نیازی به تکرار آن نیست و می توان به گردآوری نهایی اطلاعات پرداخت، در غیر اینصورت انجام یک پیش آزمون دیگر ضروری است. 

منبع : روش های کاربردی تحقیق/ نوشته ی دکتر مصطفی ازکیا و مهندس علیرضا دربان آستانه/ انتشارات کیهان.

کاربرد مدل های کامل ساختاری در پژوهش

نمایش رابطه ی رگرسیون چند متغیری با SEM

همانطور که می دانید مدل رگرسیون خطی را می توان به شکل زیر بیان کرد : Y_i=α+βX_i+e_i این معادله بیان می کند که مشاهده ی i ام در متغیرY تابعی است از : دو ثابت α و β که پارامترهای مدل هستند، مقدار مشاهده ی i ام در X و مقداری خطا که باe_i نمایش داده شده است. مدل معادله ی ساختاری نیز به گونه ی خلاصه بسط چند متغیری مدل رگرسیون خطی چند متغیری با یک متغیر وابسته (Y) به شکل مقابل است ،Y=I+BX+e . در این رابطه Y برداری شامل نمره های مشاهده شده در متغیر وابسته ، Xماتریس متغیرهای مستقل با توزیع پیوسته یا طبقه ای (کدگذاری مجازی)، Bبرداراوزان رگرسیون ، e معرف بردار بردار پس ماند ، خطا یا نمره های باقی مانده ی تبیین نشده به وسیله ی مدل رگرسیون وI برداری شامل مقادیر 0 و1 بوده و معرف عرض از مبدأ Y می باشد .

بدین ترتیب SEMشاملمجموعه ای از معادلات رگرسیون چندمتغیری است که در آن همه معادلات به گونه ی همزمان برازش داده می شود. تحلیل رگرسیون خطی چندمتغیری معمولی چندین مشخصه ی آماری ازجمله آزمون کلی برازندگی مدل آزمون برآورد پارامترهای منفردرا اجرا کرده و همچنین ضرایب غیراستاندارد رگرسیون ، خطاهای استاندارد آن ها، ضرایب استاندارد شده ی رگرسیون و همچنین مجذور همبستگی چند متغیری(R^2) را نیز محاسبه می کند.نرم افزار SEM(از جمله LISREL) همه ی این مشخصه های آماری را نه تنها برای یک معادله ی واحد که در باره ی روش کمترین مجذورات معمولی رگرسیون صادق است، بلکه برای چند معادله ی رگرسیون و با استفاده از روش های گوناگون تولید می کند.

اجرای مقدماتی مدل

بسیاری از برنامه های نرم افزار SEM (از جمله LISREL) ماتریس همبستگی یا کواریانس داده ها را می پذیرند. بدین معنی که شما می توانید این ماتریس ها را با استفاده از نرم افزار دیگری مانندSPSS محاسبه و سپس آن ها را در LISREL یابرنامه ی دیگری از نرم افزار SEM وارد کنید. با این حال روشی که برای تحلیل ترجیح داده می شود، استفاده از داده های ورودی خام است. یعنی پژوهشگر پایگاه داده ها را که در SPSS یا برنامه ی متداول دیگری (مانندEXCEL) وجود دارد به برنامه SEM می فرستد و این برنامه ماتریس کواریانس را به عنوان بخشی از تحلیل محاسبه می کند. در برونداد رایانه ای علاوه بر برآورد واریانس های تبیین شده و تبیین نشده، دو نوع ضریب استاندارد و غیر استاندادر وجود دارد. خطای استاندادر برآورد همه ی پارامترها در مدل گزارش شده و همه ی برآوردها نیز از لحاظ معنادار بودن به وسیله ی آزمون های z ، بررسی می شوند.

اصول مهم و اساسی اجرای مدل یابی معادلات ساختاری

برخی از اصول مهم مربوط به اجرای SEM از این قرار است : 
الف) پارامترهای هر مدل ساختاری خطی شامل ضرایب رگرسیون، واریانس ها و کواریانس های متغیرهای مستقل است که عبارتند از ،
1. متغیر مستقل دریک معادله ی رگرسیون خطی شامل هرمتغیری است که(شامل جمله خطا)که متغیر وابسته نباشد. 
2. در نمودار مسیر متغیری مستقل است که هیچ پیکانی به سوی آن نشانه نرفته ،و متغیری وابسته است که پیکانی به سوی آن نشانه رفته باشد. 
3. همه نتغیرهای مستقل از جمله خطاها دارای واریانس و کواریانس خواهند بود. 
4. متغیرهای مستقل دارای جمله های خطا نیستند. 
5. متغیرهای وابسته دارای واریانس و کواریانس هایی با سایر متغیرها به عنوان پارامترهای مدل ساختاری نیستند. 
ب) همه متغیرهای اندازه گیری نشده (شامل متغیرهای مکنون یا عامل ها ،جمله های خطا یا اختلال) باید دارای مقیاس معینی باشند. این عمل ممکن است از دوطریق انجام شود،
1. تثبیت یک مسیراز آن متغیر به متغیردیگر با مقدار معلوم(معمولاً 0و1). 
2. تثبیت واریانس آن متغیر در یک مقدار معلوم(معمولاً 0و1). این عمل را می توان در تحلیل عاملی تأییدی به کار می رود. 
ج) هرزمان یک متغیرمکنون از یک متغیر مستقل به یک متغیر وابسته تغییر یابد(مانند وقتی که مدل مورد آزمون را تغییر می دهید یا اصلاح می کنید) یک خطا اضافه می شود، با این فرض که آن متغیر را نمی توان به صورت کامل پیش بینی کرد. 
د) تعداد پارامترهایی که لازم است پیش بینی شود(یعنی ضرایب رگرسیون، واریانسها و کواریانس های متغیرهای مستقل) نمی توانند از تعداد واریانس ها و کواریانس هادر متغیرهای مشاهده شده یا اندازه گیری شده (متغیرهای داده های خام)تجاوز کند.اگر تعداد پارامترهایی که باید برآورد شوداز تعداد واریانس ها و کواریانس ها در متغیرهای مشاهده شده تجاوز کند ، مسئله ای به نام همانندی را ایجاد می کند که بسیار جدی بوده و می تواند نتایج را ناروا سازد.

مسائل و مشکلات مدل یابی معادله ی ساختاری

مدل یابی معادلات ساختاری به رغم توان بالقوه آن در موقعیت های پژوهشی علوم اجتماعی، روشی بسیار پیچیده و دشوار است.مهم ترین ویژگی های این روش انعطاف پذیری فوق العاده آن از لحاظ کاربرد به عنوان یک چهارچوب نظری وسیع، مشارکت متغیرهای مکنون، کاربرد اندازه های چندگانه، امکان دادن به خطا، انطباق مفروضه های توزیعی و قابلیت کار با انواع داده هااستکه آن را از لحاظ مفهومی یک روش شناسی سنگین و دشوار می سازد.ویژگی دیگری که بحث قابل توجهی را مطرح می کند، قابلیت کاربرد این روش ها هم به عنوان کنش اکتشافی و هم به عنوان کنش تأییدی میباشد.

به گونه ی ایده آل تغییر و اصلاح مدل ها و سپس بازآزمایی آن ها در نمونه های جدید برای رفع دشواریها یک استراتژی سازنده و یاری دهنده است ، اما متأسفانه محاسبه مجذور کای مستلزم گروه های نمونه با حجم زیاد است.الزام حجم نمونه در شرایط تغییر مدل ها و آزمون نمونه های جدید حتی دشوارتر خواهد بود و بنابراین تجدید و تکرار وبازآزمایی به ندرت انجام می شود.این مطلب گردآوری داده های فراوان برای هدایت تئوری را با دشواری روبه رو ساخته و موجب محدودیت در تعمیم پذیری و روایی نتایج می شود.

مسئله ی دیگر در کاربرد مدل های معادله ساختاری ،دشواری ارزشیابی برازندگی در یک فرضیه ی پژوهشی معکوس است. در مدل یابی معادله ی ساختاری اگر فرضیه صفر رد شود، فرضیه پژوهشی نیز رد می شود. مسئله این است که توان رد فرضیه ی پژوهشی نامشخص است. توان کم به این معنااست که مدل مورد نظر در حالی که نادرست است امکان دارد تأیید شود و همچنین دلالت ضمنی توان زیاد آن است که مدل مورد نظر موقعی رد می شود که احتمال نادرستی آن اندک باشد.بنابراین مهم است که نه فقط مجذور کای (که به آسانی تحت تأثیر نمونه های بزرگ قرار می گیرد) ، بلکه دیگر اطلاعات نیزدر رابطه با برازندگی بررسی شود.

دیگر ایرادی که می تواند بر کاربرد مدل یابی ساختاری وارد شود این است که از لحاظ وقت پژوهشگر ، وقت رایانه و مواردی که در گردآوری اندازه های چندگانه ی متغیرها از روی نمونه های بزرگ به کار می رود، گران تمام می شود.پژوهشگر می تواند هزینه ها را با استفاده از راه هایی مانند شروع تحقیق با یک تئوری واقعی ، تأیید همانندی و مشخص بودن مدل مورد نظر قبل از تلاش برای تحلیل آن ، وارسی ناهماهنگی بین داده ها قبل از تحلیل (از روی نمونه های با حجم کافی) و آشنایی کافی با برنامه هایی که برای آزمون مدل به کار می رود ، کاهش دهد.

منبع : مدل یابی معادلات ساختاری با کاربرد نرم افزار LIRSEL. نوشته دکتر حیدر علی هومن .

انواع ضریب همبستگی

1- انواع ضرایب همبستگی 
سر فرانسیس گالتون همبستگی و رگرسیون را برای وارسی کواریانس در دو یا تعداد بیشتری از خصیصه ها مفهوم سازی کرد و کارل پیرسون (1896) براساس نظریه گالتون فرمول آماری برای ضریب همبستگی و رگرسیون ارائه داد(1986).به مدت کوتاهی پس از آن چارلز اسپیرمن(1904) روش همبستگی را برای روش تحلیل عاملی به کار برد.تکنیک های همبستگی ،رگرسیون و تحلیل عاملی برای دهه های متمادی پایه و اساس تهیه ی آزمون ها و تعریف سازه ها را شکل داده اند. .

ضریب همبستگی پیرسون پایه ای را برای ارائه و آزمون مدل ها در میان متغیرهای اندازه گیری شده و پنهان مهیا می کند. علاوه برآن همبستگی های تفکیکی و نیمه تفکیکی تعریف خاصی از روابط دو متغیره را بین متغیرها امکان پذیر می سازند که در آن واریانس صرفاً مشترک بین دو متغیر، در حالی که نفوذ سایر متغیرها کنترل شده است، تبیین می شود. همبستگی هایتفکیکی و نیمه تفکیکی نیز همچون ضریب همبستگی پیرسون می توانند مورد آزمون معناداری قرار گیرند.

در کنار ضریب همبستگی پیرسون که تأثیرات فراوانی بر علم آمار دارد سایر ضرایب همبستگی نیز بسته به سطح سنجش متغیرها معرفی شده اند.استیونز(1968) انواعی از مقیاس های اندازه گیری را معرفی کرده است که به عنوان مقیاس های اسمی، ترتیبی، فاصله ای و نسبی شناخته شده اند. انواع ضرایب همبستگی توسعه یافته برای این سطوح اندازه گیری در جدول زیر مشخص شده اند.

با احترام داده پردازی آماری اطمینان شرق

در ادامه با توجه به نقش با اهمیتی که همبستگی(واریانس مشترک) در مدل سازی معادله ساختاری بازی می کند، عواملی را طرح می کنیم که بر ضرایب همبستگی اثر می گذارند.

2- عوامل موثر بر ضرایب همبستگی

عوامل اصلی در این رابطه عبارتند از: سطح اندازه گیری، محدودیت دامنه تغییرات مقادیر(تغییر پذیری، چولگی و کشیدگی)، داد های از دسترفته، غیر خطی بودن، مقادیر دورافتاده ، تصحیح تضعیف و موارد مرتبط با تغییر نمونه گیری، فاصله اطمینان، حجم اثر، معناداری و توان بیان شده در برآوردهای خودگردان.

 همبستگی

2-1. سطح اندازه گیری و دامنه تغییرات مقادیر:

چهار نوع یا سطح اندازه گیری برای مقیاس های سنجش متغیرهای اسمی ، ترتیبی، فاصله ای و نسبی تعریف شده است (استیونز 1968).در مدل سازی معادله ساختاری هر یک از انواع چهارگانه ی مذکور را می توان در ساخت مدل مشارکت داد. مدل سازی معادله ساختاری به متغیرهای اندازه گیری شده در سطح فاصله ای یا نسبی نیاز داشته و لذا ضرایب همبستگی گشتاوری پیرسون دررگرسیون، تحلیل مسیر، تحلیل عاملی و مدل سازی معادله ساختاری مورد استفاده قرار می گیرد.همچنین لازم است که مقادیر متغیرهای فاصله ای و نسبی برای محاسبه واریانس دارای دامنه تغییرات به اندازه کافی بزرگ باشند.اگر دامنه تغییرات نمرات محدود باشد شدت همبستگی کاهش می یابد.

نکته ی دیگری که در مورد همبستگی بین مقادیر بایستی بدان اهمیت داده شود این است که اگر توزیع متغیرها به طور گسترده ای واگرا هستند، همبستگی می تواند تحت تأثیر قرار گیرد.برای جلوگیری از این موضوع تغییر شکل هایی مانند تبدیل ریشه دوم، تبدیل لگاریتمی، تبدبل معکوس و ...پیشنهاد می شود.

2-2. غیر خطی بودن :

: ضریب همبستگی پیرسون نشان دهنده ی درجه رابطه خطی بین دو متغیر است.بنابراین ممکن است دو متغیری که دارای رابطه ی غیر خطی با یکدیگر هستند براساس این ضریب رابطه ای را نشان ندهند. در اینجا از ضریب اتا به عنوان شاخصی برای رابطه غیرخطی بین دو متغیر و با آزمون اثرات خطی ، درجه دوم و درجه سوم استفاده می شود.

2-3. داده های از دست رفته:

در یک ماتریس همبستگی با چندین متغیر، ضرایب همبستگی متفاوتی برای حجم نمونه های متفاوت می توانند محاسبه شوند.حذف انفرادی یا زوجی آزمودنی ها منجر به تفاوت در حجم نمونه برای ضرایب همبستگی موجود در ماتریس همبستگی می شود.

یک رویکرد مقدماتی در برخورد با داده های از دست رفته ، حذف هر مورد مشاهده شده ای است که دارای داده ی از دست رفته باشد. اما این روش توصیه نمی شود چراکه باعث از دست رفتن اطلاعات برای سایر متغیرها خواهد شد.روش دیگرحذف زوجی می باشد، این رویکرد داده ها را تنها هنگامی کنار می گذارد که آن ها برای دو متغیر از متغیرهای گزینش شده در تحلیل دارای داده از دست رفته باشند. سومین رویکرد که جایگزین کردن داده ها است، مقادیر از دست رفته را با یک برآورد جایگزین میکند. به عنوان مثال میانگین یک متغیر برای داده های موجود، با مقادیر از دست رفته برای کلیه موارد داده های فاقد داده همان متغیر جایگزین می شود.

2-4. مقادیر دور افتاده:

: ضریب همبستگی پیرسون به طور قابل توجهی به وسیله ی یک داده ی دورافتاده منفرد چه برای X و چه برای Y تحت تأثیر قرار می گیرد. در پژوهش های بسیاری این موضوع به دقت مورد بررسی قرار گرفته است که چگونه داده های دور افتاده متفاوت برای x یا Y یا هردو روبط همبستگی را تحت تأثیر قرار می دهند و چگونه می توان با استفاده از آماره های استوارار به تحلیل بهتری دست یافت.

2-5. تصحیح تضعیف :

: یک مفروضه ی اصلی در نظریه اندازه گیری این است که داده های مشاهده شده دارای خطای سنجش هستند. یک ضریب همبستگی پیرسون بسته به اینکه آیا آن ضریب با نمرات مشاهده شده (دارای خطا) یا نمرات واقعی(هنگامی که خطای سنجش را کنار گذاشته ایم) محاسبه شود مقادیر متفاوتی را نشان می دهد. ضریب همبستگی پیرسون می تواند برای خطاهای سنجش تضعیف کننده و ناپایدار در نمرات، تصحیح شده و به این ترتیب به یک مقدار واقعی از ضریب دست یابیم.در عین حال ضریب تصحیح شده می تواند مقداری بیش از 1 را نیز به خود بگیرد. پایین بودن قابلیت اعتماد در متغیرهای مستقل یا وابسته همراه با یک همبستگی بالا بین متغیر مستقل و وابسته می تواند ضریب همبستگی را به بالاتر از مقدار 1 برساند.

2-6. ماتریس های معین غیر مثبت:

ضرایب همبستگی بالاتر از مقدار1 در یک ماتریس همبستگی باعث معین و غیر مثبت شدن ماتریس همبستگی می شود.در اینصورت حل معادله مجاز نبوده و برآورد پارامترها قابل محاسبه نمی باشد.

ماتریس کواریانس معین غیر مثبت هنگامی رخ می دهد که دترمینان ماتریس صفر است و یا اینکه محاسبه معکوس ماتریس ممکن نیست. عواملی که چنین وضعیتی را بوجود می آورند عبارتند از ضریب همبستگی بزرگتر از 1، وابستگی خطی در میان متغیرهای مشاهده شده، همخطی در میان متغیرهای مشاهده شده، وجود وتغیری که ترکیب خطی از سایر متغیرها است، حجم نمونه کمتر از تعداد متغیرها، وجود واریانس صفر یا منفی، واریانس-کواریانس(همبستگی) خارج از دامنه تغییرات مجاز(∓1) و مقدار شروع کننده نامناسب در مدل هایی که توسط کاربر تعریف شده اند.

راه حل های ممکن برای حل چنین خطایی عبارتند از : کاهش میزان اشتراک یا تثبیت آن به مقدار کمتر از1، بیرون کشیدن تعدادی از عامل ها، تعریف مقیاس جدید برای متغیرهای مشاهده شده.

2-7. حجم نمونه :

:در مدل سازی معادله ساختاری، محقق اغلب به حجم نمونه بسیار بزرگتری از حد معمول نیاز دارد تا با حفظ توان لازم به برآوردهای باثبات تری از پارامترها و خطاهای استاندارد دست یابد. همچنین بخشی از نیاز به حجم نمونه به وجود متغیرهای پنهان مربوط است. علاوه برمقادیر مختلفی که برای حجم نمونه پیشنهاد شده است، برخی از قاعده سرانگشتی به ازای هر متغیر 10 واحد نمونه یا به ازای هر متغیر 20 واحد نمونه استفاده کنند. با این حال باید توجه داشت که هرچه حجم نمونه بزرگتر باشد احتمالاً باعث می شود که فرد بتواند با استفاده از روش دو نیمه کردن به اعتبار بیشتری برای مدل ها دست یابد.

منبع: مقدمه ای بر مدل سازی معادله ساختاری ، انتشارات جامعه شناسان. 
نویسندگان : رندال ای ، شوماخر و ریچارد جی لومکس. ترجمه : دکتر وحید قاسمی.

پایایی (Reliability)

تعریف : پایایی، همسانی نمره های افراد برای یک مجموعه از آیتم ها در دو موقعیت جداگانه یا در دو ابزار هم ارز را نشان می دهد. معمولاً از روش های همسانی درونی، دو نیمه کردن، آزمون-بازآزمون و پایایی درون رده ای برای اندازه گیری آن استفاده می شود.
سر فرانسیس گالتون همبستگی و رگرسیون را برای وارسی کواریانس در دو یا تعداد بیشتری از خصیصه ها مفهوم سازی کرد و کارل پیرسون (1896) براساس نظریه گالتون فرمول آماری برای ضریب همبستگی و رگرسیون ارائه داد(1986).به مدت کوتاهی پس از آن چارلز اسپیرمن(1904) روش همبستگی را برای روش تحلیل عاملی به کار برد.تکنیک های همبستگی ،رگرسیون و تحلیل عاملی برای دهه های متمادی پایه و اساس تهیه ی آزمون ها و تعریف سازه ها را شکل داده اند. .

پایایی یک ابزار به افراد تشکیل دهنده ی جامعه آماری مورد نظر بستگی دارد ، به طوری که اگر افراد یک جامعه شناخت بهتری از ابزار مورد نظر داشته باشند، پایایی آن ابزار در این جامعه بالاتر است.بنابراین نیاز است که پایایی (روایی) یک ابزار در جامعه ای که هدف مطالعه است ، ارزیابی گردد.

1- ارزیابی پایایی با روش همسانی درونی (آلفای کرونباخ)

این روشبرآوردی از میزان همبستگی میان متغیرهایی که سازه یا مقیاس مورد نظر را می سازند، بدست می دهد. شاخص متداول برای ارزیابی پایایی در این روش، ضریب آلفای کرونباخ می باشد. مقدار صفر این شاخص عدم پایایی مقیاس مورد نظر را نشان می دهد. در مقابل مقدار عددی 1 برای این شاخص بیانگر پایایی کامل مقیاس مورد نظر است.

فرمول محاسباتی آلفای کرونباخ به صورت زیر است :

پایایی (Reliability)

که در آن S_i^2 واریانس سؤال i ام و S_sum^2 واریانس مجموع سؤالات است. بنابراین αبه تعداد سؤالات و میزان همبستگی بین آن ها بستگی دارد. اگر امتیاز واقعی به سؤالات داده نشود و پاسخ های افراد کاملاً به یکدیگر بی ارتباط باشد α به سمت صفر میل میکند. اگر تمام سؤالات قابل اعتماد باشند و یک نتیجه را نشان دهند، این ضریب 1 خواهد بود. در ارتباط با آلفای کرونباخ نکات زیر حائز اهمیت است :

1-1) نقطه برش های متداول برای تفسیر آلفا

در ارتباط با حد مطلوب آلفای کرونباخ نظرات متفاوتی بیان می شود. بلند وآلتمن (1997) معتقد هستند که مقیاس هایی که برای ارزیابی های بالینی به کار می روند بایستی در مقایسه با مقیاس های مورد استفاده در پژوهش های غیر بالینی دارای پایایی بیشتری باشند. بر این اساس آن ها ضریب آلفای بین 0.7 و 0.8 را برای مقاصد پژوهشی پیشنهاد می کنند ولی در مقاصد بالینی مقدار آلفای مقیاس های مورد بررسی باید بزرگتر از 0.9 باشد.

1-2) تعداد آیتمهای تشکیل دهنده ی یک مقیاس

با توجه به تفسیری که برای α بیان شد، مقدار ضریب آلفای کرونباخ یک مقیاس با افزایش تعداد آیتم های آن مقیاس افزایش می یابد.بنابراین افزایش تعداد آیتم های یک مقیاس راهی برای سوق دادن ضریب آلفا به سمت یک مقدارقابل قبول برای مقیاس است. همچنین می توان نتیجه گرفت که مقیاس های با تعداد آیتم بیشتر پایاتر از مقیاس ها با تعداد آیتم های کمتر هستند.علاوه براین مقایسه ضریب آلفا دو مقیاس با تعداد آیتم های نابرابر مناسب نیست. همچنین هنگامی که تعداد آیتم های یک مقیاس محدود است، پیشنهاد می شود به میانگین همبستگی درونی آیتم ها نیز توجه شود، براساس توصیه کاکس و فرگوسن(1994) ، مقیاسی قابل قبول است که میانگین همبستگی درونی آیتم های آن بین 0.2 تا 0.4 باشد.

1-3) استفاده از آلفا برای حذف آیتم های نامناسب

در صورتی که برآوردی از مقدار آلفا با حذف یک آیتم خاص بهبود یابد، این شاخص راهی برای حذف آیتم های ناهمگون با سایر آیتم های تشکیل دهنده ی یک مقیاس، فراهم می آورد. علاوه بر این همبستگی ضعیف بین آیتم و کل مقیاس، نشان دهنده ی آیتمی است که می تواند کاندیدای حذف باشد. همچنین همبستگی منفی یک آیتم با کل مقیاس حاکی از آن است که آیتم مورد نظر باید به صورت معکوس کدگذاری شود.

2- ارزیابی پایایی با روش دو نیمه کردن

در این روش میزانی از همسانی دو مجموعه از آیتم ها که هدف واحدی را اندازه گیری می کنند، ارزیابی می شود ،برای محاسبه پایایی با این روش از دو شاخص ضریب پایایی دو نیمه کردن اسپیرمن-براون و یا گاتمن استفاده می شود.فرمول محاسباتی ضریب اسپیرمن-براون به صورت زیر است،

پایایی (Reliability)

که در آن r_ij ضریب همبستگی پیرسون بین فرم های i وj و همچنین k برابر تعداد کل نمونه تقسیم بر تعداد نمونه در هر فرم است که معمولاً برابر عدد 2 در نظر گرفته می شود.

ضریب گاتمن اصلاح شده ای از ضریب اسپیرمن-براون است که در 6 شکل مختلف L_1 تا L_6 برای اهداف مختلف ارائه می شود. مقادیر ضریب گاتمن به شدت تحت تأثیر نحوه دو نیمه کردن آیتم ها است. یک پیشنهاد اختصاص تصادفی مجموعه آیتم ها به دو گروه است به گونه ای که انتظار می رود واریانس دو مجموعه یکسان باشند.در مورد ضریب گاتمن و اسپیرمن-براونعلاوه بر پیش فرض های آلفا فرض های زیر نیز باید رعایت شود :

اختصاص تصادفی آیتم ها به دو مجموعه .
همسانی میانگین دو مجموعه: که این پیش فرض در واقع همسان بودن دو مجموع را ارزیابی می کند و برای بررسی آن از آزمون چند متغیره مقایسه میانگین T^2 هتلینگ استفاده می شود.
همگنی واریانس دو مجموعه: که این پیش فرض برای ضریب اسپیرمن-براون باید برقرار باشد ولی ضریب گاتمن نیازی به برقراری این فرض ندارد.

3-ارزیابی پایایی با روش آزمون-بازآزمون

این نوع ارزیابی پایایی، ثبات اندازه گیری ها در طول زمان را بررسی می کند. از لحاظ آماری، این روش پایایی نسخه ای از پایایی با روش دو نیمه کردن است و برای ارزیابی آن از ضریب اسپیرمن-براون استفاده می شود. از این روی پیش فرض های این روش مشابه روش دونیمه کردن می باشد با این تفاوت که مقیاس مورد نظر در طول زمان ثابت است.

در این روش ارزیابی پایایی لازم است به نکات زیر توجه شود:
1) اجرای دوباره ی آزمون ممکن است مطلوب برخی آزمودنی ها نباشد و این امکان وجود دارد که برخی از آن ها در اجرای دوم شرکت ننمایند و به این ترتیب ریزشی در حجم نمونه روی دهد.
2) این روش برای مقیاس هایی قابل استفاده است که در طول زمان پایدار باشند. برای مثال مقیاس هایی مانند هوش، اضطراب یا افسردگی این ویژگی را دارند ولی سازه ای مانند درد پایدار نیست.

4- ارزیابی پایایی با روش توافق بین ارزیاب ها

در این روش همگنی اندازه گیری ها که توسط یک ابزار روی مجموعه ی واحدی از آزمودنی ها و توسط دو یا چند ارزیاب بررسی می شود، آزمون می گردد تا میزان توافق ارزیاب ها روی ابزار مورد نظر بررسی گردد.برای ارزیابی پایایی با این روش برای داده های اسمی، ترتیبی و کمی به ترتیب از ضریب کاپای کوهن، کاپای وزنی و همبستگی درون رده ای استفاده می شود.

4-1) کاپای کوهن : این شاخص میزان توافق دو ارزیاب را روی یک صفت دو حالتی نشان می دهد. معمولاً عنوان می شود که مقادیر بزرگتر از 0.7 این شاخص، برای این منظور مناسب است.در برخی از منابع نیز مقادیر بین 0.4 تا 0.6 توافق متوسط، مقادیر بین 0.6 تا 0.8 توافق قابل ملاحظه و مقادیر بیش از 0.8 توافق عالی بین دوارزیاب را نشان می دهد.

4-2) کاپای وزنی: این شاخص مشابه کاپای کوهن است با این تفاوت که در این شاخص به رده هایی که مشابه رده مورد بررسی هستند وزن 1 و به رده های نامتشابه وزن صفر اختصاص داده می شود. این شاخص برای بررسی توافق ارزیاب ها در یک مقیاس رتبه ای به کار می رود.

4-3) همبستگی درون رده ای: از این شاخص برای ارزیابی میزان توافق دو یا تعدا بیشتری از ارزیاب ها در اندازه گیری یک متغیر کمی استفاده می شود. برای ارزیابی پایایی اندازه گیری های تکراری روی یک هدف واحد نیز می توان از این شاخص استفاده نمود. این شاخص به عنوان نسبتی از واریانس های درون ارزیاب ها با تکرار اندازه گیری ها به واریانس کل تعبیر می شود.

منبع: روش ها و تحلیل های آماری با نگاه به روش تحقیق. نویسندگان : دکتر ابراهیم حاجی زاده و دکتر محمد اصغری. سازمان انتشارات جهاد دانشگاهی .

روایی (اعتبار)Validity

زمانی یک مطالعه روا است که بتواند هدف مورد نظر را اندازه گیری نماید و همچنین در طرح مطالعه، خطای منطقی وجود نداشته باشد.به عبارت دیگر این تعریف به دو جنبه اساسی از روایی اشاره می کند که عبارتند از: قابلیت اندازه گیری هدف (اعتبار درونی) و طراحی صحیح مطالعه از جوانب مختلف (اعتبار بیرونی) .

1- اعتبار درونی :در روایی درونی قابلیت ابزار مورد نظر در اندازه گیری هدف ارزیابی می شود.انواع روایی درونی یک تحقیق عبارتند از روایی سازه ای، محتوایی، همزمان و پیش بین .

در برخی منابع دو نوع روایی همزمان و پیش بین در یک گروه و تحت عنوان روایی ملاکی معرفی می شود. برخی از مؤلفین نیز بیان می کنند که تنها یک نوع از روایی یعنی روایی سازه ای وجود دارد و روایی ملاکی و محتوایی زیر بخش هایی از آن است.با توجه به اهدافی که هریک از انواع روایی دنبال می کنند، در عمل ارزیابی همزمان هر چهارنوع روایی کار مشکلی است و اغلب پژوهشگران تنها دو نوع روایی محتوایی و سازه ای را ارزیابی می کنند.

1-1.روایی محتوایی(Content Validity): هدف از این نوع ارزیابی پاسخ به این سؤال است که آیا محتوای ابزار قابلیت اندازه گیری هدف تعریف شده را دارد یا خیر؟ به عنوان مثال آیا محتوای آزمونی که برای اندازه گیری افسردگی تعریف شده است، واقعا افسردگی را اندازه می گیرد.به همین دلیل برای ارزیابی روایی محتوایی از قضاوت افراد خبره در زمینه تخصصی مورد نظر استفاده می شود. برای مثال برای ارزیابی افسردگی ، پس از لیست نمودن تمام نشانه هایی که افسردگی را ارزیابی می کند از طریق ادبیات موضوع ، می توان مرتبط بودن، سادگی ووضوح هریک از آیتم ها و همچنین ضروری بودن آن ها را در قالب پرسشنامه ای از متخصصان مربوطه پرسید.

1-1-1) نحوه ارزیابی روایی محتوایی(محاسبه CVI وCVR)

برای ارزیابی روایی محتوایی از نظر متخصصان در مورد میزان هماهنگی محتوای ابزار اندازه گیری و هدف پژوهش ، استفاده می شود. برای این منظور دو روش کیفی و کمی در نظر گرفته می شود. در بررسی کیفی محتوا پژوهشگر از متخصصان درخواست می کند تا پس از بررسی کیفی ابزار ، بازخورد لازم را ارائه دهند که براساس آن موارد اصلاح خواهند شد.

برای بررسی روایی محتوایی به شکل کمی، ازدو ضریب نسبی روایی محتوا (CVR) و شاخص روایی محتوا (CVI)، استفاده می شود. برای تعیین CVR از متخصصان درخواست می شود تا هرآیتم را براساس طیف سه قسمتی«ضروری است» ، «مفید است ولی ضرورتی ندارد» و «ضرورتی ندارد» بررسی نماید. سپس پاسخ ها مطابق فرمول زیر محاسبه می گردد.

روایی (اعتبار)

در این رابطه n_E تعداد متخصصانی است که به گزینه ی ضروری پاسخ داده اند و N تعداد کل متخصصان است. اگر مقدار محاسبه شده از مقدار جدول بزرگتر باشد اعتبار محتوای آن آیتم پذیرفته می شود.

1-1-2) روایی صوری زیر بخشی از روایی محتوایی

این نوع ارزیابی شامل این موضوع می شود که آیا ظاهر ابزار به صورت مناسب برای ارزیابی هدف مورد نظر طراحی شده است یا خیر؟در اینجا نیز از نظر متخصصان برای تعیین روایی صوری استفاده می شود. در تعیین کیفی روایی صوری موارد سطح دشواری ، میزان عدم تناسب و ابهام مورد بررسی و اصلاح قرار می گیرد.در گام بعدی برای کاهش و حذف آیتم های نامناسب و تعیین اهمیت هریک از آیتم ها از روش کمی تأثیر آیتم استفاده خواهد شد. در این روش به هریک از گزینه های آیتم مورد نظر بنا به تعداد آنها اعداد 3،2،1،... اختصاص داده شده و فراوانی مربوط به هر یک را نیز محاسبه کرده، از رابطه ی زیر استفاده می نماییم.شماره گزینه * (%)فراوانی= شاخص

چنانچه این شاخص بیش از 1.5 باشد، آیتم برای تحلیل های بعدی مناسب تشخیص داده می شود.

1-2. روایی ملاکی (روایی همزمان و پیش بین)

منظور از روایی ملاکی میزان همبستگی بین نمرات حاصل از یک ابزار با نمرات حاصل از ابزار اندازه گیری دیگر (ملاک) است. گاهی ارزیابی همبستگی به منظور پیش بینی برای آینده است، یعنی نمرات ابزار ملاک پس از گذشت یک فاصله زمان از اجرای ابزار اول گردآوری خواهد شد در اینصورت به آن روایی پیش بینی گفته می شود. زمانی که این پیش بینی بدون فاصله و در زمان حال انجام شود، به آن روایی همزمان می گویند. برای نعیین روایی ملاکی ضریب همبستگی بین نمرات حاصل از دو ابزار به عنوان شاخص روایی آزمون مورد نظر محاسبه شده و هر چه این ضریب بزرگتر باشد، ابزار روایی بیشتری دارد.

1-3. روایی سازه ای (Construct validity)

گفت روایی سازه ای این موضوع را بررسی می کند که آیا اجزای مقیاس مورد نظر توانایی تشکیل مقیاس را دارند یا برخی از آن ها نامرتبط اند. این نوع روایی اغلب روایی عاملی نیز نامیده می شود و دلیل آن نیز نحوه ی ارزیابی این نوع روایی با روش های تحلیل عاملی است.سازه ی نامناسب سازه ای است که توافق نظری در محتوای آن وجود ندارد.

روایی سازهای به دو دسته روایی همگرایی و روایی افتراقی تقسیم می شود.

1-3-1) روایی همگرایی : روایی همگرایی به همگرایی (همسو بودن یا همبستگی) آیتم های تشکیل دهنده یک مقیاس اشاره دارد. این نوع روایی به صورت های زیر قابل اندازه گیری است ، 1) با بررسی همبستگی بین آیتم های سازنده مقیاسکه در واقع همسانی درونی آیتم ها نامیده می شود ارزیابی می شود. همسانی درونی به کمک آلفای کرونباخ، ساختار سازه ی عاملی ، مدل راش، متوسط واریانس بیان شده و واریانس روش مشترک قابل محاسبه است. 2) همسانی بین مقیاس مورد بررسی با ابزارهای مشابهی که برای اندازه گیری سازه ی مورد نظر طراحی شده اند. در صورت وجود همبستگی قوی بین سازه ی هدف و سازه ی موجود دیگر، نیازی به تعریف سازه ی جدید نیست.

3) همبستگی بین سازه ی مورد نظردر روش های مختلف(نمونه ی هدف و نمونه ارزیابی اعتبار) محاسبه شود. اگر این همبستگی مقدار قابل توجهی داشته باشد، روایی آن تأیید می شود.

در ادامه به معرفی همسانی درونی آیتم ها و روش های محاسبه آن می پردازیم.

1-3-2. روایی افتراقی

این بخش از روایی سازه ای به این موضوع اشاره دارد که آیتم های مربوط به سازه های مختلف به صورتی بسیار قوی با یکدیگر همبستگی نداشته باشند تا براساس آن بتوان نتیجه گرفت که دو سازه یک هدف را اندازه گیری میکنند.این موضوع زمانی رخ می دهد که بین دو سازه به لحاظ تعریف هم پوشانی وجود داشته باشد.برای ارزیابی این روایی ازروشهای همبستگی ، تحلیل عاملی ،متوسط واریانس بیان شده ورویکرد چندسازه ای-چند روشی استفاده می شود.

1) ارزیابی مبتنی بر همبستگی: هنگامی که یکی از آیتم های یک مقیاس باآیتم های مقیاس دیگری، که در مطالعه پژوهشگر حضور دارند، همبستگی بالایی داشته باشند(r>0.85 به عنوان یک قاعده سرانگشتی)، هشداری مبنی بر همپوشانی داشتن این دو سازه خواهد بود.

2) روش تحلیل عاملی اکتشافی : در یک تحلیل عاملی اکتشافی دو سازه در صورتی از هم افتراق دارند که دو مقیاس مختلف، دو مجموعه از بارهای عاملی متفاوت را ایجاد نمایند.

3) روش متوسط واریانس بیان شده : این روش یک روش جایگزین مبتنی بر تحلیل عاملی است که توسط فورنل وولاکر(1981) ارائه شد. در این روش زمانی بین دو سازه افتراق وجود دارد که متوسط واریانس بیان شده برای یک سازه بزرگتر از واریانس مشترک بین آن ها باشد.برای این منظور از ماتریسی استفاده می شود که از توان دوم کواریانس بین هر مقیاس با سایر مقیاس ها تشکیل شده است. برای بررسی روایی عناصر قطر اصلی ماتریس با شاخص AVE که به صورت زیر تعریف می شود، جایگزین می شود،

روایی (اعتبار)

s_1=مجموع توان های دوم بارهای عاملی مربوط به آیتم های سازنده مقیاس
s_2= مجموع مربوط به تمام آیتم ها برای شاخص (توان دوم بارهای عاملی -1 )
زمانی روایی افتراقی تأیید می گردد که هریک از عناصر روی قطر اصلی نسبت به هر مؤلفه دیگر روی سطر یا ستون بزرگتر باشد.

4) روش تحلیل عاملی تأییدی:در این روش از تحلیل عاملی تأییدی بدین صورت استفاده می شود که اگر به ازای مسیرهای تعریف شده مبتنی بر مبانی نظری برای ارتباط بین آیتم ها و سازه ی تشکیل دهنده ی آن، شاخص های برازش مدل مقادیر مناسبی داشته باشند، روایی افتراقی سازه های تعریف شده در این تحلیل تأیید می گردد.

5) استراتژی چندروشی-چند سازه ای: در این روش چند سازه تعریف می شود (چند سازه ای) و این سازه ها از طریق چند منبع جمع آوری می شود (چند روشی).به عنوان مثال در ارزیابی کیفیت زندگی کودکان از طریق پرسشنامه هریک از جنبه های کیفیت زندگی از طریق چند زیرسازه و از طریق منیع کودکان و والدین جمع آوری می گردد. هنگامی که بین سازه های اندازه گیری شده در هر روش همبستگی کوچکی وجود داشته باشد رواییافتراقی سازه ها تأیید می شود.

1-3-3 . ارزیابی روایی سازه ای با استفاده از تحلیل عاملی اکتشافی

روش تحلیل عاملی یا تجزیه ی عامل ها این امکان را برای محققان فراهم می آورد که از بین متغیرهای زیاد و روابط پیچیده میان آن ها به الگوی مشخصی دست یابند. تحلیل عاملی اکتشافی بر قاعده ی مهمی تأکید دارد، که برخی از عامل های اصلی مسئول هم تغییری میان متغیرها هستند.از جمله اهداف تحلیل عاملی اکتشافی می توان به تعیین ابعاد ابزار ، هنجاریابی پرسشنامه ها یا آزمون ها ، کاهش ابعاد (از متغیرها به عامل ها) ، ارزیابی همسانی و افتراق در بحث روایی سازه ای.

2- اعتبار بیرونی : اعتبار بیرونی با این امر سروکار دارد که آیا نتایج به دست آمده قابل تعمیم به گروهی مشابه گروه مورد مطالعه یا گروهی بزرگتر هست یاخیر .ممکن است اعتبار درونی یک تحقیق در حد مطلوبی باشد ولی این بدان معنی نیست که تحقیق انجام شده دارای اعتبار بیرونی خوبی نیز هست. اعتبار بیرونی شامل اعتبار محیطی و اعتبار آماری می باشد .
اعتبار آماری : اعتبار آماری به مناسب بودن حجم نمونه به حجم جامعه مربوط می شود .

اعتبار محیطی یا اکولوژیک‌ :اعتبار محیطی مساله ی تجانس یا عدم تجانس جامعه ی آماری می باشد.

منبع: روش ها و تحلیل های آماری با نگاه به روش تحقیق. نویسندگان : دکتر ابراهیم حاجی زاده و دکتر محمد اصغری. سازمان انتشارات جهاد دانشگاهی .

ضریب همبستگی پیرسون و ضريب همبستگي اسپيرمن در spss

ضریب همبستگی پیرسون

ضریب همبستگی پیرسون که به نام های ضریب همبستگی گشتاوری ویا ضریب همبستگی مرتبه ی صفر نیز نامیده می شود ، توسط سرکارل پیرسون معرفی شده است. این ضریب به منظور تعیین میزان رابطه، نوع و جهت رابطه ی بین دو متغیر فاصله ای یا نسبی و یا یک متغیر فاصله ای و یک متغیر نسبی به کار برده می شود

 

ضریب همبستگی رتبه ای اسپیرمن

ضریب همبستگی رتبه ای اسپیرمن توسط چارلز اسپیرمن(1945-1863) روانشناس و آماردان انگلیسی در سال 1904 معرفی شد.این ضریب میزان همبستگی رابطه ی میان دو متغیر ترتیبی را نشان می دهد و به عبارت دیگر متناظر ناپارامتری ضریب همبستگی پیرسون می باشد. در این ضریب همبستگی به جای استفاده از خود مقادیر متغیرها از رتبه های آنان استفاده می شود

 

تفاوت ضریب همبستگی رتبه ای اسپیرمن و ضریب همبستگی پیرسون :

 

  • ضریب همبستگی پیرسون برای محاسبه ی همبستگی دو متغیر فاصله ای یا نسبی به کار برده می شود، ولی ضریب اسپیرمن ، همبستگی موجود بین دو متغیر ترتیبی را نشان می دهد.

 

  •      به کمک ضریب همبستگی اسپیرمن روابط غیرخطی بررسی می شود در حالیکه ضریب همبستگی پیرسون به منظور بررسی یک رابطه ی خطی بکار برده می شود.

 

 

 

تحلیل واریانس چند متغیری MANOVA

برای مقایسه میانگین اثرات یک یا چند متغیر مستقل بر روی یک متغیر وابسته براساس طرح های آزمایشی مختلف، روش های آماری متعددی مانند آزمون t و آزمون تحلیل واریانس تک متغیری ANOVAبکار گرفته می شود.اما در حالتی که بیش از یک متغیر وابسته مدنظر قرار دارد، با توجه به وابستگی بین متغیرهای وابسته از روش های تحلیل چند متغیره استفاده می شود.

در طرح تحلیل واریانس چند متغیری دو یا چند متغیر وابسته پیوسته با یک یا چند متغیر مستقل مقوله ای ارزیابی می شوند. برای مثال مطالعه اثرات جنسیت(مرد، زن) روی رضایت شغلی کارگران و غیبت آنان از کار و یا بررسی اثرات نوع تدبیر درمانی (رفتاری-شناختی، روان کاوی، درمان فشرده) روی ارزیابی کارکرد کلی(پیامد بالینی) و رضایت مراجع از خدمات درمانی، از این قبیل می باشد. فرضیه صفر برای این آزمون در حالت کلی به صورت زیر است :H_0: μ_1=μ_2=⋯=μ_i

این فرضیه بیان می کند که میانگین همه گروه ها در جامعه برابر می باشد.
در روش MANOVA ماتریس حاصلضرب برداری کل(T) به دو گروه ماتریس حاصلضرب برداری بین گروه ها (B) و ماتریس حاصلضرب برداری درون گروه ها(W) تفکیک می شود.T=B+W
Tمیزان انحراف نمونه ها از میانگین را در هر سطح متغیر مستقل یا گروه از میانگین کل هر متغیر وابسته را نشان می دهد.ماتریس B اثرات متفاوت تدابیرآزمایشی را روی مجموعه متغیرهای وابسته نشان می دهد.در نهایت W نشان می دهد که نمونه ها در هر سطح یا گروه متغیر مستقل چگونه از میانگین های متغیرهای وابسته منحرف می شوند. چهار آزمون آماری متعارف در این زمینه وجود دارد : اثر پیلایی، لامبدای ویلکز، اثر هتلینگ و روش بزرگترین ریشه دوم. پرکاربردترین این آماره ها لامبدای ویلکز می باشد که براساس نسبت Wبر B+Wساخته می شود.در عمل اگر اثرمتغیر مستقل بر متغیرهای وابسته از نظر آماری معنادار باشد، یعنی اگر تدابیرآزمایشی اثرگذار باشند، در اینصورت مقدار B نسبتا بزرگ و Wکوچک خواهد بود.

دلایل استفاده از MONOVA

اغلب اتفاق می افتد زمانی که هدف محقق بررسی بیش از یک متغیر وابسته است، به جای استفاده از روش های چند متغیری هر بار یکی از متغیرهای وابسته را در نظر گرفته و از روش ANOVA برای تحلیل استفاده می نماید. استفاده از این روش می تواند اشکالاتی را به وجود آورد که در ادامه به بیان آن ها می پردازیم :
1- آزمون های آماری تک متغیری به طور معمول همبستگی متقابل متغیرهای وابسته را نادیده می گیرد. در حالیکه روش MANOVAهمبستگی متقابل بین متغیرهای وابسته را با بررسی ماتریس های واریانس کواریانس در نظر می گیرد.
2- روش MANOVA محققان را قادر می سازد تا روابط بین متغیرهای وابسته را در هر سطحی از متغیرهای مستقل بررسی کنند.
3- این روش به شناسایی متغیرهای وابسته با بیشترین توان تفکیک در گروه بندیکمک می کند.
4- MANOVAبه واسطه توان افزایش یافته در موقعیت چند متغیری می تواند تفاوت های گروهی نامشخص تحت شرایط تحلیل های آماری تک متغیری را آشکار نماید.
5- روش MANOVA سطح آلفای کلی یا میزان خطای نوع اول (یعنی احتمال این که فرض صفر درست بوده و به اشتباه رد شود)را کنترل می کند. برای مثال اگر بخواهیم تفاوت های جنسیتی(متغیر مستقل) را با چهار متغیر وابسته رضایت شغلی (پرداخت، مزایا، همکاران و محل کار) بررسی کنیم و برای این کار از چهار آزمون جداگانه t و یا روش ANOVAاستفاده نماییم، با سطح خطای 5% برای هر آزمون با خطای نوع اول برابر 0.054 مواجه خواهیم شد. در این حالت استفاده از روش MANOVA این مشکل را برطرف می کند.

چه موقع نباید از MANOVA استفاده کرد

حداقل دو حالت وجود دارد که تحت آن شرایط نباید از MANOVA استفاده نمود و یا اینکه در کاربرد آن ها باید جانب احتیاط رعایت شود :
1- اگر همبستگی بین متغیرهای وابسته وجود نداشته باشد. موقعیت ایده آل برای استفاده از تحلیل واریانس چند متغیری زمانی است که متغیرهای وابسته دارای همبستگی متوسط باشند.
2- در شرایطی که متغیرهای وابسته دارای همبستگی بسیار بالایی هستند نیز نباید از MANOVA استفاده شود. از نظر آماری اینگونه همبستگی ها خطر هم خطی چندگانه را افزایش می دهد. از لحاظ مفهومی متغیرهایی که دارای همبستگی بالایی هستند، ممکن است سازه ی یکسانی را اندازه گیری کنند و بنابراین در مطالعه به عنوان متغیرهای زائد تلقی شوند.

مفروضه ها و محدودیت های آماری در تحلیل واریانس چند متغیری

نرمال بودن چند متغیری : یکی از شرایط استفاده از تحلیل واریانسواریانس چند متغیری نرمال بودن چند متغیری متغیرهای وابسته می باشد.در صورت عدم برقراری این فرض از روش های مختلف تبدیل داده ها مختلف استفاده می شود.
استقلال : کننده گان در تحقیق باید مستقل از یکدیگر باشند، به لحاظ آزمایشی می توان گفت اگر شرکت کنندگان به صورت تصادفی انتخاب شوند، فرض استقلال برقرار می شود.
مقادیر پرت و گمشده : روش تحلیل واریانس چند متغیری به مقادیر پرت یا کرانه های متغیرهای وابسته بسیار حساس است. خارج نکردن مقادیر پرت از تحلیل و یا تبدیل نکردن این داده ها می تواند میزان خطای نوع اول و دوم را افزایش دهد.
همگنی ماتریس های واریانس-کواریانس : روش استاندارد برای ارزیابی برابری ماتریس های کواریانس آزمونت M باکس است، که در آن معناداری آماری شاخص ناهمگنی یا نابرابری محسوب می شود. از جمله روش های اصلاح نقض این مفروضه ها تبدیل متغیرهای وابسته است.
خطی بودن : فرض بر آن است که بین جفت متغیرهای وابسته روابط خطی برقرار است. در صورت مشاهده روابط غیرخطی می توان از تبدیل های مناسب استفاده نمود.

منبع : پژوهش چند متغیری کاربردی ، نوشته ی لاورنس اس.میزر، گلن گامست و ا.جی.گارینو. ترجمه دکتر حسن پاشا شریفی و همکاران. انتشارات رشد.

کلیات رگرسیون خطی ساده

یکی از پرکاربردترین روش های آماری در علوم مختلف، اجرای انواع روش های رگرسیون برای تعیین رابطه ی بین یک متغیر وابسته با یک یا چند متغیر مستقل می باشد . متغیر وابسته ، پاسخ و متغیرهای مستقل ، متغیرهای توضیحی نیز نامیده می شوند. اجرای یک مدل رگرسیونی با تعریف مدل رگرسیون امکان پذیر است. مدل رگرسیون ساده با متغیر وابسته یY وp-1  متغیر مستقل X1,X2,…,Xp-1 به صورت زیر تعریف می شود ،

کلیات رگرسیون خطی ساده

به عنوان مثال فرض کنید یک محقق قصد دارد اثر دو متغیر سن و وزن را بر فشارخون اندازه گیری نماید. برای این مطالعه مقادیر سن و وزن برای n=500 نفر اندازه گیری می شود. در این مطالعه سن و وزن متغیرهای مستقل یا پیشگو و متغیر فشارخون متغیر وابسته می باشد.

معادله ی (1) را می توان به فرم ماتریسی زیر نیز تعریف کرد:

کلیات رگرسیون خطی ساده

ماتریسX مقادیر مشاهده شده ی p-1  متغیر را برای n نفر نشان می دهد. بردارY نیز مقادیر مشاهده  شده ی متغیر وابسته برای نمونه ای به حجم n می باشد. در یک مدل رگرسیونیکلیات رگرسیون خطی ساده ها پارامترهای مدل بوده و به کمک روش های مختلفی مانند روش حداقل مربعات و روش درستنمایی ماکزیمم برآورد می شوند.کلیات رگرسیون خطی ساده ها نیز جملات خطا نامیده می شوند و دارای توزیع نرمال با میانگین صفر و واریانسکلیات رگرسیون خطی ساده هستند.

کلیات رگرسیون خطی ساده

معادله ی رگرسیون با تعریف ماتریس متغیرهای توضیحی و بردارهای متغیر پاسخ ، پارامترهای مدل و جملات خطا به صورت زیر تعریف می شود :

کلیات رگرسیون خطی ساده

برآورد ضرایب رگرسیون :به کمک روش حداقل مربعات مقادیر بردارکلیات رگرسیون خطی ساده با می نیمم کردن معادله

کلیات رگرسیون خطی ساده

حاصل می شود. برآورد بردارکلیات رگرسیون خطی ساده  را باکلیات رگرسیون خطی ساده نشان داده و با توجه به فرم ماتریسی تعریف شده در معادله (2) به صورت زیر محاسبه می شود

کلیات رگرسیون خطی ساده

مقادیر برازش شده وخطاها : با برآورد پارامترهای مدل ، برآورد بردارYبا استفاده از رابطه ی

کلیات رگرسیون خطی ساده

حاصل می شود. بکلیات رگرسیون خطی ساده مقادیر برازش شده گفته می شود.

تفاوت بین مقادیر واقعی و مقادیر برازش شده مانده های رگرسیون نامیده می شوند؛

کلیات رگرسیون خطی ساده

مجموع و میانگین مربعات: برای تهیه ی جدول آنالیز واریانس و بررسی معنی داری مدل برازش داده شده  به معرفی مقادیر مجموع مربعات خطا و میانگین مربعات خطا می پردازیم.

مجموع مربعات کل : این مقدار مجموع توان دوم تفاضل هریک از اعضای بردار Y از میانگین این بردار حاصل می شود. مجموع مربعات کل با SSTO نمایش داده شده و به صورت زیر تعریف می شود .

SSTO دارای n-1 درجه آزادی است .

کلیات رگرسیون خطی ساده

  ماتریسی n*n است که تمام اعضای آن 1 هستند.

مجموع مربعات رگرسیون : این مقدار میزان  تغییراتی از متغیر پاسخ را که توسط مدل برازش شده تبیین می شود، نشان می دهد. مجموع مربعات رگرسیون دارای p-1 درجه آزادی می باشد:

کلیات رگرسیون خطی ساده

مجموع مربعات خطا : میزان تغییراتی از متغیر پاسخ که توسط مدل رگرسیون بیان نمی شود ، در مجموع مربعات خطا قرار می گیرد. این عبارت دارای n-p درجه ی آزادی است.

کلیات رگرسیون خطی ساده

ماتریس H به شکل زير تعریف می شود :

 

کلیات رگرسیون خطی ساده

ا توجه به تعاریف ارائه شده ذکر این نکته لازم به نظر می رسد که مجموع تغییرات متغیر پاسخ به وسیله ی دو جزء مجموع مربعات رگرسیون و مجموع مربعات خطا قابل بیان می باشد.

SSTO=SSR+SSE 

به این ترتیب میانگین مربعات رگرسیون و میانگین مربعات خطا از تقسیم SSR وSSE بر درجه آزادی هریک حاصل می شوند وداریم :

کلیات رگرسیون خطی ساده

منبع : کتاب مقدمه ای بر مدل های خطی آماری . نوشته ی مایکل کاتنر (Michael H.Kutner) و جان نتر (John Neter).

بررسی فرض هاي زيربنايي هر رگرسيون (بررسي مناسب بودن الگوي رگرسيون)

آنچه که در ابتدا برای انجام هر رگرسیون بایستی در نظر گرفته شود فرض های زیربنایی است که تحلیل ها براساس آن ها انجام می پذیرد. اين نکته اي بسيار مهم است که متاسفانه اکثرا در تحليلها مورد غفلت قرار مي گيرد و نتايج آنرا دچار خدشه مي سازد. فرض های زیربنایی برای یک الگوی رگرسیون به صورت زیر است :

1)     جمله ی خطا ε دارای میانگین صفر است .

2)     جمله ی خطا ε دارای واریانس ثابت است .

3)     جمله ی خطا ε ناهمبسته اند .

4)     جمله ی خطا ε دارای توزیع نرمال است .

اگر الگوی برازش داده شده مناسب باشد باید مانده ها ، فرض های بیان شده ی فوق را تایید کنند . مانده اختلاف بین مقدار مشاهده شده و مقدار برازش شده بوسیله ی الگو است ، یعنی

فرض هاي زيربنايي  رگرسيون

 به عبارت دیگر مانده اندازه ای از تغییر پذیری متغیر پاسخ است که بوسیله ی الگوی رگرسیون بیان نمی شود.

مانده ها را می توان نماینده ی خطاهای الگو در نظر گرفت و از این روی هر انحراف از فرض های چهارگانه ی رگرسیون در مورد خطاها باید در مانده ها دیده شود .

یک راه مناسب برای این که ببینیم الگوی رگرسیون تا چه اندازه برای برازش به داده ها خوب است ، رسم نمودار مانده ها می باشد .

نمودار مانده ها در مقابل مقادیر  برازش شده : رسم نمودار مانده ها

فرض هاي زيربنايي  رگرسيون

در مقابل مقادیر برازش شده ی متناظر یعنیفرض هاي زيربنايي  رگرسيونر پی بردن به انواع متداول مناسب نبودن الگو مفید است . اگر مدل برازش شده مناسب باشد این نمودار بایستی نسبت به نقطه یفرض هاي زيربنايي  رگرسيونمتقارن بوده و نقاط حول این نقطه به طور یکنواخت پراکنده شده باشند . این وضعیت ثابت بودن واریانس خطاها را نشان می دهد .این نمودار به طور معمول در سه شکل زیر دیده می شود :

فرض هاي زيربنايي  رگرسيون

نمودار (الف) وضعیت مطلوبی است که در آن واریانس خطاها ثابت است . در نمودار (ب) نقاط به صورت

قیفی شکل پراکنده شده اند و ثابت نبودن واریانس خطاها را نتیجه می دهد . در این حالت انجام آزمون ها و تشکیل فواصل اطمینان مقدور نبوده و همچنین برآورد پارامترها به روش کمترین مربعات امکان پذیر نیست و بایستی ضرایب را با کمک روش دیگری برآورد کرد . در چنین وضعیتی اگر متوجه ثابت نبودن واریانس جمله ی خطا نشویم و یا به آن اعتنا نکنیم ، با دو مشکل زیر مواجه می شویم :

الف) فرمول های رگرسیونی معمول واریانس های مربوط به پارامترها را کمتر از آنچه که واقعا هست نشان می دهند .

ب) فواصل اطمینانی که محاسبه می کنیم دارای ضرایب اطمینان کمتری از آنچه تصور می کردیم خواهد بود .

برای ثابت شدن واریانس ها بنا به نظر تحلیلگر آمار از تبدیلات تثبیت کننده ی واریانس و یا روش کمترین توان دوم وزنی می توان استفاده نمود .

آخرین حالت یعنی نمودار غیر خطی (ج) نشان می دهد که باید تبدیلی مانند تبدیلات لگاریتم یا توان دوم و... روی متغیر پیشگو صورت گیرد و یا متغیری به الگو اضافه شود .

نمودار مانده ها در برابر مقادیر متغیر های پیشگو : رسم مانده ها در مقابل متغیر پیشگو نیز می تواند مفید باشد. در این نمودار یک طرح قیفی شکل عدم ثبات واریانس ها را نشان می دهد. در صورتی که نقاط به صورت یکنواخت پراکنده شده باشند، می توان ثابت بودن واریانس ها را نتیجه گرفت .

فرض هاي زيربنايي  رگرسيون

نمودار مانده ها در برابر ترتیب زمان : در صورتی که دنباله ی زمانی که در آن داده ها جمع آوری شده اند معلوم باشد، رسم نمودار مانده ها در برابر ترتیب زمان می تواند مفید باشد . اگر این نمودار طرح خاصی نداشته باشد مبین فرض وجود استقلال است.

فرض هاي زيربنايي  رگرسيون

وجود یک روند غیرخطی در نمودار مانده ها بیانگر آن است که الگوی برازش داده شده نمی تواند مناسب باشد در این صورت دو امکان وجود دارد :

1)     نیاز به یک یا چند جمله ی اضافی در الگو احساس می شود .

2)     الگو نیاز به یک تبدیل مناسب مانند تبدیل لگاریم یا توان دوم و...روی متغیر(های) پیشگو دارد .

فرض هاي زيربنايي  رگرسيون

نمودار احتمال نرمال : از آنجایی که در محاسبه ی آماره های t وF برای آزمون های رگرسیون و همچنین در محاسبه ی فواصل اطمینان، از فرض نرمال بودن خطاها استفاده می کنیم لذا انحراف های بزرگ از توزیع نرمال می تواند روی صحت و اعتبار نتایج بدست آمده تاثیرزیادی بگذارد. علاوه بر این در صورتی که خطاها از توزیع های با دنباله های باریک تر یا پهن تر از توزیع نرمال پیروی کنند ، ممکن است برازش کمترین توان های دوم نسبت به تغییر کوچکی در داده ها حساس باشد .یک روش ساده برای بررسی فرض نرمال بودن رسم نمودار احتمال نرمال مانده ها است. اگر فرض هاي زيربنايي  رگرسيون را به صورت صعودی مرتب کردهفرض هاي زيربنايي  رگرسيونو  ها را در مقابل احتمال تجمعی 

فرض هاي زيربنايي  رگرسيون

رسم کنیم ، نقاط باید روی یک خط راست قرار گیرند.

فرض هاي زيربنايي  رگرسيون

وجود یک یا چند مانده ی بزرگ در این نمودار می تواند نشانه ای از وجود نقاط دور افتاده باشد که بایستی در مورد این نقاط تفحص بیشتری انجام شود .

منبع : تحلیل رگرسیون خطی ابزاری برای تحقیق، نوشته ی دکترحسینعلی نیرومند . انتشارات دانشگاه فردوسی مشهد.

 

 

آزمون z يا Z Test براي آزمون فرض تساوي دو نسبت

اين آزمون براي مقايسه نسبتي از افراد که داراي ويژگي مشخصي هستند در دو جامعه ي متفاوت استفاده مي شود . در اين آزمون براي تقريب توزيع دوجمله اي به وسيله ي توزيع نرمال فرض مي شود که اندازه ي نمونه در هر دو جامعه به اندازه ي کافي بزرگ باشد ، (n1,n2≥30) . با تعريف اين که p2,p1 به ترتيب نسبت افراد داراي ويژگي مورد نظر در دو جامعه مي باشند ، آماره ي آزمون را به صورت زير تعريف مي کنيم :

آزمون z يا Z Test براي آزمون فرض تساوي دو نسبت

که د رآن

آزمون z يا Z Test براي آزمون فرض تساوي دو نسبت

تحت فرضيه ي صفر p1=p2   بوده و z تقريبا داراي توزيع نرمال است .با توجه به يک طرفه يا دوطرفه بودن فرض مقابل با مقدار z در جدول توزيع نرمال مقايسه مي شود .

 

مثال : با فرض n1=952 , n2=1168 , p1=0.00325 , p2=0.0573  آماره ي z به صورت زير به دست مي آيد :

آزمون z يا Z Test براي آزمون فرض تساوي دو نسبت

نمونه گیری چیست؟

آیا در همه تحقیقات می توان کلیه جامعه آماری را مورد آزمایش و بررسی قرار داد؟

مثال:

اگر بخواهیم با آزمایش طول عمر تمام لامپ های تولیدی شرکت آلفا را به دست آوریم با ید تمام لامپ ها را روشن کنیم تا بسوزد که این کار غیر معقول است. ( تمام محصولات شرکت از بین می رود)

بنابراین در شرایطی نمی توان کل جامعه آماری را مورد بررسی قرار داد که مهمترین این شرایط و محدودیت ها به صورت زیر است.

  • کمبود وقت
  • هزینه بر بودن
  • غیر ممکن و غیر معقول بودن.

بنابراین در چنین مواقعی نیاز است از نمونه گیری استفاده کنیم.

 

قبل از اینکه به بیان دقیق مفهوم نمونه گیری و نمونه بپردازیم مثال زیر را مورد بررسی قرار می دهیم.

در بسیاری از کشورها بررسی میزان محبوبیت داوطلبان نمایندگی مجلس، قبل از انجام انتخابات، بررسی متداولی است. معمولا برای این بررسی، تعدادی از رای دهندگانرا در حوزه ی رای گیری با روشی مشخص برمی گزینند و میزان محبوبیت هر داوطلب را برآورد می کنند.

فرایند انتخاب این تعداد که نمونه نامیده می شوند را نمونه گیری می نامیم.

به عنوان مثال های دیگر:
موسسات بازاریابی برای بررسی نظر مشتریان نسبت به کیفیت فراورده ها و بهای آنها مرتبا نمونه گیری می کنند.
کارخانه های داروسازی، همه روزه برای بازبینی میزان ماده موثر هر داروی خط تولید، از هر پخت دارو نمونه گیری می کنند.

سوال:

آیا انتخاب نمونه به هر روش صحیح است یا اینکه نمونه انتخابی باید دارای ویژگی هایی باشد؟

نمونه باید دارای ویژگی های زیر باشد:

  • نمونه باید نماینده جامعه باشد
  • به عنوان مثال وقتی برای تعیین میزان محبوبیت انتخاباتی یک داوطلب، نمونه ای از جامعه ی رای دهندگان بر می گزینیم، باید نمونه نماینده تمام جامعه آماری باشد و نه تنها نماینده گروهی خاص که مثلا در محله این داوطلب زندگی می کنند.
  • براوردهای مشخصه های جامعه که از نمونه نتیجه می شوند دقیق بوده و میزان اعتماد پذیری آنها را بتوان اندازه گرفت.
  • به عنوان مثال براورد (تخمین) درصد رای دهندگانی که موافق انتخاب این داوطلب هستند باید به درصد واقعی موافقین او در کل جامعه نزدیک باشد و قادر باشیم درباره دقت این براورد نمونه ای حکمی تهیه کنیم.
  • هزینه انتخاب نمونه کم باشد

 

با توجه به سه ملاک فوق علم نمونه گیری به وجود می آید؛ ما ابتدا با توجه به ساختار جامعه آماری و بر اساس اینکه نمونه باید نماینده واقعی جامعه باشد روش نمونه گیری خود را تعین می کنیم، پس از تعین روش نمونه گیری زمان آن فرا می رسد که حجم نمونه یا تعداد اعضایی که باید در تحقیق از انها استفاده کنیم را مشخص نماییم.

در این قسمت با دو محدودیت و ملاک روبرو هستیم:

  • دقت نمونه گیری
  • هزینه

 

بنابراین در انتخاب حجم نمونه دو رویکرد مختلف می تواند وجود داشته باشد:

  • تعیین حجم نمونه به روشی که دقت مورد نظر ما را در براورد مشخصه های جامعه با حداقل هزینه تامین کند
  • اگر بودجه معینی برای نمونه گیری داریم با این بودجه، حداکثر دقت را در برآورد مشخصه جامعه فراهم نماییم.

 

نمونه بخشی (زیرمجموعه ای) از جامعه تحت بررسی ( جامعه آماری) است که با روشی که از پیش تعیین شده است ( روش نمونه گیری) انتخاب می شود؛ به قسمی که می توان از این بخش (نمونه) استنباطهایی درباره کل جامعه به دست آورد.

نمونه گیری:

تکنیک های (روشهای) انتخاب نمونه را نمونه گیری می گوییم.

وارد کردن داده های پنل در نرم افزار Eviews

برای وارد کردن داده های پانل (پنل) (panel) در نرم افزار EViews ابتدا منوی 

 file> new workfile 
وارد کردن داده های پنل در نرم افزار Eviews

را انتخاب می کنیم، پنجره workfile create باز می شود که در قسمت 
work file structure type گزینه balanced panel را انتخاب و در قسمت date specification با توجه به نوع داده های مورد تحلیل گزینه مورد نظر را انتخاب می کنیم 
به عنوان مثال اگر داده ها به صورت سالانه جمع آوری شده باشد گزینه annual را انتخاب می کنیم و برای تاریخ شروع داده ها و انتهای آنها باید کمترین سال و بیشترین سال موجود را وارد کنیم به عنوان مثال اگر بعضی از مقاطع شامل داده ها ی سال 1932 تا 1967 و بعضی از مقاطع شامل داده های سال 1930 تا 1954 باشد باید شروع و انتهای داده ها را به ترتیب از 1930 تا 1967 تعیین نماییم. 
در قسمت number of cross section تعداد مقاطع مورد نظر را وارد می کنیم. سپس با کلیک بر دکمه ok ، برگه کاری جدید ایجاد می شود. 
پس از آن وارد منوی 

 object>new object
وارد کردن داده های پنل در نرم افزار Eviews

شده و در قسمت type of object عبارت series را انتخاب و در قسمت Name of object یک نام برای داده ها وارد کرده و بر روی گزینه ok کلیک می کنیم. حال در برگه کاری workfile سری که ایجاد نموده ایم را با دابل کلیک می کنیم پنجره داده ها باز می شود؛ برای وارد کردن داده ها ی مورد نظر دکمه edit+/- را انتخاب و داده ها را به ترتیب وارد می کنیم.

استنباط آماری: آزمون فرض های آماری

دف از نمونه گیری، انجام استنباط هایی درباره پارامتر جامعه است.
به طور کلی، هدف آزمون فرض های آماری تعیین این موضوع است که با توجه به اطلاعات به دست آمده از داده های نمونه، حدسی که درباره ی خصوصیتی از جامعه می زنیم، تقریبا قابل تایید است یا خیر.
این حدس بنا به هدف تحقیق، نوعا شامل ادعایی درباره ی مقدار یک پارامتر جامعه است.
در واقع هر حکمی درباره ی پارامتر جامعه را یک فرض آماری می نامیم.
بنابراین فرض آماری حکمی درباره جامعه است و قابل قبول بودن آن باید بر مبنای اطلاعات حاصل از نمونه گیری از جامعه بررسی شود.
به عنوان مثال یک شرکت تولیدی هنگام خرید محصولات اولیه با انتخاب یک نمونه و آزمون اینکه آیا محصولات دارای کیفیت واقعی هستند تصمیم به خرید محصولات می گیرد.
در انجام یک آزمون همواره یک فرض صفر و یک فرض مقابل وجود دارد.
به عنوان یک مثال می خواهیم بررسی کنیم که سن دانشجویان دانشگاه دارای میانگین 23 است؛ در این مورد
استنباط آماری: آزمون فرض های آماری

 استنباط آماری: آزمون فرض های آماری

فرضیه صفر در آمار دارای نقش بسیار مهمی است و می توان آنرا همانند مورد شخص متهمی دانست که در دادگاه فرض ابتدایی بر بی گناهی اوست مگر آنکه خلاف آن ثابت شود.
برای انجام هر آزمون نیاز به یک آماره مناسب است تا با توجه به مقدار و توزیع نمونه گیری آن در مورد فرض صفر تصمیم گیری نمود.
در آزمون فرضیه توزیع نمونه گیری آماره آزمون به دو ناحیه تقسیم می شود یکی ناحیه پذیرش فرض صفر و دیگری ناحیه رد فرض صفر و مرز این دو ناحیه را مقدار بحرانی می گوئیم، البته در تعین ناحیه رد باید به نوع آزمون توجه نمود.
اگر مقداره آماره آزمون در ناحیه رد قرار گیرد، فرضیه صفر رد می شود.

انواع فرض:

فرض دو طرفه:

 استنباط آماری: آزمون فرض های آماری 
 استنباط آماری: آزمون فرض های آماری


فرض یک طرفه:

 استنباط آماری: آزمون فرض های آماری 
 استنباط آماری: آزمون فرض های آماری
 استنباط آماری: آزمون فرض های آماری 
 استنباط آماری: آزمون فرض های آماری

پذیرش یا عدم پذیرش یک فرض آماری تا حدودی با اثبات یا رد یک گزاره ی ریاضی متفاوت است. یک گزاره ریاضی را یا اثبات می کنند و یا اینکه با ارائه یک مثال ناقص آن را رد می کنند. در هر حالت نتیجه ای که به دست می آید بدون هیچ شکی برقرار است ولی در مقابل نتیجه حاصل از آزمون فرض آماری به وسیله ی تحلیل داده های تجربی، نوعی عدم حتمیت به همراه دارد. 
در آزمون فرض صفر H0 در برابر فرض مقابل H1، روش ما این است که H0 را صحیح بدانیم مگر اینکه داده های به دست آمده قویا بر خلاف آن حکم کنند، که در این صورت H0 باید به نفع H1 رد شود. 
رد کردن H0 وقتی که H0 درست است، نسبت به رد نکردن H0 وقتی H1 درست است، خطای مهمتری است.

انواع خطا در spss

خطای نوع اول(آزمون فرض های آماری انواع خطا ): احتمال رد کردن فرض صفر هنگامی که فرض صفر در حقیقت درست است را احتمال خطای نوع اول می گوییم.
احتمال خطای نوع اول را سطح معنی دار بودن (سطح معنی داری آزمون) می گوییم.
در مثال متهم اگر فرض صفر به اشتباه رد شود مرتکب خطای بزرگتری شده ایم.
در امار نیز خطای نوع اول دارای اهمیت فوق العاده ای است و لذا همواره میزان خطای نوع اول را کنترل می کنند. 
مثال: آزمون را در سطح معنی داری آزمون فرض های آماری انواع خطا  = 0.5 انجام دهید.
خطای نوع دوم(آزمون فرض های آماری انواع خطا ): عبارت است از احتمال عدم رد فرض صفر هنگامی که غلط است و باید رد شود.
در مورد مثال سن دانشجویان خطای نوع اول زمانی اتفاق می افتد که میانگین سن دانشجویان 23 سال باشد و نتیجه بگیریم که 23 سال نیست. و خطای نوع دوم زمانی اتفاق می افتد که میانگین سن دانشجویان 23 سال نباشد و نتیجه بگیریم 23 سال است.
بنابراین با توجه به وضع واقعی پارامتر، که بر ما معلوم نیست و نتایج ممکن حاصل از انجام آزمون، یکی از حالتهای زیر پیش می آید.

  آزمون فرض های آماری انواع خطا

خطای نوع اول و دوم در رابطه ی عکس با هم هستند و اگر آزمون فرض های آماری انواع خطا  کاهش داده شود آزمون فرض های آماری انواع خطا  افزایش مییابد و چنانچه آزمون فرض های آماری انواع خطا  کاهش داده شود آزمون فرض های آماری انواع خطا  افزایش می یابد.

آزمون فرضیه یک میانگین در spss

در این قسمت قصد داریم روش ساختن آزمون فرض برای میانگین جامعه (آزمون فرض های آماری آزمون فرضیه یک میانگین ) را بررسی کنیم. همان گونه که از قبل می دانیم برای ساختن یک آزمون فرض نیاز به تعین آماره آزمون و توزیع نمونه گیری آن داریم.
یادآوری:
هر متغیر تصادفی دارای یک توزیع احتمال است. توزیع احتمال یک آماره را اصطلاحاتوزیع نمونه گیری آماره می گوییم.

بهترین اماره ای که برای میانگین جامعه آزمون فرض های آماری آزمون فرضیه یک میانگین  می توان در نظر گرفت میانگین نمونه آزمون فرض های آماری آزمون فرضیه یک میانگین است.
توزیع نمونه گیری میانگین، توزیع احتمال میانگین های همه نمونه های تصادفی با حجم مشخصی (n) است که می توان از جامعه انتخاب کرد.
توزیع نمونه گیری میانگین را توزیع آزمون فرض های آماری آزمون فرضیه یک میانگین  نیز می نامند.
توزیع آزمون فرض های آماری آزمون فرضیه یک میانگین  در حد قابل ملاحظه ای بستگی به نوع توزیع جامعه دارد. بنابراین نمی توان انتظار داشت که روش استنباطی واحدی برای همه انواع توزیع های جامعه به کار رود.
بنابراین برای ساختن یک آزمون فرض درباره میانگین، حالت های زیر می تواند اتفاق بیفتد.

  • جامعه نرمال و انحراف معیار جامعه مشخص
  • جامعه نرمال و انحراف معیار جامعه نامشخص
  • جامعه غیر نرمال و حجم نمونه بزرگ (آزمون فرض های آماری آزمون فرضیه یک میانگین )
  • جامعه غیر نرمال و حجم نمونه کوچک (n<30)

* اگر جامعه نرمال باشد(بدون توجه به حجم نمونه) توزیع آزمون فرض های آماری آزمون فرضیه یک میانگین  نرمال است.

  • اگر انحراف معیار جامعه نامشخص باشد که معمولا چنین است باید به برآورد انحراف معیار جامعه بپردازیم و در این حالت توزیع آزمون فرض های آماری آزمون فرضیه یک میانگین  دیگر نرمال نیست و دارای یک توزیع نزدیک به نرمال به نام توزیع t یا t- استودنت است.

* اگر جامعه نرمال نباشد با توجه به قضیه حد مرکزی برای آزمون فرض های آماری آزمون فرضیه یک میانگین  توزیع آزمون فرض های آماری آزمون فرضیه یک میانگین نرمال است. 
در این قسمت برای حالت های مختلف آماره آزمون را مشخص می کنیم

  • جامعه نرمال و انحراف معیار جامعه مشخص
    در این حالت آزمون فرض های آماری آزمون فرضیه یک میانگین  دارای توزیع نرمال است بنابراین آماره ی آزمون
    آزمون فرض های آماری آزمون فرضیه یک میانگین
    که در آن آزمون فرض های آماری آزمون فرضیه یک میانگین   و آزمون فرض های آماری آزمون فرضیه یک میانگین  انحراف معیار جامعه، دارای توزیع نرمال استاندارد است.
  • جامعه نرمال و انحراف معیار جامعه نامشخص
    در این حالت
    آزمون فرض های آماری آزمون فرضیه یک میانگین
    که در آن آزمون فرض های آماری آزمون فرضیه یک میانگین   و آزمون فرض های آماری آزمون فرضیه یک میانگین   است دارایتوزیع t با n-1 درجه آزادی است.
  • جامعه غیر نرمال و حجم نمونه بزرگ (آزمون فرض های آماری آزمون فرضیه یک میانگین )
    در این حالت
    آزمون فرض های آماری آزمون فرضیه یک میانگین
    دارای توزیع نرمال استاندارد است.
  • جامعه غیر نرمال و حجم نمونه کوچک (n<30)
    در این حالت باید از روشهای ناپارامتری اسثفاده کنیم.

در زیر با چند مثال حالت های مختلف را توضیح می دهیم.
مثال 1:
اگر سن دانشجویان دانشگاه دارای توزیع نرمال با واریانس 4 باشد و نمونه ای تصادفی به حجم 20 از میان آنها انتخاب و میانگین و انحراف معیار ان به ترتیب برابر 24 و 3 شود آزمون زیر را در سطح آزمون فرض های آماری آزمون فرضیه یک میانگین  = 0.05 انجام دهید.

آزمون فرض های آماری آزمون فرضیه یک میانگین

با توجه به اینکه جامعه نرمال و انحراف معیار آن مشخص است (حالت اول) بنابراینآزمون فرض های آماری آزمون فرضیه یک میانگین   دارای توزیع نرمال استاندارد است.
آزمون دو طرفه است بنابراین آزمون فرض های آماری آزمون فرضیه یک میانگین  را به دو قسمت مساوی تقسیم می کنیم و مقدار بحرانی را از جدول توزیع نرمال به دست می آوریم. Z0.025=1.96
با توجه به آنچه در قسمت آزمون فرض ها بیان شد می دانیم

آزمون فرض های آماری آزمون فرضیه یک میانگین

اگر آماره آزمون (آزمون فرض های آماری آزمون فرضیه یک میانگین   ) از 1.96 بزرگتر یا از -1.96 کوچکتر باشد فرض صفر را رد می کنیم و گرنه فرض صفر را نمی توان رد کرد.

آزمون فرض های آماری آزمون فرضیه یک میانگین

با توجه به اینکه 2.24 در ناحیه رد قرار گرفته است بنابراین فرض صفر رد می شود.
مثال 2:
مثال 1 را برای آزمون زیر در سطح آزمون فرض های آماری آزمون فرضیه یک میانگین  = 0.05 انجام دهید.

آزمون فرض های آماری آزمون فرضیه یک میانگین

آزمون یک طرفه است بنابراین Z0.05=1.64
با توجه به آنچه در قسمت آزمون فرض ها بیان شد می دانیم

آزمون فرض های آماری آزمون فرضیه یک میانگین

بنابراین اگر آماره آزمون (آزمون فرض های آماری آزمون فرضیه یک میانگین   ) از -1.64 کوچکتر باشد فرض صفر را رد می کنیم و گرنه فرض صفر را نمی توان رد کرد.

آزمون فرض های آماری آزمون فرضیه یک میانگین

با توجه به اینکه -2.24 در ناحیه رد قرار گرفته است بنابراین فرض صفر رد می شود.
مثال 3:
اگر سن دانشجویان دانشگاه دارای توزیع نرمال باشد و نمونه ای تصادفی به حجم 20 از میان آنها انتخاب و میانگین و انحراف معیار ان به ترتیب برابر 24 و 3 شود آزمون زیر را در سطح آزمون فرض های آماری آزمون فرضیه یک میانگین  = 0.05 انجام دهید.

آزمون فرض های آماری آزمون فرضیه یک میانگین

با توجه به اینکه جامعه نرمال و انحراف معیار آن معلوم نیست ( حالت دوم) بنابراین آماره آزمون آزمون فرض های آماری آزمون فرضیه یک میانگین   دارای توزیع t با r=n-1=19 درجه آزادی است.
آزمون یک طرفه است بنابراین t0.05,19=1.729
با توجه به آنچه در قسمت آزمون فرض ها بیان شد می دانیم

آزمون فرض های آماری آزمون فرضیه یک میانگین

بنابراین اگر آماره آزمون از 1.729 بزرگتر باشد فرض صفر رد می شود و گرنه فرض صفر را نمی توان رد کرد.

آزمون فرض های آماری آزمون فرضیه یک میانگین

بنابراین فرض صفر رد می شود.
به طور خلاصه در انجام آزمون فرضیه یک میانگین باید به موارد زیر توجه نمود
1- حجم نمونه ( اگر حجم نمونه بزرگ باشد آماره آزمون دارای توزیع نرمال است و دیگر توزیع جامعه مهم نیست.)
2- سطح معنی داری آزمون آزمون فرض های آماری آزمون فرضیه یک میانگین
3- نوع آزمون (یک طرفه یا دو طرفه بودن آزمون)
نکته:
اگر حجم نمونه کوچک باشد باید به توزیع جامعه و انحراف معیار ان توجه نمود.

توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟

در میان توزیع های پیوستهای که در آمار مورد استفاده قرار می گیرند، توزیع نرمال را می توان مهمترین توزیع پیوسته دانست.
یکی ار مواردی که باعث شده توزیع نرمال دارای اهمیت خاصی باشد مبنا بودن توزیع نرمال در امار استنباطی است و آنهم به دلیل رابطه ای است که توزیع با قضیه حد مرکزی دارد.
خصوصیات توزیع نرمال: 
شکل توزیع نرمال قرینه و شبیه زنگوله است
در توزیع نرمال

  • شاخص های مرکزی ( میانگین، میانه و نما(مد)) با هم برابرند.
  • دامنه ی مقادیر آن نامحدود است. به عبارت دیگر شکل منحنی نرمال از طرفین تا بی نهایت ادامه دارد. ولی به ندرت اتفاق می افتد که لازم باشد شکل منحنی نرمال را بیشتر از سه الی چهار انحراف معیار در طرفین میانگین ادامه داد.

تابع چگالی احتمال توزیع نرمال به صورت زیر است.

توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟

که در آن e عدد ثابت 2.718، توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟  عدد ثابت 3.14، توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟  میانگین، توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟  انحراف معیار و X متغیر تصادفی پیوسته است.
شکل توزیع نرمال توسط دو پارامتر میانگین توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟  و انحراف معیار توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟  مشخص می شود که با تغیر این دو پارامتر شکل توزیع نیز تغیر می کند.

توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟

معمولا وقتی متغیر تصادفی X دارای توزیع نرمال با میانگین توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟  و انحراف معیار توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟  است آنرا به صورت زیر نمایش می دهیم.

توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟

علامت توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟  به مفهوم دارای توزیع و N نیز به معنی نرمال است.
محاسبه احتمال برای توزیع نرمال: 
در توزیع نرمال احتمال اینکه متغیر تصادفی پیوسته X بین a و b باشد را باید توسط انتگرال زیر به دست آورد.

توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟

که محاسبه این انتگرال کار ساده ای نیست. بنابراین باید برای این امر جداولی تهیه نمود و با توجه به اینکه بینهایت ترکیب مختلف توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟  و توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟  وجود دارد در نتیجه بی نهایت منحنی نرمال متفاوت می سازد. محاسبه سطح زیر منحنی این توزیع های نرمال احتیاج به تنظیم بی نهایت جدول دارد که عملا امکان پذیر نیست.
استاندارد کردن توزیع نرمال: 
می توان مشکل تهیه جدول را به وسیله استاندارد کردن داده های آماری حل کرد. بدین معنی که می توان مقادیر مربوط به متغیرهای تصادفی X را که دارای توزیع نرمال است توسط رابطه ی زیر استاندارد کرد.

توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟

بنابراین متغیر استاندارد شده Z، همیشه دارای میانگین توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟  و انحراف معیار توزیع نرمال چیست؟ وچرا در آنالیز داده ها اهمیت دارد؟  است.
حال کافی است فقط برای یکبار سطح زیر منحنی نرمال استاندارد را در فواصل مختلف محاسبه کرد و در جدولی قرار داد.

نحوه ی استفاده از جدول احتمال توزیع نرمال استاندارد

 

برآورد یا تخمین پارامتر جامعه - فاصله اطمینان و سطح اطمینان چیست؟

هدف استنباط آماری به دست آوردن و نتیجه گیری در مورد پارامتر جامعه است.
می دانیم پارامتر جامعه مجهول است و باید از روی نمونه ای که از چامعه به دست می آید به براورد یا تخمین مقدار ان بپردازیم.
دو نوع برآوردگر یا تخمین زننده برای پارامتر جامعه وجود دارد.
1- برآورد کننده ی نقطه ای: برآورد کننده ای را برآوردگر نقطه ای پارامتر جامعه می گوییم که تنها یک عدد را به عنوان برآوردی ( تخمینی) از پارامتر جامعه ارائه کند.
2- برآورد کننده فاصله ای یا فاصله اطمینان: برآورد فاصله ای یا فاصله اطمینان تخمین می زند که پارامتر جامعه در میان دو عدد مشخص قرار می گیرد یا به عبارت دیگر فاصله ای را ارائه می کند که با احتمال مشخص (1- برآورد یا تخمین پارامتر  جامعه - فاصله اطمینان و سطح اطمینان چیست؟ ) پارامتر جامعه در آن فاصله قرار می گیرد.
به این فاصله [ به عنوان مثال (a,b)] فاصله اطمینان و به احتمالی که این فاصله شامل پارامتر جامعه باشد درجه اعتماد یا سطح اطمینان می گوییم.
بنابراین فاصله اطمینان یا برآورد فاصله ای عبارت است از تخمین فاصله ای از a تا b که انتظار می رود پارامتر جامعه با احتمال (1- برآورد یا تخمین پارامتر  جامعه - فاصله اطمینان و سطح اطمینان چیست؟ ) ( سطح اطمینان) در این فاصله قرار گیرد.

  برآورد یا تخمین پارامتر  جامعه - فاصله اطمینان و سطح اطمینان چیست؟

 

تفسیر فاصله اطمینان:


هنگامی که فاصله اطمینان پارامتر جامعه را محاسبه می کنیم، این فاصله یا پارامتر جامعه را در بر می گیرد یا نمی گیرد.[ پارامتر جامعه مجهول است]
به عنوان مثال اگر بخواهیم یک فاصله اطمینان با سطح اطمینان 95 درصد برای پارامتر جامعه به دست آوریم. قبل از انجام آزمایش و به دست آوردن فاصله اطمینان می دانیم که از هر 100 مورد به طور متوسط در 95 مورد فاصله اطمینان، پارامتر جامعه را در بر می گیرد ولی زمانی که فاصله اطمینان را به دست آوردیم یا پارامتر جامعه را در بر می گیرد یا نمی گیرد.
به عنوان یک مثال روشن کننده می توان چنین بیان کرد که قبل از آنکه یک بچه به وجود بیاید احتمال دختر شدن ان تقریبا 50 درصد است ولی وقتی که کار از کار گذشت و بچه به وجود آمد یا دختر است یا پسر. فاصله اطمینان نیز به همین صورت است قبل از محاسبه ما امید داریم که فاصله محاسبه شده یا احتمال (1- برآورد یا تخمین پارامتر  جامعه - فاصله اطمینان و سطح اطمینان چیست؟ ) درصد شامل پارامتر جامعه باشد ولی وقتی که فاصله محاسبه شد یا پارامتر جامعه را در بر می گیرد یا نمی گیرد.

آزمون فرضیه یک میانگین - آزمون t یک نمونه ای در spss

چگونه می توانیم این فرضیه را آزمون کنیم که یک نمونه متعلق به جامعه ای با میانگین مشخص است.
در مبحث آزمون فرضیه یک میانگین یاد گرفتیم چگونه می توان آزمون کرد که آیا یک نمونه متعلق به یک جامعه با میانگین مشخص است یا خیر. آزمون ما بر این واقعیت استوار بود که

  • اگر نمونه هایی از یک جامعه با توزیع نرمال انتخاب کنیم، توزیع میانگین های نمونه نیز نرمال خواهد بود
  • همچنین اگر حجم نمونه ها به اندازه کافی بزرگ باشد، حتی اگر جامعه ای که نمونه ها از ان انتخاب می شود توزیع نرمال نداشته باشد، توزیع میانگین های نمونهنرمال خواهد بود.

برای استفاده کردن از توزیع نرمال جهت آزمودن اینکه یک نمونه متعلق به یک جامعه مشخص است، بایستی انحراف معیار جامعه را بدانیم، اما اغلب انحراف معیار جامعه را نمی دانیم و لازم است که مقدار ان را از روی انحراف معیار نمونه برآورد کنیم.
همچنین می دانیم برای حجم نمونه های بزرگ توزیع t تقریبا با توزیع نرمال برابر است بنابراین در دنیای واقعی زمانی که جامعه نرمال است یا حجم نمونه بزرگ است برای آزمون فرضیه یک میانگین از توزیع t استفاده می کنیم. [ هنگامی که توزیع جامعه مشخص نیست و حجم نمونه کوچک است از روشهای ناپارامتری استفاده می کنیم.]


روش به دست آوردن آزمون t یک نمونه ای


روش one-sample t Test این فرضیه صفر را آزمون می کند که آیا یک نمونه متعلق به جامعه ای با میانگین مشخص است یا خیر.
به عنوان مثال می خواهیم آزمون کنیم که آیا میانگین متغیر brake برابر با 322 است یا خیر.

آزمون فرضیه یک میانگین - آزمون t  یک نمونه ای در نرم افزار spss

برای به دست آوردن آزمون t یک نمونه ای ابتدا از منوها موارد زیر را انتخاب می کنیم.

Analyze > compare means > one-sample T Test  


در کادر گفتگوی one-sample T Test شکل زیر از لیست متغیر ها، متغیر مورد نظر ( در اینجا brake) را انتخاب کرده و به لیست Test variable منتقل می کنیم. [ می توانیم بیشتر از یک متغیر را به لیست مورد نظر منتقل کنیم و تمام آنها را با مقدار مشخص شده آزمون کنیم]

آزمون فرضیه یک میانگین - آزمون t  یک نمونه ای در نرم افزار spss

در کادر test value مقدار مورد آزمون (در اینجا 322) را وارد می کنیم و برروی ok کلیک می کنیم.
برای هر یک از متغیرهای انتخاب شده، spss آماره آزمون فرضیه یک میانگین - آزمون t  یک نمونه ای در نرم افزار spss   و سطح معنی دار مشاهده شده آن را محاسبه می کند.

آزمون فرضیه یک میانگین - آزمون t  یک نمونه ای در نرم افزار spss

همان گونه که از جدول فوق مشخص است مقدار اماره برابر t=2.101 و درجه آزادی آن 127[ حجم نمونه 128] است. 
با توجه به مقدار معنی دار مشاهده شده0.038 که از سطح معنی دار مورد آزمون ( در اینجا آزمون فرضیه یک میانگین - آزمون t  یک نمونه ای در نرم افزار spss   = 0.05) کمتر است فرض صفر رد می شود یعنی نمونه از جامعه ای با میانگین 322 به دست نیامده است.
مقدار میانگین تفاضل (آزمون فرضیه یک میانگین - آزمون t  یک نمونه ای در نرم افزار spss  ) مثبت است و فاصله اطمینان هم شامل صفر نیست و مثبت است بنابراین میانگین واقعی از مقدار 322 بیشتر است. ( برای مطالعه بیشتر به مقاله رابطه فاصله اطمینان و آزمون فرض ها مراجعه کنید). 

تعین سطح اطمینان و نحوه برخورد با داده های نامعلوم


خروجی نرم افزار spss یک فاصله اطمینان برای تفاضل بین میانگین و مقدار مورد آزمون (آزمون فرضیه یک میانگین - آزمون t  یک نمونه ای در نرم افزار spss  ) محاسبه می کند ( جدول فوق) برای تعین و تغیر سطح اطمینان محاسبه شده در کادر گفتگوی one-sample T Test بر روی دکمه options کلیک می کنیم. کادر گفتگوی one-sample T Test options شکل زیر باز می شود.

آزمون فرضیه یک میانگین - آزمون t  یک نمونه ای در نرم افزار spss

در قسمت confidence Interval می توانیم سطح اطمینان را بین 1 تا 99 مشخص کنیم.
همچنین در این کادر قسمتی تحت عنوان missing values وجود دارد و هنگامی که چند متغیر را همزمان ازمون می کنیم می توانیم نحوه ی برخورد با داده های نامعلوم را تعیین کنیم.

  • Exclude case analysis by analysis: با انتخاب این گزینه هنگام محاسبه آماره های هر متغیر تمام نمونه های صحیح ان متغیر استفاده می شود
  • Exclude case listwise: با انتخاب این گزینه تنها نمونه هایی در محاسبه استفاده می شوند که برای تمام متغیرهای مشخص شده دارای مقدار صحیح باشد. با این کار مطمئن می شویم در تمام آزمون ها نمونه های یکسانی استفاده شده است.

 

چه موقع باید از روش one-sample T Test استفاده کرد؟


از این روش موقعی باید استفاده کنیم که بخواهیم این فرضیه را آزمون کنیم که آیا نمونه ما به جامعه با میانگین مشخص ( در مثال بالا 322) تعلق دارد با خیر
برای مثال
- آیا جعبه های نیم کیلویی رب گوجه فرنگی واقعا به طور متوسط نیم کیلو وزن دارند.
- آیا بچه هایی که به طور زودرس به دنیا آمده اند بهره هوشی آنها به طور متوسط 100 است؟
- آیا سن ازدواج در جامعه به طور متوسط 24 سال است.
در این موارد می خواهیم میانگین نمونه خود را با میانگین جامعه مقایسه کنیم
هنگامی که دو نمونه از داده ها داریم و می خواهیم میانگین آن ها را آزمون کنیم نباید از آزمون t یک نمونه ای استفاده کنیم. مثل مقایسه نوزادان زود رس و نه ماهه به جای آن از ازمون t با دو نمونه مستقل استفاده می کنیم.

توزیع t یا t- استودنت چیست؟

وزیع t نیز مانند توزیع نرمال قرینه است ولی دارای پراکندگی بیشتری نسبت به توزیع نرمال است. و برای مقادیر مختلف حجم نمونه (n) میزان پراکندگی توزیع t تغیر می کند و با افزایش حجم نمونه این پراکندگی کمتر شده و برای  توزیع t یا t- استودنت چیست؟  توزیع t با توزیع Z برابر می شود.
بنابراین شکل این توزیع به حجم نمونه بستگی دارد که انرا با r نشان داده و درجه آزادی می نامیم.

توزیع t یا t- استودنت چیست؟

در شکل زیر سطح زیر منحنی در دنباله راست توزیع t، با توجه به پارامتر درجه آزادی ثبت شده است.

توزیع t یا t- استودنت چیست؟

برای استفاده از جدول t فوق احتیاج به دو عدد

  • سطح منحنی در دنباله سمت راست توزیع
  • درجه آزادی توزیع t داریم

ما حرف ta,r را به مفهوم مقدار t با سطح زیر منحنی a و درجه آزادی r به کار می بریم.
مثال: اگر a=0.025 و r=15 باشد مقدار t را به دست آورید.

t0.025,15=2.131

برای پیدا کردن عدد 2.131 در جدول t کافی است که از سطر اول جدول، عدد 0.025 و از ستون اول جدول درجه آزادی 15 را پیدا کنیم محل برخورد سطر و ستون عدد 2.131 را ارائه می کند.

نکته:
اگر جامعه مورد بررسی نرمال و انحراف معیار جامعه معلوم نباشد و نمونه تصادفی به حجم n از جامعه اختیار کنیم ان گاه آماره

توزیع t یا t- استودنت چیست؟

که در آن توزیع t یا t- استودنت چیست؟   و توزیع t یا t- استودنت چیست؟   است دارای توزیع t با n-1 درجه آزادی است.
سوال: چرا درجه آزادی برابر n-1 است؟
در توجیه درجه آزادی به مثال زیر توجه کنید اگر n=5 و توزیع t یا t- استودنت چیست؟  = 8 باشد بنابراین جمع این 5 مشاهده باید برابر 40 باشد. فرض کنید بخواهیم این مجموعه اعداد را مشخص کنیم. برای این کار می توانیم هر چهار عددی که دوست داریم به صورت آزادانه انتخاب کنیم ولی هیچگونه آزادی در انتخاب عدد پنجم نداریم زیرا عدد پنجم را باید بگونه ای انتخاب کرد که جمع 5 عدد برابر 40 شود. بنابراین درجه آزادی ما برابر 4 است.

درصد تجمعی چیست و چه زمانی می توان از آن استفاده کرد؟

یکی از مواردی که در جدول توزیع فراوانی وجود دارد درصد تجمعی (cumulative percentage) است.
در هر ردیف جدول فراوانی درصد تجمعی، مجموع درصد آن ردیف و تمامی ردیف های قبل از آن را شامل می شود.
نکته ای که در مورد فراوانی تجمعی یا درصد فراوانی تجمعی باید در نظر گرفت این است که این درصد بعضی از مواقع بی معنی و بدون تفسیر است و در بعضی از موارد بسیار پرکاربرد بنابراین در هر تحقیقی نباید درصد تجمعی گزارش شود و فقط در مواردی که درصد های آن قابل تفسیر و با معنی است به ارائه آن می پردازیم. به عنوان مثال به جدول فراوانی زیر توجه کنید
مثال: جدول فراوانی حقوق افراد یک کارخانه به صورت زیر است.

درصد تجمعی چیست و چه زمانی می توان از آن استفاده کرد؟

اگر خط فقر جامعه 900 هزار تومان باشد حقوق چند درصد از کارکنان این کارخانه کمتر از خط فقر است؟
با توجه به درصد فراوانی تجمعی 81 درصد کارکنان این کارخانه حقوقی کمتر از خط فقر جامعه دریافت می کنند.
همان طور که ملاحظه می شود در مواردی که متغیر مورد بررسی ( در اینجا درآمد) دارای ترتیب خاصی باشد درصد فراوانی تجمعی می تواند قابل تفسیر و مفید باشد.
سوال 1: اگر متغیر مورد بررسی رنگ چشم افراد باشد آیا درصد تجمعی قابل تفسیر است؟
سوال 2: اگر متغیر مورد بررسی مدل ماشین افراد جامعه باشد آیا درصد تجمعی قابل تفسیر است؟ اگر قیمت ماشین افراد جامعه باشد چطور؟
سوال 3: اگر متغیر مورد بررسی سطح تحصیلات افراد جامعه باشد آیا درصد تجمعی قابل تفسیر است؟

 

محاسبه آزمون کای دو - آزمون استقلال در جدول متقاطع در spss

اطلاعاتی که در این بخش مورد تجزیه و تحلیل قرار می گیرند از فایل demo است.
در این فایل عوامل موثر بر خرید افراد مورد تجزیه و تحلیل قرار می گیرد. متغیرهای مالکیت دستگاه دیجیتالی (ownpda)، میزان درامد افراد به صورت طبقه بندی شده (inccat) و سطح تحصیلات (ed) مورد استفاده قرار می گیرد.

در مقاله روش به دست آوردن جدول متقاطع به صورت شهودی به وجود رابطه بین دو متغیر مالکیت و سطح درآمد پی بردیم در این قسمت قصد داریم به صورت آماری به بررسی این مطلب بپردازیم.
تعدادی آزمون برای تعیین اینکه آیا رابطه بین متغیر ها از لحاظ آماری دارای اهمیت ( معنی دار ) است وجود دارد که عمومی ترین آنها آزمون کای دو است.
برای به دست آوردن آزمون کای دو ابتدا از منوها موارد زیر را انتخاب می کنیم.

Analyze > Descriptive statistics > crosstabs  


کادر گفتگوی crosstabs باز می شود و مانند شکل زیر در قسمت سطر (Rows) متغیر درآمد inccat و در قسمت ستون (columns) متغیر مالکیت دستگاه دیجیتالی ownpda را وارد کرده و بر روی گزینه statistics کلیک می کنیم.

آزمون کای دو - آزمون استقلال در جدول متقاطع در نرم افزار spss

کادر گفتگوی Crosstabs:statistics شکل زیر باز می شود گزینه chi-Square را فعال و به ترتیب

آزمون کای دو - آزمون استقلال در جدول متقاطع در نرم افزار spss

بر گزینه های Continue و ok کلیک می کنیم.

آزمون کای دو - آزمون استقلال در جدول متقاطع در نرم افزار spss

در اینجا فرضیات مورد آزمون به صورت زیر است 
فرض صفر: بین متغیر ها رابطه وجود ندارد.
فرض مقابل: بین متغیر ها رابطه وجود دارد 
همان طور که از جدول بالا مشخص است مقدار آماره کای دو برابر 37.677 و احتمال معنی دار بودن برابر صفر است بنابراین فرض صفر که حاکی از عدم رابطه بین متغیر هاست رد می شود و نتیجه می گیریم که بین دو متغیر درآمد و مالکیت PDA رابطه وجود دارد.
نکته:

  • همواره باید به پیغام زیر جدول توجه کنیم و اگر مقدار مورد انتظار در سلولی کمتر از 5 شد با ادغام کردن این مشکل را بر طرف کنیم.