امروز با دو دانشجو در مورد پایاننامههایشان قبل از جلسۀ دفاع، نشست داشتم؛ پایاننامه بود و طبق معمول تحلیل رگرسیون.
امروز با دو دانشجو در مورد پایاننامههایشان قبل از جلسۀ دفاع، نشست داشتم؛ پایاننامه بود و طبق معمول تحلیل رگرسیون.
هر دو محقق هم از برخی دادههای خود لگاریتم گرفته بودند. البته چون دانش محدود آماری و اقتصادسنجی دارم، بر عهدۀ سایر استادان ناظر و مشاور است که موارد مرتبط با این تخصصها را بررسی کنند. با این همه، استفاده از متغیرها در شکل لگاریتمی در تحلیل رگرسیون آن قدر رایج شده که دلایل موضوع برای من هم تا حدی روشن شده است. در این یادداشت، آن دلایل را بدآن گونه که میفهمم، توضیح میدهم:
· بیش از همه، برای اینکه ماهیت رابطۀ بین متغیرهای مستقل و وابسته خطی شود، یعنی برای تبدیل روابط غیرخطی به خطی، از لگاریتم استفاده میکنیم. این از پیچیدگی مدلها میکاهد. بسیاری از نظریهها و مدلهایی که در پژوهشهای تجربی به آزمون در میآیند، به همین دلیل، از شکل لگاریتم گرفتهشده دادهها استفاده میکنند. از اینرو، مجبوریم برای آزمون آنها، از لگاریتم دادهها استفاده کنیم.
· وقتی که متغیر ما چوله به راست است، یعنی میانگین دادهها از میانۀ آنها بزرگتر است، با لگاریتمیگیری میکوشیم توزیع متغیر موزونتر یا (نرمالتر) شود. البته، پیشفرض تحلیل رگرسیون آن نیست که متغیرهای مستقل یا وابسته آن نرمال باشند. بنابراین، این دلیل برای لگاریتمگرفتن متغیرها نباید موجه باشد، مگر اینکه دادههای پَرت برای متغیرهای مستقل و وابسته داشته باشیم. با لگاریتمگرفتن، اثر این مشاهدات پَرت را کاهش میدهیم. برای اطمینان از استنتاجهای آماری خود، پس از لگاریتمگرفتن از متغیرها، باید ببینیم آیا پسماندها نرمال هستند یا نه؟
· وقتی در رگرسیون اعداد با کمیتهای بزرگ و کوچک داریم، با لگاریتمگیری، تفسیر بهتر از ضرایب رگرسیون ممکن میشود. به کمک مقیاس لگاریتمی، اندازههای بسیار بزرگ را در ابعاد کوچک نشان میدهیم.
· وقتی پهنۀ تغییرات پسماندها به طور موزونی با ارزش متغیرهای مستقل تغییر کند، با لگاریتمگیری از دادههای متغیرهای مستقل و وابسته، امکان حذف «ناهمسانی واریانس» فراهم میشود.
· وقتی رابطه به رابطۀ نمایی نزدیک باشد.
این فهرست از دلایل بیانگر مزایایِ بسیارِ استفاده از لگاریتم در تحلیل رگرسیون است. برای همین است که در بین «دادهتبدیلهای» مختلف چون لگاریتم، ریشهگیری یا معکوس عددها و نسبتها، لگاریتمگیری از بقیه رویکردها معمولتر است.
البته، من هنوز هم کاملاً مطمئن نیستم که با لگاریتمیگیری آیا میشود «دادههای بد» را به شکل «دادههای خوب» جلوه داد. دیدهام برای این که نمودارِ خوشترکیب بسازند، از لگاریتم استفاده میکنند. با خوشترکیببودن نمودارها مشکلی ندارم، اما طبعاً برای تحلیلکردن چنین دادههایی فکر نمیکنم باید از تبدیلهای لگاریتمی استفاده شود.