رگرسیون لجستیک چیست؟
- مقالات آموزشی لجستیک
- مدیر
- 1398-04-09
- 0
- 707
رگرسيون به بیان ساده بهمعنی بازگشت است. بهعبارتدیگر بهمعنای پيشبيني و بيان تغييرات يک متغير بر اساس اطلاعات متغير ديگر است. برای مثال رابطه بين قد و وزن در انسانها را در نظر بگيريد؛ اين رابطه يک رابطه مستقيم صددرصدي نيست که لزوما هر قدی بلندتر باشد، وزن بيشتري هم دارد، اما ميتوان گفت که با احتمال قابل قبولي افرادی که دارای قد بلندتری است، وزن بيشتري هم نيز دارند. حالکه معنا و مفهوم رگسیون را میدانیم، میتوانیم بهراحتی به مفهوم و کارکرد رگسیون لجستیک پی ببریم. رگرسیون لجستیک یک روش تحلیل آماری برای پیشبینی یک نتیجه باینری(یعنی صفر و یک، بهبیان دقیقتر ایناستکه معاملهگران پس از پایان زمان معامله، یا موفق به گرفتن سرمایه خود به همراه سودِ از پیش تعیین شده میشوند یا هیچ چیز باز نمی گردد.)، بر اساس مشاهدات قبلی یک مجموعه داده است. رگرسیون لجستیک تحلیل رگرسیونی مناسبی است که زمانی که متغیر وابسته دوتایی است انجام میشود. مانند تمام تحلیلهای رگرسیون، رگرسیون لجستیک یک تحلیل پیشبینیکننده است. گاهی اوقات تفسیر رگرسیون لجستیک دشوار است. ابزار آمار Intellectus بهراحتی به شما امکان میدهد تجزیهوتحلیل را انجام دهید، سپس به زبان انگلیسی ساده خروجی را تفسیر میکند و با google translate آن را برای خود ترجمه کنید. یک مدل رگرسیون لجستیک یک متغیر داده وابسته را با تجزیهوتحلیل رابطه بین یک یا چند متغیر مستقل موجود پیشبینی میکند. رگرسیون لجستیک میتواند نقشی در فعالیتهای آمادهسازی دادهها ایفا کند و به مجموعه دادهها اجازه میدهد تا در طی فرآیند استخراج، تبدیل، بارگذاری (ETL) در سطلهای از پیش تعریفشده خاص قرار دادهشوند تا اطلاعات را برای تجزیهوتحلیل مرحلهبندی کنند. این نوع تحلیل میتواند به شما در پیشبینی احتمال وقوع یک رویداد یا انتخاب کمک کند. برای مثال شما میتوانید سود بار خود با دادههایی که در اختیار دارید تجزیهوتحلیل کنید و سپس با اطلاعاتی که در اختیار دارید میتوانید میزان سود خود را در انواع حملونقل، ترخیص، انبارداری و موارد دیگری که در این چرخه باید طی شود تا بار شما بدستتان برسد را پیشبینی کنید. مدلهای رگرسیون لجستیک به شما کمک میکنند تا احتمال اینکه چه میزان از این عملیات سود نصبیتان میشود را آگاه شوید.
تفاوت بین رگرسیون خطی و لجستیک چیست؟
تفاوت اصلی بین رگسیون خطی و رگسیون لجستیک در نحوه استفاده از آنهاست. رگرسیون خطی برای حل مسائل رگرسیون استفاده میشود در حالیکه رگرسیون لجستیک برای حل مسائل طبقهبندی استفاده میشود. با شرح ویژگی هر دو رگسیون میتوانید به راحتی به فرق و کارکردشان پی ببرید.
ویژگیهای رگسیون خطی:
- رگرسیون خطی یکی از سادهترین الگوریتمهای یادگیری ماشینی است که تحت تکنیک یادگیری نظارتی قرار میگیرد و برای حل مسائل رگرسیون استفاده میشود.
- برای پیشبینی متغیر وابسته پیوسته با کمک متغیرهای مستقل استفاده میشود.
- هدف رگرسیون خطی یافتن بهترین خط مناسب است که بتواند خروجی متغیر وابسته پیوسته را به دقت پیشبینی کند.
- اگر از یک متغیر مستقل برای پیشبینی استفاده شود، آن را رگرسیون خطی ساده و اگر بیش از دو متغیر مستقل وجود داشتهباشد، به این رگرسیون رگرسیون خطی چندگانه میگویند.
- با یافتن بهترین خط پرازش، الگوریتم رابطه بین متغیر وابسته و متغیر مستقل را ایجاد میکند. و رابطه باید ماهیت خطی داشتهباشد.
- خروجی رگرسیون خطی فقط باید مقادیر پیوسته مانند قیمت، سن، حقوق و … باشد.
ویژگیهای رگیسون لجستیک:
- رگرسیون لجستیک یکی از محبوبترین الگوریتمهای یادگیری ماشینی است که تحت تکنیکهای یادگیری نظارتی قرار میگیرد.
- میتوان از آن برای طبقهبندی و همچنین برای مسائل رگرسیون استفاده کرد، اما عمدتاً برای مسائل طبقهبندی استفاده میشود.
- از رگرسیون لجستیک برای پیشبینی متغیر وابسته طبقهای با کمک متغیرهای مستقل استفاده میشود.
- خروجی مسئله رگرسیون لجستیک فقط میتواند بین صفر و یک باشد.
- در مواردی که احتمالات بین دو کلاس مورد نیاز است، میتوان از رگرسیون لجستیک استفاده کرد. مانند اینکه آیا امروز باران خواهد بارید یا خیر، 0 یا 1، درست یا نادرست و ….. .
- رگرسیون لجستیک مبتنیبر مفهوم برآورد حداکثر درستنمایی است. بر اساس این برآورد، دادههای مشاهده شده باید محتملترین باشد.
- در رگرسیون لجستیک، مجموع وزنی ورودیها را از یک تابع فعالسازی عبور میدهیم که میتواند مقادیر بین صفر و یک را ترسیم کند. این تابع فعالسازی بهعنوان تابع سیگموئید و منحنی بهدستآمده منحنی سیگموئید یا منحنی S نامیده میشود.
معایب رگسیون لجستیک چیست؟
حال اینکه به کارکرد، ویژگیهای مثبت و تفاوت رگسیون لجستیک با رگسیون خطی پی بردید، لازم است معایب این رگسیون را هم بشناسید تا بهراحتی بتوانید به تشخیص این نکته پی ببرید که در چه مواقعی این رگسیون لجستیک به کسبوکار شما کمک میکند.
- رگرسیون لجستیک نمیتواند یک نتیجه مستمر را پیشبینی کند. رگرسیون لجستیک تنها زمانی کار میکند که متغیر وابسته یا نتیجه دوگانه باشد.
- رگرسیون لجستیک خطی بودن بین متغیر پیش بینی شده (وابسته) و متغیرهای پیشبینیکننده (مستقل) را فرض میکند و این نکته دچار محدودیت این رگسیون میشود.
- اگر حجم نمونه خیلی کوچک باشد رگرسیون لجستیک ممکن است دقیق نباشد. اگر حجم نمونه کوچک باشد، مدل تولید شده توسط رگرسیون لجستیک بر اساس تعداد کمتری از مشاهدات واقعی است. این میتواند منجر به نصب بیش از حد شود. در آمار، پیش پرازش یک خطای مدلسازی است که زمانی رخ میدهد که مدل به دلیل کمبود دادههای آموزشی، خیلی نزدیک به مجموعهای از دادههای محدود باشد یا بهعبارتدیگر؛ دادههای ورودی کافی برای مدل برای یافتن الگوها در آن وجود ندارد. در این مورد، مدل قادر به پیشبینی دقیق نتایج یک مجموعه داده جدید یا آینده نیست.
امیدواریم توانستهباشیم در این مقاله چیستی و اهمیت رگرسیون را چه بهصورت فینفسه آن در سایر بخشها و چه بهصورت تاثیر آن در حوزه لجستیک به درستی شرح دهیم. حوزه لجستیک آنقدر گسترده است که بسیاری از مفاهیم را میتواند در خود جای دهد؛ زیرا لجستیک بستری است برای رشد اقتصادی یک کشور و اگر آن بهخوبی اجرا نشود بسیار حوزهها مستقیم یا غیرمستقیم به مشکل بر میخوردند.