رگرسیون لجستیک چیست؟

رگرسيون به بیان ساده به‌معنی بازگشت است. به‌عبارت‌دیگر به‌معنای پيش‌بيني و بيان تغييرات يک متغير بر اساس اطلاعات متغير ديگر است. برای مثال رابطه بين قد و وزن در انسان‌ها را در نظر بگيريد؛ اين رابطه يک رابطه مستقيم صددرصدي نيست که لزوما هر قدی بلندتر باشد، وزن بيشتري هم دارد، اما مي‌توان گفت که با احتمال قابل قبولي افرادی که دارای قد بلندتری است، وزن بيشتري هم نيز دارند.  حال‌که معنا و مفهوم رگسیون را می‌دانیم، می‌توانیم به‌راحتی به مفهوم و کارکرد رگسیون لجستیک پی ببریم. رگرسیون لجستیک یک روش تحلیل آماری برای پیش‌بینی یک نتیجه باینری(یعنی صفر و یک، به‌بیان‌ دقیق‌تر این‌است‌که معامله‌گران پس از پایان زمان معامله، یا موفق به گرفتن سرمایه خود به همراه سودِ از پیش تعیین شده می‌شوند یا هیچ چیز باز نمی گردد.)، بر اساس مشاهدات قبلی یک مجموعه داده است. رگرسیون لجستیک تحلیل رگرسیونی مناسبی است که زمانی که متغیر وابسته دوتایی است انجام می‌شود. مانند تمام تحلیل‌های رگرسیون، رگرسیون لجستیک یک تحلیل پیش‌بینی‌کننده است. گاهی اوقات تفسیر رگرسیون لجستیک دشوار است. ابزار آمار Intellectus به‌راحتی به شما امکان می‌دهد تجزیه‌وتحلیل را انجام دهید، سپس به زبان انگلیسی ساده خروجی را تفسیر می‌کند و با google translate آن را برای خود ترجمه کنید. یک مدل رگرسیون لجستیک یک متغیر داده وابسته را با تجزیه‌وتحلیل رابطه بین یک یا چند متغیر مستقل موجود پیش‌بینی می‌کند. رگرسیون لجستیک می‌تواند نقشی در فعالیت‌های آماده‌سازی داده‌ها ایفا کند و به مجموعه داده‌ها اجازه می‌دهد تا در طی فرآیند استخراج، تبدیل، بارگذاری (ETL) در سطل‌های از پیش تعریف‌شده خاص قرار داده‌شوند تا اطلاعات را برای تجزیه‌وتحلیل مرحله‌بندی کنند. این نوع تحلیل می‌تواند به شما در پیش‌بینی احتمال وقوع یک رویداد یا انتخاب کمک کند. برای مثال شما می‌توانید سود بار خود با داده‌هایی که در اختیار دارید تجزیه‌وتحلیل کنید و سپس با اطلاعاتی که در اختیار دارید می‌توانید میزان سود خود را در انواع حمل‌ونقل، ترخیص، انبارداری و موارد دیگری که در این چرخه باید طی شود تا بار شما بدستتان برسد را پیش‌بینی کنید. مدل‌های رگرسیون لجستیک به شما کمک می‌کنند تا احتمال اینکه چه میزان از این عملیات سود نصبیتان می‌شود را آگاه شوید.

 

تفاوت بین رگرسیون خطی و لجستیک چیست؟

تفاوت اصلی بین رگسیون خطی و رگسیون لجستیک  در نحوه استفاده از آنهاست. رگرسیون خطی برای حل مسائل رگرسیون استفاده می‌شود در حالی‌که رگرسیون لجستیک برای حل مسائل طبقه‌بندی استفاده می‌شود. با شرح ویژگی هر دو رگسیون می‌توانید به راحتی به فرق و کارکردشان پی ببرید.

ویژگی‌های رگسیون خطی:

  • رگرسیون خطی یکی از ساده‌ترین الگوریتم‌های یادگیری ماشینی است که تحت تکنیک یادگیری نظارتی قرار می‌گیرد و برای حل مسائل رگرسیون استفاده می‌شود.
  • برای پیش‌بینی متغیر وابسته پیوسته با کمک متغیرهای مستقل استفاده می‌شود.
  • هدف رگرسیون خطی یافتن بهترین خط مناسب است که بتواند خروجی متغیر وابسته پیوسته را به دقت پیش‌بینی کند.
  • اگر از یک متغیر مستقل برای پیش‌بینی استفاده شود، آن را رگرسیون خطی ساده و اگر بیش از دو متغیر مستقل وجود داشته‌باشد، به این رگرسیون رگرسیون خطی چندگانه می‌گویند.
  • با یافتن بهترین خط پرازش، الگوریتم رابطه بین متغیر وابسته و متغیر مستقل را ایجاد می‌کند. و رابطه باید ماهیت خطی داشته‌باشد.
  • خروجی رگرسیون خطی فقط باید مقادیر پیوسته مانند قیمت، سن، حقوق و … باشد.

ویژگی‌های رگیسون لجستیک:

  • رگرسیون لجستیک یکی از محبوب‌ترین الگوریتم‌های یادگیری ماشینی است که تحت تکنیک‌های یادگیری نظارتی قرار می‌گیرد.
  • می‌توان از آن برای طبقه‌بندی و همچنین برای مسائل رگرسیون استفاده کرد، اما عمدتاً برای مسائل طبقه‌بندی استفاده می‌شود.
  • از رگرسیون لجستیک برای پیش‌بینی متغیر وابسته طبقه‌ای با کمک متغیرهای مستقل استفاده می‌شود.
  • خروجی مسئله رگرسیون لجستیک فقط می‌تواند بین صفر و یک باشد.
  • در مواردی که احتمالات بین دو کلاس مورد نیاز است، می‌توان از رگرسیون لجستیک استفاده کرد. مانند اینکه آیا امروز باران خواهد بارید یا خیر، 0 یا 1، درست یا نادرست و ….. .
  • رگرسیون لجستیک مبتنی‌بر مفهوم برآورد حداکثر درستنمایی است. بر اساس این برآورد، داده‌‌های مشاهده شده باید محتمل‌ترین باشد.
  • در رگرسیون لجستیک، مجموع وزنی ورودی‌ها را از یک تابع فعال‌سازی عبور می‌دهیم که می‌تواند مقادیر بین صفر و یک را ترسیم کند. این تابع فعال‌سازی به‌عنوان تابع سیگموئید و منحنی به‌دست‌آمده منحنی سیگموئید یا منحنی S نامیده می‌شود. 

معایب رگسیون لجستیک چیست؟

حال اینکه به کارکرد، ویژگی‌های مثبت و تفاوت رگسیون لجستیک با رگسیون خطی پی بردید، لازم است معایب این رگسیون را هم بشناسید تا به‌راحتی بتوانید به تشخیص این نکته پی ببرید که در چه مواقعی این رگسیون لجستیک به کسب‌وکار شما کمک می‌کند.

  • رگرسیون لجستیک نمی‌تواند یک نتیجه مستمر را پیش‌بینی کند. رگرسیون لجستیک تنها زمانی کار می‌کند که متغیر وابسته یا نتیجه دوگانه باشد.
  • رگرسیون لجستیک خطی بودن بین متغیر پیش بینی شده (وابسته) و متغیرهای پیش‌بینی‌کننده (مستقل) را فرض می‌کند و این نکته دچار محدودیت این رگسیون می‌شود.
  • اگر حجم نمونه خیلی کوچک باشد رگرسیون لجستیک ممکن است دقیق نباشد. اگر حجم نمونه کوچک باشد، مدل تولید شده توسط رگرسیون لجستیک بر اساس تعداد کمتری از مشاهدات واقعی است. این می‌تواند منجر به نصب بیش از حد شود. در آمار، پیش ‌پرازش یک خطای مدل‌سازی است که زمانی رخ می‌دهد که مدل به دلیل کمبود داده‌های آموزشی، خیلی نزدیک به مجموعه‌ای از داده‌های محدود باشد یا به‌عبارت‌دیگر؛ داده‌های ورودی کافی برای مدل برای یافتن الگوها در آن وجود ندارد. در این مورد، مدل قادر به پیش‌بینی دقیق نتایج یک مجموعه داده جدید یا آینده نیست.

 

امیدواریم توانسته‌باشیم در این مقاله چیستی و اهمیت رگرسیون را چه به‌صورت فی‌نفسه آن در سایر بخش‌ها و چه به‌صورت تاثیر آن در حوزه لجستیک به درستی شرح دهیم. حوزه لجستیک آنقدر گسترده است که بسیاری از مفاهیم را می‌تواند در خود جای دهد؛ زیرا لجستیک بستری است برای رشد اقتصادی یک کشور و اگر آن به‌خوبی اجرا نشود بسیار حوزه‌ها مستقیم یا غیرمستقیم به مشکل بر می‌خوردند.

مدیر

کتابهای زیادی در شصت و سه درصد گذشته، حال و آینده شناخت فراوان جامعه و متخصصان را می طلبد تا با نرم افزارها شناخت بیشتری را برای طراحان رایانه ای علی الخصوص طراحان خلاقی و فرهنگ پیشرو در زبان فارسی ایجاد کرد.

0 دیدگاه

پست های مرتبط

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *